Domov Ústní dutina Interval spolehlivosti pro matematické očekávání normálního rozdělení se známým rozptylem. Interval spolehlivosti pro matematické očekávání

Interval spolehlivosti pro matematické očekávání normálního rozdělení se známým rozptylem. Interval spolehlivosti pro matematické očekávání

Sestavte v MS EXCEL interval spolehlivosti odhadnout střední hodnotu rozdělení v daném případě známá hodnota disperze.

Samozřejmě výběr úroveň důvěry zcela závisí na daném úkolu. Míra důvěry cestujícího v letecké dopravě ve spolehlivost letadla by tedy samozřejmě měla být vyšší než míra důvěry kupujícího ve spolehlivost žárovky.

Formulace úkolu

Předpokládejme, že od populace když vzal vzorek velikost n. Předpokládá se, že standardní odchylka tato distribuce je známá. Nutné na základě toho Vzorky hodnotit neznámé distribuční průměr(μ, ) a sestrojte odpovídající bilaterální interval spolehlivosti.

Bodový odhad

Jak je známo z statistika(říkejme tomu X srov) je nestranný odhad průměru tento populace a má rozdělení N(μ;σ 2 /n).

Poznámka: Co když potřebujete stavět interval spolehlivosti v případě distribuce, která není normální? V tomto případě přichází na pomoc, která říká, že s dost velká velikost Vzorky n z distribuce ne- normální, výběrová distribuce statistik Х prům vůle přibližně odpovídat normální distribuce s parametry N(μ;σ 2 /n).

Tak, bodový odhad střední distribuční hodnoty máme je průměr vzorku, tj. X srov. Teď se dáme do práce interval spolehlivosti.

Budování intervalu spolehlivosti

Obvykle, když známe rozdělení a jeho parametry, můžeme vypočítat pravděpodobnost, že náhodná veličina nabude hodnoty z daného intervalu. Nyní udělejme opak: najdeme interval, do kterého náhodná veličina s danou pravděpodobností spadá. Například z nemovitostí normální distribuce je známo, že s pravděpodobností 95% je náhodná proměnná distribuována přes normální zákon, bude spadat do intervalu přibližně +/- 2 od střední hodnota(viz článek o). Tento interval bude sloužit jako náš prototyp interval spolehlivosti.

Nyní se podívejme, zda známe distribuci , vypočítat tento interval? Pro zodpovězení otázky musíme specifikovat formu distribuce a její parametry.

Víme, jaká je forma distribuce normální distribuce (pamatujte, že mluvíme o Distribuce vzorků statistika X srov).

Parametr μ nám není znám (jen je třeba jej odhadnout pomocí interval spolehlivosti), ale máme jeho odhad X srov. vypočítané na základě vzorek, které lze použít.

Druhý parametr je výběrová střední standardní odchylka bude známo, je rovno σ/√n.

Protože neznáme μ, pak sestrojíme interval +/- 2 směrodatné odchylky ne od střední hodnota, ale z jeho známého odhadu X srov. Tito. při výpočtu interval spolehlivosti to NEBUDEME předpokládat X srov bude spadat do intervalu +/- 2 směrodatné odchylky od μ s pravděpodobností 95 % a budeme předpokládat, že interval je +/- 2 směrodatné odchylky z X srov s pravděpodobností 95 % pokryje μ - průměr běžné populace, z nichž vzorek. Tyto dva výroky jsou ekvivalentní, ale druhý výrok nám umožňuje konstrukci interval spolehlivosti.

Navíc zpřesníme interval: náhodná proměnná rozdělená přes normální zákon, s 95% pravděpodobností spadá do intervalu +/- 1,960 standardní odchylky, ne +/- 2 směrodatné odchylky. To lze vypočítat pomocí vzorce \u003d NORM.ST.OBR ((1 + 0,95) / 2), cm. ukázkový soubor Sheet Spacing.

Nyní můžeme formulovat pravděpodobnostní tvrzení, které nám poslouží k formování interval spolehlivosti:
„Pravděpodobnost, že průměr populace nachází se od ukázkový průměr do 1,960" standardní odchylky průměru vzorku", se rovná 95 %.

Hodnota pravděpodobnosti uvedená ve výpisu má speciální název , který je spojen s hladina významnosti α (alfa) jednoduchým výrazem úroveň důvěry =1 . V našem případě úroveň významnosti α =1-0,95=0,05 .

Nyní na základě tohoto pravděpodobnostního tvrzení napíšeme výraz pro výpočet interval spolehlivosti:

kde Za/2 Standard normální distribuce(taková hodnota náhodné veličiny z, Co P(z>=Za/2 ) = a/2).

Poznámka: Horní α/2-kvantil definuje šířku interval spolehlivosti PROTI směrodatné odchylky průměr vzorku. Horní α/2-kvantil Standard normální distribuce je vždy větší než 0, což je velmi výhodné.

V našem případě při α=0,05 horní α/2-kvantil rovná se 1,960. Pro ostatní hladiny významnosti α (10 %; 1 %) horní α/2-kvantil Za/2 lze vypočítat pomocí vzorce \u003d NORM.ST.OBR (1-α / 2) nebo, je-li známo úroveň důvěry, =NORM.ST.OBR((1+úroveň spolehlivosti)/2).

Obvykle při stavbě intervaly spolehlivosti pro odhad střední hodnoty použij jen horní α/2-kvantil a nepoužívejte nižší α/2-kvantil. To je možné, protože Standard normální distribuce symetricky podle osy x ( hustota jeho distribuce symetrický asi průměr, tzn. 0). Proto není třeba počítat nižší α/2-kvantil(nazývá se jednoduše α /2-kvantil), protože je to rovné horní α/2-kvantil se znaménkem mínus.

Připomeňme, že navzdory tvaru rozdělení x, odpovídající náhodné veličiny X srov distribuováno přibližně Pokuta N(μ;σ 2 /n) (viz článek o). Proto v obecný případ, výše uvedený výraz pro interval spolehlivosti je pouze přibližný. Pokud je x distribuováno přes normální zákon N(μ;σ 2 /n), pak výraz pro interval spolehlivosti je přesný.

Výpočet intervalu spolehlivosti v MS EXCEL

Pojďme vyřešit problém.
Doba odezvy elektronické součástky na vstupní signál je důležitá vlastnost zařízení. Technik chce vykreslit interval spolehlivosti pro průměrnou dobu odezvy na úrovni spolehlivosti 95 %. Z předchozích zkušeností inženýr ví, že směrodatná odchylka doby odezvy je 8 ms. Je známo, že inženýr provedl 25 měření pro odhad doby odezvy, průměrná hodnota byla 78 ms.

Řešení: Inženýr chce znát dobu odezvy elektronické zařízení, ale chápe, že doba odezvy není pevná, ale náhodná veličina, která má své vlastní rozdělení. Takže to nejlepší, v co může doufat, je určit parametry a tvar tohoto rozdělení.

Bohužel ze stavu problému neznáme formu rozložení doby odezvy (nemusí být normální). , tato distribuce je také neznámá. Známý je jen on standardní odchylka a=8. Proto, když nemůžeme vypočítat pravděpodobnosti a konstruovat interval spolehlivosti.

I když však distribuci neznáme čas samostatná odpověď, víme, že podle CPT, Distribuce vzorků průměrná doba odezvy je přibližně normální(budeme předpokládat, že podmínky CPT se provádějí, protože velikost Vzorky dostatečně velké (n=25)) .

Navíc, průměrný toto rozdělení se rovná střední hodnota rozdělení odezvy jednotek, tzn. μ. A standardní odchylka tohoto rozdělení (σ/√n) lze vypočítat pomocí vzorce =8/ROOT(25) .

Je také známo, že inženýr obdržel bodový odhad parametr μ rovný 78 ms (X cf). Proto nyní můžeme vypočítat pravděpodobnosti, protože známe formu distribuce ( normální) a jeho parametry (Х ср a σ/√n).

Inženýr chce vědět očekávaná hodnota μ distribuce doby odezvy. Jak bylo uvedeno výše, toto μ se rovná očekávání rozložení vzorku průměrné doby odezvy. Pokud použijeme normální distribuce N(X cf; σ/√n), pak bude požadované μ v rozsahu +/-2*σ/√n s pravděpodobností přibližně 95 %.

Úroveň významnosti rovná se 1-0,95=0,05.

Nakonec najděte levou a pravou hranici interval spolehlivosti.
Levý okraj: \u003d 78-NORM.ST.INR (1-0,05 / 2) * 8 / ROOT (25) = 74,864
Pravá hranice: \u003d 78 + NORM. ST. OBR (1-0,05 / 2) * 8 / ROOT (25) \u003d 81,136

Levý okraj: =NORM.INV(0,05/2; 78; 8/SQRT(25))
Pravý okraj: =NORM.INV(1-0,05/2; 78, 8/SQRT(25))

Odpovědět: interval spolehlivosti na 95% hladina spolehlivosti a σ=8msec rovná se 78+/-3,136 ms

V ukázkový soubor na listu Sigma známý vytvořil formulář pro výpočet a konstrukci bilaterální interval spolehlivosti za svévolné Vzorky s daným σ a úroveň významnosti.

Funkce CONFIDENCE.NORM().

Pokud hodnoty Vzorky jsou v dosahu B20:B79 , A úroveň významnosti rovna 0,05; pak vzorec MS EXCEL:
=PRŮMĚR (B20:B79)-CONFIDENCE(0,05;σ; POČET(B20:B79))
vrátí levý okraj interval spolehlivosti.

Stejnou hranici lze vypočítat pomocí vzorce:
=PRŮMĚR (B20:B79)-NORM.ST.INV(1-0,05/2)*σ/SQRT(POČET(B20:B79))

Poznámka: Funkce TRUST.NORM() se objevila v MS EXCEL 2010. Dřívější verze MS EXCEL používaly funkci TRUST().

Interval spolehlivosti pro matematické očekávání - to je takový interval vypočítaný z dat, který se známou pravděpodobností obsahuje matematické očekávání běžné populace. Přirozeným odhadem pro matematické očekávání je aritmetický průměr jeho pozorovaných hodnot. Proto dále v průběhu lekce budeme používat pojmy „průměr“, „průměrná hodnota“. V úlohách výpočtu intervalu spolehlivosti je nejčastěji vyžadována odpověď „Interval spolehlivosti průměrného čísla [hodnota v konkrétním problému] je od [nižší hodnota] do [vyšší hodnota]“. Pomocí intervalu spolehlivosti je možné hodnotit nejen průměrné hodnoty, ale i podíl toho či onoho znaku obecné populace. V lekci jsou rozebrány střední hodnoty, rozptyl, směrodatná odchylka a chyba, pomocí kterých se dostaneme k novým definicím a vzorcům Charakteristika vzorku a populace .

Bodové a intervalové odhady průměru

Pokud je průměrná hodnota obecné populace odhadnuta číslem (bodem), pak se jako odhad neznámého průměru obecné populace bere konkrétní průměr vypočítaný ze vzorku pozorování. V tomto případě se hodnota výběrového průměru – náhodné veličiny – neshoduje se střední hodnotou obecné populace. Při indikaci střední hodnoty vzorku je tedy nutné současně indikovat i výběrovou chybu. Standardní chyba se používá jako míra výběrové chyby, která je vyjádřena ve stejných jednotkách jako průměr. Proto se často používá následující zápis: .

Je-li požadováno, aby odhad střední hodnoty byl spojen s určitou pravděpodobností, pak parametr obecné zájmové populace musí být odhadnut nikoli jedním číslem, ale intervalem. Interval spolehlivosti je interval, ve kterém s určitou pravděpodobností P je zjištěna hodnota odhadovaného ukazatele obecné populace. Interval spolehlivosti, ve kterém s pravděpodobností P = 1 - α je náhodná proměnná , se vypočítá takto:

,

α = 1 - P, kterou najdete v příloze téměř každé knihy o statistice.

V praxi průměr a rozptyl populace nejsou známy, takže rozptyl populace je nahrazen rozptylem výběru a průměr populace průměrem vzorku. Interval spolehlivosti se tedy ve většině případů vypočítá takto:

.

Vzorec intervalu spolehlivosti lze použít k odhadu střední hodnoty populace, jestliže

  • je známa standardní odchylka obecné populace;
  • nebo není známa standardní odchylka základního souboru, ale velikost vzorku je větší než 30.

Výběrový průměr je nestranný odhad průměru populace. Na druhé straně, rozptyl vzorku není nestranný odhad rozptylu populace. Pro získání nezkresleného odhadu rozptylu populace ve vzorci pro rozptyl vzorku je velikost vzorku n by měl být nahrazen n-1.

Příklad 1 Ze 100 náhodně vybraných kaváren v určitém městě se shromažďuje informace, že průměrný počet zaměstnanců v nich je 10,5 se směrodatnou odchylkou 4,6. Určete interval spolehlivosti 95 % počtu zaměstnanců kavárny.

kde je kritická hodnota standardního normálního rozdělení pro hladinu významnosti α = 0,05 .

95% interval spolehlivosti pro průměrný počet zaměstnanců kavárny byl tedy mezi 9,6 a 11,4.

Příklad 2 Pro náhodný vzorek z obecné populace 64 pozorování byly vypočteny následující celkové hodnoty:

součet hodnot v pozorováních,

součet čtverců odchylek hodnot od průměru .

Vypočítejte 95% interval spolehlivosti pro očekávanou hodnotu.

vypočítat směrodatnou odchylku:

,

vypočítat průměrnou hodnotu:

.

Interval spolehlivosti nahraďte hodnotami ve výrazu:

kde je kritická hodnota standardního normálního rozdělení pro hladinu významnosti α = 0,05 .

Dostaneme:

95% interval spolehlivosti pro matematické očekávání tohoto vzorku se tedy pohyboval od 7,484 do 11,266.

Příklad 3 Pro náhodný vzorek z obecné populace 100 pozorování byla vypočtena střední hodnota 15,2 a směrodatná odchylka 3,2. Vypočítejte 95% interval spolehlivosti pro očekávanou hodnotu a poté 99% interval spolehlivosti. Pokud výkon vzorku a jeho variace zůstanou stejné, ale faktor spolehlivosti se zvýší, bude se interval spolehlivosti zužovat nebo rozšiřovat?

Tyto hodnoty dosadíme do výrazu pro interval spolehlivosti:

kde je kritická hodnota standardního normálního rozdělení pro hladinu významnosti α = 0,05 .

Dostaneme:

.

95% interval spolehlivosti pro průměr tohoto vzorku byl tedy od 14,57 do 15,82.

Opět dosadíme tyto hodnoty do výrazu pro interval spolehlivosti:

kde je kritická hodnota standardního normálního rozdělení pro hladinu významnosti α = 0,01 .

Dostaneme:

.

99% interval spolehlivosti pro průměr tohoto vzorku byl tedy od 14,37 do 16,02.

Jak vidíte, jak se faktor spolehlivosti zvyšuje, kritická hodnota standardního normálního rozdělení také roste, a proto jsou počáteční a koncové body intervalu umístěny dále od průměru, a tedy intervalu spolehlivosti pro matematické očekávání. zvyšuje.

Bodové a intervalové odhady měrné hmotnosti

Specifickou váhu některého znaku vzorku lze interpretovat jako bodový odhad specifická gravitace p stejný rys v běžné populaci. Pokud je třeba tuto hodnotu spojit s pravděpodobností, měl by se vypočítat interval spolehlivosti specifické hmotnosti p rys v obecné populaci s pravděpodobností P = 1 - α :

.

Příklad 4 V určitém městě jsou dva kandidáti A A B kandidovat na starostu. Náhodně bylo dotázáno 200 obyvatel města, z nichž 46 % odpovědělo, že by kandidáta volili A, 26 % - pro kandidáta B a 28 % neví, koho budou volit. Určete 95% interval spolehlivosti pro podíl obyvatel města, kteří kandidáta podporují A.

Nejprve si připomeňme následující definici:

Zvažme následující situaci. Nechť varianty obecné populace mají normální rozdělení s matematickým očekáváním $a$ a směrodatnou odchylkou $\sigma $. Ukázkový průměr v tento případ bude považováno za náhodnou veličinu. Když je $X$ normálně rozděleno, bude mít průměr vzorku také normální rozdělení s parametry

Pojďme najít interval spolehlivosti, který pokryje $a$ se spolehlivostí $\gamma $.

K tomu potřebujeme rovnost

Z toho dostáváme

Odtud můžeme snadno najít $t$ z tabulky hodnot funkce $Ф\left(t\right)$ a v důsledku toho najít $\delta $.

Vyvolejte tabulku hodnot funkce $Ф\left(t\right)$:

Obrázek 1. Tabulka hodnot funkce $Ф\left(t\right).$

Integrál spolehlivosti pro odhad očekávání, když $(\mathbf \sigma )$ není známo

V tomto případě použijeme hodnotu korigovaného rozptylu $S^2$. Nahradíme-li $\sigma $ ve výše uvedeném vzorci $S$, dostaneme:

Příklad úloh pro zjištění intervalu spolehlivosti

Příklad 1

Nechť má veličina $X$ normální rozdělení s rozptylem $\sigma =4$. Nechť je velikost vzorku $n=64$ a spolehlivost rovná $\gamma =0,95$. Najděte interval spolehlivosti pro odhad matematického očekávání daného rozdělení.

Musíme najít interval ($\overline(x)-\delta ,\overline(x)+\delta)$.

Jak jsme viděli výše

\[\delta =\frac(\sigma t)(\sqrt(n))=\frac(4t)(\sqrt(64))=\frac(\ t)(2)\]

Ze vzorce najdeme parametr $t$

\[Ф\left(t\right)=\frac(\gamma )(2)=\frac(0,95)(2)=0,475\]

Z tabulky 1 dostaneme $t=1,96$.

Nechť CB X tvoří základní soubor a β je neznámý parametr CB X. Pokud je statistický odhad v * konzistentní, pak čím větší je velikost vzorku, tím přesnější je hodnota β. V praxi však nemáme příliš velké vzorky, takže nemůžeme zaručit větší přesnost.

Nechť s* je statistický odhad pro s. Množství |v* - v| se nazývá přesnost odhadu. Je jasné, že přesnost je CB, protože s* je náhodná veličina. Nastavíme malé kladné číslo 8 a požadujeme přesnost odhadu |in* - in| bylo méně než 8, tj. | v* - v |< 8.

Spolehlivost g nebo úroveň důvěry odhad v by v * je pravděpodobnost g, se kterou je nerovnost |in * - in|< 8, т. е.

Obvykle je spolehlivost g nastavena předem a pro g mají číslo blízké 1 (0,9; 0,95; 0,99; ...).

Protože nerovnost |v * - v|< S равносильно двойному неравенству в* - S < в < в* + 8, то получаем:

Interval (v * - 8, v * + 5) se nazývá interval spolehlivosti, tj. interval spolehlivosti pokrývá neznámý parametr s pravděpodobností y. Všimněte si, že konce intervalu spolehlivosti jsou náhodné a liší se vzorek od vzorku, takže je přesnější říci, že interval (při * - 8, při * + 8) pokrývá neznámý parametr β spíše než β patří do tohoto intervalu. .

Nechat populace je dán náhodnou veličinou X, rozdělenou podle normálního zákona, navíc je známá směrodatná odchylka a. Matematické očekávání a = M (X) je neznámé. Je potřeba najít interval spolehlivosti pro a pro danou spolehlivost y.

Ukázkový průměr

je statistický odhad pro xr = a.

Teorém. Náhodná hodnota xB je normálně rozděleno, pokud je X normálně rozděleno a M(xB) = a,

A (XB) \u003d a, kde a \u003d y / B (X), a \u003d M (X). l/i

Interval spolehlivosti pro a má tvar:

Najdeme 8.

Použití vztahu

kde Ф(г) je Laplaceova funkce, máme:

P ( | XB - a |<8} = 2Ф

najdeme hodnotu t v tabulce hodnot Laplaceovy funkce.

Označující

T, dostaneme F(t) = g

Od rovnosti Najít - přesnost odhadu.

Interval spolehlivosti pro a má tedy tvar:

Pokud je dán vzorek z obecné populace X

ng Na" X2 xm
n. n1 n2 nm

n = U1 + ... + nm, pak interval spolehlivosti bude:

Příklad 6.35. Najděte interval spolehlivosti pro odhad očekávání a normálního rozdělení se spolehlivostí 0,95, když znáte průměr vzorku Xb = 10,43, velikost vzorku n = 100 a směrodatnou odchylku s = 5.

Použijme vzorec

Nechť náhodnou proměnnou X obecné populace je normálně rozdělena za předpokladu, že rozptyl a směrodatná odchylka s tohoto rozdělení jsou známé. Je nutné odhadnout neznámé matematické očekávání z výběrového průměru. V tomto případě se problém redukuje na nalezení intervalu spolehlivosti pro matematické očekávání se spolehlivostí b. Pokud nastavíme hodnotu pravděpodobnosti spolehlivosti (reliability) b, pak pomocí vzorce (6.9a) zjistíme pravděpodobnost pádu do intervalu pro neznámé matematické očekávání:

kde Ф(t) je Laplaceova funkce (5.17a).

V důsledku toho můžeme formulovat algoritmus pro nalezení hranic intervalu spolehlivosti pro matematické očekávání, pokud je znám rozptyl D = s 2:

  1. Nastavte hodnotu spolehlivosti na b .
  2. Z (6.14) vyjádřete Ф(t) = 0,5× b. Hodnotu t vyberte z tabulky pro Laplaceovu funkci hodnotou Ф(t) (viz Příloha 1).
  3. Odchylku e vypočítejte pomocí vzorce (6.10).
  4. Interval spolehlivosti zapište podle vzorce (6.12) tak, aby s pravděpodobností b platila následující nerovnost:

.

Příklad 5.

Náhodná veličina X má normální rozdělení. Najděte intervaly spolehlivosti pro odhad se spolehlivostí b = 0,96 neznámého průměru a, pokud je dán:

1) obecná směrodatná odchylka s = 5;

2) průměr vzorku;

3) velikost vzorku n = 49.

Ve vzorci (6.15) intervalového odhadu matematického očekávání A se spolehlivostí b jsou známy všechny veličiny kromě t. Hodnotu t lze zjistit pomocí (6.14): b = 2Ф(t) = 0,96. Ф(t) = 0,48.

Podle tabulky v Příloze 1 pro Laplaceovu funkci Ф(t) = 0,48 najděte odpovídající hodnotu t = 2,06. Proto, . Dosazením vypočtené hodnoty e do vzorce (6.12) získáme interval spolehlivosti: 30-1,47< a < 30+1,47.

Požadovaný interval spolehlivosti pro odhad se spolehlivostí b = 0,96 neznámého matematického očekávání je: 28,53< a < 31,47.



Novinka na místě

>

Nejoblíbenější