Domov Stomatitida Interval spolehlivosti je roven. Interval spolehlivosti

Interval spolehlivosti je roven. Interval spolehlivosti

Ve statistice existují dva typy odhadů: bodové a intervalové. Bodový odhad představuje samostatnou statistiku vzorku, která se používá k odhadu parametru populace. Například průměr vzorku je bodový odhad matematické očekávání populace a výběrový rozptyl S 2- bodový odhad rozptylu populace σ 2. ukázalo se, že výběrový průměr je nestranným odhadem matematického očekávání populace. Průměr vzorku se nazývá nestranný, protože průměr všech průměrů vzorku (se stejnou velikostí vzorku) n) se rovná matematickému očekávání běžné populace.

Aby se vzorový rozptyl S 2 se stal nestranným odhadem rozptylu populace σ 2, jmenovatel rozptylu vzorku by měl být nastaven na hodnotu n – 1 , ale ne n. Jinými slovy, populační rozptyl je průměrem všech možných výběrových rozptylů.

Při odhadu populačních parametrů je třeba mít na paměti, že výběrové statistiky jako např , závisí na konkrétních vzorcích. Zohlednit tuto skutečnost, získat intervalový odhad matematické očekávání obecné populace, analyzovat rozdělení výběrových průměrů (podrobněji viz). Konstruovaný interval je charakterizován určitou úrovní spolehlivosti, která představuje pravděpodobnost, že skutečný parametr populace je odhadnut správně. Podobné intervaly spolehlivosti lze použít k odhadu podílu charakteristiky R a hlavní distribuovaná masa populace.

Stáhněte si poznámku ve formátu nebo formátu, příklady ve formátu

Sestrojení intervalu spolehlivosti pro matematické očekávání základního souboru se známou směrodatnou odchylkou

Sestrojení intervalu spolehlivosti pro podíl charakteristiky v populaci

Tato část rozšiřuje koncept intervalu spolehlivosti na kategorická data. To nám umožňuje odhadnout podíl charakteristiky v populaci R pomocí vzorového sdílení RS= X/n. Jak je uvedeno, pokud množství nR A n(1 – p) překročit číslo 5, lze binomické rozdělení aproximovat jako normální. Proto odhadnout podíl charakteristiky v populaci R je možné sestrojit interval, jehož úroveň spolehlivosti je rovna (1 – α) x 100 %.


Kde pS- podíl vzorku charakteristiky rovný X/n, tj. počet úspěchů vydělený velikostí vzorku, R- podíl charakteristiky v běžné populaci, Z- kritická hodnota standard normální distribuce, n- velikost vzorku.

Příklad 3 Předpokládejme, že vzor sestávající ze 100 faktur vyplněných během minulý měsíc. Řekněme, že 10 z těchto faktur bylo sestaveno s chybami. Tím pádem, R= 10/100 = 0,1. 95% hladina spolehlivosti odpovídá kritické hodnotě Z = 1,96.

Pravděpodobnost, že mezi 4,12 % a 15,88 % faktur obsahuje chyby, je tedy 95 %.

Pro danou velikost vzorku se interval spolehlivosti obsahující podíl charakteristiky v základním souboru jeví širší než u spojitého náhodná proměnná. Je to proto, že měření spojité náhodné veličiny obsahují více informací než měření kategorických dat. Jinými slovy, kategorická data, která nabývají pouze dvou hodnot, obsahují nedostatečné informace pro odhad parametrů jejich distribuce.

Vvýpočet odhadů extrahovaných z konečné populace

Odhad matematického očekávání. Korekční faktor pro konečnou populaci ( fpc) byl použit ke snížení standardní chyby o faktor. Při výpočtu intervalů spolehlivosti pro odhady parametrů populace se v situacích, kdy se vzorky odebírají, aniž by byly vráceny, použije korekční faktor. Tedy interval spolehlivosti pro matematické očekávání s hladinou spolehlivosti rovnou (1 – α) x 100 %, se vypočítá podle vzorce:

Příklad 4. Abychom ilustrovali použití korekčního faktoru pro konečný soubor, vraťme se k problému výpočtu intervalu spolehlivosti pro průměrnou částku faktur, diskutovanému výše v příkladu 3. Předpokládejme, že společnost vystavuje 5 000 faktur měsíčně a X= 110,27 dolarů, S= 28,95 $, N = 5000, n = 100, α = 0,05, t99 = 1,9842. Pomocí vzorce (6) získáme:

Odhad podílu prvku. Při výběru bez návratnosti interval spolehlivosti pro podíl atributu s úrovní spolehlivosti rovnou (1 – α) x 100 %, se vypočítá podle vzorce:

Intervaly důvěry a etické otázky

Při vzorkování populace a vyvozování statistických závěrů často vyvstávají etické problémy. Hlavní je, jak se shodují intervaly spolehlivosti a bodové odhady výběrových statistik. Publikování bodových odhadů bez určení souvisejících intervalů spolehlivosti (obvykle na úrovni spolehlivosti 95 %) a velikosti vzorku, ze kterého jsou odvozeny, může způsobit zmatek. To může v uživateli vzbudit dojem, že bodový odhad je přesně to, co potřebuje k předpovědi vlastností celé populace. Je tedy nutné pochopit, že v každém výzkumu by se nemělo zaměřovat na bodové odhady, ale na intervalové odhady. Kromě, Speciální pozornost by měla být dána správná volba velikosti vzorků.

Nejčastěji jsou objektem statistické manipulace výsledky sociologických průzkumů obyvatelstva o určitých politických otázkách. V tomto případě jsou výsledky průzkumu zveřejněny na titulních stránkách novin a chyba výběrové šetření a metodika pro statistickou analýzu je vytištěna někde uprostřed. K prokázání platnosti získaných bodových odhadů je nutné uvést velikost vzorku, na základě které byly získány, hranice intervalu spolehlivosti a jeho hladinu významnosti.

Další poznámka

Jsou použity materiály z knihy Levin et al Statistika pro manažery. – M.: Williams, 2004. – str. 448–462

Teorém centrálního limitu uvádí, že při dostatečně velké velikosti vzorku lze rozložení průměrů ve vzorku aproximovat normálním rozložením. Tato vlastnost nezávisí na typu rozložení populace.

V předchozích podkapitolách jsme se zabývali otázkou odhadu neznámého parametru A jedno číslo. Tomu se říká „bodový“ odhad. V řadě úloh je potřeba nejen najít parametr A vhodnou číselnou hodnotu, ale také vyhodnotit její přesnost a spolehlivost. Musíte vědět, k jakým chybám může výměna parametru vést A jeho bodový odhad A as jakou mírou jistoty můžeme očekávat, že tyto chyby nepřekročí známé meze?

Problémy tohoto druhu jsou relevantní zejména u malého počtu pozorování, kdy bodový odhad a dovnitř je z velké části náhodné a přibližné nahrazení a může vést k závažným chybám.

Pro představu o přesnosti a spolehlivosti odhadu A,

PROTI matematické statistiky Používají tzv. intervaly spolehlivosti a pravděpodobnosti spolehlivosti.

Nechte pro parametr A nestranný odhad získaný ze zkušenosti A. V tomto případě chceme odhadnout možnou chybu. Přiřaďme nějakou dostatečně velkou pravděpodobnost p (například p = 0,9, 0,95 nebo 0,99), aby událost s pravděpodobností p mohla být považována za prakticky spolehlivou, a najdeme hodnotu s, pro kterou

Pak rozsah prakticky možných hodnot chyby vzniklé při výměně A na A, bude ± s; Velké chyby v absolutní hodnotě se objeví jen s malou pravděpodobností a = 1 - p. Přepišme (14.3.1) jako:

Rovnost (14.3.2) znamená, že s pravděpodobností p neznámá hodnota parametr A spadá do intervalu

Je třeba poznamenat jednu okolnost. Dříve jsme opakovaně zvažovali pravděpodobnost, že náhodná veličina spadne do daného nenáhodného intervalu. Zde je situace jiná: velikost A není náhodný, ale interval / p je náhodný. Jeho poloha na ose x je náhodná, určená jeho středem A; Obecně je také délka intervalu 2s náhodná, protože hodnota s se vypočítává zpravidla z experimentálních dat. Proto v v tomto případě bylo by lepší interpretovat hodnotu p ne jako pravděpodobnost „zasáhnutí“ bodu A v intervalu / p, a jako pravděpodobnost, že náhodný interval / p pokryje bod A(obr. 14.3.1).

Rýže. 14.3.1

Pravděpodobnost p se obvykle nazývá pravděpodobnost spolehlivosti a interval / p - interval spolehlivosti. Intervalové hranice Li. a x =a- s a a 2 = a + a jsou voláni hranice důvěry.

Uveďme další výklad pojmu interval spolehlivosti: lze jej považovat za interval hodnot parametrů A, kompatibilní s experimentálními daty a nejsou s nimi v rozporu. Pokud totiž souhlasíme s tím, že událost s pravděpodobností a = 1-p považujeme za prakticky nemožnou, pak ty hodnoty parametru a, pro které a - a> s musí být uznány za odporující si experimentální údaje a ty, pro které |a - A a t na 2.

Nechte pro parametr A existuje nestranný odhad A. Kdybychom znali zákon rozdělení množství A, úkol najít interval spolehlivosti by byl velmi jednoduchý: stačilo by najít hodnotu s, pro kterou

Potíž je v tom, že zákon rozdělení odhadů A závisí na zákonu rozdělení množství X a tedy na jeho neznámých parametrech (zejména na parametru samotném A).

Chcete-li tento problém obejít, můžete použít následující zhruba přibližnou techniku: nahraďte neznámé parametry ve výrazu pro s jejich bodovými odhady. S poměrně velkým počtem experimentů P(asi 20...30) tato technika obvykle poskytuje výsledky, které jsou z hlediska přesnosti uspokojivé.

Jako příklad zvažte problém intervalu spolehlivosti pro matematické očekávání.

Ať se vyrábí P X, jejichž charakteristikou je matematické očekávání T a rozptyl D- neznámý. Pro tyto parametry byly získány následující odhady:

Je nutné sestrojit odpovídající interval spolehlivosti / p pravděpodobnost spolehlivosti p, pro matematické očekávání T množství X.

Při řešení tohoto problému využijeme toho, že množství T představuje součet P nezávislé identicky rozdělené náhodné veličiny Xh a podle centrální limitní věty pro dostatečně velké P jeho distribuční zákon se blíží normálu. V praxi i při relativně malém počtu členů (asi 10...20) lze distribuční zákon součtu považovat přibližně za normální. Budeme předpokládat, že hodnota T distribuovány podle běžného zákona. Charakteristiky tohoto zákona – matematické očekávání a rozptyl – jsou stejné, resp T A

(viz kapitola 13 pododdíl 13.3). Předpokládejme, že hodnota D známe a najdeme hodnotu Ep, pro kterou

Pomocí vzorce (6.3.5) z kapitoly 6 vyjádříme pravděpodobnost na levé straně (14.3.5) pomocí funkce normálního rozdělení

kde je směrodatná odchylka odhadu T.

Z rov.

zjistěte hodnotu Sp:

kde arg Ф* (х) je inverzní funkce k Ф* (X), těch. hodnota argumentu, při kterém normální funkci distribuce se rovná X.

Disperze D, prostřednictvím kterého se veličina vyjadřuje A 1P, nevíme přesně; jako jeho přibližnou hodnotu můžete použít odhad D(14.3.4) a uveďte přibližně:

Tím byl problém sestrojení intervalu spolehlivosti přibližně vyřešen, což se rovná:

kde gp je určeno vzorcem (14.3.7).

Aby se zabránilo obrácené interpolaci v tabulkách funkce Ф* (l) při výpočtu s p, je vhodné sestavit speciální tabulku (tabulka 14.3.1), která udává hodnoty veličiny

v závislosti na r. Hodnota (p určuje pro normální zákon počet směrodatných odchylek, které je třeba vykreslit vpravo a vlevo od středu disperze tak, aby pravděpodobnost vstupu do výsledné oblasti byla rovna p.

Pomocí hodnoty 7 p je interval spolehlivosti vyjádřen jako:

Tabulka 14.3.1

Příklad 1. Bylo provedeno 20 experimentů s množstvím X; výsledky jsou uvedeny v tabulce. 14.3.2.

Tabulka 14.3.2

Je nutné najít odhad z pro matematické očekávání množství X a sestrojte interval spolehlivosti odpovídající pravděpodobnosti spolehlivosti p = 0,8.

Řešení. My máme:

Pokud jako referenční bod zvolíme l: = 10, pomocí třetího vzorce (14.2.14) najdeme nezkreslený odhad D :

Podle tabulky 14.3.1 najdeme

Limity spolehlivosti:

Interval spolehlivosti:

Hodnoty parametrů T, ležící v tomto intervalu jsou kompatibilní s experimentálními daty uvedenými v tabulce. 14.3.2.

Interval spolehlivosti pro rozptyl lze sestrojit podobným způsobem.

Ať se vyrábí P nezávislé experimenty s náhodnou veličinou X s neznámými parametry pro A i disperzi D byl získán nestranný odhad:

Je nutné přibližně sestrojit interval spolehlivosti pro rozptyl.

Ze vzorce (14.3.11) je zřejmé, že množství D představuje

množství P náhodné proměnné formuláře . Tyto hodnoty nejsou

nezávislé, protože kterýkoli z nich zahrnuje množství T, závislý na všech ostatních. Lze však ukázat, že s přibývajícími P distribuční zákon jejich součtu se také blíží normálu. Téměř v P= 20...30 to už lze považovat za normální.

Předpokládejme, že tomu tak je, a najdeme charakteristiky tohoto zákona: matematické očekávání a rozptyl. Od posouzení D- tedy nezaujatý M[D] = D.

Výpočet rozptylu D D je spojen s poměrně složitými výpočty, proto uvádíme jeho vyjádření bez odvození:

kde q 4 je čtvrtý centrální bod množství X.

Chcete-li použít tento výraz, musíte nahradit hodnoty \u003d 4 a D(alespoň ty blízké). Namísto D můžete použít jeho hodnocení D. V zásadě lze čtvrtý centrální moment také nahradit odhadem, například hodnotou tvaru:

ale taková náhrada poskytne extrémně nízkou přesnost, protože obecně, s omezeným počtem experimentů, momenty vysoký řád určeno z velké chyby. V praxi se však často stává, že typ rozdělení množství zákon X známé předem: neznámé jsou pouze jeho parametry. Pak můžete zkusit vyjádřit μ 4 přes D.

Vezměme si nejčastější případ, kdy hodnota X distribuovány podle běžného zákona. Poté je jeho čtvrtý centrální moment vyjádřen pomocí disperze (viz kapitola 6, pododdíl 6.2);

a vzorec (14.3.12) dává nebo

Nahrazení neznámého v (14.3.14) D jeho hodnocení D, dostáváme: odkud

Moment μ 4 lze vyjádřit prostřednictvím D i v některých jiných případech, kdy rozdělení hodnoty X není normální, ale jeho vzhled je známý. Například pro zákon rovnoměrná hustota(viz kapitola 5) máme:

kde (a, P) je interval, na kterém je zákon specifikován.

Proto,

Pomocí vzorce (14.3.12) dostaneme: kde přibližně najdeme

V případech, kdy není znám typ distribučního zákona pro veličinu 26, se při přibližném odhadu hodnoty a/) přesto doporučuje použít vzorec (14.3.16), pokud neexistují zvláštní důvody domnívat se, že tento zákon se velmi liší od normálního (má znatelnou kladnou nebo zápornou špičatost).

Pokud přibližnou hodnotu a/) získáme tak či onak, pak můžeme sestrojit interval spolehlivosti pro rozptyl stejným způsobem, jakým jsme jej vytvořili pro matematické očekávání:

kde hodnotu závislou na dané pravděpodobnosti p zjistíme podle tabulky. 14.3.1.

Příklad 2. Najděte přibližně 80% interval spolehlivosti pro rozptyl náhodné proměnné X za podmínek příkladu 1, je-li známo, že hodnota X distribuovány podle zákona blízkého normálu.

Řešení. Hodnota zůstává stejná jako v tabulce. 14.3.1:

Podle vzorce (14.3.16)

Pomocí vzorce (14.3.18) zjistíme interval spolehlivosti:

Odpovídající interval průměrných hodnot čtvercová odchylka: (0,21; 0,29).

14.4. Přesné metody pro konstrukci intervalů spolehlivosti pro parametry náhodné veličiny rozdělené podle normálního zákona

V předchozí podkapitole jsme zkoumali zhruba přibližné metody pro konstrukci intervalů spolehlivosti pro matematické očekávání a rozptyl. Zde poskytneme představu o přesných metodách řešení stejného problému. Zdůrazňujeme, že pro přesné nalezení intervalů spolehlivosti je bezpodmínečně nutné předem znát formu distribučního zákona množství X, zatímco pro aplikaci přibližných metod to není nutné.

Idea přesné metody konstruování intervalů spolehlivosti vede k následujícímu. Jakýkoli interval spolehlivosti se zjistí z podmínky vyjadřující pravděpodobnost splnění určitých nerovností, které zahrnují odhad, který nás zajímá A. Zákon rozdělení ocenění A PROTI obecný případ závisí na neznámých parametrech množství X. Někdy je však možné přejít v nerovnostech z náhodné veličiny A na nějakou jinou funkci pozorovaných hodnot X p X 2, ..., X str. jehož distribuční zákon nezávisí na neznámých parametrech, ale závisí pouze na počtu pokusů a na typu distribučního zákona veličiny X. Tyto druhy náhodných proměnných hrají důležitou roli v matematické statistice; nejpodrobněji byly studovány pro případ normálního rozdělení veličiny X.

Bylo například prokázáno, že při normálním rozdělení hodnoty X náhodná hodnota

podřizuje se tzv Studentské distribuční právo S P- 1 stupeň volnosti; hustota tohoto zákona má tvar

kde G(x) je známá funkce gama:

Bylo také prokázáno, že náhodná veličina

má "%2 distribuci" s P- 1 stupeň volnosti (viz kapitola 7), jehož hustota je vyjádřena vzorcem

Aniž bychom se zabývali derivacemi rozdělení (14.4.2) a (14.4.4), ukážeme si, jak je lze použít při konstrukci intervalů spolehlivosti pro parametry ty D.

Ať se vyrábí P nezávislé experimenty s náhodnou veličinou X, normálně distribuované s neznámými parametry NA. Pro tyto parametry byly získány odhady

Je nutné sestrojit intervaly spolehlivosti pro oba parametry odpovídající pravděpodobnosti spolehlivosti p.

Nejprve sestrojme interval spolehlivosti pro matematické očekávání. Je přirozené brát tento interval symetrický vzhledem k T; nechť s p označuje polovinu délky intervalu. Hodnota s p musí být zvolena tak, aby byla podmínka splněna

Zkusme se přesunout na levou stranu rovnosti (14.4.5) od náhodné veličiny T na náhodnou veličinu T, distribuován podle studentského zákona. Chcete-li to provést, vynásobte obě strany nerovnosti |m-w?|

o kladnou hodnotu: nebo pomocí zápisu (14.4.1),

Pojďme najít číslo / p takové, že hodnotu / p lze zjistit z podmínky

Ze vzorce (14.4.2) je zřejmé, že (1) - dokonce funkci, tak (14.4.8) dává

Rovnost (14.4.9) určuje hodnotu / p v závislosti na p. Pokud máte k dispozici tabulku integrálních hodnot

pak lze hodnotu /p zjistit reverzní interpolací v tabulce. Je však pohodlnější předem sestavit tabulku hodnot /p. Taková tabulka je uvedena v příloze (tabulka 5). Tato tabulka ukazuje hodnoty v závislosti na úrovni spolehlivosti p a počtu stupňů volnosti P- 1. Po určení / p z tabulky. 5 a za předpokladu

najdeme poloviční šířku intervalu spolehlivosti / p a interval samotný

Příklad 1. Bylo provedeno 5 nezávislých experimentů na náhodné proměnné X, normálně distribuované s neznámými parametry T a asi. Výsledky experimentů jsou uvedeny v tabulce. 14.4.1.

Tabulka 14.4.1

Najít hodnocení T pro matematické očekávání a sestrojte pro něj 90% interval spolehlivosti / p (tj. interval odpovídající pravděpodobnosti spolehlivosti p = 0,9).

Řešení. My máme:

Podle tabulky 5 žádosti o P - 1 = 4 a p = 0,9 najdeme kde

Interval spolehlivosti bude

Příklad 2. Pro podmínky příkladu 1 pododdílu 14.3, za předpokladu hodnoty X normálně rozdělené, najděte přesný interval spolehlivosti.

Řešení. Podle tabulky 5 přílohy zjistíme kdy P - 1 = 19ir =

0,8 / p = 1,328; odtud

Ve srovnání s řešením příkladu 1 pododdílu 14.3 (e p = 0,072) jsme přesvědčeni, že nesoulad je velmi nevýznamný. Pokud zachováme přesnost na dvě desetinná místa, pak se intervaly spolehlivosti zjištěné přesnou a přibližnou metodou shodují:

Přejděme ke konstrukci intervalu spolehlivosti pro rozptyl. Zvažte nezaujatý odhad rozptylu

a vyjádřit náhodnou veličinu D přes velikost PROTI(14.4.3), s rozdělením x 2 (14.4.4):

Znát zákon rozdělení množství PROTI, můžete najít interval /(1), do kterého s danou pravděpodobností p spadá.

Zákon rozdělování kn_x(v) magnituda I 7 má tvar znázorněný na Obr. 14.4.1.

Rýže. 14.4.1

Vyvstává otázka: jak zvolit interval / p? Je-li zákon rozdělení vel PROTI byl symetrický (jako normální zákon nebo Studentovo rozdělení), bylo by přirozené brát interval /p symetrický vzhledem k matematickému očekávání. V tomto případě zákon k p_x (v) asymetrické. Dohodněme se, že zvolíme interval /p tak, aby pravděpodobnost hodnoty byla PROTI za intervalem vpravo a vlevo (stínované oblasti na obr. 14.4.1) byly stejné a stejné

Ke konstrukci intervalu /p s touto vlastností použijeme tabulku. 4 aplikace: obsahuje čísla y) takové, že

za hodnotu PROTI, mající x 2 -rozdělení s r stupni volnosti. V našem případě r = n- 1. Pojďme opravit r = n- 1 a najděte v odpovídajícím řádku tabulky. 4 dva významy x 2 - jeden odpovídá pravděpodobnosti druhý - pravděpodobnost Označme tyto

hodnoty ve 2 A xl? Interval má y 2, levou stranou a y~ pravý konec.

Nyní najdeme z intervalu / p požadovaný interval spolehlivosti /| pro disperzi s hranicemi D, a D2, která pokrývá pointu D s pravděpodobností p:

Sestrojme interval / (, = (?> ь А), který pokrývá bod D tehdy a jen tehdy, když hodnota PROTI spadá do intervalu /r. Ukažme, že interval

tuto podmínku splňuje. Opravdu, nerovnosti jsou ekvivalentní nerovnostem

a tyto nerovnosti jsou uspokojeny pravděpodobností p. Interval spolehlivosti pro rozptyl byl tedy nalezen a je vyjádřen vzorcem (14.4.13).

Příklad 3. Najděte interval spolehlivosti pro rozptyl za podmínek příkladu 2 pododdílu 14.3, pokud je známo, že hodnota X normálně distribuované.

Řešení. My máme . Podle tabulky 4 přílohy

najdeme na r = n - 1 = 19

Pomocí vzorce (14.4.13) zjistíme interval spolehlivosti pro rozptyl

Odpovídající interval pro směrodatnou odchylku je (0,21; 0,32). Tento interval jen nepatrně překračuje interval (0,21; 0,29) získaný v příkladu 2 pododdílu 14.3 pomocí přibližné metody.

  • Obrázek 14.3.1 uvažuje interval spolehlivosti symetrický kolem a. Obecně, jak uvidíme později, to není nutné.

Intervaly spolehlivosti.

Výpočet intervalu spolehlivosti je založen na průměrné chybě odpovídajícího parametru. Interval spolehlivosti ukazuje, v jakých mezích s pravděpodobností (1-a) leží skutečná hodnota odhadovaného parametru. Zde a je hladina významnosti, (1-a) se také nazývá pravděpodobnost spolehlivosti.

V první kapitole jsme ukázali, že například u aritmetického průměru leží skutečný průměr populace přibližně v 95 % případů v rozmezí 2 směrodatných chyb od průměru. Hranice 95% intervalu spolehlivosti pro průměr tedy budou dvakrát tak daleko od průměru vzorku průměrná chyba průměr, tzn. průměrnou chybu průměru vynásobíme určitým koeficientem v závislosti na hladině spolehlivosti. Pro průměr a rozdíl průměrů se bere Studentův koeficient (kritická hodnota Studentova testu), pro podíl a rozdíl podílů kritická hodnota z kritéria. Součin koeficientu a průměrné chyby lze nazvat maximální chybou daného parametru, tzn. maximum, které můžeme při jejím posuzování získat.

Interval spolehlivosti pro aritmetický průměr : .

Zde je ukázkový průměr;

Průměrná chyba aritmetického průměru;

s – výběrová směrodatná odchylka;

n

f = n-1 (Studentův koeficient).

Interval spolehlivosti pro rozdíly aritmetických průměrů :

Zde je rozdíl mezi průměrem vzorku;

- průměrná chyba rozdílu mezi aritmetickými průměry;

s 1 , s 2 – vzorové směrodatné odchylky;

n1, n2

Kritická hodnota Studentův t test pro danou hladinu významnosti a a počet stupňů volnosti f=n1+n2-2 (Studentův koeficient).

Interval spolehlivosti pro akcií :

.

Zde d je frakce vzorku;

– chyba průměrného zlomku;

n– velikost vzorku (velikost skupiny);

Interval spolehlivosti pro rozdíl podílů :

Zde je rozdíl v podílech vzorků;

– průměrná chyba rozdílu mezi aritmetickými průměry;

n1, n2– objemy vzorků (počet skupin);

Kritická hodnota z kritéria na dané hladině významnosti a ( , , ).

Výpočtem intervalů spolehlivosti pro rozdíl mezi ukazateli za prvé přímo vidíme možné hodnoty efekt, a nejen to bodový odhad. Za druhé, můžeme vyvodit závěr o přijetí nebo zamítnutí nulové hypotézy a za třetí můžeme vyvodit závěr o síle testu.

Při testování hypotéz pomocí intervalů spolehlivosti musíte dodržovat následující pravidlo:

Pokud 100(1-a) procentní interval spolehlivosti rozdílu průměrů neobsahuje nulu, pak jsou rozdíly statisticky významné na hladině významnosti a; naopak pokud tento interval obsahuje nulu, pak rozdíly nejsou statisticky významné.

Pokud totiž tento interval obsahuje nulu, znamená to, že porovnávaný ukazatel může být v jedné ze skupin ve srovnání s druhou skupinou buď větší, nebo menší, tzn. pozorované rozdíly jsou způsobeny náhodou.

Sílu testu lze posoudit podle umístění nuly v intervalu spolehlivosti. Pokud se nula blíží nižší resp horní limit intervalu, pak by možná při větším počtu porovnávaných skupin rozdíly dosáhly statistická významnost. Pokud je nula blízko středu intervalu, znamená to, že zvýšení i snížení ukazatele v experimentální skupině jsou stejně pravděpodobné a pravděpodobně opravdu neexistují žádné rozdíly.

Příklady:

Pro srovnání operační úmrtnosti při použití dvou různých typů anestezie: 61 osob bylo operováno prvním typem anestezie, 8 zemřelo, druhým typem – 67 osob, 10 zemřelo.

d1 = 8/61 = 0,131; d2 = 10/67 = 0,149; dl-d2 = -0,018.

Rozdíl v letalitě srovnávaných metod se bude pohybovat v rozmezí (-0,018 - 0,122; -0,018 + 0,122) nebo (-0,14; 0,104) s pravděpodobností 100(1-a) = 95 %. Interval obsahuje nulu, tzn. hypotéza o stejné letalitě ve dvou odlišné typy Anestezii nelze odmítnout.

Úmrtnost tedy může a bude klesat na 14 % a zvyšovat na 10,4 % s pravděpodobností 95 %, tzn. nula je přibližně uprostřed intervalu, takže lze tvrdit, že s největší pravděpodobností se tyto dvě metody skutečně neliší v letalitě.

V příkladu diskutovaném výše byla průměrná doba lisování během testu poklepávání porovnávána ve čtyřech skupinách studentů lišících se ve výsledcích zkoušek. Vypočítejme intervaly spolehlivosti pro průměrnou dobu lisování pro studenty, kteří složili zkoušku se známkami 2 a 5, a interval spolehlivosti pro rozdíl mezi těmito průměry.

Studentovy koeficienty se zjistí pomocí Studentových distribučních tabulek (viz příloha): pro první skupinu: = t(0,05;48) = 2,011; pro druhou skupinu: = t(0,05;61) = 2,000. Intervaly spolehlivosti pro první skupinu tedy: = (162,19-2,011*2,18; 162,19+2,011*2,18) = (157,8; 166,6), pro druhou skupinu (156,55- 2000*1,88; 12581055+) ; 160,3). Takže pro ty, kteří složili zkoušku s 2, se průměrná doba stisknutí pohybuje od 157,8 ms do 166,6 ms s pravděpodobností 95 %, pro ty, kteří zkoušku složili s 5 – od 152,8 ms do 160,3 ms s pravděpodobností 95 %. .

Můžete také testovat nulovou hypotézu pomocí intervalů spolehlivosti pro průměry, a nejen pro rozdíl v průměrech. Například, jako v našem případě, pokud se intervaly spolehlivosti pro průměry překrývají, pak nelze nulovou hypotézu zamítnout. Pro zamítnutí hypotézy na zvolené hladině významnosti se odpovídající intervaly spolehlivosti nesmí překrývat.

Najděte interval spolehlivosti pro rozdíl v průměrné době lisování ve skupinách, které složily zkoušku se známkami 2 a 5. Rozdíl průměrů: 162,19 – 156,55 = 5,64. Studentův koeficient: = t(0,05;49+62-2) = t(0,05;109) = 1,982. Směrodatné odchylky skupiny se budou rovnat: ; . Vypočítáme průměrnou chybu rozdílu mezi průměry: . Interval spolehlivosti: =(5,64-1,982*2,87; 5,64+1,982*2,87) = (-0,044; 11,33).

Rozdíl v průměrné době lisování ve skupinách, které prošly zkouškou s 2 a 5, bude tedy v rozsahu od -0,044 ms do 11,33 ms. Tento interval zahrnuje nulu, tzn. Průměrná doba lisování u těch, kteří zkoušku složili dobře, se může ve srovnání s těmi, kteří zkoušku složili neuspokojivě, buď zvýšit, nebo snížit, tzn. nulovou hypotézu nelze zamítnout. Ale nula je velmi blízko spodní hranici a doba lisování se mnohem pravděpodobněji zkrátí u těch, kteří prošli dobře. Můžeme tedy dojít k závěru, že stále existují rozdíly v průměrné době lisování mezi těmi, kteří prošli 2 a 5, jen jsme je nemohli detekovat vzhledem ke změně průměrného času, rozptylu průměrného času a velikosti vzorků.



Síla testu je pravděpodobnost zamítnutí nesprávné nulové hypotézy, tzn. najít rozdíly tam, kde skutečně existují.

Síla testu se určuje na základě hladiny významnosti, velikosti rozdílů mezi skupinami, rozložení hodnot ve skupinách a velikosti vzorků.

Pro studentský test a analýza rozptylu Můžete použít diagramy citlivosti.

Pomocí síly kritéria lze předběžně určit požadovaný počet skupin.

Interval spolehlivosti ukazuje, v jakých mezích se s danou pravděpodobností nachází skutečná hodnota odhadovaného parametru.

Pomocí intervalů spolehlivosti můžete testovat statistické hypotézy a vyvozovat závěry o citlivosti kritérií.

LITERATURA.

Glanz S. – Kapitola 6,7.

Rebrová O.Yu. – s.112-114, s.171-173, s.234-238.

Sidorenko E. V. – str. 32-33.

Otázky pro sebetestování studentů.

1. Jaká je síla kritéria?

2. V jakých případech je nutné vyhodnotit sílu kritérií?

3. Metody výpočtu výkonu.

6. Jak otestovat statistickou hypotézu pomocí intervalu spolehlivosti?

7. Co lze říci o síle kritéria při výpočtu intervalu spolehlivosti?

Úkoly.

Předpokládejme, že máme velké množství položek s normálním rozložením některých vlastností (například plný sklad zeleniny stejného druhu, jejíž velikost a hmotnost se liší). Chcete znát průměrné vlastnosti celé šarže zboží, ale nemáte čas ani chuť každou zeleninu měřit a vážit. Chápete, že to není nutné. Ale kolik kusů by bylo potřeba vzít na namátkovou kontrolu?

Než uvedeme několik vzorců užitečných pro tuto situaci, připomeňme si nějaký zápis.

Za prvé, pokud bychom změřili celý sklad zeleniny (tato množina prvků se nazývá běžná populace), pak bychom se vší přesností, kterou máme k dispozici, znali průměrnou hmotnost celé dávky. Říkejme tomu průměr X prům .g en . - obecný průměr. Již víme, co je zcela určeno, pokud je známa jeho střední hodnota a odchylka s . Pravda, nejsme ani X průměrný gen. ani s Neznáme běžnou populaci. Můžeme odebrat pouze určitý vzorek, změřit hodnoty, které potřebujeme, a vypočítat pro tento vzorek jak průměrnou hodnotu X avg., tak i směrodatnou odchylku S select.

Je známo, že pokud naše výběrová kontrola obsahuje velký počet prvků (obvykle n je větší než 30), a jsou brány opravdu náhodné, pak s obecná populace se od výběru S sotva bude lišit.

Navíc pro případ normálního rozdělení můžeme použít následující vzorce:

S pravděpodobností 95%


S pravděpodobností 99%



V obecný pohled s pravděpodobností P (t)


Vztah mezi hodnotou t a hodnotou pravděpodobnosti P (t), se kterou chceme znát interval spolehlivosti, lze převzít z následující tabulky:


Zjistili jsme tedy, v jakém rozmezí leží průměrná hodnota pro populaci (s danou pravděpodobností).

Pokud nemáme dostatečně velký vzorek, nemůžeme říci, že populace má s = S vyberte V tomto případě je navíc problematická blízkost vzorku k normálnímu rozdělení. V tomto případě místo toho také použijeme S select s ve vzorci:




ale hodnota t pro pevnou pravděpodobnost P(t) bude záviset na počtu prvků ve vzorku n. Čím větší n, tím blíže bude výsledný interval spolehlivosti hodnotě dané vzorcem (1). Hodnoty t jsou v tomto případě převzaty z jiné tabulky ( Studentův t-test), který uvádíme níže:

Hodnoty Studentova t-testu pro pravděpodobnost 0,95 a 0,99


Příklad 3 Ze zaměstnanců společnosti bylo náhodně vybráno 30 lidí. Podle vzorku se ukázalo, že průměrná mzda (za měsíc) je 30 tisíc rublů se směrodatnou odchylkou 5 tisíc rublů. Určete průměrnou mzdu ve firmě s pravděpodobností 0,99.

Řešení: Podle podmínky máme n = 30, X prům. = 30 000, S = 5 000, P = 0,99. Pro zjištění intervalu spolehlivosti použijeme vzorec odpovídající Studentovu t testu. Z tabulky pro n = 30 a P = 0,99 zjistíme t = 2,756, tedy


těch. vyhledávaným správcem interval 27484< Х ср.ген < 32516.

S pravděpodobností 0,99 tedy můžeme říci, že interval (27484; 32516) v sobě obsahuje průměrnou mzdu ve firmě.

Doufáme, že tuto metodu využijete a není nutné, abyste měli stůl pokaždé s sebou. Výpočty lze provádět automaticky v Excelu. V souboru Excel klikněte na tlačítko fx v horní nabídce. Poté vyberte mezi funkcemi typ „statistický“ az navrhovaného seznamu v okně – STUDAR DISCOVER. Poté na výzvu umístěním kurzoru do pole „pravděpodobnost“ zadejte hodnotu inverzní pravděpodobnosti (tj. v našem případě místo pravděpodobnosti 0,95 musíte zadat pravděpodobnost 0,05). Podle všeho tabulkový procesor je sestaven tak, že výsledek odpovídá na otázku, s jakou pravděpodobností můžeme udělat chybu. Podobně do pole Stupeň volnosti zadejte hodnotu (n-1) pro váš vzorek.

Interval spolehlivosti pro matematické očekávání - jedná se o interval vypočítaný z údajů, které se známou pravděpodobností obsahují matematické očekávání běžné populace. Přirozeným odhadem matematického očekávání je aritmetický průměr jeho pozorovaných hodnot. Proto v celé lekci budeme používat termíny „průměr“ a „průměrná hodnota“. V problémech s výpočtem intervalu spolehlivosti je nejčastěji vyžadována odpověď něco jako „Interval spolehlivosti průměrného čísla [hodnota v konkrétním problému] je od [menší hodnota] do [větší hodnota].“ Pomocí intervalu spolehlivosti můžete vyhodnotit nejen průměrné hodnoty, ale také podíl konkrétní charakteristiky v obecné populaci. Průměry, rozptyl, standardní odchylka a chyby, díky nimž dospějeme k novým definicím a vzorcům, jsou diskutovány v lekci Charakteristika vzorku a populace .

Bodové a intervalové odhady průměru

Pokud je průměrná hodnota populace odhadnuta číslem (bodem), pak se jako odhad neznámé průměrné hodnoty populace bere konkrétní průměr, který se vypočítá ze vzorku pozorování. V tomto případě se hodnota výběrového průměru – náhodné veličiny – neshoduje se střední hodnotou obecné populace. Proto při indikaci střední hodnoty vzorku musíte současně uvést chybu vzorku. Mírou výběrové chyby je standardní chyba, která je vyjádřena ve stejných jednotkách jako průměr. Proto se často používá následující zápis: .

Pokud je třeba odhad průměru spojit s určitou pravděpodobností, pak je třeba parametr zájmu v populaci posuzovat nikoli jedním číslem, ale intervalem. Interval spolehlivosti je interval, ve kterém s určitou pravděpodobností P je zjištěna hodnota odhadovaného ukazatele počtu obyvatel. Interval spolehlivosti, ve kterém je to pravděpodobné P = 1 - α náhodná proměnná je nalezena, vypočítaná takto:

,

α = 1 - P, kterou najdete v příloze téměř každé knihy o statistice.

V praxi průměr a rozptyl populace nejsou známy, takže rozptyl populace je nahrazen rozptylem výběru a průměr populace průměrem vzorku. Interval spolehlivosti se tedy ve většině případů vypočítá takto:

.

Vzorec intervalu spolehlivosti lze použít k odhadu střední hodnoty populace, jestliže

  • je známa standardní odchylka základního souboru;
  • nebo standardní odchylka populace není známa, ale velikost vzorku je větší než 30.

Výběrový průměr je nestranný odhad průměru populace. Na druhé straně, rozptyl vzorku není nestranný odhad rozptylu populace. Chcete-li získat nezkreslený odhad rozptylu populace ve vzorci rozptylu vzorku, velikost vzorku n by měl být nahrazen n-1.

Příklad 1 Ze 100 náhodně vybraných kaváren v určitém městě byla shromážděna informace, že průměrný počet zaměstnanců v nich je 10,5 se směrodatnou odchylkou 4,6. Určete 95% interval spolehlivosti pro počet zaměstnanců kavárny.

kde je kritická hodnota standardního normálního rozdělení pro hladinu významnosti α = 0,05 .

95% interval spolehlivosti průměrného počtu zaměstnanců kavárny se tedy pohyboval v rozmezí 9,6 až 11,4.

Příklad 2 Pro náhodný vzorek z populace 64 pozorování byly vypočteny následující celkové hodnoty:

součet hodnot v pozorováních,

součet čtverců odchylek hodnot od průměru .

Vypočítejte 95% interval spolehlivosti pro matematické očekávání.

Pojďme vypočítat směrodatnou odchylku:

,

Vypočítejme průměrnou hodnotu:

.

Hodnoty dosadíme do výrazu pro interval spolehlivosti:

kde je kritická hodnota standardního normálního rozdělení pro hladinu významnosti α = 0,05 .

Dostaneme:

95% interval spolehlivosti pro matematické očekávání tohoto vzorku se tedy pohyboval od 7,484 do 11,266.

Příklad 3 Pro náhodný vzorek populace 100 pozorování je vypočtený průměr 15,2 a směrodatná odchylka je 3,2. Vypočítejte 95% interval spolehlivosti pro očekávanou hodnotu a poté 99% interval spolehlivosti. Pokud výkon vzorku a jeho variace zůstanou nezměněny a koeficient spolehlivosti se zvýší, bude se interval spolehlivosti zužovat nebo rozšiřovat?

Tyto hodnoty dosadíme do výrazu pro interval spolehlivosti:

kde je kritická hodnota standardního normálního rozdělení pro hladinu významnosti α = 0,05 .

Dostaneme:

.

95% interval spolehlivosti pro průměr tohoto vzorku se tedy pohyboval od 14,57 do 15,82.

Tyto hodnoty opět dosadíme do výrazu pro interval spolehlivosti:

kde je kritická hodnota standardního normálního rozdělení pro hladinu významnosti α = 0,01 .

Dostaneme:

.

99% interval spolehlivosti pro průměr tohoto vzorku se tedy pohyboval od 14,37 do 16,02.

Jak vidíme, jak se koeficient spolehlivosti zvyšuje, kritická hodnota standardního normálního rozdělení také roste a v důsledku toho jsou počáteční a koncové body intervalu umístěny dále od průměru, a proto se interval spolehlivosti pro matematické očekávání zvyšuje. .

Bodové a intervalové odhady měrné hmotnosti

Podíl některého atributu vzorku lze interpretovat jako bodový odhad specifická gravitace p stejné vlastnosti v běžné populaci. Pokud je třeba tuto hodnotu spojit s pravděpodobností, měl by se vypočítat interval spolehlivosti specifické hmotnosti p charakteristika v populaci s pravděpodobností P = 1 - α :

.

Příklad 4. V některém městě jsou dva kandidáti A A B kandidují na starostu. Náhodně bylo dotázáno 200 obyvatel města, z nichž 46 % odpovědělo, že by kandidáta volili A, 26 % - pro kandidáta B a 28 % neví, koho budou volit. Určete 95% interval spolehlivosti pro podíl obyvatel města podporujících kandidáta A.



Novinka na webu

>

Nejoblíbenější