Domov Protetika a implantace Jak najít příklad intervalu spolehlivosti. Interval spolehlivosti

Jak najít příklad intervalu spolehlivosti. Interval spolehlivosti

Interval spolehlivosti– limitní hodnoty statistická hodnota, která s danou pravděpodobností γ bude v tomto intervalu při vzorkování většího objemu. Označuje se jako P(θ - ε. V praxi se pravděpodobnost spolehlivosti γ volí z hodnot poměrně blízkých jednotce: γ = 0,9, γ = 0,95, γ = 0,99.

Účel služby. Pomocí této služby můžete určit:

  • interval spolehlivosti pro obecný průměr, interval spolehlivosti pro rozptyl;
  • interval spolehlivosti pro směrodatnou odchylku, interval spolehlivosti pro obecný podíl;
Výsledné řešení se uloží do souboru aplikace Word (viz příklad). Níže je video návod, jak vyplnit počáteční údaje.

Příklad č. 1. Na JZD bylo z celkového stáda 1000 ovcí 100 ovcí podrobeno selektivnímu kontrolnímu stříhání. V důsledku toho byl stanoven průměrný odstřižek vlny 4,2 kg na ovci. Určete s pravděpodobností 0,99 střední kvadraturu vzorku při stanovení průměrného střihu vlny na ovci a mezí, ve kterých je hodnota střihu obsažena, je-li rozptyl 2,5. Vzorek se neopakuje.
Příklad č. 2. Ze šarže dovezených výrobků na poště Moskevské severní celnice bylo náhodným opakovaným vzorkováním odebráno 20 vzorků výrobku „A“. Výsledkem testu byl průměrný obsah vlhkosti produktu „A“ ve vzorku, který se ukázal být roven 6 % se směrodatnou odchylkou 1 %.
Určete s pravděpodobností 0,683 limity průměrné vlhkosti výrobku v celé šarži dovážených výrobků.
Příklad č. 3. Průzkum mezi 36 studenty ukázal, že průměrný počet přečtených učebnic za rok akademický rok, ukázalo se rovna 6. Za předpokladu, že počet učebnic přečtených studentem za semestr má zákon normálního rozdělení se směrodatnou odchylkou rovnou 6, zjistěte: A) se spolehlivostí 0,99 intervalový odhad pro matematický očekávání tohoto náhodná proměnná; B) s jakou pravděpodobností můžeme říci, že průměrný počet přečtených učebnic studentem za semestr, vypočtený z daného vzorku, se bude odchylovat od matematického očekávání podle absolutní hodnota ne více než 2.

Klasifikace intervalů spolehlivosti

Podle typu hodnoceného parametru:

Podle typu vzorku:

  1. Interval spolehlivosti pro nekonečný vzorek;
  2. Interval spolehlivosti pro konečný vzorek;
Vzorek se nazývá převzorkování, pokud se vybraný objekt vrátí do populace před výběrem dalšího. Ukázka se nazývá neopakující se, pokud vybraný objekt není vrácen do populace. V praxi se většinou potýkáme s neopakujícími se vzorky.

Výpočet průměrné výběrové chyby pro náhodný výběr

Nesoulad mezi hodnotami ukazatelů získanými ze vzorku a odpovídajícími parametry obecné populace se nazývá chyba reprezentativnosti.
Označení hlavních parametrů obecné a výběrové populace.
Vzorce průměrných chyb vzorkování
opětovný výběropakovat výběr
za průměrpro sdíleníza průměrpro sdílení
Vztah mezi mezí vzorkovací chyby (Δ) je s určitou pravděpodobností zaručen Р(t), A průměrná chyba vzorek má tvar: nebo Δ = t·μ, kde t– koeficient spolehlivosti, stanovený v závislosti na úrovni pravděpodobnosti P(t) podle tabulky Laplaceovy integrální funkce.

Vzorce pro výpočet velikosti vzorku metodou čistě náhodného výběru

V předchozích podkapitolách jsme se zabývali otázkou odhadu neznámého parametru A jedno číslo. Tomu se říká „bodový“ odhad. V řadě úloh je potřeba nejen najít parametr A vhodnou číselnou hodnotu, ale také vyhodnotit její přesnost a spolehlivost. Musíte vědět, k jakým chybám může výměna parametru vést A jeho bodový odhad A as jakou mírou jistoty můžeme očekávat, že tyto chyby nepřekročí známé meze?

Problémy tohoto druhu jsou relevantní zejména u malého počtu pozorování, kdy bodový odhad a dovnitř je z velké části náhodné a přibližné nahrazení a může vést k závažným chybám.

Pro představu o přesnosti a spolehlivosti odhadu A,

PROTI matematické statistiky Používají tzv. intervaly spolehlivosti a pravděpodobnosti spolehlivosti.

Nechte pro parametr A nestranný odhad získaný ze zkušenosti A. V tomto případě chceme odhadnout možnou chybu. Přiřaďme nějakou dostatečně velkou pravděpodobnost p (například p = 0,9, 0,95 nebo 0,99), aby událost s pravděpodobností p mohla být považována za prakticky spolehlivou, a najdeme hodnotu s, pro kterou

Pak je rozsah prakticky možné hodnoty chyba, která se objeví při výměně A na A, bude ± s; Velké chyby v absolutní hodnotě se objeví jen s malou pravděpodobností a = 1 - p. Přepišme (14.3.1) jako:

Rovnost (14.3.2) znamená, že s pravděpodobností p je neznámá hodnota parametru A spadá do intervalu

Je třeba poznamenat jednu okolnost. Dříve jsme opakovaně zvažovali pravděpodobnost, že náhodná veličina spadne do daného nenáhodného intervalu. Zde je situace jiná: velikost A není náhodný, ale interval / p je náhodný. Jeho poloha na ose x je náhodná, určená jeho středem A; Obecně je také délka intervalu 2s náhodná, protože hodnota s se vypočítává zpravidla z experimentálních dat. Proto v v tomto případě bylo by lepší interpretovat hodnotu p ne jako pravděpodobnost „zasáhnutí“ bodu A v intervalu / p, a jako pravděpodobnost, že náhodný interval / p pokryje bod A(obr. 14.3.1).

Rýže. 14.3.1

Pravděpodobnost p se obvykle nazývá pravděpodobnost spolehlivosti a interval / p - interval spolehlivosti. Intervalové hranice Li. a x =a- s a a 2 = a + a jsou voláni hranice důvěry.

Uveďme další výklad pojmu interval spolehlivosti: lze jej považovat za interval hodnot parametrů A, kompatibilní s experimentálními daty a nejsou s nimi v rozporu. Pokud totiž souhlasíme s tím, že událost s pravděpodobností a = 1-p považujeme za prakticky nemožnou, pak ty hodnoty parametru a, pro které a - a> s musí být uznány za odporující si experimentální údaje a ty, pro které |a - A a t na 2.

Nechte pro parametr A existuje nestranný odhad A. Kdybychom znali zákon rozdělení množství A, úkol najít interval spolehlivosti by byl velmi jednoduchý: stačilo by najít hodnotu s, pro kterou

Potíž je v tom, že zákon rozdělení odhadů A závisí na zákonu rozdělení množství X a tedy na jeho neznámých parametrech (zejména na parametru samotném A).

Chcete-li tento problém obejít, můžete použít následující zhruba přibližnou techniku: nahraďte neznámé parametry ve výrazu pro s jejich bodovými odhady. S poměrně velkým počtem experimentů P(asi 20...30) tato technika obvykle poskytuje výsledky, které jsou z hlediska přesnosti uspokojivé.

Jako příklad zvažte problém intervalu spolehlivosti pro matematické očekávání.

Ať se vyrábí P X, jejichž vlastnosti jsou očekávaná hodnota T a rozptyl D- neznámý. Pro tyto parametry byly získány následující odhady:

Je nutné sestrojit interval spolehlivosti / p odpovídající pravděpodobnosti spolehlivosti p pro matematické očekávání T množství X.

Při řešení tohoto problému využijeme toho, že množství T představuje součet P nezávislé identicky rozdělené náhodné veličiny X h a podle centrální limitní věty pro dostatečně velké P jeho distribuční zákon se blíží normálu. V praxi i při relativně malém počtu členů (asi 10...20) lze distribuční zákon součtu považovat přibližně za normální. Budeme předpokládat, že hodnota T distribuovány podle běžného zákona. Charakteristiky tohoto zákona – matematické očekávání a rozptyl – jsou stejné, resp T A

(viz kapitola 13 pododdíl 13.3). Předpokládejme, že hodnota D známe a najdeme hodnotu Ep, pro kterou

Pomocí vzorce (6.3.5) z kapitoly 6 vyjádříme pravděpodobnost na levé straně (14.3.5) pomocí funkce normálního rozdělení

kde je směrodatná odchylka odhadu T.

Z rov.

zjistěte hodnotu Sp:

kde arg Ф* (х) je inverzní funkce k Ф* (X), těch. hodnota argumentu, při kterém normální funkci distribuce se rovná X.

Disperze D, prostřednictvím kterého se veličina vyjadřuje A 1P, nevíme přesně; jako jeho přibližnou hodnotu můžete použít odhad D(14.3.4) a uveďte přibližně:

Tím byl problém sestrojení intervalu spolehlivosti přibližně vyřešen, což se rovná:

kde gp je určeno vzorcem (14.3.7).

Aby se zabránilo obrácené interpolaci v tabulkách funkce Ф* (l) při výpočtu s p, je vhodné sestavit speciální tabulku (tabulka 14.3.1), která udává hodnoty veličiny

v závislosti na r. Hodnota (p určuje pro normální zákon počet směrodatných odchylek, které je třeba vykreslit vpravo a vlevo od středu disperze tak, aby pravděpodobnost vstupu do výsledné oblasti byla rovna p.

Pomocí hodnoty 7 p je interval spolehlivosti vyjádřen jako:

Tabulka 14.3.1

Příklad 1. Bylo provedeno 20 experimentů s množstvím X; výsledky jsou uvedeny v tabulce. 14.3.2.

Tabulka 14.3.2

Je nutné najít odhad z pro matematické očekávání množství X a sestrojte interval spolehlivosti odpovídající pravděpodobnosti spolehlivosti p = 0,8.

Řešení. My máme:

Pokud jako referenční bod zvolíme l: = 10, pomocí třetího vzorce (14.2.14) najdeme nezkreslený odhad D :

Podle tabulky 14.3.1 najdeme

Limity spolehlivosti:

Interval spolehlivosti:

Hodnoty parametrů T, ležící v tomto intervalu jsou kompatibilní s experimentálními daty uvedenými v tabulce. 14.3.2.

Interval spolehlivosti pro rozptyl lze sestrojit podobným způsobem.

Ať se vyrábí P nezávislé experimenty s náhodnou veličinou X s neznámými parametry pro A i disperzi D byl získán nestranný odhad:

Je nutné přibližně sestrojit interval spolehlivosti pro rozptyl.

Ze vzorce (14.3.11) je zřejmé, že množství D představuje

množství P náhodné proměnné formuláře . Tyto hodnoty nejsou

nezávislé, protože kterýkoli z nich zahrnuje množství T, závislý na všech ostatních. Lze však ukázat, že s přibývajícími P distribuční zákon jejich součtu se také blíží normálu. Téměř v P= 20...30 to už lze považovat za normální.

Předpokládejme, že tomu tak je, a najdeme charakteristiky tohoto zákona: matematické očekávání a rozptyl. Od posouzení D- tedy nezaujatý M[D] = D.

Výpočet rozptylu D D je spojen s poměrně složitými výpočty, proto uvádíme jeho vyjádření bez odvození:

kde q 4 je čtvrtý centrální bod množství X.

Chcete-li použít tento výraz, musíte nahradit hodnoty \u003d 4 a D(alespoň ty blízké). Namísto D můžete použít jeho hodnocení D. V zásadě lze čtvrtý centrální moment také nahradit odhadem, například hodnotou tvaru:

ale taková náhrada poskytne extrémně nízkou přesnost, protože obecně, s omezeným počtem experimentů, momenty vysoký řád určeno z velké chyby. V praxi se však často stává, že typ rozdělení množství zákon X známé předem: neznámé jsou pouze jeho parametry. Pak můžete zkusit vyjádřit μ 4 přes D.

Vezměme si nejčastější případ, kdy hodnota X distribuovány podle běžného zákona. Poté je jeho čtvrtý centrální moment vyjádřen pomocí disperze (viz kapitola 6, pododdíl 6.2);

a vzorec (14.3.12) dává nebo

Nahrazení neznámého v (14.3.14) D jeho hodnocení D, dostáváme: odkud

Moment μ 4 lze vyjádřit prostřednictvím D i v některých jiných případech, kdy rozdělení hodnoty X není normální, ale jeho vzhled je známý. Například pro zákon rovnoměrná hustota(viz kapitola 5) máme:

kde (a, P) je interval, na kterém je zákon specifikován.

Proto,

Pomocí vzorce (14.3.12) získáme: kde přibližně najdeme

V případech, kdy není znám typ distribučního zákona pro veličinu 26, se při přibližném odhadu hodnoty a/) přesto doporučuje použít vzorec (14.3.16), pokud neexistují zvláštní důvody domnívat se, že tento zákon se velmi liší od normálního (má znatelnou kladnou nebo zápornou špičatost).

Pokud přibližnou hodnotu a/) získáme tak či onak, pak můžeme sestrojit interval spolehlivosti pro rozptyl stejným způsobem, jakým jsme jej vytvořili pro matematické očekávání:

kde hodnotu závislou na dané pravděpodobnosti p zjistíme podle tabulky. 14.3.1.

Příklad 2. Najděte přibližně 80% interval spolehlivosti pro rozptyl náhodné proměnné X za podmínek příkladu 1, je-li známo, že hodnota X distribuovány podle zákona blízkého normálu.

Řešení. Hodnota zůstává stejná jako v tabulce. 14.3.1:

Podle vzorce (14.3.16)

Pomocí vzorce (14.3.18) zjistíme interval spolehlivosti:

Odpovídající interval průměrných hodnot čtvercová odchylka: (0,21; 0,29).

14.4. Přesné stavební metody intervaly spolehlivosti pro parametry náhodné veličiny rozdělené podle normálního zákona

V předchozí podkapitole jsme zkoumali zhruba přibližné metody pro konstrukci intervalů spolehlivosti pro matematické očekávání a rozptyl. Zde poskytneme představu o přesných metodách řešení stejného problému. Zdůrazňujeme, že pro přesné nalezení intervalů spolehlivosti je bezpodmínečně nutné předem znát formu distribučního zákona množství X, zatímco pro aplikaci přibližných metod to není nutné.

Idea přesné metody konstruování intervalů spolehlivosti vede k následujícímu. Jakýkoli interval spolehlivosti se zjistí z podmínky vyjadřující pravděpodobnost splnění určitých nerovností, které zahrnují odhad, který nás zajímá A. Zákon rozdělení ocenění A PROTI obecný případ závisí na neznámých parametrech množství X. Někdy je však možné přejít v nerovnostech z náhodné veličiny A na nějakou jinou funkci pozorovaných hodnot X p X 2, ..., X str. jehož distribuční zákon nezávisí na neznámých parametrech, ale závisí pouze na počtu pokusů a na typu distribučního zákona veličiny X. Tyto druhy náhodných proměnných hrají důležitou roli v matematické statistice; nejpodrobněji byly studovány pro případ normálního rozdělení veličiny X.

Bylo například prokázáno, že při normálním rozdělení hodnoty X náhodná hodnota

podřizuje se tzv Studentské distribuční právo S P- 1 stupeň volnosti; hustota tohoto zákona má tvar

kde G(x) je známá funkce gama:

Bylo také prokázáno, že náhodná veličina

má "%2 distribuci" s P- 1 stupeň volnosti (viz kapitola 7), jehož hustota je vyjádřena vzorcem

Aniž bychom se zdržovali derivacemi rozdělení (14.4.2) a (14.4.4), ukážeme si, jak je lze použít při konstrukci intervalů spolehlivosti pro parametry ty D.

Ať se vyrábí P nezávislé experimenty s náhodnou veličinou X, normálně distribuované s neznámými parametry NA. Pro tyto parametry byly získány odhady

Je nutné sestrojit intervaly spolehlivosti pro oba parametry odpovídající pravděpodobnosti spolehlivosti p.

Nejprve sestrojme interval spolehlivosti pro matematické očekávání. Je přirozené brát tento interval symetrický vzhledem k T; nechť s p označuje polovinu délky intervalu. Hodnota s p musí být zvolena tak, aby byla podmínka splněna

Zkusme se přesunout na levou stranu rovnosti (14.4.5) od náhodné veličiny T na náhodnou veličinu T, distribuován podle studentského zákona. Chcete-li to provést, vynásobte obě strany nerovnosti |m-w?|

o kladnou hodnotu: nebo pomocí zápisu (14.4.1),

Pojďme najít číslo / p takové, že hodnotu / p lze zjistit z podmínky

Ze vzorce (14.4.2) je zřejmé, že (1) - dokonce funkce, tak (14.4.8) dává

Rovnost (14.4.9) určuje hodnotu / p v závislosti na p. Pokud máte k dispozici tabulku integrálních hodnot

pak lze hodnotu /p zjistit reverzní interpolací v tabulce. Je však pohodlnější předem sestavit tabulku hodnot /p. Taková tabulka je uvedena v příloze (tabulka 5). Tato tabulka ukazuje hodnoty v závislosti na úrovni spolehlivosti p a počtu stupňů volnosti P- 1. Po určení / p z tabulky. 5 a za předpokladu

najdeme poloviční šířku intervalu spolehlivosti / p a interval samotný

Příklad 1. Bylo provedeno 5 nezávislých experimentů na náhodné proměnné X, normálně distribuované s neznámými parametry T a asi. Výsledky experimentů jsou uvedeny v tabulce. 14.4.1.

Tabulka 14.4.1

Najít hodnocení T pro matematické očekávání a sestrojte pro něj 90% interval spolehlivosti / p (tj. interval odpovídající pravděpodobnosti spolehlivosti p = 0,9).

Řešení. My máme:

Podle tabulky 5 přihlášky pro P - 1 = 4 a p = 0,9 najdeme kde

Interval spolehlivosti bude

Příklad 2. Pro podmínky příkladu 1 pododdílu 14.3, za předpokladu hodnoty X normálně rozdělené, najděte přesný interval spolehlivosti.

Řešení. Podle tabulky 5 přílohy zjistíme kdy P - 1 = 19ir =

0,8 / p = 1,328; odtud

Ve srovnání s řešením příkladu 1 pododdílu 14.3 (e p = 0,072) jsme přesvědčeni, že nesoulad je velmi nevýznamný. Pokud zachováme přesnost na dvě desetinná místa, pak se intervaly spolehlivosti zjištěné přesnou a přibližnou metodou shodují:

Přejděme ke konstrukci intervalu spolehlivosti pro rozptyl. Zvažte nezaujatý odhad rozptylu

a vyjádřit náhodnou veličinu D přes velikost PROTI(14.4.3), s rozdělením x 2 (14.4.4):

Znát zákon rozdělení množství PROTI, můžete najít interval /(1), do kterého s danou pravděpodobností p spadá.

Zákon rozdělování kn_x(v) magnituda I 7 má tvar znázorněný na Obr. 14.4.1.

Rýže. 14.4.1

Vyvstává otázka: jak zvolit interval / p? Je-li zákon rozdělení vel PROTI byl symetrický (jako normální zákon nebo Studentovo rozdělení), bylo by přirozené brát interval /p symetrický vzhledem k matematickému očekávání. V tomto případě zákon k p_x (v) asymetrické. Dohodněme se, že zvolíme interval /p tak, aby pravděpodobnost hodnoty byla PROTI za intervalem vpravo a vlevo (stínované oblasti na obr. 14.4.1) byly stejné a stejné

Ke konstrukci intervalu /p s touto vlastností použijeme tabulku. 4 aplikace: obsahuje čísla y) takové, že

za hodnotu PROTI, mající x 2 -rozdělení s r stupni volnosti. V našem případě r = n- 1. Pojďme opravit r = n- 1 a najděte v odpovídajícím řádku tabulky. 4 dva významy x 2 - jeden odpovídá pravděpodobnosti druhý - pravděpodobnost Označme tyto

hodnoty ve 2 A xl? Interval má y 2, levou stranou a y~ pravý konec.

Nyní najdeme z intervalu / p požadovaný interval spolehlivosti /| pro disperzi s hranicemi D, a D2, která pokrývá pointu D s pravděpodobností p:

Sestrojme interval / (, = (?> ь А), který pokrývá bod D tehdy a jen tehdy, když hodnota PROTI spadá do intervalu /r. Ukažme, že interval

tuto podmínku splňuje. Opravdu, nerovnosti jsou ekvivalentní nerovnostem

a tyto nerovnosti jsou uspokojeny pravděpodobností p. Tím byl nalezen interval spolehlivosti pro rozptyl a je vyjádřen vzorcem (14.4.13).

Příklad 3. Najděte interval spolehlivosti pro rozptyl za podmínek příkladu 2 pododdílu 14.3, pokud je známo, že hodnota X normálně distribuované.

Řešení. My máme . Podle tabulky 4 přílohy

najdeme na r = n - 1 = 19

Pomocí vzorce (14.4.13) zjistíme interval spolehlivosti pro rozptyl

Odpovídající interval pro směrodatnou odchylku je (0,21; 0,32). Tento interval jen nepatrně překračuje interval (0,21; 0,29) získaný v příkladu 2 pododdílu 14.3 pomocí přibližné metody.

  • Obrázek 14.3.1 uvažuje interval spolehlivosti symetrický kolem a. Obecně, jak uvidíme později, to není nutné.

Odhad intervalů spolehlivosti

Učební cíle

Statistiky zvažují následující dva hlavní úkoly:

    Máme nějaký odhad založený na vzorových datech a chceme udělat nějaké pravděpodobnostní prohlášení o tom, kde leží skutečná hodnota odhadovaného parametru.

    Máme konkrétní hypotézu, kterou je třeba otestovat pomocí vzorových dat.

V tomto tématu se zabýváme prvním úkolem. Uveďme také definici intervalu spolehlivosti.

Interval spolehlivosti je interval, který je postaven kolem odhadované hodnoty parametru a ukazuje, kde se nachází skutečná hodnota odhadovaného parametru s a priori specifikovanou pravděpodobností.

Po prostudování materiálu na toto téma:

    zjistit, co je interval spolehlivosti pro odhad;

    naučit se klasifikovat statistické problémy;

    osvojit si techniku ​​konstruování intervalů spolehlivosti, a to jak pomocí statistických vzorců, tak pomocí softwarových nástrojů;

    naučit se určovat požadované velikosti vzorků pro dosažení určitých parametrů přesnosti statistických odhadů.

Rozdělení charakteristik vzorku

T-rozdělení

Jak bylo diskutováno výše, rozdělení náhodné veličiny se blíží standardizovanému normální distribuce s parametry 0 a 1. Protože neznáme hodnotu σ, nahradíme ji nějakým odhadem s. Množství má již jiné rozdělení, a to popř Studentská distribuce, který je určen parametrem n -1 (počet stupňů volnosti). Toto rozdělení se blíží normálnímu rozdělení (čím větší n, tím bližší jsou rozdělení).

Na Obr. 95
je uvedeno Studentovo rozdělení s 30 stupni volnosti. Jak vidíte, je velmi blízko normální distribuci.

Podobně jako u funkcí pro práci s normálním rozdělením NORMIDIST a NORMINV existují funkce pro práci s t-rozdělením - STUDIST (TDIST) a STUDRASOBR (TINV). Příklad použití těchto funkcí je vidět v souboru STUDRASP.XLS (šablona a řešení) a na Obr. 96
.

Rozdělení dalších charakteristik

Jak již víme, k určení přesnosti odhadu matematického očekávání potřebujeme t-rozdělení. K odhadu dalších parametrů, jako je rozptyl, jsou zapotřebí různá rozdělení. Dvě z nich jsou F-rozdělení a x 2 -distribuce.

Interval spolehlivosti pro průměr

Interval spolehlivosti- toto je interval, který je postaven kolem odhadované hodnoty parametru a ukazuje, kde se nachází skutečná hodnota odhadovaného parametru s a priori specifikovanou pravděpodobností.

Dochází ke konstrukci intervalu spolehlivosti pro průměrnou hodnotu následujícím způsobem:

Příklad

Rychlé občerstvení plánuje rozšířit sortiment o nový typ chlebíčku. Aby manažer odhadl poptávku po něm, plánuje náhodně vybrat 40 návštěvníků z těch, kteří ho již vyzkoušeli, a požádat je, aby ohodnotili svůj postoj k novému produktu na stupnici od 1 do 10. Manažer chce odhadnout očekávanou počet bodů, které nový produkt získá, a sestrojte pro tento odhad 95% interval spolehlivosti. Jak to udělat? (viz soubor SANDWICH1.XLS (šablona a řešení).

Řešení

K vyřešení tohoto problému můžete použít . Výsledky jsou uvedeny na Obr. 97
.

Interval spolehlivosti pro celkovou hodnotu

Někdy je pomocí vzorových dat nutné odhadnout nikoli matematické očekávání, ale Celková částka hodnoty. Například v situaci s auditorem může být zájmem odhadnout nikoli průměrnou velikost účtu, ale součet všech účtů.

Nechte N- celkový prvků, n je velikost vzorku, T 3 je součet hodnot ve vzorku, T" je odhad součtu pro celou populaci, pak a interval spolehlivosti se vypočítá podle vzorce , kde s je odhad směrodatné odchylky pro vzorek a je odhad průměru pro vzorek.

Příklad

Řekněme některé daňová služba chce odhadnout výši celkových vratek daní pro 10 000 poplatníků. Poplatník buď obdrží refundaci, nebo zaplatí dodatečné daně. Najděte 95% interval spolehlivosti pro částku vrácené částky za předpokladu velikosti vzorku 500 osob (viz soubor ČÁSTKA REFUND.XLS (šablona a řešení).

Řešení

StatPro nemá pro tento případ speciální postup, nicméně lze poznamenat, že hranice lze získat z hranic pro průměr na základě výše uvedených vzorců (obr. 98
).

Interval spolehlivosti pro poměr

Nechť p je matematické očekávání podílu klientů a nechť pb je odhad tohoto podílu získaný ze vzorku o velikosti n. Lze prokázat, že pro dostatečně velké rozdělení hodnocení se bude blížit normálu s matematickým očekáváním p a směrodatnou odchylkou . Standardní chyba odhadu je v tomto případě vyjádřena jako a interval spolehlivosti je jako .

Příklad

Rychlé občerstvení plánuje rozšířit sortiment o nový typ chlebíčku. Pro posouzení poptávky po něm manažer náhodně vybral 40 návštěvníků z těch, kteří jej již vyzkoušeli, a požádal je, aby ohodnotili svůj postoj k novému produktu na stupnici od 1 do 10. Manažer chce odhadnout očekávaný podíl zákazníci, kteří nový produkt ohodnotí alespoň 6 body (očekává, že tito zákazníci budou spotřebiteli nového produktu).

Řešení

Zpočátku vytvoříme nový sloupec na základě atributu 1, pokud bylo hodnocení klienta více než 6 bodů, a jinak 0 (viz soubor SANDWICH2.XLS (šablona a řešení).

Metoda 1

Počítáním čísla 1 odhadneme podíl a poté použijeme vzorce.

Hodnota zcr je převzata ze speciálních tabulek normálního rozdělení (například 1,96 pro 95% interval spolehlivosti).

Pomocí tohoto přístupu a konkrétních dat ke konstrukci 95% intervalu získáme následující výsledky (obr. 99
). Kritická hodnota parametr z cr je roven 1,96. Standardní chyba odhadu je 0,077. Dolní mez intervalu spolehlivosti je 0,475. Horní hranice intervalu spolehlivosti je 0,775. Manažer má tedy právo se s 95% jistotou domnívat, že procento zákazníků, kteří ohodnotí nový produkt 6 body nebo více, bude mezi 47,5 a 77,5.

Metoda 2

Tento problém lze vyřešit pomocí standardních nástrojů StatPro. K tomu stačí poznamenat, že podíl se v tomto případě shoduje s průměrnou hodnotou sloupce Typ. Dále aplikujeme StatPro/Statistická inference/Analýza jednoho vzorku k sestavení intervalu spolehlivosti průměru (odhad matematického očekávání) pro sloupec Typ. Výsledky získané v tomto případě budou velmi blízké výsledkům 1. metody (obr. 99).

Interval spolehlivosti pro směrodatnou odchylku

s se používá jako odhad směrodatné odchylky (vzorec je uveden v části 1). Funkce hustoty odhadu s je funkce chí-kvadrát, která má stejně jako t-rozdělení n-1 stupňů volnosti. Pro práci s touto distribucí existují speciální funkce CHIDIST a CHIINV.

Interval spolehlivosti v tomto případě již nebude symetrický. Konvenční hraniční diagram je znázorněn na Obr. 100 .

Příklad

Stroj musí vyrábět díly o průměru 10 cm, vlivem různých okolností však dochází k chybám. Kontrolor kvality se obává dvou okolností: za prvé, průměrná hodnota by měla být 10 cm; za druhé, i v tomto případě, pokud jsou odchylky velké, bude mnoho dílů odmítnuto. Každý den vyrobí vzorek 50 dílů (viz soubor KONTROLA KVALITY.XLS (šablona a řešení). Jaké závěry může takový vzorek přinést?

Řešení

Sestrojme 95% intervaly spolehlivosti pro průměr a standardní odchylku pomocí StatPro/Statistická inference/Analýza jednoho vzorku(Obr. 101
).

Dále za předpokladu normálního rozdělení průměrů vypočítáme podíl vadných výrobků s maximální odchylkou 0,065. Pomocí možností substituční tabulky (případ dvou parametrů) vyneseme závislost podílu vad na průměrné hodnotě a směrodatné odchylce (obr. 102
).

Interval spolehlivosti pro rozdíl mezi dvěma průměry

Toto je jedna z nejvíce důležité aplikace statistické metody. Příklady situací.

    Vedoucí obchodu s oděvy by rád věděl, kolik více či méně průměrná zákaznice utratí v obchodě než průměrný mužský zákazník.

    Obě letecké společnosti létají na podobných trasách. Spotřebitelská organizace by ráda porovnala rozdíl mezi průměrnými očekávanými dobami zpoždění letů pro obě letecké společnosti.

    Společnost rozesílá kupony na jednotlivé druhy zboží v jednom městě a nezasílá do jiného. Manažeři chtějí porovnat průměrné objemy nákupů těchto produktů během příštích dvou měsíců.

    Prodejce aut často řeší manželské páry na prezentacích. Abychom porozuměli jejich osobním reakcím na prezentaci, jsou páry často dotazovány odděleně. Manažer chce vyhodnotit rozdíl v hodnocení u mužů a žen.

Případ nezávislých vzorků

Rozdíl mezi prostředky bude mít t-rozdělení s n 1 + n 2 - 2 stupni volnosti. Interval spolehlivosti pro μ 1 - μ 2 je vyjádřen vztahem:

Tento problém lze vyřešit nejen pomocí výše uvedených vzorců, ale také pomocí standardních nástrojů StatPro. K tomu stačí použít

Interval spolehlivosti pro rozdíl mezi proporcemi

Nechť je matematické očekávání akcií. Nechť jsou jejich výběrové odhady, sestavené ze vzorků velikosti n 1 a n 2, v tomto pořadí. Pak je odhad rozdílu. Proto je interval spolehlivosti tohoto rozdílu vyjádřen jako:

Zde z cr je hodnota získaná z normálního rozdělení pomocí speciálních tabulek (například 1,96 pro 95% interval spolehlivosti).

Směrodatná chyba odhadu je v tomto případě vyjádřena vztahem:

.

Příklad

Obchod, který se připravuje na velký výprodej, podnikl následující kroky: marketingový výzkum. Bylo vybráno 300 nejlepší kupující, které byly zase náhodně rozděleny do dvou skupin po 150 členech. Všem vybraným kupujícím byly zaslány výzvy k účasti na prodeji, ale pouze členové první skupiny obdrželi kupón opravňující k 5% slevě. Při prodeji byly zaznamenány nákupy všech 300 vybraných kupujících. Jak může manažer interpretovat výsledky a učinit úsudek o účinnosti kuponů? (viz soubor COUPONS.XLS (šablona a řešení)).

Řešení

Pro náš konkrétní případ ze 150 zákazníků, kteří obdrželi slevový kupón, 55 nakoupilo ve výprodeji a ze 150, kteří kupón neobdrželi, nakoupilo pouze 35 (obr. 103
). Potom jsou hodnoty podílů vzorků 0,3667 a 0,2333. A výběrový rozdíl mezi nimi je roven 0,1333, resp. Za předpokladu 95% intervalu spolehlivosti zjistíme z tabulky normálního rozdělení z cr = 1,96. Výpočet směrodatné chyby rozdílu vzorku je 0,0524. Nakonec zjistíme, že spodní hranice 95% intervalu spolehlivosti je 0,0307, ​​a horní limit 0,2359 resp. Získané výsledky lze interpretovat tak, že na každých 100 zákazníků, kteří obdrželi slevový kupón, můžeme očekávat 3 až 23 nových zákazníků. Musíme však mít na paměti, že tento závěr sám o sobě neznamená efektivitu využití kuponů (jelikož poskytnutím slevy přicházíme o zisk!). Pojďme si to ukázat na konkrétních datech. Pojďme to předstírat průměrná velikost nákup se rovná 400 rublům, z toho 50 rublům. pro obchod je zisk. Pak očekávaný zisk na 100 zákazníků, kteří neobdrželi kupon, je:

50 0,2333 100 = 1166,50 rub.

Podobné výpočty pro 100 zákazníků, kteří obdrželi kupón, dávají:

30 0,3667 100 = 1100,10 rub.

Snížení průměrného zisku na 30 je vysvětleno skutečností, že při použití slevy zákazníci, kteří obdrželi kupón, nakoupí v průměru za 380 rublů.

Konečný závěr tedy ukazuje na neúčinnost použití takových kuponů v této konkrétní situaci.

Komentář. Tento problém lze vyřešit pomocí standardních nástrojů StatPro. K tomu stačí snížit tento úkol k problému odhadu rozdílu mezi dvěma průměry pomocí této metody a poté aplikovat StatPro/Statistická inference/Dvouvzorková analýza sestrojit interval spolehlivosti pro rozdíl mezi dvěma průměrnými hodnotami.

Řízení délky intervalu spolehlivosti

Délka intervalu spolehlivosti závisí na následující podmínky :

    data přímo (směrodatná odchylka);

    úroveň významnosti;

    velikost vzorku.

Velikost vzorku pro odhad střední hodnoty

Nejprve se podívejme na problém v obecném případě. Hodnotu poloviny délky nám daného intervalu spolehlivosti označme B (obr. 104
). Víme, že interval spolehlivosti pro střední hodnotu nějaké náhodné veličiny X je vyjádřen jako , Kde . věřit:

a vyjádřením n dostaneme .

Bohužel, přesná hodnota Neznáme rozptyl náhodné veličiny X. Navíc neznáme hodnotu tcr, protože závisí na n prostřednictvím počtu stupňů volnosti. V této situaci můžeme udělat následující. Místo rozptylu s používáme nějaký odhad rozptylu založený na jakýchkoli dostupných implementacích zkoumané náhodné proměnné. Místo hodnoty t cr použijeme pro normální rozdělení hodnotu z cr. To je docela přijatelné, protože funkce hustoty distribuce pro normální a t-rozdělení jsou velmi blízké (kromě případu malého n). Požadovaný vzorec má tedy tvar:

.

Protože vzorec dává, obecně řečeno, neceločíselné výsledky, za požadovanou velikost vzorku se považuje zaokrouhlení s přebytkem výsledku.

Příklad

Rychlé občerstvení plánuje rozšířit sortiment o nový typ chlebíčku. Za účelem posouzení poptávky po něm plánuje manažer náhodně vybrat určitý počet návštěvníků z těch, kteří jej již vyzkoušeli, a požádat je, aby ohodnotili svůj postoj k novému produktu na stupnici od 1 do 10. Manažer chce odhadnout očekávaný počet bodů, které nový produkt získá, a sestrojte pro tento odhad 95% interval spolehlivosti. Zároveň chce, aby poloviční šířka intervalu spolehlivosti nepřesáhla 0,3. Kolik návštěvníků potřebuje k rozhovoru?

jak následuje:

Tady r ots je odhad podílu p a B je daná polovina délky intervalu spolehlivosti. Nadhodnocení pro n lze získat pomocí hodnoty r ots= 0,5. V tomto případě délka intervalu spolehlivosti nepřekročí specifikovanou hodnotu B pro žádnou skutečnou hodnotu p.

Příklad

Nechte manažera z předchozího příkladu naplánovat odhad podílu zákazníků, kteří preferovali nový typ produktu. Chce sestrojit 90% interval spolehlivosti, jehož poloviční délka nepřesahuje 0,05. Kolik klientů by mělo být zahrnuto do náhodného vzorku?

Řešení

V našem případě je hodnota z cr = 1,645. Proto se požadované množství vypočítá jako .

Pokud by měl manažer důvod se domnívat, že požadovaná p-hodnota je například přibližně 0,3, pak dosazením této hodnoty do výše uvedeného vzorce bychom dostali menší hodnotu náhodného vzorku, konkrétně 228.

Vzorec pro určení náhodná velikost vzorku v případě rozdílu mezi dvěma průměry napsáno jako:

.

Příklad

Některé počítačové společnosti mají středisko služeb zákazníkům. V Nedávno zvýšil se počet stížností zákazníků na špatnou kvalitu služeb. V servisní středisko Existují především dva typy zaměstnanců: ti, kteří nemají mnoho zkušeností, ale absolvovali speciální přípravné kurzy, a ti, kteří mají bohaté praktické zkušenosti, ale neabsolvovali speciální kurzy. Společnost chce analyzovat stížnosti zákazníků za posledních šest měsíců a porovnávat průměrný počet stížností pro každou ze dvou skupin zaměstnanců. Předpokládá se, že počty ve vzorcích pro obě skupiny budou stejné. Kolik zaměstnanců musí být zahrnuto do vzorku, aby se získal 95% interval s poloviční délkou ne větší než 2?

Řešení

Zde σ ots je odhad směrodatné odchylky obou náhodných veličin za předpokladu, že jsou blízko. V našem problému tedy musíme tento odhad nějak získat. To lze provést například následovně. Když se manažer podíval na údaje o stížnostech zákazníků za posledních šest měsíců, může si všimnout, že každý zaměstnanec obecně obdrží 6 až 36 stížností. S vědomím, že pro normální rozdělení nejsou téměř všechny hodnoty více než třikrát vzdáleny od průměru směrodatné odchylky může se důvodně domnívat, že:

, odkud σ ots = 5.

Dosazením této hodnoty do vzorce dostaneme .

Vzorec pro určení náhodná velikost vzorku v případě odhadu rozdílu mezi podíly má tvar:

Příklad

Některá společnost má dvě továrny vyrábějící podobné produkty. Manažer společnosti chce porovnat procento vadných výrobků v obou továrnách. Podle dostupných informací se závadovost v obou továrnách pohybuje od 3 do 5 %. Je určen k vytvoření 99% intervalu spolehlivosti s poloviční délkou ne větší než 0,005 (nebo 0,5 %). Kolik produktů musí být vybráno z každé továrny?

Řešení

Zde p 1ots a p 2ots jsou odhady dvou neznámých podílů vad v 1. a 2. továrně. Pokud dáme p 1ots = p 2ots = 0,5, dostaneme nadhodnocenou hodnotu pro n. Ale protože v našem případě máme nějaké apriorní informace o těchto akciích, vezmeme horní odhad těchto akcií, konkrétně 0,05. Dostaneme

Při odhadu některých parametrů populace z výběrových dat je užitečné uvést nejen bodový odhad parametr, ale také indikují interval spolehlivosti, který ukazuje, kde může ležet přesná hodnota odhadovaného parametru.

V této kapitole jsme se také seznámili s kvantitativními vztahy, které nám umožňují sestrojit takové intervaly pro různé parametry; naučené způsoby, jak řídit délku intervalu spolehlivosti.

Všimněte si také, že problém odhadu velikostí vzorků (problém plánování experimentu) lze vyřešit pomocí standardních nástrojů StatPro, jmenovitě StatPro/Statistická inference/Výběr velikosti vzorku.

"Katren-Style" pokračuje ve vydávání cyklu Konstantina Kravchika o lékařské statistiky. Ve dvou předchozích článcích se autor zabýval vysvětlením pojmů jako a.

Konstantin Kravchik

Matematik-analytik. Specialista v oboru statistický výzkum v medicíně a humanitních oborech

Moskva město

Velmi často v článcích na klinický výzkum můžete narazit na záhadnou frázi: „interval spolehlivosti“ (95 % CI nebo 95 % CI - interval spolehlivosti). V článku může být například napsáno: „K posouzení významnosti rozdílů jsme použili Studentův t-test s výpočtem 95 % intervalu spolehlivosti.“

Jaká je hodnota „95 % intervalu spolehlivosti“ a proč jej počítat?

Co je interval spolehlivosti? - Toto je rozsah, ve kterém leží skutečné populační prostředky. Existují „nepravdivé“ průměry? V jistém smyslu ano, dělají. Vysvětlili jsme, že je nemožné měřit parametr zájmu v celé populaci, takže výzkumníci se spokojili s omezeným vzorkem. V tomto vzorku (např. na základě tělesné hmotnosti) je jedna průměrná hodnota (určitá váha), podle které posuzujeme průměrnou hodnotu v celé populaci. Je však nepravděpodobné, že by se průměrná hmotnost ve vzorku (zejména malém) shodovala s průměrnou hmotností v obecné populaci. Proto je správnější vypočítat a použít rozsah průměrných hodnot populace.

Představte si například, že 95% interval spolehlivosti (95% CI) pro hemoglobin je 110 až 122 g/l. To znamená, že existuje 95% šance, že skutečná střední hodnota hemoglobinu v populaci bude mezi 110 a 122 g/l. Jinými slovy, nevíme průměrný hemoglobinu v běžné populaci, ale pro tuto charakteristiku můžeme s 95 % pravděpodobností uvést rozsah hodnot.

Intervaly spolehlivosti jsou zvláště důležité pro rozdíly v průměrech mezi skupinami nebo velikosti účinku, jak se jim říká.

Řekněme, že jsme porovnali účinnost dvou přípravků na železo: jednoho, který je na trhu již dlouho, a jednoho, který byl právě registrován. Po ukončení terapie jsme hodnotili koncentraci hemoglobinu u studovaných skupin pacientů a statistický program vypočítal, že rozdíl mezi průměrnými hodnotami obou skupin byl s 95 % pravděpodobností v rozmezí 1,72 až 14,36 g/l (tabulka 1).

Stůl 1. Test na nezávislé vzorky
(skupiny jsou porovnány podle hladiny hemoglobinu)

To by mělo být interpretováno následovně: u některých pacientů v běžné populaci, kteří užívají nový lék, bude hemoglobin vyšší v průměru o 1,72–14,36 g/l než u těch, kteří užili již známý lék.

Jinými slovy, v obecné populaci je rozdíl v průměrných hodnotách hemoglobinu mezi skupinami v těchto mezích s pravděpodobností 95 %. Bude na výzkumníkovi, aby posoudil, zda je to hodně nebo málo. Smyslem toho všeho je, že nepracujeme s jednou průměrnou hodnotou, ale s rozsahem hodnot, proto spolehlivěji odhadneme rozdíl v parametru mezi skupinami.

Ve statistických balíčcích můžete podle uvážení výzkumníka nezávisle zúžit nebo rozšířit hranice intervalu spolehlivosti. Snížením pravděpodobností intervalu spolehlivosti zúžíme rozsah průměrů. Například při 90 % CI bude rozsah průměrů (nebo rozdíl v průměrech) užší než při 95 %.

Naopak zvýšení pravděpodobnosti na 99 % rozšiřuje rozsah hodnot. Při porovnávání skupin může spodní hranice CI překročit nulovou značku. Pokud bychom například rozšířili hranice intervalu spolehlivosti na 99  %, pak se hranice intervalu pohybovaly od –1 do 16 g/l. To znamená, že v obecné populaci existují skupiny, mezi kterými je rozdíl v průměrech pro studovanou charakteristiku roven 0 (M = 0).

Pomocí intervalu spolehlivosti můžete zkontrolovat statistické hypotézy. Pokud interval spolehlivosti překročí nulovou hodnotu, pak platí nulová hypotéza, která předpokládá, že se skupiny neliší ve studovaném parametru. Výše je popsán příklad, kde jsme rozšířili hranice na 99 %. Někde v běžné populaci jsme našli skupiny, které se nijak nelišily.

95% interval spolehlivosti rozdílu hemoglobinu, (g/l)


Obrázek ukazuje 95% interval spolehlivosti pro rozdíl v průměrných hodnotách hemoglobinu mezi těmito dvěma skupinami. Přímka prochází nulovou značkou, proto existuje rozdíl mezi průměry nuly, což potvrzuje nulovou hypotézu, že se skupiny neliší. Rozdíl mezi skupinami je od –2 do 5 g/l. To znamená, že hemoglobin se může snížit o 2 g/l nebo zvýšit o 5 g/l.

Interval spolehlivosti je velmi důležitý ukazatel. Díky němu můžete vidět, zda rozdíly ve skupinách byly skutečně způsobeny rozdílem v průměrech nebo velkým vzorkem, protože u velkého vzorku je šance na nalezení rozdílů větší než u malého.

V praxi by to mohlo vypadat takto. Odebrali jsme vzorek 1000 lidí, změřili hladiny hemoglobinu a zjistili jsme, že interval spolehlivosti pro rozdíl v průměrech se pohyboval od 1,2 do 1,5 g/l. Hladina statistické významnosti v tomto případě p

Vidíme, že koncentrace hemoglobinu se zvýšila, ale téměř neznatelně, proto statistická významnost se objevil právě kvůli velikosti vzorku.

Intervaly spolehlivosti lze vypočítat nejen pro průměry, ale také pro podíly (a rizikové poměry). Zajímá nás například interval spolehlivosti podílů pacientů, kteří dosáhli remise při užívání vyvinutého léku. Předpokládejme, že 95 % CI pro podíly, tj. pro podíl takových pacientů, leží v rozmezí 0,60–0,80. Můžeme tedy říci, že naše medicína má terapeutický účinek od 60 do 80 % případů.

Předpokládejme, že máme velké množství položek s normálním rozložením některých vlastností (například plný sklad zeleniny stejného druhu, jejíž velikost a hmotnost se liší). Chcete znát průměrné vlastnosti celé šarže zboží, ale nemáte čas ani chuť každou zeleninu měřit a vážit. Chápete, že to není nutné. Ale kolik kusů by bylo potřeba vzít na namátkovou kontrolu?

Než uvedeme několik vzorců užitečných pro tuto situaci, připomeňme si nějaký zápis.

Za prvé, pokud bychom změřili celý sklad zeleniny (tato množina prvků se nazývá běžná populace), pak bychom se vší přesností, kterou máme k dispozici, znali průměrnou hmotnost celé dávky. Říkejme tomu průměr X prům .g en . - obecný průměr. Již víme, co je zcela určeno, pokud je známa jeho střední hodnota a odchylka s . Pravda, nejsme ani X průměrný gen. ani s Neznáme běžnou populaci. Můžeme odebrat pouze určitý vzorek, změřit hodnoty, které potřebujeme, a vypočítat pro tento vzorek jak průměrnou hodnotu X avg., tak i směrodatnou odchylku S select.

Je známo, že pokud naše výběrová kontrola obsahuje velký počet prvků (obvykle n je větší než 30), a jsou brány opravdu náhodné, pak s obecná populace se od výběru S sotva bude lišit.

Navíc pro případ normálního rozdělení můžeme použít následující vzorce:

S pravděpodobností 95%


S pravděpodobností 99%



V obecný pohled s pravděpodobností P (t)


Vztah mezi hodnotou t a hodnotou pravděpodobnosti P (t), se kterou chceme znát interval spolehlivosti, lze převzít z následující tabulky:


Zjistili jsme tedy, v jakém rozmezí leží průměrná hodnota pro populaci (s danou pravděpodobností).

Pokud nemáme dostatečně velký vzorek, nemůžeme to říci populace má s = S vyberte V tomto případě je navíc problematická blízkost vzorku k normálnímu rozdělení. V tomto případě místo toho také použijeme S select s ve vzorci:




ale hodnota t pro pevnou pravděpodobnost P(t) bude záviset na počtu prvků ve vzorku n. Čím větší n, tím blíže bude výsledný interval spolehlivosti hodnotě dané vzorcem (1). Hodnoty t jsou v tomto případě převzaty z jiné tabulky (Studentův t-test), kterou uvádíme níže:

Hodnoty Studentova t-testu pro pravděpodobnost 0,95 a 0,99


Příklad 3 Ze zaměstnanců společnosti bylo náhodně vybráno 30 lidí. Podle vzorku se ukázalo, že průměrná mzda (za měsíc) je 30 tisíc rublů se směrodatnou odchylkou 5 tisíc rublů. Určete průměrnou mzdu ve firmě s pravděpodobností 0,99.

Řešení: Podle podmínky máme n = 30, X prům. = 30 000, S = 5 000, P = 0,99. Pro zjištění intervalu spolehlivosti použijeme vzorec odpovídající Studentovu t testu. Z tabulky pro n = 30 a P = 0,99 zjistíme t = 2,756, tedy


těch. vyhledávaným správcem interval 27484< Х ср.ген < 32516.

S pravděpodobností 0,99 tedy můžeme říci, že interval (27484; 32516) v sobě obsahuje průměrnou mzdu ve firmě.

Doufáme, že tuto metodu využijete a není nutné, abyste měli stůl pokaždé s sebou. Výpočty lze provádět automaticky v Excelu. V souboru Excel klikněte na tlačítko fx v horní nabídce. Poté vyberte mezi funkcemi typ „statistický“ az navrhovaného seznamu v okně – STUDAR DISCOVER. Poté na výzvu umístěním kurzoru do pole „pravděpodobnost“ zadejte hodnotu inverzní pravděpodobnosti (tj. v našem případě místo pravděpodobnosti 0,95 musíte zadat pravděpodobnost 0,05). Podle všeho tabulkový procesor je sestaven tak, že výsledek odpovídá na otázku, s jakou pravděpodobností můžeme udělat chybu. Podobně do pole Stupeň volnosti zadejte hodnotu (n-1) pro váš vzorek.



Novinka na webu

>

Nejoblíbenější