Domov Protetika a implantace Jednosměrná analýza rozptylu. Faktorová a rozptylová analýza v Excelu s automatickými výpočty

Jednosměrná analýza rozptylu. Faktorová a rozptylová analýza v Excelu s automatickými výpočty

Cvičení . Studenti 1. ročníku byli dotazováni, aby identifikovali aktivity, kterým se věnují volný čas. Zkontrolujte, zda se liší rozložení verbálních a neverbálních preferencí žáků.

Řešení provedené pomocí kalkulačky.
Zjištění skupinových průměrů:

NP 1P 2
1 12 17
2 18 19
3 23 25
4 10 7
5 15 17
x prům 15.6 17

Označme p - počet úrovní faktoru (p=2). Počet dimenzí na každé úrovni je stejný a roven q=5.
Poslední řádek obsahuje skupinové průměry pro každou úroveň faktoru.
Celkový průměr lze získat jako aritmetický průměr skupinových průměrů:
(1)
Rozpětí skupinových průměrů procenta selhání vzhledem k celkovému průměru je ovlivněno jak změnami v úrovni posuzovaného faktoru, tak náhodnými faktory.
Aby byl zohledněn vliv tohoto faktoru, je celkový výběrový rozptyl rozdělen na dvě části, z nichž první se nazývá faktor S 2 f a druhá se nazývá reziduální S 2 zbytek.
Abychom tyto složky zohlednili, nejprve provedeme výpočet Celková částka Možnost druhé mocniny odchylek od obecného průměru:

a faktor součet kvadrátů odchylek skupinových průměrů od celkového průměru, který charakterizuje vliv tohoto faktoru:

Poslední výraz se získá nahrazením každé možnosti ve výrazu R celkovým průměrem skupiny pro daný faktor.
Zbytkový součet čtverců odchylek se získá jako rozdíl:
R zbytek = R celkem - R f
K určení celkového rozptylu vzorku je nutné vydělit R total počtem měření pq:

a pro získání nezaujatého celkového výběrového rozptylu je třeba tento výraz vynásobit pq/(pq-1):

V souladu s tím pro nezaujatý faktorový výběrový rozptyl:

kde p-1 je počet stupňů volnosti nezaujatého výběrového faktoru rozptylu.
Aby bylo možné posoudit vliv faktoru na změny uvažovaného parametru, vypočítá se hodnota:

Protože poměr dvou výběrových rozptylů S 2 f a S 2 rest je rozdělen podle Fisher-Snedecorova zákona, je výsledná hodnota f obs porovnána s hodnotou distribuční funkce.

v kritickém bodě f cr odpovídající zvolené hladině významnosti a.
Pokud f obs >f cr, pak má faktor významný vliv a měl by být zohledněn, jinak má nevýznamný vliv, který lze zanedbat.
K výpočtu Rob a Rf lze také použít následující vzorce:
(4)
(5)
Obecný průměr zjistíme pomocí vzorce (1):
Pro výpočet Rtot pomocí vzorce (4) sestavíme tabulku 2 čtverců: možnost:
NP 2 1P 2 2
1 144 289
2 324 361
3 529 625
4 100 49
5 225 289
1322 1613

Celkový průměr se vypočítá pomocí vzorce (1):

Rtot = 1322 + 1613 - 5 2 16,3 2 = 278,1
Najdeme R f pomocí vzorce (5):
Rf = 5 (15,6 2 + 17 2) - 2 16,3 2 = 4,9
Dostaneme R zbytek: R zbytek = R celkem - R f = 278,1 - 4,9 = 273,2
Určujeme faktor a zbytkové rozptyly:


Pokud jsou průměrné hodnoty náhodná proměnná, vypočítané z jednotlivých vzorků jsou stejné, pak jsou odhady faktoru a zbytkové rozptyly nezkreslené odhady obecný rozptyl a nevýznamně se liší.
Porovnání odhadů těchto rozptylů pomocí Fisherova kritéria by pak mělo ukázat, že není důvod zamítat nulovou hypotézu o rovnosti faktoru a zbytkových rozptylů.
Odhad faktorové disperze je menší než odhad zbytkové disperze, takže můžeme okamžitě potvrdit platnost nulové hypotézy o rovnosti matematických očekávání napříč vrstvami vzorku.
Jinými slovy, v tomto příkladu faktor Ф nemá významný vliv na náhodnou veličinu.
Pojďme zkontrolovat nulovou hypotézu H 0: rovnost středních hodnot x.
Najít f obs.

Pro hladinu významnosti α=0,05, stupně volnosti čísla 1 a 8, zjistíme fcr z Fisher-Snedecorovy distribuční tabulky.
fcr (0,05; 1; 8) = 5,32
Vzhledem k tomu, že f pozorováno< f кр, нулевую гипотезу о существенном влиянии фактора на результаты экспериментов отклоняем.
Jinými slovy, liší se rozložení verbálních a neverbálních preferencí žáků.

Cvičení. Závod má čtyři linky na výrobu obkladových dlaždic. Z každé řady bylo během směny náhodně vybráno 10 dlaždic a byla změřena jejich tloušťka (mm). Odchylky od jmenovité velikosti jsou uvedeny v tabulce. Na hladině významnosti a = 0,05 je třeba stanovit, že existuje závislost výroby vysoce kvalitních dlaždic na výrobní lince (faktor A).

Cvičení. Na hladině významnosti a = 0,05 zjistěte vliv barvy nátěru na životnost nátěru.

Příklad č. 1. Bylo provedeno 13 testů, z toho 4 na úrovni prvního faktoru, 4 na úrovni druhého, 3 na úrovni třetího a 2 na úrovni čtvrtého faktoru. Pomocí metody analýzy rozptylu na hladině významnosti 0,05 otestujte nulovou hypotézu o rovnosti skupinových průměrů. Předpokládá se, že vzorky byly odebrány z normálních populací se stejnými rozptyly. Výsledky testu jsou uvedeny v tabulce.

Řešení:
Zjištění skupinových průměrů:

NP 1P 2P 3P 4
1 1.38 1.41 1.32 1.31
2 1.38 1.42 1.33 1.33
3 1.42 1.44 1.34 -
4 1.42 1.45 - -
5.6 5.72 3.99 2.64
x prům 1.4 1.43 1.33 1.32

Označme p - počet úrovní faktoru (p=4). Počet dimenzí na každé úrovni je: 4,4,3,2
Poslední řádek obsahuje skupinové průměry pro každou úroveň faktoru.
Celkový průměr se vypočítá podle vzorce:

Pro výpočet součtu pomocí vzorce (4) sestavíme tabulku 2 čtverců: možnost:

NP 2 1P 2 2P 2 3P 2 4
1 1.9 1.99 1.74 1.72
2 1.9 2.02 1.77 1.77
3 2.02 2.07 1.8 -
4 2.02 2.1 - -
7.84 8.18 5.31 3.49

Celkový součet čtverců odchylek se zjistí pomocí vzorce:


Najdeme S f pomocí vzorce:


Dostaneme S zbytek: S zbytek = S celkem - S f = 0,0293 - 0,0263 = 0,003
Stanovíme rozptyl faktorů:

a zbytkový rozptyl:

Pokud jsou průměrné hodnoty náhodné veličiny vypočítané pro jednotlivé vzorky stejné, pak jsou odhady faktoru a zbytkové rozptyly nezkreslené odhady obecné odchylky a významně se neliší.
Porovnání odhadů těchto rozptylů pomocí Fisherova kritéria by pak mělo ukázat, že není důvod zamítat nulovou hypotézu o rovnosti faktoru a zbytkových rozptylů.
Odhad faktorové disperze je větší než odhad zbytkové disperze, takže můžeme okamžitě tvrdit, že nulová hypotéza o rovnosti matematických očekávání napříč vrstvami vzorku není pravdivá.
Jinými slovy, v tomto příkladu má faktor Ф významný vliv na náhodnou veličinu.
Pojďme zkontrolovat nulovou hypotézu H 0: rovnost středních hodnot x.
Najít f obs.

Pro hladinu významnosti α=0,05, stupně volnosti čísla 3 a 12 zjistíme fcr z Fisher-Snedecorovy distribuční tabulky.
fcr (0,05; 3; 12) = 3,49
Vzhledem k tomu, že f pozorováno > f cr, přijímáme nulovou hypotézu o významném vlivu faktoru na výsledky experimentů (zamítáme nulovou hypotézu o rovnosti skupinových průměrů). Jinými slovy, skupinové prostředky jako celek se výrazně liší.

Příklad č. 2. Škola má 5 šestých tříd. Psycholog má za úkol zjistit, zda je průměrná míra situační úzkosti ve třídách stejná. Pro tento účel byly uvedeny v tabulce. Zkontrolujte hladinu významnosti α=0,05, předpoklad, že se průměrná situační úzkost ve třídách neliší.

Příklad č. 3. Ke studiu hodnoty X byly provedeny 4 testy na každé z pěti úrovní faktoru F. Výsledky testu jsou uvedeny v tabulce. Zjistěte, zda je významný vliv faktoru F na hodnotu X. Vezměte α = 0,05. Předpokládá se, že vzorky byly odebrány z normálních populací se stejnými rozptyly.

Příklad č. 4. Předpokládejme, že se pedagogického experimentu zúčastnily tři skupiny po 10 studentech. Aplikováno ve skupinách různé metodyškolení: v první - tradiční (F 1), ve druhé - založené na počítačové technologii (F 2), ve třetí - metoda, která široce využívá úkoly pro samostatná práce(F 3). Znalosti byly hodnoceny pomocí desetibodového systému.
Je třeba zpracovat získaná data ze zkoušky a učinit závěr o tom, zda je vliv vyučovací metody významný, přičemž jako hladinu významnosti α = 0,05.
Výsledky zkoušky jsou uvedeny v tabulce, F j je úroveň faktoru x ij - hodnocení i-tého studenta metodou F j.

Úroveň faktoru

Příklad č. 5. Jsou uvedeny výsledky soutěžního odrůdového testování plodin (výnos v centimetrech na hektar). Každá odrůda byla testována na čtyřech plochách. Pomocí analýzy rozptylu studujte vliv odrůdy na výnos. Stanovte významnost vlivu faktoru (podíl meziskupinové variace na celkové variaci) a významnost experimentálních výsledků na hladině významnosti 0,05.
Produktivita na plochách testování odrůd

Odrůda c. Produktivita podle replikací. od ha
1 2 3 4
1
2
3
42,4
52,5
52,3
37,4
50,1
53,0
40,7
53,8
51,4
38,2
50,7
53,6

Použití statistik v této poznámce bude ilustrováno průřezovým příkladem. Řekněme, že jste vedoucí výroby ve společnosti Perfect Parachute. Padáky jsou vyrobeny ze syntetických vláken dodávaných čtyřmi různými dodavateli. Jednou z hlavních vlastností padáku je jeho pevnost. Musíte zajistit, aby všechna dodávaná vlákna měla stejnou sílu. K zodpovězení této otázky by měl být navržen experimentální návrh pro měření síly padáků tkaných ze syntetických vláken. různých dodavatelů. Informace získané z tohoto experimentu určí, který dodavatel poskytuje nejodolnější padáky.

Mnoho aplikací zahrnuje experimenty, které berou v úvahu více skupin nebo úrovní jednoho faktoru. Některé faktory, jako je teplota vypalování keramiky, mohou mít více číselných úrovní (tj. 300°, 350°, 400° a 450°). Jiné faktory, jako je umístění položek v supermarketu, mohou mít kategorické úrovně (např. první dodavatel, druhý dodavatel, třetí dodavatel, čtvrtý dodavatel). Jednofaktorové experimenty, ve kterých jsou experimentální jednotky náhodně přiřazeny do skupin nebo úrovní faktorů, se nazývají zcela randomizované.

PoužíváníF-kritéria pro posouzení rozdílů mezi několika matematickými očekáváními

Pokud jsou numerická měření faktoru ve skupinách spojitá a některá dodatečné podmínky, slouží k porovnání matematických očekávání několika skupin analýza rozptylu(ANOVA - An analýza Ó F Va riance). Analýza rozptylu pomocí zcela randomizovaných návrhů se nazývá jednocestná procedura ANOVA. V některých ohledech je termín analýza rozptylu nesprávné, protože porovnává rozdíly mezi očekávanými hodnotami skupin spíše než mezi rozptyly. Srovnání matematických očekávání se však provádí právě na základě analýzy odchylek dat. V postupu ANOVA je celková odchylka ve výsledcích měření rozdělena na meziskupiny a v rámci skupin (obr. 1). Variace uvnitř skupiny se vysvětluje experimentální chybou a variace mezi skupinami se vysvětluje účinky experimentálních podmínek. Symbol S označuje počet skupin.

Rýže. 1. Variace rozdělení ve zcela náhodném experimentu

Stáhněte si poznámku ve formátu nebo formátu, příklady ve formátu

Pojďme to předstírat S skupiny jsou extrahovány z nezávislých populací, které mají normální rozdělení a stejný rozptyl. Nulová hypotéza je taková matematická očekávání populace jsou stejné: H 0: μ 1 = μ 2 = ... = μ s. Alternativní hypotéza tvrdí, že ne všechna matematická očekávání jsou stejná: H 1: ne všechna μ j jsou stejná j= 1, 2, …, s).

Na Obr. Obrázek 2 představuje skutečnou nulovou hypotézu o matematických očekáváních pěti porovnávaných skupin za předpokladu, že populace mají normální rozdělení a stejný rozptyl. Pět obecných populací spojených s na různých úrovních faktory jsou totožné. V důsledku toho jsou na sebe navrstveny, mají stejné matematické očekávání, variace a tvar.

Rýže. 2. Pět obecných populací má stejná matematická očekávání: μ 1 = μ 2 = μ 3 = μ 4 = μ 5

Na druhou stranu předpokládejme, že ve skutečnosti je nulová hypotéza nepravdivá, přičemž čtvrtá úroveň má nejvyšší očekávanou hodnotu, první úroveň má mírně nižší očekávanou hodnotu a zbývající úrovně mají stejné a dokonce nižší očekávané hodnoty ( Obrázek 3). Všimněte si, že s výjimkou očekávaných hodnot je všech pět populací identických (to znamená, že mají stejnou variabilitu a tvar).

Rýže. 3. Pozoruje se účinek experimentálních podmínek: μ 4 > μ 1 > μ 2 = μ 3 = μ 5

Při testování hypotézy o rovnosti matematických očekávání několika obecných populací se celková variace rozdělí na dvě části: meziskupinová variace v důsledku rozdílů mezi skupinami a vnitroskupinová variace v důsledku rozdílů mezi prvky patřícími do stejné skupiny. Celková variace je vyjádřena celkovým součtem čtverců (SST – sum of squares total). Vzhledem k tomu, nulová hypotéza je, že matematické očekávání všech S skupiny jsou si navzájem rovny, celková variace se rovná součtu čtverců rozdílů mezi jednotlivými pozorováními a celkovým průměrem (průměrem průměrů), vypočítaným pro všechny vzorky. Plná variace:

Kde - obecný průměr, X ij - i-e pozorování v j- skupina nebo úroveň, n j- počet pozorování v j skupina, n - celkový pozorování ve všech skupinách (tj. n = n 1 + n 2 + … + n c), S- počet studovaných skupin nebo úrovní.

Variace mezi skupinami, obvykle nazývaný součet čtverců mezi skupinami (SSA - součet čtverců mezi skupinami), se rovná součtu čtverců rozdílů mezi průměrem výběru každé skupiny j a celkový průměr , vynásobené objemem odpovídající skupiny n j:

Kde S- počet studovaných skupin nebo úrovní, n j- počet pozorování v j skupina, j- průměrná hodnota j skupina, - celkový průměr.

Variace v rámci skupiny, obvykle nazývaný součet čtverců uvnitř skupiny (SSW - součet čtverců uvnitř skupin), se rovná součtu čtverců rozdílů mezi prvky každé skupiny a výběrového průměru této skupiny j:

Kde Xij - i prvek j skupina, j- průměrná hodnota j skupina.

Protože se porovnávají Súrovní faktoru, meziskupinový součet čtverců má s – 1 stupně svobody. Každý z Súrovně má n j – 1 stupně volnosti, takže vnitroskupinový součet čtverců má n- S stupně volnosti a

Navíc celkový součet čtverců má n – 1 stupně volnosti od každého pozorování Xij se porovnává s celkovým průměrem vypočteným ze všech n pozorování. Pokud se každý z těchto součtů vydělí odpovídajícím počtem stupňů volnosti, vzniknou tři typy disperze: meziskupina(střední čtverec mezi - MSA), vnitroskupinové(střední čtverec v rámci - MSW) a plný(průměrný čtverec celkem - MST):

Nehledě na to, že hlavním účelem analýzy rozptylu je porovnat matematická očekávání S skupiny k odhalení vlivu experimentálních podmínek, jeho název je dán tím, že hlavním nástrojem je analýza rozptylů odlišné typy. Pokud je nulová hypotéza pravdivá, a mezi matematickými očekáváními S skupiny nejsou žádné významné rozdíly, všechny tři rozptyly - MSA, MSW a MST - jsou odhady rozptylu σ 2 součástí analyzovaných dat. Tedy otestovat nulovou hypotézu H 0: μ 1 = μ 2 = ... = μ s a alternativní hypotéza H 1: ne všechna μ j jsou stejná j = 1, 2, …, S), je nutné vypočítat statistiky F-kritérium, což je poměr dvou rozptylů, MSA a MSW. Test F-statistika v jednosměrné analýze rozptylu

Statistika F- podle kritérií F- distribuce s s – 1 stupně volnosti v čitateli M.S.A. A n – s stupně volnosti ve jmenovateli M.S.W.. Pro danou hladinu významnosti α je nulová hypotéza zamítnuta, pokud je vypočtena F FU, inherentní F- distribuce s s – 1 n – s stupně volnosti ve jmenovateli. Jak je tedy znázorněno na Obr. 4, rozhodující pravidlo formulováno takto: nulová hypotéza H 0 odmítnut, pokud F>FU; jinak se neodmítá.

Rýže. 4. Kritická oblast analýzy rozptylu při testování hypotézy H 0

Pokud je nulová hypotéza H 0 je pravda, vypočítaná F-statistika se blíží 1, protože její čitatel a jmenovatel jsou odhady stejné veličiny - rozptylu σ 2 vlastní analyzovaným datům. Pokud je nulová hypotéza H 0 je nepravdivá (a existuje významný rozdíl mezi matematickými očekáváními různých skupin), vypočítaná F-statistika bude mnohem větší než jedna, protože její čitatel, MSA, kromě přirozené variability dat odhaduje vliv experimentálních podmínek nebo rozdílů mezi skupinami, zatímco jmenovatel MSW odhaduje pouze přirozenou variabilitu dat. Postup ANOVA tedy je F-kritérium, ve kterém je na dané hladině významnosti α zamítnuta nulová hypotéza, pokud je vypočtena F-statistiky jsou vyšší než horní kritická hodnota FU, inherentní F- distribuce s s – 1 stupně volnosti v čitateli a n – s stupně volnosti ve jmenovateli, jak je znázorněno na Obr. 4.

Pro ilustraci jednosměrné analýzy rozptylu se vraťme ke scénáři nastíněném na začátku poznámky. Účelem experimentu je zjistit, zda padáky utkané ze syntetických vláken získaných od různých dodavatelů mají stejnou pevnost. Každá skupina má pět padáků. Skupiny jsou rozděleny podle dodavatelům - Dodavatel 1, Dodavatel 2, Dodavatel 3 a Dodavatel 4. Síla padáků se měří pomocí speciálního zařízení, které testuje látku na roztržení na obou stranách. Síla potřebná k rozbití padáku se měří na speciální stupnici. Čím vyšší je brzdná síla, tím silnější je padák. Excel umožňuje analyzovat F-statistiky jedním kliknutím. Projděte si nabídku DataAnalýza dat a vyberte řádek Jednosměrná ANOVA, vyplňte okno, které se otevře (obr. 5). Experimentální výsledky (mez pevnosti), některé popisné statistiky a výsledky jednosměrné analýzy rozptylu jsou uvedeny na Obr. 6.

Rýže. 5. Okno Jednocestná analýza balíčku pro analýzu rozptylu Vynikat

Rýže. 6. Ukazatele pevnosti padáků utkaných ze syntetických vláken získaných od různých dodavatelů, popisné statistiky a výsledky jednosměrné analýzy rozptylu

Analýza na obrázku 6 ukazuje, že existuje určitý rozdíl mezi průměrem vzorku. Průměrná pevnost vláken získaných od prvního dodavatele je 19,52, od druhého - 24,26, od třetího - 22,84 a od čtvrtého - 21,16. Je tento rozdíl statisticky významný? Rozložení lomové síly je znázorněno na bodovém grafu (obr. 7). Jasně ukazuje rozdíly mezi skupinami i uvnitř nich. Pokud by každá skupina měla větší velikost, mohl by se k jejich analýze použít diagram stonku a listu, krabicový graf nebo zvonek.

Rýže. 7. Schéma rozptylu síly pro padáky tkané ze syntetických vláken získaných od čtyř dodavatelů.

Nulová hypotéza říká, že mezi průměrnými skóre pevnosti nejsou žádné významné rozdíly: H 0: μ 1 = μ 2 = μ 3 = μ 4. Alternativní hypotézou je, že existuje alespoň jeden dodavatel, jehož průměrná síla vlákna se liší od ostatních: H 1: ne všechna μ j jsou stejná ( j = 1, 2, …, S).

Celkový průměr (viz obr. 6) = PRŮMĚR(D12:D15) = 21,945; pro určení můžete také zprůměrovat všech 20 původních čísel: = PRŮMĚR(A3:D7). Hodnoty rozptylu se vypočítají Balíček analýzy a odrážejí se v desce Analýza rozptylu(viz obr. 6): SSA = 63,286, SSW = 97,504, SST = 160,790 (viz sloupec SS tabulky Analýza rozptylu Obrázek 6). Průměry se vypočítají vydělením těchto součtů čtverců příslušným počtem stupňů volnosti. Protože S= 4, a n= 20, získáme následující hodnoty stupňů volnosti; pro SSA: s – 1= 3; pro SSW: n–c= 16; pro SST: n – 1= 19 (viz sloupec df). Tedy: MSA = SSA / ( s – 1)= 21,095; MSW = SSW / ( n–c) = 6,094; MST = SST / ( n – 1) = 8,463 (viz sloupec SLEČNA). F-statistika = MSA / MSW = 3,462 (viz sloupec F).

Horní kritická hodnota FU, charakteristický pro F-rozdělení, určené vzorcem =F.OBR(0,95;3;16) = 3,239. Parametry funkce =F.OBR(): α = 0,05, čitatel má tři stupně volnosti a jmenovatel 16. F-statistika rovna 3,462 překračuje horní kritickou hodnotu FU= 3,239, nulová hypotéza je zamítnuta (obr. 8).

Rýže. 8. Kritická oblast analýzy rozptylu na hladině významnosti 0,05, pokud má čitatel tři stupně volnosti a jmenovatel je -16

R-hodnota, tzn. pravděpodobnost, že pokud je nulová hypotéza pravdivá F-statistika ne menší než 3,46, rovná se 0,041 nebo 4,1 % (viz sloupec p-hodnota tabulky Analýza rozptylu Obrázek 6). Protože tato hodnota nepřesahuje hladinu významnosti α = 5 %, nulová hypotéza se zamítá. Navíc, R-hodnota udává, že pravděpodobnost odhalení takového nebo většího rozdílu mezi matematickými očekáváními obecné populace, za předpokladu, že jsou ve skutečnosti stejná, se rovná 4,1 %.

Tak. Mezi čtyřmi průměry vzorků je rozdíl. Nulová hypotéza byla, že všechna matematická očekávání čtyř populací jsou stejná. Za těchto podmínek se míra celkové variability (tj. celková odchylka SST) síly všech padáků vypočítá sečtením druhých mocnin rozdílů mezi každým pozorováním. X ij a celkový průměr . Celková variace byla poté rozdělena do dvou složek (viz obr. 1). První složkou byla variace mezi skupinami v SSA a druhou byla variace v rámci skupiny v SSW.

Co vysvětluje variabilitu dat? Jinými slovy, proč nejsou všechna pozorování stejná? Jedním z důvodů je, že různé společnosti dodávají vlákna různé síly. To částečně vysvětluje, proč mají skupiny různá matematická očekávání: čím silnější je účinek experimentálních podmínek, tím větší je rozdíl mezi matematickými očekáváními skupin. Dalším důvodem variability dat je přirozená variabilita jakéhokoli procesu, in v tomto případě- výroba padáků. I kdyby byla všechna vlákna zakoupena od stejného dodavatele, jejich síla by nebyla stejná, všechny ostatní věci by byly stejné. Protože k tomuto efektu dochází v rámci každé skupiny, nazývá se variace uvnitř skupiny.

Rozdíly mezi průměry vzorků se nazývají meziskupinová variace SSA. Část variace v rámci skupiny, jak již bylo naznačeno, je vysvětlena příslušností dat různé skupiny. Nicméně, i kdyby byly skupiny úplně stejné (tj. nulová hypotéza byla pravdivá), stále by existovaly variace mezi skupinami. Důvodem je přirozená variabilita výrobního procesu padáku. Protože vzorky jsou různé, jejich průměry vzorků se navzájem liší. Pokud je tedy nulová hypotéza pravdivá, variabilita mezi skupinami i v rámci skupiny představuje odhad variability populace. Pokud je nulová hypotéza nepravdivá, hypotéza mezi skupinami bude větší. Právě tato skutečnost je základem F-kritéria pro srovnání rozdílů mezi matematickými očekáváními několika skupin.

Po provedení jednosměrné analýzy ANOVA a zjištění významného rozdílu mezi firmami zůstává neznámé, který dodavatel se výrazně liší od ostatních. Víme pouze, že matematická očekávání obecné populace nejsou stejná. Jinými slovy, alespoň jedno z matematických očekávání se výrazně liší od ostatních. Chcete-li zjistit, který dodavatel se liší od ostatních, můžete použít Tukey postup pomocí párových srovnání mezi dodavateli. Tento postup vyvinul John Tukey. Následně společně s K. Kramerem tento postup nezávisle upravili pro situace, kdy se velikosti vzorků od sebe liší.

Vícenásobné srovnání: Postup Tukey-Kramer

V našem scénáři byla k porovnání síly padáků použita jednosměrná analýza rozptylu. Po zjištění významných rozdílů mezi matematickými očekáváními čtyř skupin je nutné určit, které skupiny se od sebe liší. Ačkoli existuje několik způsobů, jak tento problém vyřešit, popíšeme pouze postup vícenásobného porovnání Tukey-Kramer. Tato metoda je příkladem post hoc srovnávacích postupů, protože testovaná hypotéza je formulována po analýze dat. Postup Tukey-Kramer umožňuje současné porovnání všech párů skupin. V první fázi se vypočítávají rozdíly Xj -Xj, Kde j ≠j, mezi matematickými očekáváními s(s – 1)/2 skupiny. Kritický rozsah Postup Tukey-Kramer se vypočítá podle vzorce:

Kde Q U- horní kritická hodnota rozdělení studentizovaného rozsahu, která má S stupně volnosti v čitateli a n - S stupně volnosti ve jmenovateli.

Pokud velikosti vzorků nejsou stejné, kritické rozmezí se vypočítá pro každou dvojici matematických očekávání zvlášť. V poslední fázi každý z s(s – 1)/2 páry matematických očekávání jsou porovnány s odpovídajícím kritickým rozsahem. Prvky dvojice jsou považovány za výrazně odlišné, pokud je rozdílový modul | Xj -Xj| mezi nimi přesahuje kritický rozsah.

Aplikujme postup Tukey-Kramer na problém pevnosti padáků. Protože padáková společnost má čtyři dodavatele, je třeba zkontrolovat 4 (4 – 1)/2 = 6 párů dodavatelů (obrázek 9).

Rýže. 9. Párová srovnání průměrů vzorků

Protože všechny skupiny mají stejný objem (tj n j = n j), stačí vypočítat pouze jeden kritický rozsah. K tomu podle tabulky ANOVA(obr. 6) určíme hodnotu MSW = 6,094. Potom zjistíme hodnotu Q U při α = 0,05, S= 4 (počet stupňů volnosti v čitateli) a n- S= 20 – 4 = 16 (počet stupňů volnosti ve jmenovateli). Bohužel jsem v Excelu nenašel odpovídající funkci, tak jsem použil tabulku (obr. 10).

Rýže. 10. Kritická hodnota studovaného rozsahu Q U

Dostaneme:

Protože pouze 4,74 > 4,47 (viz spodní tabulka na obr. 9), existuje statisticky významný rozdíl mezi prvním a druhým dodavatelem. Všechny ostatní páry mají vzorové prostředky, které nám nedovolují mluvit o jejich rozdílech. V důsledku toho je průměrná pevnost padáků utkaných z vláken zakoupených od prvního dodavatele výrazně nižší než u druhého dodavatele.

Nezbytné podmínky pro jednosměrnou analýzu rozptylu

Při řešení problému pevnosti padáků jsme nekontrolovali, zda podmínky, za kterých je možné použít jednofaktorový F-kritérium. Jak víte, zda můžete použít jednofaktorový? F-kritérium při analýze konkrétních experimentálních dat? Jediný faktor F-kritérium lze uplatnit pouze při splnění tří základních předpokladů: experimentální data musí být náhodná a nezávislá, mít normální rozdělení a jejich rozptyly musí být stejné.

První odhad - náhodnost a nezávislost na datech- musí být provedeno vždy, protože správnost jakéhokoli experimentu závisí na náhodnosti výběru a/nebo procesu randomizace. Aby nedošlo ke zkreslení výsledků, je nutné, aby byla data extrahována S obecné populace náhodně a nezávisle na sobě. Podobně by měla být data rozložena náhodně Súrovně faktoru, který nás zajímá (experimentální skupiny). Porušení těchto podmínek může vážně zkreslit výsledky analýzy rozptylu.

Druhý pokus - normálnost- znamená, že data jsou extrahována z normálně distribuovaných populací. Pokud jde o t-kritéria, jednosměrná analýza rozptylu na základě F-kritéria je relativně málo citlivá na porušení této podmínky. Pokud se rozdělení příliš výrazně neodchyluje od normálu, hladina významnosti F-kritérium se mění jen málo, zvláště pokud je velikost vzorku dostatečně velká. Pokud je podmínka normality distribuce vážně porušena, měla by být uplatněna.

Třetí odhad - homogenita rozptylu- znamená, že rozptyly každé populace jsou si navzájem rovny (tj. σ 1 2 = σ 2 2 = ... = σ j 2). Tento předpoklad umožňuje rozhodnout, zda oddělit nebo sloučit odchylky v rámci skupiny. Pokud jsou velikosti skupin stejné, má podmínka homogenity rozptylu malý vliv na závěry získané pomocí F-kritéria. Pokud jsou však velikosti vzorků nestejné, porušení podmínky rovnosti rozptylů může vážně zkreslit výsledky analýzy rozptylu. Proto by mělo být vynaloženo úsilí k zajištění stejné velikosti vzorků. Jednou z metod kontroly předpokladu homogenity rozptylu je kritérium Levene popsané níže.

Pokud je ze všech tří podmínek porušena pouze podmínka homogenity rozptylu, postupuje se obdobně jako t-kritérium pomocí samostatného rozptylu (podrobněji viz). Pokud však předpoklady o normální distribuce a zároveň je narušena homogenita rozptylu, je nutné data normalizovat a rozdíly mezi rozptyly zmenšit nebo použít neparametrický postup.

Leveneův test pro testování homogenity rozptylu

Ačkoli F-kritérium je relativně odolné vůči porušení podmínky rovnosti rozptylů ve skupinách, hrubé porušení tohoto předpokladu výrazně ovlivňuje míru významnosti a sílu kritéria. Snad jedním z nejsilnějších je kritérium Levene. Pro kontrolu rovnosti rozptylů S obecné populace, budeme testovat následující hypotézy:

Н 0: σ 1 2 = σ 2 2 = … = σj 2

H 1: Ne vše σ j 2 jsou stejní ( j = 1, 2, …, S)

Modifikovaný Leveneův test je založen na předpokladu, že pokud je variabilita stejná napříč skupinami, lze analýzu rozptylu použít k testování nulové hypotézy o rovnosti rozptylů. absolutní hodnoty rozdíly mezi pozorováními a skupinovými mediány. Nejprve byste tedy měli vypočítat absolutní hodnoty rozdílů mezi pozorováními a mediány v každé skupině a poté provést jednosměrnou analýzu rozptylu na výsledných absolutních hodnotách rozdílů. Abychom ilustrovali Leveneovo kritérium, vraťme se ke scénáři nastíněném na začátku poznámky. Pomocí údajů uvedených na Obr. 6, provedeme podobnou analýzu, ale ve vztahu k modulům rozdílů v počátečních datech a mediánech pro každý vzorek zvlášť (obr. 11).

Analýza rozptylu

1. Koncepce analýzy rozptylu

Analýza rozptylu je analýza variability znaku pod vlivem jakýchkoli řízených proměnných faktorů. V zahraniční literatuře je analýza rozptylu často označována jako ANOVA, což se překládá jako analýza variability (Analysis of Variance).

Problém ANOVA spočívá v izolaci variability jiného druhu od obecné variability vlastnosti:

a) variabilita v důsledku působení každé ze studovaných nezávislých proměnných;

b) variabilita způsobená interakcí studovaných nezávislých proměnných;

c) náhodná variabilita způsobená všemi ostatními neznámými proměnnými.

Variabilita způsobená působením zkoumaných proměnných a jejich interakcí koreluje s náhodnou variabilitou. Indikátorem tohoto vztahu je Fisherův F test.

Vzorec pro výpočet kritéria F obsahuje odhady rozptylů, tedy distribučních parametrů atributu, proto je kritérium F parametrickým kritériem.

Čím více je variabilita vlastnosti způsobena zkoumanými proměnnými (faktory) nebo jejich interakcí, tím vyšší je hodnoty empirického kritéria.

Nula hypotéza v analýze rozptylu bude uvádět, že průměrné hodnoty studované efektivní charakteristiky jsou ve všech gradacích stejné.

Alternativní hypotéza bude konstatovat, že průměrné hodnoty výsledné charakteristiky v různých gradacích zkoumaného faktoru jsou různé.

Analýza rozptylu nám umožňuje konstatovat změnu charakteristiky, ale neindikuje ji směr tyto změny.

Začněme naše úvahy o analýze rozptylu nejjednodušším případem, kdy studujeme pouze akci jeden proměnná (jeden faktor).

2. Jednosměrná analýza rozptylu pro nepříbuzné vzorky

2.1. Účel metody

Metoda jednofaktorové analýzy rozptylu se používá v případech, kdy jsou studovány změny efektivní charakteristiky pod vlivem měnících se podmínek nebo gradací faktoru. V této verzi metody je vliv každé z gradací faktoru odlišný ukázky předmětů. Musí existovat alespoň tři gradace faktoru. (Mohou existovat dvě gradace, ale v tomto případě nebudeme schopni vytvořit nelineární závislosti a zdá se rozumnější použít jednodušší).

Neparametrickou verzí tohoto typu analýzy je Kruskal-Wallisův H test.

Hypotézy

H 0: Rozdíly mezi stupni faktorů (různé podmínky) nejsou větší než náhodné rozdíly v každé skupině.

H 1: Rozdíly mezi stupni faktoru (různé podmínky) jsou větší než náhodné rozdíly v každé skupině.

2.2. Omezení jednosměrné analýzy rozptylu pro nepříbuzné vzorky

1. Jednosměrná analýza rozptylu vyžaduje alespoň tři gradace faktoru a alespoň dva subjekty v každé gradaci.

2. Výsledná charakteristika musí být ve zkoumaném vzorku normálně rozložena.

Pravda, většinou není uvedeno, zda se bavíme o rozložení charakteristiky v celém zkoumaném vzorku nebo v té jeho části, která tvoří disperzní komplex.

3. Příklad řešení úlohy metodou jednosměrné analýzy rozptylu pro nepříbuzné vzorky na příkladu:

Tři různé skupiny po šesti předmětech dostaly seznamy po deseti slovech. První skupině byla slova předkládána nízkou rychlostí – 1 slovo za 5 sekund, druhé skupině průměrnou rychlostí – 1 slovo za 2 sekundy a třetí skupině vysokou rychlostí – 1 slovo za sekundu. Předpokládalo se, že výkon reprodukce bude záviset na rychlosti prezentace slov. Výsledky jsou uvedeny v tabulce. 1.

Počet reprodukovaných slov stůl 1

Předmět č.

nízká rychlost

průměrná rychlost

vysoká rychlost

Celková částka

H 0: Rozdíly v rozpětí tvorby slov mezi skupiny nejsou výraznější než náhodné rozdíly uvnitř každá skupina.

H1: Rozdíly v objemu produkce slov mezi skupiny jsou výraznější než náhodné rozdíly uvnitř každá skupina. Pomocí experimentálních hodnot uvedených v tabulce. 1, stanovíme některé hodnoty, které budou nutné pro výpočet kritéria F.

Výpočet hlavních veličin pro jednosměrnou analýzu rozptylu je uveden v tabulce:

tabulka 2

Tabulka 3

Posloupnost operací v jednosměrné analýze rozptylu pro nepříbuzné vzorky

Označení SS, které se často vyskytuje v této a následujících tabulkách, je zkratka pro „součet čtverců“. Tato zkratka se nejčastěji používá v přeložených pramenech.

SS skutečnost znamená variabilitu charakteristiky v důsledku působení zkoumaného faktoru;

SS obvykle- obecná variabilita znaku;

S C.A.-variabilita způsobená nezohledněnými faktory, „náhodná“ nebo „zbytková“ variabilita.

SLEČNA- „střední čtverec“ nebo matematické očekávání součtu čtverců, průměrná hodnota odpovídající SS.

df - počet stupňů volnosti, který jsme při uvažování neparametrických kritérií označili řeckým písmenem proti.

Závěr: H 0 se zamítá. H 1 je akceptován. Rozdíly ve vybavování slov mezi skupinami byly větší než náhodné rozdíly v každé skupině (α=0,05). Rychlost prezentace slov tedy ovlivňuje objem jejich reprodukce.

Níže je uveden příklad řešení problému v aplikaci Excel:

Počáteční údaje:

Pomocí příkazu: Nástroje->Analýza dat->Jednosměrná ANOVA získáme následující výsledky:

Jednofaktorový rozptylový model vypadá jako

Kde xjj- hodnota zkoumané proměnné získaná dne g-úroveň faktor (r = 1, 2,..., T) taaak sériové číslo (j- 1,2,..., P);/y - účinek vlivem i-té úrovně faktoru; e^. - náhodná složka, nebo porucha způsobená vlivem neovlivnitelných faktorů, tzn. variace proměnné v rámci individuální úrovně.

Pod úroveň faktoru odkazuje na nějakou jeho míru nebo podmínku, například množství aplikovaného hnojiva, typ tavení kovu nebo počet dílů atd.

Základní premisy analýzy rozptylu.

1. Matematické očekávání rušení ? (/ - se rovná nule pro libovolné i, těch.

  • 2. Poruchy jsou vzájemně nezávislé.
  • 3. Rozptyl poruchy (nebo proměnné Xy) je konstantní pro jakékoli ij> těch.

4. Porucha e# (nebo proměnná Xy) má normální distribuční zákon N( 0; a 2).

Vliv úrovní faktorů může být podobný pevný nebo systematický(model I) a náhodný(model II).

Předpokládejme například, že je třeba zjistit, zda jsou mezi šaržemi výrobků významné rozdíly z hlediska nějakého ukazatele kvality, tzn. zkontrolovat vliv na kvalitu jednoho faktoru - šarže výrobků. Pokud do studie zahrneme všechny šarže surovin, pak je vliv úrovně takového faktoru systematický (model I) a získané závěry jsou aplikovatelné pouze na ty jednotlivé šarže, které byly do studie zapojeny; pokud zahrneme pouze náhodně vybranou část stran, pak je vliv faktoru náhodný (model II). V multifaktorových komplexech je možný smíšený model III, ve kterém některé faktory mají náhodné úrovně, zatímco jiné mají pevné úrovně.

Zvažme tento úkol podrobněji. Nech to být Tšarží výrobků. Podle toho se vybírá z každé šarže p L, p 2 ,p t produkty (pro zjednodušení předpokládáme, že u = n 2 =... = p t = p). Hodnoty ukazatele kvality těchto produktů uvádíme ve formě pozorovací matice


Je nutné prověřit významnost vlivu šarží výrobků na jejich kvalitu.

Pokud předpokládáme, že prvky řádků pozorovací matice jsou číselné hodnoty (realizace) náhodných proměnných Xt, X 2 ,..., X t, vyjadřující kvalitu výrobků a mající normální distribuční zákon s matematickými očekáváními, resp a v a 2, ..., na a identické rozptyly a 2, pak tento úkol jde o testování nulové hypotézy #0: a v = a 2l = ... = A t, provedené v analýze rozptylu.

Označme tedy průměrování nad nějakým indexem hvězdičkou (nebo tečkou) místo indexu průměrný jakost výrobků ité šarže, popř skupinový průměr pro i-tou úroveň faktoru má tvar

A celkový průměr -

Uvažujme součet čtverců odchylek pozorování od celkového průměru x„:

nebo Q = Q, + Q 2+ ?>з Poslední termín

protože součet odchylek hodnot proměnné od jejího průměru, tzn. ? 1.g y - x) se rovná nule. ) =x

První termín lze zapsat ve tvaru

V důsledku toho získáme následující identitu:

atd. _

Kde Q = Y, X [ x ij _ x„, já 2 - Všeobecné, nebo plný, součet čtverců odchylek; 7=1

Q, -n^)

Novinka na webu

>

Nejoblíbenější