Dom Usnoj šupljini Metode analize varijanse. Jednosmjerna ANOVA

Metode analize varijanse. Jednosmjerna ANOVA

5.1. Šta se desilo analiza varijanse?

Analizu disperzije razvio je 20-ih godina 20. vijeka engleski matematičar i genetičar Ronald Fisher. Prema anketi među naučnicima, koja je otkrila ko je najviše uticao na biologiju 20. veka, prvenstvo je dobio Sir Fisher (za svoje zasluge odlikovan je viteškim zvanjem - jednim od najviših priznanja u Velikoj Britaniji); u tom pogledu, Fischer je uporediv sa Charlesom Darwinom, koji je imao najveći utjecaj na biologiju 19. stoljeća.

Analiza varijanse je sada posebna grana statistike. Zasniva se na činjenici koju je otkrio Fisher da se mjera varijabilnosti proučavane veličine može razložiti na dijelove koji odgovaraju faktorima koji utiču na ovu veličinu i slučajnim odstupanjima.

Da bismo razumjeli suštinu analize varijanse, istu vrstu proračuna ćemo izvršiti dva puta: “ručno” (sa kalkulatorom) i korištenjem programa Statistica. Da bismo pojednostavili naš zadatak, nećemo raditi s rezultatima stvarnog opisa raznolikosti zelenih žaba, već s fiktivnim primjerom koji se tiče poređenja ženki i mužjaka kod ljudi. Uzmite u obzir raznolikost visina 12 odraslih osoba: 7 žena i 5 muškaraca.

Tabela 5.1.1. Primjer jednosmjerne ANOVA: podaci o spolu i visini 12 osoba

Hajde da izvršimo jednosmernu analizu varijanse: uporedimo da li se muškarci i žene u okarakterisanoj grupi statistički značajno razlikuju po visini ili ne.

5.2. Test za normalnu distribuciju

Dalje razmišljanje se zasniva na činjenici da je distribucija u uzorku koji se razmatra normalna ili blizu normalne. Ako je distribucija daleko od normalne, disperzija (varijansa) nije adekvatna mjera njene varijabilnosti. Međutim, analiza varijanse je relativno otporna na odstupanja distribucije od normalnosti.

Test normalnosti ovih podataka može se obaviti na dva različita načina. Prvo: Statistika / Osnovna statistika / Tabele / Deskriptivna statistika / Kartica Normalnost. U kartici Normalnost Možete odabrati koje ćete testove normalnosti koristiti. Kada kliknete na dugme Tabele frekvencija, pojaviće se tabela frekvencija, a dugme Histogrami će prikazati histogram. Tabela i histogram će pokazati rezultate različitih testova.

Druga metoda je povezana s korištenjem odgovarajućih mogućnosti prilikom konstruiranja histograma. U dijalogu za izradu histograma (Grafovi / Histogrami...) odaberite karticu Napredno. Na dnu se nalazi blok Statistike. Označimo Shapiro-Wilka na njemu t est i Kolmogorov-Smirnov test, kao što je prikazano na slici.

Rice. 5.2.1. Statistički testovi za normalnost distribucije u dijaloškom okviru za iscrtavanje histograma

Kao što se može vidjeti iz histograma, distribucija rasta u našem uzorku se razlikuje od normalne (postoji „neuspjeh“ u sredini).


Rice. 5.2.2. Histogram izgrađen sa parametrima navedenim na prethodnoj slici

Treći red u naslovu grafikona označava parametre normalne distribucije kojoj se ispostavilo da je posmatrana distribucija najbliža. Ukupna srednja vrijednost je 173, a ukupna standardna devijacija je 10,4. Umetak ispod u grafikonu prikazuje rezultate testova normalnosti. D je Kolmogorov-Smirnov test, a SW-W je Shapiro-Wilkov test. Kao što se može vidjeti, za sve korištene testove, razlike između distribucije visine i normalne distribucije su se pokazale statistički beznačajne ( str u svim slučajevima veći od 0,05).

Dakle, formalno gledano, testovi da distribucija bude normalna nisu nam „zabranili“ da koristimo parametarsku metodu zasnovanu na pretpostavci normalna distribucija. Kao što je već spomenuto, analiza varijanse je relativno otporna na odstupanja od normalnosti, pa ćemo je i dalje koristiti.

5.3. Jednosmjerna analiza varijanse: ručni proračuni

Da bismo okarakterizirali varijabilnost visine ljudi u datom primjeru, izračunajmo zbir kvadrata odstupanja (na engleskom označeno kao SS , Zbir kvadrata ili ) pojedinačne vrijednosti iz prosjeka: . Prosječna vrijednost visine u gornjem primjeru je 173 centimetra. Na osnovu ovoga,

SS = (186–173) 2 + (169–173) 2 + (166–173) 2 + (188–173) 2 + (172–173) 2 + (179–173) 2 + (165–173) 2 + (174–173) 2 + (163–173) 2 + (162–173) 2 + (162–173) 2 + (190–173) 2 ;

SS = 132 + 42 + 72 + 152 + 12 + 62 + 82 + 12 + 102 + 112 + 112 + 172;

SS = 169 + 16 + 49 + 225 + 1 + 36 + 64 + 1 + 100 + 121 + 121 + 289 = 1192.

Rezultirajuća vrijednost (1192) je mjera varijabilnosti cijelog skupa podataka. Međutim, oni se sastoje od dvije grupe, od kojih svaka može imati svoj prosjek. U datim podacima prosječna visinažene - 168 cm, a muškarci - 180 cm.

Izračunajmo zbir kvadrata odstupanja za žene:

SS f = (169–168) 2 + (166–168) 2 + (172–168) 2 + (179–168) 2 + (163–168) 2 + (162–168) 2 ;

SS f = 12 + 22 + 42 + 112 + 32 + 52 + 62 = 1 + 4 + 16 + 121 + 9 + 25 + 36 = 212.

Također izračunavamo zbir kvadrata odstupanja za muškarce:

SS m = (186–180) 2 + (188–180) 2 + (174–180) 2 + (162–180) 2 + (190–180) 2 ;

SS m = 62 + 82 + 62 + 182 + 102 = 36 + 64 + 36 + 324 + 100 = 560.

Od čega zavisi vrednost koja se proučava u skladu sa logikom analize varijanse?

Dvije izračunate vrijednosti, SS f I SS m , karakteriziraju unutargrupnu varijaciju, koja se u analizi varijanse obično naziva “greška”. Porijeklo ovog imena povezano je sa sljedećom logikom.

Šta određuje visinu osobe u ovom primjeru? Prije svega, na prosječnu visinu ljudi općenito, bez obzira na njihov spol. Drugo - sa poda. Ako su osobe jednog pola (muški) viši od drugog (ženskog), to se može predstaviti kao dodatak „univerzalnom“ prosjeku neke vrijednosti, rodnog efekta. Konačno, osobe istog pola razlikuju se po visini zbog individualnih razlika. U modelu koji visinu opisuje kao zbir ljudskog prosjeka i prilagođavanja spolu, individualne razlike su neobjašnjive i mogu se smatrati "greškom".

Dakle, u skladu sa logikom analize varijanse, vrijednost koja se proučava se određuje na sljedeći način: , Gdje x ij - i-ta vrijednost proučavane veličine kod j-te vrijednosti proučavanog faktora; - opšti prosjek; Fj - uticaj j-te vrijednosti faktora koji se proučava; - “greška”, doprinos individualnosti objekta na koji se vrijednost odnosix ij .

Međugrupni zbir kvadrata

dakle, SS greške = SS f + SS m = 212 + 560 = 772. Ovom vrijednošću smo opisali unutargrupnu varijabilnost (prilikom razlikovanja grupa po spolu). Ali postoji drugi dio varijabilnosti - međugrupna varijabilnost, koju ćemo nazvatiSS efekat (pošto je riječ o efektu podjele ukupnosti predmetnih predmeta na žene i muškarce).

Srednja vrijednost svake grupe razlikuje se od ukupne srednje vrijednosti. Prilikom izračunavanja doprinosa ove razlike ukupnoj mjeri varijabilnosti, moramo pomnožiti razliku između grupe i ukupnog prosjeka brojem objekata u svakoj grupi.

SS efekat = = 7×(168–173) 2 + 5×(180–173) 2 = 7×52 + 5×72 = 7×25 + 5×49 = 175 + 245 = 420.

Ovdje se manifestirao princip konstantnosti zbira kvadrata, koji je otkrio Fischer: SS = efekat SS + greška SS , tj. za ovaj primjer, 1192 = 440 + 722.

Prosječni kvadrati

Uspoređujući međugrupne i unutargrupne sume kvadrata u našem primjeru, možemo vidjeti da je prvi povezan s varijacijama dvije grupe, a drugi je povezan sa 12 vrijednosti u 2 grupe. Broj stepeni slobode ( df ) za neki parametar se može definirati kao razlika između broja objekata u grupi i broja ovisnosti (jednačina) koje povezuju ove veličine.

U našem primjeru df efekat = 2–1 = 1, A df greške = 12–2 = 10.

Zbire kvadrata možemo podijeliti njihovim brojem stupnjeva slobode, dajući nam srednje kvadrate ( GOSPOĐA , Sredstva kvadrata). Nakon što smo ovo uradili, možemo to utvrditi GOSPOĐA - ništa više od varijacija („varijanse“, rezultat dijeljenja zbira kvadrata brojem stupnjeva slobode). Nakon ovog otkrića, možemo razumjeti strukturu ANOVA tablice. Za naš primjer, to će izgledati ovako.

Efekat

Greška

MS efekat I MS greške su procjene međugrupne i unutargrupne varijanse, te se stoga mogu porediti prema kriterijuF (Snedecorov kriterijum, nazvan po Fischeru), dizajniran za upoređivanje varijacija. Ovaj kriterij je jednostavno količnik dijeljenja veće varijacije manjom. U našem slučaju to je 420 / 77,2 = 5,440.

Određivanje statističke značajnosti Fisherovog testa pomoću tabela

Ako bismo ručno, koristeći tabele, odredili statističku značajnost efekta, morali bismo uporediti rezultujuću vrijednost kriterija F sa kritičnom vrednošću koja odgovara određenom nivou statističke značajnosti za date stepene slobode.


Rice. 5.3.1. Fragment tabele sa vrednostima kritičnih kriterijuma F

Kao što vidite, za nivo statističke značajnosti p=0,05 kritična vrednost kriterijuma jeF je 4,96. To znači da je u našem primeru efekat ispitivanog pola zabeležen na nivou statističke značajnosti od 0,05.

Dobijeni rezultat se može protumačiti na sljedeći način. Vjerovatnoća nulte hipoteze, prema kojoj je prosječna visina žena i muškaraca ista, a zabilježena razlika u njihovoj visini zbog slučajnosti u odabiru uzoraka, manja je od 5%. To znači da moramo izabrati alternativnu hipotezu, a to je da je prosječna visina žena i muškaraca različita.

5.4. Jednosmjerna analiza varijanse ( ANOVA) u paketu Statistica

U slučajevima kada se proračuni ne rade ručno, već pomoću odgovarajućih programa (na primjer, paket Statistica), vrijednost str određuje se automatski. Možete provjeriti da je nešto više od kritične vrijednosti.

Da biste analizirali primjer o kojem se raspravlja koristeći najjednostavniju verziju analize varijanse, potrebno je pokrenuti proceduru Statistika / ANOVA za datoteku s odgovarajućim podacima i odabrati opciju One-way ANOVA u prozoru Tip analize i dijalog Brze specifikacije opciju u prozoru Metoda specifikacije.


Rice. 5.4.1. Dijalog General ANOVA/MANOVA (Analiza varijance)

U brzom dijaloškom prozoru koji se otvori, u polju Variables potrebno je navesti one stupce koji sadrže podatke čiju varijabilnost proučavamo (Lista zavisnih varijabli; u našem slučaju kolona Rast), kao i kolonu koja sadrži vrijednosti ​​koje dijele vrijednost koja se proučava u grupe (Katigorički prediktor (faktor); u našem slučaju kolona Spol). U ovoj verziji analize, za razliku od multivarijantne analize, može se uzeti u obzir samo jedan faktor.


Rice. 5.4.2. Dialogue One-Way ANOVA (Jednosmjerna analiza varijanse)

U prozoru Faktorski kodovi trebali biste naznačiti one vrijednosti faktora u pitanju koje je potrebno obraditi tokom ove analize. Sve dostupne vrijednosti mogu se vidjeti pomoću gumba Zoom; ako, kao u našem primjeru, trebate uzeti u obzir sve vrijednosti faktora (a za spol u našem primjeru postoje samo dvije), možete kliknuti gumb Sve. Kada su kolone i kodovi faktora koji se obrađuju navedeni, možete kliknuti OK i otići na prozor brza analiza rezultati: ANOVA Rezultati 1, na kartici Brzi.

Rice. 5.4.3. Brza kartica prozora ANOVA Results

Dugme Svi efekti/Grafovi vam omogućava da vidite kako se upoređuju srednje vrijednosti dvije grupe. Iznad grafikona je naznačen broj stupnjeva slobode, kao i vrijednosti F i p za faktor o kojem je riječ.


Rice. 5.4.4. Grafički prikaz rezultata ANOVA

Dugme Svi efekti vam omogućava da dobijete analizu tabele varijanse sličnu onoj gore opisanoj (sa nekim značajnim razlikama).


Rice. 5.4.5. Tabela sa rezultatima analize varijanse (uporedi sa sličnom tabelom dobijenom „ručno“)

Donji red tabele prikazuje zbir kvadrata, broj stepeni slobode i srednji kvadrat greške (varijabilnost unutar grupe). Na gornjoj liniji su slični pokazatelji za faktor koji se proučava (in u ovom slučaju- znak Pol), kao i kriterijum F (odnos srednjih kvadrata efekta i srednjih kvadrata greške) i nivo njegove statističke značajnosti. Činjenica da se efekat faktora koji se razmatra pokazao statistički značajan pokazuje crvena boja.

A prvi red prikazuje podatke o indikatoru "Presretanje". Ovo Red tabele predstavlja misteriju za korisnike koji se pridružuju Statistici u njenoj 6. ili novijoj verziji. Vrijednost intercepta je vjerovatno povezana sa dekompozicijom zbira kvadrata svih vrijednosti podataka (tj. 1862 + 1692 ... = 360340). Vrijednost F kriterija naznačena za njega dobijena je dijeljenjem MS Intercept/MS Greška = 353220 / 77,2 = 4575,389 i, naravno, daje vrlo niska vrijednost str . Zanimljivo je da u Statistici-5 ova vrijednost uopće nije izračunata, a u priručnicima za korištenje kasnijih verzija paketa ni na koji način se ne komentariše njeno uvođenje. Vjerovatno najbolja stvar koju biolog koji koristi Statisticu-6 i kasnije može učiniti je jednostavno zanemariti red Intercept u tabeli ANOVA.

5.5. ANOVA i Studentov i Fisherov t-test: koji je bolji?

Kao što ste možda primijetili, podatke koje smo uporedili koristeći jednosmjernu analizu varijanse, mogli bismo ispitati i pomoću Studentovog i Fisherovog testa. Hajde da uporedimo ove dve metode. Da bismo to učinili, izračunajmo razliku u visini između muškaraca i žena koristeći ove kriterije. Da bismo to uradili, moraćemo da pratimo putanju Statistika / Osnovna statistika / t-test, nezavisno, po grupama. Naravno, zavisne varijable su varijabla rasta, a varijabla grupisanja je varijabla spola.


Rice. 5.5.1. Poređenje podataka obrađenih pomoću ANOVA pomoću Studentovog i Fisherovog testa

Kao što vidite, rezultat je isti kao kod upotrebe ANOVA. str = 0,041874 u oba slučaja, kao što je prikazano na sl. 5.4.5, a prikazano na Sl. 5.5.2 (uvjerite se sami!).


Rice. 5.5.2. Rezultati analize (detaljno objašnjenje tabele rezultata - u paragrafu posvećenom Studentovom testu)

Važno je naglasiti da iako je F kriterijum sa matematičke tačke gledišta u razmatranoj analizi prema Studentovom i Fišerovom testu isti kao u ANOVA (i izražava omjer varijanse), njegovo značenje u rezultatima analize prikazanim u finalni sto je potpuno drugačiji. Prilikom poređenja Studentovim i Fišerovim testom, poređenje srednjih vrednosti uzorka vrši se Studentovim testom, a poređenje njihove varijabilnosti vrši se Fišerovim testom. Rezultati analize ne prikazuju samu varijaciju, već njenu Kvadratni korijen- standardna devijacija.

U ANOVA-i, s druge strane, Fisherov test se koristi za upoređivanje srednjih vrijednosti različitih uzoraka (kao što smo raspravljali, to se radi dijeljenjem zbira kvadrata na dijelove i poređenjem srednjeg zbira kvadrata koji odgovaraju između i unutar grupe varijabilnost).

Međutim, gornja razlika se prije tiče prezentacije rezultata. statističko istraživanje nego njegova suština. Kao što Glantz (1999, str. 99) ističe, na primjer, poređenje grupa korištenjem Studentovog t testa može se posmatrati kao poseban slučaj analiza varijanse za dva uzorka.

Dakle, poređenje uzoraka pomoću Studentovog i Fisherovog testa ima jednu stvar važna prednost prije analize varijanse: u njoj se uzorci mogu porediti u smislu njihove varijabilnosti. Ali prednosti analize varijanse su još značajnije. To uključuje, na primjer, mogućnost istovremenog poređenja nekoliko uzoraka.

Analiza varijanse je statistička metoda dizajnirana za procjenu utjecaja različitih faktora na rezultat eksperimenta, kao i za naknadno planiranje sličnih eksperimenata.

U početku (1918), analizu varijanse razvio je engleski matematičar i statističar R.A. Fišera da obradi rezultate agronomskih eksperimenata za identifikaciju uslova za postizanje maksimalnog prinosa različitih sorti poljoprivrednih kultura.

Prilikom postavljanja eksperimenta moraju biti ispunjeni sljedeći uslovi:

    Svaka varijanta pokusa mora biti izvedena na nekoliko posmatračkih jedinica (grupe životinja, terenski odseci itd.)

    Raspodjela jedinica promatranja između eksperimentalnih varijanti treba biti nasumična, a ne namjerna.

ANOVA koristi F-kriterijum(R.A. Fisherov kriterij), koji predstavlja omjer dvije varijanse:

gdje je činjenica d, d rezidual faktorijalne (međugrupne) i rezidualne (unutargrupne) varijanse po stepenu slobode, respektivno.

Faktorske i rezidualne varijanse su procjene varijanse populacije, izračunate iz podataka uzorka uzimajući u obzir broj stupnjeva slobode varijacije.

Faktorska (međugrupna) disperzija objašnjava varijaciju efektivne karakteristike pod uticajem faktora koji se proučava.

Preostala (unutar grupe) varijansa objašnjava varijaciju efektivne karakteristike zbog uticaja drugih faktora (osim uticaja faktora koji se proučava).

Sve u svemu, faktor i rezidualne varijanse daju ukupnu varijansu, izražavajući uticaj svih faktorskih karakteristika na rezultantnu.

Procedura za provođenje analize varijanse:

1. Eksperimentalni podaci se unose u proračunsku tabelu i određuju količine i prosječne vrijednosti u svakoj grupi populacije koja se proučava, kao i ukupan iznos i prosječna vrijednost za cijelu populaciju (Tabela 1).

Tabela 1

Vrijednost rezultirajuće karakteristike za i-tu jedinicu

u j-toj grupi, x ij

Broj zapažanja, f j

Prosjek (grupni i ukupni), x j

x 11, x 12, …, x 1 n

x 21, x 22, …, x 2 n

x m 1, x m 2, ..., x mn

Ukupan broj zapažanja n izračunato kao zbir broja zapažanja f j u svakoj grupi:

Ako sve grupe imaju isti broj elemenata, onda je ukupni prosjek nalazi se iz grupnih sredina kao jednostavna aritmetička sredina:

Ako je broj elemenata u grupama različit, onda je ukupni prosjek izračunato pomoću formule ponderirane aritmetičke sredine:

2. Utvrđuje se ukupna varijansa D općenito kao zbir kvadrata odstupanja pojedinačnih vrijednosti rezultirajuće karakteristike od ukupnog prosjeka :

3. Izračunava se faktorska (međugrupna) varijansa D činjenica kao zbir kvadrata odstupanja grupnih srednjih vrednosti od ukupnog prosjeka , pomnoženo sa brojem zapažanja:

4. Određuje se vrijednost preostale (unutargrupne) varijanse D ost kao razlika između ukupnog iznosa D općenito i faktorijel D činjenica varijance:

5. Izračunajte broj stupnjeva slobode faktora
varijansa kao razlika između broja grupa m i jedinica:

6. Određuje se broj stupnjeva slobode za zaostalu disperziju
kao razlika između broja pojedinačnih vrijednosti neke karakteristike n i broj grupa m:

7. Izračunava se vrijednost faktorske disperzije po jednom stepenu slobode d činjenica kao omjer faktorske varijance D činjenica na broj stupnjeva slobode faktorske disperzije
:

8. Određuje se vrijednost preostale disperzije po jednom stepenu slobode d ost kao omjer rezidualne varijance D ost na broj stupnjeva slobode zaostale disperzije
:

9. Određuje se izračunata vrijednost F-kriterijuma F-kalkulacija kao omjer varijanse faktora po stepenu slobode d činjenica na zaostalu varijansu po stepenu slobode d ost :

10. Koristeći Fisher F test tablicu, uzimajući u obzir nivo značajnosti usvojen u studiji, kao i uzimajući u obzir stepene slobode faktora i rezidualnih varijansi, nalazi se teorijska vrijednost F sto .

Nivo značajnosti od 5% odgovara nivou vjerovatnoće od 95%, a nivo značajnosti od 1% odgovara nivou vjerovatnoće od 99%. U većini slučajeva koristi se nivo značajnosti od 5%.

Teorijska vrijednost F sto na datom nivou značajnosti se određuje iz tabela na preseku reda i kolone, što odgovara dva stepena slobode varijansi:

po liniji – ostatak;

po stupcu – faktorijel.

11. Rezultati proračuna prikazani su u tabeli (Tablica 2).

Svi ljudi po prirodi teže znanju. (Aristotel. Metafizika)

Analiza varijanse

Uvodni pregled

U ovom dijelu ćemo pregledati osnovne metode, pretpostavke i terminologiju ANOVA-e.

Imajte na umu da se u literaturi na engleskom jeziku analiza varijanse obično naziva analiza varijacije. Stoga, radi sažetosti, u nastavku ćemo ponekad koristiti termin ANOVA (An alysis o f va rijacija) za običnu ANOVA-u i termin MANOVA za multivarijantnu analizu varijanse. U ovom dijelu ćemo uzastopno pregledati glavne ideje analize varijanse ( ANOVA), analiza kovarijanse ( ANCOVA), multivarijantna analiza varijanse ( MANOVA) i multivarijantna analiza kovarijanse ( MANCOVA). Nakon kratke rasprave o prednostima kontrastne analize i post hoc testova, pogledajmo pretpostavke na kojima su zasnovane ANOVA metode. Na kraju ovog odjeljka objašnjene su prednosti multivarijatnog pristupa za analizu ponovljenih mjera u odnosu na tradicionalni univarijantni pristup.

Ključne ideje

Svrha analize varijanse. Glavna svrha analize varijanse je da se ispita značaj razlika između srednjih vrijednosti. Poglavlje (Poglavlje 8) daje kratak uvod u proučavanje statističke značajnosti. Ako jednostavno uspoređujete srednje vrijednosti dva uzorka, analiza varijanse će dati isti rezultat kao i obična analiza. t- test za nezavisne uzorke (ako se porede dve nezavisne grupe objekata ili zapažanja) ili t- kriterijum za zavisne uzorke (ako se dve varijable porede na istom skupu objekata ili posmatranja). Ako niste upoznati s ovim kriterijima, preporučujemo da pogledate uvodni pregled poglavlja (poglavlje 9).

Odakle je došlo ime Analiza varijanse? Može izgledati čudno da se postupak za poređenje srednjih vrijednosti naziva analiza varijanse. U stvarnosti, to je zato što kada ispitujemo statističku značajnost razlika između srednjih vrijednosti, mi zapravo analiziramo varijanse.

Particioniranje zbira kvadrata

Za veličinu uzorka n, varijansa uzorka se izračunava kao zbir kvadrata odstupanja od srednje vrijednosti uzorka podijeljen sa n-1 (veličina uzorka minus jedan). Dakle, za fiksnu veličinu uzorka n, varijansa je funkcija zbira kvadrata (odstupanja), označena, radi kratkoće, SS(od engleskog Sum of Squares - Sum of Squares). Osnova analize varijanse je odvajanje (ili particioniranje) varijanse na dijelove. Razmotrite sljedeći skup podataka:

Srednja vrijednost dvije grupe značajno se razlikuje (2 i 6, respektivno). Zbir kvadrata odstupanja unutra svaka grupa je jednaka 2. Sabirajući ih, dobijamo 4. Ako sada ponovimo ove proračune isključujućičlanstvo u grupi, odnosno ako računamo SS na osnovu ukupne srednje vrednosti dva uzorka, dobijamo 28. Drugim rečima, varijansa (zbir kvadrata) zasnovana na varijabilnosti unutar grupe rezultira mnogo manjim vrednostima nego kada se izračunava na osnovu ukupne varijabilnosti (u odnosu na ukupna srednja vrijednost). Razlog tome je očito značajna razlika između srednjih vrijednosti, a ta razlika između srednjih vrijednosti objašnjava postojeću razliku između zbira kvadrata. Zapravo, ako koristite modul za analizu datih podataka Analiza varijanse, dobiće se sljedeći rezultati:

Kao što se može vidjeti iz tabele, ukupan zbir kvadrata SS=28 podijeljeno je zbirom kvadrata datim sa unutargrupa varijabilnost ( 2+2=4 ; vidi drugi red tabele) i zbir kvadrata zbog razlike u srednjim vrednostima. (28-(2+2)=24; vidi prvi red tabele).

SS greške iSS efekat. varijabilnost unutar grupe ( SS) se obično naziva disperzija greške. To znači da se obično ne može predvidjeti ili objasniti kada se eksperiment izvodi. Na drugoj strani, SS efekat(ili varijabilnost između grupa) može se objasniti razlikama između srednjih vrijednosti ispitivanih grupa. Drugim riječima, pripadnost određenoj grupi objašnjava međugrupna varijabilnost, jer znamo da ove grupe imaju različita sredstva.

Provjera značaja. Osnovne ideje testiranja statističke značajnosti razmatrane su u poglavlju Osnovni koncepti statistike(poglavlje 8). Ovo poglavlje također objašnjava razloge zašto mnogi testovi koriste omjer objašnjene i neobjašnjive varijanse. Primjer ove upotrebe je analiza same varijanse. Testiranje značajnosti u ANOVA bazira se na poređenju varijanse zbog varijanse između grupa (tzv. efekat srednjeg kvadrata ili GOSPOĐAEfekat) i varijansu zbog varijacije unutar grupe (tzv srednja kvadratna greška ili GOSPOĐAgreška). Ako je nulta hipoteza (jednakost srednjih vrijednosti u dvije populacije) tačna, onda bi se očekivala relativno mala razlika u srednjim vrijednostima uzorka zbog slučajne varijacije. Prema tome, pod nultom hipotezom, varijansa unutar grupe će se praktično poklapati sa ukupnom varijansom izračunatom bez uzimanja u obzir pripadnosti grupi. Rezultirajuće varijanse unutar grupe mogu se uporediti pomoću F- test koji provjerava da li je omjer varijanse značajno veći od 1. U primjeru o kojem se gore govori F- kriterijum pokazuje da je razlika između srednjih vrednosti statistički značajna.

Osnovna logika analize varijanse. Da rezimiramo, svrha ANOVA je testiranje statističke značajnosti razlike između srednjih vrijednosti (za grupe ili varijable). Ova provjera se provodi analizom varijanse, tj. dijeljenjem ukupne varijanse (varijacije) na dijelove, od kojih je jedan rezultat slučajne greške (tj. unutargrupne varijabilnosti), a drugi je povezan s razlikama u srednjim vrijednostima. Posljednja komponenta varijanse se tada koristi za analizu statističke značajnosti razlike između srednjih vrijednosti. Ako je ova razlika značajna, nulta hipoteza se odbacuje i prihvaća alternativna hipoteza da postoji razlika između srednjih vrijednosti.

Zavisne i nezavisne varijable. Pozivaju se varijable čije su vrijednosti određene mjerenjima tokom eksperimenta (na primjer, rezultat testa). zavisan varijable. Varijable koje se mogu kontrolisati u eksperimentu (na primjer, nastavne metode ili drugi kriteriji za podjelu zapažanja u grupe) nazivaju se faktori ili nezavisni varijable. Ovi koncepti su detaljnije opisani u poglavlju Osnovni koncepti statistike(poglavlje 8).

Multivarijantna analiza varijanse

U gore navedenom jednostavan primjer možete odmah izračunati t-test za nezavisne uzorke koristeći odgovarajuću opciju modula Osnovne statistike i tabele. Dobiveni rezultati će se prirodno poklopiti sa rezultatima analize varijanse. Međutim, ANOVA sadrži fleksibilne i moćne tehnike koje se mogu koristiti za mnogo složenije studije.

Mnogo faktora. Svijet je složen i višedimenzionalan po prirodi. Izuzetno su rijetke situacije kada je određena pojava potpuno opisana jednom varijablom. Na primjer, ako pokušavamo naučiti kako uzgajati velike rajčice, trebali bismo uzeti u obzir faktore povezane s genetskom strukturom biljke, tipom tla, svjetlošću, temperaturom itd. Dakle, prilikom izvođenja tipičnog eksperimenta, mora se suočiti sa velikim brojem faktora. Glavni razlog zašto je korištenje ANOVA poželjnije od ponovljenih poređenja dva uzorka na različitim nivoima faktora korištenjem t- Kriterijum je da je analiza varijanse više efektivno i, za male uzorke, informativniji.

Faktorsko upravljanje. Pretpostavimo da u primeru analize dva uzorka o kojem smo gore govorili, dodamo još jedan faktor, npr. Kat- Rod. Neka se svaka grupa sastoji od 3 muškarca i 3 žene. Dizajn ovog eksperimenta može se predstaviti u obliku tabele 2x2:

Eksperimentiraj. Grupa 1 Eksperimentiraj. Grupa 2
Muškarci2 6
3 7
1 5
Prosjek2 6
Žene4 8
5 9
3 7
Prosjek4 8

Prije nego što izvršite izračune, možete primijetiti da u ovom primjeru ukupna varijansa ima najmanje tri izvora:

(1) slučajna greška (unutar grupne varijanse),

(2) varijabilnost povezana sa članstvom u eksperimentalnoj grupi, i

(3) varijabilnost zbog pola objekata posmatranja.

(Imajte na umu da postoji još jedan mogući izvor varijabilnosti - interakcija faktora, o čemu ćemo kasnije raspravljati). Šta se dešava ako ne uključimo katspol kao faktor u analizi i izračunajte uobičajeno t-kriterijum? Ako izračunamo sume kvadrata, zanemarimo sprat -spol(tj. kombinovanje objekata različitog pola u jednu grupu prilikom izračunavanja varijanse unutar grupe, čime se dobija zbir kvadrata za svaku grupu jednak SS=10, i ukupan zbir kvadrata SS= 10+10 = 20), tada dobijamo veću vrijednost unutargrupne varijanse nego preciznijom analizom sa dodatnom podjelom na podgrupe prema polu- spol(u ovom slučaju, srednja vrijednost unutar grupe će biti jednaka 2, a ukupni zbir kvadrata unutar grupe će biti jednak SS = 2+2+2+2 = 8). Ova razlika je zbog činjenice da je prosječna vrijednost za muškarci - mužjaci manje od prosjeka za žene -žensko, a ova razlika u srednjim vrijednostima povećava ukupnu varijabilnost unutar grupe kada se spol ne uzima u obzir. Kontrola varijanse greške povećava osjetljivost (snagu) testa.

Ovaj primjer pokazuje još jednu prednost analize varijanse u odnosu na konvencionalnu t- kriterijum za dva uzorka. Analiza varijanse vam omogućava da proučavate svaki faktor kontrolirajući vrijednosti preostalih faktora. To je, zapravo, glavni razlog njegove veće statističke moći (za dobijanje smislenih rezultata potrebne su manje veličine uzorka). Iz tog razloga analiza varijanse, čak i na malim uzorcima, daje statistički više značajne rezultate nego jednostavno t- kriterijum.

Efekti interakcije

Postoji još jedna prednost korištenja analize varijanse u odnosu na konvencionalnu t- kriterijum: analiza varijanse nam omogućava da otkrijemo interakcija između faktora i stoga omogućava proučavanje složenijih modela. Za ilustraciju, razmotrite još jedan primjer.

Glavni efekti, parne (dvofaktorske) interakcije. Pretpostavimo da postoje dvije grupe učenika, a psihološki su učenici prve grupe odlučni da urade postavljene zadatke i svrsishodniji su od učenika druge grupe koju čine lijeniji učenici. Hajde da nasumično podijelimo svaku grupu na pola i jednoj polovini svake grupe damo težak zadatak, a drugoj polovini lakši. Zatim ćemo izmjeriti koliko naporno učenici rade na ovim zadacima. Prosjeci za ovu (izmišljenu) studiju prikazani su u tabeli:

Kakav zaključak se može izvući iz ovih rezultata? Možemo li zaključiti da: (1) učenici intenzivnije rade na složenom zadatku; (2) Da li motivirani učenici rade više od lijenih? Nijedna od ovih izjava ne obuhvata suštinu sistematske prirode sredstava prikazanih u tabeli. Analizirajući rezultate, ispravnije bi bilo reći da samo motivisani učenici više rade na teškim zadacima, dok samo lijeni učenici više rade na lakim zadacima. Drugim riječima, karakter učenika i težina zadatka interakciju utiču jedni na druge na uloženi napor. To je primjer interakcija u paru između karaktera učenika i težine zadatka. Imajte na umu da izjave 1 i 2 opisuju glavni efekti.

Interakcije višeg reda. Dok je interakcije u paru još uvijek relativno lako objasniti, interakcije višeg reda je mnogo teže objasniti. Zamislimo da je u gore razmatranom primjeru uveden još jedan faktor kat -Rod i dobili smo sljedeću tabelu prosjeka:

Koji se zaključci sada mogu izvući iz dobijenih rezultata? Prosječni zapleti olakšavaju tumačenje složenih efekata. Modul ANOVA vam omogućava da napravite ove grafikone sa skoro jednim klikom miša.

Slika u grafikonima ispod predstavlja interakciju tri faktora koja se proučava.

Gledajući grafikone, možemo reći da za žene postoji interakcija između ličnosti i poteškoća u testiranju: motivisane žene više rade na teškom zadatku nego na lakom. Za muškarce, ista interakcija je obrnuta. Može se vidjeti da opis interakcije između faktora postaje sve zbunjujući.

Opšti način opisivanja interakcija. IN opšti slučaj interakcija između faktora se opisuje kao promjena jednog efekta pod utjecajem drugog. U primjeru o kojem je gore raspravljano, dvofaktorska interakcija se može opisati kao promjena glavnog efekta faktora koji karakterizira težinu zadatka pod utjecajem faktora koji opisuje karakter učenika. Za interakciju tri faktora iz prethodnog stava možemo reći da se interakcija dva faktora (teškoće zadatka i karakter učenika) menja pod uticajem spolRod. Ako se proučava interakcija četiri faktora, možemo reći da se interakcija tri faktora mijenja pod uticajem četvrtog faktora, tj. Postoje različite vrste interakcija na različitim nivoima četvrtog faktora. Pokazalo se da u mnogim područjima interakcija pet ili čak više faktora nije neobična.

Komplikovani planovi

Dizajni između grupe i unutar grupe (nacrti ponovljenih mjera)

Kada uporedimo dva razne grupe obično se koristi t- kriterijum za nezavisne uzorke (iz modula Osnovne statistike i tabele). Kada se dvije varijable uspoređuju na istom skupu objekata (zapažanja), koristi se t-kriterijum za zavisne uzorke. Za analizu varijanse takođe je važno da li su uzorci zavisni ili ne. Ako postoje ponovljena mjerenja istih varijabli (sa različitim uslovima ili u različito vrijeme) za iste objekte, zatim govore o prisustvu faktor ponovljenih mjera(takođe se zove unutargrupni faktor, budući da se unutar grupe zbir kvadrata izračunava da bi se procijenila njegova važnost). Ako se uporede različite grupe predmeta (npr. muškarci i žene, tri soja bakterija, itd.), onda se opisuje razlika između grupa međugrupni faktor. Metode za izračunavanje kriterijuma značajnosti za dva opisana tipa faktora su različite, ali su im opšta logika i tumačenja ista.

Među- i unutar-grupni planovi. U mnogim slučajevima, eksperiment zahtijeva uključivanje faktora između subjekata i faktora ponovljenih mjerenja u dizajn. Na primjer, mjere se matematičke vještine učenika i učenika (gdje sprat -Rod-međugrupni faktor) na početku i na kraju semestra. Dvije mjere vještina svakog učenika čine faktor unutar grupe (faktor ponovljenih mjerenja). Interpretacija glavnih efekata i interakcija za faktore između predmeta i ponovljenih mjera je konzistentna, a obje vrste faktora očigledno mogu biti u interakciji jedni s drugima (npr. žene stječu vještine tokom semestra, dok ih muškarci gube).

Nepotpuni (ugniježđeni) planovi

U mnogim slučajevima efekat interakcije se može zanemariti. To se dešava ili kada se zna da nema interakcijskog efekta u populaciji, ili kada je implementacija potpuna faktorijel plan je nemoguć. Na primjer, proučava se učinak četiri aditiva za gorivo na potrošnju goriva. Odabrana su četiri automobila i četiri vozača. Pun faktorijel eksperiment zahtijeva da se svaka kombinacija: aditiv, vozač, auto - pojavi barem jednom. Za ovo je potrebno najmanje 4 x 4 x 4 = 64 grupe testova, što oduzima previše vremena. Uz to, malo je vjerovatno da će doći do bilo kakve interakcije između vozača i aditiva za gorivo. Uzimajući to u obzir, možete koristiti plan latinski kvadrati, koji sadrži samo 16 test grupa (četiri aditiva su označena slovima A, B, C i D):

Latinski kvadrati su opisani u većini knjiga o eksperimentalnom dizajnu (npr. Hays, 1988; Lindman, 1974; Milliken i Johnson, 1984; Winer, 1962) i ovdje se neće detaljno raspravljati. Imajte na umu da su latinični kvadrati Nenpun dizajni u kojima nisu uključene sve kombinacije nivoa faktora. Na primjer, vozač 1 vozi auto 1 samo sa dodatkom A, vozač 3 vozi auto 1 samo sa dodatkom C. Nivoi faktora aditivi ( A, B, C i D) su ugniježđene u ćelije tabele automobil x vozač - kao jaja u gnezdima. Ovo mnemoničko pravilo korisno za razumevanje prirode ugniježđen ili ugniježđen planove. Modul Analiza varijanse pruža jednostavne načine analiza planova ove vrste.

Kovarijansna analiza

glavna ideja

U poglavlju Ključne ideje Ukratko je razmotrena ideja kontrole faktora i kako uključivanje aditivnih faktora smanjuje zbir grešaka na kvadrat i povećava statističku moć dizajna. Sve se to može proširiti na varijable s kontinuiranim skupom vrijednosti. Kada su takve kontinuirane varijable uključene kao faktori u dizajnu, one se nazivaju kovarijati.

Fiksne kovarijate

Pretpostavimo da upoređujemo matematičke vještine dvije grupe učenika koji su podučavani koristeći dva različita udžbenika. Pretpostavimo i da su podaci o kvocijentu inteligencije (IQ) dostupni za svakog učenika. Možete pretpostaviti da je IQ povezan s matematičkim vještinama i koristiti te informacije. Za svaku od dvije grupe učenika može se izračunati koeficijent korelacije između IQ-a i matematičkih vještina. Koristeći ovaj koeficijent korelacije, moguće je izolovati udio varijanse u grupama koji se objašnjava utjecajem IQ-a i neobjašnjivog udjela varijanse (vidi također Osnovni koncepti statistike(poglavlje 8) i Osnovne statistike i tabele(poglavlje 9)). Preostali dio varijanse se koristi u analizi kao varijansa greške. Ako postoji korelacija između IQ-a i matematičkih vještina, tada se varijansa greške može značajno smanjiti SS/(n-1) .

Uticaj kovarijati naF- kriterijum. F- kriterij procjenjuje statističku značajnost razlike srednjih vrijednosti u grupama, a izračunava se omjer međugrupne varijanse ( GOSPOĐAefekat) do varijance greške ( GOSPOĐAgreška) . Ako GOSPOĐAgreška smanjuje se, na primjer, kada se uzme u obzir IQ faktor, vrijednost F povećava.

Mnogo kovarijacija. Gore korišćeno rezonovanje za jednu kovarijatu (IQ) može se lako proširiti na više kovarijata. Na primjer, pored IQ-a, možete uključiti mjerenja motivacije, prostornog razmišljanja itd. Umjesto uobičajenog koeficijenta korelacije, koristi se višestruki koeficijent korelacije.

Kada vrijednostF - kriteriji se smanjuju. Ponekad uvođenje kovarijata u eksperimentalni dizajn smanjuje značaj F-kriterijumi . Ovo obično ukazuje na to da su kovarijate u korelaciji ne samo sa zavisnom varijablom (npr. matematičke vještine) već i sa faktorima (npr. različiti udžbenici). Pretpostavimo da se IQ mjeri na kraju semestra, nakon skoro godinu dana podučavanja dvije grupe studenata koristeći dva različita udžbenika. Iako su učenici raspoređeni u grupe nasumično, moguće je da su razlike u udžbenicima toliko velike da će i IQ i matematičke vještine uvelike varirati između grupa. U ovom slučaju, kovarijate ne samo da smanjuju varijansu greške već i varijansu između grupa. Drugim riječima, nakon kontrole razlika u IQ-u među grupama, razlike u matematičkim vještinama više nisu značajne. Možete reći drugačije. Nakon „isključivanja“ uticaja IQ-a, nenamerno se isključuje uticaj udžbenika na razvoj matematičkih veština.

Prilagođeni prosjeci. Kada kovarijanta utiče na faktor između subjekata, treba izračunati prilagođena sredstva, tj. ona sredstva koja se dobiju nakon uklanjanja svih kovarijatnih procjena.

Interakcije između kovarijati i faktora. Baš kao što se ispituju interakcije između faktora, mogu se ispitati interakcije između kovarijata i između grupa faktora. Recimo da je jedan od udžbenika posebno pogodan za pametne učenike. Drugi udžbenik je dosadan za pametne učenike, a isti udžbenik je težak za manje pametne učenike. Kao rezultat, postoji pozitivna korelacija između IQ-a i ishoda učenja u prvoj grupi (pametniji učenici, bolji rezultati) i nula ili neznatna negativna korelacija u drugoj grupi (što je učenik pametniji, manja je vjerovatnoća da će steći matematičke vještine iz drugog udžbenika). Neke studije razmatraju ovu situaciju kao primjer kršenja pretpostavki kovarijansne analize. Međutim, budući da ANOVA modul koristi najčešće metode analize kovarijanse, moguće je, posebno, procijeniti statističku značajnost interakcije između faktora i kovarijanti.

Varijabilne kovarijate

Dok se fiksne kovarijate dosta često govore u udžbenicima, varijabilne kovarijate se pominju mnogo rjeđe. Obično, kada provodimo eksperimente s ponovljenim mjerenjima, zanimaju nas razlike u mjerenjima istih veličina u različitim vremenskim trenucima. Naime, zanima nas značaj ovih razlika. Ako se kovarijate mjere istovremeno s mjerenjima zavisnih varijabli, može se izračunati korelacija između kovarijate i zavisne varijable.

Na primjer, interes za matematiku i matematičke vještine mogu se istražiti na početku i na kraju semestra. Bilo bi zanimljivo provjeriti da li su promjene u interesu za matematiku u korelaciji sa promjenama u matematičkim vještinama.

Modul Analiza varijanse V STATISTICA automatski procjenjuje statističku značajnost promjena u kovarijati u dizajnu gdje je to moguće.

Multivarijantni dizajn: multivarijantna analiza varijanse i kovarijanse

Međugrupni planovi

Svi prethodno razmotreni primjeri uključivali su samo jednu zavisnu varijablu. Kada postoji više zavisnih varijabli u isto vrijeme, samo se povećava složenost proračuna, ali se sadržaj i osnovni principi ne mijenjaju.

Na primjer, studija se izvodi na dva različita udžbenika. Istovremeno se proučava uspjeh učenika u izučavanju fizike i matematike. U ovom slučaju postoje dvije zavisne varijable i potrebno je otkriti kako dva različita udžbenika utječu na njih istovremeno. Da biste to učinili, možete koristiti multivarijantnu analizu varijanse (MANOVA). Umjesto jednodimenzionalnog F kriterij, koristi se višedimenzionalno F test (Wilksov l test), zasnovan na poređenju matrice kovarijanse greške i matrice kovarijanse među grupama.

Ako su zavisne varijable međusobno povezane, onda ovu korelaciju treba uzeti u obzir prilikom izračunavanja kriterija značajnosti. Očigledno, ako se isto mjerenje ponovi dva puta, onda se ne može dobiti ništa novo. Ako se mjerenje koje je povezano s njim doda postojećem mjerenju, onda neka nove informacije, ali nova varijabla sadrži suvišne informacije, što se ogleda u kovarijansi između varijabli.

Interpretacija rezultata. Ako je ukupni multivarijantni test značajan, možemo zaključiti da je odgovarajući efekat (npr. tip udžbenika) značajan. Međutim, postavljaju se sljedeća pitanja. Da li tip udžbenika utiče na poboljšanja samo matematičkih vještina, samo fizičkih vještina ili obje vještine? U stvari, nakon dobijanja značajnog multivarijantnog testa, univarijantni test se ispituje za pojedinačni glavni efekat ili interakciju. F kriterijum. Drugim riječima, zavisne varijable koje doprinose značajnosti multivarijatnog testa se ispituju zasebno.

Dizajni ponovljenih mjera

Ako se na početku semestra i na kraju semestra mjere matematičke i fizičke vještine, onda su to ponovljene mjere. Proučavanje kriterijuma značaja u ovakvim planovima je logičan razvoj jednodimenzionalni slučaj. Imajte na umu da se multivarijantna analiza tehnika varijanse takođe obično koristi za ispitivanje značaja faktora univarijantnih ponovljenih mjera koji imaju više od dva nivoa. Odgovarajuće aplikacije će biti razmatrane kasnije u ovom dijelu.

Sumiranje vrijednosti varijabli i multivarijantna analiza varijanse

Čak i iskusnim korisnicima univarijantne i multivarijantne analize varijanse često je teško dobiti različite rezultate kada primjenjuju multivarijantnu analizu varijanse, na primjer, na tri varijable, a kada primjenjuju univarijantnu analizu varijanse na zbir ove tri varijable, kao da bile jedna varijabla.

Ideja sumiranje varijabla je da svaka varijabla sadrži neku istinitu varijablu, koja se proučava, kao i slučajnu grešku mjerenja. Stoga, kada se prosječuju vrijednosti varijabli, greška mjerenja će biti bliža 0 za sva mjerenja i prosječne vrijednosti će biti pouzdanije. U stvari, u ovom slučaju, primjena ANOVA na zbir varijabli je razumna i jeste moćna metoda. Međutim, ako su zavisne varijable višedimenzionalne prirode, zbrajanje vrijednosti varijabli je neprikladno.

Na primjer, neka se zavisne varijable sastoje od četiri indikatora uspjeh u društvu. Svaki pokazatelj karakterizira potpuno nezavisan aspekt ljudske aktivnosti (na primjer, profesionalni uspjeh, uspjeh u poslu, porodično blagostanje, itd.). Dodavanje ovih varijabli je kao dodavanje jabuka i narandži. Zbir ovih varijabli ne bi bio odgovarajuća jednodimenzionalna mjera. Stoga se takvi podaci moraju tretirati kao višedimenzionalni indikatori u multivarijantna analiza varijanse.

Kontrastna analiza i post hoc testovi

Zašto se upoređuju odvojeni skupovi prosjeka?

Tipično, hipoteze o eksperimentalnim podacima nisu formulisane samo u smislu glavnih efekata ili interakcija. Primjer bi bila ova hipoteza: određeni udžbenik poboljšava matematičke vještine samo kod učenika, dok je drugi udžbenik približno podjednako efikasan za oba spola, ali je još manje efikasan za muškarce. Može se predvidjeti da je efikasnost udžbenika u interakciji sa polom učenika. Međutim, važi i ova prognoza priroda interakcije. Očekuje se značajna razlika između polova za učenike koji koriste jednu knjigu i praktično nezavisni rezultati prema polu za učenike koji koriste drugu knjigu. Ova vrsta hipoteze se obično ispituje upotrebom kontrastne analize.

Analiza kontrasta

Ukratko, kontrastna analiza omogućava da se proceni statistička značajnost određenih linearnih kombinacija složenih efekata. Kontrastna analiza je glavni i obavezni element svakog kompleksnog ANOVA plana. Modul Analiza varijanse ima dosta različitih mogućnosti analize kontrasta koje vam omogućavaju da izolujete i analizirate bilo koju vrstu poređenja sredstava.

A posteriori poređenja

Ponekad se, kao rezultat obrade eksperimenta, otkrije neočekivani efekat. Iako će u većini slučajeva kreativni istraživač biti u stanju da objasni bilo koji rezultat, to ne dozvoljava dalju analizu i procjene za predviđanje. Ovaj problem je jedan od onih zbog kojih a posteriori kriterijumi, odnosno kriterijumi koji se ne koriste a priori hipoteze. Za ilustraciju, razmotrite sljedeći eksperiment. Pretpostavimo da postoji 100 kartica koje sadrže brojeve od 1 do 10. Stavljajući sve ove kartice u šešir, nasumično biramo 5 kartica 20 puta i izračunavamo prosječnu vrijednost (prosjek brojeva napisanih na karticama) za svaki uzorak. Možete li očekivati ​​da će postojati dva uzorka čija se sredina značajno razlikuju? Ovo je vrlo uvjerljivo! Odabirom dva uzorka s maksimalnom i minimalnom srednjom vrijednosti, možete dobiti razliku u srednjim vrijednostima koja se jako razlikuje od razlike u srednjim vrijednostima, na primjer, prva dva uzorka. Ova razlika se može istražiti, na primjer, upotrebom kontrastne analize. Ne ulazeći u detalje, postoji nekoliko tzv a posteriori kriterijumi koji se zasnivaju upravo na prvom scenariju (uzimanje ekstremnih srednjih vrednosti od 20 uzoraka), odnosno ovi kriterijumi se zasnivaju na odabiru najrazličitijih sredstava za poređenje svih sredstava u dizajnu. Ovi kriterijumi se koriste kako bi se osiguralo da se veštački efekat ne dobije čisto slučajno, na primer, da bi se otkrila značajna razlika između sredstava kada ih nema. Modul Analiza varijanse nudi širok spektar takvih kriterijuma. Kada se naiđu neočekivani rezultati u eksperimentu koji uključuje nekoliko grupa, onda a posteriori procedure za ispitivanje statističke značajnosti dobijenih rezultata.

Zbir kvadrata tipa I, II, III i IV

Multivarijantna regresija i analiza varijanse

Postoji bliska veza između metode multivarijantne regresije i analize varijanse (analize varijanse). U obje metode proučava se linearni model. Ukratko, gotovo svi eksperimentalni dizajni mogu se ispitati korištenjem multivarijantne regresije. Razmislite o sljedećem jednostavnom dizajnu međugrupa 2 x 2.

D.V. A B AxB
3 1 1 1
4 1 1 1
4 1 -1 -1
5 1 -1 -1
6 -1 1 -1
6 -1 1 -1
3 -1 -1 1
2 -1 -1 1

Kolone A i B sadrže kodove koji karakterišu nivoe faktora A i B, kolona AxB sadrži proizvod dva stupca A i B. Ove podatke možemo analizirati koristeći multivarijantnu regresiju. Varijabilna D.V. definirana kao zavisna varijabla, varijable iz A prije AxB kao nezavisne varijable. Proučavanje značaja za koeficijente regresije će se poklopiti sa proračunima u analizi varijanse značajnosti glavnih efekata faktora A I B i efekat interakcije AxB.

Neuravnoteženi i izbalansirani planovi

Prilikom izračunavanja matrice korelacije za sve varijable, kao što su podaci prikazani iznad, primijetit ćete da su glavni efekti faktora A I B i efekat interakcije AxB nekorelirano. Ovo svojstvo efekata naziva se i ortogonalnost. Kažu efekti A I B - ortogonalno ili nezavisni jedno od drugog. Ako su svi efekti u planu ortogonalni jedan prema drugom, kao u gornjem primjeru, tada se kaže da je plan uravnotežen.

Izbalansirani planovi imaju “ dobra nekretnina" Izračuni za analizu takvih planova su vrlo jednostavni. Svi proračuni se svode na izračunavanje korelacije između efekata i zavisnih varijabli. Pošto su efekti ortogonalni, parcijalne korelacije (kao i potpune multidimenzionalni regresije) se ne računaju. Međutim, u pravi zivot planovi nisu uvek izbalansirani.

Razmotrimo stvarne podatke sa nejednakim brojem zapažanja u ćelijama.

Faktor A Faktor B
B1 B2
A1 3 4, 5
A2 6, 6, 7 2

Ako ove podatke kodiramo kao gore i izračunamo matricu korelacije za sve varijable, otkrićemo da su projektni faktori međusobno povezani. Faktori u planu više nisu ortogonalni i takvi planovi se nazivaju neuravnotežen. Imajte na umu da je u primjeru koji razmatramo korelacija između faktora u potpunosti posljedica razlike u frekvencijama od 1 i -1 u stupcima matrice podataka. Drugim riječima, eksperimentalni dizajn s nejednakim volumenom ćelija (tačnije, nesrazmjernim volumenima) će biti neuravnotežen, što znači da će glavni efekti i interakcije biti zbunjeni. U ovom slučaju, puna multivarijantna regresija mora se izračunati da bi se izračunala statistička značajnost efekata. Ovdje postoji nekoliko strategija.

Zbir kvadrata tipa I, II, III i IV

Zbroj kvadrata tipaIIIII. Da bi se ispitao značaj svakog faktora u multivarijantnom modelu, može se izračunati parcijalna korelacija svakog faktora, pod uslovom da su svi ostali faktori već uzeti u obzir u modelu. Također možete unijeti faktore u model na način korak po korak, hvatajući sve faktore koji su već uneseni u model i zanemarujući sve ostale faktore. Općenito, ovo je razlika između tip III I tipI zbir kvadrata (ova terminologija je uvedena u SAS, vidi, na primjer, SAS, 1982; detaljna rasprava se također može naći u Searle, 1987, str. 461; Woodward, Bonett i Brecht, 1990, str. 216; ili Milliken i Johnson, 1984, str. 138).

Zbroj kvadrata tipaII. Sljedeća „srednja“ strategija formiranja modela sastoji se od: kontrole svih glavnih efekata kada se ispituje značaj jednog glavnog efekta; u kontroli svih glavnih efekata i svih interakcija u paru kada se ispituje značaj pojedinačne interakcije u paru; u kontroli svih glavnih efekata svih interakcija u paru i svih interakcija tri faktora; kada se proučava individualna interakcija tri faktora, itd. Zove se zbroji kvadrata za efekte izračunate na ovaj način tipII zbir kvadrata. dakle, tipII zbir kvadrata kontroliše sve efekte istog i nižeg reda, zanemarujući sve efekte višeg reda.

Zbroj kvadrata tipaIV. Konačno, za neke posebne planove u kojima nedostaju ćelije (nepotpuni planovi) moguće je izračunati tzv. tip IV zbir kvadrata. Ova metoda će biti razmotrena kasnije u vezi sa nekompletnim dizajnom (dizajni sa nedostajućim ćelijama).

Interpretacija hipoteze zbira kvadrata tipa I, II i III

Zbir kvadrata tipIII najlakše protumačiti. Podsjetimo da su zbroji kvadrata tipIII ispitati efekte nakon kontrole svih ostalih efekata. Na primjer, nakon pronalaska statistički značajnog tipIII efekat za faktor A u modulu Analiza varijanse, možemo reći da postoji samo jedan značajan efekat faktora A, nakon što uvedemo sve ostale efekte (faktore) i shodno tome protumačimo ovaj efekat. U vjerovatno 99% svih ANOVA aplikacija, ovo je tip testa za koji je istraživač zainteresiran. Ova vrsta zbira kvadrata se obično izračunava po modulu Analiza varijanse podrazumevano, bez obzira da li je opcija izabrana Regresijski pristup ili ne (standardni pristupi usvojeni u modulu Analiza varijanse diskutovano u nastavku).

Značajni efekti dobiveni korištenjem zbira kvadrata tip ili tipII sume kvadrata nije tako lako protumačiti. Oni se najbolje tumače u kontekstu postupne multivarijantne regresije. Ako, kada se koristi zbir kvadrata tipI glavni efekat faktora B je bio značajan (nakon što je faktor A uključen u model, ali pre nego što je dodata interakcija između A i B), možemo zaključiti da postoji značajan glavni efekat faktora B, pod uslovom da nema interakcije između faktora A i B. (Ako koristite kriterijum tipIII, faktor B se takođe pokazao značajnim, onda možemo zaključiti da postoji značajan glavni efekat faktora B, nakon uvođenja svih ostalih faktora i njihovih interakcija u model).

U smislu hipoteze marginalnih sredstava tipI I tipII obično nemaju jednostavnu interpretaciju. U tim slučajevima se kaže da se značaj efekata ne može tumačiti gledajući samo na marginalna sredstva. Radije predstavljeno str sredstva su povezana sa složenom hipotezom koja kombinuje srednje vrednosti i veličinu uzorka. Na primjer, tipII hipoteze za faktor A u jednostavnom primjeru dizajna 2 x 2 o kojem smo ranije govorili bi bile (vidi Woodward, Bonett i Brecht, 1990, str. 219):

nij- broj posmatranja u ćeliji

uij- prosječna vrijednost u ćeliji

n. j- granični prosjek

Ne ulazeći previše u detalje (za više detalja vidjeti Milliken i Johnson, 1984, Poglavlje 10), jasno je da ovo nisu jednostavne hipoteze i da u većini slučajeva nijedna od njih nije od posebnog interesa za istraživača. Međutim, postoje slučajevi kada hipoteze tipI može biti zanimljivo.

Zadani računski pristup u modulu Analiza varijanse

Podrazumevano ako opcija nije označena Regresijski pristup, modul Analiza varijanse koristi prosječni model ćelije. Ovaj model karakterizira činjenica da su zbroji kvadrata za različiti efekti izračunavaju se za linearne kombinacije srednjih vrijednosti ćelija. U punom faktorijalnom eksperimentu, ovo rezultira zbirom kvadrata koji je isti kao zbir kvadrata o kojem se ranije raspravljalo kao tip III. Međutim, u opciji Planirana poređenja(u prozoru Rezultati ANOVA), korisnik može testirati hipotezu u odnosu na bilo koju linearnu kombinaciju ponderiranih ili neponderiranih srednjih vrijednosti ćelije. Dakle, korisnik može testirati ne samo hipoteze tipIII, ali hipoteze bilo koje vrste (uključujući tipIV). Ovo opšti pristup posebno korisno kada se ispituju planovi sa nedostajućim ćelijama (koji se nazivaju nepotpuni planovi).

Za potpune faktorijalne dizajne, ovaj pristup je također koristan kada se želi analizirati ponderisana marginalna sredina. Na primjer, pretpostavimo da u jednostavnom dizajnu 2 x 2 razmatranom ranije, moramo uporediti ponderisane (prema nivoima faktora B) marginalna sredina za faktor A. Ovo je korisno kada eksperimentator nije pripremio distribuciju zapažanja po ćelijama, već je konstruisana nasumično, a ta slučajnost se odražava u distribuciji broja posmatranja na nivoima faktora B u agregat.

Na primjer, postoji faktor - starost udovice. Mogući uzorak ispitanika podijeljen je u dvije grupe: ispod 40 godina i preko 40 godina (faktor B). Drugi faktor (faktor A) u planu je bio da li su udovice dobile socijalnu podršku od neke agencije (neke su udovice odabrane nasumično, druge su služile kao kontrola). U ovom slučaju, distribucija udovica prema starosti u uzorku odražava stvarnu distribuciju udovica prema starosti u populaciji. Grupna procena efektivnosti socijalna podrška widows by svih uzrastaće odgovarati ponderisanom prosjeku ova dva starosne grupe(sa ponderima koji odgovaraju broju zapažanja u grupi).

Planirana poređenja

Imajte na umu da zbir unesenih koeficijenata kontrasta nije nužno jednak 0 (nula). Umjesto toga, program će automatski izvršiti prilagođavanja kako bi osigurao da se odgovarajuće hipoteze ne pomiješaju sa ukupnim prosjekom.

Da bismo to ilustrirali, vratimo se jednostavnom planu 2 x 2 o kojem smo ranije govorili. Podsjetimo da su brojevi opservacija u ćelijama ovog neuravnoteženog dizajna -1, 2, 3 i 1. Pretpostavimo da želimo da uporedimo ponderisane marginalne sredine za faktor A (ponderisane učestalošću nivoa faktora B). Možete unijeti koeficijente kontrasta:

Imajte na umu da se ovi koeficijenti ne zbrajaju do 0. Program će postaviti koeficijente tako da su zbir 0, a njihove relativne vrijednosti će biti sačuvane, tj.:

1/3 2/3 -3/4 -1/4

Ovi kontrasti će uporediti ponderisane sredine za faktor A.

Hipoteze o glavnom prosjeku. Hipoteza da je neponderisana glavna srednja vrednost 0 može se istražiti korišćenjem koeficijenata:

Hipoteza da je ponderisana glavna srednja vrijednost 0 testira se korištenjem:

Program ni u kom slučaju ne prilagođava omjere kontrasta.

Analiza planova sa nedostajućim ćelijama (nepotpuni planovi)

Faktorski dizajni koji sadrže prazne ćelije (obrade kombinacije ćelija koje nemaju zapažanja) nazivaju se nepotpunim. U takvim projektima neki faktori obično nisu ortogonalni i neke interakcije se ne mogu izračunati. Uopšte ne postoji najbolja metoda analiza takvih planova.

Regresijski pristup

U nekim starijim programima koji se oslanjaju na analizu ANOVA dizajna koristeći multivarijantnu regresiju, faktori u nekompletnom dizajnu su specificirani kao i obično (kao da je dizajn potpun). Zatim multidimenzionalno regresiona analiza za ove lažno kodirane faktore. Nažalost, ova metoda daje rezultate koje je vrlo teško, ako ne i nemoguće, protumačiti jer je nejasno kako svaki efekat doprinosi linearnoj kombinaciji sredstava. Razmotrite sljedeći jednostavan primjer.

Faktor A Faktor B
B1 B2
A1 3 4, 5
A2 6, 6, 7 Promašen

Ako izvršimo multivarijantnu regresiju oblika Zavisna varijabla = konstanta + faktor A + faktor B, tada hipoteza o značaju faktora A i B u smislu linearnih kombinacija srednjih izgleda ovako:

Faktor A: Ćelija A1,B1 = Ćelija A2,B1

Faktor B: Ćelija A1,B1 = Ćelija A1,B2

Ovaj slučaj je jednostavan. U složenijim projektima nemoguće je zapravo odrediti šta će se tačno ispitivati.

Ćelija znači, ANOVA pristup , Hipoteze tipa IV

Pristup koji se preporučuje u literaturi i koji se čini poželjnijim je proučavanje smisleno (u smislu istraživačkih pitanja) a priori hipoteze o uočenim sredstvima u ćelijama plana. Detaljna rasprava o ovom pristupu može se naći u Dodge (1985), Heiberger (1989), Milliken i Johnson (1984), Searle (1987) ili Woodward, Bonett i Brecht (1990). Zbroji kvadrata povezani s hipotezama o linearnoj kombinaciji srednjih vrijednosti u nekompletnim projektima koji ispituju procjene dijela efekata također se nazivaju sumi kvadrata IV.

Automatsko generiranje hipoteza tipaIV. Kada multivarijantni dizajn ima složene obrasce ćelija koje nedostaju, poželjno je definirati ortogonalne (nezavisne) hipoteze čije je istraživanje ekvivalentno ispitivanju glavnih efekata ili interakcija. Algoritamske (računarske) strategije (zasnovane na pseudo-inverznoj matrici dizajna) su razvijene za generiranje odgovarajuće vage za takva poređenja. Nažalost, konačne hipoteze nisu definisane na jedinstven način. Naravno, oni zavise od redosleda u kome su efekti identifikovani i retko dozvoljavaju jednostavnu interpretaciju. Stoga se preporučuje pažljivo proučavanje prirode ćelija koje nedostaju, a zatim formuliranje hipoteza tipIV, koji najsmislenije odgovaraju ciljevima studije. Zatim istražite ove hipoteze koristeći opciju Planirana poređenja u prozoru rezultate. Najlakši način da se specificiraju poređenja u ovom slučaju je da se zahtijeva uvođenje vektora kontrasta za sve faktore zajedno u prozoru Planirana poređenja. Nakon poziva dijalog box-a Planirana poređenja sve grupe će biti prikazane trenutni plan a oni koji su propušteni su označeni.

Nedostajuće ćelije i testiranje specifičnog efekta

Postoji nekoliko tipova dizajna u kojima lokacija ćelija koje nedostaju nije nasumična, već je pažljivo planirana, omogućavajući jednostavnu analizu glavnih efekata bez uticaja na druge efekte. Na primjer, kada potreban broj ćelija u planu nije dostupan, planovi se često koriste Latinski kvadrati procijeniti glavne efekte nekoliko faktora sa velikim brojem nivoa. Na primjer, faktorski dizajn 4 x 4 x 4 x 4 zahtijeva 256 ćelija. Istovremeno možete koristiti Grčko-latinski trg za procjenu glavnih efekata sa samo 16 ćelija u dizajnu (pogl Planiranje eksperimenta, tom IV, sadrži detaljan opis takvih planova). Nepotpuni dizajni u kojima se glavni efekti (i neke interakcije) mogu procijeniti korištenjem jednostavnih linearnih kombinacija sredstava nazivaju se izbalansirani nedovršeni planovi.

U balansiranim dizajnima, standardna (podrazumevana) metoda generisanja kontrasta (težina) za glavne efekte i interakcije će zatim proizvesti tabelu analize varijanse u kojoj se zbroji kvadrata za odgovarajuće efekte ne mešaju jedan s drugim. Opcija Specifični efekti prozor rezultateće generirati kontraste koji nedostaju upisivanjem nule u ćelije plana koje nedostaju. Odmah nakon traženja opcije Specifični efekti za korisnika koji ispituje neku hipotezu, pojavljuje se tabela rezultata sa stvarnim težinama. Imajte na umu da se u balansiranom dizajnu zbroji kvadrata odgovarajućih efekata izračunavaju samo ako su ti efekti ortogonalni (nezavisni) u odnosu na sve druge glavne efekte i interakcije. U suprotnom, morate koristiti opciju Planirana poređenja istražiti smislena poređenja između sredstava.

Nedostajuće ćelije i objedinjeni efekti/termini greške

Ako opcija Regresijski pristup na početnoj ploči modula Analiza varijanse nije odabran, model prosječne ćelije će se koristiti prilikom izračunavanja zbira kvadrata za efekte (podrazumevana postavka). Ako dizajn nije uravnotežen, onda kada se kombiniraju neortogonalni efekti (vidi gornju raspravu o opciji Propuštene ćelije i specifičan efekat) može se dobiti zbir kvadrata koji se sastoji od neortogonalnih (ili preklapajućih) komponenti. Dobijeni rezultati se obično ne mogu interpretirati. Stoga treba biti vrlo oprezan pri odabiru i implementaciji složenih nekompletnih eksperimentalnih dizajna.

Postoji mnogo knjiga sa detaljnim raspravama o planovima različite vrste. (Dodge, 1985; Heiberger, 1989; Lindman, 1974; Milliken i Johnson, 1984; Searle, 1987; Woodward i Bonett, 1990), ali ova vrsta informacija je izvan okvira ovog udžbenika. Međutim, analiza će biti prikazana kasnije u ovom dijelu. razne vrste planove.

Pretpostavke i efekti kršenja pretpostavki

Odstupanje od pretpostavke normalnih distribucija

Pretpostavimo da se zavisna varijabla mjeri na numeričkoj skali. Pretpostavimo i da je zavisna varijabla normalno raspoređena unutar svake grupe. Analiza varijanse sadrži širok spektar grafikona i statističkih podataka koji podržavaju ovu pretpostavku.

Efekti poremećaja. Uopšte F kriterijum je veoma otporan na odstupanja od normalnosti ( detaljni rezultati vidi Lindman, 1974). Ako je eksces veći od 0, tada je vrijednost statistike F može postati vrlo mala. Nulta hipoteza je prihvaćena, iako možda nije tačna. Situacija je obrnuta kada je kurtozis manji od 0. Iskrivljenost distribucije obično ima mali uticaj na F statistika. Ako je broj opažanja u ćeliji dovoljno velik, onda odstupanje od normalnosti nije posebno značajno zbog centralna granična teorema, prema kojoj je distribucija prosječne vrijednosti blizu normalne, bez obzira na početnu raspodjelu. Detaljna diskusija o održivosti F statistike se mogu naći u Box i Anderson (1955) ili Lindman (1974).

Ujednačenost varijanse

Pretpostavke. Pretpostavlja se da su varijanse različitih grupa dizajna iste. Ova pretpostavka se zove pretpostavka homogenost varijanse. Podsjetimo da smo na početku ovog odjeljka, kada smo opisivali izračunavanje zbira kvadrata grešaka, izvršili sumiranje unutar svake grupe. Ako se varijanse u dvije grupe razlikuju jedna od druge, onda njihovo zbrajanje nije baš prirodno i ne daje procjenu ukupne varijanse unutar grupe (pošto u ovom slučaju uopće nema ukupne varijanse). Modul Analiza varijanse -ANOVA/MANOVA sadrži veliki set statistički kriterijumi otkrivanje odstupanja od homogenosti pretpostavki varijanse.

Efekti poremećaja. Lindman (1974, str. 33) to pokazuje F kriterijum je prilično stabilan u pogledu kršenja pretpostavki homogenosti varijanse ( heterogenost varijansa, vidi i Box, 1954a, 1954b; Hsu, 1938).

Poseban slučaj: korelacija srednjih vrijednosti i varijansi. Ima trenutaka kada F statistika može obmanuti. Ovo se dešava kada su sredstva projektovanih ćelija u korelaciji sa varijansom. Modul Analiza varijanse omogućava vam da napravite dijagrame disperzije ili standardna devijacija u odnosu na prosjeke za otkrivanje takve korelacije. Razlog zašto je ova korelacija opasna je sljedeći. Zamislimo da je na planu 8 ćelija, od kojih 7 ima skoro isti prosjek, a u jednoj ćeliji je prosjek mnogo veći od ostalih. Onda F test može otkriti statistički značajan efekat. Ali pretpostavimo da je u ćeliji sa velikom prosječnom vrijednošću varijansa znatno veća od ostalih, tj. prosječna vrijednost i varijansa u ćelijama su zavisne (što je veći prosjek, veća je varijansa). U ovom slučaju, veliki prosjek je nepouzdan jer može biti uzrokovan velikom varijacijom u podacima. kako god F statistike zasnovane na ujedinjeni varijansa unutar ćelija će obuhvatiti veliku srednju vrijednost, iako testovi zasnovani na varijansi unutar svake ćelije neće smatrati da su sve razlike u srednjim vrijednostima značajne.

Ova vrsta podataka (velika srednja vrijednost i velika varijansa) se često javlja kada postoje izvanredne opservacije. Jedno ili dva vanjska opažanja uvelike pomjeraju srednju vrijednost i uvelike povećavaju varijansu.

Homogenost varijanse i kovarijanse

Pretpostavke. Multivarijantni dizajn sa multivarijantnim zavisnim mjerama također primjenjuje pretpostavku homogenosti varijanse opisanu ranije. Međutim, budući da postoje multivarijantne zavisne varijable, potrebno je i da njihove međukorelacije (kovarijance) budu ujednačene u svim ćelijama dizajna. Modul Analiza varijanse nudi različite načine testiranja ovih pretpostavki.

Efekti poremećaja. Multidimenzionalni analog F- kriterij - Wilksov λ-test. Ne zna se mnogo o robusnosti Wilksovog λ testa s obzirom na kršenje gornjih pretpostavki. Međutim, budući da je interpretacija rezultata modula Analiza varijanse se obično zasniva na značajnosti univarijantnih efekata (nakon utvrđivanja značaja opšteg kriterijuma), rasprava o robusnosti se uglavnom odnosi na univarijantnu analizu varijanse. Stoga, značaj univarijantnih efekata treba pažljivo ispitati.

Poseban slučaj: analiza kovarijanse. Naročito teška kršenja homogenosti varijanse/kovarijance mogu nastati kada su kovarijate uključene u dizajn. Konkretno, ako se korelacija između kovarijati i zavisnih mjera razlikuje po ćelijama u dizajnu, može doći do pogrešnog tumačenja rezultata. Zapamtite da analiza kovarijanse u suštini izvodi regresijsku analizu unutar svake ćelije kako bi se izolirao onaj dio varijanse koji je obuhvaćen kovarijantom. Homogenost pretpostavke varijanse/kovarijance sugerira da se ova regresiona analiza provodi na sljedeće ograničenje: Sve regresijske jednačine(nagibi) su isti za sve ćelije. Ako se to ne očekuje, može se pojaviti velike greške. Modul Analiza varijanse ima nekoliko posebnih kriterijuma za testiranje ove pretpostavke. Preporučljivo je koristiti ove kriterije kako bi se osiguralo da su jednadžbe regresije za različite ćelije približno iste.

Sferičnost i kompleksna simetrija: razlozi za korištenje multivarijantnog pristupa ponovljenim mjerama u analizi varijanse

U dizajnu koji sadrži faktore ponovljenih mjerenja sa više od dva nivoa, upotreba univarijantne ANOVA zahtijeva dodatne pretpostavke: pretpostavku složene simetrije i pretpostavku sferičnosti. Ove pretpostavke se rijetko ispunjavaju (vidi dolje). Stoga, u poslednjih godina multivarijantna analiza varijanse je stekla popularnost u takvim dizajnima (oba pristupa su kombinovana u modulu Analiza varijanse).

Pretpostavka kompleksne simetrije Pretpostavka složene simetrije je da su varijanse (dijeljene unutar grupa) i kovarijanse (dijeljene unutar grupa) za različite ponovljene mjere homogene (iste). Ovo je dovoljan uslov da bi univarijantni F test za ponovljene mjere bio validan (tj. prijavljene F vrijednosti su u prosjeku konzistentne sa F distribucijom). Međutim, u ovom slučaju ovaj uslov nije neophodan.

Pretpostavka sferičnosti. Pretpostavka sferičnosti je neophodan i dovoljan uslov da bi F-test bio validan. Sastoji se u tome da su unutar grupa sva opažanja nezavisna i ravnomjerno raspoređena. Priroda ovih pretpostavki i uticaj njihovog kršenja obično nisu dobro opisani u knjigama o ANOVA-i - to će biti objašnjeno u sljedećim paragrafima. Također će se pokazati da se rezultati univarijatnog pristupa mogu razlikovati od rezultata multivarijatnog pristupa, te će biti objašnjeno što to znači.

Potreba za nezavisnošću hipoteza. Opšti način analize podataka u ANOVA je uklapanje modela. Ako, u odnosu na model koji odgovara podacima, postoje neki a priori hipoteze, onda se varijansa dijeli kako bi se testirale ove hipoteze (kriterijumi za glavne efekte, interakcije). Sa računske tačke gledišta, ovaj pristup generiše skup kontrasta (skup poređenja planskih sredstava). Međutim, ako kontrasti nisu nezavisni jedan od drugog, podjela varijansi postaje besmislena. Na primjer, ako su dva kontrasta A I B su identične i odgovarajući dio varijanse se izdvaja, zatim se isti dio izdvaja dva puta. Na primjer, glupo je i besmisleno identificirati dvije hipoteze: “srednja vrijednost u ćeliji 1 je veća od prosjeka u ćeliji 2” i “srednja vrijednost u ćeliji 1 je veća od srednje vrijednosti u ćeliji 2”. Dakle, hipoteze moraju biti nezavisne ili ortogonalne.

Nezavisne hipoteze u ponovljenim mjerama. Opšti algoritam, implementiran u modulu Analiza varijanse, pokušaće da generiše nezavisne (ortogonalne) kontraste za svaki efekat. Za faktor ponovljenih mjerenja, ovi kontrasti daju mnoge hipoteze o razlike između nivoa faktora koji se razmatra. Međutim, ako su ove razlike u korelaciji unutar grupa, onda nastali kontrasti više nisu nezavisni. Na primjer, u nastavi gdje se studenti mjere tri puta u jednom semestru, može se desiti da je promjena između 1. i 2. mjerenja u negativnoj korelaciji sa promjenom između 2. i 3. mjerenja predmeta. Oni koji su savladali većinu gradiva između 1. i 2. dimenzije, savladavaju manji dio tokom vremena koje je prošlo između 2. i 3. dimenzije. Zapravo, za većinu slučajeva gdje se ANOVA koristi za ponovljene mjere, može se pretpostaviti da su promjene između nivoa povezane među subjektima. Međutim, kada se to dogodi, pretpostavka kompleksne simetrije i pretpostavka sferičnosti ne vrijede i nezavisni kontrasti se ne mogu izračunati.

Utjecaj kršenja i načini za njihovo ispravljanje. Kada pretpostavke složene simetrije ili sferičnosti ne vrijede, ANOVA može proizvesti pogrešni rezultati. Prije nego što su multivarijantne procedure dovoljno razvijene, predloženo je nekoliko pretpostavki za kompenzaciju kršenja ovih pretpostavki. (Vidi, na primjer, Greenhouse & Geisser, 1959. i Huynh & Feldt, 1970.). Ove metode su još uvijek u širokoj primjeni (zbog čega su predstavljene u modulu Analiza varijanse).

Multivarijantna analiza varijansnog pristupa ponovljenim mjerama. Generalno, problemi kompleksne simetrije i sferičnosti odnose se na činjenicu da skupovi kontrasta uključeni u proučavanje efekata faktora ponovljenih mjerenja (sa više od 2 nivoa) nisu nezavisni jedan od drugog. Međutim, ne moraju biti neovisni ako se koriste multidimenzionalni kriterijum za istovremenu verifikaciju statistički značaj dva ili više ponovljenih mjera faktora kontrasta. To je razlog zašto se multivarijantna analiza tehnika varijanse sve više koristi za testiranje značajnosti faktora univarijantnih ponovljenih mjera sa više od 2 nivoa. Ovaj pristup je široko prihvaćen jer općenito ne zahtijeva složenu simetriju ili sferičnost.

Slučajevi u kojima se ne može koristiti multivarijantna analiza varijansnog pristupa. Postoje primjeri (projekti) u kojima se ne može primijeniti multivarijantna analiza varijansnog pristupa. To su tipični slučajevi kada postoji mali broj subjekata u dizajnu i mnogo nivoa u faktoru ponovljenih mjerenja. Tada može biti premalo zapažanja da bi se izvršila multivarijantna analiza. Na primjer, ako postoji 12 subjekata, str = 4 faktor ponovljenih mjerenja, a svaki faktor ima k = 3 nivoa. Tada će interakcija 4 faktora “potrošiti” (k-1)P = 2 4 = 16 stepena slobode. Međutim, postoji samo 12 subjekata, tako da se multivarijantni test ne može izvesti u ovom primjeru. Modul Analiza varijanseće nezavisno otkriti ova zapažanja i izračunati samo jednodimenzionalne kriterijume.

Razlike u univarijantnim i multivarijantnim rezultatima. Ako studija uključuje veliki broj ponovljenih mjera, mogu postojati slučajevi u kojima pristup ANOVA s univarijantnim ponovljenim mjerama daje rezultate koji se vrlo razlikuju od onih dobivenih multivarijantnim pristupom. To znači da su razlike između nivoa odgovarajućih ponovljenih mjera u korelaciji između subjekata. Ponekad je ova činjenica od nekog nezavisnog interesa.

Multivarijantna analiza varijanse i modeliranje strukturnih jednačina

Posljednjih godina, modeliranje strukturnih jednačina postalo je popularno kao alternativa multivarijantnoj analizi varijanse (vidi, na primjer, Bagozzi i Yi, 1989; Bagozzi, Yi i Singh, 1991; Cole, Maxwell, Arvey i Salas, 1993) . Ovaj pristup omogućava testiranje hipoteza ne samo o srednjim vrijednostima u različitim grupama, već io matricama korelacije zavisnih varijabli. Na primjer, moglo bi se ublažiti pretpostavke o homogenosti varijansi i kovarijansi i eksplicitno uključiti varijanse greške i kovarijanse u model za svaku grupu. Modul STATISTICAModeliranje strukturne jednačine (SEPATH) (vidi Tom III) dozvoljava takvu analizu.

Opće definicije

Svrha analize varijanse (ANOVA - Analysis of Variation) je da se testira značajnost razlike između srednjih vrednosti u različitim grupama upoređivanjem varijansi ovih grupa. Podjela ukupne varijanse na više izvora (koji se mogu pripisati različitim efektima dizajna) omogućava da se varijansa zbog varijacije između grupa uporedi sa varijansom zbog varijacije unutar grupe.

Hipoteza koja se testira je da nema razlike između grupa. Ako je nulta hipoteza tačna, procjena varijanse povezane s varijansom unutar grupe trebala bi biti bliska procjeni varijanse između grupe. Ako je netačno, značajno je odstupiti.

Općenito, analiza varijanse može se podijeliti u nekoliko tipova:

  • jednodimenzionalni (jedna zavisna varijabla) i višedimenzionalni (nekoliko zavisnih varijabli);

  • univarijantna (jedna varijabla grupisanja) i multifaktorska (nekoliko varijabli grupiranja) sa mogućom interakcijom između faktora;

  • sa jednostavnim merenjima (zavisna varijabla se meri samo jednom) i sa ponovljenim merenjima (zavisna varijabla se meri nekoliko puta).

IN STATISITICA Implementirani su svi poznati modeli analize varijanse.

IN STATISITICA analiza varijanse može se provesti korištenjem ANOVA modula u bloku STATISITICA Base (Analiza -> Analiza varijanse (DA)). Da biste napravili posebnu vrstu modela, koristite puna verzija Analiza varijanse, prikazana u modulima Opći linearni modeli, Generalizirani linearni i nelinearni modeli, Opći regresijski modeli, Opći modeli privatnih najmanjih kvadrata iz bloka Napredne tehnike analize (STATISTICA Napredni linearni/nelinearni modeli).

do početka

Korak po korak primjer u STATISTICA

Ilustrovaćemo moć ANOVE u STATISITICA, gledajući primjer modela korak po korak.

Izvorni fajl podataka opisuje populaciju ljudi sa različitim nivoima prihoda, obrazovanja, starosti i pola. Hajde da razmotrimo kako nivo obrazovanja, godine i pol utiču na nivo prihoda.

Po godinama, svi ljudi su podijeljeni u četiri grupe:

  • do 30 godina;

  • od 31 do 40 godina;

  • od 41 do 50 godina;

  • od 51 godine.

Prema stepenu obrazovanja, postojala je podjela u 5 grupa:

  • nepotpuna srednja;

  • prosjek;

  • srednje stručno obrazovanje;

  • nezavršeno visoko obrazovanje;

  • viši.

S obzirom da se radi o modelskim podacima, dobijeni rezultati će biti uglavnom kvalitativne prirode i ilustrirati način provođenja analize.

Korak 1: Odabir analize

Odaberimo analizu varijanse iz menija: Analiza -> Napredne metode analize -> Opći linearni modeli.

Rice. 1. Odabir ANOVA sa padajućeg menija STATISTICA

Zatim će se otvoriti prozor u kojem su predstavljene različite vrste analiza. Izaberi Vrsta analizeFaktorska analiza varijanse.


Rice. 2. Odabir vrste analize

U ovom prozoru također možete odabrati način izrade modela: način dijaloga ili korištenje čarobnjaka za analizu. Odaberimo način dijaloga.

Korak 2: Postavljanje varijabli

Iz otvorenog fajla podataka odaberite varijable za analizu, kliknite na dugme Varijable, uzimate:

Prihodi– zavisna varijabla,

Nivo obrazovanja, Kat I Dob– kategorijalni faktori (prediktori).

primeti, to Faktorski kodovi u ovom jednostavnom primjeru ne morate to specificirati. Kada pritisnete dugme uredu, STATISTICAće ih automatski postaviti.


Rice. 3. Postavljanje varijabli

Korak 3: Promjena opcija

Idemo na karticu Opcije u prozoru GLM Factorial DA.


Rice. 4. Options Tab

U ovom dijalogu možete:

  • odabrati slučajne faktore;

  • postaviti tip parametrizacije modela;

  • označite vrstu zbira kvadrata (SS), postoji 6 različitih zbira kvadrata (SS);

  • omogući unakrsnu provjeru.

Ostavimo sve zadane postavke (ovo je u većini slučajeva dovoljno) i pritisnite dugme uredu.

Korak 4. Analizirajte rezultate - pogledajte sve efekte

Rezultati analize se mogu pogledati u prozoru rezultate koristeći kartice i grupe dugmadi. Razmotrite, na primjer, karticu Rezultati.


Rice. 5. Prozor analize rezultata: kartica Rezultati

Sa ove kartice možete pristupiti svim glavnim rezultatima. Koristite druge kartice za više rezultata. Dugme Manje omogućava vam da izmijenite dijalog rezultata uklanjanjem kartica koje se obično ne koriste.

Kada se pritisne dugme Provjerite sve efekte dobijamo sledeću tabelu.


Rice. 6. Tabela svih efekata

Ova tabela prikazuje glavne rezultate analize: sume kvadrata, stepene slobode, vrednosti F-testa, nivoe značajnosti.

Za praktičnost proučavanja, značajni efekti (str<.05) выделены красным цветом. Два главных эффекта (Nivo obrazovanja I Dob) i neke interakcije u ovom primjeru su značajne (str<.05).

Korak 5. Analiza rezultata - pregled specificiranih efekata

Najbolji način da vidite kako se prosječni prihodi razlikuju po kategorijama je korištenje grafičkih alata. Kada pritisnete dugme Svi efekti/grafika Pojavit će se sljedeći dijaloški okvir.


Rice. 7. Prozor Tabela svih efekata

Prozor prikazuje sve efekte koji se razmatraju. Statistički značajni efekti su označeni *.

Na primjer, izaberimo efekat Dob, u grupi Display naznačimo Table i kliknite uredu. Pojavljuje se tabela koja prikazuje srednju vrijednost zavisne varijable za svaki nivo efekta. (prihod), standardna vrijednost greške i granice pouzdanosti.


Rice. 8. Tabela sa deskriptivnom statistikom po nivoima varijable Starost

Pogodno je ovu tabelu prikazati u grafičkom obliku. Za ovo biramo Raspored u grupi Display dijaloški okvir Table sve efekte i pritisnite uredu. Pojavit će se odgovarajući grafikon.


Rice. 9. Grafikon prosječne zarade u odnosu na godine

Grafikon jasno pokazuje da postoji razlika u visini prihoda između grupa ljudi različite dobi. Što je starost veća, to su prihodi veći.

Provešćemo slične operacije za interakciju nekoliko faktora. U dijaloškom okviru hajde da izaberemo Kat*Dob i kliknite uredu.


Rice. 10. Grafikon prosječnih primanja u zavisnosti od pola i starosti

Dobijen je neočekivan rezultat: za ispitane osobe mlađe od 50 godina, nivo prihoda raste sa godinama i ne zavisi od pola; Za ispitane osobe starije od 50 godina, žene imaju znatno više prihoda od muškaraca.

Vrijedi konstruirati rezultirajući graf u smislu obrazovnog nivoa. Možda je ovaj obrazac narušen u nekim kategorijama ili je, obrnuto, univerzalan. Za ovo biramo Nivo obrazovanja * Kat* Dob i kliknite uredu.


Rice. 11. Grafikon prosječnih primanja u zavisnosti od pola, starosti, nivoa obrazovanja

Vidimo da nastala zavisnost nije tipična za srednje i srednje stručno obrazovanje. U drugim slučajevima je pošteno.

Korak 6. Analiza rezultata – procjena kvaliteta modela

Gore su uglavnom korištena grafička sredstva analize varijanse. Pogledajmo neke druge korisne rezultate koji se mogu dobiti.

Prvo, zanimljivo je vidjeti koliki je dio varijanse objašnjen faktorima o kojima je riječ i njihovim interakcijama. Da biste to učinili, u kartici Rezultati kliknite na dugme Generalni R modeli. Pojavit će se sljedeća tabela.

Rice. 12. Tabela SS modela i SS reziduala

Broj u koloni Set. R2 – koeficijent višestruke korelacije na kvadrat; pokazuje koliki je udio varijabilnosti objašnjen konstruiranim modelom. U našem slučaju, R2 = 0,195, što ukazuje na nisku kvalitetu modela. Zapravo, na nivoe prihoda utiču ne samo faktori uključeni u model.

Korak 7. Analiza rezultata – kontrastna analiza

Često je potrebno ne samo utvrditi razliku u srednjoj vrijednosti zavisne varijable za različite kategorije, već i utvrditi veličinu razlike za date kategorije. Da biste to učinili, kontrasti se moraju istražiti.

Gore je pokazano da se nivo prihoda muškaraca i žena značajno razlikuje za uzrast iznad 51 godine, au ostalim slučajevima razlika nije značajna. Izvedemo razliku u nivoima prihoda za muškarce i žene starosti iznad 51 godine i između 40 i 50 godina.

Da biste to učinili, idite na karticu Kontrasti i postavite sve vrijednosti na sljedeći način.


Rice. 13. Kartica Kontrasti

Kada se pritisne dugme Izračunati Pojavit će se nekoliko tabela. Zanima nas tabela sa procjenama kontrasta.


Rice. 14. Tabela za procjenu kontrasta

Mogu se izvući sljedeći zaključci:

  • za muškarce i žene starije od 51 godine, razlika u prihodima iznosi 48,7 hiljada dolara.Razlika je značajna;

  • za muškarce i žene starosti od 41 do 50 godina, razlika u prihodima je 1,73 hiljade dolara.Razlika nije značajna.

Slično tome, možete postaviti složenije kontraste ili koristiti jedan od unaprijed definiranih skupova.

Korak 8: Dodatni rezultati

Koristeći preostale kartice prozora s rezultatima, možete dobiti sljedeće rezultate:

  • prosječne vrijednosti zavisne varijable za odabrani efekat – tab Prosjek;

  • provjera posteriori kriterija (post hoc) – tab A posteriori;

  • provjera pretpostavki napravljenih za ANOVA – tab Pretpostavke;

  • izgradnja profila odgovora/poželjnosti – tab Profili;

  • Analiza ostataka – tab Ostaci;

  • izlaz matrica korištenih u analizi – tab Matrice;

  • Korištenje statistike u ovoj bilješci će biti ilustrovano unakrsnim primjerom. Recimo da ste menadžer proizvodnje u kompaniji Perfect Parachute. Padobrani su napravljeni od sintetičkih vlakana koje isporučuju četiri različita dobavljača. Jedna od glavnih karakteristika padobrana je njegova snaga. Morate osigurati da sva isporučena vlakna budu iste čvrstoće. Da bi se odgovorilo na ovo pitanje, trebalo bi osmisliti eksperimentalni dizajn za mjerenje snage padobrana tkanih od sintetičkih vlakana. različitih dobavljača. Informacije dobijene iz ovog eksperimenta će odrediti koji dobavljač nudi najizdržljivije padobrane.

    Mnoge aplikacije uključuju eksperimente koji razmatraju više grupa ili nivoa jednog faktora. Neki faktori, kao što je temperatura pečenja keramike, mogu imati više numeričkih nivoa (tj. 300°, 350°, 400° i 450°). Drugi faktori, kao što je lokacija artikala u supermarketu, mogu imati kategoričke nivoe (npr. prvi dobavljač, drugi dobavljač, treći dobavljač, četvrti dobavljač). Eksperimenti sa jednim faktorom u kojima su eksperimentalne jedinice nasumično dodijeljene grupama ili nivoima faktora nazivaju se potpuno randomizirani.

    UpotrebaF-kriterijumi za procjenu razlika između nekoliko matematičkih očekivanja

    Ako su numerička mjerenja faktora u grupama kontinuirana i neki dodatni uvjeti su ispunjeni, analiza varijanse (ANOVA) se koristi za poređenje matematičkih očekivanja nekoliko grupa. An alysis o f Va riance). Analiza varijanse korištenjem potpuno randomiziranih dizajna naziva se jednosmjerna ANOVA procedura. Na neki način, termin analiza varijanse je pogrešan naziv jer uspoređuje razlike između očekivanih vrijednosti grupa, a ne između varijansi. Međutim, poređenje matematičkih očekivanja vrši se upravo na osnovu analize varijacije podataka. U ANOVA proceduri, ukupna varijacija u rezultatima mjerenja podijeljena je na između grupa i unutar grupa (slika 1). Varijacije unutar grupe se objašnjavaju eksperimentalnom greškom, a varijacije između grupa se objašnjavaju efektima eksperimentalnih uslova. Simbol With označava broj grupa.

    Rice. 1. Particioniranje varijacije u potpuno randomiziranom eksperimentu

    Preuzmite bilješku u formatu ili, primjere u formatu

    Pretvarajmo se to With grupe se izdvajaju iz nezavisnih populacija koje imaju normalnu distribuciju i jednaku varijansu. Nul hipoteza je da su matematička očekivanja populacije ista: H 0: μ 1 = μ 2 = ... = μ s. Alternativna hipoteza kaže da nisu sva matematička očekivanja ista: H 1: nisu svi μ j isti j= 1, 2, …, s).

    Na sl. Slika 2 predstavlja pravu nultu hipotezu o matematičkim očekivanjima pet upoređenih grupa, pod uslovom da populacije imaju normalnu distribuciju i istu varijansu. Pet populacija povezanih sa različitim nivoima faktora su identične. Shodno tome, oni su superponirani jedni na druge, imaju ista matematička očekivanja, varijaciju i oblik.

    Rice. 2. Pet općih populacija ima ista matematička očekivanja: μ 1 = μ 2 = μ 3 = μ 4 = μ 5

    S druge strane, pretpostavimo da je zapravo nulta hipoteza pogrešna, pri čemu četvrti nivo ima najveću očekivanu vrijednost, prvi nivo ima nešto nižu očekivanu vrijednost, a preostali nivoi imaju iste, pa čak niže očekivane vrijednosti ( Slika 3). Imajte na umu da je, sa izuzetkom očekivanih vrijednosti, svih pet populacija identičnih (odnosno, imaju istu varijabilnost i oblik).

    Rice. 3. Uočava se efekat eksperimentalnih uslova: μ 4 > μ 1 > μ 2 = μ 3 = μ 5

    Prilikom testiranja hipoteze o jednakosti matematičkih očekivanja nekoliko općih populacija, ukupna varijacija se dijeli na dva dijela: međugrupna varijacija, zbog razlika među grupama, i unutargrupna varijacija, zbog razlika između elemenata koji pripadaju istoj grupi. Ukupna varijacija se izražava ukupnim zbirom kvadrata (SST – zbir kvadrata). Pošto je nulta hipoteza da su matematička očekivanja svih With grupe su jednake jedna drugoj, ukupna varijacija je jednaka zbiru kvadrata razlika između pojedinačnih opažanja i ukupnog prosjeka (prosjeka prosjeka), izračunatog za sve uzorke. Potpuna varijacija:

    Gdje - opšti prosek, X ij - i-e posmatranje u j-grupa ili nivo, n j- broj zapažanja u j ta grupa, n - ukupno zapažanja u svim grupama (tj. n = n 1 + n 2 + … + n c), With- broj proučavanih grupa ili nivoa.

    Varijacije između grupa, koji se obično naziva zbir kvadrata između grupe (SSA - zbir kvadrata među grupama), jednak je zbiru kvadrata razlika između srednje vrijednosti uzorka svake grupe j i ukupni prosjek , pomnoženo sa zapreminom odgovarajuće grupe n j:

    Gdje With- broj proučavanih grupa ili nivoa, n j- broj zapažanja u j ta grupa, j- prosječna vrijednost j ta grupa, - ukupan prosek.

    Varijacije unutar grupe, koji se obično naziva zbir kvadrata unutar grupe (SSW - zbir kvadrata unutar grupa), jednak je zbiru kvadrata razlika između elemenata svake grupe i srednje vrijednosti uzorka ove grupe j:

    Gdje Xij - i th element j ta grupa, j- prosječna vrijednost j th group.

    Pošto se upoređuju With nivoi faktora, međugrupni zbir kvadrata ima s – 1 stepena slobode. Svaki od With nivoa ima n j – 1 stepena slobode, tako da unutargrupni zbir kvadrata ima n- Sa stepena slobode, i

    Osim toga, ukupan zbir kvadrata ima n – 1 stepena slobode, od svakog posmatranja Xij se upoređuje sa ukupnim prosjekom izračunatim za sve n zapažanja. Ako se svaki od ovih zbroja podijeli s odgovarajućim brojem stupnjeva slobode, nastaju tri vrste disperzije: međugrupa(srednji kvadrat među - MSA), unutargrupa(srednji kvadrat unutar - MSW) i pun(srednji kvadratni ukupni - MST):

    Uprkos činjenici da je glavna svrha analize varijanse da uporedi matematička očekivanja With grupe u cilju identifikacije uticaja eksperimentalnih uslova, naziv je dobio zbog činjenice da je glavni alat analiza varijansi različitih tipova. Ako je nulta hipoteza tačna, i između matematičkih očekivanja With grupe nema značajnih razlika, sve tri varijanse - MSA, MSW i MST - su procjene varijanse σ 2 svojstvene analiziranim podacima. Dakle, za testiranje nulte hipoteze H 0: μ 1 = μ 2 = ... = μ s i alternativne hipoteze H 1: nisu svi μ j isti j = 1, 2, …, With), potrebno je izračunati statistiku F-kriterijum, koji predstavlja omjer dvije varijanse, MSA i MSW. Test F-statistika u jednosmjernoj analizi varijanse

    Statistika F-u zavisnosti od kriterijuma F-distribucija sa s – 1 stepena slobode u brojiocu M.S.A. I n – s stepena slobode u nazivniku M.S.W.. Za dati nivo značajnosti α, nulta hipoteza se odbacuje ako se izračuna F FU, inherentno F-distribucija sa s – 1 n – s stepena slobode u nazivniku. Dakle, kao što je prikazano na sl. 4, odlučujuće pravilo formulisan na sledeći način: nulta hipoteza H 0 odbijeno ako F>FU; inače se ne odbija.

    Rice. 4. Kritična oblast analize varijanse pri testiranju hipoteze H 0

    Ako je nulta hipoteza H 0 je tačno, izračunato F-statistika je blizu 1, pošto su njen brojilac i nazivnik procene iste veličine - disperzije σ2 svojstvene analiziranim podacima. Ako je nulta hipoteza H 0 je lažna (i postoji značajna razlika između matematičkih očekivanja različitih grupa), izračunato F-statistika će biti mnogo veća od jedinice jer njen brojilac, MSA, procjenjuje efekat eksperimentalnih uslova ili razlika između grupa pored prirodne varijabilnosti podataka, dok imenilac MSW procjenjuje samo prirodnu varijabilnost podataka. Dakle, ANOVA postupak je F-kriterijum u kojem se, na datom nivou značajnosti α, nulta hipoteza odbacuje ako je izračunata F-statistika je veća od gornje kritične vrijednosti FU, inherentno F-distribucija sa s – 1 stepena slobode u brojiocu i n – s stepena slobode u nazivniku, kao što je prikazano na sl. 4.

    Da bismo ilustrirali jednosmjernu analizu varijanse, vratimo se scenariju koji je naveden na početku napomene. Svrha eksperimenta je utvrditi da li padobrani tkani od sintetičkih vlakana dobivenih od različitih dobavljača imaju istu snagu. Svaka grupa ima pet padobrana. Grupe su podijeljene po dobavljačima - dobavljač 1, dobavljač 2, dobavljač 3 i dobavljač 4. Snaga padobrana se mjeri pomoću posebnog uređaja koji testira tkaninu na kidanje sa obje strane. Sila potrebna za razbijanje padobrana mjeri se na posebnoj skali. Što je veća sila loma, to je padobran jači. Excel vam omogućava analizu F-statistika jednim klikom. Prođite kroz meni PodaciAnaliza podataka i izaberite liniju Jednosmjerna ANOVA, popunite prozor koji se otvori (slika 5). Eksperimentalni rezultati (prekidna čvrstoća), neke deskriptivne statistike i rezultati jednosmjerne analize varijanse prikazani su na Sl. 6.

    Rice. 5. Prozor Jednosmjerna analiza paketa analize varijanse Excel

    Rice. 6. Pokazatelji čvrstoće padobrana tkanih od sintetičkih vlakana dobijenih od različitih dobavljača, deskriptivna statistika i rezultati jednosmjerne analize varijanse

    Analiza slike 6 pokazuje da postoji određena razlika između srednjih vrijednosti uzorka. Prosječna čvrstoća vlakana dobijenih od prvog dobavljača je 19,52, od drugog - 24,26, od trećeg - 22,84 i od četvrtog - 21,16. Da li je ova razlika statistički značajna? Raspodjela sile loma prikazana je na dijagramu raspršenja (slika 7). To jasno pokazuje razlike između i unutar grupa. Ako bi svaka grupa bila veća, za njihovu analizu bi se mogao koristiti dijagram stabljike i lista, dijagram kutije ili dijagram zvona.

    Rice. 7. Dijagram disperzije čvrstoće za padobrane tkane od sintetičkih vlakana dobijenih od četiri dobavljača.

    Nul hipoteza kaže da nema značajnih razlika između prosječnih rezultata snage: H 0: μ 1 = μ 2 = μ 3 = μ 4. Alternativna hipoteza je da postoji barem jedan dobavljač čija se prosječna snaga vlakana razlikuje od ostalih: H 1: nisu svi μ j isti ( j = 1, 2, …, With).

    Ukupan prosek (vidi sliku 6) = PROSEK (D12:D15) = 21,945; da biste odredili, takođe možete usredsrediti svih 20 originalnih brojeva: = PROSEK (A3:D7). Izračunavaju se vrijednosti varijanse Paket analiza i odražavaju se u ploči Analiza varijanse(vidi sliku 6): SSA = 63,286, SSW = 97,504, SST = 160,790 (vidi kolonu SS stolovi Analiza varijanse Slika 6). Prosjeci se izračunavaju dijeljenjem ovih zbira kvadrata sa odgovarajućim brojem stupnjeva slobode. Zbog With= 4, a n= 20, dobijamo sledeće vrednosti stepena slobode; za SSA: s – 1= 3; za SSW: n–c= 16; za SST: n – 1= 19 (vidi kolonu df). Dakle: MSA = SSA / ( s – 1)= 21.095; MSW = SSW / ( n–c) = 6.094; MST = SST / ( n – 1) = 8,463 (vidi kolonu GOSPOĐA). F-statistika = MSA / MSW = 3,462 (vidi kolonu F).

    Gornja kritična vrijednost FU, karakteristika F-distribucija, određena formulom =F.OBR(0,95;3;16) = 3,239. Parametri funkcije =F.OBR(): α = 0,05, brojilac ima tri stepena slobode, a imenilac 16. Dakle, izračunato F-statistika jednaka 3,462 premašuje gornju kritičnu vrijednost FU= 3,239, nulta hipoteza se odbacuje (slika 8).

    Rice. 8. Kritična oblast analize varijanse na nivou značajnosti 0,05 ako brojilac ima tri stepena slobode, a imenilac -16

    R-vrijednost, tj. vjerovatnoća da je nulta hipoteza tačna F-statistiku ne manje od 3,46, jednako 0,041 ili 4,1% (vidi kolonu p-vrijednost stolovi Analiza varijanse Slika 6). Pošto ova vrijednost ne prelazi nivo značajnosti α = 5%, nulta hipoteza se odbacuje. Štaviše, R-vrijednost pokazuje da je vjerovatnoća otkrivanja takve ili veće razlike između matematičkih očekivanja općih populacija, pod uslovom da su ona u stvari ista, jednaka 4,1%.

    Dakle. Postoji razlika između četiri srednje vrijednosti uzorka. Nul hipoteza je bila da su sva matematička očekivanja četiri populacije jednaka. Pod ovim uslovima, mera ukupne varijabilnosti (tj. ukupne SST varijacije) snage svih padobrana se izračunava zbrajanjem kvadrata razlika između svakog posmatranja X ij i ukupni prosjek . Ukupna varijacija je zatim razdvojena na dvije komponente (vidi sliku 1). Prva komponenta je bila varijacija između grupa u SSA, a druga je bila varijacija unutar grupe u SSW.

    Šta objašnjava varijabilnost u podacima? Drugim riječima, zašto sva zapažanja nisu ista? Jedan od razloga je taj što različite kompanije isporučuju vlakna različite jačine. Ovo delimično objašnjava zašto grupe imaju različita matematička očekivanja: što je jači efekat eksperimentalnih uslova, veća je razlika između matematičkih očekivanja grupa. Drugi razlog za varijabilnost podataka je prirodna varijabilnost bilo kojeg procesa, u ovom slučaju proizvodnje padobrana. Čak i da su sva vlakna kupljena od istog dobavljača, njihova snaga ne bi bila ista, pod uslovom da su sve ostale jednake. Budući da se ovaj efekat javlja unutar svake grupe, naziva se varijacija unutar grupe.

    Razlike između srednjih vrijednosti uzorka nazivaju se međugrupna varijacija SSA. Dio varijacija unutar grupe, kao što je već naznačeno, objašnjava se pripadnosti podataka različitim grupama. Međutim, čak i da su grupe potpuno iste (tj. nulta hipoteza je tačna), varijacije između grupa bi i dalje postojale. Razlog tome je prirodna varijabilnost procesa proizvodnje padobrana. Budući da su uzorci različiti, njihova se vrijednost uzorka razlikuju jedna od druge. Stoga, ako je nulta hipoteza tačna, i varijabilnost između i unutar grupe predstavlja procjenu varijabilnosti populacije. Ako je nulta hipoteza netačna, hipoteza između grupa će biti veća. Ova činjenica je u osnovi F-kriterijumi za poređenje razlika između matematičkih očekivanja nekoliko grupa.

    Nakon izvršenja jednosmjerne ANOVA i pronalaženja značajne razlike između firmi, ostaje nepoznato koji dobavljač se značajno razlikuje od ostalih. Znamo samo da matematička očekivanja opće populacije nisu jednaka. Drugim riječima, barem jedno od matematičkih očekivanja značajno se razlikuje od ostalih. Da biste utvrdili koji se dobavljač razlikuje od ostalih, možete koristiti Tukey procedura, koristeći poređenje u paru između dobavljača. Ovu proceduru je razvio John Tukey. Nakon toga, on i K. Kramer su nezavisno modifikovali ovu proceduru za situacije u kojima se veličine uzoraka razlikuju jedna od druge.

    Višestruko poređenje: Tukey-Kramerova procedura

    U našem scenariju, jednosmjerna analiza varijanse korištena je za poređenje snage padobrana. Nakon što su utvrđene značajne razlike između matematičkih očekivanja četiri grupe, potrebno je utvrditi koje se grupe međusobno razlikuju. Iako postoji nekoliko načina za rješavanje ovog problema, opisati ćemo samo Tukey-Kramerov postupak višestrukog poređenja. Ova metoda je primjer post hoc procedura poređenja jer se hipoteza koja se testira formuliše nakon analize podataka. Tukey-Kramerova procedura omogućava da se svi parovi grupa uporede istovremeno. U prvoj fazi se izračunavaju razlike Xj -Xj, Gdje j ≠j, između matematičkih očekivanja s(s – 1)/2 grupe. Kritički opseg Tukey-Kramerov postupak se izračunava po formuli:

    Gdje Q U- gornja kritična vrijednost studentizovane raspodjele raspona, koja ima With stepena slobode u brojiocu i n - Sa stepena slobode u nazivniku.

    Ako veličine uzorka nisu iste, kritični raspon se izračunava za svaki par matematičkih očekivanja posebno. U posljednjoj fazi, svaki od s(s – 1)/2 parovi matematičkih očekivanja se porede sa odgovarajućim kritičnim opsegom. Elementi para se smatraju značajno različitim ako je modul razlike | X j -Xj| između njih prelazi kritični raspon.

    Primijenimo Tukey-Kramerov postupak na problem snage padobrana. Pošto padobranska kompanija ima četiri dobavljača, potrebno je provjeriti 4(4 – 1)/2 = 6 parova dobavljača (slika 9).

    Rice. 9. Parna poređenja srednjih vrijednosti uzorka

    Pošto sve grupe imaju isti volumen (tj n j = n j), dovoljno je izračunati samo jedan kritični raspon. Da biste to učinili, prema tabeli ANOVA(slika 6) određujemo vrijednost MSW = 6,094. Zatim nalazimo vrijednost Q U pri α = 0,05, With= 4 (broj stepena slobode u brojiocu) i n- Sa= 20 – 4 = 16 (broj stepena slobode u nazivniku). Nažalost, nisam našao odgovarajuću funkciju u Excelu, pa sam koristio tabelu (slika 10).

    Rice. 10. Kritična vrijednost studentiziranog raspona Q U

    Dobijamo:

    Pošto je samo 4,74 > 4,47 (vidi donju tabelu na slici 9), postoji statistički značajna razlika između prvog i drugog dobavljača. Svi ostali parovi imaju uzorke koji nam ne dozvoljavaju da govorimo o njihovim razlikama. Posljedično, prosječna čvrstoća padobrana tkanih od vlakana kupljenih od prvog dobavljača znatno je manja od one kod drugog.

    Neophodni uslovi za jednosmernu analizu varijanse

    Prilikom rješavanja problema jačine padobrana nismo provjerili da li su uvjeti pod kojima je moguće koristiti jednofaktorski F-kriterijum. Kako znate da li možete koristiti jedan faktor F-kriterijum pri analizi konkretnih eksperimentalnih podataka? Jedan faktor F-kriterijum se može primijeniti samo ako su ispunjene tri osnovne pretpostavke: eksperimentalni podaci moraju biti slučajni i nezavisni, imati normalnu distribuciju, a njihove varijanse moraju biti jednake.

    Prva pretpostavka - slučajnost i nezavisnost podataka- mora se uvijek izvoditi, jer ispravnost svakog eksperimenta zavisi od slučajnosti izbora i/ili procesa randomizacije. Da bi se izbjeglo pristrasnost rezultata, potrebno je da se podaci izvuku iz With opšte populacije nasumično i nezavisno jedna od druge. Slično, podaci bi trebali biti nasumično raspoređeni With nivoi faktora koji nas zanima (eksperimentalne grupe). Kršenje ovih uslova može ozbiljno poremetiti rezultate analize varijanse.

    Drugo nagađanje - normalnost- znači da su podaci izvučeni iz normalno raspoređenih populacija. Kao za t-kriterijumi, jednosmjerna analiza varijanse na osnovu F-kriterijum je relativno malo osjetljiv na kršenje ovog stanja. Ako distribucija ne odstupa previše značajno od normalne, nivo značajnosti F-kriterijum se malo mijenja, posebno ako je veličina uzorka dovoljno velika. Ako je uslov normalnosti distribucije ozbiljno narušen, treba ga primijeniti.

    Treća pretpostavka - homogenost varijanse- znači da su varijanse svake populacije jednake jedna drugoj (tj. σ 1 2 = σ 2 2 = ... = σ j 2). Ova pretpostavka omogućava da se odluči hoće li odvojiti ili objediniti varijanse unutar grupe. Ako su veličine grupa iste, uslov homogenosti varijanse ima mali uticaj na zaključke dobijene korišćenjem F-kriterijumi. Međutim, ako su veličine uzorka nejednake, kršenje uvjeta jednakosti varijansi može ozbiljno iskriviti rezultate analize varijanse. Stoga treba uložiti napore da se osigura da su veličine uzoraka jednake. Jedna od metoda za provjeru pretpostavke homogenosti varijanse je kriterij Levene opisano u nastavku.

    Ako je od sva tri uslova prekršen samo uslov homogenosti varijanse, postupak sličan t-kriterijum koji koristi odvojenu varijansu (za više detalja pogledajte). Međutim, ako se istovremeno naruše pretpostavke normalne distribucije i homogenosti varijanse, potrebno je normalizirati podatke i smanjiti razlike između varijansi ili primijeniti neparametarski postupak.

    Levenov test za ispitivanje homogenosti varijanse

    Iako F-kriterijum je relativno otporan na narušavanje uslova jednakosti varijansi u grupama, grubo kršenje ove pretpostavke značajno utiče na nivo značajnosti i snagu kriterijuma. Možda je jedan od najmoćnijih kriterija Levene. Za provjeru jednakosti varijansi With opće populacije, testirat ćemo sljedeće hipoteze:

    N 0: σ 1 2 = σ 2 2 = … = σj 2

    H 1: Ne sve σ j 2 su isti ( j = 1, 2, …, With)

    Modifikovani Levenov test zasniva se na pretpostavci da ako je varijabilnost jednaka među grupama, analiza varijanse se može koristiti za testiranje nulte hipoteze o jednakosti varijansi apsolutne vrijednosti razlike između opažanja i grupnih medijana. Dakle, prvo biste trebali izračunati apsolutne vrijednosti razlika između opažanja i medijana u svakoj grupi, a zatim izvršiti jednosmjernu analizu varijanse na rezultirajućim apsolutnim vrijednostima razlika. Da bismo ilustrovali Levenov kriterijum, vratimo se scenariju iznetom na početku beleške. Koristeći podatke prikazane na sl. 6, sprovešćemo sličnu analizu, ali u odnosu na module razlika u početnim podacima i medijanima za svaki uzorak posebno (Sl. 11).



Novo na sajtu

>

Najpopularniji