Dom Odstranjivanje Testiranje statističkih hipoteza u MS EXCEL-u o jednakosti srednje vrijednosti distribucije (varijansa je nepoznata). Testiranje hipoteze o jednakosti srednjih vrijednosti dvije ili više populacija

Testiranje statističkih hipoteza u MS EXCEL-u o jednakosti srednje vrijednosti distribucije (varijansa je nepoznata). Testiranje hipoteze o jednakosti srednjih vrijednosti dvije ili više populacija

3. PROVJERA HIPOTEZE O JEDNAKOSTI PROSJEKA

Koristi se za testiranje pretpostavke da se srednja vrijednost dva indikatora predstavljena uzorcima značajno razlikuje. Postoje tri vrste testova: jedan za povezane uzorke i dva za nepovezane uzorke (sa istim i različitim varijacijama). Ako uzorci nisu povezani, tada se hipoteza o jednakosti varijansi mora prvo testirati kako bi se odredilo koji kriterij koristiti. Kao iu slučaju poređenja varijansi, postoje 2 načina za rješavanje problema, koje ćemo razmotriti na primjeru.

PRIMJER 3. Postoje podaci o broju prodaje robe u dva grada. Testirajte na nivou značajnosti od 0,01 statističku hipotezu da je prosječan broj prodaje proizvoda u gradovima različit.

23 25 23 22 23 24 28 16 18 23 29 26 31 19
22 28 26 26 35 20 27 28 28 26 22 29

Koristimo paket za analizu podataka. U zavisnosti od vrste kriterijuma, bira se jedan od tri: „Upareni t-test sa dva uzorka za srednje vrednosti” - za povezane uzorke i „T-test sa dva uzorka sa jednakim varijacijama” ili „T-test sa dva uzorka sa različite varijance” - za nepovezane uzorke. Pozovite test sa jednakim varijacijama, u prozoru koji se otvori, u polja „Variable Interval 1” i „Variable Interval 2” unesite veze do podataka (A1-N1 i A2-L2, respektivno); ako postoje oznake podataka , a zatim potvrdite okvir pored „Oznake” (nemamo ih, pa potvrdni okvir nije označen). Zatim unesite nivo značajnosti u polje “Alfa” - 0,01. Polje “Hipotetička srednja razlika” ostaje prazno. U odjeljku "Opcije izlaza" stavite kvačicu pored "Izlazni interval" i, postavite kursor u polje koje se pojavljuje nasuprot natpisa, kliknite lijevo dugme u ćeliji B7. Rezultat će biti izlaz počevši od ove ćelije. Klikom na “OK” pojavljuje se tabela rezultata. Pomerite granicu između kolona B i C, C i D, D i E povećavajući širinu kolona B, C i D tako da sve oznake stanu. Postupak prikazuje glavne karakteristike uzorka, t-statistiku, kritične vrijednosti ove statistike i kritični nivoi značaj "P(T<=t) одностороннее» и «Р(Т<=t) двухстороннее». Если по модулю t-статистика меньше критического, то средние показатели с заданной вероятностью равны. В нашем случае│-1,784242592│ < 2,492159469, следовательно, среднее число продаж значимо не отличается. Следует отметить, что если взять уровень значимости α=0,05, то результаты исследования будут совсем иными.



T-test sa dva uzorka sa jednakim varijacijama

Prosjek 23,57142857 26,41666667
Disperzija 17,34065934 15,35606061
Zapažanja 14 12
Objedinjena varijansa 16,43105159
Hipotetička srednja razlika 0
df 24
t-statistika -1,784242592
P(T<=t) одностороннее 0,043516846
t kritično jednostrano 2,492159469
P(T<=t) двухстороннее 0,087033692
t kritična dvosmjerna 2,796939498

Laboratorijski rad br. 3

UPARENA LINEARNA REGRESIJA

Cilj: Ovladati metodama konstruisanja linearne jednačine uparene regresije pomoću računara, naučiti kako dobiti i analizirati glavne karakteristike jednačine regresije.

Razmotrimo metodologiju za konstruisanje regresione jednadžbe na primjeru.

PRIMJER. Dati su uzorci faktora x i i y i. Koristeći ove uzorke, pronađite jednadžbu linearne regresije ỹ = ax + b. Pronađite koeficijent korelacije para. Provjerite adekvatnost regresijskog modela na nivou značajnosti a = 0,05.

X 0 1 2 3 4 5 6 7 8 9
Y 6,7 6,3 4,4 9,5 5,2 4,3 7,7 7,1 7,1 7,9

Da biste pronašli koeficijente a i b regresione jednadžbe, koristite funkcije SLOPE i INTERCEPT, kategorije “Statistički”. Upisujemo potpis “a=” u A5 i unosimo funkciju TILT u susjednu ćeliju B5, postavljamo kursor u polje “Iz_value_y” i postavljamo vezu na ćelije B2-K2 tako što ih kružimo mišem. Rezultat je 0,14303. Nađimo sada koeficijent b. U A6 unosimo signaturu “b=”, au B6 funkciju CUT sa istim parametrima kao i funkcije TILT. Rezultat je 5,976364. prema tome, jednadžba linearne regresije je y=0,14303x+5,976364.

Nacrtajmo jednačinu regresije. Da bismo to učinili, u treći red tabele unosimo vrijednosti funkcije u datim tačkama X (prvi red) – y(x 1). Da biste dobili ove vrijednosti, koristite funkciju TREND Statističke kategorije. Upisujemo potpis “Y(X)” u A3 i, postavljajući kursor na B3, pozivamo funkciju TREND. U poljima “From_value_y” i “From_value_x” dajemo vezu na B2-K2 i B1-K1. u polje “New_value_x” unosimo i vezu na B1-K1. u polje „Konstanta“ unesite 1 ako regresijska jednačina ima oblik y=ax+b, i 0 ako je y=ax. U našem slučaju unosimo jedan. Funkcija TREND je niz, tako da za prikaz svih njenih vrijednosti odaberite područje B3-K3 i pritisnite F2 i Ctrl+Shift+Enter. Rezultat su vrijednosti jednadžbe regresije u datim tačkama. Pravimo raspored. Postavite kursor u bilo koju slobodnu ćeliju, pozovite čarobnjaka za dijagrame, odaberite kategoriju „Izoštreno“, vrstu grafikona – linija bez tačaka (u donjem desnom uglu), kliknite „Dalje“, unesite vezu na B3-K3 u Polje „Dijagnostika“. idite na karticu “Row” i u polje “X Values” unesite vezu do B1-K1, kliknite “Finish”. Rezultat je ravna linija regresije. Pogledajmo kako se razlikuju grafovi eksperimentalnih podataka i jednadžbe regresije. Da biste to uradili, postavite kursor u bilo koju slobodnu ćeliju, pozovite čarobnjaka za grafikone, kategoriju „Grafikon“, tip grafikona – isprekidana linija sa tačkama (druga od gore levo), kliknite „Dalje“, u polje „Raspon“ unesite vezu na drugi i treći red B2-K3. idite na karticu „Red” i u polje „Oznake osi X” unesite vezu na B1-K1, kliknite na „Završi”. Rezultat su dvije linije (plava – originalna, crvena – jednačina regresije). Vidi se da se linije malo razlikuju jedna od druge.

a= 0,14303
b= 5,976364

Da biste izračunali koeficijent korelacije r xy, koristite PEARSON funkciju. Postavljamo graf tako da se nalazi iznad linije 25, a u A25 pravimo potpis “Korelacija”, u B25 zovemo PEARSON funkciju, u polja kojih “Niz 2” upisujemo link do izvornih podataka B1 -K1 i B2-K2. rezultat je 0,993821. koeficijent determinacije R xy je kvadrat koeficijenta korelacije r xy . U A26 potpisujemo “Određivanje”, au B26 upisujemo formulu “=B25*B25”. Rezultat je 0,265207.

Međutim, u Excelu postoji jedna funkcija koja izračunava sve osnovne karakteristike linearne regresije. Ovo je LINEST funkcija. Postavite kursor na B28 i pozovite funkciju LINEST, kategorija “Statistički”. U poljima “From_value_y” i “From_value_x” dajemo vezu na B2-K2 i B1-K1. Polje “Konstanta” ima isto značenje kao i funkcija TREND, u našem slučaju je jednako 1. Polje “Stat” mora sadržavati 1 ako trebate prikazati kompletnu statistiku o regresiji. U našem slučaju, stavili smo jedan tamo. Funkcija vraća niz od 2 stupca i 5 redova. Nakon unosa, odaberite ćeliju B28-C32 mišem i pritisnite F2 i Ctrl+Shift+Enter. Rezultat je tabela vrijednosti, u kojoj brojevi imaju sljedeće značenje:



Koeficijent a

Koeficijent b

Standardna greška m o

Standardna greška m h

Koeficijent determinacije R xy

Standardna devijacija

F – statistika

Stepeni slobode n-2

Regresijski zbir kvadrata S n 2

Preostali zbir kvadrata S n 2

0,14303 5,976364
0,183849 0,981484
0,070335 1,669889
0,60525 8
1,687758 22,30824

Analiza rezultata: u prvom redu - koeficijenti regresione jednadžbe, uporedite ih sa izračunatim funkcijama SLOPE i INTERCEPT. Drugi red su standardne greške koeficijenata. Ako je jedan od njih veći po apsolutnoj vrijednosti od samog koeficijenta, tada se koeficijent smatra nulom. Koeficijent determinacije karakteriše kvalitet odnosa između faktora. Dobijena vrijednost od 0,070335 ukazuje na vrlo dobar odnos između faktora, F - statistika testira hipotezu o adekvatnosti regresionog modela. Ovaj broj se mora uporediti sa kritičnom vrijednošću, da bismo je dobili u E33 unosimo potpis “F-kritično”, au F33 funkciju FRIST, čije argumente unosimo odnosno “0,05” (nivo značajnosti), “1” (broj faktora X) i "8" (stepeni slobode).

F-kritično 5,317655

Može se vidjeti da je F-statistika manja od F-kritičke, što znači da regresijski model nije adekvatan. Posljednji red prikazuje regresijski zbir kvadrata i rezidualne sume kvadrata . Važno je da je suma regresije (objašnjena regresijom) mnogo veća od ostatka (ne objašnjava se regresijom, uzrokovana slučajnim faktorima). U našem slučaju ovaj uslov nije ispunjen, što ukazuje na lošu regresiju.

Zaključak: U toku svog rada savladao sam metode konstruisanja linearne jednačine parne regresije uz pomoć računara, naučio da dobijem i analiziram glavne karakteristike regresione jednačine.


Laboratorijski rad br. 4

NELINEARNA REGRESIJA

Cilj: savladati metode za konstruisanje glavnih tipova nelinearnih parnih regresionih jednačina pomoću računara (interni linearni modeli), naučiti dobijati i analizirati indikatore kvaliteta regresionih jednačina.

Razmotrimo slučaj kada se nelinearni modeli mogu svesti na linearne pomoću transformacije podataka (interni linearni modeli).

PRIMJER. Konstruirajte jednadžbu regresije y = f(x) za uzorak x n y n (f = 1,2,…,10). Kao f(x), razmotrite četiri tipa funkcija - linearne, potencijske, eksponencijalne i hiperbolu:

y = Ax + B; y = Ax B; y = Ae Bx; y = A/x + B.

Potrebno je pronaći njihove koeficijente A i B, te nakon poređenja pokazatelja kvaliteta odabrati funkciju koja najbolje opisuje ovisnost.

Profit Y 0,3 1,2 2,8 5,2 8,1 11,0 16,8 16,9 24,7 29,4
Dobit X 0,25 0,50 0,75 1,00 1,25 1,50 1,75 2,00 2,25 2,50

Unesimo podatke u tabelu zajedno sa potpisima (ćelije A1-K2). Ostavimo slobodna tri reda ispod tabele za unos konvertovanih podataka, izaberite prvih pet redova prevlačenjem duž levog sivog okvira duž brojeva od 1 do 5 i izaberite boju (svetlo - žutu ili ružičastu) da obojite pozadinu ćelije. Zatim, počevši od A6, prikazujemo parametre linearne regresije. Da biste to učinili, napišite "Linear" u ćeliju A6 i unesite funkciju LINEST u susjednu ćeliju B6. U poljima “Izv_value_x” dajemo vezu na B2-K2 i B1-K1, sljedeća dva polja imaju vrijednosti od jedan. Zatim zaokružite područje ispod u 5 redaka i lijevo u 2 reda i pritisnite F2 i Ctrl+Shift+Enter. Rezultat je tabela sa parametrima regresije, od kojih je koeficijent determinacije u prvoj koloni, trećoj od vrha, od najvećeg interesa. U našem slučaju to je jednako R 1 = 0,951262. Vrijednost F-kriterijuma, koji omogućava provjeru adekvatnosti modela F 1 = 156,1439

(četvrti red, prva kolona). Jednačina regresije je

y = 12,96 x +6,18 (koeficijenti a i b dati su u ćelijama B6 i C6).

Linearno 12,96 -6,18
1,037152 1,60884
0,951262 2,355101
156,1439 8
866,052 44,372

Odredimo slične karakteristike za druge regresije i, kao rezultat poređenja koeficijenata determinacije, naći ćemo najbolji regresijski model. Razmotrimo hiperboličku regresiju. Da bismo ga dobili, transformiramo podatke. U trećem redu, u ćeliju A3 upisujemo potpis “1/x” a u ćeliju B3 upisujemo formulu “=1/B2”. Hajde da automatski popunimo ovu ćeliju do područja B3-K3. Hajde da dobijemo karakteristike regresijskog modela. U ćeliju A12 upisujemo potpis “Hyperbola”, au susjednu funkciju LINEST. U poljima “From_value_y” i “From_value_x2” dajemo vezu na B1-K1 i konvertovane podatke argumenta x – B3-K3, sljedeća dva polja imaju vrijednosti od jedan. Zatim zaokružite područje ispod 5 linija i 2 reda lijevo i pritisnite F2 i Ctrl+Shift+Enter. Dobijamo tabelu parametara regresije. Koeficijent determinacije u u ovom slučaju je jednako R 2 = 0,475661, što je mnogo gore nego u slučaju linearne regresije. F-statistika je F2 = 7,257293. Jednačina regresije je y = -6,25453x 18,96772.

Hiperbola -6,25453 18,96772
2,321705 3,655951
0,475661 7,724727
7,257293 8
433,0528 477,3712

Razmotrimo eksponencijalnu regresiju. Da bismo ga linearizirali, dobijamo jednačinu , gdje je ỹ = ln y, ã = b, = ln a. Može se vidjeti da je potrebno izvršiti transformaciju podataka - zamijeniti y sa ln y. Postavite kursor u ćeliju A4 i postavite naslov “ln y”. Postavite kursor na B4 i unesite LN formulu (kategorija “Matematički”). Kao argument navodimo B1. Koristeći automatsko popunjavanje, proširujemo formulu do četvrtog reda na ćelije B4-K4. Zatim u ćeliju F6 postavljamo potpis “Exponent” i u susjedni G6 unosimo funkciju LINEST, čiji će argumenti biti transformirani podaci B4-K4 (u polju “Measured_value_y”), a preostala polja su isto kao i za slučaj linearne regresije (B2-K2, jedanaest). Zatim zaokružite ćelije G6-H10 i pritisnite F2 i Ctrl+Shift+Enter. Rezultat je R 3 = 0,89079, F 3 = 65,25304, što ukazuje na vrlo dobru regresiju. Naći koeficijente regresione jednadžbe b = ã; stavite kursor u J6 i napravite naslov “a=”, au susjednom K6 formulu “=EXP(H6)”, u J7 dajemo naslov “b=”, au K7 formulu “=G6”. Jednačina regresije je y = 0,511707· e 6,197909 x.

Izlagač 1,824212 -0,67 a= 0,511707
0,225827 0,350304 b= 6,197909
0,89079 0,512793
65,25304 8
17,15871 2,103652

Razmotrimo regresiju moći. Da bismo ga linearizirali, dobijamo jednačinu ỹ = ã, gdje je ỹ = ln y, = ln x, ã = b, = ln a. Vidi se da je potrebno transformisati podatke - zamijeniti y sa ln y i zamijeniti x sa ln x. Već imamo liniju sa ln y. Hajde da transformišemo varijable x. U ćeliju A5 upisujemo potpis “ln x”, au ćeliju B5 unosimo formulu LN (kategorija “Matematički”). Kao argument navodimo B2. Koristeći automatsko popunjavanje, proširujemo formulu do petog reda na ćelije B5-K5. Zatim u ćeliju F12 postavljamo potpis “Power” i u susjedni G12 unosimo funkciju LINEST, čiji će argumenti biti konvertirani podaci B4-K4 (u polju “From_value_y”) i B5-K5 (u polje “From_value_x”), preostala polja su jedinice. Zatim oslobodite ćelije G12-H16 i pritisnite F2 i Ctrl+Shift+Enter. Rezultat je R 4 = 0,997716, F 4 = 3494,117, što ukazuje na dobru regresiju. Naći koeficijente regresione jednadžbe b = ã; stavite kursor u J12 i napravite naslov “a=”, au susjednom K12 formulu “=EXP(H12)”, u J13 dajemo naslov “b=”, au K13 formulu “=G12”. Jednačina regresije je y = 4,90767/x+ 7,341268.

Snaga 1,993512 1,590799 a= 4,90767
0,033725 0,023823 b= 7,341268
0,997716 0,074163
3494,117 8
19,21836 0,044002

Provjerimo da li sve jednačine adekvatno opisuju podatke. Da biste to učinili, trebate uporediti F-statistiku svakog kriterija sa kritičnom vrijednošću. Da bismo ga dobili, u A21 upisujemo potpis “F-kritičan”, au B21 funkciju FRIST, čije argumente unosimo, odnosno “0,05” (nivo značajnosti), “1” (broj faktora X u linija “Nivo značaja 1”) i “8” (stepen slobode 2 = n – 2). Rezultat je 5,317655. F – kritično je veće od F – statistike, što znači da je model adekvatan. Preostale regresije su također adekvatne. Da bismo utvrdili koji model najbolje opisuje podatke, upoređujemo indekse determinacije za svaki model R 1, R 2, R 3, R 4. Najveći je R4 = 0,997716. To znači da se eksperimentalni podaci bolje opisuju sa y = 4,90767/x + 7,341268.

Zaključak: U toku svog rada savladao sam metode za konstruisanje glavnih tipova nelinearnih parnih regresionih jednačina pomoću računara (interni linearni modeli), naučio da dobijam i analiziram indikatore kvaliteta regresionih jednačina.

Y 0,3 1,2 2,8 5,2 8,1 11 16,8 16,9 24,7 29,4
X 0,25 0,5 0,75 1 1,25 1,5 1,75 2 2,25 2,5
1/x 4 2 1,333333 1 0,8 0,666667 0,571429 0,5 0,444444 0,4
ln y -1,20397 0,182322 1,029619 1,648659 2,0918641 2,397895 2,821379 2,827314 3,206803 3,380995
ln x -1,38629 -0,69315 -0,28768 0 0,2231436 0,405465 0,559616 0,693147 0,81093 0,916291
Linearno 12,96 -6,18 Izlagač 1,824212 -0,67 a= 0,511707
1,037152 1,60884 0,225827 0,350304 b= 6,197909
0,951262 2,355101 0,89079 0,512793
156,1439 8 65,25304 8
866,052 44,372 17,15871 2,103652
Hiperbola -6,25453 18,96772 Snaga 1,993512 1,590799 a= 4,90767
2,321705 3,655951 0,033725 0,023823 b= 7,341268
0,475661 7,724727 0,997716 0,074163
7,257293 8 3494,117 8
433,0528 477,3712 19,21836 0,044002
F - kritičan 5,317655

Laboratorijski rad br. 5

POLINOMIJSKA REGRESIJA

Svrha: Koristeći eksperimentalne podatke, konstruirati jednadžbu regresije oblika y = ax 2 + bx + c.

NAPREDAK:

Razmatra se zavisnost prinosa određenog useva y i od količine mineralnih đubriva unesenih na tlo x i. Pretpostavlja se da je ova zavisnost kvadratna. Potrebno je pronaći jednadžbu regresije oblika ỹ = ax 2 + bx + c.

x 0 1 2 3 4 5 6 7 8 9
y 29,8 58,8 72,2 101,5 141 135,1 156,6 181,7 216,6 208,2

Unesimo ove podatke u tabelu zajedno sa potpisima u ćelijama A1-K2. Napravimo graf. Da biste to uradili, zaokružite podatke Y (ćelije B2-K2), pozovite čarobnjaka za grafikone, izaberite tip grafikona „Grafikon“, tip grafikona – grafikon sa tačkama (drugi odozgo levo), kliknite „Dalje“, idite na Kartica “Serija” i u “Oznake osi X” povežite na B2-K2, kliknite na “Završi”. Graf se može aproksimirati polinomom stepena 2 y = ax 2 + bx + c. Da biste pronašli koeficijente a, b, c, morate riješiti sistem jednačina:

Izračunajmo iznose. Da biste to učinili, unesite potpis "X^2" u ćeliju A3, a u ćeliju B3 unesite formulu "= B1*B1" i prenesite je na cijeli red B3-K3 pomoću automatskog popunjavanja. U ćeliju A4 unosimo potpis “X^3”, au B4 formulu “=B1*B3” i Autofill prenosimo na cijeli red B4-K4. U ćeliju A5 unosimo "X^4", au B5 formulu "=B4*B1", automatski popunjavamo red. U ćeliju A6 unosimo “X*Y”, au B8 formulu “=B2*B1”, automatski popunjavamo red. U ćeliju A7 unosimo “X^2*Y”, au B9 formulu “=B3*B2”, automatski popunjavamo red. Sada prebrojavamo iznose. Odaberite kolonu L druge boje klikom na zaglavlje i odabirom boje. Postavite kursor u ćeliju L1 i kliknite na dugme za automatski zbir sa ikonom ∑ da biste izračunali zbir prvog reda. Koristeći AutoFill, prenosimo formulu u ćelije L1-710.

Sada rješavamo sistem jednačina. Da bismo to učinili, uvodimo glavnu matricu sistema. U ćeliju A13 upisujemo potpis “A=”, a u ćelije matrice B13-D15 unosimo veze prikazane u tabeli

B C D
13 =L5 =L4 =L3
14 =L3 =L2 =L1
15 =L2 =L1 =9

Uvodimo i desnu stranu sistema jednačina. U G13 unosimo potpis “B=”, au H13-H15 unosimo, respektivno, veze do ćelija “=L7”, “=L6”, “=L2”. Sistem rješavamo matričnim metodom. Iz više matematike je poznato da je rješenje jednako A -1 B. Pronađite inverznu matricu. Da biste to učinili, u ćeliju J13 unesite potpis „A arr.“. i, postavljajući kursor u K13, postavite MOBR formulu (kategorija “Matematički”). Kao argument niza, dajemo referencu na ćelije B13:D15. Rezultat bi također trebao biti 4x4 matrica. Da biste ga dobili, zaokružite mišem ćelije K13-M15, odaberite ih i pritisnite F2 i Ctrl+Shift+Enter. Rezultat je matrica A -1. Nađimo sada proizvod ove matrice i kolone B (ćelije H13-H15). U ćeliju A18 upisujemo potpis „Koeficijenti“, au ćeliju B18 postavljamo VIŠE funkcije (kategorija „Matematički“). Argumenti funkcije „Niz 1” su veza sa matricom A-1 (ćelije K13-M15), au polju „Niz 2” dajemo vezu sa kolonom B (ćelije H13-H16). Zatim odaberite B18-B20 i pritisnite F2 i Ctrl+Shift+Enter. Rezultirajući niz su koeficijenti regresione jednadžbe a, b, c. Kao rezultat, dobijamo jednačinu regresije oblika: y = 1,201082x 2 – 5,619177x + 78,48095.

Napravimo grafove originalnih podataka i onih dobijenih na osnovu jednadžbe regresije. Da biste to učinili, unesite potpis "Regresija" u ćeliju A8 i unesite formulu "=$B$18*B3+$B$19*B1+$B$20" u ćeliju B8. Koristeći AutoFill, prenosimo formulu u ćelije B8-K8. Da biste napravili grafikon, odaberite ćelije B8-K8 i, držeći pritisnutu tipku Ctrl, također odaberite ćelije B2-M2. Pozovite čarobnjaka za grafikone, izaberite tip grafikona „Grafikon“, tip grafikona – grafikon sa tačkama (drugi odozgo lijevo), kliknite „Dalje“, idite na karticu „Serija“ i u polju „Oznake X-ose“ napravite vezu do B2-M2, kliknite na "Spremno". Vidi se da se krive skoro poklapaju.

ZAKLJUČAK: U procesu rada, na osnovu eksperimentalnih podataka, naučio sam da konstruišem regresionu jednačinu oblika y = ax 2 + bx + c.





Empirijska gustina raspodjele slučajne analizirane varijable i izračunavanje njenih karakteristika Odrediti raspon dostupnih podataka, tj. razlika između najveće i najmanje vrijednosti uzorka (R = Xmax – Xmin): Odabir broja intervala grupisanja k za broj opservacija n<100 – ориентировочное значение интервалов можно рассчитать с использованием формулы Хайнхольда и Гаеде: ...

Podaci, mogu pouzdano suditi o statističkim odnosima koji postoje između varijabli koje se proučavaju u ovom eksperimentu. Sve metode matematičke i statističke analize konvencionalno se dijele na primarne i sekundarne. Primarne metode su one koje se mogu koristiti za dobijanje indikatora koji direktno odražavaju rezultate mjerenja izvršenih u eksperimentu. Shodno tome, pod...

Procesori opšte namene (na primer, Excel, Lotus 1-2-3, itd.), kao i neke baze podataka. Zapadni statistički paketi (SPSS, SAS, BMDP, itd.) imaju sljedeće mogućnosti: Omogućavaju vam da obrađujete ogromne količine podataka. Uključuje alate za opisivanje zadataka na ugrađenom jeziku. Oni omogućavaju izgradnju sistema za obradu informacija na njihovoj osnovi za čitava preduzeća. Dopustiti...



Kurs masaže i 1-2 mjeseca nakon nje. 1.2 Oblici terapijske masaže Oblik terapeutske masaže se dijeli na opću i privatnu. Ovi oblici su tipični za sve vrste i metode masaže. I privatnu i opštu masažu može izvoditi masažni terapeut u vidu međusobne masaže, parove masaže ili samomasaže. 1.2.1 Opća masaža Opća masaža je takva masaža (bez obzira na...

x 0 1 2 3 4 5 6 7 8 9
y 29,8 58,8 72,2 101,5 141 135,1 156,6 181,7 216,6 208,2
X^2 0 1 4 9 16 25 36 49 64 81
X^3 0 1 8 27 64 125 216 343 512 729
X^4 0 1 16 81 256 625 1296 2401 4096 6561
X*Y 0 58,8 144,4 304,5 564 675,5 939,6 1271,9 1732,8 1873,8
X^2*Y 0 58,8 288,8 913,5 2256 3377,5 5637,6 8903,3 13862,4 16864,2
Regresija. 78,48095 85,30121 94,52364 106,1482 120,175 136,6039 155,435 176,6682 200,3036 226,3412
A= 15333 2025 285 B= 52162,1 A Arr. 0,003247 -0,03247 0,059524
2025 285 45 7565,3 -0,03247 0,341342 -0,67857
285 45 9 1301,5 0,059524 -0,67857 1,619048
Koeficijent 1,201082 a
5,619177

5. novembar 2012. 5. novembar 2012. 5. novembar 2012. 5. novembar 2012. Predavanje 6. Poređenje dva uzorka 6-1. Hipoteza jednakosti sredstava. Upareni uzorci 6-2 Interval pouzdanosti za razliku u srednjim vrijednostima. Upareni uzorci 6-3. Hipoteza jednakosti varijansi 6-4. Hipoteza jednakosti udjela 6-5. Interval pouzdanosti za razliku u proporcijama


2 Ivanov O.V., 2005. U ovom predavanju... U prethodnom predavanju testirali smo hipotezu o jednakosti proseka dve opšte populacije i konstruisali interval povjerenja za razliku srednjih vrednosti za slučaj nezavisnih uzoraka. Sada ćemo razmotriti kriterijum za testiranje hipoteze jednakosti srednjih vrednosti i konstruisati interval poverenja za razliku srednjih vrednosti u slučaju uparenih (zavisnih) uzoraka. Zatim će se u odjeljku 6-3 testirati hipoteza jednakosti varijansi, u dijelu 6-4 - hipoteza jednakosti udjela. Konačno, konstruišemo interval pouzdanosti za razliku u proporcijama.


5. novembar 2012. 5. novembar 2012. 5. novembar 2012. 5. novembar 2012. Hipoteza jednakosti sredstava. Upareni uzorci Izjava o problemu Hipoteze i statistika Redoslijed radnji Primjer


4 Ivanov O.V., 2005 Upareni uzorci. Opis problema Šta imamo 1. Dva jednostavna slučajna uzorka dobijena iz dvije opšte populacije. Uzorci su upareni (ovisni). 2. Oba uzorka imaju veličinu n 30. Ako nisu, onda su oba uzorka uzeta iz normalno raspoređenih populacija. Ono što želimo je testirati hipotezu o razlici između srednjih vrijednosti dvije populacije:


5 Ivanov O.V., 2005 Statistika za uparene uzorke Za testiranje hipoteze koristi se statistika: gdje je razlika između dvije vrijednosti u jednom paru - opći prosjek za uparene razlike - prosjek uzorka za uparene razlike - standardna devijacija razlike za uzorak - broj parova


6 Ivanov O.V., 2005 Primjer. Obuka studenata Grupa od 15 polaznika polagala je test prije i nakon obuke. Rezultati ispitivanja su u tabeli. Testirajmo hipotezu za uparene uzorke o odsustvu uticaja treninga na pripremu studenata na nivou značajnosti 0,05. Rješenje. Izračunajmo razlike i njihove kvadrate. Student PrijeNakon Σ= 21 Σ= 145


7 Ivanov O.V., 2005 Rješenje Korak 1. Glavna i alternativna hipoteza: Korak 2. Postavlja se nivo značajnosti =0,05. Korak 3. Koristeći tabelu za df = 15 – 1=14, nalazimo kritičnu vrijednost t = 2,145 i upišemo kritično područje: t > 2,145. 2.145."> 2.145."> 2.145." title="7 Ivanov O.V., 2005. Rješenje Korak 1. Glavne i alternativne hipoteze: Korak 2. Nivo značajnosti je postavljen = 0.05. Korak 3. Po tabeli za df = 15 – 1=14 nalazimo kritičnu vrijednost t = 2.145 i zapisujemo kritično područje: t > 2.145."> title="7 Ivanov O.V., 2005 Rješenje Korak 1. Glavna i alternativna hipoteza: Korak 2. Postavlja se nivo značajnosti =0,05. Korak 3. Koristeći tabelu za df = 15 – 1=14, nalazimo kritičnu vrijednost t = 2,145 i upišemo kritično područje: t > 2,145."> !}




9 Ivanov O.V., 2005. Statistika rješenja uzima vrijednost: Korak 5. Uporedite dobijenu vrijednost sa kritičnim područjem. 1.889


5. novembar 2012. 5. novembar 2012. 5. novembar 2012. 5. novembar 2012. Interval pouzdanosti za razliku u srednjim vrijednostima. Upareni uzorci Izjava problema Metoda za konstruisanje intervala pouzdanosti Primjer


11 Ivanov O.V., 2005 Opis problema Šta imamo Imamo dva slučajna uparena (zavisna) uzorka veličine n iz dvije opšte populacije. Opšte populacije imaju normalan zakon distribucije sa parametrima 1, 1 i 2, 2 ili su zapremine oba uzorka 30. Ono što želimo je da procijenimo prosječnu vrijednost uparenih razlika za dvije opšte populacije. Da biste to učinili, konstruirajte interval povjerenja za prosjek u obliku:






5. novembar 2012. 5. novembar 2012. 5. novembar 2012. 5. novembar 2012. Hipoteza jednakosti varijansi Izjava o problemu Hipoteze i statistika Redoslijed radnji Primjer


15 Ivanov O.V., 2005 Tokom studije... Istraživač će možda morati da proveri pretpostavku da su varijanse dve populacije koje se proučavaju jednake. U slučaju kada ove opšte populacije imaju normalna distribucija, za to postoji F-test, koji se naziva i Fišerov kriterijum. Za razliku od Studenta, Fischer nije radio u pivari.


16 Ivanov O.V., 2005 Opis problema Šta imamo 1. Dva jednostavna slučajna uzorka dobijena iz dvije normalno raspoređene populacije. 2. Uzorci su nezavisni. To znači da ne postoji veza između ispitanika uzorka. Ono što želimo je da testiramo hipotezu o jednakosti varijansi populacije:














23 Ivanov O.V., 2005. Primjer Medicinski istraživač želi provjeriti postoji li razlika između pulsa pušača i nepušača (broj otkucaja u minuti). Rezultati dvije nasumično odabrane grupe prikazani su u nastavku. Koristeći α = 0,05, saznajte da li je doktor u pravu. Pušači Nepušači


24 Ivanov O.V., 2005 Rješenje Korak 1. Glavne i alternativne hipoteze: Korak 2. Postavlja se nivo značajnosti =0,05. Korak 3. Koristeći tabelu za broj stupnjeva slobode brojnika 25 i nazivnika 17, nalazimo kritičnu vrijednost f = 2,19 i kritično područje: f > 2,19. Korak 4. Koristeći uzorak, izračunavamo statističku vrijednost: 2.19. Korak 4. Koristeći uzorak, izračunavamo statističku vrijednost: ">




5. novembar 2012. 5. novembar 2012. 5. novembar 2012. 5. novembar 2012. Hipoteza jednakih udjela Izjava o problemu Hipoteze i statistika Redoslijed radnji Primjer


27 Ivanov O.V., 2005. Pitanje Od 100 nasumično odabranih studenata Fakulteta sociologije, 43 pohađaju specijalne kurseve. Od 200 nasumično odabranih studenata ekonomije, njih 90 pohađa specijalne kurseve. Da li se udio studenata koji pohađaju specijalne kurseve razlikuje između odsjeka sociologije i ekonomije? Čini se da se ne razlikuje bitno. Kako mogu ovo provjeriti? Udio onih koji pohađaju specijalne kurseve je udio atributa. 43 – broj “uspjeha”. 43/100 – udio uspjeha. Terminologija je ista kao u Bernoullijevoj šemi.


28 Ivanov O.V., 2005 Opis problema Šta imamo 1. Dva jednostavna slučajna uzorka dobijena iz dvije normalno raspoređene populacije. Uzorci su nezavisni. 2. Za uzorke su ispunjeni np 5 i nq 5. To znači da najmanje 5 elemenata uzorka ima proučavanu karakterističnu vrijednost, a najmanje 5 nema. Ono što želimo je testirati hipotezu o jednakosti udjela neke karakteristike u dvije opće populacije:






31 Ivanov O.V., 2005 Primjer. Specijalni kursevi dva fakulteta Od 100 nasumično odabranih studenata sociološkog fakulteta, 43 pohađaju specijalne kurseve. Od 200 studenata ekonomije, njih 90 pohađa specijalne kurseve. Na nivou značajnosti = 0,05 testirati hipotezu da ne postoji razlika između udjela studenata koji pohađaju specijalne kurseve na ova dva fakulteta. 33 Ivanov O.V., 2005 Rješenje Korak 1. Glavne i alternativne hipoteze: Korak 2. Postavlja se nivo značajnosti =0,05. Korak 3. Koristeći tablicu normalne raspodjele, nalazimo kritične vrijednosti z = – 1,96 i z = 1,96 i konstruišemo kritično područje: z 1,96. Korak 4. Na osnovu uzorka izračunavamo vrijednost statistike.


34 Ivanov O.V., 2005 Rešenje Korak 5. Uporedite dobijenu vrednost sa kritičnim područjem. Rezultirajuća statistička vrijednost nije bila unutar kritičnog područja. Korak 6. Formulirajte zaključak. Nema razloga da se odbaci glavna hipoteza. Udio onih koji pohađaju specijalne kurseve ne razlikuje se statistički značajno.


5. novembar 2012. 5. novembar 2012. 5. novembar 2012. 5. novembar 2012. Interval pouzdanosti za razliku u proporcijama Izjava o problemu Metoda za konstruisanje intervala poverenja Primer





Razmotrimo dva nezavisna uzorka x 1, x 2, ….., x n i y 1, y 2, …, y n, izdvojena iz normalnih populacija sa jednakim varijacijama, sa veličinama uzorka n i m, respektivno, i prosjecima μ x, μ y i varijansa σ 2 su nepoznati. Potrebno je testirati glavnu hipotezu H 0: μ x = μ y sa konkurentskom H 1: μ x μ y.

Kao što je poznato, proseci uzorka će imati sledeća svojstva: ~N(μ x, σ 2 /n), ~N(μ y, σ 2 /m).

Njihova razlika je normalna vrijednost sa prosjekom i varijansa, dakle

~ (23).

Pretpostavimo za trenutak da je glavna hipoteza H 0 tačna: μ x – μ y =0. Onda i podijelimo vrijednost sa njenom standardnom devijacijom, dobijamo standardnu ​​normalu sl. Veličina ~N(0,1).

Ranije je navedeno da magnitude raspoređeno prema zakonu sa (n-1) stepenom slobode, a - po zakonu sa (m-1) stepenima slobode. Uzimajući u obzir nezavisnost ova dva zbira, nalazimo da jesu ukupan iznos raspoređeno po zakonu sa n+m-2 stepena slobode.

Sjećajući se koraka 7, vidimo da je razlomak poštuje t-distribuciju (Student) sa ν=m+n-2 stepena slobode: Z=t. Ova činjenica se javlja samo kada je hipoteza H 0 tačna.

Zamenivši ξ i Q njihovim izrazima, dobijamo proširenu formulu za Z:

(24)

Sljedeća Z vrijednost, nazvana statistika kriterija, omogućava vam da donesete odluku sa sljedećim redoslijedom akcija:

1. Utvrđuje se površina D=[-t β,ν , +t β,ν ] koja sadrži β=1–α površine ispod krivulje raspodjele t ν (tablica 10).

2. Eksperimentalna vrijednost Z on statistike Z izračunava se pomoću formule (24), za koju se umjesto X 1 i Y 1 zamjenjuju vrijednosti x 1 i y 1 određenih uzoraka, kao i njihova srednje vrijednosti uzorka i . .

3. Ako je Z na D, onda se smatra da hipoteza H 0 nije u suprotnosti sa eksperimentalnim podacima i prihvata se.

Ako je Z na D, onda je hipoteza H 1 prihvaćena.

Ako je hipoteza H 0 tačna, onda Z ispunjava poznatu t ν -distribuciju sa nultom srednjom vrijednosti i sa velikom vjerovatnoćom β = 1–α pada u D-područje prihvatanja hipoteze H 0 . Kada posmatrana, eksperimentalna vrijednost Z on padne u D. Ovo smatramo dokazom u prilog hipotezi H 0.

Kada Z 0 n leži izvan D (kako kažu, leži u kritičnom području K), što je prirodno ako je hipoteza H 1 tačna, ali malo vjerovatno ako je H 0 tačna, tada hipotezu H 0 možemo odbaciti samo prihvatanjem H 1 .

Primjer 31.

Upoređuju se dva razreda benzina: A i B. Na 11 vozila iste snage, jednom su testirani benzini razreda A i B na kružnoj šasiji. Jedan automobil se pokvario na putu i za njega nema podataka o benzinu B.

Potrošnja benzina na 100 km

Tabela 12

i
X i 10,51 11,86 10,5 9,1 9,21 10,74 10,75 10,3 11,3 11,8 10,9 n=11
U i 13,22 13,0 11,5 10,4 11,8 11,6 10,64 12,3 11,1 11,6 - m=10

Varijanca u potrošnji benzina razreda A i B je nepoznata i pretpostavlja se da je ista. Da li je moguće, na nivou značajnosti α=0,05, prihvatiti hipotezu da su pravi prosječni troškovi μ A i μ B ovih vrsta benzina isti?

Rješenje. Testiranje hipoteze H 0: μ A -μ B = 0 sa konkurentskom. H 1:μ 1 μ 2 uradite sledeće:

1. Nađite srednje vrijednosti uzorka i zbir kvadrata odstupanja Q.

;

;

2. Izračunajte eksperimentalnu vrijednost Z statistike

3. Iz Tabele 10 t-distribucije nalazimo granicu t β,ν za broj stupnjeva slobode ν=m+n–2=19 i β=1–α=0,95. Tabela 10 ima t 0,95,20 =2,09 i t 0,95,15 =2,13, ali ne i t 0,95,19. Interpolacijom nalazimo t 0,95,19 =2,09+ =2,10.

4. Provjerite koje od dvije oblasti D ili K sadrži broj Zon. Zona=-2,7 D=[-2,10; -2,10].

Pošto posmatrana vrijednost Z on leži u kritičnom području, K = R\D, odbacujemo je. H 0 i prihvati hipotezu H 1. U ovom slučaju kažu da je njihova razlika značajna. Da se, pod svim uslovima ovog primjera, samo Q promijenio, recimo, Q se udvostručio, onda bi se naš zaključak promijenio. Udvostručavanje Q bi dovelo do smanjenja vrijednosti Zon za faktor, a zatim bi broj Zon pao u dozvoljeno područje D, tako da bi hipoteza H 0 izdržala test i bila prihvaćena. U ovom slučaju, neslaganje između i bi se objasnilo prirodnim rasipanjem podataka, a ne činjenicom da je μ A μ B.

Teorija testiranja hipoteza je vrlo opsežna; hipoteze mogu biti o vrsti zakona raspodjele, o homogenosti uzoraka, o nezavisnosti sljedećih veličina, itd.

KRITERIJ c 2 (PEARSON)

Najčešći kriterij u praksi za testiranje jednostavne hipoteze. Primjenjuje se kada je zakon distribucije nepoznat. Razmotrimo slučajnu varijablu X nad kojom je n nezavisni testovi. Dobija se realizacija x 1 , x 2 ,...,x n. Potrebno je ispitati hipotezu o zakonu raspodjele ove slučajne varijable.

Razmotrimo slučaj jednostavne hipoteze. Jednostavna hipoteza testira usklađenost uzorka sa populacijom koja je normalno raspoređena (poznata). Gradimo po uzorcima varijantne serije x (1) , x (2) , ..., x (n) . Interval dijelimo na podintervale. Neka su ovi intervali r. Tada ćemo naći vjerovatnoću da će X, kao rezultat testa, pasti u interval Di, i=1,...,r ako je hipoteza koja se testira tačna.

Kriterijum ne provjerava istinitost gustine vjerovatnoće, već istinitost brojeva

Svakom intervalu Di povezujemo slučajni događaj A i - pogodak u ovom intervalu (pogod kao rezultat testa na X njegove implementacije rezultat u Di). Hajde da uvedemo slučajne varijable. m i je broj provedenih testova od n u kojima se dogodio događaj A i. m i su raspoređeni prema binomskom zakonu i ako je hipoteza tačna

Dm i =np i (1-p i)

Kriterijum c 2 ima oblik

p 1 +p 2 +...+p r =1

m 1 +m 2 +...+m r =n

Ako je hipoteza koja se testira tačna, tada m i predstavlja učestalost pojavljivanja događaja koji ima vjerovatnoću pi u svakom od n pokušaja, stoga možemo smatrati m i kao slučajnu varijablu koja podliježe binomnom zakonu sa središtem u tački npi. Kada je n veliko, onda možemo pretpostaviti da je frekvencija raspoređena asimptotski normalno sa istim parametrima. Ako je hipoteza tačna, treba očekivati ​​da će oni biti asimptotski normalno raspoređeni

međusobno povezani odnosom

Kao mjeru neslaganja između podataka uzorka m 1 +m 2 +...+m r i teoretskog np 1 +np 2 +...+np r, razmotrite vrijednost

c 2 - zbir kvadrata pridruženih asimptotski normalnih veličina linearna zavisnost. Ranije smo se susreli sa sličnim slučajem i znamo da je prisustvo linearne veze dovelo do smanjenja broja stepeni slobode za jedan.

Ako je hipoteza koja se testira tačna, onda kriterij c 2 ima distribuciju koja teži kao n®¥ prema raspodjeli c 2 sa r-1 stupnjeva slobode.

Pretpostavimo da je hipoteza pogrešna. Tada postoji tendencija povećanja zbirnih članova, tj. ako je hipoteza netočna, tada će ovaj zbir pasti u određeno područje velikih vrijednosti c 2. Kao kritično područje uzimamo područje pozitivnih vrijednosti kriterija


U slučaju nepoznatih parametara distribucije, svaki parametar smanjuje broj stupnjeva slobode za Pearsonov kriterij za jedan

8.1. Koncept zavisnih i nezavisnih uzoraka.

Odabir kriterija za testiranje hipoteze

je prvenstveno određena time da li su uzorci koji se razmatraju zavisni ili nezavisni. Hajde da uvedemo odgovarajuće definicije.

Def. Uzorci se pozivaju nezavisni, ako postupak odabira jedinica u prvom uzorku nije ni na koji način povezan sa postupkom odabira jedinica u drugom uzorku.

Primjer dva nezavisna uzorka bi bili uzorci muškaraca i žena koji rade u istom preduzeću (u istoj industriji, itd.) o kojima je bilo riječi gore.

Imajte na umu da nezavisnost dva uzorka uopće ne znači da ne postoji zahtjev za određenom vrstom sličnosti ovih uzoraka (njihova homogenost). Stoga, kada proučavamo nivo prihoda muškaraca i žena, malo je vjerovatno da ćemo dopustiti situaciju da se muškarci biraju između moskovskih biznismena, a žene iz aboridžina Australije. Žene takođe treba da budu Moskovljanke i, štaviše, „poslovne žene“. Ali ovdje nije riječ o ovisnosti uzoraka, već o zahtjevu homogenosti proučavane populacije objekata, koji mora biti zadovoljen i pri prikupljanju i pri analizi socioloških podataka.

Def. Uzorci se pozivaju zavisni ili upareni, ako je svaka jedinica jednog uzorka „povezana” sa određenom jedinicom drugog uzorka.

Ova posljednja definicija vjerovatno će postati jasnija ako damo primjer zavisnih uzoraka.

Pretpostavimo da želimo da saznamo da li je socijalni status oca u proseku niži od socijalnog statusa sina (verujemo da možemo izmeriti ovo složeno i dvosmisleno shvaćeno društvene karakteristike osoba). Čini se očiglednim da je u takvoj situaciji preporučljivo odabrati parove ispitanika (otac, sin) i pretpostaviti da je svaki element prvog uzorka (jedan od očeva) „vezan“ za određeni element drugog uzorka (njegov sin). Ova dva uzorka će se zvati zavisna.

8.2. Testiranje hipoteza za nezavisne uzorke

Za nezavisni uzoraka, izbor kriterijuma zavisi od toga da li znamo opšte varijanse s 1 2 i s 2 2 karakteristike koja se razmatra za uzorke koji se proučavaju. Ovaj problem ćemo smatrati riješenim, pod pretpostavkom da se varijanse uzorka poklapaju sa općim. U ovom slučaju, kriterij je vrijednost:

Prije nego što pređemo na raspravu o situaciji kada su nam opće varijanse (ili barem jedna od njih) nepoznate, napominjemo sljedeće.

Logika korišćenja kriterijuma (8.1) je slična onoj koju smo opisali kada smo razmatrali kriterijum „hi-kvadrat“ (7.2). Postoji samo jedna fundamentalna razlika. Govoreći o značenju kriterija (7.2), razmatrali smo beskonačan broj uzoraka veličine n, „izvučenih“ iz našeg stanovništva. Ovdje, analizirajući značenje kriterija (8.1), prelazimo na razmatranje beskonačnog broja pare uzorci veličine n 1 i n 2. Za svaki par izračunava se statistika oblika (8.1). Ukupno dobijene vrijednosti takve statistike, u skladu s našom notacijom, odgovara normalnoj raspodjeli (kao što smo se dogovorili, slovo z se koristi za označavanje takvog kriterija kojem odgovara normalna raspodjela).

Dakle, ako su nam opšte varijanse nepoznate, onda smo primorani da umjesto toga koristimo njihove procjene uzorka s 1 2 i s 2 2. Međutim, u ovom slučaju, normalnu distribuciju treba zamijeniti Studentovom raspodjelom - z treba zamijeniti sa t (kao što je bio slučaj u sličnoj situaciji pri konstruiranju intervala povjerenja za matematičko očekivanje). Međutim, kod dovoljno velikih veličina uzorka (n 1, n 2 ³ 30), kao što već znamo, Studentova raspodjela se praktično poklapa sa normalnom. Drugim riječima, za velike uzorke možemo nastaviti koristiti kriterij:

Situacija je složenija kada su varijanse nepoznate, a veličina barem jednog uzorka mala. Tada dolazi u obzir još jedan faktor. Vrsta kriterija ovisi o tome možemo li nepoznate varijanse razmatrane karakteristike u dva analizirana uzorka smatrati jednakima. Da bismo saznali, moramo testirati hipotezu:

H 0: s 1 2 = s 2 2. (8.3)

Za provjeru ove hipoteze koristi se kriterij

O specifičnostima korištenja ovog kriterija razgovaraćemo u nastavku, a sada ćemo nastaviti da raspravljamo o algoritmu za odabir kriterijuma koji se koristi za testiranje hipoteza o jednakosti matematičkih očekivanja.

Ako se hipoteza (8.3) odbaci, onda kriterij koji nas zanima ima oblik:

(8.5)

(tj. razlikuje se od kriterijuma (8.2), koji je korišćen za velike uzorke, po tome što odgovarajuća statistika nema normalnu, već Studentovu distribuciju). Ako se prihvati hipoteza (8.3), tada se mijenja tip korištenog kriterija:

(8.6)

Sumirajmo kako se odabire kriterij za testiranje hipoteze o jednakosti općih matematičkih očekivanja na osnovu analize dva nezavisna uzorka.

poznato

nepoznato

veličina uzorka je velika

H 0: s 1 = s 2 odbijeno

Prihvaćeno

8.3. Testiranje hipoteza za zavisne uzorke

Pređimo na razmatranje zavisnih uzoraka. Neka nizovi brojeva

X 1, X 2, …, X n;

Y 1 , Y 2 , … , Y n –

ovo su vrijednosti razmatrane slučajne jedinice za elemente dva zavisna uzorka. Hajde da uvedemo notaciju:

D i = X i - Y i , i = 1, ... , n.

Za zavisan kriterij uzorka koji vam omogućava da testirate hipotezu

kao što slijedi:

Imajte na umu da upravo dati izraz za s D nije ništa drugo do novi izraz za poznata formula, izražavajući standardnu ​​devijaciju. U ovom slučaju govorimo o standardnoj devijaciji vrijednosti D i. Slična formula se često koristi u praksi kao jednostavnija (u usporedbi s "direktnim" proračunom sume kvadrata odstupanja vrijednosti razmatrane vrijednosti od odgovarajuće aritmetičke sredine) metoda izračunavanja disperzije.

Ako uporedimo gornje formule s onima koje smo koristili kada smo raspravljali o principima konstruiranja intervala povjerenja, lako je primijetiti da je testiranje hipoteze jednakosti srednjih vrijednosti za slučaj zavisnih uzoraka u suštini testiranje jednakosti matematičkog očekivanja vrijednosti D i na nulu. Magnituda

je standardna devijacija za D i . Stoga je vrijednost upravo opisanog kriterija t n -1 u suštini jednaka vrijednosti D i izraženoj kao dio standardne devijacije. Kao što smo već rekli (kada se raspravlja o metodama za konstruisanje intervala poverenja), ovaj indikator se može koristiti za procenu verovatnoće razmatrane vrednosti Di. Razlika je u tome što smo gore govorili o jednostavnoj aritmetičkoj sredini, normalno raspoređenoj, a ovdje govorimo o prosječnim razlikama, takvi prosjeci imaju Studentovu distribuciju. Ali razmišljanje o odnosu između vjerovatnoće odstupanja aritmetičke sredine uzorka od nule (sa matematičko očekivanje, jednako nuli) s koliko jedinica s ovo odstupanje iznosi da ostane na snazi.

Primjer. Prihod apoteka u jednom od gradskih mikrokvartova za određeni period iznosio je 128; 192; 223; 398; 205; 266; 219; 260; 264; 98 (konvencionalne jedinice). U susjednom mikrookrugu za isto vrijeme iznosili su 286; 240; 263; 266; 484; 223; 335.
Za oba uzorka izračunajte srednju vrijednost, ispravljenu varijansu i standardnu ​​devijaciju. Pronađite raspon varijacije, prosječno apsolutno (linearno) odstupanje, koeficijent varijacije, linearni koeficijent varijacije, koeficijent oscilacije.
Pod pretpostavkom da je ovo slučajna vrijednost ima normalnu distribuciju, odredite interval pouzdanosti za opštu sredinu (u oba slučaja).
Koristeći Fisherov kriterij provjerite hipotezu o jednakosti općih varijansi. Pomoću Studentovog testa provjerite hipotezu o jednakosti općih srednjih vrijednosti (alternativna hipoteza je o njihovoj nejednakosti).
U svim proračunima, nivo značajnosti je α = 0,05.

Rješenje provodimo pomoću kalkulatora Testiranje hipoteze jednakosti varijansi.
1. Pronađite indikatore varijacije za prvi uzorak.

x|x - x av |(x - x prosječno) 2
98 127.3 16205.29
128 97.3 9467.29
192 33.3 1108.89
205 20.3 412.09
219 6.3 39.69
223 2.3 5.29
260 34.7 1204.09
264 38.7 1497.69
266 40.7 1656.49
398 172.7 29825.29
2253 573.6 61422.1


.



Indikatori varijacije.
.

R = X max - X min
R = 398 - 98 = 300
Prosječna linearna devijacija


Svaka vrijednost serije razlikuje se od druge u prosjeku za 57,36
Disperzija


Nepristrasna procjena varijanse


.

Svaka vrijednost serije razlikuje se od prosječne vrijednosti od 225,3 u prosjeku za 78,37
.

.

Koeficijent varijacije

Pošto v>30%, ali v ili

Koeficijent oscilacije

.
.


Koristeći Studentovu tabelu nalazimo:
T tabela (n-1;α/2) = T tabela (9;0,025) = 2,262

(225.3 - 59.09;225.3 + 59.09) = (166.21;284.39)

2. Pronađite indikatore varijacije za drugi uzorak.
Hajde da rangiramo red. Da bismo to učinili, sortiramo njegove vrijednosti uzlaznim redoslijedom.
Tabela za izračunavanje indikatora.

x|x - x av |(x - x prosječno) 2
223 76.57 5863.18
240 59.57 3548.76
263 36.57 1337.47
266 33.57 1127.04
286 13.57 184.18
335 35.43 1255.18
484 184.43 34013.9
2097 439.71 47329.71

Za procjenu serije distribucije nalazimo sljedeće indikatore:
Indikatori distributivnog centra.
Jednostavni aritmetički prosjek


Indikatori varijacije.
Apsolutne varijacije.
Opseg varijacije je razlika između maksimalne i minimalne vrijednosti karakteristike primarne serije.
R = X max - X min
R = 484 - 223 = 261
Prosječna linearna devijacija- izračunati kako bi se uzele u obzir razlike svih jedinica populacije koja se proučava.


Svaka vrijednost serije razlikuje se od druge u prosjeku za 62,82
Disperzija- karakteriše mjeru disperzije oko njene prosječne vrijednosti (mjera disperzije, tj. odstupanja od prosjeka).


Nepristrasna procjena varijanse- konzistentna procjena varijanse (ispravljena varijansa).


Standardna devijacija.

Svaka vrijednost serije razlikuje se od prosječne vrijednosti od 299,57 u prosjeku za 82,23
Procjena standardne devijacije.

Mjere relativne varijacije.
Relativni indikatori varijacije uključuju: koeficijent oscilacije, linearni koeficijent varijacije, relativno linearno odstupanje.
Koeficijent varijacije- mjera relativne disperzije vrijednosti populacije: pokazuje koliki je udio prosječne vrijednosti ove vrijednosti njena prosječna disperzija.

Pošto je v ≤ 30%, populacija je homogena i varijacija je slaba. Dobijeni rezultati se mogu vjerovati.
Linearni koeficijent varijacije ili Relativna linearna devijacija- karakteriše udio prosječne vrijednosti predznaka apsolutnih odstupanja od prosječne vrijednosti.

Koeficijent oscilacije- odražava relativnu fluktuaciju ekstremnih vrijednosti karakteristike oko prosjeka.

Intervalna procjena naseljenog centra.
Interval pouzdanosti za opću srednju vrijednost.

Odredite vrijednost t kp koristeći Studentovu tablicu raspodjele
Koristeći Studentovu tabelu nalazimo:
T tablica (n-1;α/2) = T tablica (6;0,025) = 2,447

(299.57 - 82.14;299.57 + 82.14) = (217.43;381.71)
Sa vjerovatnoćom od 0,95, može se reći da prosječna vrijednost sa većom veličinom uzorka neće izaći izvan pronađenog intervala.
Testiramo hipotezu o jednakosti varijansi:
H 0: D x = D y ;
H 1: D x Nađimo uočenu vrijednost Fisherovog kriterija:

Pošto je s y 2 > s x 2, onda je s b 2 = s y 2, s m 2 = s x 2
Broj stepeni slobode:
f 1 = n y – 1 = 7 – 1 = 6
f 2 = n x – 1 = 10 – 1 = 9
Koristeći tablicu kritičnih tačaka Fisher-Snedecorove distribucije na nivou značajnosti α = 0,05 i datim brojevima stupnjeva slobode, nalazimo F cr (6;9) = 3,37
Jer F obs. Testiramo hipotezu o jednakosti općih srednjih vrijednosti:


Nađimo eksperimentalnu vrijednost Studentovog kriterija:


Broj stupnjeva slobode f = n x + n y – 2 = 10 + 7 – 2 = 15
Odredite vrijednost t kp koristeći Studentovu tablicu raspodjele
Koristeći Studentovu tabelu nalazimo:
T tablica (f;α/2) = T tablica (15;0,025) = 2,131
Koristeći tabelu kritičnih tačaka Studentove distribucije na nivou značajnosti α = 0,05 i datom broju stepeni slobode, nalazimo tcr = 2,131
Jer t obs.



Novo na sajtu

>

Najpopularniji