Dom Stomatitis Interval pouzdanosti je jednak. Interval povjerenja

Interval pouzdanosti je jednak. Interval povjerenja

U statistici postoje dvije vrste procjena: tačka i interval. Tačka procjena predstavlja posebnu statistiku uzorka koja se koristi za procjenu parametra stanovništva. Na primjer, srednja vrijednost uzorka je bodovna procjena matematičko očekivanje populaciju i varijansu uzorka S 2- bodovna procjena varijanse populacije σ 2. pokazalo se da je srednja vrijednost uzorka nepristrasna procjena matematičkog očekivanja populacije. Srednja vrijednost uzorka se naziva nepristrasna jer je prosjek svih srednjih vrijednosti uzorka (sa istom veličinom uzorka) n) jednak je matematičkom očekivanju opće populacije.

U cilju varijanse uzorka S 2 postala nepristrasna procjena varijanse stanovništva σ 2, nazivnik varijanse uzorka treba postaviti jednakim n – 1 , ali ne n. Drugim riječima, varijansa populacije je prosjek svih mogućih varijansi uzorka.

Prilikom procjene parametara populacije, treba imati na umu da statistika uzorka kao npr , ovise o konkretnim uzorcima. Uzeti ovu činjenicu u obzir, dobiti intervalna procjena matematičko očekivanje opće populacije, analizirati distribuciju srednjih vrijednosti uzorka (za više detalja vidjeti). Konstruisani interval karakteriše određeni nivo pouzdanosti, koji predstavlja verovatnoću da je pravi parametar populacije ispravno procenjen. Slični intervali pouzdanosti mogu se koristiti za procjenu udjela karakteristike R i glavna rasprostranjena masa stanovništva.

Preuzmite bilješku u formatu ili, primjere u formatu

Izgradnja intervala povjerenja za matematičko očekivanje populacije sa poznatom standardnom devijacijom

Izgradnja intervala povjerenja za udio neke karakteristike u populaciji

Ovaj odjeljak proširuje koncept intervala povjerenja na kategoričke podatke. Ovo nam omogućava da procijenimo udio ove karakteristike u populaciji R koristeći udio uzorka RS= X/n. Kao što je naznačeno, ako količine nR I n(1 – str) prelazi broj 5, binomna distribucija se može aproksimirati kao normalna. Dakle, procijeniti udio neke karakteristike u populaciji R moguće je konstruisati interval čiji je nivo pouzdanosti jednak (1 – α)x100%.


Gdje strS- proporcija uzorka karakteristike jednaka X/n, tj. broj uspjeha podijeljen s veličinom uzorka, R- udio karakteristike u opštoj populaciji, Z- kritična vrijednost standardizirane normalna distribucija, n- veličina uzorka.

Primjer 3. Pretpostavimo da je uzorak koji se sastoji od 100 faktura popunjenih tokom prošli mjesec. Recimo da je 10 ovih faktura sastavljeno sa greškama. dakle, R= 10/100 = 0,1. Nivo pouzdanosti od 95% odgovara kritičnoj vrijednosti Z = 1,96.

Dakle, vjerovatnoća da između 4,12% i 15,88% računa sadrži greške iznosi 95%.

Za datu veličinu uzorka, interval pouzdanosti koji sadrži udio karakteristike u populaciji izgleda širi nego za kontinuirani slučajna varijabla. To je zato što mjerenja kontinuirane slučajne varijable sadrže više informacija nego mjerenja kategoričkih podataka. Drugim riječima, kategorički podaci koji uzimaju samo dvije vrijednosti ne sadrže dovoljno informacija za procjenu parametara njihove distribucije.

INizračunavanje procjena ekstrahovanih iz konačne populacije

Procjena matematičkog očekivanja. Korekcioni faktor za konačnu populaciju ( fpc) je korišten za smanjenje standardne greške za faktor. Prilikom izračunavanja intervala pouzdanosti za procjene parametara populacije, faktor korekcije se primjenjuje u situacijama kada se uzorci uzimaju bez vraćanja. Dakle, interval pouzdanosti za matematičko očekivanje ima nivo pouzdanosti jednak (1 – α)x100%, izračunava se po formuli:

Primjer 4. Da bismo ilustrovali upotrebu faktora korekcije za konačnu populaciju, vratimo se problemu izračunavanja intervala pouzdanosti za prosječan iznos faktura, o čemu se govorilo u primjeru 3. Pretpostavimo da kompanija izdaje 5.000 faktura mjesečno, i =110,27 dolara, S= 28,95 dolara, N = 5000, n = 100, α = 0,05, t 99 = 1,9842. Koristeći formulu (6) dobijamo:

Procjena udjela neke karakteristike. Prilikom odabira bez povrata, interval pouzdanosti za udio atributa koji ima nivo pouzdanosti jednak (1 – α)x100%, izračunava se po formuli:

Intervali povjerenja i etička pitanja

Prilikom uzorkovanja populacije i izvođenja statističkih zaključaka često se javljaju etička pitanja. Glavni je način na koji se intervali povjerenja i procjene tačaka statistike uzorka slažu. Objavljivanje procjena tačaka objavljivanja bez specificiranja povezanih intervala pouzdanosti (obično na nivou pouzdanosti od 95%) i veličine uzorka iz kojeg su izvedene može stvoriti zabunu. Ovo može dati korisniku utisak da je bodovna procjena upravo ono što mu je potrebno da predvidi svojstva cjelokupne populacije. Stoga je potrebno shvatiti da u svakom istraživanju fokus ne treba biti na tačkastim procjenama, već na procjenama intervala. osim toga, Posebna pažnja treba dati pravi izbor veličine uzoraka.

Predmet statističke manipulacije najčešće su rezultati socioloških istraživanja stanovništva o određenim političkim temama. U ovom slučaju rezultati ankete se objavljuju na naslovnim stranicama novina, a greška uzorak ankete a metodologija za statističku analizu je odštampana negde u sredini. Da bi se dokazala validnost dobijenih tačaka, potrebno je navesti veličinu uzorka na osnovu koje su dobijene, granice intervala poverenja i nivo njegove značajnosti.

Sledeća napomena

Korišteni su materijali iz knjige Levin i dr. Statistika za menadžere. – M.: Williams, 2004. – str. 448–462

Centralna granična teorema navodi da se sa dovoljno velikom veličinom uzorka distribucija uzorka srednjih vrijednosti može aproksimirati normalnom distribucijom. Ovo svojstvo ne zavisi od vrste distribucije stanovništva.

U prethodnim pododjeljcima razmatrali smo pitanje procjene nepoznatog parametra A jedan broj. To se zove procjena “poen”. U brojnim zadacima, ne morate samo pronaći parametar A odgovarajuću numeričku vrijednost, ali i za procjenu njegove tačnosti i pouzdanosti. Morate znati do kojih grešaka može dovesti zamjena parametra A svoju tačku procenu A i sa kojim stepenom pouzdanosti možemo očekivati ​​da ove greške neće preći poznate granice?

Problemi ove vrste su posebno relevantni sa malim brojem zapažanja, kada je tačka procena i u je uglavnom nasumična i približna zamjena a sa a može dovesti do ozbiljnih grešaka.

Da biste dobili ideju o tačnosti i pouzdanosti procjene A,

V matematičke statistike Oni koriste takozvane intervale povjerenja i vjerovatnoće povjerenja.

Neka za parametar A nepristrasna procjena dobijena iz iskustva A.Želimo procijeniti moguću grešku u ovom slučaju. Dodijelimo neku dovoljno veliku vjerovatnoću p (na primjer, p = 0,9, 0,95 ili 0,99) tako da se događaj s vjerovatnoćom p može smatrati praktično pouzdanim, i pronađemo vrijednost s za koju

Zatim raspon praktički mogućih vrijednosti greške koja nastaje prilikom zamjene A on A, će biti ± s; Velike greške u apsolutnoj vrijednosti će se pojaviti samo sa malom vjerovatnoćom a = 1 - p. Prepišimo (14.3.1) kao:

Jednakost (14.3.2) znači da je sa vjerovatnoćom p nepoznata vrijednost parametar A spada u interval

Potrebno je napomenuti jednu okolnost. Ranije smo više puta razmatrali vjerovatnoću da slučajna varijabla padne u dati neslučajni interval. Ovdje je situacija drugačija: veličina A nije slučajan, ali interval / p je slučajan. Njegov položaj na x-osi je nasumičan, određen njegovim centrom A; Općenito, dužina intervala 2s je također slučajna, jer se vrijednost s izračunava, po pravilu, iz eksperimentalnih podataka. Stoga u u ovom slučaju bilo bi bolje protumačiti p vrijednost ne kao vjerovatnoću „pogotka“ tačke A u intervalu / p, i kao vjerovatnoća da će slučajni interval / p pokriti tačku A(Slika 14.3.1).

Rice. 14.3.1

Verovatnoća p se obično naziva verovatnoća poverenja, i interval / p - interval povjerenja. Granice intervala Ako. a x =a- s and a 2 = a + i zovu se granice poverenja.

Hajde da damo još jednu interpretaciju konceptu intervala poverenja: može se smatrati intervalom vrednosti parametara A, kompatibilan s eksperimentalnim podacima i nije im u suprotnosti. Zaista, ako se složimo da događaj s vjerovatnoćom a = 1-p smatramo praktički nemogućim, onda one vrijednosti parametra a za koje aa> s moraju biti prepoznate kao kontradiktorni eksperimentalni podaci, a oni za koje |a - A a t na 2 .

Neka za parametar A postoji nepristrasna procjena A. Kad bismo znali zakon raspodjele količine A, zadatak pronalaženja intervala povjerenja bio bi vrlo jednostavan: bilo bi dovoljno pronaći vrijednost s za koju

Poteškoća je u tome što zakon raspodjele procjena A zavisi od zakona raspodele veličine X i, prema tome, na njegove nepoznate parametre (posebno na sam parametar A).

Da biste zaobišli ovu poteškoću, možete koristiti sljedeću otprilike približnu tehniku: zamijenite nepoznate parametre u izrazu za s njihovim procjenama tačaka. Uz relativno veliki broj eksperimenata P(oko 20...30) ova tehnika obično daje rezultate koji su zadovoljavajući u smislu tačnosti.

Kao primjer, razmotrite problem intervala povjerenja za matematičko očekivanje.

Neka se proizvede P X,čije su karakteristike matematičko očekivanje T i varijansu D- nepoznato. Za ove parametre dobijene su sljedeće procjene:

Potrebno je konstruisati interval pouzdanosti / p odgovarajući verovatnoća poverenja p, za matematičko očekivanje T količine X.

Prilikom rješavanja ovog problema koristit ćemo se činjenicom da je količina T predstavlja zbir P nezavisne identično distribuirane slučajne varijable Xh a prema središnjoj graničnoj teoremi, za dovoljno veliku P njegov zakon raspodjele je blizu normalnog. U praksi, čak i sa relativno malim brojem članova (oko 10...20), zakon raspodjele sume može se približno smatrati normalnim. Pretpostavićemo da je vrednost T distribuiraju prema uobičajenom zakonu. Karakteristike ovog zakona - matematičko očekivanje i varijansa - su jednake, respektivno T I

(vidi poglavlje 13 pododjeljak 13.3). Pretpostavimo da je vrijednost D znamo i naći ćemo vrijednost Ep za koju

Koristeći formulu (6.3.5) iz poglavlja 6, izražavamo vjerovatnoću na lijevoj strani (14.3.5) kroz funkciju normalne distribucije

gdje je standardna devijacija procjene T.

Iz Eq.

pronađite vrijednost Sp:

gdje je arg F* (h) inverzna funkcija od F* (X), one. vrijednost argumenta pri kojoj normalna funkcija distribucija je jednaka X.

Disperzija D, kroz koji se izražava količina A 1P, ne znamo tačno; kao njegovu približnu vrijednost možete koristiti procjenu D(14.3.4) i stavite približno:

Dakle, problem konstruisanja intervala povjerenja je približno riješen, koji je jednak:

gdje je gp određen formulom (14.3.7).

Da bi se izbjegla obrnuta interpolacija u tabelama funkcije F* (l) pri izračunavanju s p, prikladno je sastaviti posebnu tabelu (tabela 14.3.1), koja daje vrijednosti veličine

zavisno od r. Vrijednost (p određuje za normalni zakon broj standardnih devijacija koje se moraju iscrtati desno i lijevo od centra disperzije tako da je vjerovatnoća ulaska u rezultujuću oblast jednaka p.

Koristeći vrijednost 7 p, interval pouzdanosti se izražava kao:

Tabela 14.3.1

Primjer 1. Izvedeno je 20 eksperimenata na količini X; rezultati su prikazani u tabeli. 14.3.2.

Tabela 14.3.2

Potrebno je pronaći procjenu za matematičko očekivanje količine X i konstruisati interval poverenja koji odgovara verovatnoći poverenja p = 0,8.

Rješenje. Imamo:

Odabirom l: = 10 kao referentnu tačku, koristeći treću formulu (14.2.14) nalazimo nepristrasnu procjenu D :

Prema tabeli 14.3.1 nalazimo

Granice povjerenja:

Interval povjerenja:

Vrijednosti parametara T, koji leže u ovom intervalu kompatibilni su sa eksperimentalnim podacima datim u tabeli. 14.3.2.

Interval povjerenja za varijansu može se konstruirati na sličan način.

Neka se proizvede P nezavisni eksperimenti na slučajnoj varijabli X sa nepoznatim parametrima i za A i za disperziju D dobijena je nepristrasna procjena:

Potrebno je približno konstruirati interval povjerenja za varijansu.

Iz formule (14.3.11) jasno je da je veličina D predstavlja

iznos P slučajne varijable oblika . Ove vrijednosti nisu

nezavisno, jer bilo koji od njih uključuje količinu T, zavisi od svih ostalih. Međutim, može se pokazati da sa povećanjem P zakon raspodjele njihovog zbira se također približava normalnom. Skoro kod P= 20...30 već se može smatrati normalnim.

Pretpostavimo da je to tako i pronađimo karakteristike ovog zakona: matematičko očekivanje i disperziju. Od procene D- nepristrasan, onda M[D] = D.

Kalkulacija varijanse D D je povezan sa relativno složenim proračunima, pa predstavljamo njegov izraz bez izvođenja:

gdje je q 4 četvrti centralna tačka količine X.

Da biste koristili ovaj izraz, trebate zamijeniti vrijednosti \u003d 4 i D(barem bliskih). Umjesto D možete koristiti njegovu procjenu D. U principu, četvrti središnji momenat se također može zamijeniti procjenom, na primjer, vrijednošću oblika:

ali takva zamjena će dati izuzetno nisku točnost, jer općenito, uz ograničen broj eksperimenata, momenti high order utvrđeno od velike greške. Međutim, u praksi se često dešava da je vrsta zakona o raspodjeli količine X unaprijed poznat: nepoznati su samo njegovi parametri. Tada možete pokušati izraziti μ 4 kroz D.

Uzmimo najčešći slučaj, kada je vrijednost X distribuiraju prema uobičajenom zakonu. Tada se njegov četvrti centralni momenat izražava u terminima disperzije (vidi Poglavlje 6, pododjeljak 6.2);

a formula (14.3.12) daje ili

Zamjena nepoznatog u (14.3.14) D njegovu procjenu D, dobijamo: odakle

Moment μ 4 se može izraziti kroz D iu nekim drugim slučajevima, kada je distribucija vrijednosti X nije normalno, ali je poznat njegov izgled. Na primjer, za zakon ujednačena gustina(vidi poglavlje 5) imamo:

gdje je (a, P) interval na kojem je specificiran zakon.

dakle,

Koristeći formulu (14.3.12) dobijamo: gde nalazimo otprilike

U slučajevima kada je vrsta zakona raspodjele za veličinu 26 nepoznata, pri približnoj procjeni vrijednosti a/) ipak se preporučuje upotreba formule (14.3.16), osim ako postoje posebni razlozi da se vjeruje da je ovaj zakon se vrlo razlikuje od normalnog (ima primjetan pozitivan ili negativan eksces).

Ako se približna vrijednost a/) dobije na ovaj ili onaj način, tada možemo konstruirati interval povjerenja za varijansu na isti način na koji smo ga izgradili za matematičko očekivanje:

gde se vrednost zavisno od date verovatnoće p nalazi prema tabeli. 14.3.1.

Primjer 2. Naći približno 80% intervala povjerenja za varijansu slučajne varijable X pod uslovima iz primjera 1, ako je poznato da je vrijednost X distribuiraju u skladu sa zakonom koji je blizak normalnom.

Rješenje. Vrijednost ostaje ista kao u tabeli. 14.3.1:

Prema formuli (14.3.16)

Koristeći formulu (14.3.18) nalazimo interval povjerenja:

Odgovarajući interval prosječnih vrijednosti kvadratna devijacija: (0,21; 0,29).

14.4. Tačne metode za konstruiranje intervala povjerenja za parametre slučajne varijable raspoređene prema normalnom zakonu

U prethodnom pododjeljku smo ispitali grubo približne metode za konstruiranje intervala povjerenja za matematička očekivanja i varijansu. Ovdje ćemo dati ideju o tačnim metodama za rješavanje istog problema. Naglašavamo da je za precizno pronalaženje intervala povjerenja apsolutno neophodno unaprijed znati oblik zakona raspodjele veličine X, dok za primjenu aproksimativnih metoda to nije potrebno.

Ideja preciznim metodama konstruisanje intervala poverenja svodi se na sledeće. Bilo koji interval povjerenja nalazi se iz uvjeta koji izražava vjerovatnoću ispunjenja određenih nejednakosti, koje uključuju procjenu koja nas zanima A. Zakon distribucije vrednovanja A V opšti slučaj zavisi od nepoznatih parametara količine X. Međutim, ponekad je moguće preneti nejednakosti iz slučajne varijable A na neku drugu funkciju posmatranih vrednosti X p X 2, ..., X str.čiji zakon distribucije ne zavisi od nepoznatih parametara, već zavisi samo od broja eksperimenata i od vrste zakona raspodele veličine X. Ove vrste slučajnih varijabli igraju važnu ulogu u matematičkoj statistici; oni su najdetaljnije proučavani za slučaj normalne distribucije količine X.

Na primjer, dokazano je da sa normalnom raspodjelom vrijednosti X slučajna vrijednost

poštuje tzv Zakon o raspodjeli studenata With P- 1 stepen slobode; gustina ovog zakona ima oblik

gdje je G(x) poznata gama funkcija:

Također je dokazano da je slučajna varijabla

ima "%2 distribuciju" sa P- 1 stepen slobode (vidi Poglavlje 7), čija se gustina izražava formulom

Ne zadržavajući se na derivacijama distribucija (14.4.2) i (14.4.4), pokazaćemo kako se one mogu primeniti prilikom konstruisanja intervala poverenja za parametre ty D.

Neka se proizvede P nezavisni eksperimenti na slučajnoj varijabli X, normalno distribuiran sa nepoznatim parametrima T&O. Za ove parametre su dobijene procjene

Potrebno je konstruisati intervale poverenja za oba parametra koji odgovaraju verovatnoći poverenja p.

Prvo konstruirajmo interval povjerenja za matematičko očekivanje. Prirodno je uzeti ovaj interval simetričnim u odnosu na T; neka s p označava polovinu dužine intervala. Vrijednost s p mora biti odabrana tako da uvjet bude zadovoljen

Pokušajmo pomaknuti na lijevu stranu jednakosti (14.4.5) od slučajne varijable T na slučajnu varijablu T, distribuira se prema studentskom zakonu. Da biste to učinili, pomnožite obje strane nejednakosti |m-w?|

po pozitivnoj vrijednosti: ili, koristeći notaciju (14.4.1),

Nađimo broj /p takav da se vrijednost /p može naći iz uvjeta

Iz formule (14.4.2) jasno je da (1) - ravnomjerna funkcija, pa (14.4.8) daje

Jednakost (14.4.9) određuje vrijednost /p ovisno o p. Ako imate na raspolaganju tablicu integralnih vrijednosti

tada se vrijednost /p može pronaći obrnutom interpolacijom u tabeli. Međutim, zgodnije je sastaviti tabelu /p vrijednosti unaprijed. Takva tabela je data u Dodatku (Tabela 5). Ova tabela prikazuje vrijednosti u zavisnosti od nivoa pouzdanosti p i broja stepeni slobode P- 1. Odredivši / p iz tabele. 5 i pod pretpostavkom

naći ćemo polovinu širine intervala pouzdanosti / p i samog intervala

Primjer 1. Izvedeno je 5 nezavisnih eksperimenata na slučajnoj varijabli X, normalno distribuiran sa nepoznatim parametrima T i o. Rezultati eksperimenata su dati u tabeli. 14.4.1.

Tabela 14.4.1

Pronađite ocjenu T za matematičko očekivanje i konstruisati interval pouzdanosti od 90% / p za njega (tj. interval koji odgovara verovatnoći pouzdanosti p = 0,9).

Rješenje. Imamo:

Prema tabeli 5 zahtjeva za P - 1 = 4 i p = 0,9 nalazimo gdje

Interval pouzdanosti će biti

Primjer 2. Za uslove primjera 1 pododjeljka 14.3, uz pretpostavku vrijednosti X normalno raspoređeni, pronađite tačan interval pouzdanosti.

Rješenje. Prema tabeli 5 u prilogu nalazimo kada P - 1 = 19ir =

0,8 / p = 1,328; odavde

Upoređujući sa rješenjem primjera 1 pododjeljka 14.3 (e p = 0,072), uvjereni smo da je neslaganje vrlo neznatno. Ako zadržimo točnost do druge decimale, tada se intervali povjerenja pronađeni egzaktnom i približnom metodom poklapaju:

Prijeđimo na konstruiranje intervala povjerenja za varijansu. Razmotrite nepristrasnu procjenu varijanse

i izraziti slučajnu varijablu D kroz veličinu V(14.4.3), s raspodjelom x 2 (14.4.4):

Poznavanje zakona raspodjele količine V, možete pronaći interval /(1) u koji pada sa datom vjerovatnoćom p.

Zakon o raspodjeli kn_x(v) magnituda I 7 ima oblik prikazan na sl. 14.4.1.

Rice. 14.4.1

Postavlja se pitanje: kako odabrati interval / p? Ako je zakon raspodjele veličine V bio simetričan (kao normalni zakon ili Studentova raspodjela), bilo bi prirodno uzeti interval /p simetričan u odnosu na matematičko očekivanje. U ovom slučaju zakon k p_x (v) asimetrično. Dogovorimo se da odaberemo interval /p tako da vjerovatnoća vrijednosti bude V izvan intervala desno i lijevo (zasjenjena područja na slici 14.4.1) bili su isti i jednaki

Za konstruiranje intervala /p s ovim svojstvom koristimo tablicu. 4 aplikacije: sadrži brojeve y) takav da

za vrijednost V, ima x 2 -distribuciju sa r stepena slobode. U našem slučaju r = n- 1. Popravimo r = n- 1 i pronađite u odgovarajućem redu tabele. 4 dva značenja x 2 - jedan odgovara vjerovatnoći drugi - vjerovatnoća Označimo ih

vrijednosti u 2 I xl? Interval ima y 2, lijevom i y~ desni kraj.

Sada pronađimo iz intervala /p željeni interval pouzdanosti /|, za disperziju sa granicama D, i D2, koji pokriva poentu D sa vjerovatnoćom p:

Konstruirajmo interval / (, = (?> ʹ A) koji pokriva tačku D ako i samo ako je vrijednost V pada u interval /r. Pokažimo da je interval

zadovoljava ovaj uslov. Zaista, nejednakosti su ekvivalentne nejednakosti

a ove nejednakosti su zadovoljene sa vjerovatnoćom p. Dakle, interval pouzdanosti za varijansu je pronađen i izražen je formulom (14.4.13).

Primjer 3. Pronađite interval povjerenja za varijansu pod uslovima primjera 2 pododjeljka 14.3, ako je poznato da je vrijednost X normalno raspoređeni.

Rješenje. Imamo . Prema tabeli 4 priloga

nalazimo na r = n - 1 = 19

Koristeći formulu (14.4.13) nalazimo interval pouzdanosti za varijansu

Odgovarajući interval za standardnu ​​devijaciju je (0,21; 0,32). Ovaj interval samo neznatno premašuje interval (0,21; 0,29) dobijen u primjeru 2 pododjeljka 14.3 primjenom aproksimativne metode.

  • Slika 14.3.1 razmatra interval povjerenja simetričan oko a. Općenito, kao što ćemo kasnije vidjeti, to nije potrebno.

Intervali pouzdanosti.

Izračunavanje intervala povjerenja zasniva se na prosječnoj grešci odgovarajućeg parametra. Interval povjerenja pokazuje u kojim granicama sa vjerovatnoćom (1-a) leži prava vrijednost procijenjenog parametra. Ovde je a nivo značajnosti, (1-a) se takođe naziva verovatnoća poverenja.

U prvom poglavlju smo pokazali da, na primjer, za aritmetičku sredinu, prava populacijska sredina u otprilike 95% slučajeva leži unutar 2 standardne greške srednje vrijednosti. Stoga će granice intervala pouzdanosti od 95% za srednju vrijednost biti dvostruko dalje od srednje vrijednosti uzorka prosečna greška prosjek, tj. množimo prosečnu grešku srednje vrednosti sa određenim koeficijentom u zavisnosti od nivoa pouzdanosti. Za prosek i razliku proseka uzima se Student koeficijent (kritična vrednost Studentovog testa), a za udeo i razliku udela kritična vrednost z kriterijuma. Umnožak koeficijenta i prosječne greške može se nazvati maksimalnom greškom datog parametra, tj. maksimum koji možemo dobiti kada ga procjenjujemo.

Interval pouzdanosti za aritmetička sredina : .

Evo srednje vrijednosti uzorka;

Prosječna greška aritmetičke sredine;

s – standardna devijacija uzorka;

n

f = n-1 (Studentov koeficijent).

Interval pouzdanosti za razlike aritmetičkih sredina :

Evo razlike između srednjih vrijednosti uzorka;

- prosječna greška razlike aritmetičkih sredina;

s 1 , s 2 – uzorak standardnih devijacija;

n1,n2

Kritična vrijednost Studentov t test za dati nivo značajnosti a i broj stepeni slobode f=n 1 +n 2-2 (Studentov koeficijent).

Interval pouzdanosti za dionice :

.

Ovdje je d frakcija uzorka;

– prosječna frakciona greška;

n– veličina uzorka (veličina grupe);

Interval pouzdanosti za razlika u udjelima :

Evo razlike u udjelima uzorka;

– prosječna greška razlike aritmetičkih sredina;

n1,n2– zapremine uzoraka (broj grupa);

Kritična vrijednost z kriterija na datom nivou značajnosti a ( , , ).

Izračunavajući intervale povjerenja za razliku između indikatora, mi, prvo, direktno vidimo moguće vrijednosti efekat, i ne samo to tačka procene. Drugo, možemo izvući zaključak o prihvatanju ili odbacivanju nulte hipoteze i, treće, možemo izvući zaključak o snazi ​​testa.

Kada testirate hipoteze koristeći intervale pouzdanosti, morate se pridržavati sljedećeg pravila:

Ako 100(1-a) postotni interval pouzdanosti razlike u srednjim vrijednostima ne sadrži nulu, tada su razlike statistički značajne na nivou značajnosti a; naprotiv, ako ovaj interval sadrži nulu, onda razlike nisu statistički značajne.

Zaista, ako ovaj interval sadrži nulu, to znači da indikator koji se poredi može biti veći ili manji u jednoj od grupa u odnosu na drugu, tj. uočene razlike su rezultat slučajnosti.

Snaga testa može se procijeniti po lokaciji nule unutar intervala povjerenja. Ako je nula blizu niže ili gornja granica intervalu, onda bi možda kod većeg broja upoređenih grupa razlike dostigle statistički značaj. Ako je nula blizu sredine intervala, onda to znači da su i povećanje i smanjenje indikatora u eksperimentalnoj grupi podjednako vjerojatni i, vjerojatno, zaista nema razlika.

primjeri:

Da uporedimo hirurški mortalitet pri upotrebi dve različite vrste anestezije: 61 osoba je operisana sa prvom vrstom anestezije, 8 je umrlo, sa drugom vrstom – 67 osoba, 10 umrlo.

d 1 = 8/61 = 0,131; d2 = 10/67 = 0,149; d1-d2 = - 0,018.

Razlika u letalnosti upoređenih metoda biće u opsegu (-0,018 - 0,122; -0,018 + 0,122) ili (-0,14; 0,104) sa verovatnoćom od 100(1-a) = 95%. Interval sadrži nulu, tj. hipoteza o istoj smrtonosnosti kod dvoje različite vrste Anestezija se ne može odbiti.

Dakle, stopa mortaliteta može i hoće da se smanji na 14% i da poraste na 10,4% sa verovatnoćom od 95%, tj. nula je otprilike u sredini intervala, pa se može tvrditi da se ove dvije metode, najvjerovatnije, zaista ne razlikuju po smrtnosti.

U primjeru o kojem smo ranije govorili, prosječno vrijeme pritiskanja tokom testa tapkanja upoređeno je u četiri grupe studenata koji su se razlikovali u rezultatima ispita. Izračunajmo intervale povjerenja za prosječno vrijeme presinga za studente koji su položili ispit sa ocjenama 2 i 5 i interval povjerenja za razliku između ovih prosjeka.

Studentovi koeficijenti se nalaze pomoću Studentovih tablica raspodjele (vidi prilog): za prvu grupu: = t(0,05;48) = 2,011; za drugu grupu: = t(0,05;61) = 2.000. Dakle, intervali povjerenja za prvu grupu: = (162,19-2,011*2,18; 162,19+2,011*2,18) = (157,8; 166,6), za drugu grupu (156,55- 2,000*1,88; 156,08*156,08) ; 160.3). Dakle, za one koji su položili ispit sa 2, prosečno vreme pritiskanja se kreće od 157,8 ms do 166,6 ms sa verovatnoćom od 95%, za one koji su položili ispit sa 5 – od 152,8 ms do 160,3 ms sa verovatnoćom od 95% .

Također možete testirati nultu hipotezu koristeći intervale povjerenja za srednje vrijednosti, a ne samo za razliku u srednjim vrijednostima. Na primjer, kao u našem slučaju, ako se intervali povjerenja za srednje vrijednosti preklapaju, tada se nulta hipoteza ne može odbaciti. Da bi se odbacila hipoteza na odabranom nivou značaja, odgovarajući intervali pouzdanosti ne smiju se preklapati.

Nađimo interval povjerenja za razliku u prosječnom vremenu presinga u grupama koje su položile ispit sa ocjenama 2 i 5. Razlika prosjeka: 162,19 – 156,55 = 5,64. Studentov koeficijent: = t(0,05;49+62-2) = t(0,05;109) = 1,982. Grupne standardne devijacije će biti jednake: ; . Izračunavamo prosječnu grešku razlike između srednjih vrijednosti: . Interval pouzdanosti: =(5,64-1,982*2,87; 5,64+1,982*2,87) = (-0,044; 11,33).

Dakle, razlika u prosečnom vremenu pritiskanja u grupama koje su položile ispit sa 2 i 5 biće u rasponu od -0,044 ms do 11,33 ms. Ovaj interval uključuje nulu, tj. Prosječno vrijeme presovanja za one koji su dobro položili ispit može se ili povećati ili smanjiti u odnosu na one koji su položili ispit nezadovoljavajuće, tj. nulta hipoteza se ne može odbaciti. Ali nula je vrlo blizu donje granice, a vrijeme presinga je mnogo vjerojatnije da će se smanjiti za one koji su dobro prošli. Dakle, možemo zaključiti da i dalje postoje razlike u prosječnom vremenu presovanja između onih koji su prošli 2 i 5, samo ih nismo mogli uočiti s obzirom na promjenu prosječnog vremena, širenja prosječnog vremena i veličine uzorka.



Snaga testa je vjerovatnoća odbacivanja netačne nulte hipoteze, tj. pronaći razlike tamo gdje one zaista postoje.

Snaga testa se određuje na osnovu nivoa značajnosti, veličine razlika između grupa, širenja vrednosti u grupama i veličine uzoraka.

Za studentski test i analiza varijanse Možete koristiti dijagrame osjetljivosti.

Snaga kriterija može se koristiti za preliminarno određivanje potrebnog broja grupa.

Interval pouzdanosti pokazuje unutar kojih granica leži prava vrijednost procijenjenog parametra sa datom vjerovatnoćom.

Koristeći intervale povjerenja, možete testirati statističke hipoteze i izvući zaključke o osjetljivosti kriterija.

LITERATURA.

Glanz S. – Poglavlje 6,7.

Rebrova O.Yu. – str.112-114, str.171-173, str.234-238.

Sidorenko E.V. – str.32-33.

Pitanja za samotestiranje učenika.

1. Koja je snaga kriterija?

2. U kojim slučajevima je potrebno vrednovati snagu kriterijuma?

3. Metode za proračun snage.

6. Kako testirati statističku hipotezu koristeći interval pouzdanosti?

7. Šta se može reći o snazi ​​kriterija pri izračunavanju intervala povjerenja?

Zadaci.

Pretpostavimo da imamo veliki broj artikala sa normalnom distribucijom nekih karakteristika (na primjer, puno skladište povrća iste vrste, čija veličina i težina varira). Želite znati prosječne karakteristike cijele serije robe, ali nemate ni vremena ni želje da mjerite i vagate svako povrće. Razumijete da to nije potrebno. Ali koliko bi komada trebalo uzeti za provjeru na licu mjesta?

Prije nego što damo nekoliko formula korisnih za ovu situaciju, podsjetimo se neke oznake.

Prvo, kada bismo izmjerili cijelo skladište povrća (ovaj skup elemenata se zove opšta populacija), tada bismo sa svom dostupnom preciznošću znali prosječnu težinu cijele serije. Nazovimo ovo prosjekom X avg .g en . - opšti prosek. Već znamo šta je potpuno određeno ako su poznati njegova srednja vrijednost i devijacija s . Istina, dok mi nismo ni X prosječna gen s Ne poznajemo opštu populaciju. Možemo uzeti samo određeni uzorak, izmjeriti vrijednosti koje su nam potrebne i izračunati za ovaj uzorak i prosječnu vrijednost X avg. i standardnu ​​devijaciju S odabranu.

Poznato je da ako naša provjera uzorka sadrži veliki broj elemenata (obično je n veće od 30), a oni se uzimaju zaista nasumično, zatim s opća populacija teško da će se razlikovati od S selekcije ..

Osim toga, za slučaj normalne distribucije možemo koristiti sljedeće formule:

Sa vjerovatnoćom od 95%


Sa vjerovatnoćom od 99%



IN opšti pogled sa vjerovatnoćom P (t)


Odnos između vrijednosti t i vrijednosti vjerovatnoće P (t), s kojom želimo znati interval povjerenja, može se uzeti iz sljedeće tabele:


Tako smo odredili u kom rasponu se nalazi prosječna vrijednost za populaciju (sa datom vjerovatnoćom).

Osim ako nemamo dovoljno velik uzorak, ne možemo reći da populacija ima s = S odaberite Osim toga, u ovom slučaju je problematična blizina uzorka normalnoj distribuciji. U ovom slučaju koristimo i S select umjesto toga s u formuli:




ali će vrijednost t za fiksnu vjerovatnoću P(t) zavisiti od broja elemenata u uzorku n. Što je n veći, rezultujući interval pouzdanosti će biti bliži vrednosti datoj formulom (1). Vrijednosti t u ovom slučaju su preuzete iz druge tabele ( Studentov t-test), koje predstavljamo u nastavku:

Studentove vrijednosti t-testa za vjerovatnoću 0,95 i 0,99


Primjer 3. Od zaposlenih u kompaniji nasumično je odabrano 30 ljudi. Prema uzorku, ispostavilo se da je prosječna plata (mjesečno) 30 hiljada rubalja sa standardnom devijacijom od 5 hiljada rubalja. Odredite prosječnu platu u kompaniji sa vjerovatnoćom od 0,99.

Rješenje: Po uslovu imamo n = 30, X avg. =30000, S=5000, P = 0,99. Da bismo pronašli interval pouzdanosti, koristićemo formulu koja odgovara Studentovom t testu. Iz tabele za n = 30 i P = 0,99 nalazimo t = 2,756, dakle,


one. traženi poverenik interval 27484< Х ср.ген < 32516.

Dakle, sa vjerovatnoćom od 0,99 možemo reći da interval (27484; 32516) sadrži u sebi prosječnu platu u kompaniji.

Nadamo se da ćete koristiti ovu metodu i nije neophodno da svaki put imate sto sa sobom. Proračuni se mogu izvršiti automatski u Excel-u. Dok ste u Excel datoteci, kliknite na dugme fx u gornjem meniju. Zatim među funkcijama odaberite „statistički” tip, a sa predložene liste u prozoru - STUDAR DISCOVER. Zatim, na upit, postavljajući kursor u polje „verovatnoća“, unesite vrednost inverzne verovatnoće (tj. u našem slučaju, umesto verovatnoće od 0,95, potrebno je da unesete verovatnoću od 0,05). Očigledno tabela je sastavljena na način da rezultat odgovara na pitanje s kojom vjerovatnoćom možemo pogriješiti. Slično, u polje Degree of Freedom unesite vrijednost (n-1) za vaš uzorak.

Interval pouzdanosti za matematička očekivanja - ovo je interval izračunat iz podataka koji sa poznatom vjerovatnoćom sadrži matematičko očekivanje opće populacije. Prirodna procjena za matematičko očekivanje je aritmetička sredina njegovih promatranih vrijednosti. Zbog toga ćemo tokom čitave lekcije koristiti pojmove „prosjek“ i „prosječna vrijednost“. U problemima izračunavanja intervala pouzdanosti, odgovor koji se najčešće traži je nešto poput „Interval pouzdanosti prosječnog broja [vrijednosti u određenom problemu] je od [manje vrijednosti] do [veće vrijednosti].“ Koristeći interval pouzdanosti, možete procijeniti ne samo prosječne vrijednosti, već i udio određene karakteristike opće populacije. Prosjeci, varijansa, standardna devijacija a greške kroz koje ćemo doći do novih definicija i formula raspravlja se u lekciji Karakteristike uzorka i populacije .

Tačkaste i intervalne procjene srednje vrijednosti

Ako je prosječna vrijednost populacije procijenjena brojem (bodom), tada se kao procjena nepoznate prosječne vrijednosti populacije uzima određeni prosjek, koji se izračunava iz uzorka opservacija. U ovom slučaju, vrijednost uzorka srednje vrijednosti - slučajne varijable - ne poklapa se sa srednjom vrijednošću opće populacije. Stoga, kada pokazujete srednju vrijednost uzorka, morate istovremeno naznačiti grešku uzorkovanja. Mjera greške uzorkovanja je standardna greška, koja se izražava u istim jedinicama kao i srednja vrijednost. Stoga se često koristi sljedeća notacija: .

Ako procjenu prosjeka treba povezati sa određenom vjerovatnoćom, onda se parametar od interesa u populaciji mora procijeniti ne jednim brojem, već intervalom. Interval pouzdanosti je interval u kojem, sa određenom vjerovatnoćom P nalazi se vrijednost indikatora procijenjenog stanovništva. Interval povjerenja u kojem je vjerovatno P = 1 - α pronađena je slučajna varijabla, izračunata na sljedeći način:

,

α = 1 - P, koji se može naći u dodatku gotovo svake knjige o statistici.

U praksi, populacijska srednja vrijednost i varijansa nisu poznate, pa se varijansa populacije zamjenjuje varijansom uzorka, a populacijska srednja vrijednost uzorkom. Stoga se interval pouzdanosti u većini slučajeva izračunava na sljedeći način:

.

Formula intervala pouzdanosti može se koristiti za procjenu srednje vrijednosti populacije ako

  • poznata je standardna devijacija populacije;
  • ili je standardna devijacija populacije nepoznata, ali je veličina uzorka veća od 30.

Srednja vrijednost uzorka je nepristrasna procjena srednje vrijednosti populacije. Zauzvrat, varijansa uzorka nije nepristrasna procjena varijanse populacije. Da bi se dobila nepristrasna procjena varijanse populacije u formuli varijanse uzorka, veličina uzorka n treba zamijeniti sa n-1.

Primjer 1. Od 100 nasumično odabranih kafića u određenom gradu prikupljena je informacija da je prosječan broj zaposlenih u njima 10,5 sa standardnom devijacijom od 4,6. Odredite interval pouzdanosti od 95% za broj zaposlenih u kafiću.

gdje je kritična vrijednost standardne normalne distribucije za nivo značajnosti α = 0,05 .

Tako se interval povjerenja od 95% za prosječan broj zaposlenih u kafiću kretao od 9,6 do 11,4.

Primjer 2. Za slučajni uzorak iz populacije od 64 opservacije, izračunate su sljedeće ukupne vrijednosti:

zbir vrijednosti u zapažanjima,

zbir kvadrata odstupanja vrijednosti od srednje vrijednosti .

Izračunajte 95% interval pouzdanosti za matematičko očekivanje.

Izračunajmo standardnu ​​devijaciju:

,

Izračunajmo prosječnu vrijednost:

.

Zamjenjujemo vrijednosti u izraz za interval povjerenja:

gdje je kritična vrijednost standardne normalne distribucije za nivo značajnosti α = 0,05 .

Dobijamo:

Tako se interval pouzdanosti od 95% za matematičko očekivanje ovog uzorka kretao od 7,484 do 11,266.

Primjer 3. Za slučajni uzorak populacije od 100 opservacija, izračunata srednja vrijednost je 15,2, a standardna devijacija je 3,2. Izračunajte interval pouzdanosti od 95% za očekivanu vrijednost, a zatim 99% interval pouzdanosti. Ako snaga uzorka i njena varijacija ostanu nepromijenjene, a koeficijent pouzdanosti raste, hoće li se interval povjerenja suziti ili proširiti?

Ove vrijednosti zamjenjujemo u izraz za interval povjerenja:

gdje je kritična vrijednost standardne normalne distribucije za nivo značajnosti α = 0,05 .

Dobijamo:

.

Tako se interval pouzdanosti od 95% za srednju vrijednost ovog uzorka kretao od 14,57 do 15,82.

Ponovo zamjenjujemo ove vrijednosti u izraz za interval povjerenja:

gdje je kritična vrijednost standardne normalne distribucije za nivo značajnosti α = 0,01 .

Dobijamo:

.

Tako se interval pouzdanosti od 99% za srednju vrijednost ovog uzorka kretao od 14,37 do 16,02.

Kao što vidimo, kako se koeficijent pouzdanosti povećava, tako se povećava i kritična vrijednost standardne normalne distribucije, pa se početna i završna tačka intervala nalaze dalje od srednje vrijednosti, a samim tim raste i interval povjerenja za matematičko očekivanje. .

Tačkaste i intervalne procjene specifične težine

Udio nekog atributa uzorka može se tumačiti kao bodovna procjena specifična gravitacija str iste karakteristike u opštoj populaciji. Ako ovu vrijednost treba povezati s vjerovatnoćom, tada treba izračunati interval pouzdanosti specifične težine str karakteristika u populaciji sa vjerovatnoćom P = 1 - α :

.

Primjer 4. U nekom gradu postoje dva kandidata A I B kandiduju se za gradonačelnika. Anketirano je nasumično 200 stanovnika grada, od kojih je 46% odgovorilo da bi glasalo za kandidata A, 26% - za kandidata B a 28% ne zna za koga će glasati. Odredite interval povjerenja od 95% za udio stanovnika grada koji podržavaju kandidata A.



Novo na sajtu

>

Najpopularniji