Dom Protetika i implantacija Kako pronaći primjer intervala povjerenja. Interval povjerenja

Kako pronaći primjer intervala povjerenja. Interval povjerenja

Interval povjerenja– granične vrijednosti statističku vrijednost, koji će sa datom sigurnošću γ biti u ovom intervalu pri uzorkovanju veće količine. Označava se kao P(θ - ε. U praksi, vjerovatnoća pouzdanosti γ se bira između vrijednosti koje su prilično bliske jedinici: γ = 0,9, γ = 0,95, γ = 0,99.

Svrha usluge. Koristeći ovu uslugu, možete odrediti:

  • interval povjerenja za opću srednju vrijednost, interval povjerenja za varijansu;
  • interval povjerenja za standardnu ​​devijaciju, interval povjerenja za generalni udio;
Rezultirajuće rješenje se pohranjuje u Word datoteku (pogledajte primjer). Ispod je video uputstvo kako popuniti početne podatke.

Primjer br. 1. Na kolektivnoj farmi, od ukupnog stada od 1000 ovaca, 100 ovaca je podvrgnuto selektivnoj kontroli. Kao rezultat, utvrđeno je prosječno šišanje vune od 4,2 kg po ovci. Odrediti s vjerovatnoćom od 0,99 srednju kvadratnu grešku uzorka pri određivanju prosječnog striženja vune po ovci i granice unutar kojih se nalazi vrijednost striženja ako je varijansa 2,5. Uzorak se ne ponavlja.
Primjer br. 2. Iz serije uvezenih proizvoda na pošti Moskovske sjeverne carine uzeto je 20 uzoraka proizvoda „A“ slučajnim ponovljenim uzorkovanjem. Kao rezultat ispitivanja, utvrđen je prosječni sadržaj vlage proizvoda „A“ u uzorku, koji se pokazao jednakim 6% sa standardnom devijacijom od 1%.
Odrediti sa vjerovatnoćom 0,683 granice prosječnog sadržaja vlage proizvoda u cijeloj seriji uvezenih proizvoda.
Primjer br. 3. Istraživanje na 36 učenika pokazalo je da je prosječan broj udžbenika koji pročitaju godišnje akademske godine, ispostavilo se da je jednako 6. Uz pretpostavku da broj udžbenika koje student pročita po semestru ima normalan zakon raspodjele sa standardnom devijacijom jednakom 6, naći: A) sa pouzdanošću od 0,99, intervalnu procjenu za matematički očekivanje ovoga slučajna varijabla; B) s kojom vjerovatnoćom možemo reći da će prosječan broj udžbenika koje student pročita po semestru, izračunat iz datog uzorka, odstupiti od matematičkog očekivanja prema apsolutna vrijednost ne više od 2.

Klasifikacija intervala povjerenja

Po vrsti parametra koji se procjenjuje:

Po vrsti uzorka:

  1. Interval pouzdanosti za beskonačan uzorak;
  2. Interval pouzdanosti za konačni uzorak;
Uzorak se naziva resampling, ako se odabrani objekt vrati u populaciju prije odabira sljedećeg. Uzorak se naziva neponavljanjem, ako se odabrani objekt ne vrati u populaciju. U praksi se obično bavimo uzorcima koji se ne ponavljaju.

Izračunavanje prosječne greške uzorkovanja za slučajno uzorkovanje

Nesklad između vrijednosti indikatora dobijenih iz uzorka i odgovarajućih parametara opće populacije naziva se greška reprezentativnosti.
Oznake glavnih parametara opće populacije i populacije uzorka.
Formule prosječne greške uzorkovanja
ponovna selekcijaponovite odabir
za prosjekza dionicuza prosjekza dionicu
Odnos između granice greške uzorkovanja (Δ) zajamčen s određenom vjerovatnoćom R(t), I prosečna greška uzorak ima oblik: ili Δ = t·μ, gdje je t– koeficijent pouzdanosti, određen u zavisnosti od nivoa verovatnoće P(t) prema tabeli Laplaceove integralne funkcije.

Formule za izračunavanje veličine uzorka koristeći metodu čisto slučajnog uzorkovanja

U prethodnim pododjeljcima razmatrali smo pitanje procjene nepoznatog parametra A jedan broj. To se zove procjena “poen”. U brojnim zadacima, ne morate samo pronaći parametar A odgovarajuću numeričku vrijednost, ali i za procjenu njegove tačnosti i pouzdanosti. Morate znati do kojih grešaka može dovesti zamjena parametra A svoju tačku procenu A i sa kojim stepenom pouzdanosti možemo očekivati ​​da ove greške neće preći poznate granice?

Problemi ove vrste su posebno relevantni sa malim brojem zapažanja, kada je tačka procena i u je uglavnom nasumična i približna zamjena a sa a može dovesti do ozbiljnih grešaka.

Da biste dobili ideju o tačnosti i pouzdanosti procjene A,

V matematičke statistike Oni koriste takozvane intervale povjerenja i vjerovatnoće povjerenja.

Neka za parametar A nepristrasna procjena dobijena iz iskustva A.Želimo procijeniti moguću grešku u ovom slučaju. Dodijelimo neku dovoljno veliku vjerovatnoću p (na primjer, p = 0,9, 0,95 ili 0,99) tako da se događaj sa vjerovatnoćom p može smatrati praktično pouzdanim, i pronađemo vrijednost s za koju

Tada je raspon praktično moguće vrijednosti greška koja se javlja prilikom zamjene A on A, će biti ± s; Velike greške u apsolutnoj vrijednosti će se pojaviti samo sa malom vjerovatnoćom a = 1 - p. Prepišimo (14.3.1) kao:

Jednakost (14.3.2) znači da je sa vjerovatnoćom p nepoznata vrijednost parametra A spada u interval

Potrebno je napomenuti jednu okolnost. Ranije smo više puta razmatrali vjerovatnoću da slučajna varijabla padne u dati neslučajni interval. Ovdje je situacija drugačija: veličina A nije slučajan, ali interval / p je slučajan. Njegov položaj na x-osi je nasumičan, određen njegovim centrom A; Općenito, dužina intervala 2s je također slučajna, jer se vrijednost s izračunava, po pravilu, iz eksperimentalnih podataka. Stoga u u ovom slučaju bilo bi bolje protumačiti p vrijednost ne kao vjerovatnoću „pogotka“ tačke A u intervalu / p, i kao vjerovatnoća da će slučajni interval / p pokriti tačku A(Slika 14.3.1).

Rice. 14.3.1

Verovatnoća p se obično naziva verovatnoća poverenja, i interval / p - interval povjerenja. Granice intervala Ako. a x =a- s and a 2 = a + i zovu se granice poverenja.

Hajde da damo još jednu interpretaciju konceptu intervala poverenja: može se smatrati intervalom vrednosti parametara A, kompatibilan s eksperimentalnim podacima i nije im u suprotnosti. Zaista, ako se složimo da događaj s vjerovatnoćom a = 1-p smatramo praktički nemogućim, onda one vrijednosti parametra a za koje aa> s moraju biti prepoznate kao kontradiktorni eksperimentalni podaci, a oni za koje |a - A a t na 2 .

Neka za parametar A postoji nepristrasna procjena A. Kad bismo znali zakon raspodjele količine A, zadatak pronalaženja intervala povjerenja bio bi vrlo jednostavan: bilo bi dovoljno pronaći vrijednost s za koju

Poteškoća je u tome što zakon raspodjele procjena A zavisi od zakona raspodele veličine X i, prema tome, na njegove nepoznate parametre (posebno na sam parametar A).

Da biste zaobišli ovu poteškoću, možete koristiti sljedeću otprilike približnu tehniku: zamijenite nepoznate parametre u izrazu za s njihovim procjenama tačaka. Uz relativno veliki broj eksperimenata P(oko 20...30) ova tehnika obično daje rezultate koji su zadovoljavajući u smislu tačnosti.

Kao primjer, razmotrite problem intervala povjerenja za matematičko očekivanje.

Neka se proizvede P X,čije su karakteristike očekivanu vrijednost T i varijansu D- nepoznato. Za ove parametre dobijene su sljedeće procjene:

Potrebno je konstruirati interval povjerenja /p koji odgovara vjerovatnoći povjerenja p za matematičko očekivanje T količine X.

Prilikom rješavanja ovog problema koristit ćemo se činjenicom da je količina T predstavlja zbir P nezavisne identično distribuirane slučajne varijable Xh a prema središnjoj graničnoj teoremi, za dovoljno veliku P njegov zakon raspodjele je blizu normalnog. U praksi, čak i sa relativno malim brojem članova (oko 10...20), zakon raspodjele sume može se približno smatrati normalnim. Pretpostavićemo da je vrednost T distribuiraju prema uobičajenom zakonu. Karakteristike ovog zakona - matematičko očekivanje i varijansa - su jednake, respektivno T I

(vidi poglavlje 13 pododjeljak 13.3). Pretpostavimo da je vrijednost D znamo i naći ćemo vrijednost Ep za koju

Koristeći formulu (6.3.5) iz poglavlja 6, izražavamo vjerovatnoću na lijevoj strani (14.3.5) kroz funkciju normalne distribucije

gdje je standardna devijacija procjene T.

Iz Eq.

pronađite vrijednost Sp:

gdje je arg F* (h) inverzna funkcija od F* (X), one. vrijednost argumenta pri kojoj normalna funkcija distribucija je jednaka X.

Disperzija D, kroz koji se izražava količina A 1P, ne znamo tačno; kao njegovu približnu vrijednost možete koristiti procjenu D(14.3.4) i stavite približno:

Dakle, problem konstruisanja intervala povjerenja je približno riješen, koji je jednak:

gdje je gp određen formulom (14.3.7).

Da bi se izbjegla obrnuta interpolacija u tabelama funkcije F* (l) pri izračunavanju s p, prikladno je sastaviti posebnu tabelu (tabela 14.3.1), koja daje vrijednosti veličine

zavisno od r. Vrijednost (p određuje za normalni zakon broj standardnih devijacija koje se moraju iscrtati desno i lijevo od centra disperzije tako da je vjerovatnoća ulaska u rezultujuću oblast jednaka p.

Koristeći vrijednost 7 p, interval pouzdanosti se izražava kao:

Tabela 14.3.1

Primjer 1. Izvedeno je 20 eksperimenata na količini X; rezultati su prikazani u tabeli. 14.3.2.

Tabela 14.3.2

Potrebno je pronaći procjenu za matematičko očekivanje količine X i konstruisati interval poverenja koji odgovara verovatnoći poverenja p = 0,8.

Rješenje. Imamo:

Odabirom l: = 10 kao referentnu tačku, koristeći treću formulu (14.2.14) nalazimo nepristrasnu procjenu D :

Prema tabeli 14.3.1 nalazimo

Granice povjerenja:

Interval povjerenja:

Vrijednosti parametara T, koji leže u ovom intervalu kompatibilni su sa eksperimentalnim podacima datim u tabeli. 14.3.2.

Interval povjerenja za varijansu može se konstruirati na sličan način.

Neka se proizvede P nezavisni eksperimenti na slučajnoj varijabli X sa nepoznatim parametrima i za A i za disperziju D dobijena je nepristrasna procjena:

Potrebno je približno konstruirati interval povjerenja za varijansu.

Iz formule (14.3.11) jasno je da je veličina D predstavlja

iznos P slučajne varijable oblika . Ove vrijednosti nisu

nezavisno, jer bilo koji od njih uključuje količinu T, zavisi od svih ostalih. Međutim, može se pokazati da sa povećanjem P zakon raspodjele njihovog zbira se također približava normalnom. Skoro kod P= 20...30 već se može smatrati normalnim.

Pretpostavimo da je to tako i pronađimo karakteristike ovog zakona: matematičko očekivanje i disperziju. Od procene D- nepristrasan, onda M[D] = D.

Kalkulacija varijanse D D je povezan sa relativno složenim proračunima, pa predstavljamo njegov izraz bez izvođenja:

gdje je q 4 četvrti centralna tačka količine X.

Da biste koristili ovaj izraz, trebate zamijeniti vrijednosti \u003d 4 i D(barem bliskih). Umjesto D možete koristiti njegovu procjenu D. U principu, četvrti središnji momenat se također može zamijeniti procjenom, na primjer, vrijednošću oblika:

ali takva zamjena će dati izuzetno nisku točnost, jer općenito, uz ograničen broj eksperimenata, momenti high order utvrđeno od velike greške. Međutim, u praksi se često dešava da je vrsta zakona o raspodjeli količine X unaprijed poznat: nepoznati su samo njegovi parametri. Tada možete pokušati izraziti μ 4 kroz D.

Uzmimo najčešći slučaj, kada je vrijednost X distribuiraju prema uobičajenom zakonu. Tada se njegov četvrti centralni momenat izražava u terminima disperzije (vidi Poglavlje 6, pododjeljak 6.2);

a formula (14.3.12) daje ili

Zamjena nepoznatog u (14.3.14) D njegovu procjenu D, dobijamo: odakle

Moment μ 4 se može izraziti kroz D iu nekim drugim slučajevima, kada je distribucija vrijednosti X nije normalno, ali je poznat njegov izgled. Na primjer, za zakon ujednačena gustina(vidi poglavlje 5) imamo:

gdje je (a, P) interval na kojem je specificiran zakon.

dakle,

Koristeći formulu (14.3.12) dobijamo: gde nalazimo otprilike

U slučajevima kada je vrsta zakona raspodjele za veličinu 26 nepoznata, pri približnoj procjeni vrijednosti a/) ipak se preporučuje upotreba formule (14.3.16), osim ako postoje posebni razlozi da se vjeruje da je ovaj zakon se vrlo razlikuje od normalnog (ima primjetan pozitivan ili negativan eksces).

Ako se približna vrijednost a/) dobije na ovaj ili onaj način, tada možemo konstruirati interval povjerenja za varijansu na isti način na koji smo ga izgradili za matematičko očekivanje:

gde se vrednost zavisno od date verovatnoće p nalazi prema tabeli. 14.3.1.

Primjer 2. Naći približno 80% intervala povjerenja za varijansu slučajne varijable X pod uslovima iz primjera 1, ako je poznato da je vrijednost X distribuiraju u skladu sa zakonom koji je blizak normalnom.

Rješenje. Vrijednost ostaje ista kao u tabeli. 14.3.1:

Prema formuli (14.3.16)

Koristeći formulu (14.3.18) nalazimo interval povjerenja:

Odgovarajući interval prosječnih vrijednosti kvadratna devijacija: (0,21; 0,29).

14.4. Precizne metode konstrukcije intervali poverenja za parametre slučajne varijable raspoređene prema normalnom zakonu

U prethodnom pododjeljku smo ispitali grubo približne metode za konstruiranje intervala povjerenja za matematička očekivanja i varijansu. Ovdje ćemo dati ideju o tačnim metodama za rješavanje istog problema. Naglašavamo da je za precizno pronalaženje intervala povjerenja apsolutno neophodno unaprijed znati oblik zakona raspodjele veličine X, dok za primjenu aproksimativnih metoda to nije potrebno.

Ideja preciznim metodama konstruisanje intervala poverenja svodi se na sledeće. Bilo koji interval povjerenja nalazi se iz uvjeta koji izražava vjerovatnoću ispunjenja određenih nejednakosti, koje uključuju procjenu koja nas zanima A. Zakon distribucije vrednovanja A V opšti slučaj zavisi od nepoznatih parametara količine X. Međutim, ponekad je moguće preneti nejednakosti iz slučajne varijable A na neku drugu funkciju posmatranih vrednosti X p X 2, ..., X str.čiji zakon distribucije ne zavisi od nepoznatih parametara, već zavisi samo od broja eksperimenata i od vrste zakona raspodele veličine X. Ove vrste slučajnih varijabli igraju važnu ulogu u matematičkoj statistici; oni su najdetaljnije proučavani za slučaj normalne distribucije količine X.

Na primjer, dokazano je da sa normalnom raspodjelom vrijednosti X slučajna vrijednost

poštuje tzv Zakon o raspodjeli studenata With P- 1 stepen slobode; gustina ovog zakona ima oblik

gdje je G(x) poznata gama funkcija:

Također je dokazano da je slučajna varijabla

ima "%2 distribuciju" sa P- 1 stepen slobode (vidi Poglavlje 7), čija se gustina izražava formulom

Ne zadržavajući se na derivacijama distribucija (14.4.2) i (14.4.4), pokazaćemo kako se one mogu primeniti prilikom konstruisanja intervala poverenja za parametre ty D.

Neka se proizvede P nezavisni eksperimenti na slučajnoj varijabli X, normalno distribuiran sa nepoznatim parametrima T&O. Za ove parametre su dobijene procjene

Potrebno je konstruisati intervale poverenja za oba parametra koji odgovaraju verovatnoći poverenja p.

Prvo konstruirajmo interval povjerenja za matematičko očekivanje. Prirodno je uzeti ovaj interval simetričnim u odnosu na T; neka s p označava polovinu dužine intervala. Vrijednost s p mora biti odabrana tako da uvjet bude zadovoljen

Pokušajmo pomaknuti na lijevu stranu jednakosti (14.4.5) od slučajne varijable T na slučajnu varijablu T, distribuira se prema studentskom zakonu. Da biste to učinili, pomnožite obje strane nejednakosti |m-w?|

po pozitivnoj vrijednosti: ili, koristeći notaciju (14.4.1),

Nađimo broj /p takav da se vrijednost /p može naći iz uvjeta

Iz formule (14.4.2) jasno je da (1) - ravnomjerna funkcija, pa (14.4.8) daje

Jednakost (14.4.9) određuje vrijednost /p ovisno o p. Ako imate na raspolaganju tablicu integralnih vrijednosti

tada se vrijednost /p može pronaći obrnutom interpolacijom u tabeli. Međutim, zgodnije je sastaviti tabelu /p vrijednosti unaprijed. Takva tabela je data u Dodatku (Tabela 5). Ova tabela prikazuje vrijednosti u zavisnosti od nivoa pouzdanosti p i broja stepeni slobode P- 1. Odredivši / p iz tabele. 5 i pod pretpostavkom

naći ćemo polovinu širine intervala pouzdanosti / p i samog intervala

Primjer 1. Izvedeno je 5 nezavisnih eksperimenata na slučajnoj varijabli X, normalno distribuiran sa nepoznatim parametrima T i o. Rezultati eksperimenata su dati u tabeli. 14.4.1.

Tabela 14.4.1

Pronađite ocjenu T za matematičko očekivanje i konstruisati interval pouzdanosti od 90% / p za njega (tj. interval koji odgovara verovatnoći pouzdanosti p = 0,9).

Rješenje. Imamo:

Prema tabeli 5 zahtjeva za P - 1 = 4 i p = 0,9 nalazimo gdje

Interval pouzdanosti će biti

Primjer 2. Za uslove primjera 1 pododjeljka 14.3, uz pretpostavku vrijednosti X normalno raspoređeni, pronađite tačan interval pouzdanosti.

Rješenje. Prema tabeli 5 u prilogu nalazimo kada P - 1 = 19ir =

0,8 / p = 1,328; odavde

Upoređujući sa rješenjem primjera 1 pododjeljka 14.3 (e p = 0,072), uvjereni smo da je neslaganje vrlo neznatno. Ako zadržimo točnost do druge decimale, tada se intervali povjerenja pronađeni egzaktnom i približnom metodom poklapaju:

Prijeđimo na konstruiranje intervala povjerenja za varijansu. Razmotrite nepristrasnu procjenu varijanse

i izraziti slučajnu varijablu D kroz veličinu V(14.4.3), s raspodjelom x 2 (14.4.4):

Poznavanje zakona raspodjele količine V, možete pronaći interval /(1) u koji pada sa datom vjerovatnoćom p.

Zakon o raspodjeli kn_x(v) magnituda I 7 ima oblik prikazan na sl. 14.4.1.

Rice. 14.4.1

Postavlja se pitanje: kako odabrati interval / p? Ako je zakon raspodjele veličine V bio simetričan (kao normalni zakon ili Studentova raspodjela), bilo bi prirodno uzeti interval /p simetričan u odnosu na matematičko očekivanje. U ovom slučaju zakon k p_x (v) asimetrično. Dogovorimo se da odaberemo interval /p tako da vjerovatnoća vrijednosti bude V izvan intervala desno i lijevo (zasjenjena područja na slici 14.4.1) bili su isti i jednaki

Za konstruiranje intervala /p s ovim svojstvom koristimo tablicu. 4 aplikacije: sadrži brojeve y) takav da

za vrijednost V, ima x 2 -distribuciju sa r stepena slobode. U našem slučaju r = n- 1. Popravimo r = n- 1 i pronađite u odgovarajućem redu tabele. 4 dva značenja x 2 - jedan odgovara vjerovatnoći drugi - vjerovatnoća Označimo ih

vrijednosti u 2 I xl? Interval ima y 2, lijevom i y ~ desni kraj.

Sada pronađimo iz intervala /p željeni interval pouzdanosti /|, za disperziju sa granicama D, i D2, koji pokriva poentu D sa vjerovatnoćom p:

Konstruirajmo interval / (, = (?> ʹ A) koji pokriva tačku D ako i samo ako je vrijednost V pada u interval /r. Pokažimo da je interval

zadovoljava ovaj uslov. Zaista, nejednakosti su ekvivalentne nejednakosti

a ove nejednakosti su zadovoljene sa vjerovatnoćom p. Dakle, interval pouzdanosti za varijansu je pronađen i izražen je formulom (14.4.13).

Primjer 3. Pronađite interval povjerenja za varijansu pod uslovima primjera 2 pododjeljka 14.3, ako je poznato da je vrijednost X normalno raspoređeni.

Rješenje. Imamo . Prema tabeli 4 priloga

nalazimo na r = n - 1 = 19

Koristeći formulu (14.4.13) nalazimo interval pouzdanosti za varijansu

Odgovarajući interval za standardnu ​​devijaciju je (0,21; 0,32). Ovaj interval samo neznatno premašuje interval (0,21; 0,29) dobijen u primjeru 2 pododjeljka 14.3 primjenom aproksimativne metode.

  • Slika 14.3.1 razmatra interval povjerenja simetričan oko a. Općenito, kao što ćemo kasnije vidjeti, to nije potrebno.

Procjena intervala pouzdanosti

Ciljevi učenja

Statistike razmatraju sljedeće dva glavna zadatka:

    Imamo neku procjenu zasnovanu na uzorku podataka, i želimo dati neku vjerovatnoću o tome gdje leži prava vrijednost procijenjenog parametra.

    Imamo specifičnu hipotezu koju treba testirati koristeći uzorke podataka.

U ovoj temi razmatramo prvi zadatak. Hajde da uvedemo i definiciju intervala poverenja.

Interval pouzdanosti je interval koji se gradi oko procijenjene vrijednosti parametra i pokazuje gdje se nalazi prava vrijednost procijenjenog parametra sa a priori određenom vjerovatnoćom.

Nakon proučavanja materijala na ovu temu, vi:

    saznati šta je interval pouzdanosti za procjenu;

    naučiti klasificirati statističke probleme;

    ovladati tehnikom konstruisanja intervala poverenja, kako korišćenjem statističkih formula tako i korišćenjem softverskih alata;

    naučiti odrediti potrebne veličine uzorka za postizanje određenih parametara tačnosti statističkih procjena.

Raspodjela karakteristika uzorka

T-distribucija

Kao što je gore objašnjeno, distribucija slučajne varijable je blizu standardizovane normalna distribucija sa parametrima 0 i 1. Pošto ne znamo vrijednost σ, zamjenjujemo je nekom procjenom s. Količina već ima drugačiju distribuciju, odnosno ili Distribucija studenata, koji je određen parametrom n -1 (broj stupnjeva slobode). Ova raspodjela je bliska normalnoj (što je n veće, distribucije su bliže).

Na sl. 95
prikazana je Studentova distribucija sa 30 stepeni slobode. Kao što vidite, vrlo je blizu normalnoj distribuciji.

Slično funkcijama za rad sa normalnom distribucijom NORMIDIST i NORMINV, postoje funkcije za rad sa t-distribucijom - STUDIST (TDIST) i STUDRASOBR (TINV). Primjer korištenja ovih funkcija može se vidjeti u datoteci STUDRASP.XLS (šablon i rješenje) i na Sl. 96
.

Raspodjela ostalih karakteristika

Kao što već znamo, da bismo odredili tačnost procjene matematičkog očekivanja, potrebna nam je t-distribucija. Za procjenu drugih parametara, kao što je varijansa, potrebne su različite distribucije. Dvije od njih su F-distribucija i x 2 -distribucija.

Interval pouzdanosti za srednju vrijednost

Interval povjerenja- ovo je interval koji se gradi oko procijenjene vrijednosti parametra i pokazuje gdje se nalazi prava vrijednost procijenjenog parametra sa a priori određenom vjerovatnoćom.

Dolazi do konstrukcije intervala pouzdanosti za prosječnu vrijednost na sledeći način:

Primjer

Restoran brze hrane planira svoj asortiman proširiti novom vrstom sendviča. Kako bi procijenio potražnju za njim, menadžer planira nasumično odabrati 40 posjetitelja od onih koji su ga već isprobali i zamoliti ih da ocijene svoj stav prema novom proizvodu na skali od 1 do 10. Menadžer želi procijeniti očekivano broj bodova koje će novi proizvod dobiti i konstruirati interval pouzdanosti od 95% za ovu procjenu. Kako to učiniti? (pogledajte datoteku SANDWICH1.XLS (šablon i rješenje).

Rješenje

Za rješavanje ovog problema možete koristiti . Rezultati su predstavljeni na sl. 97
.

Interval pouzdanosti za ukupnu vrijednost

Ponekad je, koristeći uzorke podataka, potrebno procijeniti ne matematičko očekivanje, već ukupan iznos vrijednosti. Na primjer, u situaciji sa revizorom, interes može biti u procjeni ne prosječne veličine računa, već zbroja svih računa.

Neka N - ukupno elemenata, n je veličina uzorka, T 3 je zbir vrijednosti u uzorku, T" je procjena sume za cijelu populaciju, tada , a interval povjerenja se izračunava po formuli , gdje je s procjena standardne devijacije za uzorak, a procjena srednje vrijednosti za uzorak.

Primjer

Recimo neke poreska službaželi procijeniti iznos ukupnih povrata poreza za 10.000 poreskih obveznika. Poreski obveznik ili prima povrat ili plaća dodatne poreze. Pronađite interval pouzdanosti od 95% za iznos povrata, uz pretpostavku da je uzorak od 500 ljudi (pogledajte datoteku IZNOS REFUND.XLS (šablon i rješenje).

Rješenje

StatPro nema posebnu proceduru za ovaj slučaj, međutim, može se primijetiti da se granice mogu dobiti iz granica za prosjek na osnovu gornjih formula (Sl. 98
).

Interval pouzdanosti za proporciju

Neka je p matematičko očekivanje udjela klijenata, a p b procjena ovog udjela dobijena iz uzorka veličine n. Može se pokazati da za dovoljno velike distribucija procjene će biti blizu normalne sa matematičkim očekivanjem p i standardnom devijacijom . Standardna greška procjene u ovom slučaju se izražava kao , a interval povjerenja je kao .

Primjer

Restoran brze hrane planira svoj asortiman proširiti novom vrstom sendviča. Kako bi procijenio potražnju za njim, menadžer je nasumično odabrao 40 posjetitelja od onih koji su ga već isprobali i zamolio ih da ocijene svoj stav prema novom proizvodu na skali od 1 do 10. Menadžer želi procijeniti očekivani udio kupaca koji novi proizvod ocijene najmanje sa 6 bodova (očekuje da će ti kupci biti potrošači novog proizvoda).

Rješenje

U početku kreiramo novu kolonu na osnovu atributa 1 ako je ocjena klijenta veća od 6 bodova i 0 u suprotnom (pogledajte datoteku SANDWICH2.XLS (šablon i rješenje).

Metoda 1

Brojenjem broja 1 procjenjujemo udio, a zatim koristimo formule.

Vrijednost zcr se uzima iz posebnih tablica normalne distribucije (na primjer, 1,96 za interval pouzdanosti od 95%).

Koristeći ovaj pristup i specifične podatke za konstruisanje intervala od 95% dobijamo sledeće rezultate (Sl. 99
). Kritična vrijednost parametar z cr je jednak 1,96. Standardna greška procjene je 0,077. Donja granica intervala pouzdanosti je 0,475. Gornja granica intervala pouzdanosti je 0,775. Dakle, menadžer ima pravo vjerovati sa 95% povjerenja da će postotak kupaca koji novi proizvod ocijene 6 bodova ili više biti između 47,5 i 77,5.

Metoda 2

Ovaj problem se može riješiti korištenjem standardnih StatPro alata. Da biste to učinili, dovoljno je napomenuti da se udio u ovom slučaju poklapa sa prosječnom vrijednošću stupca Vrsta. Zatim se prijavljujemo StatPro/Statističko zaključivanje/Analiza jednog uzorka da se konstruiše interval pouzdanosti srednje vrednosti (procena matematičkog očekivanja) za kolonu Tip. Rezultati dobijeni u ovom slučaju bit će vrlo bliski rezultatima 1. metode (Sl. 99).

Interval pouzdanosti za standardnu ​​devijaciju

s se koristi kao procjena standardne devijacije (formula je data u odjeljku 1). Funkcija gustine procjene s je hi-kvadrat funkcija, koja, kao i t-distribucija, ima n-1 stupnjeva slobode. Postoje posebne funkcije za rad sa ovom distribucijom CHIDIST i CHIINV.

Interval pouzdanosti u ovom slučaju više neće biti simetričan. Konvencionalni granični dijagram prikazan je na Sl. 100 .

Primjer

Mašina mora proizvoditi dijelove prečnika 10 cm, međutim, zbog različitih okolnosti dolazi do grešaka. Kontrolor kvaliteta zabrinut je zbog dvije okolnosti: prvo, prosječna vrijednost treba da bude 10 cm; drugo, čak i u ovom slučaju, ako su odstupanja velika, tada će mnogi dijelovi biti odbijeni. Svaki dan pravi uzorak od 50 delova (pogledajte fajl KVALITETA CONTROL.XLS (šablon i rešenje). Kakve zaključke može dati takav uzorak?

Rješenje

Konstruirajmo 95% intervale povjerenja za srednju vrijednost i standardnu ​​devijaciju koristeći StatPro/Statističko zaključivanje/Analiza jednog uzorka(Sl. 101
).

Zatim, koristeći pretpostavku normalne raspodjele promjera, izračunavamo udio neispravnih proizvoda, postavljajući maksimalno odstupanje od 0,065. Koristeći mogućnosti tabele supstitucije (slučaj dva parametra), crtamo zavisnost udjela defekata od prosječne vrijednosti i standardne devijacije (Sl. 102).
).

Interval povjerenja za razliku između dvije sredine

Ovo je jedan od najvecih važne aplikacije statističke metode. Primjeri situacija.

    Menadžer prodavnice odeće želi da zna koliko više ili manje prosečna mušterija troši u prodavnici od prosečnog muškarca.

    Dvije avio kompanije lete na sličnim rutama. Organizacija potrošača želi da uporedi razliku između prosečnog očekivanog vremena kašnjenja leta za obe avio kompanije.

    Kompanija šalje kupone za pojedinačne vrste robu u jednom gradu i ne šalje u drugi. Menadžeri žele da uporede prosječne količine kupovine ovih proizvoda u naredna dva mjeseca.

    Prodavac automobila često ima posla sa bračnim parovima na prezentacijama. Kako bi razumjeli njihove lične reakcije na prezentaciju, parovi se često intervjuišu odvojeno. Menadžer želi ocijeniti razliku u ocjenama muškaraca i žena.

Slučaj nezavisnih uzoraka

Razlika između srednjih vrednosti će imati t-distribuciju sa n 1 + n 2 - 2 stepena slobode. Interval pouzdanosti za μ 1 - μ 2 izražava se relacijom:

Ovaj problem se može riješiti ne samo korištenjem gornjih formula, već i standardnim StatPro alatima. Da biste to učinili, dovoljno je koristiti

Interval pouzdanosti za razliku između proporcija

Neka je matematičko očekivanje udjela. Neka su njihove procjene uzorka, konstruirane iz uzoraka veličine n 1 i n 2, respektivno. Zatim je procjena razlike. Stoga se interval povjerenja ove razlike izražava kao:

Ovdje je z cr vrijednost dobivena iz normalne distribucije korištenjem posebnih tabela (na primjer, 1,96 za interval pouzdanosti od 95%).

Standardna greška procjene je u ovom slučaju izražena relacijom:

.

Primjer

Radnja je, pripremajući se za veliku rasprodaju, preduzela sljedeće korake: marketinško istraživanje. Odabrano je 300 najbolji kupci, koji su nasumično podijeljeni u dvije grupe od po 150 članova. Svim odabranim kupcima upućeni su pozivi za učešće u prodaji, ali su samo članovi prve grupe dobili kupon koji im daje pravo na popust od 5%. Prilikom prodaje evidentirane su kupovine svih 300 odabranih kupaca. Kako menadžer može protumačiti rezultate i donijeti sud o djelotvornosti kupona? (pogledajte datoteku COUPONS.XLS (šablon i rješenje)).

Rješenje

Za naš konkretan slučaj, od 150 kupaca koji su dobili kupon za popust, 55 je kupilo na akciji, a od 150 koji nisu dobili kupon, samo 35 je kupilo (Sl. 103
). Tada su vrijednosti proporcija uzorka 0,3667 i 0,2333, respektivno. A razlika uzorka između njih je jednaka 0,1333, respektivno. Uz pretpostavku intervala pouzdanosti od 95%, iz tabele normalne distribucije nalazimo z cr = 1,96. Izračunavanje standardne greške razlike uzorka je 0,0524. Konačno nalazimo da je donja granica intervala pouzdanosti od 95% 0,0307, ​​i gornja granica 0,2359 respektivno. Dobijeni rezultati se mogu tumačiti na način da na svakih 100 kupaca koji su dobili kupon za popust možemo očekivati ​​od 3 do 23 nova kupca. Međutim, moramo imati na umu da ovaj zaključak sam po sebi ne znači efikasnost korišćenja kupona (jer davanjem popusta gubimo profit!). Pokažimo to konkretnim podacima. Pretvarajmo se to prosječne veličine kupovina je jednaka 400 rubalja, od čega 50 rubalja. postoji profit za radnju. Tada je očekivani profit na 100 kupaca koji nisu dobili kupon:

50 0,2333 100 = 1166,50 rub.

Slične kalkulacije za 100 kupaca koji su dobili kupon daju:

30 0,3667 100 = 1100,10 rub.

Pad prosječne dobiti na 30 objašnjava se činjenicom da će, koristeći popust, kupci koji su dobili kupon u prosjeku kupovati za 380 rubalja.

Dakle, konačni zaključak ukazuje na neefikasnost korištenja takvih kupona u konkretnoj situaciji.

Komentar. Ovaj problem se može riješiti korištenjem standardnih StatPro alata. Da biste to učinili, dovoljno je smanjiti ovaj zadatak na problem procjene razlike između dva prosjeka korištenjem metode, a zatim primijeniti StatPro/Statističko zaključivanje/Analiza dva uzorka da se konstruiše interval poverenja za razliku između dve prosečne vrednosti.

Kontrola dužine intervala pouzdanosti

Dužina intervala pouzdanosti zavisi od sledećim uslovima :

    podaci direktno (standardna devijacija);

    nivo značaja;

    veličina uzorka.

Veličina uzorka za procjenu srednje vrijednosti

Prvo, razmotrimo problem u opštem slučaju. Označimo vrijednost polovine dužine intervala povjerenja koji nam je dat kao B (Sl. 104
). Znamo da se interval pouzdanosti za srednju vrijednost neke slučajne varijable X izražava kao , Gdje . vjerujući:

i izražavajući n, dobijamo .

nažalost, tačna vrijednost Ne znamo varijansu slučajne varijable X. Osim toga, ne znamo vrijednost tcr, jer ovisi o n kroz broj stupnjeva slobode. U ovoj situaciji možemo učiniti sljedeće. Umjesto varijanse s, koristimo neku procjenu varijanse na osnovu bilo koje dostupne implementacije slučajne varijable koja se proučava. Umjesto vrijednosti t cr, koristimo vrijednost z cr za normalnu distribuciju. Ovo je sasvim prihvatljivo, budući da su funkcije gustoće distribucije za normalnu i t-distribuciju vrlo bliske (osim za slučaj malog n). Dakle, tražena formula ima oblik:

.

Budući da formula daje, općenito govoreći, necijelobrojne rezultate, zaokruživanje s viškom rezultata uzima se kao željena veličina uzorka.

Primjer

Restoran brze hrane planira svoj asortiman proširiti novom vrstom sendviča. Kako bi procijenio potražnju za njim, menadžer planira nasumično odabrati određeni broj posjetitelja od onih koji su ga već isprobali i zamoliti ih da ocijene svoj stav prema novom proizvodu na skali od 1 do 10. Menadžer želi procijeniti očekivani broj bodova koje će novi proizvod dobiti proizvod i konstruirati interval pouzdanosti od 95% za ovu procjenu. Istovremeno, želi da pola širine intervala povjerenja ne prelazi 0,3. Koliko posjetilaca treba da intervjuiše?

kao što slijedi:

Evo r ots je procjena proporcije p, a B je data polovina dužine intervala povjerenja. Prekoračenje za n može se dobiti korištenjem vrijednosti r ots= 0,5. U ovom slučaju, dužina intervala pouzdanosti neće premašiti specificiranu vrijednost B za bilo koju pravu vrijednost p.

Primjer

Neka menadžer iz prethodnog primjera planira procijeniti udio kupaca koji su preferirali novu vrstu proizvoda. On želi da konstruiše interval pouzdanosti od 90% čija polovična dužina ne prelazi 0,05. Koliko klijenata treba uključiti u slučajni uzorak?

Rješenje

U našem slučaju, vrijednost z cr = 1,645. Stoga se potrebna količina izračunava kao .

Ako bi menadžer imao razloga vjerovati da je željena p-vrijednost, na primjer, približno 0,3, tada bismo zamjenom ove vrijednosti u gornju formulu dobili manju vrijednost slučajnog uzorka, odnosno 228.

Formula za određivanje nasumična veličina uzorka u slučaju razlike između dva srednja vrijednost napisano kao:

.

Primjer

Neka kompjuterska kompanija ima centar za korisničku podršku. IN U poslednje vreme povećan je broj pritužbi korisnika na loš kvalitet usluge. IN servisni centar Uglavnom postoje dvije vrste zaposlenih: oni koji nemaju puno iskustva, ali su završili posebne pripremne kurseve i oni koji imaju veliko praktično iskustvo, a nisu završili specijalne kurseve. Kompanija želi da analizira pritužbe kupaca u proteklih šest mjeseci i uporedi prosječan broj pritužbi za svaku od dvije grupe zaposlenih. Pretpostavlja se da će brojevi u uzorcima za obje grupe biti isti. Koliko zaposlenih mora biti uključeno u uzorak da bi se dobio interval od 95% sa polovičnom dužinom ne većom od 2?

Rješenje

Ovdje je σ ots procjena standardne devijacije obje slučajne varijable pod pretpostavkom da su bliske. Dakle, u našem zadatku moramo nekako dobiti ovu procjenu. To se može učiniti, na primjer, na sljedeći način. Gledajući podatke o žalbama kupaca u proteklih šest mjeseci, menadžer može primijetiti da svaki zaposleni generalno dobije od 6 do 36 pritužbi. Znajući da se za normalnu distribuciju gotovo sve vrijednosti ne uklanjaju više od tri puta od srednje vrijednosti standardne devijacije, on može razumno vjerovati da:

, odakle je σ ots = 5.

Zamjenom ove vrijednosti u formulu dobijamo .

Formula za određivanje slučajna veličina uzorka u slučaju procjene razlike između proporcija ima oblik:

Primjer

Neka kompanija ima dvije fabrike koje proizvode slične proizvode. Menadžer kompanije želi da uporedi procenat neispravnih proizvoda u obe fabrike. Prema dostupnim informacijama, stopa kvarova u obje fabrike kreće se od 3 do 5%. Predviđeno je da se konstruiše interval pouzdanosti od 99% sa polovičnom dužinom ne većom od 0,005 (ili 0,5%). Koliko proizvoda treba izabrati iz svake fabrike?

Rješenje

Ovdje su p 1ots i p 2ots procjene dva nepoznata udjela kvarova u 1. i 2. tvornici. Ako stavimo p 1ots = p 2ots = 0,5, onda ćemo dobiti precijenjenu vrijednost za n. Ali pošto u našem slučaju imamo neke apriorne informacije o ovim udjelima, uzimamo gornju procjenu ovih udjela, odnosno 0,05. Dobijamo

Prilikom procjene nekih parametara populacije iz podataka uzorka, korisno je dati ne samo tačka procene parametar, ali i ukazuje na interval pouzdanosti koji pokazuje gdje se može nalaziti tačna vrijednost procijenjenog parametra.

U ovom poglavlju smo se također upoznali s kvantitativnim odnosima koji nam omogućavaju da konstruiramo takve intervale za različite parametre; naučili načine za kontrolu dužine intervala povjerenja.

Napominjemo da se problem procjene veličine uzorka (problem planiranja eksperimenta) može riješiti korištenjem standardnih StatPro alata, tj. StatPro/Statistički zaključak/Odabir veličine uzorka.

"Katren-Style" nastavlja objavljivanje ciklusa Konstantina Kravčika o medicinska statistika. U dva prethodna članka autor se bavio objašnjenjem pojmova kao što su i.

Konstantin Kravchik

Matematičar-analitičar. Specijalista u ovoj oblasti statističko istraživanje u medicini i humanističkim naukama

Moskva grad

Vrlo često u člancima o klinička istraživanja možete naići na misterioznu frazu: “interval pouzdanosti” (95 % CI ili 95 % CI - interval pouzdanosti). Na primjer, članak može napisati: „Da bismo procijenili značaj razlika, koristili smo se Studentov t-test sa izračunavanjem 95 % intervala pouzdanosti.”

Koja je vrijednost “95 % intervala pouzdanosti” i zašto je izračunati?

Šta je interval pouzdanosti? - Ovo je raspon unutar kojeg prava populacija znači laž. Postoje li “neistiniti” prosjeci? U određenom smislu, da, imaju. Objasnili smo da je nemoguće izmjeriti parametar od interesa u cijeloj populaciji, pa se istraživači zadovoljavaju ograničenim uzorkom. U ovom uzorku (na primjer, na osnovu tjelesne težine) postoji jedna prosječna vrijednost (određena težina), po kojoj prosuđujemo prosječnu vrijednost u cijeloj populaciji. Međutim, malo je vjerovatno da će se prosječna težina u uzorku (posebno malom) poklapati sa prosječnom težinom u općoj populaciji. Stoga je ispravnije izračunati i koristiti raspon prosječnih vrijednosti populacije.

Na primjer, zamislite da je interval pouzdanosti od 95% (95% CI) za hemoglobin 110 do 122 g/L. To znači da postoji 95% šanse da će prava srednja vrijednost hemoglobina u populaciji biti između 110 i 122 g/L. Drugim riječima, ne znamo prosjek hemoglobina u općoj populaciji, ali možemo naznačiti raspon vrijednosti za ovu karakteristiku sa vjerovatnoćom od 95 %.

Intervali pouzdanosti su posebno relevantni za razlike u srednjim vrijednostima između grupa, ili veličinama efekta kako se oni nazivaju.

Recimo da smo uporedili efikasnost dva preparata gvožđa: jednog koji je već duže vreme na tržištu i jednog koji je tek registrovan. Nakon završene terapije vršili smo procenu koncentracije hemoglobina u ispitivanim grupama pacijenata, a statističkim programom je izračunato da je razlika između prosečnih vrednosti dve grupe sa verovatnoćom od 95 % u rasponu od 1,72 do 14,36 g/l (Tabela 1).

Table 1. Test za nezavisne uzorke
(grupe se porede po nivou hemoglobina)

Ovo treba tumačiti na sljedeći način: kod nekih pacijenata u općoj populaciji koji uzimaju nova droga, hemoglobin će u prosjeku biti viši za 1,72–14,36 g/l nego kod onih koji su uzimali već poznati lijek.

Drugim riječima, u općoj populaciji razlika u prosječnim vrijednostima hemoglobina između grupa je u ovim granicama sa vjerovatnoćom od 95%. Na istraživaču će biti da proceni da li je to mnogo ili malo. Poenta svega je da ne radimo sa jednom prosječnom vrijednošću, već s rasponom vrijednosti, pa stoga pouzdanije procjenjujemo razliku u parametru između grupa.

U statističkim paketima, prema diskreciji istraživača, možete samostalno suziti ili proširiti granice intervala povjerenja. Smanjenjem vjerovatnoće intervala povjerenja, sužavamo raspon srednjih vrijednosti. Na primjer, pri 90 % CI raspon srednjih vrijednosti (ili razlika u srednjim vrijednostima) će biti uži nego kod 95 %.

Suprotno tome, povećanje vjerovatnoće na 99 % proširuje raspon vrijednosti. Prilikom upoređivanja grupa, donja granica CI može preći nultu oznaku. Na primjer, ako smo proširili granice intervala povjerenja na 99 %, onda su granice intervala bile u rasponu od –1 do 16 g/l. To znači da u opštoj populaciji postoje grupe čija je razlika u srednjim vrednostima za karakteristiku koja se proučava jednaka 0 (M = 0).

Koristeći interval pouzdanosti, možete provjeriti statističke hipoteze. Ako interval pouzdanosti prelazi nultu vrijednost, tada je tačna nulta hipoteza, koja pretpostavlja da se grupe ne razlikuju po parametru koji se proučava. Gore je opisan primjer gdje smo proširili granice na 99 %. Negdje u opštoj populaciji našli smo grupe koje se ni po čemu nisu razlikovale.

95% interval pouzdanosti razlike u hemoglobinu, (g/l)


Na slici je prikazan interval pouzdanosti od 95% za razliku srednjih vrijednosti hemoglobina između dvije grupe. Prava prolazi kroz nultu oznaku, stoga postoji razlika između srednjih vrijednosti nule, što potvrđuje nultu hipotezu da se grupe ne razlikuju. Raspon razlika između grupa je od –2 do 5 g/L To znači da se hemoglobin može smanjiti za 2 g/L ili povećati za 5 g/L.

Interval povjerenja je vrlo važan indikator. Zahvaljujući njemu možete vidjeti da li su razlike u grupama zaista nastale zbog razlike u srednjim vrijednostima ili zbog velikog uzorka, jer su kod velikog uzorka šanse za pronalaženje razlika veće nego kod malog.

U praksi bi to moglo izgledati ovako. Uzeli smo uzorak od 1000 ljudi, izmjerili nivoe hemoglobina i ustanovili da se interval pouzdanosti za razliku u srednjim vrijednostima kretao od 1,2 do 1,5 g/l. Nivo statističke značajnosti u ovom slučaju str

Vidimo da je koncentracija hemoglobina porasla, ali gotovo neprimjetno, dakle, statistički značaj pojavio upravo zbog veličine uzorka.

Intervali povjerenja mogu se izračunati ne samo za sredstva, već i za proporcije (i omjere rizika). Na primjer, zanima nas interval povjerenja proporcija pacijenata koji su postigli remisiju uzimajući razvijeni lijek. Pretpostavimo da se CI od 95 % za proporcije, odnosno za udio takvih pacijenata, nalazi u rasponu od 0,60–0,80. Dakle, možemo reći da naša medicina ima terapeutski efekat od 60 do 80 % slučajeva.

Pretpostavimo da imamo veliki broj artikala sa normalnom distribucijom nekih karakteristika (na primjer, puno skladište povrća iste vrste, čija veličina i težina varira). Želite znati prosječne karakteristike cijele serije robe, ali nemate ni vremena ni želje da mjerite i vagate svako povrće. Razumijete da to nije potrebno. Ali koliko bi komada trebalo uzeti za provjeru na licu mjesta?

Prije nego što damo nekoliko formula korisnih za ovu situaciju, podsjetimo se neke oznake.

Prvo, kada bismo izmjerili cijelo skladište povrća (ovaj skup elemenata se zove opšta populacija), tada bismo sa svom dostupnom preciznošću znali prosječnu težinu cijele serije. Nazovimo ovo prosjekom X avg .g en . - opšti prosek. Već znamo šta je potpuno određeno ako su poznati njegova srednja vrijednost i devijacija s . Istina, dok nismo ni X prosječna gen s Ne poznajemo opštu populaciju. Možemo uzeti samo određeni uzorak, izmjeriti vrijednosti koje su nam potrebne i izračunati za ovaj uzorak i prosječnu vrijednost X avg i standardnu ​​devijaciju S.

Poznato je da ako naša provjera uzorka sadrži veliki broj elemenata (obično je n veće od 30), a oni se uzimaju zaista nasumično, zatim s opća populacija teško da će se razlikovati od S selekcije ..

Osim toga, za slučaj normalne distribucije možemo koristiti sljedeće formule:

Sa vjerovatnoćom od 95%


Sa vjerovatnoćom od 99%



IN opšti pogled sa vjerovatnoćom P (t)


Odnos između vrijednosti t i vrijednosti vjerovatnoće P (t), s kojom želimo znati interval povjerenja, može se uzeti iz sljedeće tabele:


Tako smo odredili u kom rasponu se nalazi prosječna vrijednost za populaciju (sa datom vjerovatnoćom).

Ako nemamo dovoljno veliki uzorak, ne možemo to reći stanovništva ima s = S odaberite Osim toga, u ovom slučaju je problematična blizina uzorka normalnoj distribuciji. U ovom slučaju koristimo i S select umjesto toga s u formuli:




ali će vrijednost t za fiksnu vjerovatnoću P(t) zavisiti od broja elemenata u uzorku n. Što je n veći, rezultujući interval pouzdanosti će biti bliži vrednosti datoj formulom (1). Vrijednosti t u ovom slučaju su preuzete iz druge tabele (Studentov t-test), koju predstavljamo u nastavku:

Studentove vrijednosti t-testa za vjerovatnoću 0,95 i 0,99


Primjer 3. Od zaposlenih u kompaniji nasumično je odabrano 30 ljudi. Prema uzorku, ispostavilo se da je prosječna plata (mjesečno) 30 hiljada rubalja sa standardnom devijacijom od 5 hiljada rubalja. Odredite prosječnu platu u kompaniji sa vjerovatnoćom od 0,99.

Rješenje: Po uslovu imamo n = 30, X avg. =30000, S=5000, P = 0,99. Da bismo pronašli interval pouzdanosti, koristićemo formulu koja odgovara Studentovom t testu. Iz tabele za n = 30 i P = 0,99 nalazimo t = 2,756, dakle,


one. traženi poverenik interval 27484< Х ср.ген < 32516.

Dakle, sa vjerovatnoćom od 0,99 možemo reći da interval (27484; 32516) sadrži u sebi prosječnu platu u kompaniji.

Nadamo se da ćete koristiti ovu metodu i nije neophodno da svaki put imate sto sa sobom. Proračuni se mogu izvršiti automatski u Excel-u. Dok ste u Excel datoteci, kliknite na dugme fx u gornjem meniju. Zatim među funkcijama odaberite „statistički” tip, a sa predložene liste u prozoru - STUDAR DISCOVER. Zatim, na upit, postavljajući kursor u polje „verovatnoća“, unesite vrednost inverzne verovatnoće (tj. u našem slučaju, umesto verovatnoće od 0,95, potrebno je da unesete verovatnoću od 0,05). Očigledno tabela je sastavljena na način da rezultat odgovara na pitanje s kojom vjerovatnoćom možemo pogriješiti. Slično, u polje Degree of Freedom unesite vrijednost (n-1) za vaš uzorak.



Novo na sajtu

>

Najpopularniji