Dom Usnoj šupljini Interval pouzdanosti za matematičko očekivanje normalne distribucije sa poznatom varijansom. Interval pouzdanosti za matematička očekivanja

Interval pouzdanosti za matematičko očekivanje normalne distribucije sa poznatom varijansom. Interval pouzdanosti za matematička očekivanja

Ugradimo u MS EXCEL interval povjerenja procijeniti srednju vrijednost distribucije u slučaju poznata vrijednost varijanse.

Naravno izbor nivo poverenja potpuno zavisi od problema koji se rešava. Dakle, stepen povjerenja putnika u pouzdanost aviona nesumnjivo bi trebao biti veći od stepena povjerenja kupca u pouzdanost električne sijalice.

Formulacija problema

Pretpostavimo da od stanovništva oduzeto uzorak veličina n. Pretpostavlja se da standardna devijacija ova distribucija je poznata. Na osnovu ovoga je neophodno uzorci proceniti nepoznato srednja distribucija(μ, ) i konstruisati odgovarajuće dvostrano interval povjerenja.

Tačka procjena

Kao što je poznato iz statistika(označimo ga X avg) je nepristrasna procjena srednje vrijednosti ovo stanovništva i ima distribuciju N(μ;σ 2 /n).

Bilješka: Šta učiniti ako trebate graditi interval povjerenja u slučaju distribucije koja nije normalno? U ovom slučaju priskače u pomoć, što govori da je dovoljno velika veličina uzorci n iz distribucije ne biti normalno, uzorak distribucije statistike X prosće otprilike dopisivati ​​se normalna distribucija sa parametrima N(μ;σ 2 /n).

dakle, tačka procene prosjek vrijednosti distribucije imamo - ovo srednja vrijednost uzorka, tj. X avg. Hajdemo sada interval povjerenja.

Izgradnja intervala povjerenja

Obično, poznavajući distribuciju i njene parametre, možemo izračunati vjerovatnoću da će slučajna varijabla uzeti vrijednost iz intervala koji odredimo. Sada uradimo suprotno: pronađite interval u koji će slučajna varijabla pasti sa datom vjerovatnoćom. Na primjer, iz svojstava normalna distribucija poznato je da je sa vjerovatnoćom od 95% slučajna varijabla raspoređena po normalan zakon, pasti će u raspon od približno +/- 2 od prosječna vrijednost(vidi članak o). Ovaj interval će nam poslužiti kao prototip interval povjerenja.

Sada da vidimo da li znamo distribuciju , izračunati ovaj interval? Da bismo odgovorili na pitanje, moramo navesti oblik distribucije i njene parametre.

Znamo oblik distribucije - to je normalna distribucija (zapamtite da govorimo o distribucija uzorkovanja statistika X avg).

Parametar μ nam je nepoznat (samo ga treba procijeniti pomoću interval povjerenja), ali imamo procjenu toga X prosječno, izračunato na osnovu uzorci, koji se mogu koristiti.

Drugi parametar - standardna devijacija srednje vrijednosti uzorka smatraćemo to poznatim, jednako je σ/√n.

Jer ne znamo μ, onda ćemo izgraditi interval +/- 2 standardne devijacije ne od prosječna vrijednost, i iz njegove poznate procjene X avg. One. prilikom izračunavanja interval povjerenja to NEĆEMO pretpostaviti X avg spada u raspon +/- 2 standardne devijacije od μ sa vjerovatnoćom od 95%, a pretpostavićemo da je interval +/- 2 standardne devijacije od X avg sa 95% vjerovatnoće će pokriti μ – prosek opšte populacije, iz koje se uzima uzorak. Ove dvije izjave su ekvivalentne, ali nam druga izjava omogućava konstruiranje interval povjerenja.

Uz to, razjasnimo interval: slučajna varijabla raspoređena po normalan zakon, sa vjerovatnoćom od 95% spada u interval +/- 1.960 standardne devijacije, ne +/- 2 standardne devijacije. Ovo se može izračunati pomoću formule =NORM.ST.REV((1+0,95)/2), cm. primjer datoteke Sheet Interval.

Sada možemo formulisati verovatnoćan iskaz koji će nam poslužiti za formiranje interval povjerenja:
„Verovatnoća da srednja populacija nalazi se od prosek uzorka unutar 1.960 " standardne devijacije srednje vrijednosti uzorka", jednako 95%".

Vrijednost vjerovatnoće spomenuta u izjavi ima poseban naziv , koji je povezan sa nivo značajnosti α (alfa) jednostavnim izrazom nivo poverenja =1 . U našem slučaju nivo značajnosti α =1-0,95=0,05 .

Sada, na osnovu ove vjerovatnoće, pišemo izraz za izračunavanje interval povjerenja:

gdje je Z α/2 standard normalna distribucija(ova vrijednost slučajne varijable z, Šta P(z>=Z α/2 )=α/2).

Bilješka: Gornji α/2-kvantil definiše širinu interval povjerenja V standardne devijacije srednja vrijednost uzorka. Gornji α/2-kvantil standard normalna distribucija uvijek veće od 0, što je vrlo zgodno.

U našem slučaju, sa α=0,05, gornji α/2-kvantil jednako 1.960. Za druge nivoe značajnosti α (10%; 1%) gornji α/2-kvantil Z α/2 može se izračunati pomoću formule =NORM.ST.REV(1-α/2) ili, ako je poznato nivo poverenja, =NORM.ST.OBR((1+nivo povjerenja)/2).

Obično prilikom izgradnje intervali povjerenja za procjenu srednje vrijednosti koristiti samo gornji α/2-kvantil i nemojte koristiti niži α/2-kvantil. Ovo je moguće jer standard normalna distribucija simetrično oko x ose ( njegova gustina distribucije simetrično oko prosjek, tj. 0). Stoga nema potrebe za kalkulacijom niži α/2-kvantil(jednostavno se zove α /2-kvantil), jer jednako je gornji α/2-kvantil sa znakom minus.

Podsjetimo da je, uprkos obliku distribucije vrijednosti x, odgovarajuća slučajna varijabla X avg distribuirano otprilike U redu N(μ;σ 2 /n) (vidi članak o). Stoga, u opšti slučaj, gornji izraz za interval povjerenja je samo aproksimacija. Ako je vrijednost x raspoređena po normalan zakon N(μ;σ 2 /n), zatim izraz za interval povjerenja je tačno.

Izračunavanje intervala pouzdanosti u MS EXCEL-u

Hajde da rešimo problem.
Vrijeme odziva elektronske komponente na ulazni signal je važna karakteristika uređaja. Inženjer želi da konstruiše interval pouzdanosti za prosečno vreme odgovora na nivou pouzdanosti od 95%. Iz prethodnog iskustva, inženjer zna da je standardna devijacija vremena odziva 8 ms. Poznato je da je za procjenu vremena odziva inženjer izvršio 25 mjerenja, prosječna vrijednost bila je 78 ms.

Rješenje: Inženjer želi znati vrijeme odgovora elektronski uređaj, ali razumije da vrijeme odgovora nije fiksna vrijednost, već slučajna varijabla koja ima svoju distribuciju. Dakle, najbolje čemu se može nadati je da odredi parametre i oblik ove distribucije.

Nažalost, iz uslova problema ne znamo oblik distribucije vremena odziva (ne mora biti normalno). , ova distribucija je također nepoznata. Samo on je poznat standardna devijacijaσ=8. Stoga, dok ne možemo izračunati vjerovatnoće i konstruirati interval povjerenja.

Međutim, uprkos činjenici da ne znamo distribuciju vrijeme odvojen odgovor, znamo da prema CPT, distribucija uzorkovanja prosječno vrijeme odgovora je približno normalno(pretpostavićemo da su uslovi CPT se sprovode, jer veličina uzorci prilično velika (n=25)) .

Štaviše, prosjek ova distribucija je jednaka prosječna vrijednost distribucija jednog odgovora, tj. μ. A standardna devijacija ove distribucije (σ/√n) može se izračunati pomoću formule =8/ROOT(25) .

Takođe je poznato da je inženjer primio tačka procene parametar μ jednak 78 ms (X pros.). Dakle, sada možemo izračunati vjerovatnoće, jer znamo oblik distribucije ( normalno) i njegove parametre (X avg i σ/√n).

Inženjer želi da zna očekivanu vrijednost μ distribucije vremena odziva. Kao što je gore navedeno, ovaj μ je jednak matematičko očekivanje distribucije uzorka prosječnog vremena odgovora. Ako koristimo normalna distribucija N(X avg; σ/√n), tada će željeni μ biti u opsegu +/-2*σ/√n sa vjerovatnoćom od približno 95%.

Nivo značaja jednako 1-0,95=0,05.

Konačno, pronađimo lijevu i desnu granicu interval povjerenja.
Lijeva granica: =78-NORM.ST.REV(1-0,05/2)*8/ROOT(25) = 74,864
Desna granica: =78+NORM.ST.INV(1-0,05/2)*8/ROOT(25)=81,136

Lijeva granica: =NORM.REV(0,05/2; 78; 8/ROOT(25))
Desna granica: =NORM.REV(1-0,05/2; 78; 8/KORIJEN(25))

Odgovori: interval povjerenja at 95% nivo pouzdanosti i σ=8msec jednaki 78+/-3,136 ms.

IN primjer datoteke na Sigma listu poznat, kreirao obrazac za obračun i konstrukciju dvostrano interval povjerenja za proizvoljno uzorci sa datim σ i nivo značaja.

CONFIDENCE.NORM() funkcija

Ako vrijednosti uzorci su u dometu B20:B79 , A nivo značajnosti jednako 0,05; zatim MS EXCEL formula:
=PROSJEK(B20:B79)-POVJERENJE.NORMA(0,05;σ; BROJ(B20:B79))
će vratiti lijevu ivicu interval povjerenja.

Ista granica se može izračunati pomoću formule:
=PROSJEK(B20:B79)-NORM.ST.REV(1-0,05/2)*σ/ROOT(BROJ(B20:B79))

Bilješka: Funkcija CONFIDENCE.NORM() pojavila se u MS EXCEL-u 2010. U ranijim verzijama MS EXCEL-a, korištena je funkcija TRUST().

Interval pouzdanosti za matematička očekivanja - ovo je interval izračunat iz podataka koji sa poznatom vjerovatnoćom sadrži matematičko očekivanje opće populacije. Prirodna procjena za matematičko očekivanje je aritmetička sredina njegovih promatranih vrijednosti. Zbog toga ćemo tokom čitave lekcije koristiti pojmove „prosjek“ i „prosječna vrijednost“. U problemima izračunavanja intervala pouzdanosti, odgovor koji se najčešće traži je nešto poput „Interval pouzdanosti prosječnog broja [vrijednosti u određenom problemu] je od [manje vrijednosti] do [veće vrijednosti].“ Koristeći interval pouzdanosti, možete procijeniti ne samo prosječne vrijednosti, već i udio određene karakteristike opće populacije. O prosječnim vrijednostima, disperziji, standardnoj devijaciji i grešci, kroz koje ćemo doći do novih definicija i formula, govori se u lekciji Karakteristike uzorka i populacije .

Tačkaste i intervalne procjene srednje vrijednosti

Ako je prosječna vrijednost populacije procijenjena brojem (bodom), tada se kao procjena nepoznate prosječne vrijednosti populacije uzima određeni prosjek, koji se izračunava iz uzorka opservacija. U ovom slučaju, vrijednost uzorka srednje vrijednosti - slučajne varijable - ne poklapa se sa srednjom vrijednošću opće populacije. Stoga, kada pokazujete srednju vrijednost uzorka, morate istovremeno naznačiti grešku uzorkovanja. Mjera greške uzorkovanja je standardna greška, koja se izražava u istim jedinicama kao i srednja vrijednost. Stoga se često koristi sljedeća notacija: .

Ako procjenu prosjeka treba povezati sa određenom vjerovatnoćom, onda se parametar od interesa u populaciji mora procijeniti ne jednim brojem, već intervalom. Interval pouzdanosti je interval u kojem, sa određenom vjerovatnoćom P nalazi se vrijednost indikatora procijenjenog stanovništva. Interval povjerenja u kojem je vjerovatno P = 1 - α pronađena je slučajna varijabla, izračunata na sljedeći način:

,

α = 1 - P, koji se može naći u dodatku gotovo svake knjige o statistici.

U praksi, populacijska srednja vrijednost i varijansa nisu poznate, pa se varijansa populacije zamjenjuje varijansom uzorka, a populacijska srednja vrijednost uzorkom. Stoga se interval pouzdanosti u većini slučajeva izračunava na sljedeći način:

.

Formula intervala pouzdanosti može se koristiti za procjenu srednje vrijednosti populacije ako

  • poznata je standardna devijacija populacije;
  • ili je standardna devijacija populacije nepoznata, ali je veličina uzorka veća od 30.

Srednja vrijednost uzorka je nepristrasna procjena srednje vrijednosti populacije. Zauzvrat, varijansa uzorka nije nepristrasna procjena varijanse populacije. Da bi se dobila nepristrasna procjena varijanse populacije u formuli varijanse uzorka, veličina uzorka n treba zamijeniti sa n-1.

Primjer 1. Od 100 nasumično odabranih kafića u određenom gradu prikupljena je informacija da je prosječan broj zaposlenih u njima 10,5 sa standardnom devijacijom od 4,6. Odredite interval pouzdanosti od 95% za broj zaposlenih u kafiću.

gdje je kritična vrijednost standardne normalne distribucije za nivo značajnosti α = 0,05 .

Tako se interval povjerenja od 95% za prosječan broj zaposlenih u kafiću kretao od 9,6 do 11,4.

Primjer 2. Za slučajni uzorak iz populacije od 64 opservacije, izračunate su sljedeće ukupne vrijednosti:

zbir vrijednosti u zapažanjima,

zbir kvadrata odstupanja vrijednosti od prosjeka .

Izračunajte 95% interval pouzdanosti za matematičko očekivanje.

Izračunajmo standardnu ​​devijaciju:

,

Izračunajmo prosječnu vrijednost:

.

Zamjenjujemo vrijednosti u izraz za interval povjerenja:

gdje je kritična vrijednost standardne normalne distribucije za nivo značajnosti α = 0,05 .

Dobijamo:

Tako se interval pouzdanosti od 95% za matematičko očekivanje ovog uzorka kretao od 7,484 do 11,266.

Primjer 3. Za slučajni uzorak populacije od 100 opservacija, izračunata srednja vrijednost je 15,2, a standardna devijacija je 3,2. Izračunajte interval pouzdanosti od 95% za očekivanu vrijednost, a zatim 99% interval pouzdanosti. Ako snaga uzorka i njena varijacija ostanu nepromijenjene, a koeficijent pouzdanosti raste, hoće li se interval povjerenja suziti ili proširiti?

Ove vrijednosti zamjenjujemo u izraz za interval povjerenja:

gdje je kritična vrijednost standardne normalne distribucije za nivo značajnosti α = 0,05 .

Dobijamo:

.

Tako se interval pouzdanosti od 95% za srednju vrijednost ovog uzorka kretao od 14,57 do 15,82.

Ponovo zamjenjujemo ove vrijednosti u izraz za interval povjerenja:

gdje je kritična vrijednost standardne normalne distribucije za nivo značajnosti α = 0,01 .

Dobijamo:

.

Tako se interval pouzdanosti od 99% za srednju vrijednost ovog uzorka kretao od 14,37 do 16,02.

Kao što vidimo, kako se koeficijent pouzdanosti povećava, tako se povećava i kritična vrijednost standardne normalne distribucije, pa se početna i završna tačka intervala nalaze dalje od srednje vrijednosti, a samim tim raste i interval povjerenja za matematičko očekivanje. .

Tačkaste i intervalne procjene specifične težine

Udio neke karakteristike uzorka može se tumačiti kao tačka procene specifična gravitacija str iste karakteristike u opštoj populaciji. Ako ovu vrijednost treba povezati s vjerovatnoćom, tada treba izračunati interval pouzdanosti specifične težine str karakteristika u populaciji sa vjerovatnoćom P = 1 - α :

.

Primjer 4. U nekom gradu postoje dva kandidata A I B kandiduju se za gradonačelnika. Anketirano je nasumično 200 stanovnika grada, od kojih je 46% odgovorilo da bi glasalo za kandidata A, 26% - za kandidata B a 28% ne zna za koga će glasati. Odredite interval povjerenja od 95% za udio stanovnika grada koji podržavaju kandidata A.

Za početak, podsjetimo se sljedeće definicije:

Razmotrimo sljedeću situaciju. Neka varijante populacije imaju normalnu distribuciju sa matematičkim očekivanjem $a$ i standardnom devijacijom $\sigma$. Uzorak srednji u u ovom slučajuće se tretirati kao slučajna varijabla. Kada je količina $X$ normalno raspoređena, srednja vrijednost uzorka također će biti normalno raspoređena s parametrima

Nađimo interval pouzdanosti koji pokriva vrijednost $a$ sa pouzdanošću od $\gamma $.

Da bismo to učinili, potrebna nam je jednakost

Od toga dobijamo

Odavde možemo lako pronaći $t$ iz tablice vrijednosti funkcije $F\left(t\right)$ i, kao posljedicu, pronaći $\delta $.

Prisjetimo se tablice vrijednosti funkcije $F\left(t\right)$:

Slika 1. Tabela vrijednosti funkcije $F\left(t\right).$

Integral pouzdanosti za procjenu matematičkog očekivanja za nepoznati $(\mathbf \sigma )$

U ovom slučaju koristićemo ispravljenu vrijednost varijanse $S^2$. Zamjenom $\sigma $ sa $S$ u gornjoj formuli dobijamo:

Primjeri problema za pronalaženje intervala povjerenja

Primjer 1

Neka veličina $X$ ima normalnu distribuciju sa varijansom $\sigma =4$. Neka veličina uzorka bude $n=64$, a pouzdanost $\gamma =0,95$. Pronađite interval pouzdanosti za procjenu matematičkog očekivanja ove distribucije.

Moramo pronaći interval ($\overline(x)-\delta ,\overline(x)+\delta)$.

Kao što smo vidjeli gore

\[\delta =\frac(\sigma t)(\sqrt(n))=\frac(4t)(\sqrt(64))=\frac(\t)(2)\]

Parametar $t$ se može naći iz formule

\[F\left(t\right)=\frac(\gamma )(2)=\frac(0.95)(2)=0.475\]

Iz tabele 1 nalazimo da je $t=1.96$.

Neka CB X formira opštu populaciju i neka je β nepoznati parametar CB X. Ako je statistička procjena u * konzistentna, onda što je veća veličina uzorka, točnije dobijamo vrijednost β. Međutim, u praksi nemamo baš velike uzorke, pa ne možemo garantovati veću tačnost.

Neka je b* statistička procjena za c. Vrijednost |in* - in| naziva se tačnost procjene. Jasno je da je tačnost CB, pošto je β* slučajna varijabla. Navedite mali pozitivan broj 8 i zahtijevamo da je tačnost procjene |v* - v| bio manji od 8, tj. | u* - u |< 8.

Pouzdanost g ili verovatnoća poverenja procjene u po in * je vjerovatnoća g sa kojom je nejednakost |in * - in|< 8, т. е.

Obično je pouzdanost g specificirana unaprijed, a g se uzima kao broj blizu 1 (0,9; 0,95; 0,99; ...).

Budući da je nejednakost |in * - in|< S равносильно двойному неравенству в* - S < в < в* + 8, то получаем:

Interval (u * - 8, u * + 5) naziva se interval povjerenja, tj. interval povjerenja pokriva nepoznati parametar u s vjerovatnoćom y. Imajte na umu da su krajevi intervala pouzdanosti nasumični i variraju od uzorka do uzorka, pa je tačnije reći da interval (u * - 8, u * + 8) pokriva nepoznati parametar u, umjesto da pripada ovom interval.

Neka stanovništva je dato slučajnom varijablom X, raspoređenom prema normalnom zakonu, a standardna devijacija a je poznata. Nepoznato je matematičko očekivanje a = M (X). Potrebno je pronaći interval pouzdanosti za a za datu pouzdanost y.

Uzorak srednji

je statistička procjena za xr = a.

Teorema. Slučajna vrijednost xB ima normalnu distribuciju ako X ima normalnu distribuciju i M(XB) = a,

A (XB) = a, gdje je a = y/B (X), a = M (X). l/i

Interval pouzdanosti za a ima oblik:

Nalazimo 8.

Koristeći omjer

gdje je F(r) Laplaceova funkcija, imamo:

P ( | XB - a |<8} = 2Ф

tablicu vrijednosti Laplaceove funkcije nalazimo vrijednost t.

Nakon što je odredio

T, dobijamo F(t) = g Pošto je g zadato, onda po

Iz jednakosti nalazimo da je procjena tačna.

To znači da interval pouzdanosti za a ima oblik:

S obzirom na uzorak iz populacije X

ng za" X2 Xm
n. n1 n2 nm

n = U1 + ... + nm, tada će interval pouzdanosti biti:

Primjer 6.35. Pronađite interval pouzdanosti za procjenu matematičkog očekivanja a normalne distribucije sa pouzdanošću od 0,95, znajući srednju vrijednost uzorka Xb = 10,43, veličinu uzorka n = 100 i standardnu ​​devijaciju s = 5.

Koristimo formulu

Neka je slučajna varijabla X populacije normalno raspoređena, uzimajući u obzir da su varijansa i standardna devijacija s ove distribucije poznate. Potrebno je procijeniti nepoznato matematičko očekivanje korištenjem srednje vrijednosti uzorka. U ovom slučaju, zadatak se svodi na pronalaženje intervala povjerenja za matematičko očekivanje s pouzdanošću b. Ako navedete vrijednost vjerovatnoće pouzdanosti (pouzdanosti) b, tada možete pronaći vjerovatnoću pada u interval za nepoznato matematičko očekivanje koristeći formulu (6.9a):

gdje je F(t) Laplaceova funkcija (5.17a).

Kao rezultat, možemo formulirati algoritam za pronalaženje granica intervala povjerenja za matematičko očekivanje ako je poznata varijansa D = s 2:

  1. Postavite vrijednost pouzdanosti – b.
  2. Iz (6.14) izraziti F(t) = 0,5× b. Odaberite vrijednost t iz tabele za Laplaceovu funkciju na osnovu vrijednosti F(t) (vidi Dodatak 1).
  3. Izračunajte devijaciju e koristeći formulu (6.10).
  4. Zapišite interval povjerenja koristeći formulu (6.12) tako da sa vjerovatnoćom b vrijedi nejednakost:

.

Primjer 5.

Slučajna varijabla X ima normalnu distribuciju. Pronađite intervale povjerenja za procjenu s pouzdanošću b = 0,96 nepoznatog matematičkog očekivanja a, ako je dato:

1) opšta standardna devijacija s = 5;

2) prosek uzorka;

3) veličina uzorka n = 49.

U formuli (6.15) intervalne procjene matematičkog očekivanja A sa pouzdanošću b sve veličine osim t su poznate. Vrijednost t se može naći pomoću (6.14): b = 2F(t) = 0,96. F(t) = 0,48.

Koristeći tabelu u Dodatku 1 za Laplaceovu funkciju F(t) = 0,48, pronađite odgovarajuću vrijednost t = 2,06. dakle, . Zamjenom izračunate vrijednosti e u formulu (6.12), možete dobiti interval povjerenja: 30-1,47< a < 30+1,47.

Potreban interval pouzdanosti za procjenu sa pouzdanošću b = 0,96 nepoznatog matematičkog očekivanja jednak je: 28,53< a < 31,47.



Novo na sajtu

>

Najpopularniji