Dom Prevencija Interval pouzdanosti za matematička očekivanja. Interval pouzdanosti za procjenu srednje vrijednosti (varijansa je poznata) u MS EXCEL-u

Interval pouzdanosti za matematička očekivanja. Interval pouzdanosti za procjenu srednje vrijednosti (varijansa je poznata) u MS EXCEL-u

Često procjenitelj mora analizirati tržište nekretnina segmenta u kojem se nekretnina koja se procjenjuje nalazi. Ako je tržište razvijeno, može biti teško analizirati cijeli skup prikazanih objekata, pa se za analizu koristi uzorak objekata. Ovaj uzorak ne ispada uvijek homogen, ponekad ga je potrebno očistiti od ekstremnih tačaka - previsokih ili preniskih tržišnih ponuda. U tu svrhu se koristi interval povjerenja. Target ovu studiju- izvršiti uporednu analizu dvije metode za izračunavanje intervala povjerenja i odabrati optimalnu opciju proračuna pri radu sa različitim uzorcima u sistemu estimatica.pro.

Interval povjerenja- interval vrijednosti atributa izračunat na osnovu uzorka, koji sa poznatom vjerovatnoćom sadrži procijenjeni parametar stanovništva.

Smisao izračunavanja intervala povjerenja je da se takav interval konstruiše na osnovu podataka uzorka tako da se sa datom vjerovatnoćom može konstatovati da je vrijednost procijenjenog parametra u ovom intervalu. Drugim riječima, interval povjerenja sadrži sa određenom vjerovatnoćom nepoznata vrijednost procijenjena vrijednost. Što je interval širi, to je veća nepreciznost.

Postoje različite metode za određivanje intervala pouzdanosti. U ovom članku ćemo pogledati 2 metode:

  • kroz medijanu i standardnu ​​devijaciju;
  • kroz kritična vrijednost t-statistika (Studentov koeficijent).

Faze komparativna analiza Različiti putevi CI izračun:

1. formirati uzorak podataka;

2. obrađujemo statističkim metodama: izračunavamo prosječnu vrijednost, medijan, varijansu itd.;

3. izračunati interval pouzdanosti na dva načina;

4. analizirati očišćene uzorke i rezultirajuće intervale pouzdanosti.

Faza 1. Uzorkovanje podataka

Uzorak je formiran pomoću sistema estimatica.pro. Uzorak je uključivao 91 ponudu za prodaju jednosobnih stanova u 3. zoni cijena sa tipom rasporeda „Hruščov“.

Tabela 1. Početni uzorak

Cijena 1 m2, jed

Fig.1. Početni uzorak



Faza 2. Obrada početnog uzorka

Obrada uzorka pomoću statističkih metoda zahtijeva izračunavanje sljedećih vrijednosti:

1. Aritmetička sredina

2. Medijan je broj koji karakteriše uzorak: tačno polovina elemenata uzorka je veća od medijane, druga polovina je manja od medijane

(za uzorak sa neparnim brojem vrijednosti)

3. Raspon - razlika između maksimalne i minimalne vrijednosti u uzorku

4. Varijanca - koristi se za precizniju procjenu varijacije podataka

5. Standardna devijacija uzorka (u daljem tekstu - SD) je najčešći indikator disperzije vrednosti podešavanja oko aritmetičke sredine.

6. Koeficijent varijacije - odražava stepen rasipanja vrednosti podešavanja

7. koeficijent oscilacije - odražava relativnu fluktuaciju ekstremnih vrijednosti cijene u uzorku oko prosjeka

Tabela 2. Statistički pokazatelji originalnog uzorka

Koeficijent varijacije, koji karakteriše homogenost podataka, iznosi 12,29%, ali je koeficijent oscilacije previsok. Dakle, možemo reći da originalni uzorak nije homogen, pa prijeđimo na izračunavanje intervala povjerenja.

Faza 3. Proračun intervala povjerenja

Metoda 1. Proračun korištenjem medijane i standardne devijacije.

Interval pouzdanosti se određuje na sljedeći način: minimalna vrijednost - standardna devijacija se oduzima od medijane; maksimalna vrijednost - standardna devijacija se dodaje medijani.

Dakle, interval povjerenja (47179 CU; 60689 CU)

Rice. 2. Vrijednosti koje spadaju u interval pouzdanosti 1.



Metoda 2. Konstruiranje intervala povjerenja korištenjem kritične vrijednosti t-statistike (Student koeficijent)

S.V. Gribovski u knjizi “ Matematičke metode Procjena vrijednosti svojstva“ opisuje metodu za izračunavanje intervala povjerenja korištenjem Studentovog koeficijenta. Prilikom izračunavanja pomoću ove metode, procjenitelj mora sam postaviti nivo značajnosti ∝, koji određuje vjerovatnoću sa kojom će se konstruirati interval povjerenja. Obično se koriste nivoi značajnosti od 0,1; 0,05 i 0,01. Oni odgovaraju vjerovatnoći pouzdanosti od 0,9; 0,95 i 0,99. Ovom metodom se pretpostavljaju prave vrijednosti matematičko očekivanje a varijanse su praktično nepoznate (što je gotovo uvijek tačno kada se rješavaju praktični problemi procjene).

Formula intervala povjerenja:

n - veličina uzorka;

Kritična vrijednost t-statistike (Studentova distribucija) sa nivoom značajnosti ∝, brojem stupnjeva slobode n-1, koji se utvrđuje korištenjem posebnih statističkih tabela ili korištenjem MS Excel-a (→„Statistički”→ STUDIST);

∝ - nivo značajnosti, uzmite ∝=0,01.

Rice. 2. Vrijednosti koje spadaju u interval pouzdanosti 2.

Faza 4. Analiza različitih metoda za izračunavanje intervala povjerenja

Dvije metode izračunavanja intervala povjerenja - kroz medijanu i Studentov koeficijent - dovele su do različita značenja intervalima. Shodno tome, dobili smo dva različita očišćena uzorka.

Tabela 3. Statistika za tri uzorka.

Indeks

Početni uzorak

1 opcija

Opcija 2

Prosječna vrijednost

Disperzija

Coef. varijacije

Coef. oscilacije

Broj penzionisanih objekata, kom.

Na osnovu izvršenih proračuna možemo reći da je dobijeno različite metode vrijednosti intervala povjerenja se sijeku, tako da možete koristiti bilo koju od metoda izračuna po nahođenju ocjenjivača.

Međutim, smatramo da je pri radu u sistemu estimatica.pro preporučljivo odabrati metodu za izračunavanje intervala povjerenja u zavisnosti od stepena razvijenosti tržišta:

  • ako je tržište nerazvijeno, koristite metodu obračuna koristeći medijanu i standardnu ​​devijaciju, jer je broj penzionisanih objekata u ovom slučaju mali;
  • ako je tržište razvijeno, proračun primijeniti kroz kritičnu vrijednost t-statistike (Studentov koeficijent), jer je moguće formirati veliki početni uzorak.

U pripremi članka korišteno je sljedeće:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Matematičke metode za procjenu vrijednosti imovine. Moskva, 2014

2. Sistemski podaci estimatica.pro

Interval pouzdanosti za matematička očekivanja - ovo je interval izračunat iz podataka koji sa poznatom vjerovatnoćom sadrži matematičko očekivanje opće populacije. Prirodna procjena za matematičko očekivanje je aritmetička sredina njegovih promatranih vrijednosti. Zbog toga ćemo tokom čitave lekcije koristiti pojmove „prosjek“ i „prosječna vrijednost“. U problemima izračunavanja intervala pouzdanosti, odgovor koji se najčešće traži je nešto poput „Interval pouzdanosti prosječnog broja [vrijednosti u određenom problemu] je od [manje vrijednosti] do [veće vrijednosti].“ Koristeći interval pouzdanosti, možete procijeniti ne samo prosječne vrijednosti, već i udio određene karakteristike opće populacije. Prosjeci, varijansa, standardna devijacija a greške kroz koje ćemo doći do novih definicija i formula raspravlja se u lekciji Karakteristike uzorka i populacije .

Tačkaste i intervalne procjene srednje vrijednosti

Ako je prosječna vrijednost populacije procijenjena brojem (bodom), tada se kao procjena nepoznate prosječne vrijednosti populacije uzima određeni prosjek, koji se izračunava iz uzorka opservacija. U ovom slučaju, vrijednost uzorka srednje vrijednosti - slučajne varijable - ne poklapa se sa srednjom vrijednošću opće populacije. Stoga, kada pokazujete srednju vrijednost uzorka, morate istovremeno naznačiti grešku uzorkovanja. Mjera greške uzorkovanja je standardna greška, koja se izražava u istim jedinicama kao i srednja vrijednost. Stoga se često koristi sljedeća notacija: .

Ako procjenu prosjeka treba povezati sa određenom vjerovatnoćom, onda se parametar od interesa u populaciji mora procijeniti ne jednim brojem, već intervalom. Interval pouzdanosti je interval u kojem, sa određenom vjerovatnoćom P nalazi se vrijednost indikatora procijenjenog stanovništva. Interval povjerenja u kojem je vjerovatno P = 1 - α pronađena je slučajna varijabla, izračunata na sljedeći način:

,

α = 1 - P, koji se može naći u dodatku gotovo svake knjige o statistici.

U praksi, populacijska srednja vrijednost i varijansa nisu poznate, pa se varijansa populacije zamjenjuje varijansom uzorka, a populacijska srednja vrijednost uzorkom. Stoga se interval pouzdanosti u većini slučajeva izračunava na sljedeći način:

.

Formula intervala pouzdanosti može se koristiti za procjenu srednje vrijednosti populacije ako

  • poznata je standardna devijacija populacije;
  • ili je standardna devijacija populacije nepoznata, ali je veličina uzorka veća od 30.

Srednja vrijednost uzorka je nepristrasna procjena srednje vrijednosti populacije. Zauzvrat, varijansa uzorka nije nepristrasna procjena varijanse populacije. Da bi se dobila nepristrasna procjena varijanse populacije u formuli varijanse uzorka, veličina uzorka n treba zamijeniti sa n-1.

Primjer 1. Od 100 nasumično odabranih kafića u određenom gradu prikupljena je informacija da je prosječan broj zaposlenih u njima 10,5 sa standardnom devijacijom od 4,6. Odredite interval pouzdanosti od 95% za broj zaposlenih u kafiću.

gdje je kritična vrijednost standarda normalna distribucija za nivo značaja α = 0,05 .

Tako se interval povjerenja od 95% za prosječan broj zaposlenih u kafiću kretao od 9,6 do 11,4.

Primjer 2. Za slučajni uzorak iz populacije od 64 opservacije, izračunate su sljedeće ukupne vrijednosti:

zbir vrijednosti u zapažanjima,

zbir kvadrata odstupanja vrijednosti od prosjeka .

Izračunajte 95% interval pouzdanosti za matematičko očekivanje.

Izračunajmo standardnu ​​devijaciju:

,

Izračunajmo prosječnu vrijednost:

.

Zamjenjujemo vrijednosti u izraz za interval povjerenja:

gdje je kritična vrijednost standardne normalne distribucije za nivo značajnosti α = 0,05 .

Dobijamo:

Tako se interval pouzdanosti od 95% za matematičko očekivanje ovog uzorka kretao od 7,484 do 11,266.

Primjer 3. Za slučajni uzorak populacije od 100 opservacija, izračunata srednja vrijednost je 15,2, a standardna devijacija je 3,2. Izračunajte interval pouzdanosti od 95% za očekivanu vrijednost, a zatim 99% interval pouzdanosti. Ako snaga uzorka i njena varijacija ostanu nepromijenjene, a koeficijent pouzdanosti raste, hoće li se interval povjerenja suziti ili proširiti?

Ove vrijednosti zamjenjujemo u izraz za interval povjerenja:

gdje je kritična vrijednost standardne normalne distribucije za nivo značajnosti α = 0,05 .

Dobijamo:

.

Tako se interval pouzdanosti od 95% za srednju vrijednost ovog uzorka kretao od 14,57 do 15,82.

Ponovo zamjenjujemo ove vrijednosti u izraz za interval povjerenja:

gdje je kritična vrijednost standardne normalne distribucije za nivo značajnosti α = 0,01 .

Dobijamo:

.

Tako se interval pouzdanosti od 99% za srednju vrijednost ovog uzorka kretao od 14,37 do 16,02.

Kao što vidimo, kako se koeficijent pouzdanosti povećava, tako se povećava i kritična vrijednost standardne normalne distribucije, pa se početna i završna tačka intervala nalaze dalje od srednje vrijednosti, a samim tim raste i interval povjerenja za matematičko očekivanje. .

Tačkaste i intervalne procjene specifične težine

Udio nekog atributa uzorka može se tumačiti kao bodovna procjena specifična gravitacija str iste karakteristike u opštoj populaciji. Ako ovu vrijednost treba povezati s vjerovatnoćom, tada treba izračunati interval pouzdanosti specifične težine str karakteristika u populaciji sa vjerovatnoćom P = 1 - α :

.

Primjer 4. U nekom gradu postoje dva kandidata A I B kandiduju se za gradonačelnika. Anketirano je nasumično 200 stanovnika grada, od kojih je 46% odgovorilo da bi glasalo za kandidata A, 26% - za kandidata B a 28% ne zna za koga će glasati. Odredite interval povjerenja od 95% za udio stanovnika grada koji podržavaju kandidata A.

Interval povjerenja– granične vrijednosti statističku vrijednost, koji će sa datom sigurnošću γ biti u ovom intervalu pri uzorkovanju veće količine. Označava se kao P(θ - ε. U praksi, vjerovatnoća pouzdanosti γ se bira između vrijednosti koje su prilično bliske jedinici: γ = 0,9, γ = 0,95, γ = 0,99.

Svrha usluge. Koristeći ovu uslugu, možete odrediti:

  • interval povjerenja za opću srednju vrijednost, interval povjerenja za varijansu;
  • interval povjerenja za standardnu ​​devijaciju, interval povjerenja za generalni udio;
Rezultirajuće rješenje se pohranjuje u Word datoteku (pogledajte primjer). Ispod je video uputstvo kako popuniti početne podatke.

Primjer br. 1. Na kolektivnoj farmi, od ukupnog stada od 1000 ovaca, 100 ovaca je podvrgnuto selektivnoj kontroli. Kao rezultat, utvrđeno je prosječno šišanje vune od 4,2 kg po ovci. Odrediti s vjerovatnoćom od 0,99 srednju kvadratnu grešku uzorka pri određivanju prosječnog striženja vune po ovci i granice unutar kojih se nalazi vrijednost striženja ako je varijansa 2,5. Uzorak se ne ponavlja.
Primjer br. 2. Iz serije uvezenih proizvoda na pošti Moskovske sjeverne carine uzeto je 20 uzoraka proizvoda „A“ slučajnim ponovljenim uzorkovanjem. Kao rezultat ispitivanja, utvrđen je prosječni sadržaj vlage proizvoda „A“ u uzorku, koji se pokazao jednakim 6% sa standardnom devijacijom od 1%.
Odrediti sa vjerovatnoćom 0,683 granice prosječnog sadržaja vlage proizvoda u cijeloj seriji uvezenih proizvoda.
Primjer br. 3. Istraživanje na 36 učenika pokazalo je da je prosječan broj udžbenika koji pročitaju godišnje akademske godine, ispostavilo se da je jednako 6. Uz pretpostavku da broj udžbenika koje student pročita po semestru ima normalan zakon raspodjele sa standardnom devijacijom jednakom 6, naći: A) sa pouzdanošću od 0,99, intervalnu procjenu za matematički očekivanje ove slučajne varijable; B) s kojom vjerovatnoćom možemo reći da će prosječan broj udžbenika koje student pročita po semestru, izračunat iz datog uzorka, odstupiti od matematičkog očekivanja prema apsolutna vrijednost ne više od 2.

Klasifikacija intervala povjerenja

Po vrsti parametra koji se procjenjuje:

Po vrsti uzorka:

  1. Interval pouzdanosti za beskonačan uzorak;
  2. Interval pouzdanosti za konačni uzorak;
Uzorak se naziva resampling, ako se odabrani objekt vrati u populaciju prije odabira sljedećeg. Uzorak se naziva neponavljanjem, ako se odabrani objekt ne vrati u populaciju. U praksi se obično bavimo uzorcima koji se ne ponavljaju.

Izračunavanje prosječne greške uzorkovanja za slučajno uzorkovanje

Nesklad između vrijednosti indikatora dobijenih iz uzorka i odgovarajućih parametara opće populacije naziva se greška reprezentativnosti.
Oznake glavnih parametara opće populacije i populacije uzorka.
Formule prosječne greške uzorkovanja
ponovna selekcijaponovite odabir
za prosjekza dionicuza prosjekza dionicu
Odnos između granice greške uzorkovanja (Δ) zajamčen s određenom vjerovatnoćom R(t), I prosečna greška uzorak ima oblik: ili Δ = t·μ, gdje je t– koeficijent pouzdanosti, određen u zavisnosti od nivoa verovatnoće P(t) prema tabeli Laplaceove integralne funkcije.

Formule za izračunavanje veličine uzorka koristeći metodu čisto slučajnog uzorkovanja

Neka je slučajna varijabla (može se govoriti o opštoj populaciji) raspoređena po normalnom zakonu, za koji je poznata varijansa D = 2 (> 0). Iz opće populacije (na skupu objekata od kojih je određena slučajna varijabla) pravi se uzorak veličine n. Uzorak x 1 , x 2 ,..., x n se smatra skupom od n nezavisnih slučajnih varijabli raspoređenih na isti način kao (pristup objašnjen gore u tekstu).

Ranije su razmatrane i dokazane sljedeće jednakosti:

Mx 1 = Mx 2 = ... = Mx n = M;

Dx 1 = Dx 2 = ... = Dx n = D;

Dovoljno je jednostavno dokazati (izostavljamo dokaz) da je slučajna varijabla u u ovom slučaju se takođe distribuira u skladu sa uobičajenim zakonom.

Označimo nepoznatu veličinu M sa a i izaberemo, na osnovu date pouzdanosti, broj d > 0 tako da je uslov zadovoljen:

P(- a< d) = (1)

Pošto je slučajna varijabla distribuirana prema normalnom zakonu sa matematičkim očekivanjem M = M = a i varijansom D = D /n = 2 /n, dobijamo:

P(- a< d) =P(a - d < < a + d) =

Ostaje izabrati d tako da vrijedi jednakost

Za bilo koji, možete koristiti tabelu da pronađete broj t takav da je (t)= / 2. Ovaj broj t se ponekad naziva kvantil.

Sada iz jednakosti

odredimo vrijednost d:

Konačan rezultat dobijamo predstavljanjem formule (1) u obliku:

Značenje posljednje formule je sljedeće: uz pouzdanost, interval povjerenja

pokriva nepoznati parametar a = M populacije. Možete reći drugačije: tačka procene određuje vrijednost parametra M sa tačnošću d= t / i pouzdanošću.

Zadatak. Neka postoji opšta populacija sa određenom karakteristikom raspoređenom prema normalnom zakonu sa varijansom jednakom 6,25. Uzet je uzorak veličine n = 27 i dobijena je prosječna vrijednost uzorka karakteristike = 12. Pronađite interval povjerenja koji pokriva nepoznato matematičko očekivanje proučavane karakteristike opće populacije s pouzdanošću = 0,99.

Rješenje. Prvo, koristeći tablicu za Laplaceovu funkciju, nalazimo vrijednost t iz jednakosti (t) = / 2 = 0,495. Na osnovu dobijene vrijednosti t = 2,58 određujemo tačnost procjene (ili pola dužine intervala povjerenja) d: d = 2,52,58 / 1,24. Odavde dobijamo traženi interval poverenja: (10,76; 13,24).

statistička hipoteza generalna varijacija

Interval pouzdanosti za matematičko očekivanje normalne distribucije kada nije poznata varijansa

Neka je slučajna varijabla distribuirana prema normalnom zakonu s nepoznatim matematičkim očekivanjem M, koje označavamo slovom a. Napravimo uzorak volumena n. Odredimo prosječan uzorak i ispravljenu varijansu uzorka s 2 koristeći poznate formule.

Slučajna vrijednost

raspoređeno prema Studentovom zakonu sa n - 1 stepenom slobode.

Zadatak je pronaći broj t za datu pouzdanost i broj stupnjeva slobode n - 1 tako da je jednakost

ili ekvivalentna jednakost

Ovdje je u zagradama napisan uvjet da vrijednost nepoznatog parametra a pripada određenom intervalu, a to je interval povjerenja. Njegove granice zavise od pouzdanosti kao i od parametara uzorkovanja i s.

Da bismo odredili vrijednost t po veličini, transformiramo jednakost (2) u oblik:

Sada, koristeći tabelu za slučajnu varijablu t raspoređenu prema Studentovom zakonu, koristeći vjerovatnoću 1 - i broj stupnjeva slobode n - 1, nalazimo t. Formula (3) daje odgovor na postavljeni problem.

Zadatak. Tokom kontrolnih ispitivanja 20 električnih lampi prosječno trajanje njihov rad je bio jednak 2000 sati sa standardnom devijacijom (izračunatom kao kvadratni korijen korigirane varijanse uzorka) jednakom 11 sati. Poznato je da je trajanje rada lampe normalno raspoređeno slučajna varijabla. Odredite sa pouzdanošću od 0,95 interval pouzdanosti za matematičko očekivanje ove slučajne varijable.

Rješenje. Vrijednost 1 - u ovom slučaju je jednaka 0,05. Prema Studentovoj tabeli raspodjele, sa brojem stupnjeva slobode jednakim 19, nalazimo: t = 2,093. Izračunajmo sada tačnost procjene: 2,093121/ = 56,6. Odavde dobijamo traženi interval poverenja: (1943,4; 2056,6).

Neka je slučajna varijabla X populacije normalno raspoređena, uzimajući u obzir da su varijansa i standardna devijacija s ove distribucije poznate. Potrebno je procijeniti nepoznato matematičko očekivanje korištenjem srednje vrijednosti uzorka. U ovom slučaju, zadatak se svodi na pronalaženje intervala povjerenja za matematičko očekivanje s pouzdanošću b. Ako postavite vrijednost verovatnoća poverenja(pouzdanost) b, tada možete pronaći vjerovatnoću pada u interval za nepoznato matematičko očekivanje koristeći formulu (6.9a):

gdje je F(t) Laplaceova funkcija (5.17a).

Kao rezultat, možemo formulirati algoritam za pronalaženje granica intervala povjerenja za matematičko očekivanje ako je poznata varijansa D = s 2:

  1. Postavite vrijednost pouzdanosti – b.
  2. Iz (6.14) izraziti F(t) = 0,5× b. Odaberite vrijednost t iz tabele za Laplaceovu funkciju na osnovu vrijednosti F(t) (vidi Dodatak 1).
  3. Izračunajte devijaciju e koristeći formulu (6.10).
  4. Zapišite interval povjerenja koristeći formulu (6.12) tako da sa vjerovatnoćom b vrijedi nejednakost:

.

Primjer 5.

Slučajna varijabla X ima normalnu distribuciju. Pronađite intervale povjerenja za procjenu s pouzdanošću b = 0,96 nepoznatog matematičkog očekivanja a, ako je dato:

1) opšta standardna devijacija s = 5;

2) prosek uzorka;

3) veličina uzorka n = 49.

U formuli (6.15) intervalne procjene matematičkog očekivanja A sa pouzdanošću b sve veličine osim t su poznate. Vrijednost t se može naći pomoću (6.14): b = 2F(t) = 0,96. F(t) = 0,48.

Koristeći tabelu u Dodatku 1 za Laplaceovu funkciju F(t) = 0,48, pronađite odgovarajuću vrijednost t = 2,06. dakle, . Zamjenom izračunate vrijednosti e u formulu (6.12), možete dobiti interval povjerenja: 30-1,47< a < 30+1,47.

Potreban interval pouzdanosti za procjenu sa pouzdanošću b = 0,96 nepoznatog matematičkog očekivanja jednak je: 28,53< a < 31,47.



Novo na sajtu

>

Najpopularniji