Mājas Stomatīts Vispārīgās populācijas matemātiskās cerības ticamības intervāla konstruēšana. Ticamības intervāls vidējā (variance ir zināma) novērtēšanai MS EXCEL

Vispārīgās populācijas matemātiskās cerības ticamības intervāla konstruēšana. Ticamības intervāls vidējā (variance ir zināma) novērtēšanai MS EXCEL

Ļaujiet CB X veidot vispārējo kopu un lai β ir nezināmais parametrs CB X. Ja statistiskais novērtējums * ir konsekvents, tad jo lielāks ir izlases lielums, jo precīzāk mēs iegūstam β vērtību. Taču praksē mums nav ļoti lielu paraugu, tāpēc nevaram garantēt lielāku precizitāti.

Pieņemsim, ka b* ir c statistiskais novērtējums. Vērtība |in* - in| sauc par novērtējuma precizitāti. Ir skaidrs, ka precizitāte ir CB, jo β* ir nejaušs lielums. Norādīsim nelielu pozitīvu skaitli 8 un pieprasīsim, lai aplēses precizitāte |в* - в| bija mazāks par 8, t.i. | in* - in |< 8.

Uzticamība g vai ticamības varbūtība aplēses in by in * ir varbūtība g, ar kuru nevienādība |in * - in|< 8, т. е.

Parasti uzticamība g ir norādīta iepriekš, un g tiek uzskatīts par skaitli, kas ir tuvu 1 (0,9; 0,95; 0,99; ...).

Tā kā nevienādība |in * - in|< S равносильно двойному неравенству в* - S < в < в* + 8, то получаем:

Intervālu (in * - 8, in * + 5) sauc par ticamības intervālu, t.i. ticamības intervāls aptver nezināmo parametru ar varbūtību y. Ņemiet vērā, ka ticamības intervāla beigas ir nejaušas un atšķiras atkarībā no izlases, tāpēc ir precīzāk teikt, ka intervāls (in * - 8, in * + 8) aptver nezināmo parametru in, nevis in pieder šim. intervāls.

Ļaujiet populācija ir dots ar nejaušu lielumu X, kas sadalīts saskaņā ar normālu likumu, un ir zināma standarta novirze a. Nezināms ir paredzamā vērtība a = M(X). Ir jāatrod a ticamības intervāls noteiktai ticamībai y.

Parauga vidējais

ir statistisks novērtējums xr = a.

Teorēma. Izlases vērtība xB ir normālais sadalījums, ja X ir normāls sadalījums un M (XB) = a,

A (XB) = a, kur a = y/B (X), a = M (X). l/i

A ticamības intervālam ir šāda forma:

Mēs atrodam 8.

Izmantojot koeficientu

kur Ф(r) ir Laplasa funkcija, mums ir:

P ( | XB - a |<8} = 2Ф

Laplasa funkcijas vērtību tabulā mēs atrodam t vērtību.

Norādījis

T, mēs iegūstam F(t) = g Tā kā g ir dots, tad ar

No vienlīdzības mēs atklājam, ka aplēse ir precīza.

Tas nozīmē, ka ticamības intervālam ir šāda forma:

Dots paraugs no kopas X

ng uz" X2 Xm
n. n1 n2 nm

n = U1 + ... + nm, tad ticamības intervāls būs:

Piemērs 6.35. Atrodiet ticamības intervālu normālā sadalījuma matemātiskās cerības a novērtēšanai ar ticamību 0,95, zinot izlases vidējo vērtību Xb = 10,43, izlases lielumu n = 100 un standartnovirzi s = 5.

Izmantosim formulu

PĀRLIECINĀBAS INTERVĀLS MATEMĀTISKĀM GAIDĀM

1. Lai tas būtu zināms sl. lielums x ievēro normālu likumu ar nezināmu vidējo μ un zināmo σ 2: X~N(μ,σ 2), ir dots σ 2, μ nav zināms. β ir norādīts. Pamatojoties uz paraugu x 1, x 2, … , x n, ir jākonstruē I β (θ) (tagad θ=μ), apmierinot (13)

Izlases vidējais (saukts arī par izlases vidējo) ievēro normālo likumu ar to pašu centru μ, bet mazāku dispersiju X~N (μ, D), kur dispersija D =σ 2 =σ 2 /n.

Mums būs nepieciešams skaitlis K β, ko ξ~N(0,1) definē nosacījums

Vārdos: starp abscisu ass punktiem -K β un K β atrodas laukums zem standarta normālā likuma blīvuma līknes, kas vienāds ar β

Piemēram, K 0,90 = 1,645 vērtības līmeņa 0,95 kvantile ξ

K 0,95 = 1,96. ; K 0,997 =3.

Jo īpaši, atmetot 1,96 standarta novirzes pa labi un to pašu pa kreisi no jebkura parastā likuma centra, mēs uztveram laukumu zem blīvuma līknes, kas vienāda ar 0,95, kā dēļ K 0 95 ir līmeņa 0,95 kvantile. + 1/2 * 0,005 = 0,975 šim likumam.

Nepieciešamais ticamības intervāls vispārējam vidējam μ ir I A (μ) = (x-σ, x+σ),

kur δ = (15)

Sniegsim pamatojumu:

Saskaņā ar teikto, vārdi. vērtība iekrīt intervālā J=μ±σ ar varbūtību β (9. att.). Šajā gadījumā daudzums novirzās no centra μ mazāk nekā δ un nejaušā intervāla ± δ (ar nejaušu centru un tādu pašu platumu kā J) aptvers punktu μ. Tas ir Є Dž<=> μ Є Iβ, un tāpēc Р(μЄІ β) = Р(Є J)=β.

Tātad intervāls I β, nemainīgs paraugā, satur vidējo μ ar varbūtību β.

Skaidrs, jo lielāks n, jo mazāks σ un intervāls ir šaurāks, un jo lielāku mēs ņemam garantiju β, jo plašāks ir ticamības intervāls.

21. piemērs.

Pamatojoties uz paraugu ar n=16 normālai vērtībai ar zināmu dispersiju σ 2 =64, tika atrasts x=200. Konstruējiet ticamības intervālu vispārējam vidējam (citiem vārdiem sakot, matemātiskajai cerībai) μ, pieņemot β=0,95.

Risinājums. I β (μ)= ± δ, kur δ = K β σ/ -> K β σ/ =1,96*8/ = 4

I 0,95 (μ)=200 4=(196;204).

Secinot, ka ar garantiju β=0,95 patiesais vidējais pieder pie intervāla (196,204), saprotam, ka ir iespējama kļūda.

No 100 ticamības intervāliem I 0,95 (μ), vidēji 5 nesatur μ.

22. piemērs.

Kas n jāņem vērā iepriekšējā 21. piemēra apstākļos, lai uz pusi samazinātu ticamības intervālu? Lai iegūtu 2δ=4, mums jāņem

Praksē bieži tiek izmantoti vienpusēji ticamības intervāli. Tādējādi, ja augstas μ vērtības ir noderīgas vai nav kaitīgas, bet zemas vērtības ir nepatīkamas, piemēram, stiprības vai uzticamības gadījumā, tad ir saprātīgi izveidot vienpusēju intervālu. Lai to izdarītu, jums pēc iespējas jāpalielina tā augšējā robeža. Ja mēs, kā 21. piemērā, izveidojam divpusēju ticamības intervālu noteiktai β un pēc tam to pēc iespējas paplašinām uz vienas robežas rēķina, mēs iegūstam vienpusēju intervālu ar lielāku garantiju β" = β + (1-β) / 2 = (1+ β)/2, piemēram, ja β = 0,90, tad β = 0,90 + 0,10/2 = 0,95.

Piemēram, mēs pieņemsim, ka mēs runājam par produkta stiprumu, un paaugstināsim intervāla augšējo robežu līdz . Tad μ 21. piemērā iegūstam vienpusēju ticamības intervālu (196,°°) ar apakšējo robežu 196 un ticamības varbūtību β"=0.95+0.05/2=0.975.

Formulas (15) praktiskais trūkums ir tāds, ka to iegūst, pieņemot, ka ir zināma dispersija = σ 2 (tātad = σ 2 /n); un tas dzīvē notiek reti. Izņēmums ir gadījums, kad izlases lielums ir liels, teiksim, n mēra simtos vai tūkstošos, un tad par σ 2 var praktiski ņemt tā novērtējumu s 2 vai .

23. piemērs.

Pieņemsim, ka lielā pilsētā iedzīvotāju dzīves apstākļu izlases apsekojuma rezultātā tika iegūta šāda datu tabula (piemērs no darba).

8. tabula

Piemēram, avota dati

Ir dabiski to pieņemt vērtība X ir kopējā (lietderīgā) platība (m2) uz vienu cilvēku un atbilst parastajam likumam. Vidējais μ un dispersija σ 2 nav zināmi. Attiecībā uz μ ir jākonstruē 95% ticamības intervāls. Lai, izmantojot grupētus datus, atrastu izlases vidējos un dispersijas rādītājus, mēs sastādīsim šādu aprēķinu tabulu (9. tabula).

9. tabula

X un 5 aprēķināšana no grupētiem datiem

N grupa 3 Kopējā platība uz cilvēku, m2 Iedzīvotāju skaits grupā r j Intervāla vidusdaļa x j r j x j rjxj 2
Līdz 5.0 2.5 20.0 50.0
5.0-10.0 7.5 712.5 5343.75
10.0-15.0 12.5 2550.0 31875.0
15.0-20.0 17.5 4725.0 82687.5
20.0-25.0 22.5 4725.0 106312.5
25.0-30.0 27.5 3575.0 98312.5
vairāk nekā 30,0 32.5 * 2697.5 87668.75
- 19005.0 412250.0

Šajā palīgtabulā pirmais un otrais sākotnējais statistiskais moments ir aprēķināts, izmantojot formulu (2) a 1 Un A 2

Lai gan dispersija σ 2 šeit nav zināma, lielā izlases lieluma dēļ varam praktiski pielietot formulu (15), ieliekot tajā σ = = 7,16.

Tad δ=k 0,95 σ/ =1,96*7,16/ =0,46.

Vispārīgā vidējā ticamības intervāls pie β=0,95 ir vienāds ar I 0,95 (μ) = ± δ = 19 ± 0,46 = (18,54; 19,46).

Līdz ar to vidējā platība uz vienu cilvēku noteiktā pilsētā ar garantiju 0,95 atrodas intervālā (18,54; 19,46).



2. Matemātiskās cerības μ ticamības intervāls normālās vērtības nezināmas dispersijas σ 2 gadījumā. Šo intervālu noteiktai garantijai β veido pēc formulas, kur ν = n-1,

(16)

Koeficientam t β,ν ir tāda pati nozīme t sadalījumam ar ν brīvības pakāpēm kā β sadalījumam N(0,1), proti:

.

Citiem vārdiem sakot, sl. Vērtība tν ietilpst intervālā (-t β,ν ; +t β,ν) ar varbūtību β. T β,ν vērtības ir norādītas 10. tabulā pie β=0,95 un β=0,99.

10. tabula.

Vērtības t β,ν

Atgriežoties pie 23. piemēra, redzam, ka tajā ticamības intervāls tika konstruēts pēc formulas (16) ar koeficientu t β,υ =k 0..95 =1.96, jo n=1000.

Pieņemsim, ka populācijas gadījuma lielums X ir normāli sadalīts, ņemot vērā, ka ir zināma šī sadalījuma dispersija un standartnovirze s. Ir nepieciešams novērtēt nezināmo matemātisko cerību, izmantojot izlases vidējo. Šajā gadījumā uzdevums ir atrast ticamības intervālu matemātiskajai cerībai ar ticamību b. Ja norādāt ticamības varbūtības (uzticamības) vērtību b, tad, izmantojot formulu (6.9a), varat atrast varbūtību iekrist nezināmās matemātiskās cerības intervālā:

kur Ф(t) ir Laplasa funkcija (5.17a).

Rezultātā mēs varam formulēt algoritmu ticamības intervāla robežu atrašanai matemātiskajai cerībai, ja ir zināma dispersija D = s 2:

  1. Iestatiet uzticamības vērtību – b.
  2. No (6.14) izteikt Ф(t) = 0,5× b. Laplasa funkcijas tabulā atlasiet t vērtību, pamatojoties uz vērtību Ф(t) (sk. 1. pielikumu).
  3. Aprēķina novirzi e, izmantojot formulu (6.10.).
  4. Pierakstiet ticamības intervālu, izmantojot formulu (6.12), lai ar varbūtību b pastāvētu nevienādība:

.

5. piemērs.

Nejaušajam lielumam X ir normāls sadalījums. Atrodiet ticamības intervālus aplēsei ar ticamību b = 0,96 no nezināmās matemātiskās cerības a, ja ir:

1) vispārējā standartnovirze s = 5;

2) izlases vidējais rādītājs;

3) izlases lielums n = 49.

Matemātiskās gaidas intervāla novērtējuma formulā (6.15). A ar ticamību b ir zināmi visi lielumi, izņemot t. T vērtību var atrast, izmantojot (6.14): b = 2Ф(t) = 0.96. Ф(t) = 0,48.

Izmantojot Laplasa funkcijas Ф(t) = 0,48 tabulu 1. pielikumā, atrodiet atbilstošo vērtību t = 2,06. Tāpēc . Aizvietojot aprēķināto e vērtību formulā (6.12), var iegūt ticamības intervālu: 30-1.47< a < 30+1,47.

Nepieciešamais ticamības intervāls aplēsei ar ticamību b = 0,96 no nezināmas matemātiskās cerības ir vienāds ar: 28,53< a < 31,47.

Ticamības intervāls– statistiskā lieluma robežvērtības, kas ar doto ticamības varbūtību γ atradīsies šajā intervālā, ņemot paraugus lielākam tilpumam. Apzīmēts kā P(θ - ε. Praksē ticamības varbūtību γ izvēlas no vērtībām, kas ir diezgan tuvu vienībai: γ = 0,9, γ = 0,95, γ = 0,99.

Pakalpojuma mērķis. Izmantojot šo pakalpojumu, varat noteikt:

  • ticamības intervāls vispārējam vidējam, ticamības intervāls dispersijai;
  • ticamības intervāls standarta novirzei, ticamības intervāls vispārējai akcijai;
Iegūtais risinājums tiek saglabāts Word failā (skatiet piemēru). Zemāk ir video instrukcija, kā aizpildīt sākotnējos datus.

Piemērs Nr.1. Kolhozā no kopējā 1000 aitu ganāmpulka 100 aitām tika veikta selektīva kontroles cirpšana. Rezultātā tika noteikts vidējais vilnas apcirpums 4,2 kg uz vienu aitu. Nosaka ar varbūtību 0,99 parauga vidējo kvadrātveida kļūdu, nosakot vidējo vilnas cirpumu uz vienu aitu, un robežas, kurās iekļaujas cirpšanas vērtība, ja dispersija ir 2,5. Paraugs neatkārtojas.
Piemērs Nr.2. No ievestās produkcijas partijas Maskavas Ziemeļu muitas postenī izlases veidā tika paņemti 20 preces “A” paraugi. Pārbaudes rezultātā tika noteikts produkta “A” vidējais mitruma saturs paraugā, kas izrādījās vienāds ar 6% ar standartnovirzi 1%.
Noteikt ar varbūtību 0,683 produkta vidējā mitruma satura robežas visā ievestās produkcijas partijā.
Piemērs Nr.3. Aptaujājot 36 studentus, noskaidrots, ka vidējais viņu izlasīto mācību grāmatu skaits mācību gadā bija 6. Pieņemot, ka studenta izlasīto mācību grāmatu skaitam semestrī ir normāls sadalījuma likums ar standartnovirzi, kas vienāda ar 6, atrodiet. : A) ar ticamību 0,99 intervāla aplēse šī gadījuma lieluma matemātiskajai cerībai; B) ar kādu varbūtību varam teikt, ka vidējais studenta izlasīto mācību grāmatu skaits semestrī, kas aprēķināts no šīs izlases, absolūtā vērtībā novirzīsies no matemātiskās cerības ne vairāk kā par 2.

Uzticamības intervālu klasifikācija

Pēc novērtējamā parametra veida:

Pēc parauga veida:

  1. Pārliecības intervāls bezgalīgam paraugam;
  2. Pārliecības intervāls gala paraugam;
Paraugu sauc par resampling, ja atlasītais objekts tiek atgriezts populācijā pirms nākamā atlases. Paraugu sauc par neatkārtojamu, ja atlasītais objekts netiek atgriezts populācijā. Praksē mēs parasti nodarbojamies ar paraugiem, kas neatkārtojas.

Vidējās izlases kļūdas aprēķins nejaušai izlasei

Tiek saukta neatbilstība starp paraugā iegūto rādītāju vērtībām un atbilstošajiem vispārējās populācijas parametriem reprezentativitātes kļūda.
Vispārējās un izlases populācijas galveno parametru apzīmējumi.
Vidējās izlases kļūdu formulas
atkārtota atlaseatkārtojiet atlasi
vidējipar daļuvidējipar daļu
Attiecība starp izlases kļūdas robežu (Δ) garantēta ar zināmu varbūtību Р(t), un vidējai izlases kļūdai ir šāda forma: vai Δ = t·μ, kur t– ticamības koeficients, kas noteikts atkarībā no varbūtības līmeņa P(t) pēc Laplasa integrālfunkcijas tabulas.

Formulas izlases lieluma aprēķināšanai, izmantojot tīri nejaušas izlases metodi

Statistikā ir divu veidu aplēses: punkts un intervāls. Punktu tāme ir viena izlases statistika, ko izmanto, lai novērtētu populācijas parametru. Piemēram, izlases vidējais rādītājs ir kopas matemātiskās cerības un izlases dispersijas punktveida aprēķins S 2- populācijas dispersijas punktu novērtējums σ 2. ir pierādīts, ka izlases vidējais rādītājs ir objektīvs populācijas matemātiskās cerības novērtējums. Izlases vidējo vērtību sauc par objektīvu, jo visu izlases vidējo (ar vienādu izlases lielumu) vidējais rādītājs n) ir vienāds ar vispārējās populācijas matemātisko cerību.

Lai parauga dispersija S 2 kļuva par objektīvu populācijas dispersijas aplēsi σ 2, izlases dispersijas saucējam jābūt vienādam ar n – 1 , bet ne n. Citiem vārdiem sakot, populācijas dispersija ir visu iespējamo izlases dispersiju vidējā vērtība.

Novērtējot populācijas parametrus, jāpatur prātā, ka izlases statistika, piemēram, , ir atkarīgi no konkrētiem paraugiem. Šo faktu ņemt vērā, iegūt intervāla novērtējums vispārējās populācijas matemātiskās cerības, analizējiet izlases vidējo sadalījumu (sīkāk sk.). Konstruētajam intervālam ir raksturīgs noteikts ticamības līmenis, kas atspoguļo varbūtību, ka patiesais populācijas parametrs ir pareizi novērtēts. Līdzīgus ticamības intervālus var izmantot, lai novērtētu raksturlieluma proporciju R un galvenā izplatītā iedzīvotāju masa.

Lejupielādējiet piezīmi formātā vai formātā, piemērus formātā

Uzticamības intervāla konstruēšana populācijas matemātiskajai gaidīšanai ar zināmu standarta novirzi

Uzticamības intervāla konstruēšana raksturlieluma daļai populācijā

Šī sadaļa paplašina ticamības intervāla jēdzienu līdz kategoriskiem datiem. Tas ļauj novērtēt raksturlieluma īpatsvaru populācijā R izmantojot izlases daļu RS= X/n. Kā norādīts, ja daudzumi nR Un n(1–p) pārsniedz skaitli 5, binomiālo sadalījumu var tuvināt kā normālu. Tāpēc, lai novērtētu raksturlieluma īpatsvaru populācijā R ir iespējams izveidot intervālu, kura ticamības līmenis ir vienāds ar (1 – α) x 100%.


Kur lppS- raksturlieluma izlases proporcija, kas vienāda ar X/n, t.i. panākumu skaits dalīts ar izlases lielumu, R- raksturlieluma īpatsvars kopējā populācijā, Z- standartizētā normālā sadalījuma kritiskā vērtība, n- parauga lielums.

3. piemērs. Pieņemsim, ka no informācijas sistēmas tiek izvilkts paraugs, kas sastāv no 100 pēdējā mēneša laikā aizpildītiem rēķiniem. Pieņemsim, ka 10 no šiem rēķiniem tika sastādīti ar kļūdām. Tādējādi R= 10/100 = 0,1. 95% ticamības līmenis atbilst kritiskajai vērtībai Z = 1,96.

Tādējādi iespējamība, ka no 4,12% līdz 15,88% rēķinu satur kļūdas, ir 95%.

Noteiktam izlases lielumam ticamības intervāls, kas satur raksturlieluma proporciju populācijā, šķiet plašāks nekā nepārtrauktam gadījuma mainīgajam. Tas ir tāpēc, ka nepārtraukta nejauša lieluma mērījumi satur vairāk informācijas nekā kategorisku datu mērījumi. Citiem vārdiem sakot, kategoriski dati, kas ņem tikai divas vērtības, satur nepietiekamu informāciju, lai novērtētu to sadalījuma parametrus.

INaprēķinot aplēses, kas iegūtas no ierobežotas populācijas

Matemātiskās cerības novērtējums. Korekcijas koeficients galīgajai populācijai ( fpc) tika izmantots, lai samazinātu standarta kļūdu par koeficientu. Aprēķinot ticamības intervālus populācijas parametru aplēsēm, situācijās, kad paraugi tiek ņemti bez atgriešanas, tiek piemērots korekcijas koeficients. Tādējādi matemātiskās cerības ticamības intervāls, kura ticamības līmenis ir vienāds ar (1 – α) x 100%, aprēķina pēc formulas:

4. piemērs. Lai ilustrētu korekcijas koeficienta izmantošanu ierobežotai kopai, atgriezīsimies pie vidējās rēķinu summas ticamības intervāla aprēķināšanas problēmas, kas tika apskatīta iepriekš 3. piemērā. Pieņemsim, ka uzņēmums mēnesī izraksta 5000 rēķinu un = 110,27 dolāri, S= 28,95 ASV dolāri, N = 5000, n = 100, α = 0,05, t 99 = 1,9842. Izmantojot formulu (6), mēs iegūstam:

Objekta daļas novērtējums. Izvēloties bez atgriešanas, ticamības intervāls atribūta proporcijai, kuras ticamības līmenis ir vienāds ar (1 – α) x 100%, aprēķina pēc formulas:

Pārliecības intervāli un ētiskas problēmas

Veicot populācijas izlasi un izdarot statistiskus secinājumus, bieži rodas ētiskas problēmas. Galvenais ir tas, kā sakrīt ticamības intervāli un izlases statistikas punktu aplēses. Punktu aprēķinu publicēšana, nenorādot saistītos ticamības intervālus (parasti 95% ticamības līmenī) un izlases lielumu, no kura tie iegūti, var radīt neskaidrības. Tas var radīt lietotājam iespaidu, ka punktu novērtējums ir tieši tas, kas viņam nepieciešams, lai paredzētu visas populācijas īpašības. Līdz ar to ir jāsaprot, ka jebkurā pētījumā jākoncentrējas nevis uz punktu aplēsēm, bet gan uz intervālu aplēsēm. Turklāt īpaša uzmanība jāpievērš pareizai paraugu lieluma izvēlei.

Visbiežāk statistisko manipulāciju objekti ir iedzīvotāju socioloģisko aptauju rezultāti par noteiktiem politiskiem jautājumiem. Tajā pašā laikā aptaujas rezultāti tiek publicēti laikrakstu pirmajās lapās, bet izlases kļūda un statistiskās analīzes metodika tiek publicēta kaut kur pa vidu. Lai pierādītu iegūto punktu novērtējumu pamatotību, nepieciešams norādīt izlases lielumu, uz kura pamata tie iegūti, ticamības intervāla robežas un tā nozīmīguma līmeni.

Nākamā piezīme

Izmantoti materiāli no grāmatas Levin et al. Statistika vadītājiem. – M.: Williams, 2004. – lpp. 448–462

Centrālās robežas teorēma norāda, ka ar pietiekami lielu izlases lielumu vidējo izlases sadalījumu var tuvināt ar normālu sadalījumu. Šis īpašums nav atkarīgs no iedzīvotāju sadalījuma veida.



Jaunums vietnē

>

Populārākais