Mājas Stomatīts Ticamības intervāls ir vienāds ar. Ticamības intervāls

Ticamības intervāls ir vienāds ar. Ticamības intervāls

Statistikā ir divu veidu aplēses: punkts un intervāls. Punktu tāme ir atsevišķa parauga statistika, ko izmanto, lai novērtētu parametru populācija. Piemēram, izlases vidējais rādītājs ir punktveida aprēķins matemātiskās cerības populācija un izlases dispersija S 2- populācijas dispersijas punktu novērtējums σ 2. ir pierādīts, ka izlases vidējais rādītājs ir objektīvs populācijas matemātiskās cerības novērtējums. Izlases vidējo vērtību sauc par objektīvu, jo visu izlases vidējo (ar vienādu izlases lielumu) vidējais rādītājs n) ir vienāds ar vispārējās populācijas matemātisko cerību.

Lai parauga dispersija S 2 kļuva par objektīvu populācijas dispersijas aplēsi σ 2, izlases dispersijas saucējam jābūt vienādam ar n – 1 , bet ne n. Citiem vārdiem sakot, populācijas dispersija ir visu iespējamo izlases dispersiju vidējā vērtība.

Novērtējot populācijas parametrus, jāpatur prātā, ka izlases statistika, piemēram, , ir atkarīgi no konkrētiem paraugiem. Šo faktu ņemt vērā, iegūt intervāla novērtējums vispārējās populācijas matemātiskās cerības, analizējiet izlases vidējo sadalījumu (sīkāk sk.). Konstruētajam intervālam ir raksturīgs noteikts ticamības līmenis, kas atspoguļo varbūtību, ka patiesais populācijas parametrs ir pareizi novērtēts. Līdzīgus ticamības intervālus var izmantot, lai novērtētu raksturlieluma proporciju R un galvenā izplatītā iedzīvotāju masa.

Lejupielādējiet piezīmi formātā vai formātā, piemērus formātā

Uzticamības intervāla konstruēšana populācijas matemātiskajai gaidīšanai ar zināmu standarta novirzi

Uzticamības intervāla konstruēšana raksturlieluma daļai populācijā

Šī sadaļa paplašina ticamības intervāla jēdzienu līdz kategoriskiem datiem. Tas ļauj novērtēt raksturlieluma īpatsvaru populācijā R izmantojot izlases daļu RS= X/n. Kā norādīts, ja daudzumi nR Un n(1–p) pārsniedz skaitli 5, binomiālo sadalījumu var tuvināt kā normālu. Tāpēc, lai novērtētu raksturlieluma īpatsvaru populācijā R ir iespējams izveidot intervālu, kura ticamības līmenis ir vienāds ar (1 – α) x 100%.


Kur lppS- raksturlieluma izlases proporcija, kas vienāda ar X/n, t.i. panākumu skaits dalīts ar izlases lielumu, R- raksturlieluma īpatsvars kopējā populācijā, Z- standartizētā kritiskā vērtība normālais sadalījums, n- parauga lielums.

3. piemērs. Pieņemsim, ka laikā tika aizpildīts paraugs, kas sastāv no 100 rēķiniem pagājušajā mēnesī. Pieņemsim, ka 10 no šiem rēķiniem tika sastādīti ar kļūdām. Tādējādi R= 10/100 = 0,1. 95% ticamības līmenis atbilst kritiskajai vērtībai Z = 1,96.

Tādējādi iespējamība, ka no 4,12% līdz 15,88% rēķinu satur kļūdas, ir 95%.

Noteiktam izlases lielumam ticamības intervāls, kas satur raksturlieluma daļu populācijā, šķiet plašāks nekā nepārtrauktam nejaušais mainīgais. Tas ir tāpēc, ka nepārtraukta nejauša lieluma mērījumi satur vairāk informācijas nekā kategorisku datu mērījumi. Citiem vārdiem sakot, kategoriski dati, kas ņem tikai divas vērtības, satur nepietiekamu informāciju, lai novērtētu to sadalījuma parametrus.

INaprēķinot aplēses, kas iegūtas no ierobežotas populācijas

Matemātiskās cerības novērtējums. Korekcijas koeficients galīgajai populācijai ( fpc) tika izmantots, lai samazinātu standarta kļūdu par koeficientu. Aprēķinot ticamības intervālus populācijas parametru aplēsēm, situācijās, kad paraugi tiek ņemti bez atgriešanas, tiek piemērots korekcijas koeficients. Tādējādi matemātiskās cerības ticamības intervāls, kura ticamības līmenis ir vienāds ar (1 – α) x 100%, aprēķina pēc formulas:

4. piemērs. Lai ilustrētu korekcijas koeficienta izmantošanu ierobežotai kopai, atgriezīsimies pie vidējās rēķinu summas ticamības intervāla aprēķināšanas problēmas, kas tika apskatīta iepriekš 3. piemērā. Pieņemsim, ka uzņēmums mēnesī izraksta 5000 rēķinu un = 110,27 dolāri, S= 28,95 ASV dolāri, N = 5000, n = 100, α = 0,05, t 99 = 1,9842. Izmantojot formulu (6), mēs iegūstam:

Objekta daļas novērtējums. Izvēloties bez atgriešanas, ticamības intervāls atribūta proporcijai, kuras ticamības līmenis ir vienāds ar (1 – α) x 100%, aprēķina pēc formulas:

Pārliecības intervāli un ētiskas problēmas

Veicot populācijas izlasi un izdarot statistiskus secinājumus, bieži rodas ētiskas problēmas. Galvenais ir tas, kā sakrīt ticamības intervāli un izlases statistikas punktu aplēses. Punktu aprēķinu publicēšana, nenorādot saistītos ticamības intervālus (parasti 95% ticamības līmenī) un izlases lielumu, no kura tie iegūti, var radīt neskaidrības. Tas var radīt lietotājam iespaidu, ka punktu novērtējums ir tieši tas, kas viņam nepieciešams, lai paredzētu visas populācijas īpašības. Līdz ar to ir jāsaprot, ka jebkurā pētījumā jākoncentrējas nevis uz punktu aplēsēm, bet gan uz intervālu aplēsēm. Turklāt, Īpaša uzmanība būtu jādod pareizā izvēle paraugu izmēri.

Visbiežāk statistisko manipulāciju objekti ir iedzīvotāju socioloģisko aptauju rezultāti par noteiktiem politiskiem jautājumiem. Šajā gadījumā aptaujas rezultāti tiek publicēti laikrakstu pirmajās lapās un kļūda izlases veida aptauja un statistiskās analīzes metodoloģija ir iespiesta kaut kur pa vidu. Lai pierādītu iegūto punktu novērtējumu pamatotību, nepieciešams norādīt izlases lielumu, uz kura pamata tie iegūti, ticamības intervāla robežas un tā nozīmīguma līmeni.

Nākamā piezīme

Izmantoti materiāli no grāmatas Levin et al. Statistika vadītājiem. – M.: Williams, 2004. – lpp. 448–462

Centrālās robežas teorēma norāda, ka ar pietiekami lielu izlases lielumu vidējo izlases sadalījumu var tuvināt ar normālu sadalījumu. Šis īpašums nav atkarīgs no iedzīvotāju sadalījuma veida.

Iepriekšējās apakšnodaļās mēs apskatījām jautājumu par nezināma parametra novērtēšanu A viens numurs. To sauc par "punkta" aplēsi. Vairākos uzdevumos jums ne tikai jāatrod parametrs A piemērotu skaitlisko vērtību, bet arī novērtēt tās precizitāti un uzticamību. Jums jāzina, kādas kļūdas var izraisīt parametra aizstāšana A tā punktu aplēse A un ar kādu pārliecības pakāpi mēs varam sagaidīt, ka šīs kļūdas nepārsniegs zināmās robežas?

Šāda veida problēmas ir īpaši aktuālas ar nelielu novērojumu skaitu, kad punktu novērtējums un iekšā ir lielā mērā nejaušs, un aptuvenā a aizstāšana ar a var izraisīt nopietnas kļūdas.

Sniegt priekšstatu par tāmes precizitāti un ticamību A,

V matemātiskā statistika Viņi izmanto tā sauktos ticamības intervālus un ticamības varbūtības.

Ļaujiet parametram A objektīvs novērtējums, kas iegūts no pieredzes A. Mēs vēlamies novērtēt iespējamo kļūdu šajā gadījumā. Piešķirsim kādu pietiekami lielu varbūtību p (piemēram, p = 0,9, 0,95 vai 0,99), lai notikumu ar varbūtību p varētu uzskatīt par praktiski ticamu, un atradīsim vērtību s, kurai

Pēc tam nomaiņas laikā radušās kļūdas praktiski iespējamo vērtību diapazons A ieslēgts A, būs ± s; Lielas kļūdas absolūtajā vērtībā parādīsies tikai ar mazu varbūtību a = 1 - p. Pārrakstīsim (14.3.1) šādi:

Vienādība (14.3.2.) nozīmē, ka ar varbūtību p nezināma vērtība parametrs A ietilpst intervālā

Jāņem vērā viens apstāklis. Iepriekš mēs vairākkārt esam apsvēruši varbūtību, ka gadījuma lielums nonāks noteiktā negadījuma intervālā. Šeit situācija ir atšķirīga: lielums A nav nejaušs, bet intervāls / p ir nejaušs. Tās atrašanās vieta uz x ass ir nejauša, ko nosaka tās centrs A; Parasti arī intervāla 2s garums ir nejaušs, jo s vērtību parasti aprēķina no eksperimentāliem datiem. Tāpēc iekšā šajā gadījumā P vērtību labāk būtu interpretēt nevis kā varbūtību “trāpīt” punktā A intervālā / p un kā varbūtību, ka nejaušs intervāls / p aptvers punktu A(14.3.1. att.).

Rīsi. 14.3.1

Par varbūtību p parasti sauc ticamības varbūtība, un intervāls / p - ticamības intervāls. Intervālu robežas Ja. a x =a- smiltis a 2 = a + un tiek saukti uzticības robežas.

Sniegsim citu interpretāciju ticamības intervāla jēdzienam: to var uzskatīt par parametru vērtību intervālu A, saderīgi ar eksperimentālajiem datiem un nav tiem pretrunā. Patiešām, ja mēs piekrītam uzskatīt notikumu ar varbūtību a = 1-p praktiski neiespējamu, tad tās parametra a vērtības, kurām a - a> s ir jāatzīst par pretrunīgiem eksperimentālajiem datiem, un tie, kuriem |a - A a t na 2 .

Ļaujiet parametram A ir objektīvs aprēķins A. Ja mēs zinātu daudzuma sadalījuma likumu A, uzdevums atrast ticamības intervālu būtu ļoti vienkāršs: pietiktu atrast vērtību s, kurai

Grūtības ir tādas, ka aplēšu sadalījuma likums A ir atkarīgs no daudzuma sadales likuma X un tāpēc uz tā nezināmajiem parametriem (jo īpaši uz pašu parametru A).

Lai apietu šo grūtību, varat izmantot šādu aptuveni aptuvenu paņēmienu: aizstājiet nezināmos parametrus izteiksmē s ar to punktu aprēķiniem. Ar salīdzinoši lielu eksperimentu skaitu P(apmēram 20...30) šī tehnika parasti dod rezultātus, kas ir apmierinoši precizitātes ziņā.

Kā piemēru apsveriet matemātisko gaidu ticamības intervāla problēmu.

Ļaujiet tai ražot P X, kuru raksturlielumi ir matemātiskās cerības T un dispersiju D- nezināms. Šiem parametriem tika iegūti šādi aprēķini:

Ir nepieciešams izveidot atbilstošo ticamības intervālu / p ticamības varbūtība p, matemātiskām cerībām T daudzumus X.

Risinot šo problēmu, izmantosim faktu, ka daudzums T atspoguļo summu P neatkarīgi identiski sadalīti gadījuma lielumi X h un saskaņā ar centrālo robežu teorēmu pietiekami lielai P tā sadalījuma likums ir tuvu normālam. Praksē pat ar salīdzinoši nelielu terminu skaitu (apmēram 10...20) summas sadalījuma likumu var aptuveni uzskatīt par normālu. Mēs pieņemsim, ka vērtība T izplatīts saskaņā ar parasto likumu. Šī likuma raksturlielumi - matemātiskā gaida un dispersija - ir attiecīgi vienādi T Un

(skat. 13. nodaļas 13.3. apakšnodaļu). Pieņemsim, ka vērtība D mēs zinām un atradīsim vērtību Ep, par kuru

Izmantojot 6. nodaļas formulu (6.3.5), mēs izsakām varbūtību (14.3.5) kreisajā pusē caur normālā sadalījuma funkciju

kur ir novērtējuma standartnovirze T.

No Eq.

atrodiet Sp vērtību:

kur arg Ф* (х) ir Ф* apgrieztā funkcija (X), tie. argumenta vērtība, kurā normāla funkcija sadalījums ir vienāds ar X.

Izkliede D, caur kuru tiek izteikts daudzums A 1P, mēs precīzi nezinām; kā tā aptuveno vērtību varat izmantot tāmi D(14.3.4.) un ievietojiet aptuveni:

Tādējādi ir aptuveni atrisināta ticamības intervāla konstruēšanas problēma, kas ir vienāda ar:

kur gp nosaka pēc formulas (14.3.7.).

Lai izvairītos no apgrieztās interpolācijas funkcijas Ф* (l) tabulās, aprēķinot s p, ir ērti sastādīt īpašu tabulu (14.3.1. tabula), kurā norādītas daudzuma vērtības.

atkarībā no r. Vērtība (p nosaka parastajam likumam standarta noviržu skaitu, kas jāzīmē pa labi un pa kreisi no dispersijas centra, lai varbūtība nokļūt iegūtajā apgabalā būtu vienāda ar p.

Izmantojot vērtību 7 p, ticamības intervālu izsaka šādi:

14.3.1. tabula

1. piemērs. Tika veikti 20 eksperimenti ar daudzumu X; rezultāti ir parādīti tabulā. 14.3.2.

14.3.2. tabula

Ir jāatrod aprēķins no daudzuma matemātiskās cerības X un izveido ticamības intervālu, kas atbilst ticamības varbūtībai p = 0,8.

Risinājums. Mums ir:

Izvēloties l: = 10 par atskaites punktu, izmantojot trešo formulu (14.2.14.), atrodam objektīvu novērtējumu. D :

Saskaņā ar tabulu 14.3.1 mēs atrodam

Uzticības robežas:

Ticamības intervāls:

Parametru vērtības T, kas atrodas šajā intervālā, ir saderīgi ar tabulā norādītajiem eksperimentālajiem datiem. 14.3.2.

Dispersijas ticamības intervālu var izveidot līdzīgā veidā.

Ļaujiet tai ražot P neatkarīgi eksperimenti ar nejaušu lielumu X ar nezināmiem parametriem gan A, gan dispersijai D tika iegūts objektīvs novērtējums:

Ir nepieciešams aptuveni izveidot dispersijas ticamības intervālu.

No formulas (14.3.11.) ir skaidrs, ka daudzums D pārstāv

summa P formas nejaušie mainīgie . Šīs vērtības nav

neatkarīgi, jo jebkurš no tiem ietver daudzumu T, atkarīgs no visiem pārējiem. Tomēr var pierādīt, ka pieaugot P arī to summas sadalījuma likums tuvojas normālam. Gandrīz plkst P= 20...30 to jau var uzskatīt par normālu.

Pieņemsim, ka tas tā ir, un atradīsim šī likuma raksturlielumus: matemātiskās cerības un dispersiju. Kopš novērtējuma D- tad objektīvs M[D] = D.

Distances aprēķins D D ir saistīta ar salīdzinoši sarežģītiem aprēķiniem, tāpēc mēs piedāvājam tā izteiksmi bez atvasinājumiem:

kur q 4 ir ceturtais centrālais punkts daudzumus X.

Lai izmantotu šo izteiksmi, ir jāaizstāj vērtības\u003d 4 un D(vismaz tuvākie). Tā vietā D jūs varat izmantot viņa novērtējumu D. Principā ceturto centrālo momentu var aizstāt arī ar aprēķinu, piemēram, formas vērtību:

taču šāda nomaiņa nodrošinās ārkārtīgi zemu precizitāti, jo kopumā ar ierobežotu skaitu eksperimentu momenti augsta kārtība noteikts no lielas kļūdas. Taču praksē nereti gadās, ka daudzumu sadales likuma veids X zināms iepriekš: nav zināmi tikai tā parametri. Pēc tam varat mēģināt izteikt μ 4 cauri D.

Ņemsim visizplatītāko gadījumu, kad vērtība X izplatīts saskaņā ar parasto likumu. Tad tā ceturtais centrālais moments tiek izteikts dispersijas izteiksmē (sk. 6. nodaļas 6.2. apakšnodaļu);

un formula (14.3.12) dod vai

Nezināmā aizstāšana (14.3.14.) D viņa vērtējums D, mēs iegūstam: no kurienes

Momentu μ 4 var izteikt caur D arī dažos citos gadījumos, kad vērtības sadale X nav normāli, bet tā izskats ir zināms. Piemēram, likumam vienmērīgs blīvums(skat. 5. nodaļu) mums ir:

kur (a, P) ir intervāls, kurā likums ir norādīts.

Tāpēc

Izmantojot formulu (14.3.12), mēs iegūstam: kur mēs aptuveni atrodam

Gadījumos, kad lieluma 26 sadalījuma likuma veids nav zināms, veicot aptuvenu a/) vērtības novērtējumu, joprojām ieteicams izmantot formulu (14.3.16.), ja vien nav īpašu iemeslu uzskatīt, ka šis likums ļoti atšķiras no parastās (ir manāma pozitīva vai negatīva kurtoze) .

Ja aptuvenā vērtība a/) ir iegūta vienā vai otrā veidā, tad mēs varam izveidot ticamības intervālu dispersijai tādā pašā veidā, kā mēs to izveidojām matemātiskajai cerībai:

kur pēc tabulas atrodama vērtība atkarībā no dotās varbūtības p. 14.3.1.

2. piemērs. Atrodiet aptuveni 80% ticamības intervālu nejaušā lieluma dispersijai X saskaņā ar 1. piemēra nosacījumiem, ja ir zināms, ka vērtība X sadalīta saskaņā ar likumu, kas ir tuvu normālam.

Risinājums. Vērtība paliek tāda pati kā tabulā. 14.3.1.:

Saskaņā ar formulu (14.3.16.)

Izmantojot formulu (14.3.18), mēs atrodam ticamības intervālu:

Atbilstošs vidējo vērtību intervāls kvadrātveida novirze: (0,21; 0,29).

14.4. Precīzas metodes ticamības intervālu konstruēšanai nejauša lieluma parametriem, kas sadalīti saskaņā ar normālu likumu

Iepriekšējā apakšnodaļā mēs pārbaudījām aptuveni aptuvenas metodes ticamības intervālu konstruēšanai matemātiskām prognozēm un dispersijai. Šeit mēs sniegsim priekšstatu par precīzām metodēm vienas un tās pašas problēmas risināšanai. Mēs uzsveram, ka, lai precīzi atrastu ticamības intervālus, ir absolūti nepieciešams iepriekš zināt daudzuma sadalījuma likuma formu X, tā kā aptuvenu metožu piemērošanai tas nav nepieciešams.

Ideja precīzas metodes ticamības intervālu konstruēšana ir šāda. Jebkurš ticamības intervāls tiek atrasts no nosacījuma, kas izsaka noteiktu nevienādību izpildes varbūtību, kas ietver mūs interesējošo novērtējumu A. Vērtēšanas sadalījuma likums A V vispārējs gadījums atkarīgs no nezināmiem daudzuma parametriem X. Tomēr dažreiz no nejauša lieluma ir iespējams pārnest nevienādības A uz kādu citu novēroto vērtību funkciju X p X 2, ..., X lpp. kura sadalījuma likums nav atkarīgs no nezināmiem parametriem, bet ir atkarīgs tikai no eksperimentu skaita un lieluma sadalījuma likuma veida X.Šāda veida nejaušajiem mainīgajiem ir svarīga loma matemātiskajā statistikā; tie ir visdetalizētāk pētīti normālā daudzuma sadalījuma gadījumā X.

Piemēram, ir pierādīts, ka ar normālu vērtības sadalījumu X nejauša vērtība

pakļaujas t.s Studentu sadales likums Ar P- 1 brīvības pakāpe; šī likuma blīvumam ir forma

kur G(x) ir zināmā gamma funkcija:

Ir arī pierādīts, ka nejaušais mainīgais

ir "%2 sadalījums" ar P- 1 brīvības pakāpe (sk. 7. nodaļu), kuras blīvumu izsaka ar formulu

Nekavējoties pie sadalījumu (14.4.2) un (14.4.4) atvasinājumiem, mēs parādīsim, kā tos var izmantot, veidojot parametru ticamības intervālus. ty D.

Ļaujiet tai ražot P neatkarīgi eksperimenti ar nejaušu lielumu X, parasti izplatīts ar nezināmiem parametriem T&O. Par šiem parametriem tika iegūti aprēķini

Abiem parametriem ir jākonstruē ticamības intervāli, kas atbilst ticamības varbūtībai p.

Vispirms izveidosim ticamības intervālu matemātiskajai cerībai. Ir dabiski pieņemt šo intervālu simetriski attiecībā pret T; ar s p apzīmē pusi no intervāla garuma. Vērtība s p ir jāizvēlas tā, lai nosacījums būtu izpildīts

Mēģināsim pāriet uz vienādības (14.4.5) kreiso pusi no nejaušā lieluma T uz nejaušu lielumu T, izplatīts saskaņā ar Studenta likumu. Lai to izdarītu, reiziniet abas nevienādības |m-w?| puses

ar pozitīvu vērtību: vai, izmantojot apzīmējumu (14.4.1.),

Atradīsim tādu skaitli / p, lai vērtību / p varētu atrast no nosacījuma

No formulas (14.4.2) ir skaidrs, ka (1) - vienmērīga funkcija, tā (14.4.8) dod

Vienādība (14.4.9) nosaka vērtību / p atkarībā no p. Ja jūsu rīcībā ir integrālo vērtību tabula

tad /p vērtību var atrast tabulā ar apgriezto interpolāciju. Tomēr ērtāk ir iepriekš izveidot /p vērtību tabulu. Šāda tabula ir sniegta pielikumā (5. tabula). Šajā tabulā parādītas vērtības atkarībā no ticamības līmeņa p un brīvības pakāpju skaita P- 1. Pēc tabulas noteikšanas / p. 5 un pieņemot

mēs atradīsim pusi no ticamības intervāla / p platuma un pašu intervālu

1. piemērs. Ar nejaušu lielumu tika veikti 5 neatkarīgi eksperimenti X, parasti izplatīts ar nezināmiem parametriem T un apmēram. Eksperimentu rezultāti ir doti tabulā. 14.4.1.

14.4.1. tabula

Atrodiet vērtējumu T matemātiskajai cerībai un izveidojiet tai 90% ticamības intervālu / p (t.i., intervālu, kas atbilst ticamības varbūtībai p = 0,9).

Risinājums. Mums ir:

Saskaņā ar pieteikuma 5. tabulu par P - 1 = 4 un p = 0,9 mēs atrodam kur

Uzticamības intervāls būs

2. piemērs. 14.3. apakšnodaļas 1. piemēra nosacījumiem, pieņemot vērtību X parasti sadala, atrodiet precīzu ticamības intervālu.

Risinājums. Saskaņā ar pielikuma 5. tabulu mēs atrodam, kad P - 1 = 19ir =

0,8 / p = 1,328; no šejienes

Salīdzinot ar 14.3.apakšnodaļas 1.piemēra risinājumu (e p = 0,072), esam pārliecināti, ka neatbilstība ir ļoti nenozīmīga. Ja saglabājam precizitāti līdz otrajai zīmei aiz komata, tad ar precīzo un aptuveno metodi atrastie ticamības intervāli sakrīt:

Pāriesim pie dispersijas ticamības intervāla konstruēšanas. Apsveriet objektīvu dispersijas novērtētāju

un izteikt nejaušo mainīgo D caur lielumu V(14.4.3), ar sadalījumu x 2 (14.4.4):

Zinot daudzuma sadalījuma likumu V, jūs varat atrast intervālu /(1), kurā tas ietilpst ar noteiktu varbūtību p.

Sadales likums kn_x(v) Lielumam I 7 ir tāda forma, kā parādīts attēlā. 14.4.1.

Rīsi. 14.4.1

Rodas jautājums: kā izvēlēties intervālu / p? Ja lieluma sadalījuma likums V bija simetrisks (tāpat kā parastais likums vai Stjudenta sadalījums), būtu dabiski ņemt intervālu /p simetriski attiecībā pret matemātisko cerību. Šajā gadījumā likums k p_x (v) asimetrisks. Vienosimies izvēlēties intervālu /p tā, lai vērtības varbūtība būtu V aiz intervāla pa labi un pa kreisi (ēnotās zonas 14.4.1. attēlā) bija vienādas un vienādas

Lai izveidotu intervālu /p ar šo īpašību, mēs izmantojam tabulu. 4 lietojumprogrammas: tajā ir skaitļi y) tāds, ka

par vērtību V, kam ir x 2 sadalījums ar r brīvības pakāpēm. Mūsu gadījumā r = n- 1. Labosim r = n- 1 un atrodiet attiecīgajā tabulas rindā. 4 divas nozīmes x 2 - viens atbilst varbūtībai otrs - varbūtība Apzīmēsim tos

vērtības plkst.2 Un xl? Intervāls ir 2 gads, ar kreiso palīdzību un y ~ labais gals.

Tagad no intervāla / p atradīsim vēlamo ticamības intervālu /| dispersijai ar robežām D un D2, kas aptver punktu D ar varbūtību p:

Konstruēsim intervālu / (, = (?> ь А), kas aptver punktu D tad un tikai tad, ja vērtība V iekrīt intervālā /r. Ļaujiet mums parādīt, ka intervāls

atbilst šim nosacījumam. Patiešām, nevienlīdzība ir līdzvērtīgi nevienlīdzībai

un šīs nevienādības apmierina ar varbūtību p. Tādējādi dispersijas ticamības intervāls ir atrasts un izteikts ar formulu (14.4.13.).

3. piemērs. Atrodiet ticamības intervālu dispersijai 14.3. apakšnodaļas 2. piemēra apstākļos, ja ir zināms, ka vērtība X parasti izplatīts.

Risinājums. Mums ir . Saskaņā ar pielikuma 4. tabulu

atrodam plkst r = n - 1 = 19

Izmantojot formulu (14.4.13), mēs atrodam dispersijas ticamības intervālu

Atbilstošais standartnovirzes intervāls ir (0,21; 0,32). Šis intervāls tikai nedaudz pārsniedz 14.3. apakšnodaļas 2. piemērā iegūto intervālu (0,21; 0,29), izmantojot aptuveno metodi.

  • Attēlā 14.3.1. ticamības intervāls ir simetrisks ap a. Kopumā, kā mēs redzēsim vēlāk, tas nav nepieciešams.

Pārliecības intervāli.

Ticamības intervāla aprēķins ir balstīts uz atbilstošā parametra vidējo kļūdu. Ticamības intervāls parāda, kādās robežās ar varbūtību (1-a) atrodas aprēķinātā parametra patiesā vērtība. Šeit a ir nozīmīguma līmenis, (1-a) sauc arī par ticamības varbūtību.

Pirmajā nodaļā mēs parādījām, ka, piemēram, vidējam aritmētiskajam, patiesais populācijas vidējais aptuveni 95% gadījumu ir 2 vidējās standarta kļūdu robežās. Tādējādi vidējā 95% ticamības intervāla robežas būs divas reizes tālāk no izlases vidējā vidējā kļūda vidēji, t.i. mēs reizinām vidējo kļūdu ar noteiktu koeficientu atkarībā no ticamības līmeņa. Vidējam un vidējo rādītāju starpībai tiek ņemts Stjudenta koeficients (Stjudenta testa kritiskā vērtība), daļu īpatsvaram un starpībai – z kritērija kritiskā vērtība. Koeficienta un vidējās kļūdas reizinājumu var saukt par dotā parametra maksimālo kļūdu, t.i. maksimums, ko varam iegūt, to novērtējot.

Pārliecības intervāls priekš vidējais aritmētiskais : .

Šeit ir parauga vidējais rādītājs;

Vidējā aritmētiskā kļūda;

s – parauga standartnovirze;

n

f = n-1 (Studenta koeficients).

Pārliecības intervāls priekš vidējo aritmētisko atšķirības :

Šeit ir atšķirība starp izlases līdzekļiem;

- vidējo aritmētisko starpības vidējā kļūda;

s 1 , s 2 - parauga standartnovirzes;

n1, n2

Kritiskā vērtība Studenta t tests noteiktam nozīmīguma līmenim a un brīvības pakāpju skaitam f=n 1 + n 2-2 (Studenta koeficients).

Pārliecības intervāls priekš akcijas :

.

Šeit d ir parauga daļa;

– vidējās daļas kļūda;

n– izlases lielums (grupas lielums);

Pārliecības intervāls priekš akciju starpība :

Šeit ir atšķirība izlases daļās;

– vidējo aritmētisko starpības vidējā kļūda;

n1, n2– paraugu apjomi (grupu skaits);

z kritērija kritiskā vērtība noteiktā nozīmīguma līmenī a ( , , ).

Aprēķinot ticamības intervālus atšķirībai starp rādītājiem, mēs, pirmkārt, tieši redzam iespējamās vērtības efekts, un ne tikai tas punktu tāme. Otrkārt, mēs varam izdarīt secinājumu par nulles hipotēzes pieņemšanu vai noraidīšanu un, treškārt, mēs varam izdarīt secinājumu par testa spēku.

Pārbaudot hipotēzes, izmantojot ticamības intervālus, jums jāievēro šāds noteikums:

Ja vidējo starpības 100(1-a) procentu ticamības intervāls nesatur nulli, tad atšķirības ir statistiski nozīmīgas nozīmīguma līmenī a; gluži pretēji, ja šajā intervālā ir nulle, tad atšķirības nav statistiski nozīmīgas.

Patiešām, ja šajā intervālā ir nulle, tas nozīmē, ka salīdzināmais rādītājs vienā no grupām var būt lielāks vai mazāks salīdzinājumā ar otru, t.i. novērotās atšķirības ir radušās nejaušības dēļ.

Testa jaudu var novērtēt pēc nulles atrašanās vietas ticamības intervālā. Ja nulle ir tuvu zemākai vai augšējā robeža intervālā, tad varbūt ar lielāku salīdzināmo grupu skaitu atšķirības sasniegtu statistiskā nozīme. Ja nulle ir tuvu intervāla vidum, tad tas nozīmē, ka gan rādītāja pieaugums, gan samazinājums eksperimentālajā grupā ir vienlīdz iespējams, un, iespējams, atšķirību tiešām nav.

Piemēri:

Salīdzinot ķirurģisko mirstību, lietojot divus dažādus anestēzijas veidus: ar pirmo anestēzijas veidu operēts 61 cilvēks, 8 miruši, ar otro veidu – 67 cilvēki, 10 miruši.

d 1 = 8/61 = 0,131; d2 = 10/67 = 0,149; d1-d2 = - 0,018.

Salīdzināmo metožu letalitātes atšķirība būs robežās (-0,018 - 0,122; -0,018 + 0,122) vai (-0,14; 0,104) ar varbūtību 100(1-a) = 95%. Intervāls satur nulli, t.i. hipotēze par vienādu letalitāti divos dažādi veidi Anestēziju nevar noraidīt.

Tādējādi mirstība var samazināties un samazināsies līdz 14% un pieaugs līdz 10,4% ar 95% varbūtību, t.i. nulle ir aptuveni intervāla vidū, tāpēc var apgalvot, ka, visticamāk, šīs divas metodes patiešām neatšķiras pēc letalitātes.

Iepriekš aplūkotajā piemērā vidējais nospiešanas laiks pieskaršanās testa laikā tika salīdzināts četrās skolēnu grupās, kurām bija atšķirīgi eksāmenu rezultāti. Aprēķināsim ticamības intervālus vidējam nospiešanas laikam skolēniem, kuri nokārtoja eksāmenu ar 2. un 5. atzīmi, un ticamības intervālu šo vidējo vērtību starpībai.

Studenta koeficienti tiek atrasti, izmantojot Stjudenta sadalījuma tabulas (skat. pielikumu): pirmajai grupai: = t(0,05;48) = 2,011; otrajai grupai: = t(0,05;61) = 2,000. Tādējādi ticamības intervāli pirmajai grupai: = (162,19-2,011*2,18; 162,19+2,011*2,18) = (157,8; 166,6), otrajai grupai (156,55- 2000*1,88; 156,05) = 1,8,8 (1,8 ; 160.3). Tātad tiem, kas eksāmenu nokārtoja ar 2, vidējais nospiešanas laiks svārstās no 157,8 ms līdz 166,6 ms ar varbūtību 95%, tiem, kas eksāmenu nokārtoja ar 5 – no 152,8 ms līdz 160,3 ms ar varbūtību 95% .

Varat arī pārbaudīt nulles hipotēzi, izmantojot ticamības intervālus vidējiem, nevis tikai vidējo atšķirību noteikšanai. Piemēram, tāpat kā mūsu gadījumā, ja vidējo ticamības intervāli pārklājas, nulles hipotēzi nevar noraidīt. Lai noraidītu hipotēzi izvēlētajā nozīmīguma līmenī, attiecīgie ticamības intervāli nedrīkst pārklāties.

Atradīsim ticamības intervālu vidējā presēšanas laika starpībai grupās, kuras eksāmenu nokārtoja ar 2. un 5. vērtējumu. Vidējo vērtību starpība: 162,19 – 156,55 = 5,64. Studenta koeficients: = t(0,05;49+62-2) = t(0,05;109) = 1,982. Grupas standartnovirzes būs vienādas ar: ; . Aprēķinām vidējo kļūdu starpības vidējo kļūdu: . Pārliecības intervāls: =(5,64-1,982*2,87; 5,64+1,982*2,87) = (-0,044; 11,33).

Tātad vidējā nospiešanas laika atšķirība grupās, kuras eksāmenu nokārtoja ar 2 un 5, būs robežās no -0,044 ms līdz 11,33 ms. Šis intervāls ietver nulli, t.i. Vidējais spiešanas laiks tiem, kas eksāmenu nokārtojuši labi, var vai nu palielināties, vai samazināties, salīdzinot ar tiem, kuri eksāmenu nokārtojuši neapmierinoši, t.i. nulles hipotēzi nevar noraidīt. Bet nulle ir ļoti tuvu apakšējai robežai, un nospiešanas laiks, visticamāk, samazināsies tiem, kuri labi nokārtoja. Tādējādi varam secināt, ka joprojām pastāv atšķirības vidējā presēšanas laikā starp tiem, kuri izturēja 2 un 5, tikai mēs nevarējām tās atklāt, ņemot vērā vidējā laika izmaiņas, vidējā laika izplatību un izlases lielumus.



Pārbaudes spēks ir nepareizas nulles hipotēzes noraidīšanas varbūtība, t.i. atrast atšķirības tur, kur tās patiesībā pastāv.

Testa jaudu nosaka, pamatojoties uz nozīmīguma līmeni, atšķirību lielumu starp grupām, vērtību izplatību grupās un paraugu lielumu.

Studenta ieskaitei un dispersijas analīze Varat izmantot jutības diagrammas.

Kritērija jaudu var izmantot, lai provizoriski noteiktu nepieciešamo grupu skaitu.

Ticamības intervāls parāda, kurās robežās atrodas aprēķinātā parametra patiesā vērtība ar noteiktu varbūtību.

Izmantojot ticamības intervālus, varat pārbaudīt statistiskās hipotēzes un izdarīt secinājumus par kritēriju jutīgumu.

LITERATŪRA.

Glanz S. – 6.,7. nodaļa.

Rebrova O.Ju. – 112.-114.lpp., 171.-173.lpp., 234.-238.lpp.

Sidorenko E.V. – 32.-33.lpp.

Jautājumi skolēnu pašpārbaudei.

1. Kāds ir kritērija spēks?

2. Kādos gadījumos ir nepieciešams izvērtēt kritēriju spēku?

3. Jaudas aprēķināšanas metodes.

6. Kā pārbaudīt statistisko hipotēzi, izmantojot ticamības intervālu?

7. Ko var teikt par kritērija spēku, aprēķinot ticamības intervālu?

Uzdevumi.

Pieņemsim, ka mums ir liels skaits preču ar normālu dažu īpašību sadalījumu (piemēram, pilna viena veida dārzeņu noliktava, kuras izmērs un svars atšķiras). Jūs vēlaties uzzināt visas preču partijas vidējās īpašības, bet jums nav ne laika, ne vēlēšanās izmērīt un nosvērt katru dārzeņu. Jūs saprotat, ka tas nav nepieciešams. Bet cik gabalu būtu jāņem uz vietas pārbaudei?

Pirms sniegt vairākas šajā situācijā noderīgas formulas, atcerēsimies dažus apzīmējumus.

Pirmkārt, ja mēs izmērītu visu dārzeņu noliktavu (šo elementu kopu sauc par vispārējo populāciju), tad mēs ar visu mums pieejamo precizitāti zinātu visas partijas vidējo svaru. Sauksim šo par vidējo X vid .g lv . - vispārējais vidējais. Mēs jau zinām, kas ir pilnībā noteikts, ja ir zināma tā vidējā vērtība un novirze s . Tiesa, kamēr neesam ne X vidējais gen., ne s Mēs nezinām kopējo iedzīvotāju skaitu. Mēs varam ņemt tikai noteiktu paraugu, izmērīt mums vajadzīgās vērtības un aprēķināt šim paraugam gan vidējo vērtību X vid., gan standarta novirzi S atlasīt.

Ir zināms, ka, ja mūsu izlases pārbaudē ir liels skaits elementu (parasti n ir lielāks par 30), un tie tiek ņemti tiešām nejauši, tad s vispārējā populācija gandrīz neatšķirsies no S izlases..

Turklāt normālā sadalījuma gadījumā mēs varam izmantot šādas formulas:

ar 95% varbūtību


ar 99% varbūtību



IN vispārējs skats ar varbūtību P (t)


Sakarību starp t vērtību un varbūtības vērtību P (t), ar kuru mēs vēlamies uzzināt ticamības intervālu, var iegūt no šādas tabulas:


Tādējādi esam noteikuši, kurā diapazonā atrodas populācijas vidējā vērtība (ar noteiktu varbūtību).

Ja vien mums nav pietiekami lielas izlases, mēs nevaram teikt, ka populācijai ir s = S izvēlieties Turklāt šajā gadījumā parauga tuvums normālajam sadalījumam ir problemātisks. Šajā gadījumā mēs izmantojam arī S select s formulā:




bet t vērtība fiksētai varbūtībai P(t) būs atkarīga no elementu skaita izlasē n. Jo lielāks n, jo tuvāk iegūtais ticamības intervāls būs vērtībai, kas norādīta ar formulu (1). T vērtības šajā gadījumā tiek ņemtas no citas tabulas ( Studenta t-tests), ko mēs piedāvājam tālāk:

Studenta t-testa vērtības varbūtībai 0,95 un 0,99


3. piemērs. No uzņēmuma darbiniekiem nejauši tika atlasīti 30 cilvēki. Saskaņā ar paraugu, izrādījās, ka vidējā alga (mēnesī) ir 30 tūkstoši rubļu ar standarta novirzi 5 tūkstoši rubļu. Nosakiet vidējo algu uzņēmumā ar varbūtību 0,99.

Risinājums: Pēc nosacījuma mums ir n = 30, X vid. =30000, S=5000, P = 0,99. Lai atrastu ticamības intervālu, izmantosim Stjudenta t testam atbilstošu formulu. No tabulas n = 30 un P = 0,99 mēs atrodam t = 2,756, tāpēc


tie. pieprasītais pilnvarnieks intervāls 27484< Х ср.ген < 32516.

Tātad ar varbūtību 0,99 varam teikt, ka intervāls (27484; 32516) sevī ietver vidējo algu uzņēmumā.

Mēs ceram, ka izmantosit šo metodi, un nav nepieciešams, lai katru reizi būtu līdzi galds. Aprēķinus var veikt automātiski programmā Excel. Atrodoties Excel failā, augšējā izvēlnē noklikšķiniet uz pogas fx. Pēc tam starp funkcijām atlasiet “statistisko” veidu un no piedāvātā saraksta logā - STUDAR DISCOVER. Pēc tam uzvednē, novietojot kursoru laukā “varbūtība”, ievadiet apgrieztās varbūtības vērtību (t.i., mūsu gadījumā varbūtības 0,95 vietā jāievada varbūtība 0,05). Acīmredzot izklājlapa ir sastādīts tā, lai rezultāts atbildētu uz jautājumu, ar kādu varbūtību mēs varam kļūdīties. Līdzīgi laukā Brīvības pakāpe ievadiet sava parauga vērtību (n-1).

Pārliecības intervāls matemātiskām cerībām - šis ir intervāls, kas aprēķināts no datiem, kas ar zināmu varbūtību satur vispārējās populācijas matemātisko cerību. Matemātiskās cerības dabiskais novērtējums ir tās novēroto vērtību vidējais aritmētiskais. Tāpēc visas nodarbības laikā izmantosim terminus “vidējā” un “vidējā vērtība”. Uzticamības intervāla aprēķināšanas uzdevumos visbiežāk prasītā atbilde ir šāda: “Vidējā skaitļa [vērtība konkrētā uzdevumā] ticamības intervāls ir no [mazāka vērtība] līdz [lielāka vērtība]. Izmantojot ticamības intervālu, varat novērtēt ne tikai vidējās vērtības, bet arī konkrēta raksturlieluma īpatsvaru vispārējā populācijā. Vidējie rādītāji, dispersija, standarta novirze un kļūdas, caur kurām mēs nonāksim pie jaunām definīcijām un formulām, tiek apspriestas nodarbībā Izlases un populācijas raksturojums .

Punktu un intervālu aplēses par vidējo

Ja kopas vidējo vērtību novērtē pēc skaitļa (punkta), tad par kopas nezināmās vidējās vērtības novērtējumu tiek ņemts konkrēts vidējais, kas tiek aprēķināts no novērojumu izlases. Šajā gadījumā izlases vidējā vērtība – gadījuma mainīgais – nesakrīt ar vispārējās populācijas vidējo vērtību. Tāpēc, norādot izlases vidējo vērtību, vienlaikus jānorāda izlases kļūda. Izlases kļūdas mērs ir standarta kļūda, ko izsaka tajās pašās vienībās kā vidējo. Tāpēc bieži tiek lietots šāds apzīmējums: .

Ja vidējā aplēse ir jāsaista ar noteiktu varbūtību, tad populācijā interesējošais parametrs jānovērtē nevis pēc viena skaitļa, bet pēc intervāla. Ticamības intervāls ir intervāls, kurā ar noteiktu varbūtību P tiek atrasta aplēstā iedzīvotāju skaita rādītāja vērtība. Pārliecības intervāls, kurā tas ir iespējams P = 1 - α nejaušo lielumu atrod, aprēķina šādi:

,

α = 1 - P, kuru var atrast gandrīz jebkuras statistikas grāmatas pielikumā.

Praksē populācijas vidējā vērtība un dispersija nav zināma, tāpēc populācijas dispersiju aizstāj ar izlases dispersiju, bet populācijas vidējo ar izlases vidējo. Tādējādi ticamības intervālu vairumā gadījumu aprēķina šādi:

.

Ticamības intervāla formulu var izmantot, lai novērtētu populācijas vidējo vērtību, ja

  • ir zināma populācijas standartnovirze;
  • vai arī populācijas standartnovirze nav zināma, bet izlases lielums ir lielāks par 30.

Izlases vidējais rādītājs ir objektīvs populācijas vidējā aprēķins. Savukārt izlases dispersija nav objektīvs populācijas dispersijas novērtējums. Lai iegūtu objektīvu populācijas dispersijas novērtējumu izlases dispersijas formulā, izlases lielums n jāaizstāj ar n-1.

1. piemērs. No 100 nejauši izvēlētām kafejnīcām noteiktā pilsētā tika apkopota informācija, ka vidējais darbinieku skaits tajās ir 10,5 ar standartnovirzi 4,6. Nosakiet 95% ticamības intervālu kafejnīcas darbinieku skaitam.

kur ir nozīmīguma līmeņa standarta normālā sadalījuma kritiskā vērtība α = 0,05 .

Tādējādi 95% ticamības intervāls vidējam kafejnīcu darbinieku skaitam bija robežās no 9,6 līdz 11,4.

2. piemērs. Nejaušam paraugam no 64 novērojumu kopas tika aprēķinātas šādas kopējās vērtības:

novērojumu vērtību summa,

vērtību kvadrātu noviržu summa no vidējā .

Aprēķiniet 95% ticamības intervālu matemātiskajai cerībai.

Aprēķināsim standarta novirzi:

,

Aprēķināsim vidējo vērtību:

.

Mēs aizstājam vērtības ticamības intervāla izteiksmē:

kur ir nozīmīguma līmeņa standarta normālā sadalījuma kritiskā vērtība α = 0,05 .

Mēs iegūstam:

Tādējādi šīs izlases matemātiskās cerības 95% ticamības intervāls svārstījās no 7,484 līdz 11,266.

3. piemērs. Nejaušai populācijas izlasei ar 100 novērojumiem aprēķinātais vidējais ir 15,2 un standarta novirze ir 3,2. Aprēķiniet paredzamās vērtības 95% ticamības intervālu, pēc tam 99% ticamības intervālu. Ja izlases jauda un tās variācijas paliek nemainīgas un ticamības koeficients palielinās, vai ticamības intervāls sašaurinās vai paplašināsies?

Mēs aizstājam šīs vērtības ticamības intervāla izteiksmē:

kur ir nozīmīguma līmeņa standarta normālā sadalījuma kritiskā vērtība α = 0,05 .

Mēs iegūstam:

.

Tādējādi šīs izlases vidējais 95% ticamības intervāls bija no 14,57 līdz 15,82.

Mēs atkal aizstājam šīs vērtības ticamības intervāla izteiksmē:

kur ir nozīmīguma līmeņa standarta normālā sadalījuma kritiskā vērtība α = 0,01 .

Mēs iegūstam:

.

Tādējādi šīs izlases vidējais 99% ticamības intervāls bija no 14,37 līdz 16,02.

Kā redzam, pieaugot ticamības koeficientam, pieaug arī standarta normālā sadalījuma kritiskā vērtība, un līdz ar to intervāla sākuma un beigu punkti atrodas tālāk no vidējā, un līdz ar to palielinās matemātiskās cerības ticamības intervāls. .

Īpatnējā smaguma punktu un intervālu aprēķini

Kāda parauga atribūta daļu var interpretēt kā punktu novērtējumu īpaša gravitāte lpp tāda pati īpašība vispārējā populācijā. Ja šī vērtība ir jāsaista ar varbūtību, tad jāaprēķina īpatnējā smaguma ticamības intervāls lpp raksturīgs populācijā ar varbūtību P = 1 - α :

.

4. piemērs. Dažās pilsētās ir divi kandidāti A Un B kandidē uz mēra amatu. Nejauši tika aptaujāti 200 pilsētas iedzīvotāji, no kuriem 46% atbildēja, ka balsotu par kandidātu A, 26% - kandidātam B un 28% nezina, par ko balsos. Nosakiet 95% ticamības intervālu to pilsētas iedzīvotāju īpatsvaram, kuri atbalsta kandidātu A.



Jaunums vietnē

>

Populārākais