Mājas Protezēšana un implantācija Kā atrast ticamības intervāla piemēru. Ticamības intervāls

Kā atrast ticamības intervāla piemēru. Ticamības intervāls

Ticamības intervāls– robežvērtības statistiskā vērtība, kas ar noteiktu ticamības varbūtību γ atradīsies šajā intervālā, ņemot paraugus lielākam tilpumam. Apzīmēts kā P(θ - ε. Praksē ticamības varbūtību γ izvēlas no vērtībām, kas ir diezgan tuvu vienībai: γ = 0,9, γ = 0,95, γ = 0,99.

Pakalpojuma mērķis. Izmantojot šo pakalpojumu, varat noteikt:

  • ticamības intervāls vispārējam vidējam, ticamības intervāls dispersijai;
  • ticamības intervāls standarta novirzei, ticamības intervāls vispārējai akcijai;
Iegūtais risinājums tiek saglabāts Word failā (skatiet piemēru). Zemāk ir video instrukcija, kā aizpildīt sākotnējos datus.

Piemērs Nr.1. Kolhozā no kopējā 1000 aitu ganāmpulka 100 aitām tika veikta selektīva kontroles cirpšana. Rezultātā tika noteikts vidējais vilnas apcirpums 4,2 kg uz vienu aitu. Nosaka ar varbūtību 0,99 parauga vidējo kvadrātveida kļūdu, nosakot vidējo vilnas cirpumu uz vienu aitu, un robežas, kurās iekļaujas cirpšanas vērtība, ja dispersija ir 2,5. Paraugs neatkārtojas.
Piemērs Nr.2. No ievestās produkcijas partijas Maskavas Ziemeļu muitas postenī izlases veidā tika paņemti 20 preces “A” paraugi. Pārbaudes rezultātā tika noteikts produkta “A” vidējais mitruma saturs paraugā, kas izrādījās vienāds ar 6% ar standartnovirzi 1%.
Noteikt ar varbūtību 0,683 produkta vidējā mitruma satura robežas visā ievestās produkcijas partijā.
Piemērs Nr.3. Aptauja, kurā piedalījās 36 skolēni, parādīja, ka vidējais mācību grāmatu skaits, ko viņi izlasa gadā akadēmiskais gads, izrādījās vienāds ar 6. Pieņemot, ka studenta izlasīto mācību grāmatu skaitam semestrī ir normālsadalījuma likums ar standartnovirzi, kas vienāda ar 6, atrodiet: A) ar ticamību 0,99, intervāla aprēķinu matemātiskajam. cerības uz šo nejaušais mainīgais; B) ar kādu varbūtību varam teikt, ka vidējais studenta izlasīto mācību grāmatu skaits semestrī, kas aprēķināts no šīs izlases, absolūtā vērtībā novirzīsies no matemātiskās cerības ne vairāk kā par 2.

Uzticamības intervālu klasifikācija

Pēc novērtējamā parametra veida:

Pēc parauga veida:

  1. Pārliecības intervāls bezgalīgam paraugam;
  2. Pārliecības intervāls gala paraugam;
Paraugu sauc par resampling, ja atlasītais objekts tiek atgriezts populācijā pirms nākamā atlases. Paraugu sauc par neatkārtojamu, ja atlasītais objekts netiek atgriezts populācijā. Praksē mēs parasti nodarbojamies ar paraugiem, kas neatkārtojas.

Vidējās izlases kļūdas aprēķins nejaušai izlasei

Tiek saukta neatbilstība starp paraugā iegūto rādītāju vērtībām un atbilstošajiem vispārējās populācijas parametriem reprezentativitātes kļūda.
Vispārējās un izlases populācijas galveno parametru apzīmējumi.
Vidējās izlases kļūdu formulas
atkārtota atlaseatkārtojiet atlasi
vidējipar akcijuvidējipar akciju
Attiecība starp izlases kļūdas robežu (Δ) garantēta ar zināmu varbūtību Р(t), Un vidējā kļūda paraugam ir forma: vai Δ = t·μ, kur t– ticamības koeficients, kas noteikts atkarībā no varbūtības līmeņa P(t) pēc Laplasa integrālfunkcijas tabulas.

Formulas izlases lieluma aprēķināšanai, izmantojot tīri nejaušas izlases metodi

Iepriekšējās apakšnodaļās mēs apskatījām jautājumu par nezināma parametra novērtēšanu A viens numurs. To sauc par "punkta" aplēsi. Vairākos uzdevumos jums ne tikai jāatrod parametrs A piemērotu skaitlisko vērtību, bet arī novērtēt tās precizitāti un uzticamību. Jums jāzina, kādas kļūdas var izraisīt parametra aizstāšana A tā punktu aplēse A un ar kādu pārliecības pakāpi mēs varam sagaidīt, ka šīs kļūdas nepārsniegs zināmās robežas?

Šāda veida problēmas ir īpaši aktuālas ar nelielu novērojumu skaitu, kad punktu novērtējums un iekšā ir lielā mērā nejaušs, un aptuvenā a aizstāšana ar a var izraisīt nopietnas kļūdas.

Sniegt priekšstatu par tāmes precizitāti un ticamību A,

V matemātiskā statistika Viņi izmanto tā sauktos ticamības intervālus un ticamības varbūtības.

Ļaujiet parametram A objektīvs novērtējums, kas iegūts no pieredzes A. Mēs vēlamies novērtēt iespējamo kļūdu šajā gadījumā. Piešķirsim kādu pietiekami lielu varbūtību p (piemēram, p = 0,9, 0,95 vai 0,99), lai notikumu ar varbūtību p varētu uzskatīt par praktiski ticamu, un atradīsim vērtību s, kurai

Tad diapazons ir praktiski iespējamās vērtības kļūda, kas rodas nomaiņas laikā A ieslēgts A, būs ± s; Lielas kļūdas absolūtajā vērtībā parādīsies tikai ar mazu varbūtību a = 1 - p. Pārrakstīsim (14.3.1) šādi:

Vienādība (14.3.2.) nozīmē, ka ar varbūtību p ir parametra nezināmā vērtība A ietilpst intervālā

Jāņem vērā viens apstāklis. Iepriekš mēs vairākkārt esam apsvēruši varbūtību, ka gadījuma lielums nonāks noteiktā negadījuma intervālā. Šeit situācija ir atšķirīga: lielums A nav nejaušs, bet intervāls / p ir nejaušs. Tās atrašanās vieta uz x ass ir nejauša, ko nosaka tās centrs A; Parasti arī intervāla 2s garums ir nejaušs, jo s vērtību parasti aprēķina no eksperimentāliem datiem. Tāpēc iekšā šajā gadījumā P vērtību labāk būtu interpretēt nevis kā varbūtību “trāpīt” punktā A intervālā / p un kā varbūtību, ka nejaušs intervāls / p aptvers punktu A(14.3.1. att.).

Rīsi. 14.3.1

Par varbūtību p parasti sauc ticamības varbūtība, un intervāls / p - ticamības intervāls. Intervālu robežas Ja. a x =a- smiltis a 2 = a + un tiek saukti uzticības robežas.

Sniegsim citu interpretāciju ticamības intervāla jēdzienam: to var uzskatīt par parametru vērtību intervālu A, saderīgi ar eksperimentālajiem datiem un nav tiem pretrunā. Patiešām, ja mēs piekrītam uzskatīt notikumu ar varbūtību a = 1-p praktiski neiespējamu, tad tās parametra a vērtības, kurām a - a> s ir jāatzīst par pretrunīgiem eksperimentālajiem datiem, un tie, kuriem |a - A a t na 2 .

Ļaujiet parametram A ir objektīvs aprēķins A. Ja mēs zinātu daudzuma sadalījuma likumu A, uzdevums atrast ticamības intervālu būtu ļoti vienkāršs: pietiktu atrast vērtību s, kurai

Grūtības ir tādas, ka aplēšu sadalījuma likums A ir atkarīgs no daudzuma sadales likuma X un tāpēc uz tā nezināmajiem parametriem (jo īpaši uz pašu parametru A).

Lai apietu šo grūtību, varat izmantot šādu aptuveni aptuvenu paņēmienu: aizstājiet nezināmos parametrus izteiksmē s ar to punktu aprēķiniem. Ar salīdzinoši lielu eksperimentu skaitu P(apmēram 20...30) šī tehnika parasti dod rezultātus, kas ir apmierinoši precizitātes ziņā.

Kā piemēru apsveriet matemātisko gaidu ticamības intervāla problēmu.

Ļaujiet tai ražot P X, kuru īpašības ir paredzamā vērtība T un dispersiju D- nezināms. Šiem parametriem tika iegūti šādi aprēķini:

Ir nepieciešams izveidot ticamības intervālu / p, kas atbilst ticamības varbūtībai p matemātiskajai cerībai T daudzumus X.

Risinot šo problēmu, izmantosim faktu, ka daudzums T atspoguļo summu P neatkarīgi identiski sadalīti gadījuma lielumi Xh un saskaņā ar centrālo robežu teorēmu pietiekami lielai P tā sadalījuma likums ir tuvu normālam. Praksē pat ar salīdzinoši nelielu terminu skaitu (apmēram 10...20) summas sadalījuma likumu var aptuveni uzskatīt par normālu. Mēs pieņemsim, ka vērtība T izplatīts saskaņā ar parasto likumu. Šī likuma raksturlielumi - matemātiskā gaida un dispersija - ir attiecīgi vienādi T Un

(skat. 13. nodaļas 13.3. apakšnodaļu). Pieņemsim, ka vērtība D mēs zinām un atradīsim vērtību Ep, par kuru

Izmantojot 6. nodaļas formulu (6.3.5), mēs izsakām varbūtību (14.3.5) kreisajā pusē caur normālā sadalījuma funkciju

kur ir novērtējuma standartnovirze T.

No Eq.

atrodiet Sp vērtību:

kur arg Ф* (х) ir Ф* apgrieztā funkcija (X), tie. argumenta vērtība, kurā normāla funkcija sadalījums ir vienāds ar X.

Izkliede D, caur kuru tiek izteikts daudzums A 1P, mēs precīzi nezinām; kā tā aptuveno vērtību varat izmantot tāmi D(14.3.4.) un ievietojiet aptuveni:

Tādējādi ir aptuveni atrisināta ticamības intervāla konstruēšanas problēma, kas ir vienāda ar:

kur gp nosaka pēc formulas (14.3.7.).

Lai izvairītos no apgrieztās interpolācijas funkcijas Ф* (l) tabulās, aprēķinot s p, ir ērti sastādīt īpašu tabulu (14.3.1. tabula), kurā norādītas daudzuma vērtības.

atkarībā no r. Vērtība (p nosaka parastajam likumam standarta noviržu skaitu, kas jāzīmē pa labi un pa kreisi no dispersijas centra, lai varbūtība nokļūt iegūtajā apgabalā būtu vienāda ar p.

Izmantojot vērtību 7 p, ticamības intervālu izsaka šādi:

14.3.1. tabula

1. piemērs. Tika veikti 20 eksperimenti ar daudzumu X; rezultāti ir parādīti tabulā. 14.3.2.

14.3.2. tabula

Ir jāatrod aprēķins no daudzuma matemātiskās cerības X un izveido ticamības intervālu, kas atbilst ticamības varbūtībai p = 0,8.

Risinājums. Mums ir:

Izvēloties l: = 10 par atskaites punktu, izmantojot trešo formulu (14.2.14.), atrodam objektīvu novērtējumu. D :

Saskaņā ar tabulu 14.3.1 mēs atrodam

Uzticības robežas:

Ticamības intervāls:

Parametru vērtības T, kas atrodas šajā intervālā, ir saderīgi ar tabulā norādītajiem eksperimentālajiem datiem. 14.3.2.

Dispersijas ticamības intervālu var izveidot līdzīgā veidā.

Ļaujiet tai ražot P neatkarīgi eksperimenti ar nejaušu lielumu X ar nezināmiem parametriem gan A, gan dispersijai D tika iegūts objektīvs novērtējums:

Ir nepieciešams aptuveni izveidot dispersijas ticamības intervālu.

No formulas (14.3.11.) ir skaidrs, ka daudzums D pārstāv

summa P formas nejaušie mainīgie . Šīs vērtības nav

neatkarīgi, jo jebkurš no tiem ietver daudzumu T, atkarīgs no visiem pārējiem. Tomēr var pierādīt, ka pieaugot P arī to summas sadalījuma likums tuvojas normālam. Gandrīz plkst P= 20...30 to jau var uzskatīt par normālu.

Pieņemsim, ka tas tā ir, un atradīsim šī likuma raksturlielumus: matemātiskās cerības un dispersiju. Kopš novērtējuma D- tad objektīvs M[D] = D.

Distances aprēķins D D ir saistīta ar salīdzinoši sarežģītiem aprēķiniem, tāpēc mēs piedāvājam tā izteiksmi bez atvasinājumiem:

kur q 4 ir ceturtais centrālais punkts daudzumus X.

Lai izmantotu šo izteiksmi, ir jāaizstāj vērtības\u003d 4 un D(vismaz tuvākie). Tā vietā D jūs varat izmantot viņa novērtējumu D. Principā ceturto centrālo momentu var aizstāt arī ar aprēķinu, piemēram, formas vērtību:

taču šāda nomaiņa nodrošinās ārkārtīgi zemu precizitāti, jo kopumā ar ierobežotu skaitu eksperimentu momenti augsta kārtība noteikts no lielas kļūdas. Taču praksē nereti gadās, ka daudzumu sadales likuma veids X zināms iepriekš: nav zināmi tikai tā parametri. Pēc tam varat mēģināt izteikt μ 4 cauri D.

Ņemsim visizplatītāko gadījumu, kad vērtība X izplatīts saskaņā ar parasto likumu. Tad tā ceturtais centrālais moments tiek izteikts dispersijas izteiksmē (sk. 6. nodaļas 6.2. apakšnodaļu);

un formula (14.3.12) dod vai

Nezināmā aizstāšana (14.3.14.) D viņa vērtējums D, mēs iegūstam: no kurienes

Momentu μ 4 var izteikt caur D arī dažos citos gadījumos, kad vērtības sadale X nav normāli, bet tā izskats ir zināms. Piemēram, likumam vienmērīgs blīvums(skat. 5. nodaļu) mums ir:

kur (a, P) ir intervāls, kurā likums ir norādīts.

Tāpēc

Izmantojot formulu (14.3.12), iegūstam: kur mēs aptuveni atrodam

Gadījumos, kad lieluma 26 sadalījuma likuma veids nav zināms, veicot aptuvenu a/) vērtības novērtējumu, joprojām ieteicams izmantot formulu (14.3.16.), ja vien nav īpašu iemeslu uzskatīt, ka šis likums ļoti atšķiras no parastās (ir manāma pozitīva vai negatīva kurtoze) .

Ja aptuvenā vērtība a/) ir iegūta vienā vai otrā veidā, tad mēs varam izveidot ticamības intervālu dispersijai tādā pašā veidā, kā mēs to izveidojām matemātiskajai cerībai:

kur pēc tabulas atrodama vērtība atkarībā no dotās varbūtības p. 14.3.1.

2. piemērs. Atrodiet aptuveni 80% ticamības intervālu nejaušā lieluma dispersijai X saskaņā ar 1. piemēra nosacījumiem, ja ir zināms, ka vērtība X sadalīta saskaņā ar likumu, kas ir tuvu normālam.

Risinājums. Vērtība paliek tāda pati kā tabulā. 14.3.1.:

Saskaņā ar formulu (14.3.16.)

Izmantojot formulu (14.3.18), mēs atrodam ticamības intervālu:

Atbilstošs vidējo vērtību intervāls kvadrātveida novirze: (0,21; 0,29).

14.4. Precīzas būvniecības metodes ticamības intervāli gadījuma lieluma parametriem, kas sadalīti saskaņā ar normālo likumu

Iepriekšējā apakšnodaļā mēs pārbaudījām aptuveni aptuvenas metodes ticamības intervālu konstruēšanai matemātiskām prognozēm un dispersijai. Šeit mēs sniegsim priekšstatu par precīzām metodēm vienas un tās pašas problēmas risināšanai. Mēs uzsveram, ka, lai precīzi atrastu ticamības intervālus, ir absolūti nepieciešams iepriekš zināt daudzuma sadalījuma likuma formu X, tā kā aptuvenu metožu piemērošanai tas nav nepieciešams.

Ideja precīzas metodes ticamības intervālu konstruēšana ir šāda. Jebkurš ticamības intervāls tiek atrasts no nosacījuma, kas izsaka noteiktu nevienādību izpildes varbūtību, kas ietver mūs interesējošo novērtējumu A. Vērtēšanas sadalījuma likums A V vispārējs gadījums atkarīgs no nezināmiem daudzuma parametriem X. Tomēr dažreiz no nejauša lieluma ir iespējams pārnest nevienādības A uz kādu citu novēroto vērtību funkciju X p X 2, ..., X lpp. kura sadalījuma likums nav atkarīgs no nezināmiem parametriem, bet ir atkarīgs tikai no eksperimentu skaita un lieluma sadalījuma likuma veida X.Šāda veida nejaušajiem mainīgajiem ir svarīga loma matemātiskajā statistikā; tie ir visdetalizētāk pētīti normālā daudzuma sadalījuma gadījumā X.

Piemēram, ir pierādīts, ka ar normālu vērtības sadalījumu X nejauša vērtība

pakļaujas t.s Studentu sadales likums Ar P- 1 brīvības pakāpe; šī likuma blīvumam ir forma

kur G(x) ir zināmā gamma funkcija:

Ir arī pierādīts, ka nejaušais mainīgais

ir "%2 sadalījums" ar P- 1 brīvības pakāpe (sk. 7. nodaļu), kuras blīvumu izsaka ar formulu

Nekavējoties pie sadalījumu (14.4.2) un (14.4.4) atvasinājumiem, mēs parādīsim, kā tos var izmantot, veidojot parametru ticamības intervālus. ty D.

Ļaujiet tai ražot P neatkarīgi eksperimenti ar nejaušu lielumu X, parasti izplatīts ar nezināmiem parametriem T&O. Par šiem parametriem tika iegūti aprēķini

Abiem parametriem ir jākonstruē ticamības intervāli, kas atbilst ticamības varbūtībai p.

Vispirms izveidosim ticamības intervālu matemātiskajai cerībai. Ir dabiski pieņemt šo intervālu simetriski attiecībā pret T; ar s p apzīmē pusi no intervāla garuma. Vērtība s p ir jāizvēlas tā, lai nosacījums būtu izpildīts

Mēģināsim pāriet uz vienādības (14.4.5) kreiso pusi no nejaušā lieluma T uz nejaušu lielumu T, izplatīts saskaņā ar Studenta likumu. Lai to izdarītu, reiziniet abas nevienādības |m-w?| puses

ar pozitīvu vērtību: vai, izmantojot apzīmējumu (14.4.1.),

Atradīsim tādu skaitli / p, lai vērtību / p varētu atrast no nosacījuma

No formulas (14.4.2) ir skaidrs, ka (1) - vienmērīga funkcija, tā (14.4.8) dod

Vienādība (14.4.9) nosaka vērtību / p atkarībā no p. Ja jūsu rīcībā ir integrālo vērtību tabula

tad /p vērtību var atrast tabulā ar apgriezto interpolāciju. Tomēr ērtāk ir iepriekš izveidot /p vērtību tabulu. Šāda tabula ir sniegta pielikumā (5. tabula). Šajā tabulā parādītas vērtības atkarībā no ticamības līmeņa p un brīvības pakāpju skaita P- 1. Pēc tabulas noteikšanas / p. 5 un pieņemot

mēs atradīsim pusi no ticamības intervāla / p platuma un pašu intervālu

1. piemērs. Ar nejaušu lielumu tika veikti 5 neatkarīgi eksperimenti X, parasti izplatīts ar nezināmiem parametriem T un apmēram. Eksperimentu rezultāti ir doti tabulā. 14.4.1.

14.4.1. tabula

Atrodiet vērtējumu T matemātiskajai cerībai un izveidojiet tai 90% ticamības intervālu / p (t.i., intervālu, kas atbilst ticamības varbūtībai p = 0,9).

Risinājums. Mums ir:

Saskaņā ar pieteikuma 5. tabulu par P - 1 = 4 un p = 0,9 mēs atrodam kur

Uzticamības intervāls būs

2. piemērs. 14.3. apakšnodaļas 1. piemēra nosacījumiem, pieņemot vērtību X parasti sadala, atrodiet precīzu ticamības intervālu.

Risinājums. Saskaņā ar pielikuma 5. tabulu mēs atrodam, kad P - 1 = 19ir =

0,8 / p = 1,328; no šejienes

Salīdzinot ar 14.3.apakšnodaļas 1.piemēra risinājumu (e p = 0,072), esam pārliecināti, ka neatbilstība ir ļoti nenozīmīga. Ja saglabājam precizitāti līdz otrajai zīmei aiz komata, tad ar precīzo un aptuveno metodi atrastie ticamības intervāli sakrīt:

Pāriesim pie dispersijas ticamības intervāla konstruēšanas. Apsveriet objektīvu dispersijas novērtētāju

un izteikt nejaušo mainīgo D caur lielumu V(14.4.3), ar sadalījumu x 2 (14.4.4):

Zinot daudzuma sadalījuma likumu V, jūs varat atrast intervālu /(1), kurā tas ietilpst ar noteiktu varbūtību p.

Sadales likums kn_x(v) Lielumam I 7 ir tāda forma, kā parādīts attēlā. 14.4.1.

Rīsi. 14.4.1

Rodas jautājums: kā izvēlēties intervālu / p? Ja lieluma sadalījuma likums V bija simetrisks (tāpat kā parastais likums vai Stjudenta sadalījums), būtu dabiski ņemt intervālu /p simetriski attiecībā pret matemātisko cerību. Šajā gadījumā likums k p_x (v) asimetrisks. Vienosimies izvēlēties intervālu /p tā, lai vērtības varbūtība būtu V aiz intervāla pa labi un pa kreisi (ēnotās zonas 14.4.1. attēlā) bija vienādas un vienādas

Lai izveidotu intervālu /p ar šo īpašību, mēs izmantojam tabulu. 4 lietojumprogrammas: tajā ir skaitļi y) tāds, ka

par vērtību V, kam ir x 2 sadalījums ar r brīvības pakāpēm. Mūsu gadījumā r = n- 1. Labosim r = n- 1 un atrodiet attiecīgajā tabulas rindā. 4 divas nozīmes x 2 - viens atbilst varbūtībai otrs - varbūtība Apzīmēsim tos

vērtības plkst.2 Un xl? Intervāls ir 2 gads, ar kreiso un y~ labais gals.

Tagad no intervāla / p atradīsim vēlamo ticamības intervālu /| dispersijai ar robežām D un D2, kas aptver punktu D ar varbūtību p:

Konstruēsim intervālu / (, = (?> ь А), kas aptver punktu D tad un tikai tad, ja vērtība V iekrīt intervālā /r. Ļaujiet mums parādīt, ka intervāls

atbilst šim nosacījumam. Patiešām, nevienlīdzība ir līdzvērtīgi nevienlīdzībai

un šīs nevienādības apmierina ar varbūtību p. Tādējādi dispersijas ticamības intervāls ir atrasts un izteikts ar formulu (14.4.13.).

3. piemērs. Atrodiet ticamības intervālu dispersijai 14.3. apakšnodaļas 2. piemēra apstākļos, ja ir zināms, ka vērtība X parasti izplatīts.

Risinājums. Mums ir . Saskaņā ar pielikuma 4. tabulu

atrodam plkst r = n - 1 = 19

Izmantojot formulu (14.4.13), mēs atrodam dispersijas ticamības intervālu

Atbilstošais standartnovirzes intervāls ir (0,21; 0,32). Šis intervāls tikai nedaudz pārsniedz 14.3. apakšnodaļas 2. piemērā iegūto intervālu (0,21; 0,29), izmantojot aptuveno metodi.

  • Attēlā 14.3.1. ticamības intervāls ir simetrisks ap a. Kopumā, kā mēs redzēsim vēlāk, tas nav nepieciešams.

Uzticības intervālu novērtēšana

Mācību mērķi

Statistika ņem vērā sekojošo divi galvenie uzdevumi:

    Mums ir daži aprēķini, kuru pamatā ir izlases dati, un mēs vēlamies sniegt varbūtības apgalvojumu par to, kur atrodas aplēstā parametra patiesā vērtība.

    Mums ir īpaša hipotēze, kas jāpārbauda, ​​izmantojot izlases datus.

Šajā tēmā mēs aplūkojam pirmo uzdevumu. Ieviesīsim arī ticamības intervāla definīciju.

Ticamības intervāls ir intervāls, kas tiek veidots ap aplēsto parametra vērtību un parāda, kur atrodas aprēķinātā parametra patiesā vērtība ar a priori noteiktu varbūtību.

Izpētījis materiālu par šo tēmu, jūs:

    uzzināt, kas ir ticamības intervāls novērtējumam;

    iemācīties klasificēt statistikas problēmas;

    apgūt ticamības intervālu konstruēšanas tehniku, gan izmantojot statistikas formulas, gan izmantojot programmatūras rīkus;

    iemācīties noteikt nepieciešamos izlases lielumus, lai sasniegtu noteiktus statistisko aplēšu precizitātes parametrus.

Izlases raksturlielumu sadalījumi

T-sadale

Kā minēts iepriekš, nejaušā lieluma sadalījums ir tuvu standartizētajam normālais sadalījums ar parametriem 0 un 1. Tā kā mēs nezinām σ vērtību, mēs to aizstājam ar kādu s novērtējumu. Daudzumam jau ir atšķirīgs sadalījums, proti, vai Studentu sadale, ko nosaka ar parametru n -1 (brīvības pakāpju skaits). Šis sadalījums ir tuvu normālajam sadalījumam (jo lielāks n, jo tuvāki sadalījumi).

Attēlā 95
tiek parādīts Studentu sadalījums ar 30 brīvības pakāpēm. Kā redzat, tas ir ļoti tuvu normālajam sadalījumam.

Līdzīgi kā funkcijām darbam ar normālo sadalījumu NORMIDIST un NORMINV, ir arī funkcijas darbam ar t sadalījumu - STUDIST (TDIST) un STUDRASOBR (TINV). Šo funkciju izmantošanas piemēru var redzēt failā STUDRASP.XLS (veidne un risinājums) un attēlā. 96
.

Citu raksturlielumu sadalījumi

Kā mēs jau zinām, lai noteiktu matemātiskās cerības novērtējuma precizitāti, mums ir nepieciešams t sadalījums. Lai novērtētu citus parametrus, piemēram, dispersiju, ir nepieciešami dažādi sadalījumi. Divi no tiem ir F sadalījums un x 2 -sadale.

Pārliecības intervāls vidējam

Ticamības intervāls- šis ir intervāls, kas tiek veidots ap aplēsto parametra vērtību un parāda, kur atrodas aprēķinātā parametra patiesā vērtība ar a priori noteiktu varbūtību.

Tiek izveidots ticamības intervāls vidējai vērtībai šādā veidā:

Piemērs

Ātrās ēdināšanas restorāns plāno paplašināt savu sortimentu ar jauna veida sviestmaizi. Lai novērtētu pieprasījumu pēc tā, vadītājs plāno nejauši atlasīt 40 apmeklētājus no jau izmēģinājušajiem un lūgt novērtēt savu attieksmi pret jauno produktu skalā no 1 līdz 10. Vadītājs vēlas novērtēt sagaidāmo punktu skaits, ko jaunais produkts saņems, un izveidojiet 95% ticamības intervālu šim aprēķinam. Kā to izdarīt? (skatiet failu SANDWICH1.XLS (veidne un risinājums).

Risinājums

Lai atrisinātu šo problēmu, varat izmantot. Rezultāti ir parādīti attēlā. 97
.

Kopējās vērtības ticamības intervāls

Dažkārt, izmantojot izlases datus, ir nepieciešams novērtēt nevis matemātisko cerību, bet gan kopējā summa vērtības. Piemēram, situācijā ar revidentu interese var būt nevis vidējā konta lieluma aplēse, bet gan visu kontu summa.

Ļaujiet N - Kopā elementi, n ir izlases lielums, T 3 ir izlasē esošo vērtību summa, T" ir summas aprēķins visai populācijai, tad , un ticamības intervālu aprēķina pēc formulas , kur s ir izlases standartnovirzes aprēķins un izlases vidējās vērtības novērtējums.

Piemērs

Pieņemsim, ka nodokļu aģentūra vēlas aprēķināt kopējo nodokļu atmaksu 10 000 nodokļu maksātājiem. Nodokļu maksātājs vai nu saņem atmaksu, vai arī maksā papildu nodokļus. Atrodiet 95% ticamības intervālu atmaksas summai, pieņemot, ka izlases lielums ir 500 personas (skatiet failu AMOUNT OF REFUND.XLS (veidne un risinājums).

Risinājums

StatPro nav īpašas procedūras šim gadījumam, tomēr var atzīmēt, ka robežas var iegūt no robežām vidējam, pamatojoties uz iepriekš minētajām formulām (98. att.
).

Pārliecības intervāls proporcijai

Ļaujiet p apzīmēt klientu daļas matemātisku cerību, un p b ir šīs daļas novērtējums, kas iegūts no n lieluma izlases. Var pierādīt, ka pietiekami lielai novērtējuma sadalījums būs tuvu normālam ar matemātisko paredzamo p un standarta novirzi . Novērtējuma standarta kļūdu šajā gadījumā izsaka kā , un ticamības intervāls ir kā .

Piemērs

Ātrās ēdināšanas restorāns plāno paplašināt savu sortimentu ar jauna veida sviestmaizi. Lai novērtētu pieprasījumu pēc tā, vadītājs nejauši izvēlējās 40 apmeklētājus no jau izmēģinājušajiem un lūdza novērtēt savu attieksmi pret jauno produktu skalā no 1 līdz 10. Vadītājs vēlas novērtēt sagaidāmo īpatsvaru klientiem, kuri jauno produktu novērtē vismaz ar 6 ballēm (viņš sagaida, ka šie klienti būs jaunā produkta patērētāji).

Risinājums

Sākotnēji mēs izveidojam jaunu kolonnu, pamatojoties uz atribūtu 1, ja klienta vērtējums bija lielāks par 6 punktiem un 0 pārējā gadījumā (skatiet failu SANDWICH2.XLS (veidne un risinājums).

1. metode

Saskaitot skaitli 1, mēs novērtējam daļu un pēc tam izmantojam formulas.

Zcr vērtība tiek ņemta no īpašām normālā sadalījuma tabulām (piemēram, 1,96 95% ticamības intervālam).

Izmantojot šo pieeju un konkrētus datus, lai izveidotu 95% intervālu, mēs iegūstam šādus rezultātus (99. att.
). Kritiskā vērtība parametrs z cr ir vienāds ar 1,96. Novērtējuma standartkļūda ir 0,077. Uzticamības intervāla apakšējā robeža ir 0,475. Ticamības intervāla augšējā robeža ir 0,775. Tādējādi vadītājam ir tiesības ar 95% pārliecību uzskatīt, ka to klientu procentuālais daudzums, kuri jauno produktu novērtēs ar 6 ballēm vai augstāk, būs no 47,5 līdz 77,5.

2. metode

Šo problēmu var atrisināt, izmantojot standarta StatPro rīkus. Lai to izdarītu, pietiek atzīmēt, ka daļa šajā gadījumā sakrīt ar slejas Tips vidējo vērtību. Tālāk piesakāmies StatPro/Statistikas secinājumi/Viena parauga analīze lai izveidotu vidējā (matemātiskās cerības aplēses) ticamības intervālu kolonnai Tips. Šajā gadījumā iegūtie rezultāti būs ļoti tuvi 1. metodes rezultātiem (99. att.).

Standarta novirzes ticamības intervāls

s izmanto kā standartnovirzes aprēķinu (formula dota 1. sadaļā). Novērtējuma s blīvuma funkcija ir hī kvadrāta funkcija, kurai, tāpat kā t sadalījumam, ir n-1 brīvības pakāpe. Ir īpašas funkcijas darbam ar šo izplatīšanu CHIDIST un CHIINV.

Uzticamības intervāls šajā gadījumā vairs nebūs simetrisks. Parastā robežu diagramma ir parādīta attēlā. 100 .

Piemērs

Mašīnai jāražo detaļas ar diametru 10 cm.Tomēr dažādu apstākļu dēļ rodas kļūdas. Kvalitātes kontrolieris ir nobažījies par diviem apstākļiem: pirmkārt, vidējai vērtībai jābūt 10 cm; otrkārt, pat šajā gadījumā, ja novirzes ir lielas, tad daudzas daļas tiks noraidītas. Katru dienu viņš izgatavo 50 detaļu paraugu (skat. failu QUALITY CONTROL.XLS (veidne un risinājums). Kādus secinājumus šāds paraugs var dot?

Risinājums

Konstruēsim 95% ticamības intervālus vidējai un standarta novirzei, izmantojot StatPro/Statistikas secinājumi/Viena parauga analīze(101. att
).

Tālāk, izmantojot pieņēmumu par normālu diametru sadalījumu, mēs aprēķinām bojāto izstrādājumu proporciju, nosakot maksimālo novirzi 0,065. Izmantojot aizstāšanas tabulas iespējas (divu parametru gadījums), uzzīmējam defektu proporcijas atkarību no vidējās vērtības un standartnovirzes (102. att.
).

Pārliecības intervāls starpībai starp diviem līdzekļiem

Šis ir viens no visvairāk svarīgas lietojumprogrammas statistikas metodes. Situāciju piemēri.

    Apģērbu veikala vadītāja vēlas uzzināt, cik daudz vairāk vai mazāk vidējā pircēja sieviete veikalā tērē nekā vidusmēra vīrietis.

    Abas aviosabiedrības veic lidojumus līdzīgos maršrutos. Patērētāju organizācija vēlas salīdzināt abu aviosabiedrību vidējo paredzamo lidojumu kavēšanās laiku atšķirību.

    Uzņēmums izsūta kuponus par atsevišķas sugas preces vienā pilsētā un neizsūta uz citu. Vadītāji vēlas salīdzināt šo produktu vidējos pirkšanas apjomus nākamo divu mēnešu laikā.

    Automašīnu tirgotājs prezentācijās bieži nodarbojas ar precētiem pāriem. Lai saprastu viņu personīgās reakcijas uz prezentāciju, pāri bieži tiek intervēti atsevišķi. Vadītājs vēlas novērtēt vīriešu un sieviešu sniegto vērtējumu atšķirību.

Neatkarīgu paraugu gadījums

Atšķirībai starp līdzekļiem būs t sadalījums ar n 1 + n 2 - 2 brīvības pakāpēm. Ticamības intervālu μ 1 - μ 2 izsaka ar attiecību:

Šo problēmu var atrisināt ne tikai izmantojot iepriekš minētās formulas, bet arī izmantojot standarta StatPro rīkus. Lai to izdarītu, pietiek ar to izmantošanu

Pārliecības intervāls starpībai starp proporcijām

Ļaut būt matemātiskām akcijām. Ļaut ir viņu izlases aplēses, kas veidotas no attiecīgi n 1 un n 2 izmēra paraugiem. Tad ir aplēse par starpību. Tāpēc šīs atšķirības ticamības intervālu izsaka šādi:

Šeit z cr ir vērtība, kas iegūta no normālā sadalījuma, izmantojot īpašas tabulas (piemēram, 1,96 95% ticamības intervālam).

Novērtējuma standarta kļūdu šajā gadījumā izsaka ar attiecību:

.

Piemērs

Veikals, gatavojoties lielajai izpārdošanai, veica šādas darbības: tirgus izpēte. Tika atlasīti 300 labākie pircēji, kas savukārt tika nejauši sadalīti divās grupās pa 150 dalībniekiem katrā. Visiem atlasītajiem pircējiem tika nosūtīti uzaicinājumi piedalīties izpārdošanā, bet tikai pirmās grupas dalībnieki saņēma kuponu, kas dod tiesības uz 5% atlaidi. Izpārdošanas laikā tika fiksēti visu 300 atlasīto pircēju pirkumi. Kā vadītājs var interpretēt rezultātus un pieņemt lēmumu par kuponu efektivitāti? (skatiet failu COUPONS.XLS (veidne un risinājums)).

Risinājums

Mūsu konkrētajā gadījumā no 150 klientiem, kuri saņēma atlaižu kuponu, 55 veica pirkumu izpārdošanā, bet no 150, kas kuponu nesaņēma, tikai 35 veica pirkumu (103. att.
). Tad parauga proporciju vērtības ir attiecīgi 0,3667 un 0,2333. Un izlases starpība starp tām ir attiecīgi vienāda ar 0,1333. Pieņemot 95% ticamības intervālu, no normālā sadalījuma tabulas atrodam z cr = 1,96. Izlases starpības standartkļūdas aprēķins ir 0,0524. Visbeidzot, mēs atklājam, ka 95% ticamības intervāla apakšējā robeža ir 0,0307 un augšējā robeža attiecīgi 0,2359. Iegūtos rezultātus var interpretēt tā, ka uz katriem 100 klientiem, kuri saņēma atlaižu kuponu, varam sagaidīt no 3 līdz 23 jauniem klientiem. Taču jāpatur prātā, ka šis secinājums pats par sevi nenozīmē kuponu izmantošanas efektivitāti (jo, nodrošinot atlaidi, mēs zaudējam peļņu!). Pierādīsim to ar konkrētiem datiem. Izliksimies tā vidējais izmērs pirkums ir vienāds ar 400 rubļiem, no kuriem 50 rubļi. veikalam ir peļņa. Tad paredzamā peļņa no 100 klientiem, kuri nesaņēma kuponu, ir:

50 0,2333 100 = 1166,50 rub.

Līdzīgi aprēķini 100 klientiem, kuri saņēma kuponu, sniedz:

30 0,3667 100 = 1100,10 rub.

Vidējās peļņas samazināšanās līdz 30 skaidrojama ar to, ka, izmantojot atlaidi, klienti, kuri saņēmuši kuponu, vidēji iepirksies par 380 rubļiem.

Tādējādi gala secinājums norāda uz šādu kuponu izmantošanas neefektivitāti konkrētajā situācijā.

komentēt. Šo problēmu var atrisināt, izmantojot standarta StatPro rīkus. Lai to izdarītu, ir pietiekami samazināt šo uzdevumu uz problēmu, kā novērtēt atšķirību starp diviem vidējiem rādītājiem, izmantojot metodi, un pēc tam piemērot StatPro/Statistikas secinājumi/Divu paraugu analīze lai izveidotu ticamības intervālu starpībai starp divām vidējām vērtībām.

Pārliecības intervāla garuma kontrole

Uzticamības intervāla garums ir atkarīgs no šādiem nosacījumiem :

    dati tieši (standarta novirze);

    nozīmīguma līmenis;

    parauga lielums.

Izlases lielums, lai novērtētu vidējo

Pirmkārt, aplūkosim problēmu vispārīgā gadījumā. Apzīmēsim pusi no mums dotā ticamības intervāla garuma vērtību kā B (104. att.
). Mēs zinām, ka kāda nejauša lieluma X vidējās vērtības ticamības intervāls ir izteikts kā , Kur . Ticot:

un izsakot n, mēs iegūstam .

Diemžēl, precīza vērtība Mēs nezinām nejaušā lieluma X dispersiju. Turklāt mēs nezinām tcr vērtību, jo tā ir atkarīga no n caur brīvības pakāpju skaitu. Šajā situācijā mēs varam rīkoties šādi. Izkliedes s vietā mēs izmantojam dažus dispersijas aprēķinus, pamatojoties uz jebkuru pieejamo pētāmā nejaušā mainīgā implementāciju. T cr vērtības vietā mēs izmantojam z cr vērtību normālajam sadalījumam. Tas ir diezgan pieņemami, jo sadalījuma blīvuma funkcijas normālajam un t sadalījumam ir ļoti tuvas (izņemot mazo n gadījumu). Tādējādi nepieciešamā formula ir šāda:

.

Tā kā formula sniedz, vispārīgi runājot, rezultātus, kas nav veseli, noapaļošana ar rezultāta pārsniegumu tiek uzskatīta par vēlamo izlases lielumu.

Piemērs

Ātrās ēdināšanas restorāns plāno paplašināt savu sortimentu ar jauna veida sviestmaizi. Lai novērtētu pieprasījumu pēc tā, vadītājs plāno pēc nejaušības principa atlasīt apmeklētāju skaitu no jau izmēģinājušajiem un lūgt novērtēt savu attieksmi pret jauno produktu skalā no 1 līdz 10. Vadītājs vēlas novērtēt paredzamais punktu skaits, ko jaunais produkts saņems, un šim aprēķinam izveidojiet 95% ticamības intervālu. Tajā pašā laikā viņš vēlas, lai ticamības intervāla pusplatums nepārsniegtu 0,3. Cik apmeklētāju viņam ir nepieciešams intervēt?

sekojoši:

Šeit r ots ir proporcijas p novērtējums, un B ir dotā puse no ticamības intervāla garuma. Pārvērtējumu n var iegūt, izmantojot vērtību r ots= 0,5. Šajā gadījumā ticamības intervāla garums nepārsniegs norādīto vērtību B nevienai patiesajai p vērtībai.

Piemērs

Ļaujiet vadītājam no iepriekšējā piemēra plānot to klientu daļu, kuri deva priekšroku jauna veida produktam. Viņš vēlas izveidot 90% ticamības intervālu, kura pusgarums nepārsniedz 0,05. Cik klientu jāiekļauj nejaušajā izlasē?

Risinājums

Mūsu gadījumā z cr vērtība = 1,645. Tāpēc nepieciešamais daudzums tiek aprēķināts kā .

Ja vadītājam būtu pamats uzskatīt, ka vēlamā p vērtība ir, piemēram, aptuveni 0,3, tad, aizvietojot šo vērtību iepriekš minētajā formulā, mēs iegūtu mazāku nejaušās izlases vērtību, proti, 228.

Formula noteikšanai nejaušs izlases lielums, ja atšķiras divi vidējie rādītāji rakstīts kā:

.

Piemērs

Dažiem datoru uzņēmumiem ir klientu apkalpošanas centrs. IN Nesen pieaudzis klientu sūdzību skaits par slikto servisa kvalitāti. IN servisa centrs Galvenokārt ir divu veidu darbinieki: tie, kuriem nav lielas pieredzes, bet ir izgājuši speciālos sagatavošanas kursus, un tie, kuriem ir liela praktiskā pieredze, bet nav izgājuši speciālos kursus. Uzņēmums vēlas analizēt klientu sūdzības pēdējo sešu mēnešu laikā un salīdzināt vidējo sūdzību skaitu katrā no divām darbinieku grupām. Tiek pieņemts, ka skaitļi izlasēs abām grupām būs vienādi. Cik darbinieku jāiekļauj izlasē, lai iegūtu 95% intervālu ar pusgarumu ne vairāk kā 2?

Risinājums

Šeit σ ots ir abu nejaušo mainīgo standartnovirzes aprēķins, pieņemot, ka tie ir tuvu. Tādējādi mūsu uzdevumā mums ir kaut kādā veidā jāiegūst šis novērtējums. To var izdarīt, piemēram, šādi. Apskatot datus par klientu sūdzībām pēdējo sešu mēnešu laikā, vadītājs var pamanīt, ka katrs darbinieks kopumā saņem no 6 līdz 36 sūdzībām. Zinot, ka normālam sadalījumam gandrīz visas vērtības ir ne vairāk kā trīs reizes noņemtas no vidējā standarta novirzes, viņš var pamatoti uzskatīt, ka:

, no kurienes σ ots = 5.

Aizvietojot šo vērtību formulā, mēs iegūstam .

Formula noteikšanai nejaušas izlases lielums proporciju starpības novērtēšanas gadījumā ir šāda forma:

Piemērs

Dažam uzņēmumam ir divas rūpnīcas, kas ražo līdzīgus produktus. Uzņēmuma vadītājs vēlas salīdzināt defektīvo produktu procentuālo daudzumu abās rūpnīcās. Saskaņā ar pieejamo informāciju defektu līmenis abās rūpnīcās svārstās no 3 līdz 5%. Ir paredzēts izveidot 99% ticamības intervālu ar pusgarumu, kas nepārsniedz 0,005 (vai 0,5%). Cik daudz produktu ir jāizvēlas no katras rūpnīcas?

Risinājums

Šeit p 1ots un p 2ots ir aplēses par divām nezināmām defektu daļām 1. un 2. rūpnīcā. Ja liekam p 1ots = p 2ots = 0,5, tad n iegūstam pārvērtētu vērtību. Bet, tā kā mūsu gadījumā mums ir zināma a priori informācija par šīm akcijām, tad mēs ņemam šo akciju augšējo tāmi, proti, 0,05. Mēs saņemam

Novērtējot dažus populācijas parametrus no izlases datiem, ir lietderīgi norādīt ne tikai punktu tāme parametru, bet arī norāda ticamības intervālu, kas parāda, kur var atrasties precīzā aprēķinātā parametra vērtība.

Šajā nodaļā mēs arī iepazināmies ar kvantitatīvām attiecībām, kas ļauj konstruēt šādus intervālus dažādiem parametriem; uzzināja veidus, kā kontrolēt ticamības intervāla garumu.

Ņemiet vērā arī to, ka paraugu lieluma noteikšanas problēmu (eksperimenta plānošanas problēmu) var atrisināt, izmantojot standarta StatPro rīkus, proti, StatPro/Statistikas secinājumi/Parauga lieluma izvēle.

"Katren-Style" turpina Konstantīna Kravčika cikla izdošanu par medicīniskā statistika. Divos iepriekšējos rakstos autors nodarbojās ar tādu jēdzienu kā un skaidrojumu.

Konstantīns Kravčiks

Matemātiķis-analītiķis. Jomas speciālists statistikas pētījumi medicīnā un humanitārajās zinātnēs

Maskavas pilsēta

Ļoti bieži rakstos par klīniskie pētījumi jūs varat saskarties ar noslēpumainu frāzi: “uzticamības intervāls” (95 % TI vai 95 % TI - ticamības intervāls). Piemēram, rakstā var rakstīt: “Lai novērtētu atšķirību nozīmīgumu, mēs izmantojām Studenta t-tests ar 95 % ticamības intervāla aprēķinu.

Kāda ir “95 % ticamības intervāla” vērtība un kāpēc to aprēķināt?

Kas ir ticamības intervāls? - Šis ir diapazons, kurā atrodas patiesā populācija. Vai ir “nepatiesi” vidējie rādītāji? Savā ziņā jā, viņi to dara. Mēs paskaidrojām, ka nav iespējams izmērīt interesējošo parametru visā populācijā, tāpēc pētnieki ir apmierināti ar ierobežotu izlasi. Šajā izlasē (piemēram, pamatojoties uz ķermeņa svaru) ir viena vidējā vērtība (noteikts svars), pēc kuras mēs spriežam par vidējo vērtību visā populācijā. Tomēr ir maz ticams, ka vidējais svars izlasē (īpaši mazā) sakritīs ar vidējo svaru vispārējā populācijā. Tāpēc pareizāk ir aprēķināt un izmantot iedzīvotāju vidējo vērtību diapazonu.

Piemēram, iedomājieties, ka hemoglobīna 95% ticamības intervāls (95% TI) ir no 110 līdz 122 g/l. Tas nozīmē, ka pastāv 95% iespēja, ka patiesā vidējā hemoglobīna vērtība populācijā būs no 110 līdz 122 g/l. Citiem vārdiem sakot, mēs nezinām vidēji hemoglobīna līmeni vispārējā populācijā, taču mēs varam norādīt virkni šī raksturlieluma vērtību ar 95 % varbūtību.

Uzticamības intervāli ir īpaši svarīgi attiecībā uz atšķirībām starp grupām vai efektu lielumiem, kā tos sauc.

Pieņemsim, ka mēs salīdzinājām divu dzelzs preparātu efektivitāti: vienu, kas ir tirgū jau ilgu laiku, un vienu, kas ir tikko reģistrēts. Pēc terapijas kursa izvērtējām hemoglobīna koncentrāciju pētītajās pacientu grupās, un statistikas programma aprēķināja, ka starpība starp abu grupu vidējām vērtībām ar 95 % varbūtību ir robežās no 1,72 līdz 14,36 g/l (1. tabula).

Tabula 1. Neatkarīgu paraugu pārbaude
(grupas tiek salīdzinātas pēc hemoglobīna līmeņa)

Tas jāinterpretē šādi: dažiem pacientiem vispārējā populācijā, kas lieto jaunas zāles, hemoglobīns būs vidēji par 1,72–14,36 g/l augstāks nekā tiem, kuri lietoja jau zināmas zāles.

Citiem vārdiem sakot, vispārējā populācijā vidējā hemoglobīna vērtību atšķirība starp grupām ir šajās robežās ar 95% varbūtību. Tas, vai tas ir daudz vai maz, būs pētnieka ziņā. Tā visa būtība ir tāda, ka mēs strādājam nevis ar vienu vidējo vērtību, bet ar vērtību diapazonu, tāpēc mēs ticamāk novērtējam parametra atšķirību starp grupām.

Statistikas paketēs pēc pētnieka ieskatiem jūs varat patstāvīgi sašaurināt vai paplašināt ticamības intervāla robežas. Samazinot ticamības intervāla varbūtības, mēs sašaurinām vidējo diapazonu. Piemēram, pie 90 % TI vidējo diapazons (vai vidējo atšķirības) būs šaurāks nekā pie 95 %.

Un otrādi, palielinot varbūtību līdz 99 %, vērtību diapazons tiek paplašināts. Salīdzinot grupas, CI apakšējā robeža var šķērsot nulles atzīmi. Piemēram, ja mēs paplašinājām ticamības intervāla robežas līdz 99 %, tad intervāla robežas bija no –1 līdz 16 g/l. Tas nozīmē, ka vispārējā populācijā ir grupas, kuru vidējo starpība pētāmajam raksturlielumam ir vienāda ar 0 (M = 0).

Izmantojot ticamības intervālu, varat pārbaudīt statistiskās hipotēzes. Ja ticamības intervāls šķērso nulles vērtību, tad nulles hipotēze, kas pieņem, ka grupas neatšķiras pēc pētāmā parametra, ir patiesa. Piemērs ir aprakstīts iepriekš, kur mēs paplašinājām robežas līdz 99 %. Kaut kur vispārējā populācijā mēs atradām grupas, kas nekādā veidā neatšķīrās.

95% hemoglobīna atšķirības ticamības intervāls, (g/l)


Attēlā parādīts 95% ticamības intervāls vidējo hemoglobīna vērtību starpībai starp abām grupām. Līnija iet cauri nulles atzīmei, tāpēc starp nulles vidējiem rādītājiem ir atšķirība, kas apstiprina nulles hipotēzi, ka grupas neatšķiras. Atšķirību diapazons starp grupām ir no –2 līdz 5 g/l. Tas nozīmē, ka hemoglobīns var samazināties par 2 g/l vai palielināties par 5 g/l.

Pārliecības intervāls ir ļoti svarīgs rādītājs. Pateicoties tam, jūs varat redzēt, vai atšķirības grupās patiešām radās vidējo atšķirību vai lielas izlases dēļ, jo ar lielu izlasi atšķirības ir lielākas nekā ar mazu.

Praksē tas varētu izskatīties šādi. Mēs paņēmām 1000 cilvēku paraugu, izmērījām hemoglobīna līmeni un konstatējām, ka ticamības intervāls vidējo atšķirību diapazonā ir no 1,2 līdz 1,5 g/l. Statistiskās nozīmīguma līmenis šajā gadījumā p

Mēs redzam, ka hemoglobīna koncentrācija ir palielinājusies, bet gandrīz nemanāmi, tāpēc statistiskā nozīme parādījās tieši izlases lieluma dēļ.

Pārliecības intervālus var aprēķināt ne tikai līdzekļiem, bet arī proporcijām (un riska koeficientiem). Piemēram, mūs interesē to pacientu īpatsvara ticamības intervāls, kuri sasniedza remisiju, lietojot izstrādātas zāles. Pieņemsim, ka 95 % TI proporcijām, t.i., šādu pacientu īpatsvaram, ir robežās no 0,60 līdz 0,80. Tādējādi mēs varam teikt, ka mūsu medicīnā ir terapeitiskais efekts no 60 līdz 80 % gadījumu.

Pieņemsim, ka mums ir liels skaits preču ar normālu dažu īpašību sadalījumu (piemēram, pilna viena veida dārzeņu noliktava, kuras izmērs un svars atšķiras). Jūs vēlaties uzzināt visas preču partijas vidējās īpašības, bet jums nav ne laika, ne vēlēšanās izmērīt un nosvērt katru dārzeņu. Jūs saprotat, ka tas nav nepieciešams. Bet cik gabalu būtu jāņem uz vietas pārbaudei?

Pirms sniegt vairākas šajā situācijā noderīgas formulas, atcerēsimies dažus apzīmējumus.

Pirmkārt, ja mēs izmērītu visu dārzeņu noliktavu (šo elementu kopu sauc par vispārējo populāciju), tad mēs ar visu mums pieejamo precizitāti zinātu visas partijas vidējo svaru. Sauksim šo par vidējo X vid .g lv . - vispārējais vidējais. Mēs jau zinām, kas ir pilnībā noteikts, ja ir zināma tā vidējā vērtība un novirze s . Tiesa, kamēr neesam ne X vidējais gen., ne s Mēs nezinām kopējo iedzīvotāju skaitu. Mēs varam ņemt tikai noteiktu paraugu, izmērīt mums vajadzīgās vērtības un aprēķināt šim paraugam gan vidējo vērtību X vid., gan standarta novirzi S atlasīt.

Ir zināms, ka, ja mūsu izlases pārbaudē ir liels skaits elementu (parasti n ir lielāks par 30), un tie tiek ņemti tiešām nejauši, tad s vispārējā populācija gandrīz neatšķirsies no S izlases..

Turklāt normālā sadalījuma gadījumā mēs varam izmantot šādas formulas:

ar 95% varbūtību


ar 99% varbūtību



IN vispārējs skats ar varbūtību P (t)


Sakarību starp t vērtību un varbūtības vērtību P (t), ar kuru mēs vēlamies uzzināt ticamības intervālu, var iegūt no šādas tabulas:


Tādējādi esam noteikuši, kurā diapazonā atrodas populācijas vidējā vērtība (ar noteiktu varbūtību).

Ja vien mums nav pietiekami lielas izlases, mēs to nevaram teikt populācija ir s = S izvēlieties Turklāt šajā gadījumā parauga tuvums normālajam sadalījumam ir problemātisks. Šajā gadījumā mēs izmantojam arī S select s formulā:




bet t vērtība fiksētai varbūtībai P(t) būs atkarīga no elementu skaita izlasē n. Jo lielāks n, jo tuvāk iegūtais ticamības intervāls būs vērtībai, kas norādīta ar formulu (1). T vērtības šajā gadījumā ir ņemtas no citas tabulas (Studenta t-tests), kuru mēs piedāvājam zemāk:

Studenta t-testa vērtības varbūtībai 0,95 un 0,99


3. piemērs. No uzņēmuma darbiniekiem nejauši tika atlasīti 30 cilvēki. Saskaņā ar paraugu, izrādījās, ka vidējā alga (mēnesī) ir 30 tūkstoši rubļu ar standarta novirzi 5 tūkstoši rubļu. Nosakiet vidējo algu uzņēmumā ar varbūtību 0,99.

Risinājums: Pēc nosacījuma mums ir n = 30, X vid. =30000, S=5000, P = 0,99. Lai atrastu ticamības intervālu, izmantosim Stjudenta t testam atbilstošu formulu. No tabulas n = 30 un P = 0,99 mēs atrodam t = 2,756, tāpēc


tie. pieprasītais pilnvarnieks intervāls 27484< Х ср.ген < 32516.

Tātad ar varbūtību 0,99 varam teikt, ka intervāls (27484; 32516) sevī ietver vidējo algu uzņēmumā.

Mēs ceram, ka izmantosit šo metodi, un nav nepieciešams, lai katru reizi būtu līdzi galds. Aprēķinus var veikt automātiski programmā Excel. Atrodoties Excel failā, augšējā izvēlnē noklikšķiniet uz pogas fx. Pēc tam starp funkcijām atlasiet “statistisko” veidu un no piedāvātā saraksta logā - STUDAR DISCOVER. Pēc tam uzvednē, novietojot kursoru laukā “varbūtība”, ievadiet apgrieztās varbūtības vērtību (t.i., mūsu gadījumā varbūtības 0,95 vietā jāievada varbūtība 0,05). Acīmredzot izklājlapa ir sastādīts tā, lai rezultāts atbildētu uz jautājumu, ar kādu varbūtību mēs varam kļūdīties. Līdzīgi laukā Brīvības pakāpe ievadiet sava parauga vērtību (n-1).



Jaunums vietnē

>

Populārākais