Bahay Stomatitis Ang pagitan ng kumpiyansa ay katumbas ng. Agwat ng kumpiyansa

Ang pagitan ng kumpiyansa ay katumbas ng. Agwat ng kumpiyansa

Mayroong dalawang uri ng mga pagtatantya sa mga istatistika: punto at pagitan. Pagtatantya ng punto kumakatawan sa isang hiwalay na sample na istatistika na ginagamit upang tantyahin ang isang parameter populasyon. Halimbawa, ang ibig sabihin ng sample ay isang pagtatantya ng punto inaasahan sa matematika populasyon, at pagkakaiba-iba ng sample S 2- punto ng pagtatantya ng pagkakaiba-iba ng populasyon σ 2. ipinakita na ang sample mean ay isang walang pinapanigan na pagtatantya ng matematikal na inaasahan ng populasyon. Ang isang sample mean ay tinatawag na walang kinikilingan dahil ang average ng lahat ng sample ay nangangahulugan (na may parehong laki ng sample) n) ay katumbas ng mathematical na inaasahan ng pangkalahatang populasyon.

Upang ang sample na pagkakaiba-iba S 2 naging walang pinapanigan na pagtatantya ng pagkakaiba-iba ng populasyon σ 2, ang denominator ng sample na variance ay dapat itakda na katumbas ng n – 1 , ngunit hindi n. Sa madaling salita, ang pagkakaiba-iba ng populasyon ay ang average ng lahat ng posibleng pagkakaiba-iba ng sample.

Kapag tinatantya ang mga parameter ng populasyon, dapat tandaan na ang mga sample na istatistika tulad ng , depende sa mga partikular na sample. Upang isaalang-alang ang katotohanang ito, upang makuha pagtatantya ng pagitan pag-asa sa matematika ng pangkalahatang populasyon, pag-aralan ang pamamahagi ng mga sample na paraan (para sa higit pang mga detalye, tingnan). Ang itinayong agwat ay nailalarawan sa pamamagitan ng isang tiyak na antas ng kumpiyansa, na kumakatawan sa posibilidad na ang tunay na parameter ng populasyon ay natantiya nang tama. Maaaring gamitin ang mga katulad na agwat ng kumpiyansa upang tantiyahin ang proporsyon ng isang katangian R at ang pangunahing ibinahagi na masa ng populasyon.

I-download ang tala sa o format, mga halimbawa sa format

Pagbubuo ng agwat ng kumpiyansa para sa mathematical na inaasahan ng populasyon na may kilalang standard deviation

Pagbuo ng agwat ng kumpiyansa para sa bahagi ng isang katangian sa populasyon

Pinapalawak ng seksyong ito ang konsepto ng agwat ng kumpiyansa sa pangkategoryang data. Ito ay nagpapahintulot sa amin na matantya ang bahagi ng katangian sa populasyon R gamit ang sample share RS= X/n. Tulad ng ipinahiwatig, kung ang mga dami nR At n(1 – p) lumampas sa numero 5, ang binomial distribution ay maaaring tantiyahin bilang normal. Samakatuwid, upang tantiyahin ang bahagi ng isang katangian sa populasyon R posible na bumuo ng isang pagitan na ang antas ng kumpiyansa ay katumbas ng (1 – α)х100%.


saan pS- sample na proporsyon ng katangian na katumbas ng X/n, ibig sabihin. bilang ng mga tagumpay na hinati sa laki ng sample, R- ang bahagi ng katangian sa pangkalahatang populasyon, Z- kritikal na halaga ng standardized normal na pamamahagi, n- laki ng sample.

Halimbawa 3. Ipagpalagay natin na isang sample na binubuo ng 100 invoice na napunan noong noong nakaraang buwan. Sabihin nating 10 sa mga invoice na ito ay pinagsama-sama ng mga error. kaya, R= 10/100 = 0.1. Ang 95% na antas ng kumpiyansa ay tumutugma sa kritikal na halaga Z = 1.96.

Kaya, ang posibilidad na sa pagitan ng 4.12% at 15.88% ng mga invoice ay naglalaman ng mga error ay 95%.

Para sa isang ibinigay na laki ng sample, ang agwat ng kumpiyansa na naglalaman ng proporsyon ng katangian sa populasyon ay lumilitaw na mas malawak kaysa sa isang tuluy-tuloy na random variable. Ito ay dahil ang mga pagsukat ng isang tuluy-tuloy na random na variable ay naglalaman ng higit pang impormasyon kaysa sa mga sukat ng pangkategoryang data. Sa madaling salita, ang mga kategoryang data na kumukuha lamang ng dalawang halaga ay naglalaman ng hindi sapat na impormasyon upang matantya ang mga parameter ng kanilang pamamahagi.

SApagkalkula ng mga pagtatantya na nakuha mula sa isang may hangganang populasyon

Pagtatantya ng inaasahan sa matematika. Salik ng pagwawasto para sa panghuling populasyon ( fpc) ay ginamit upang bawasan ang karaniwang error sa pamamagitan ng isang kadahilanan. Kapag kinakalkula ang mga agwat ng kumpiyansa para sa mga pagtatantya ng parameter ng populasyon, isang salik sa pagwawasto ay inilalapat sa mga sitwasyon kung saan ang mga sample ay kinukuha nang hindi ibinabalik. Kaya, isang agwat ng kumpiyansa para sa inaasahan sa matematika na may antas ng kumpiyansa na katumbas ng (1 – α)х100%, ay kinakalkula ng formula:

Halimbawa 4. Upang ilarawan ang paggamit ng correction factor para sa isang limitadong populasyon, bumalik tayo sa problema ng pagkalkula ng confidence interval para sa average na halaga ng mga invoice, na tinalakay sa itaas sa Halimbawa 3. Ipagpalagay na ang isang kumpanya ay nag-isyu ng 5,000 invoice bawat buwan, at Xᅳ=110.27 dolyar, S= $28.95, N = 5000, n = 100, α = 0.05, t 99 = 1.9842. Gamit ang formula (6) makuha natin:

Pagtatantya ng bahagi ng isang tampok. Kapag pumipili nang walang pagbabalik, ang agwat ng kumpiyansa para sa proporsyon ng katangian na may antas ng kumpiyansa na katumbas ng (1 – α)х100%, ay kinakalkula ng formula:

Mga Pagitan ng Kumpiyansa at Mga Isyu sa Etikal

Kapag nagsa-sample ng isang populasyon at gumuhit ng mga istatistikal na konklusyon, madalas na lumilitaw ang mga isyu sa etika. Ang pangunahing isa ay kung paano nagkakasundo ang mga agwat ng kumpiyansa at mga pagtatantya ng punto ng mga sample na istatistika. Ang mga pagtatantya ng punto ng pag-publish nang hindi tinukoy ang nauugnay na mga pagitan ng kumpiyansa (karaniwan ay nasa 95% na antas ng kumpiyansa) at ang laki ng sample kung saan nagmula ang mga ito ay maaaring lumikha ng kalituhan. Maaari itong magbigay ng impresyon sa user na ang pagtatantya ng punto ay eksaktong kailangan niya upang mahulaan ang mga katangian ng buong populasyon. Kaya, kinakailangang maunawaan na sa anumang pananaliksik ang pagtutuon ay hindi dapat sa mga pagtatantya ng punto, ngunit sa mga pagtatantya ng pagitan. Bukod sa, Espesyal na atensyon dapat ibigay Ang tamang desisyon mga sukat ng sample.

Kadalasan, ang mga bagay ng istatistikal na pagmamanipula ay ang mga resulta ng mga sociological survey ng populasyon sa ilang mga isyung pampulitika. Sa kasong ito, ang mga resulta ng survey ay nai-publish sa mga front page ng mga pahayagan, at ang error sample survey at ang pamamaraan para sa pagsusuri sa istatistika ay nakalimbag sa isang lugar sa gitna. Upang patunayan ang bisa ng nakuha na mga pagtatantya ng punto, kinakailangang ipahiwatig ang laki ng sample batay sa kung saan nakuha ang mga ito, ang mga hangganan ng agwat ng kumpiyansa at ang antas ng kahalagahan nito.

Susunod na tala

Mga materyales mula sa aklat na Levin et al. Ginagamit ang Statistics for Managers. – M.: Williams, 2004. – p. 448–462

Central limit theorem nagsasaad na may sapat na malaking sample size, ang sample distribution ng mga paraan ay maaaring tantiyahin sa pamamagitan ng normal na distribution. Ang ari-arian na ito ay hindi nakadepende sa uri ng pamamahagi ng populasyon.

Sa mga nakaraang subsection ay isinasaalang-alang namin ang isyu ng pagtantya ng hindi kilalang parameter A isang numero. Ito ay tinatawag na "punto" na pagtatantya. Sa isang bilang ng mga gawain, hindi mo lamang kailangang hanapin ang parameter A angkop na halaga ng numero, ngunit din upang suriin ang katumpakan at pagiging maaasahan nito. Kailangan mong malaman kung anong mga error ang maaaring humantong sa pagpapalit ng isang parameter A punto pagtatantya nito A at anong antas ng kumpiyansa ang maaari nating asahan na ang mga pagkakamaling ito ay hindi lalampas sa mga kilalang limitasyon?

Ang mga problema ng ganitong uri ay partikular na may kaugnayan sa isang maliit na bilang ng mga obserbasyon, kapag ang pagtatantya ng punto at sa ay higit sa lahat ay random at tinatayang pagpapalit ng isang sa pamamagitan ng isang maaaring humantong sa mga malubhang error.

Upang magbigay ng ideya ng katumpakan at pagiging maaasahan ng pagtatantya A,

V mga istatistika ng matematika Gumagamit sila ng tinatawag na confidence interval at confidence probabilities.

Hayaan para sa parameter A walang pinapanigan na pagtatantya na nakuha mula sa karanasan A. Gusto naming tantyahin ang posibleng error sa kasong ito. Magtalaga tayo ng ilang sapat na malaking probabilidad p (halimbawa, p = 0.9, 0.95 o 0.99) upang ang isang kaganapan na may probabilidad na p ay maituturing na praktikal na maaasahan, at makahanap ng isang halaga kung saan

Pagkatapos ang saklaw ng halos posibleng mga halaga ng error na nagmumula sa panahon ng pagpapalit A sa A, ay magiging ± s; Ang malalaking error sa absolute value ay lilitaw lamang na may mababang posibilidad a = 1 - p. Isulat muli natin ang (14.3.1) bilang:

Ang pagkakapantay-pantay (14.3.2) ay nangangahulugan na may posibilidad na p hindi kilalang halaga parameter A nahuhulog sa loob ng pagitan

Kinakailangang tandaan ang isang pangyayari. Noong nakaraan, paulit-ulit naming isinasaalang-alang ang posibilidad ng isang random na variable na nahuhulog sa isang ibinigay na hindi random na pagitan. Dito iba ang sitwasyon: ang laki A ay hindi random, ngunit ang interval / p ay random. Ang posisyon nito sa x-axis ay random, na tinutukoy ng sentro nito A; Sa pangkalahatan, ang haba ng interval 2s ay random din, dahil ang halaga ng s ay kinakalkula, bilang panuntunan, mula sa pang-eksperimentong data. Samakatuwid sa sa kasong ito mas mainam na bigyang-kahulugan ang p value hindi bilang ang posibilidad ng "pagtama" ng isang punto A sa pagitan / p, at bilang ang posibilidad na ang isang random na pagitan / p ay sumasakop sa punto A(Larawan 14.3.1).

kanin. 14.3.1

Ang probabilidad p ay karaniwang tinatawag posibilidad ng kumpiyansa, at pagitan / p - agwat ng kumpiyansa. Mga hangganan ng pagitan Kung. a x = a- s at a 2 = a + at tinatawag mga hangganan ng tiwala.

Bigyan natin ng isa pang interpretasyon ang konsepto ng isang agwat ng kumpiyansa: maaari itong ituring bilang isang pagitan ng mga halaga ng parameter A, tugma sa pang-eksperimentong data at hindi sumasalungat sa mga ito. Sa katunayan, kung sumasang-ayon kaming isaalang-alang ang isang kaganapan na may posibilidad na a = 1-p na halos imposible, kung gayon ang mga halaga ng parameter a kung saan a - a> s ay dapat kilalanin bilang sumasalungat sa pang-eksperimentong data, at ang mga kung saan |a - A a t na 2 .

Hayaan para sa parameter A mayroong walang kinikilingan na pagtatantya A. Kung alam natin ang batas ng distribusyon ng dami A, ang gawain ng paghahanap ng agwat ng kumpiyansa ay magiging napakasimple: sapat na upang makahanap ng isang halaga kung saan

Ang kahirapan ay ang batas ng pamamahagi ng mga pagtatantya A depende sa batas ng pamamahagi ng dami X at, samakatuwid, sa hindi kilalang mga parameter nito (sa partikular, sa parameter mismo A).

Upang malampasan ang kahirapan na ito, maaari mong gamitin ang sumusunod na humigit-kumulang tinatayang pamamaraan: palitan ang hindi kilalang mga parameter sa expression para sa s ng kanilang mga pagtatantya ng punto. Sa medyo malaking bilang ng mga eksperimento P(mga 20...30) ang pamamaraang ito ay karaniwang nagbibigay ng mga resulta na kasiya-siya sa mga tuntunin ng katumpakan.

Bilang halimbawa, isaalang-alang ang problema ng isang agwat ng kumpiyansa para sa inaasahan sa matematika.

Hayaan itong mabuo P X, na ang mga katangian ay ang matematikal na inaasahan T at pagkakaiba-iba D- hindi kilala. Ang mga sumusunod na pagtatantya ay nakuha para sa mga parameter na ito:

Ito ay kinakailangan upang bumuo ng isang confidence interval / p naaayon posibilidad ng kumpiyansa p, para sa pag-asa sa matematika T dami X.

Kapag nilutas ang problemang ito, gagamitin namin ang katotohanan na ang dami T kumakatawan sa kabuuan P independiyenteng magkaparehong ipinamahagi na mga random na variable X h at ayon sa central limit theorem, para sa isang sapat na malaki P ang batas ng pamamahagi nito ay malapit sa normal. Sa pagsasagawa, kahit na may medyo maliit na bilang ng mga termino (mga 10...20), ang batas sa pamamahagi ng kabuuan ay maaaring ituring na normal. Ipagpalagay namin na ang halaga T ipinamahagi ayon sa normal na batas. Ang mga katangian ng batas na ito - mathematical expectation at variance - ay pantay, ayon sa pagkakabanggit T At

(tingnan ang kabanata 13 subsection 13.3). Ipagpalagay natin na ang halaga D alam natin at makakahanap tayo ng halagang Ep kung saan

Gamit ang formula (6.3.5) ng Kabanata 6, ipinapahayag namin ang probabilidad sa kaliwang bahagi ng (14.3.5) sa pamamagitan ng normal na distribution function

nasaan ang standard deviation ng estimate T.

Mula sa Eq.

hanapin ang halaga ng Sp:

kung saan ang arg Ф* (х) ay ang inverse function ng Ф* (X), mga. ang halaga ng argumento kung saan normal na paggana ang pamamahagi ay katumbas ng X.

Pagpapakalat D, kung saan ipinapahayag ang dami A 1P, hindi natin alam nang eksakto; bilang tinatayang halaga nito, maaari mong gamitin ang pagtatantya D(14.3.4) at maglagay ng humigit-kumulang:

Kaya, ang problema sa pagbuo ng isang agwat ng kumpiyansa ay tinatayang nalutas, na katumbas ng:

kung saan ang gp ay tinutukoy ng formula (14.3.7).

Upang maiwasan ang reverse interpolation sa mga talahanayan ng function na Ф* (l) kapag kinakalkula ang s p, maginhawang mag-compile ng isang espesyal na talahanayan (Talahanayan 14.3.1), na nagbibigay ng mga halaga ng dami

depende sa r. Tinutukoy ng halaga (p para sa normal na batas ang bilang ng mga karaniwang paglihis na dapat i-plot sa kanan at kaliwa mula sa gitna ng dispersion upang ang posibilidad na makapasok sa resultang lugar ay katumbas ng p.

Gamit ang value na 7 p, ang confidence interval ay ipinahayag bilang:

Talahanayan 14.3.1

Halimbawa 1. 20 eksperimento ang isinagawa sa dami X; ang mga resulta ay ipinapakita sa talahanayan. 14.3.2.

Talahanayan 14.3.2

Kinakailangang maghanap ng pagtatantya mula sa para sa mathematical na inaasahan ng dami X at bumuo ng agwat ng kumpiyansa na tumutugma sa probabilidad ng kumpiyansa p = 0.8.

Solusyon. Meron kami:

Ang pagpili sa l: = 10 bilang reference point, gamit ang ikatlong formula (14.2.14) makikita natin ang walang pinapanigan na pagtatantya D :

Ayon sa talahanayan 14.3.1 nahanap namin

Mga limitasyon ng kumpiyansa:

Agwat ng kumpiyansa:

Mga halaga ng parameter T, nakahiga sa pagitan na ito ay tugma sa pang-eksperimentong data na ibinigay sa talahanayan. 14.3.2.

Ang isang agwat ng kumpiyansa para sa pagkakaiba ay maaaring mabuo sa katulad na paraan.

Hayaan itong mabuo P mga independiyenteng eksperimento sa isang random na variable X na may hindi kilalang mga parameter para sa parehong A at pagpapakalat D isang walang pinapanigan na pagtatantya ang nakuha:

Kinakailangan na humigit-kumulang na bumuo ng isang agwat ng kumpiyansa para sa pagkakaiba.

Mula sa formula (14.3.11) malinaw na ang dami D kumakatawan

halaga P mga random na variable ng form. Ang mga halagang ito ay hindi

independyente, dahil ang alinman sa mga ito ay kasama ang dami T, umaasa sa iba. Gayunpaman, maaari itong ipakita na sa pagtaas P ang batas ng pamamahagi ng kanilang kabuuan ay lumalapit din sa normal. Halos sa P= 20...30 maaari na itong ituring na normal.

Ipagpalagay natin na ito ay totoo, at hanapin natin ang mga katangian ng batas na ito: pag-asa sa matematika at pagpapakalat. Mula noong pagtatasa D- walang kinikilingan, kung gayon M[D] = D.

Pagkalkula ng pagkakaiba-iba DD ay nauugnay sa medyo kumplikadong mga kalkulasyon, kaya ipinakita namin ang expression nito nang walang derivation:

kung saan ang q 4 ay ang ikaapat gitnang punto dami X.

Upang magamit ang expression na ito, kailangan mong palitan ang mga halaga \u003d 4 at D(kahit malapit lang). sa halip na D maaari mong gamitin ang kanyang pagtatasa D. Sa prinsipyo, ang ikaapat na gitnang sandali ay maaari ding mapalitan ng isang pagtatantya, halimbawa, isang halaga ng form:

ngunit ang gayong kapalit ay magbibigay ng napakababang katumpakan, dahil sa pangkalahatan, na may limitadong bilang ng mga eksperimento, ang mga sandali mataas na pagkakasunud-sunod tinutukoy mula sa malalaking pagkakamali. Gayunpaman, sa pagsasanay ito ay madalas na nangyayari na ang uri ng dami ng pamamahagi ng batas X kilala nang maaga: ang mga parameter lamang nito ay hindi alam. Pagkatapos ay maaari mong subukang ipahayag ang μ 4 hanggang D.

Kunin natin ang pinakakaraniwang kaso, kapag ang halaga X ipinamahagi ayon sa normal na batas. Pagkatapos ang ikaapat na sentral na sandali nito ay ipinahayag sa mga tuntunin ng pagpapakalat (tingnan ang Kabanata 6, subsection 6.2);

at formula (14.3.12) ay nagbibigay o

Pinapalitan ang hindi alam sa (14.3.14) D kanyang pagtatasa D, nakukuha natin: mula saan

Ang sandali μ 4 ay maaaring ipahayag sa pamamagitan ng D din sa ilang iba pang mga kaso, kapag ang pamamahagi ng halaga X ay hindi normal, ngunit ang hitsura nito ay kilala. Halimbawa, para sa batas pare-parehong density(tingnan ang kabanata 5) mayroon tayo:

kung saan ang (a, P) ay ang pagitan kung saan tinukoy ang batas.

Kaya naman,

Gamit ang formula (14.3.12) makuha namin: kung saan namin mahahanap ang humigit-kumulang

Sa mga kaso kung saan hindi alam ang uri ng batas sa pamamahagi para sa dami 26, kapag gumagawa ng tinatayang pagtatantya ng halaga a/) inirerekomenda pa rin na gumamit ng formula (14.3.16), maliban kung may mga espesyal na dahilan para maniwala na ang batas na ito ay ibang-iba sa normal (may kapansin-pansing positibo o negatibong kurtosis) .

Kung ang tinatayang halaga a/) ay nakuha sa isang paraan o iba pa, maaari tayong bumuo ng isang agwat ng kumpiyansa para sa pagkakaiba sa parehong paraan tulad ng ginawa natin para sa inaasahan sa matematika:

kung saan ang halaga depende sa ibinigay na probabilidad p ay matatagpuan ayon sa talahanayan. 14.3.1.

Halimbawa 2. Maghanap ng humigit-kumulang 80% confidence interval para sa pagkakaiba ng isang random variable X sa ilalim ng mga kondisyon ng halimbawa 1, kung ito ay kilala na ang halaga X ipinamahagi ayon sa isang batas na malapit sa normal.

Solusyon. Ang halaga ay nananatiling pareho sa talahanayan. 14.3.1:

Ayon sa formula (14.3.16)

Gamit ang formula (14.3.18) nakita namin ang agwat ng kumpiyansa:

Kaukulang pagitan ng mga average na halaga parisukat na paglihis: (0,21; 0,29).

14.4. Mga eksaktong pamamaraan para sa pagbuo ng mga pagitan ng kumpiyansa para sa mga parameter ng isang random na variable na ibinahagi ayon sa isang normal na batas

Sa nakaraang subsection, sinuri namin ang humigit-kumulang tinatayang mga pamamaraan para sa pagbuo ng mga agwat ng kumpiyansa para sa inaasahan at pagkakaiba-iba ng matematika. Dito ay magbibigay kami ng ideya ng eksaktong mga pamamaraan upang malutas ang parehong problema. Binibigyang-diin namin na upang tumpak na makahanap ng mga agwat ng kumpiyansa ito ay ganap na kinakailangan upang malaman nang maaga ang anyo ng batas ng pamamahagi ng dami X, samantalang para sa aplikasyon ng mga tinatayang pamamaraan na ito ay hindi kinakailangan.

Idea tumpak na pamamaraan ang pagbuo ng mga pagitan ng kumpiyansa ay bumaba sa mga sumusunod. Ang anumang agwat ng kumpiyansa ay matatagpuan mula sa isang kundisyong nagpapahayag ng posibilidad na matupad ang ilang partikular na hindi pagkakapantay-pantay, na kinabibilangan ng pagtatantya na interesado kami A. Batas ng pamamahagi ng pagpapahalaga A V pangkalahatang kaso depende sa hindi kilalang mga parameter ng dami X. Gayunpaman, kung minsan posible na ipasa ang mga hindi pagkakapantay-pantay mula sa isang random na variable A sa ilang iba pang function ng mga naobserbahang halaga X p X 2, ..., X p. ang batas ng pamamahagi kung saan ay hindi nakasalalay sa hindi kilalang mga parameter, ngunit nakasalalay lamang sa bilang ng mga eksperimento at sa uri ng batas ng pamamahagi ng dami X. Ang mga uri ng mga random na variable ay gumaganap ng isang mahalagang papel sa mga istatistika ng matematika; ang mga ito ay pinag-aralan nang mas detalyado para sa kaso ng isang normal na distribusyon ng dami X.

Halimbawa, napatunayan na sa isang normal na pamamahagi ng halaga X random na halaga

sumusunod sa tinatawag na Batas sa pamamahagi ng mag-aaral Sa P- 1 antas ng kalayaan; ang densidad ng batas na ito ay may anyo

kung saan ang G(x) ay ang kilalang gamma function:

Napatunayan din na ang random variable

ay may "%2 distribution" na may P- 1 degree ng kalayaan (tingnan ang Kabanata 7), ang density nito ay ipinahayag ng formula

Nang hindi isinasaalang-alang ang mga derivasyon ng mga distribusyon (14.4.2) at (14.4.4), ipapakita namin kung paano mailalapat ang mga ito kapag gumagawa ng mga agwat ng kumpiyansa para sa mga parameter ty D.

Hayaan itong mabuo P mga independiyenteng eksperimento sa isang random na variable X, karaniwang ipinamamahagi na may hindi kilalang mga parameter T&O. Para sa mga parameter na ito, nakuha ang mga pagtatantya

Kinakailangang bumuo ng mga pagitan ng kumpiyansa para sa parehong mga parameter na tumutugma sa probabilidad ng kumpiyansa p.

Bumuo muna tayo ng confidence interval para sa mathematical expectation. Ito ay natural na gawin ang pagitan na ito simetriko patungkol sa T; sabihin s p tukuyin ang kalahati ng haba ng pagitan. Dapat piliin ang halaga s p upang ang kundisyon ay masiyahan

Subukan nating lumipat sa kaliwang bahagi ng pagkakapantay-pantay (14.4.5) mula sa random variable T sa isang random variable T, ipinamahagi ayon sa batas ng Mag-aaral. Upang gawin ito, i-multiply ang magkabilang panig ng hindi pagkakapantay-pantay |m-w?|

sa pamamagitan ng isang positibong halaga: o, gamit ang notasyon (14.4.1),

Maghanap tayo ng isang numero / p upang ang halaga / p ay matatagpuan mula sa kundisyon

Mula sa formula (14.4.2) malinaw na (1) - kahit function, kaya (14.4.8) ay nagbibigay

Ang pagkakapantay-pantay (14.4.9) ay tumutukoy sa halaga / p depende sa p. Kung mayroon kang isang talahanayan ng mga mahalagang halaga

pagkatapos ay ang halaga ng /p ay matatagpuan sa pamamagitan ng reverse interpolation sa talahanayan. Gayunpaman, mas maginhawang gumuhit ng isang talahanayan ng mga halaga ng /p nang maaga. Ang nasabing talahanayan ay ibinigay sa Appendix (Talahanayan 5). Ipinapakita ng talahanayang ito ang mga halaga depende sa antas ng kumpiyansa p at ang bilang ng mga antas ng kalayaan P- 1. Ang pagkakaroon ng natukoy / p mula sa talahanayan. 5 at ipagpalagay

makikita natin ang kalahati ng lapad ng agwat ng kumpiyansa / p at ang agwat mismo

Halimbawa 1. 5 independyenteng mga eksperimento ang isinagawa sa isang random na variable X, karaniwang ipinamamahagi na may hindi kilalang mga parameter T at tungkol sa. Ang mga resulta ng mga eksperimento ay ibinigay sa talahanayan. 14.4.1.

Talahanayan 14.4.1

Maghanap ng rating T para sa inaasahan sa matematika at bumuo ng 90% na agwat ng kumpiyansa / p para dito (ibig sabihin, ang agwat na tumutugma sa probabilidad ng kumpiyansa p = 0.9).

Solusyon. Meron kami:

Ayon sa talahanayan 5 ng aplikasyon para sa P - 1 = 4 at p = 0.9 nakita namin saan

Ang agwat ng kumpiyansa ay magiging

Halimbawa 2. Para sa mga kundisyon ng halimbawa 1 ng subsection 14.3, ipagpalagay ang halaga X karaniwang ipinamamahagi, hanapin ang eksaktong agwat ng kumpiyansa.

Solusyon. Ayon sa talahanayan 5 ng apendiks ay makikita natin kung kailan P - 1 = 19ir =

0.8 / p = 1.328; mula rito

Kung ikukumpara sa solusyon ng halimbawa 1 ng subsection 14.3 (e p = 0.072), kami ay kumbinsido na ang pagkakaiba ay napakaliit. Kung pananatilihin namin ang katumpakan hanggang sa pangalawang decimal place, ang mga agwat ng kumpiyansa na makikita ng eksakto at tinatayang mga pamamaraan ay magkakasabay:

Magpatuloy tayo sa pagbuo ng agwat ng kumpiyansa para sa pagkakaiba. Isaalang-alang ang walang pinapanigan na variance estimator

at ipahayag ang random variable D sa pamamagitan ng magnitude V(14.4.3), may distribusyon x 2 (14.4.4):

Pag-alam sa batas ng distribusyon ng dami V, mahahanap mo ang pagitan /(1) kung saan ito nahuhulog na may ibinigay na probabilidad p.

Batas ng pamamahagi kn_x(v) Ang magnitude I 7 ay may anyo na ipinapakita sa Fig. 14.4.1.

kanin. 14.4.1

Ang tanong ay arises: kung paano pumili ng pagitan / p? Kung ang batas ng distribusyon ng magnitude V ay simetriko (tulad ng normal na batas o distribusyon ng Mag-aaral), natural na kunin ang pagitan /p simetriko na may paggalang sa inaasahan sa matematika. Sa kasong ito ang batas k p_x (v) walang simetriko. Sumang-ayon tayo na piliin ang interval /p upang ang posibilidad ng pagiging value V lampas sa pagitan sa kanan at kaliwa (mga lugar na may kulay sa Fig. 14.4.1) ay pareho at pantay

Upang bumuo ng isang agwat / p sa property na ito, ginagamit namin ang talahanayan. 4 na aplikasyon: naglalaman ito ng mga numero y) ganyan

para sa halaga V, pagkakaroon ng x 2 -pamamahagi na may r antas ng kalayaan. Sa kaso natin r = n- 1. Ayusin natin r = n- 1 at hanapin sa kaukulang hilera ng talahanayan. 4 dalawang kahulugan x 2 - ang isa ay tumutugma sa posibilidad ang isa pa - probabilidad Let us decate these

mga halaga sa 2 At xl? Ang pagitan ay may y 2, sa iyong kaliwa, at y~ kanang dulo.

Ngayon hanapin natin mula sa pagitan / p ang nais na agwat ng kumpiyansa /|, para sa pagpapakalat na may mga hangganan D, at D2, na sumasaklaw sa punto D may posibilidad p:

Bumuo tayo ng pagitan / (, = (?> ь А) na sumasaklaw sa punto D kung at kung lamang ang halaga V nahuhulog sa pagitan /r. Ipakita natin na ang pagitan

natutugunan ang kundisyong ito. Sa katunayan, ang hindi pagkakapantay-pantay ay katumbas ng hindi pagkakapantay-pantay

at ang mga hindi pagkakapantay-pantay na ito ay nasiyahan sa probabilidad p. Kaya, ang pagitan ng kumpiyansa para sa pagkakaiba ay natagpuan at ipinahayag ng formula (14.4.13).

Halimbawa 3. Hanapin ang agwat ng kumpiyansa para sa pagkakaiba sa ilalim ng mga kondisyon ng halimbawa 2 ng subsection 14.3, kung alam na ang halaga X karaniwang ipinamamahagi.

Solusyon. Meron kami . Ayon sa talahanayan 4 ng apendiks

matatagpuan natin sa r = n - 1 = 19

Gamit ang formula (14.4.13) makikita natin ang confidence interval para sa variance

Ang kaukulang pagitan para sa karaniwang paglihis ay (0.21; 0.32). Ang agwat na ito ay bahagyang lumampas sa pagitan (0.21; 0.29) na nakuha sa halimbawa 2 ng subsection 14.3 gamit ang tinatayang pamamaraan.

  • Isinasaalang-alang ng Figure 14.3.1 ang isang simetriko na pagitan ng kumpiyansa tungkol sa a. Sa pangkalahatan, tulad ng makikita natin sa ibang pagkakataon, hindi ito kinakailangan.

Mga pagitan ng kumpiyansa.

Ang pagkalkula ng agwat ng kumpiyansa ay batay sa average na error ng kaukulang parameter. Agwat ng kumpiyansa nagpapakita sa loob ng kung anong mga limitasyon sa probabilidad (1-a) ang totoong halaga ng tinantyang parameter. Narito ang isang antas ng kabuluhan, (1-a) ay tinatawag ding posibilidad ng kumpiyansa.

Sa unang kabanata ipinakita namin na, halimbawa, para sa arithmetic mean, ang totoong populasyon na ibig sabihin sa humigit-kumulang 95% ng mga kaso ay nasa loob ng 2 karaniwang error ng mean. Kaya, ang mga hangganan ng 95% na agwat ng kumpiyansa para sa mean ay magiging dalawang beses na mas malayo sa sample mean. average na error average, i.e. pinaparami natin ang average na error ng mean sa isang tiyak na koepisyent depende sa antas ng kumpiyansa. Para sa average at pagkakaiba ng mga average, kukunin ang Student coefficient (kritikal na halaga ng pagsusulit ng Estudyante), para sa bahagi at pagkakaiba ng mga share, ang kritikal na halaga ng z criterion. Ang produkto ng koepisyent at ang average na error ay maaaring tawaging maximum na error ng isang ibinigay na parameter, i.e. ang maximum na maaari naming makuha kapag tinatasa ito.

Agwat ng kumpiyansa para sa ibig sabihin ng aritmetika : .

Narito ang sample mean;

Average na error ng arithmetic mean;

s – sample standard deviation;

n

f = n-1 (Koepisyent ng mag-aaral).

Agwat ng kumpiyansa para sa pagkakaiba ng arithmetic means :

Narito ang pagkakaiba sa pagitan ng sample na paraan;

- average na error ng pagkakaiba sa pagitan ng arithmetic means;

s 1 , s 2 – sample standard deviations;

n1,n2

Kritikal na halaga Pagsusulit ng mag-aaral para sa isang naibigay na antas ng kahalagahan a at bilang ng mga antas ng kalayaan f=n 1 +n 2-2 (Koepisyent ng mag-aaral).

Agwat ng kumpiyansa para sa pagbabahagi :

.

Narito ang d ay ang sample fraction;

– average na fraction error;

n– laki ng sample (laki ng pangkat);

Agwat ng kumpiyansa para sa pagkakaiba ng shares :

Narito ang pagkakaiba sa mga sample share;

– average na error ng pagkakaiba sa pagitan ng arithmetic means;

n1,n2– dami ng sample (bilang ng mga grupo);

Ang kritikal na halaga ng z criterion sa isang naibigay na antas ng kahalagahan a ( , , ).

Sa pamamagitan ng pagkalkula ng mga pagitan ng kumpiyansa para sa pagkakaiba sa pagitan ng mga tagapagpahiwatig, kami, una, direktang nakikita posibleng mga halaga epekto, at hindi lamang ito pagtatantya ng punto. Pangalawa, maaari tayong gumawa ng konklusyon tungkol sa pagtanggap o pagtanggi sa null hypothesis at, pangatlo, maaari tayong gumawa ng konklusyon tungkol sa kapangyarihan ng pagsubok.

Kapag sinusubukan ang mga hypotheses gamit ang mga agwat ng kumpiyansa, dapat mong sundin ang sumusunod na panuntunan:

Kung ang 100(1-a) porsyento na agwat ng kumpiyansa ng pagkakaiba sa paraan ay hindi naglalaman ng zero, kung gayon ang mga pagkakaiba ay makabuluhan ayon sa istatistika sa antas ng kahalagahan a; sa kabaligtaran, kung ang pagitan na ito ay naglalaman ng zero, kung gayon ang mga pagkakaiba ay hindi makabuluhan ayon sa istatistika.

Sa katunayan, kung ang agwat na ito ay naglalaman ng zero, nangangahulugan ito na ang tagapagpahiwatig na inihambing ay maaaring mas malaki o mas kaunti sa isa sa mga pangkat kumpara sa isa pa, i.e. ang naobserbahang pagkakaiba ay dahil sa pagkakataon.

Ang kapangyarihan ng pagsubok ay maaaring hatulan sa pamamagitan ng lokasyon ng zero sa loob ng agwat ng kumpiyansa. Kung ang zero ay malapit sa mas mababa o itaas na limitasyon agwat, pagkatapos ay marahil sa isang mas malaking bilang ng mga inihambing na grupo, ang mga pagkakaiba ay aabot istatistikal na kahalagahan. Kung ang zero ay malapit sa gitna ng agwat, nangangahulugan ito na ang parehong pagtaas at pagbaba sa tagapagpahiwatig sa pang-eksperimentong pangkat ay pantay na malamang, at, marahil, talagang walang mga pagkakaiba.

Mga halimbawa:

Upang ihambing ang surgical mortality kapag gumagamit ng dalawang magkaibang uri ng anesthesia: 61 tao ang inoperahan gamit ang unang uri ng anesthesia, 8 ang namatay, kasama ang pangalawang uri – 67 tao, 10 ang namatay.

d 1 = 8/61 = 0.131; d2 = 10/67 = 0.149; d1-d2 = - 0.018.

Ang pagkakaiba sa lethality ng mga inihambing na pamamaraan ay nasa hanay (-0.018 - 0.122; -0.018 + 0.122) o (-0.14; 0.104) na may posibilidad na 100(1-a) = 95%. Ang pagitan ay naglalaman ng zero, i.e. hypothesis tungkol sa parehong lethality sa dalawa iba't ibang uri Ang kawalan ng pakiramdam ay hindi maaaring tanggihan.

Kaya, ang dami ng namamatay ay maaari at bababa sa 14% at tataas sa 10.4% na may posibilidad na 95%, i.e. ang zero ay humigit-kumulang sa gitna ng agwat, kaya maaari itong maitalo na, malamang, ang dalawang pamamaraan na ito ay talagang hindi naiiba sa kabagsikan.

Sa halimbawang tinalakay kanina, ang average na oras ng pagpindot sa panahon ng tapping test ay inihambing sa apat na grupo ng mga mag-aaral na naiiba sa mga marka ng pagsusulit. Kalkulahin natin ang mga pagitan ng kumpiyansa para sa average na oras ng pagpindot para sa mga mag-aaral na nakapasa sa pagsusulit na may mga grado 2 at 5 at ang pagitan ng kumpiyansa para sa pagkakaiba sa pagitan ng mga average na ito.

Ang mga koepisyent ng mag-aaral ay matatagpuan gamit ang mga talahanayan ng pamamahagi ng Mag-aaral (tingnan ang apendiks): para sa unang pangkat: = t(0.05;48) = 2.011; para sa pangalawang pangkat: = t(0.05;61) = 2.000. Kaya, ang mga agwat ng kumpiyansa para sa unang pangkat: = (162.19-2.011*2.18; 162.19+2.011*2.18) = (157.8; 166.6), para sa pangalawang grupo (156.55- 2,000*1.88; 156.55 =*1.88; 156.55+1.88) ; 160.3). Kaya, para sa mga nakapasa sa pagsusulit na may 2, ang average na oras ng pagpindot ay mula 157.8 ms hanggang 166.6 ms na may posibilidad na 95%, para sa mga nakapasa sa pagsusulit na may 5 - mula 152.8 ms hanggang 160.3 ms na may posibilidad na 95% .

Maaari mo ring subukan ang null hypothesis gamit ang mga agwat ng kumpiyansa para sa mga paraan, at hindi lamang para sa pagkakaiba sa mga paraan. Halimbawa, tulad ng sa aming kaso, kung ang mga agwat ng kumpiyansa para sa mga paraan ay magkakapatong, kung gayon ang null hypothesis ay hindi maaaring tanggihan. Upang tanggihan ang isang hypothesis sa isang napiling antas ng kahalagahan, ang mga kaukulang agwat ng kumpiyansa ay hindi dapat mag-overlap.

Hanapin natin ang confidence interval para sa pagkakaiba sa average na oras ng pagpindot sa mga pangkat na nakapasa sa pagsusulit na may grade 2 at 5. Pagkakaiba ng mga average: 162.19 – 156.55 = 5.64. Koepisyent ng mag-aaral: = t(0.05;49+62-2) = t(0.05;109) = 1.982. Ang mga karaniwang paglihis ng pangkat ay magiging katumbas ng: ; . Kinakalkula namin ang average na error ng pagkakaiba sa pagitan ng mga paraan: . Agwat ng kumpiyansa: =(5.64-1.982*2.87; 5.64+1.982*2.87) = (-0.044; 11.33).

Kaya, ang pagkakaiba sa average na oras ng pagpindot sa mga pangkat na nakapasa sa pagsusulit na may 2 at 5 ay nasa hanay mula -0.044 ms hanggang 11.33 ms. Kasama sa agwat na ito ang zero, i.e. Ang average na oras ng pagpindot para sa mga nakapasa ng mabuti sa pagsusulit ay maaaring tumaas o bumaba kumpara sa mga nakapasa sa pagsusulit nang hindi kasiya-siya, i.e. hindi maaaring tanggihan ang null hypothesis. Ngunit ang zero ay napakalapit sa mas mababang limitasyon, at ang oras ng pagpindot ay mas malamang na bumaba para sa mga nakapasa nang maayos. Kaya, maaari nating tapusin na may mga pagkakaiba pa rin sa average na oras ng pagpindot sa pagitan ng mga pumasa sa 2 at 5, hindi lang natin sila matukoy dahil sa pagbabago sa average na oras, ang pagkalat ng average na oras at ang mga laki ng sample.



Ang kapangyarihan ng isang pagsubok ay ang posibilidad na tanggihan ang isang maling null hypothesis, i.e. maghanap ng mga pagkakaiba kung saan sila aktwal na umiiral.

Ang kapangyarihan ng pagsubok ay tinutukoy batay sa antas ng kahalagahan, ang laki ng mga pagkakaiba sa pagitan ng mga grupo, ang pagkalat ng mga halaga sa mga grupo at ang laki ng mga sample.

Para sa pagsusulit ng Mag-aaral at pagsusuri ng pagkakaiba-iba Maaari kang gumamit ng mga sensitivity diagram.

Ang kapangyarihan ng criterion ay maaaring gamitin upang paunang matukoy ang kinakailangang bilang ng mga grupo.

Ipinapakita ng agwat ng kumpiyansa kung aling mga limitasyon ang tunay na halaga ng tinantyang parameter ay nakasalalay sa isang ibinigay na posibilidad.

Gamit ang mga pagitan ng kumpiyansa, maaari mong subukan ang mga istatistikal na hypotheses at gumawa ng mga konklusyon tungkol sa pagiging sensitibo ng pamantayan.

PANITIKAN.

Glanz S. – Kabanata 6,7.

Rebrova O.Yu. – p.112-114, p.171-173, p.234-238.

Sidorenko E.V. – p.32-33.

Mga tanong para sa self-testing ng mga mag-aaral.

1. Ano ang kapangyarihan ng pamantayan?

2. Sa anong mga kaso kinakailangan na suriin ang kapangyarihan ng pamantayan?

3. Mga paraan para sa pagkalkula ng kapangyarihan.

6. Paano subukan ang isang statistical hypothesis gamit ang isang confidence interval?

7. Ano ang masasabi tungkol sa kapangyarihan ng criterion kapag kinakalkula ang agwat ng kumpiyansa?

Mga gawain.

Ipagpalagay na mayroon kaming isang malaking bilang ng mga item na may normal na pamamahagi ng ilang mga katangian (halimbawa, isang buong bodega ng mga gulay na may parehong uri, ang laki at bigat nito ay nag-iiba). Gusto mong malaman ang karaniwang mga katangian ng buong batch ng mga kalakal, ngunit wala kang oras o pagnanais na sukatin at timbangin ang bawat gulay. Naiintindihan mo na hindi ito kailangan. Ngunit ilang piraso ang kailangang kunin para sa isang spot check?

Bago magbigay ng ilang mga formula na kapaki-pakinabang para sa sitwasyong ito, alalahanin natin ang ilang notasyon.

Una, kung susukatin natin ang buong bodega ng mga gulay (ang hanay ng mga elementong ito ay tinatawag na pangkalahatang populasyon), malalaman natin sa lahat ng katumpakan na magagamit sa amin ang average na timbang ng buong batch. Tawagin natin itong average X avg .g en . - pangkalahatang average. Alam na natin kung ano ang ganap na natutukoy kung ang ibig sabihin ng halaga at paglihis nito ay kilala . Totoo, habang hindi kami X average na gen. o s Hindi natin alam ang pangkalahatang populasyon. Maaari lamang kaming kumuha ng isang partikular na sample, sukatin ang mga halaga na kailangan namin at kalkulahin para sa sample na ito pareho ang average na halaga ng X avg. at ang standard deviation na piliin ng S.

Ito ay kilala na kung ang aming sample check ay naglalaman ng isang malaking bilang ng mga elemento (karaniwan ay n ay mas malaki kaysa sa 30), at sila ay kinuha random talaga, pagkatapos ay s ang pangkalahatang populasyon ay halos hindi mag-iiba mula sa pagpili ng S ..

Bilang karagdagan, para sa kaso ng normal na pamamahagi maaari naming gamitin ang mga sumusunod na formula:

May posibilidad na 95%


May posibilidad na 99%



SA pangkalahatang pananaw may posibilidad na P (t)


Ang relasyon sa pagitan ng t value at probability value na P (t), kung saan gusto nating malaman ang confidence interval, ay maaaring kunin mula sa sumusunod na talahanayan:


Kaya, natukoy namin kung saang saklaw ang average na halaga para sa populasyon ay namamalagi (na may ibinigay na posibilidad).

Maliban kung mayroon tayong sapat na malaking sample, hindi natin masasabi na ang populasyon ay may s = S piliin Bilang karagdagan, sa kasong ito ang pagiging malapit ng sample sa normal na pamamahagi ay may problema. Sa kasong ito, ginagamit din namin ang S select sa halip s sa formula:




ngunit ang halaga ng t para sa isang nakapirming probabilidad na P(t) ay depende sa bilang ng mga elemento sa sample n. Kung mas malaki ang n, mas malapit ang magreresultang agwat ng kumpiyansa sa halagang ibinigay ng formula (1). Ang mga halaga ng t sa kasong ito ay kinuha mula sa isa pang talahanayan ( T-test ng mag-aaral), na ipinakita namin sa ibaba:

Ang mga halaga ng t-test ng mag-aaral para sa posibilidad na 0.95 at 0.99


Halimbawa 3. 30 katao ang random na pinili mula sa mga empleyado ng kumpanya. Ayon sa sample, lumabas na ang average na suweldo (bawat buwan) ay 30 libong rubles na may karaniwang paglihis ng 5 libong rubles. Tukuyin ang average na suweldo sa kumpanya na may posibilidad na 0.99.

Solusyon: Ayon sa kundisyon mayroon kaming n = 30, X avg. =30000, S=5000, P = 0.99. Upang mahanap ang agwat ng kumpiyansa, gagamitin namin ang formula na tumutugma sa t test ng Estudyante. Mula sa talahanayan para sa n = 30 at P = 0.99 nakita namin ang t = 2.756, samakatuwid,


mga. hinahanap na katiwala pagitan 27484< Х ср.ген < 32516.

Kaya, na may posibilidad na 0.99 maaari nating sabihin na ang pagitan (27484; 32516) ay naglalaman sa loob mismo ng average na suweldo sa kumpanya.

Inaasahan namin na gagamitin mo ang pamamaraang ito, at hindi kinakailangan na mayroon kang isang talahanayan sa bawat oras. Ang mga kalkulasyon ay maaaring awtomatikong isagawa sa Excel. Habang nasa Excel file, i-click ang fx button sa tuktok na menu. Pagkatapos, piliin ang uri ng "statistical" sa mga function, at mula sa iminungkahing listahan sa window - STUDAR DISCOVER. Pagkatapos, sa prompt, paglalagay ng cursor sa field na "probability", ipasok ang halaga ng inverse probability (i.e. sa aming kaso, sa halip na probabilidad na 0.95, kailangan mong i-type ang probabilidad na 0.05). Malamang spreadsheet ay pinagsama-sama sa paraan na ang resulta ay sumasagot sa tanong na may posibilidad na maaari tayong magkamali. Katulad nito, sa Degree of Freedom field, maglagay ng value (n-1) para sa iyong sample.

Agwat ng kumpiyansa para sa inaasahan sa matematika - ito ay isang agwat na kinakalkula mula sa data na, na may kilalang probabilidad, ay naglalaman ng mathematical na inaasahan ng pangkalahatang populasyon. Ang natural na pagtatantya para sa mathematical na inaasahan ay ang arithmetic mean ng mga naobserbahang halaga nito. Samakatuwid, sa buong aralin ay gagamitin natin ang mga katagang "average" at "average na halaga". Sa mga problema sa pagkalkula ng agwat ng kumpiyansa, ang isang sagot na kadalasang kinakailangan ay tulad ng "Ang agwat ng kumpiyansa ng average na numero [halaga sa isang partikular na problema] ay mula sa [mas maliit na halaga] hanggang sa [mas malaking halaga]." Gamit ang isang agwat ng kumpiyansa, maaari mong suriin hindi lamang ang mga average na halaga, kundi pati na rin ang proporsyon ng isang partikular na katangian ng pangkalahatang populasyon. Mga average, pagkakaiba-iba, karaniwang lihis at ang mga pagkakamali kung saan tayo makakarating sa mga bagong kahulugan at pormula ay tinalakay sa aralin Mga katangian ng sample at populasyon .

Mga pagtatantya ng punto at pagitan ng mean

Kung ang average na halaga ng populasyon ay tinatantya ng isang numero (punto), kung gayon ang isang tiyak na average, na kinakalkula mula sa isang sample ng mga obserbasyon, ay kinuha bilang isang pagtatantya ng hindi kilalang average na halaga ng populasyon. Sa kasong ito, ang halaga ng sample mean - isang random na variable - ay hindi tumutugma sa mean na halaga ng pangkalahatang populasyon. Samakatuwid, kapag ipinapahiwatig ang ibig sabihin ng sample, dapat mong sabay na ipahiwatig ang error sa sampling. Ang sukat ng error sa sampling ay ang karaniwang error, na ipinahayag sa parehong mga yunit bilang ang ibig sabihin. Samakatuwid, ang sumusunod na notasyon ay kadalasang ginagamit: .

Kung ang pagtatantya ng average ay kailangang maiugnay sa isang tiyak na posibilidad, kung gayon ang parameter ng interes sa populasyon ay dapat na tasahin hindi sa pamamagitan ng isang numero, ngunit sa pamamagitan ng isang pagitan. Ang agwat ng kumpiyansa ay isang agwat kung saan, na may tiyak na posibilidad P matatagpuan ang halaga ng tinantyang indicator ng populasyon. Ang pagitan ng kumpiyansa kung saan ito ay malamang P = 1 - α ang random na variable ay matatagpuan, kinakalkula tulad ng sumusunod:

,

α = 1 - P, na makikita sa apendiks sa halos anumang aklat sa mga istatistika.

Sa pagsasagawa, hindi alam ang ibig sabihin at pagkakaiba ng populasyon, kaya ang pagkakaiba ng populasyon ay pinapalitan ng sample na variance, at ang ibig sabihin ng populasyon ng sample mean. Kaya, ang agwat ng kumpiyansa sa karamihan ng mga kaso ay kinakalkula tulad ng sumusunod:

.

Ang formula ng confidence interval ay maaaring gamitin upang tantyahin ang ibig sabihin ng populasyon kung

  • ang karaniwang paglihis ng populasyon ay kilala;
  • o ang karaniwang paglihis ng populasyon ay hindi alam, ngunit ang laki ng sample ay higit sa 30.

Ang sample mean ay isang walang pinapanigan na pagtatantya ng average ng populasyon. Sa turn, ang sample variance ay hindi isang walang pinapanigan na pagtatantya ng pagkakaiba-iba ng populasyon. Upang makakuha ng walang pinapanigan na pagtatantya ng pagkakaiba-iba ng populasyon sa sample na formula ng pagkakaiba, laki ng sample n dapat palitan ng n-1.

Halimbawa 1. Ang impormasyon ay nakolekta mula sa 100 random na piniling mga cafe sa isang tiyak na lungsod na ang average na bilang ng mga empleyado sa kanila ay 10.5 na may karaniwang paglihis na 4.6. Tukuyin ang 95% confidence interval para sa bilang ng mga empleyado ng cafe.

nasaan ang kritikal na halaga ng karaniwang normal na distribusyon para sa antas ng kabuluhan α = 0,05 .

Kaya, ang 95% confidence interval para sa average na bilang ng mga empleyado ng cafe ay mula 9.6 hanggang 11.4.

Halimbawa 2. Para sa isang random na sample mula sa isang populasyon ng 64 na mga obserbasyon, ang mga sumusunod na kabuuang halaga ay kinakalkula:

kabuuan ng mga halaga sa mga obserbasyon,

kabuuan ng mga squared deviations ng mga halaga mula sa mean .

Kalkulahin ang 95% na agwat ng kumpiyansa para sa inaasahan sa matematika.

Kalkulahin natin ang karaniwang paglihis:

,

Kalkulahin natin ang average na halaga:

.

Pinapalitan namin ang mga halaga sa expression para sa agwat ng kumpiyansa:

nasaan ang kritikal na halaga ng karaniwang normal na distribusyon para sa antas ng kabuluhan α = 0,05 .

Nakukuha namin:

Kaya, ang 95% na agwat ng kumpiyansa para sa inaasahan ng matematika ng sample na ito ay mula 7.484 hanggang 11.266.

Halimbawa 3. Para sa random na sample ng populasyon ng 100 obserbasyon, ang kinakalkula na mean ay 15.2 at ang standard deviation ay 3.2. Kalkulahin ang 95% confidence interval para sa inaasahang halaga, pagkatapos ay ang 99% confidence interval. Kung ang sample power at ang variation nito ay mananatiling hindi nagbabago at ang confidence coefficient ay tumaas, magpapaliit ba o lalawak ang confidence interval?

Pinapalitan namin ang mga halagang ito sa expression para sa agwat ng kumpiyansa:

nasaan ang kritikal na halaga ng karaniwang normal na distribusyon para sa antas ng kabuluhan α = 0,05 .

Nakukuha namin:

.

Kaya, ang 95% na agwat ng kumpiyansa para sa mean ng sample na ito ay mula 14.57 hanggang 15.82.

Muli naming pinapalitan ang mga halagang ito sa expression para sa agwat ng kumpiyansa:

nasaan ang kritikal na halaga ng karaniwang normal na distribusyon para sa antas ng kabuluhan α = 0,01 .

Nakukuha namin:

.

Kaya, ang 99% na agwat ng kumpiyansa para sa mean ng sample na ito ay mula 14.37 hanggang 16.02.

Tulad ng nakikita natin, habang tumataas ang koepisyent ng kumpiyansa, tumataas din ang kritikal na halaga ng karaniwang normal na distribusyon, at, dahil dito, ang mga panimulang punto at pagtatapos ng pagitan ay matatagpuan sa malayo mula sa mean, at sa gayon ang agwat ng kumpiyansa para sa inaasahan sa matematika ay tumataas. .

Mga pagtatantya ng punto at pagitan ng tiyak na gravity

Ang bahagi ng ilang sample na katangian ay maaaring bigyang-kahulugan bilang pagtatantya ng punto tiyak na gravity p ng parehong katangian sa pangkalahatang populasyon. Kung ang value na ito ay kailangang iugnay sa probabilidad, dapat kalkulahin ang confidence interval ng specific gravity p katangian sa populasyon na may posibilidad P = 1 - α :

.

Halimbawa 4. Sa ilang lungsod mayroong dalawang kandidato A At B tumatakbong mayor. Ang 200 residente ng lungsod ay random na na-survey, kung saan 46% ang tumugon na iboboto nila ang kandidato A, 26% - para sa kandidato B at 28% ang hindi alam kung sino ang kanilang iboboto. Tukuyin ang 95% confidence interval para sa proporsyon ng mga residente ng lungsod na sumusuporta sa kandidato A.



Bago sa site

>

Pinaka sikat