Bahay Prosthetics at implantation Paano makahanap ng halimbawa ng confidence interval. Agwat ng kumpiyansa

Paano makahanap ng halimbawa ng confidence interval. Agwat ng kumpiyansa

Agwat ng kumpiyansa- limitahan ang mga halaga istatistikal na halaga, na may ibinigay na probabilidad ng kumpiyansa na γ ay nasa pagitan na ito kapag nagsa-sample ng mas malaking volume. Tinutukoy bilang P(θ - ε. Sa pagsasagawa, ang probabilidad ng kumpiyansa na γ ay pinili mula sa mga halagang medyo malapit sa pagkakaisa: γ = 0.9, γ = 0.95, γ = 0.99.

Layunin ng serbisyo. Gamit ang serbisyong ito, matutukoy mo:

  • agwat ng kumpiyansa para sa pangkalahatang mean, agwat ng kumpiyansa para sa pagkakaiba;
  • confidence interval para sa standard deviation, confidence interval para sa general share;
Ang resultang solusyon ay nai-save sa isang Word file (tingnan ang halimbawa). Nasa ibaba ang isang video na pagtuturo kung paano punan ang paunang data.

Halimbawa Blg. 1. Sa isang kolektibong bukid, sa kabuuang kawan ng 1000 tupa, 100 tupa ang sumailalim sa selective control shearing. Bilang isang resulta, ang isang average na gupit ng lana na 4.2 kg bawat tupa ay itinatag. Tukuyin na may probabilidad na 0.99 ang mean square error ng sample kapag tinutukoy ang average na paggugupit ng lana bawat tupa at ang mga limitasyon kung saan nakapaloob ang halaga ng paggugupit kung ang pagkakaiba ay 2.5. Ang sample ay hindi paulit-ulit.
Halimbawa Blg. 2. Mula sa isang batch ng mga imported na produkto sa post ng Moscow Northern Customs, 20 sample ng produktong "A" ang kinuha sa pamamagitan ng random na paulit-ulit na sampling. Bilang resulta ng pagsubok, ang average na nilalaman ng kahalumigmigan ng produkto na "A" sa sample ay itinatag, na naging katumbas ng 6% na may karaniwang paglihis ng 1%.
Tukuyin na may posibilidad na 0.683 ang mga limitasyon ng average na moisture content ng produkto sa buong batch ng mga imported na produkto.
Halimbawa Blg. 3. Ang isang survey sa 36 na mga mag-aaral ay nagpakita na ang average na bilang ng mga textbook na kanilang binabasa bawat taon Taong panuruan, naging katumbas ng 6. Ipagpalagay na ang bilang ng mga aklat-aralin na binabasa ng isang mag-aaral bawat semestre ay may normal na batas sa pamamahagi na may karaniwang paglihis na katumbas ng 6, hanapin ang: A) na may pagiging maaasahan na 0.99, isang pagtatantya ng pagitan para sa matematikal inaasahan nito random variable; B) sa anong posibilidad na masasabi natin na ang average na bilang ng mga aklat-aralin na binabasa ng isang mag-aaral bawat semestre, na kinakalkula mula sa sample na ito, ay lilihis mula sa inaasahan sa matematika ayon sa ganap na halaga hindi hihigit sa 2.

Pag-uuri ng mga agwat ng kumpiyansa

Sa pamamagitan ng uri ng parameter na sinusuri:

Ayon sa uri ng sample:

  1. Agwat ng kumpiyansa para sa isang walang katapusang sample;
  2. Agwat ng kumpiyansa para sa huling sample;
Ang sample ay tinatawag na resampling, kung ang napiling bagay ay ibinalik sa populasyon bago piliin ang susunod. Ang sample ay tinatawag na non-repeat, kung ang napiling bagay ay hindi ibinalik sa populasyon. Sa pagsasagawa, kadalasan ay nakikitungo kami sa mga hindi paulit-ulit na sample.

Pagkalkula ng average sampling error para sa random sampling

Ang pagkakaiba sa pagitan ng mga halaga ng mga tagapagpahiwatig na nakuha mula sa sample at ang kaukulang mga parameter ng pangkalahatang populasyon ay tinatawag pagkakamali sa pagiging kinatawan.
Mga pagtatalaga ng mga pangunahing parameter ng pangkalahatan at sample na populasyon.
Average na mga formula ng error sa pag-sample
muling pagpiliulitin ang pagpili
para sa karaniwanpara ibahagipara sa karaniwanpara ibahagi
Ang ugnayan sa pagitan ng limitasyon ng error sa pag-sample (Δ) ay ginagarantiyahan na may ilang posibilidad Р(t), At average na error ang sample ay may anyo: o Δ = t·μ, kung saan t– koepisyent ng kumpiyansa, tinutukoy depende sa antas ng posibilidad na P(t) ayon sa talahanayan ng Laplace integral function.

Mga formula para sa pagkalkula ng laki ng sample gamit ang isang random na paraan ng sampling

Sa mga nakaraang subsection ay isinasaalang-alang namin ang isyu ng pagtantya ng hindi kilalang parameter A isang numero. Ito ay tinatawag na "punto" na pagtatantya. Sa isang bilang ng mga gawain, hindi mo lamang kailangang hanapin ang parameter A angkop na halaga ng numero, ngunit din upang suriin ang katumpakan at pagiging maaasahan nito. Kailangan mong malaman kung anong mga error ang maaaring humantong sa pagpapalit ng isang parameter A point estimate nito A at sa anong antas ng kumpiyansa ang maaari nating asahan na ang mga pagkakamaling ito ay hindi lalampas sa mga kilalang limitasyon?

Ang mga problema ng ganitong uri ay partikular na may kaugnayan sa isang maliit na bilang ng mga obserbasyon, kapag ang pagtatantya ng punto at sa ay higit sa lahat ay random at tinatayang pagpapalit ng isang sa pamamagitan ng isang maaaring humantong sa mga malubhang error.

Upang magbigay ng ideya ng katumpakan at pagiging maaasahan ng pagtatantya A,

V mga istatistika ng matematika Gumagamit sila ng tinatawag na confidence interval at confidence probabilities.

Hayaan para sa parameter A walang pinapanigan na pagtatantya na nakuha mula sa karanasan A. Gusto naming tantyahin ang posibleng error sa kasong ito. Magtalaga tayo ng ilang sapat na malaking probabilidad p (halimbawa, p = 0.9, 0.95 o 0.99) upang ang isang kaganapan na may probabilidad na p ay maituturing na praktikal na maaasahan, at makahanap ng isang halaga kung saan

Kung gayon ang saklaw ay praktikal posibleng mga halaga error na nangyayari kapag pinapalitan A sa A, ay magiging ± s; Ang malalaking error sa absolute value ay lilitaw lamang na may mababang posibilidad a = 1 - p. Isulat muli natin ang (14.3.1) bilang:

Ang pagkakapantay-pantay (14.3.2) ay nangangahulugan na may probabilidad p ang hindi alam na halaga ng parameter A nahuhulog sa loob ng pagitan

Kinakailangang tandaan ang isang pangyayari. Noong nakaraan, paulit-ulit naming isinasaalang-alang ang posibilidad ng isang random na variable na nahuhulog sa isang ibinigay na hindi random na pagitan. Dito iba ang sitwasyon: ang laki A ay hindi random, ngunit ang interval / p ay random. Ang posisyon nito sa x-axis ay random, na tinutukoy ng sentro nito A; Sa pangkalahatan, ang haba ng interval 2s ay random din, dahil ang halaga ng s ay kinakalkula, bilang panuntunan, mula sa pang-eksperimentong data. Samakatuwid sa sa kasong ito mas mainam na bigyang-kahulugan ang p value hindi bilang ang posibilidad ng "pagtama" ng isang punto A sa pagitan / p, at bilang ang posibilidad na ang isang random na pagitan / p ay sumasakop sa punto A(Larawan 14.3.1).

kanin. 14.3.1

Ang probabilidad p ay karaniwang tinatawag posibilidad ng kumpiyansa, at pagitan / p - agwat ng kumpiyansa. Mga hangganan ng pagitan Kung. a x = a- s at a 2 = a + at tinatawag mga hangganan ng tiwala.

Bigyan natin ng isa pang interpretasyon ang konsepto ng isang agwat ng kumpiyansa: maaari itong ituring bilang isang pagitan ng mga halaga ng parameter A, tugma sa pang-eksperimentong data at hindi sumasalungat sa mga ito. Sa katunayan, kung sumasang-ayon kaming isaalang-alang ang isang kaganapan na may posibilidad na a = 1-p na halos imposible, kung gayon ang mga halaga ng parameter a kung saan a - a> s ay dapat kilalanin bilang sumasalungat sa pang-eksperimentong data, at ang mga kung saan |a - A a t na 2 .

Hayaan para sa parameter A mayroong walang pinapanigan na pagtatantya A. Kung alam natin ang batas ng distribusyon ng dami A, ang gawain ng paghahanap ng agwat ng kumpiyansa ay magiging napakasimple: sapat na upang makahanap ng isang halaga kung saan

Ang kahirapan ay ang batas ng pamamahagi ng mga pagtatantya A depende sa batas ng pamamahagi ng dami X at, samakatuwid, sa hindi kilalang mga parameter nito (sa partikular, sa parameter mismo A).

Upang malampasan ang kahirapan na ito, maaari mong gamitin ang sumusunod na humigit-kumulang tinatayang pamamaraan: palitan ang hindi kilalang mga parameter sa expression para sa s ng kanilang mga pagtatantya ng punto. Sa medyo malaking bilang ng mga eksperimento P(mga 20...30) ang pamamaraan na ito ay karaniwang nagbibigay ng mga resulta na kasiya-siya sa mga tuntunin ng katumpakan.

Bilang halimbawa, isaalang-alang ang problema ng isang agwat ng kumpiyansa para sa inaasahan sa matematika.

Hayaan itong mabuo P X, ang mga katangian nito ay inaasahang halaga T at pagkakaiba-iba D- hindi kilala. Ang mga sumusunod na pagtatantya ay nakuha para sa mga parameter na ito:

Kinakailangang bumuo ng isang agwat ng kumpiyansa / p na tumutugma sa probabilidad ng kumpiyansa p para sa inaasahan sa matematika T dami X.

Kapag nilutas ang problemang ito, gagamitin namin ang katotohanan na ang dami T kumakatawan sa kabuuan P independiyenteng magkaparehong ipinamahagi na mga random na variable X h at ayon sa central limit theorem, para sa isang sapat na malaki P ang batas ng pamamahagi nito ay malapit sa normal. Sa pagsasagawa, kahit na may medyo maliit na bilang ng mga termino (mga 10...20), ang batas sa pamamahagi ng kabuuan ay maaaring ituring na normal. Ipagpalagay namin na ang halaga T ipinamahagi ayon sa normal na batas. Ang mga katangian ng batas na ito - mathematical expectation at variance - ay pantay, ayon sa pagkakabanggit T At

(tingnan ang kabanata 13 subsection 13.3). Ipagpalagay natin na ang halaga D alam natin at makakahanap tayo ng halagang Ep kung saan

Gamit ang formula (6.3.5) ng Kabanata 6, ipinapahayag namin ang probabilidad sa kaliwang bahagi ng (14.3.5) sa pamamagitan ng normal na distribution function

nasaan ang standard deviation ng estimate T.

Mula sa Eq.

hanapin ang halaga ng Sp:

kung saan ang arg Ф* (х) ay ang inverse function ng Ф* (X), mga. ang halaga ng argumento kung saan normal na paggana ang pamamahagi ay katumbas ng X.

Pagpapakalat D, kung saan ipinapahayag ang dami A 1P, hindi natin alam nang eksakto; bilang tinatayang halaga nito, maaari mong gamitin ang pagtatantya D(14.3.4) at maglagay ng humigit-kumulang:

Kaya, ang problema sa pagbuo ng isang agwat ng kumpiyansa ay tinatayang nalutas, na katumbas ng:

kung saan ang gp ay tinutukoy ng formula (14.3.7).

Upang maiwasan ang reverse interpolation sa mga talahanayan ng function na Ф* (l) kapag kinakalkula ang s p, maginhawang mag-compile ng isang espesyal na talahanayan (Talahanayan 14.3.1), na nagpapakita ng mga halaga ng dami

depende sa r. Tinutukoy ng halaga (p para sa normal na batas ang bilang ng mga karaniwang paglihis na dapat i-plot sa kanan at kaliwa mula sa gitna ng dispersion upang ang posibilidad na makapasok sa resultang lugar ay katumbas ng p.

Gamit ang value na 7 p, ang confidence interval ay ipinahayag bilang:

Talahanayan 14.3.1

Halimbawa 1. 20 eksperimento ang isinagawa sa dami X; ang mga resulta ay ipinapakita sa talahanayan. 14.3.2.

Talahanayan 14.3.2

Kinakailangang maghanap ng pagtatantya mula sa para sa mathematical na inaasahan ng dami X at bumuo ng agwat ng kumpiyansa na tumutugma sa probabilidad ng kumpiyansa p = 0.8.

Solusyon. Meron kami:

Ang pagpili sa l: = 10 bilang reference point, gamit ang ikatlong formula (14.2.14) makikita natin ang walang pinapanigan na pagtatantya D :

Ayon sa talahanayan 14.3.1 nahanap namin

Mga limitasyon ng kumpiyansa:

Agwat ng kumpiyansa:

Mga halaga ng parameter T, nakahiga sa pagitan na ito ay tugma sa pang-eksperimentong data na ibinigay sa talahanayan. 14.3.2.

Ang isang agwat ng kumpiyansa para sa pagkakaiba ay maaaring mabuo sa katulad na paraan.

Hayaan itong mabuo P mga independiyenteng eksperimento sa isang random na variable X na may hindi kilalang mga parameter para sa parehong A at pagpapakalat D isang walang pinapanigan na pagtatantya ang nakuha:

Kinakailangan na humigit-kumulang na bumuo ng isang agwat ng kumpiyansa para sa pagkakaiba.

Mula sa formula (14.3.11) malinaw na ang dami D kumakatawan

halaga P mga random na variable ng form. Ang mga halagang ito ay hindi

independyente, dahil ang alinman sa mga ito ay kasama ang dami T, nakadepende sa iba. Gayunpaman, maaari itong ipakita na sa pagtaas P ang batas ng pamamahagi ng kanilang kabuuan ay lumalapit din sa normal. Halos sa P= 20...30 maaari na itong ituring na normal.

Ipagpalagay natin na ito ay totoo at hanapin ang mga katangian ng batas na ito: pag-asa sa matematika at pagpapakalat. Mula noong pagtatasa D- walang kinikilingan, kung gayon M[D] = D.

Pagkalkula ng pagkakaiba-iba DD ay nauugnay sa medyo kumplikadong mga kalkulasyon, kaya ipinakita namin ang expression nito nang walang derivation:

kung saan ang q 4 ay ang ikaapat gitnang punto dami X.

Upang magamit ang expression na ito, kailangan mong palitan ang mga halaga \u003d 4 at D(kahit malapit lang). sa halip na D maaari mong gamitin ang kanyang pagtatasa D. Sa prinsipyo, ang ikaapat na gitnang sandali ay maaari ding mapalitan ng isang pagtatantya, halimbawa, isang halaga ng form:

ngunit ang gayong kapalit ay magbibigay ng napakababang katumpakan, dahil sa pangkalahatan, na may limitadong bilang ng mga eksperimento, ang mga sandali mataas na pagkakasunud-sunod tinutukoy mula sa malalaking pagkakamali. Gayunpaman, sa pagsasanay ito ay madalas na nangyayari na ang uri ng dami ng pamamahagi ng batas X kilala nang maaga: ang mga parameter lamang nito ay hindi alam. Pagkatapos ay maaari mong subukang ipahayag ang μ 4 hanggang D.

Kunin natin ang pinakakaraniwang kaso, kapag ang halaga X ipinamahagi ayon sa normal na batas. Pagkatapos ang ikaapat na sentral na sandali nito ay ipinahayag sa mga tuntunin ng pagpapakalat (tingnan ang Kabanata 6, subsection 6.2);

at formula (14.3.12) ay nagbibigay o

Pinapalitan ang hindi alam sa (14.3.14) D kanyang pagtatasa D, nakukuha natin: mula saan

Ang sandali μ 4 ay maaaring ipahayag sa pamamagitan ng D din sa ilang iba pang mga kaso, kapag ang pamamahagi ng halaga X ay hindi normal, ngunit ang hitsura nito ay kilala. Halimbawa, para sa batas pare-parehong density(tingnan ang kabanata 5) mayroon tayo:

kung saan ang (a, P) ay ang pagitan kung saan tinukoy ang batas.

Kaya naman,

Gamit ang formula (14.3.12) makuha namin: kung saan namin mahahanap ang humigit-kumulang

Sa mga kaso kung saan hindi alam ang uri ng batas sa pamamahagi para sa dami 26, kapag gumagawa ng tinatayang pagtatantya ng halaga a/) inirerekomenda pa rin na gumamit ng formula (14.3.16), maliban kung may mga espesyal na dahilan para maniwala na ang batas na ito ay ibang-iba sa normal (may kapansin-pansing positibo o negatibong kurtosis) .

Kung ang tinatayang halaga a/) ay nakuha sa isang paraan o iba pa, maaari tayong bumuo ng isang agwat ng kumpiyansa para sa pagkakaiba sa parehong paraan tulad ng ginawa natin para sa inaasahan sa matematika:

kung saan ang halaga depende sa ibinigay na probabilidad p ay matatagpuan ayon sa talahanayan. 14.3.1.

Halimbawa 2. Maghanap ng humigit-kumulang 80% confidence interval para sa pagkakaiba ng isang random variable X sa ilalim ng mga kondisyon ng halimbawa 1, kung ito ay kilala na ang halaga X ipinamahagi ayon sa isang batas na malapit sa normal.

Solusyon. Ang halaga ay nananatiling pareho sa talahanayan. 14.3.1:

Ayon sa formula (14.3.16)

Gamit ang formula (14.3.18) nakita namin ang agwat ng kumpiyansa:

Kaukulang pagitan ng mga average na halaga parisukat na paglihis: (0,21; 0,29).

14.4. Mga Tumpak na Paraan ng Konstruksyon mga pagitan ng kumpiyansa para sa mga parameter ng isang random na variable na ibinahagi ayon sa normal na batas

Sa nakaraang subsection, sinuri namin ang humigit-kumulang tinatayang mga pamamaraan para sa pagbuo ng mga agwat ng kumpiyansa para sa inaasahan at pagkakaiba-iba ng matematika. Dito ay magbibigay kami ng ideya ng eksaktong mga pamamaraan upang malutas ang parehong problema. Binibigyang-diin namin na upang tumpak na makahanap ng mga agwat ng kumpiyansa, talagang kinakailangan na malaman nang maaga ang anyo ng batas ng pamamahagi ng dami. X, samantalang para sa aplikasyon ng mga tinatayang pamamaraan na ito ay hindi kinakailangan.

Idea tumpak na pamamaraan ang pagbuo ng mga pagitan ng kumpiyansa ay bumaba sa mga sumusunod. Ang anumang agwat ng kumpiyansa ay matatagpuan mula sa isang kundisyong nagpapahayag ng posibilidad na matupad ang ilang partikular na hindi pagkakapantay-pantay, na kinabibilangan ng pagtatantya na interesado kami A. Batas ng pamamahagi ng pagpapahalaga A V pangkalahatang kaso depende sa hindi kilalang mga parameter ng dami X. Gayunpaman, kung minsan ay posible na ipasa ang mga hindi pagkakapantay-pantay mula sa isang random na variable A sa ilang iba pang function ng mga naobserbahang halaga X p X 2, ..., X p. ang batas ng pamamahagi kung saan ay hindi nakasalalay sa hindi kilalang mga parameter, ngunit nakasalalay lamang sa bilang ng mga eksperimento at sa uri ng batas ng pamamahagi ng dami X. Ang mga ganitong uri ng mga random na variable ay gumaganap ng isang mahalagang papel sa mga istatistika ng matematika; ang mga ito ay pinag-aralan nang mas detalyado para sa kaso ng isang normal na distribusyon ng dami X.

Halimbawa, napatunayan na sa isang normal na pamamahagi ng halaga X random na halaga

sumusunod sa tinatawag na Batas sa pamamahagi ng mag-aaral Sa P- 1 antas ng kalayaan; ang kapal ng batas na ito ay may anyo

kung saan ang G(x) ay ang kilalang gamma function:

Napatunayan din na ang random variable

ay may "%2 distribution" na may P- 1 degree ng kalayaan (tingnan ang Kabanata 7), ang density nito ay ipinahayag ng formula

Nang hindi isinasaalang-alang ang mga derivasyon ng mga distribusyon (14.4.2) at (14.4.4), ipapakita namin kung paano mailalapat ang mga ito kapag gumagawa ng mga agwat ng kumpiyansa para sa mga parameter ty D.

Hayaan itong mabuo P mga independiyenteng eksperimento sa isang random na variable X, karaniwang ipinamamahagi na may hindi kilalang mga parameter T&O. Para sa mga parameter na ito, nakuha ang mga pagtatantya

Kinakailangang bumuo ng mga pagitan ng kumpiyansa para sa parehong mga parameter na tumutugma sa probabilidad ng kumpiyansa p.

Bumuo muna tayo ng confidence interval para sa mathematical expectation. Ito ay natural na gawin ang pagitan na ito simetriko na may paggalang sa T; sabihin s p tukuyin ang kalahati ng haba ng pagitan. Dapat piliin ang halaga s p upang ang kundisyon ay masiyahan

Subukan nating lumipat sa kaliwang bahagi ng pagkakapantay-pantay (14.4.5) mula sa random variable T sa isang random variable T, ipinamahagi ayon sa batas ng Mag-aaral. Upang gawin ito, i-multiply ang magkabilang panig ng hindi pagkakapantay-pantay |m-w?|

sa pamamagitan ng isang positibong halaga: o, gamit ang notasyon (14.4.1),

Maghanap tayo ng isang numero / p upang ang halaga / p ay matatagpuan mula sa kundisyon

Mula sa formula (14.4.2) malinaw na (1) - kahit na function, kaya (14.4.8) ay nagbibigay

Ang pagkakapantay-pantay (14.4.9) ay tumutukoy sa halaga / p depende sa p. Kung mayroon kang isang talahanayan ng mga mahalagang halaga

pagkatapos ay ang halaga ng /p ay matatagpuan sa pamamagitan ng reverse interpolation sa talahanayan. Gayunpaman, mas maginhawang gumuhit ng isang talahanayan ng mga halaga ng /p nang maaga. Ang nasabing talahanayan ay ibinigay sa Appendix (Talahanayan 5). Ipinapakita ng talahanayang ito ang mga halaga depende sa antas ng kumpiyansa p at ang bilang ng mga antas ng kalayaan P- 1. Ang pagkakaroon ng natukoy / p mula sa talahanayan. 5 at ipagpalagay

makikita natin ang kalahati ng lapad ng agwat ng kumpiyansa / p at ang agwat mismo

Halimbawa 1. 5 independyenteng mga eksperimento ang isinagawa sa isang random na variable X, karaniwang ipinamamahagi na may hindi kilalang mga parameter T at tungkol sa. Ang mga resulta ng mga eksperimento ay ibinigay sa talahanayan. 14.4.1.

Talahanayan 14.4.1

Maghanap ng rating T para sa inaasahan sa matematika at bumuo ng 90% na agwat ng kumpiyansa / p para dito (ibig sabihin, ang agwat na tumutugma sa probabilidad ng kumpiyansa p = 0.9).

Solusyon. Meron kami:

Ayon sa talahanayan 5 ng aplikasyon para sa P - 1 = 4 at p = 0.9 nakita namin saan

Ang agwat ng kumpiyansa ay magiging

Halimbawa 2. Para sa mga kundisyon ng halimbawa 1 ng subsection 14.3, ipagpalagay ang halaga X karaniwang ipinamamahagi, hanapin ang eksaktong agwat ng kumpiyansa.

Solusyon. Ayon sa talahanayan 5 ng apendiks ay makikita natin kung kailan P - 1 = 19ir =

0.8 / p = 1.328; mula rito

Kung ikukumpara sa solusyon ng halimbawa 1 ng subsection 14.3 (e p = 0.072), kami ay kumbinsido na ang pagkakaiba ay napakaliit. Kung pananatilihin namin ang katumpakan hanggang sa pangalawang decimal place, ang mga agwat ng kumpiyansa na makikita ng eksakto at tinatayang mga pamamaraan ay magkakasabay:

Magpatuloy tayo sa pagbuo ng agwat ng kumpiyansa para sa pagkakaiba. Isaalang-alang ang walang pinapanigan na variance estimator

at ipahayag ang random variable D sa pamamagitan ng magnitude V(14.4.3), may distribusyon x 2 (14.4.4):

Pag-alam sa batas ng distribusyon ng dami V, mahahanap mo ang pagitan /(1) kung saan ito nahuhulog na may ibinigay na probabilidad p.

Batas ng pamamahagi kn_x(v) Ang magnitude I 7 ay may anyo na ipinapakita sa Fig. 14.4.1.

kanin. 14.4.1

Ang tanong ay arises: kung paano piliin ang pagitan / p? Kung ang batas ng distribusyon ng magnitude V ay simetriko (tulad ng normal na batas o distribusyon ng Mag-aaral), natural na kunin ang pagitan /p simetriko na may paggalang sa inaasahan sa matematika. Sa kasong ito ang batas k p_x (v) walang simetriko. Sumang-ayon tayo na piliin ang interval /p upang ang posibilidad ng pagiging value V lampas sa pagitan sa kanan at kaliwa (mga lugar na may kulay sa Fig. 14.4.1) ay pareho at pantay

Upang makabuo ng pagitan /p gamit ang property na ito, ginagamit namin ang talahanayan. 4 na application: naglalaman ito ng mga numero y) ganyan

para sa halaga V, pagkakaroon ng x 2 -pamamahagi na may r antas ng kalayaan. Sa kaso natin r = n- 1. Ayusin natin r = n- 1 at hanapin sa kaukulang hilera ng talahanayan. 4 dalawang kahulugan x 2 - ang isa ay tumutugma sa probabilidad ang isa pa - probabilidad Let us decate these

mga halaga sa 2 At xl? Ang pagitan ay may y 2, sa iyong kaliwa, at y~ kanang dulo.

Ngayon hanapin natin mula sa pagitan / p ang ninanais na agwat ng kumpiyansa /|, para sa pagpapakalat na may mga hangganan D, at D2, na sumasaklaw sa punto D may posibilidad p:

Bumuo tayo ng pagitan / (, = (?> ь А) na sumasaklaw sa punto D kung at kung lamang ang halaga V nahuhulog sa pagitan /r. Ipakita natin na ang pagitan

natutugunan ang kundisyong ito. Sa katunayan, ang hindi pagkakapantay-pantay ay katumbas ng hindi pagkakapantay-pantay

at ang mga hindi pagkakapantay-pantay na ito ay nasiyahan sa probabilidad p. Kaya, ang pagitan ng kumpiyansa para sa pagkakaiba ay natagpuan at ipinahayag ng formula (14.4.13).

Halimbawa 3. Hanapin ang agwat ng kumpiyansa para sa pagkakaiba sa ilalim ng mga kondisyon ng halimbawa 2 ng subsection 14.3, kung alam na ang halaga X karaniwang ipinamamahagi.

Solusyon. Meron kami . Ayon sa talahanayan 4 ng apendiks

mahanap namin sa g = n - 1 = 19

Gamit ang formula (14.4.13) hinahanap natin ang pagitan ng kumpiyansa para sa pagkakaiba

Ang kaukulang pagitan para sa karaniwang paglihis ay (0.21; 0.32). Ang agwat na ito ay bahagyang lumampas sa pagitan (0.21; 0.29) na nakuha sa halimbawa 2 ng subsection 14.3 gamit ang tinatayang pamamaraan.

  • Isinasaalang-alang ng Figure 14.3.1 ang isang simetriko na pagitan ng kumpiyansa tungkol sa a. Sa pangkalahatan, tulad ng makikita natin sa ibang pagkakataon, hindi ito kinakailangan.

Pagtataya ng Mga Pagitan ng Kumpiyansa

Mga Layunin sa pag-aaral

Isinasaalang-alang ng mga istatistika ang mga sumusunod dalawang pangunahing gawain:

    Mayroon kaming ilang pagtatantya batay sa sample na data, at gusto naming gumawa ng ilang probabilistikong pahayag tungkol sa kung saan matatagpuan ang tunay na halaga ng tinantyang parameter.

    Mayroon kaming partikular na hypothesis na kailangang masuri gamit ang sample na data.

Sa paksang ito isasaalang-alang natin ang unang gawain. Ipakilala din natin ang kahulugan ng agwat ng kumpiyansa.

Ang agwat ng kumpiyansa ay isang agwat na binuo sa paligid ng tinantyang halaga ng isang parameter at nagpapakita kung saan matatagpuan ang tunay na halaga ng tinantyang parameter na may isang priori na tinukoy na posibilidad.

Pagkatapos pag-aralan ang materyal sa paksang ito, ikaw ay:

    alamin kung ano ang agwat ng kumpiyansa para sa isang pagtatantya;

    matutong pag-uri-uriin ang mga problema sa istatistika;

    makabisado ang pamamaraan ng pagbuo ng mga agwat ng kumpiyansa, kapwa gamit ang mga istatistikal na formula at paggamit ng mga tool sa software;

    matutong tukuyin ang mga kinakailangang laki ng sample upang makamit ang ilang partikular na parameter ng katumpakan ng mga istatistikal na pagtatantya.

Pamamahagi ng mga katangian ng sample

T-pamamahagi

Tulad ng tinalakay sa itaas, ang distribusyon ng random variable ay malapit sa standardized normal na pamamahagi na may mga parameter na 0 at 1. Dahil hindi natin alam ang halaga ng σ, pinapalitan natin ito ng ilang pagtatantya ng s. Ang dami ay mayroon nang ibang distribusyon, ibig sabihin, o Pamamahagi ng mag-aaral, na tinutukoy ng parameter n -1 (ang bilang ng mga antas ng kalayaan). Ang distribusyon na ito ay malapit sa normal na distribusyon (mas malaki n, mas malapit ang mga distribusyon).

Sa Fig. 95
ipinakita ang pamamahagi ng Mag-aaral na may 30 digri ng kalayaan. Tulad ng nakikita mo, ito ay napakalapit sa normal na pamamahagi.

Katulad ng mga function para sa pagtatrabaho sa normal na distribution NORMIDIST at NORMINV, may mga function para sa pagtatrabaho sa t-distribution - STUDIST (TDIST) at STUDRASOBR (TINV). Ang isang halimbawa ng paggamit ng mga function na ito ay makikita sa file na STUDRASP.XLS (template at solusyon) at sa Fig. 96
.

Pamamahagi ng iba pang mga katangian

Tulad ng alam na natin, upang matukoy ang katumpakan ng pagtantya ng inaasahan sa matematika, kailangan natin ng t-distribution. Upang matantya ang iba pang mga parameter, tulad ng pagkakaiba-iba, kinakailangan ang iba't ibang mga distribusyon. Dalawa sa kanila ay ang F-distribution at x 2 -pamamahagi.

Agwat ng kumpiyansa para sa mean

Agwat ng kumpiyansa- ito ay isang agwat na binuo sa paligid ng tinantyang halaga ng parameter at nagpapakita kung saan matatagpuan ang tunay na halaga ng tinantyang parameter na may isang priori na tinukoy na posibilidad.

Ang pagbuo ng isang agwat ng kumpiyansa para sa average na halaga ay nangyayari sa sumusunod na paraan:

Halimbawa

Plano ng fast food restaurant na palawakin ang assortment nito gamit ang bagong uri ng sandwich. Upang matantya ang pangangailangan para dito, plano ng manager na random na pumili ng 40 bisita mula sa mga nakasubok na nito at hilingin sa kanila na i-rate ang kanilang saloobin sa bagong produkto sa isang sukat mula 1 hanggang 10. Gusto ng manager na tantiyahin ang inaasahang bilang ng mga puntos na matatanggap ng bagong produkto at bubuo ng 95% confidence interval para sa pagtatantyang ito. Paano ito gawin? (tingnan ang file na SANDWICH1.XLS (template at solusyon).

Solusyon

Upang malutas ang problemang ito maaari mong gamitin ang . Ang mga resulta ay ipinakita sa Fig. 97
.

Agwat ng kumpiyansa para sa kabuuang halaga

Minsan, gamit ang sample na data, ito ay kinakailangan upang tantiyahin hindi ang matematikal na inaasahan, ngunit kabuuang halaga mga halaga. Halimbawa, sa isang sitwasyon sa isang auditor, ang interes ay maaaring hindi sa pagtatantya ng average na laki ng account, ngunit ang kabuuan ng lahat ng mga account.

Hayaan N - kabuuan mga elemento, n ang laki ng sample, ang T 3 ay ang kabuuan ng mga halaga sa sample, ang T" ay ang pagtatantya para sa kabuuan para sa buong populasyon, pagkatapos , at ang pagitan ng kumpiyansa ay kinakalkula ng formula , kung saan ang s ay ang pagtatantya ng karaniwang paglihis para sa sample, at ang pagtatantya ng mean para sa sample.

Halimbawa

Sabihin natin ang ilan serbisyo sa buwis gustong tantyahin ang halaga ng kabuuang mga refund ng buwis para sa 10,000 nagbabayad ng buwis. Ang nagbabayad ng buwis ay maaaring makatanggap ng refund o magbabayad ng mga karagdagang buwis. Hanapin ang 95% na agwat ng kumpiyansa para sa halaga ng refund, kung ipagpalagay na ang laki ng sample na 500 tao (tingnan ang file na HALAGA NG REFUND.XLS (template at solusyon).

Solusyon

Ang StatPro ay walang espesyal na pamamaraan para sa kasong ito, gayunpaman, mapapansin na ang mga hangganan ay maaaring makuha mula sa mga hangganan para sa average batay sa mga formula sa itaas (Fig. 98
).

Agwat ng kumpiyansa para sa proporsyon

Hayaan ang p ay ang matematikal na inaasahan ng bahagi ng mga kliyente, at hayaang p b ang pagtatantya ng bahaging ito na nakuha mula sa isang sample ng laki n. Maaari itong ipakita na para sa sapat na malaki ang distribusyon ng pagtatasa ay magiging malapit sa normal na may mathematical expectation p at standard deviation . Ang karaniwang error ng pagtatantya sa kasong ito ay ipinahayag bilang , at ang agwat ng kumpiyansa ay bilang .

Halimbawa

Plano ng fast food restaurant na palawakin ang assortment nito gamit ang bagong uri ng sandwich. Upang masuri ang pangangailangan para dito, random na pumili ang manager ng 40 bisita mula sa mga nakasubok na nito at hiniling sa kanila na i-rate ang kanilang saloobin sa bagong produkto sa isang sukat mula 1 hanggang 10. Nais tantiyahin ng manager ang inaasahang proporsyon ng mga customer na nagre-rate ng bagong produkto ng hindi bababa sa 6 na puntos (inaasahan niya na ang mga customer na ito ay ang mga mamimili ng bagong produkto).

Solusyon

Sa una, gumawa kami ng bagong column batay sa attribute 1 kung ang rating ng kliyente ay higit sa 6 na puntos at 0 kung hindi man (tingnan ang file na SANDWICH2.XLS (template at solusyon).

Paraan 1

Sa pamamagitan ng pagbilang ng bilang ng 1, tinatantya namin ang bahagi, at pagkatapos ay ginagamit ang mga formula.

Ang zcr value ay kinuha mula sa mga espesyal na normal na distribution table (halimbawa, 1.96 para sa isang 95% confidence interval).

Gamit ang diskarteng ito at tiyak na data upang makabuo ng 95% na pagitan, nakuha namin ang mga sumusunod na resulta (Larawan 99
). Kritikal na halaga ang parameter na z cr ay katumbas ng 1.96. Ang karaniwang error ng pagtatantya ay 0.077. Ang mas mababang limitasyon ng agwat ng kumpiyansa ay 0.475. Ang pinakamataas na limitasyon ng agwat ng kumpiyansa ay 0.775. Kaya, ang manager ay may karapatang maniwala nang may 95% kumpiyansa na ang porsyento ng mga customer na nagre-rate ng bagong produkto ng 6 na puntos o mas mataas ay nasa pagitan ng 47.5 at 77.5.

Paraan 2

Ang problemang ito ay maaaring malutas gamit ang mga karaniwang tool ng StatPro. Upang gawin ito, sapat na tandaan na ang bahagi sa kasong ito ay tumutugma sa average na halaga ng hanay ng Uri. Susunod na mag-apply kami StatPro/Statistical Inference/One-Sample na Pagsusuri para bumuo ng confidence interval ng mean (estimate ng mathematical expectation) para sa Type column. Ang mga resulta na nakuha sa kasong ito ay magiging napakalapit sa mga resulta ng 1st method (Fig. 99).

Agwat ng kumpiyansa para sa karaniwang paglihis

s ay ginagamit bilang isang pagtatantya ng karaniwang paglihis (ang formula ay ibinigay sa Seksyon 1). Ang densidad function ng pagtatantya s ay ang chi-square function, na, tulad ng t-distribution, ay may n-1 degrees ng kalayaan. May mga espesyal na function para sa pagtatrabaho sa pamamahaging ito ng CHIDIST at CHIINV.

Ang agwat ng kumpiyansa sa kasong ito ay hindi na magiging simetriko. Ang isang maginoo na diagram ng hangganan ay ipinapakita sa Fig. 100 .

Halimbawa

Ang makina ay dapat gumawa ng mga bahagi na may diameter na 10 cm Gayunpaman, dahil sa iba't ibang mga pangyayari, ang mga pagkakamali ay nangyayari. Ang controller ng kalidad ay nag-aalala tungkol sa dalawang pangyayari: una, ang average na halaga ay dapat na 10 cm; pangalawa, kahit na sa kasong ito, kung ang mga paglihis ay malaki, kung gayon maraming bahagi ang tatanggihan. Araw-araw ay gumagawa siya ng sample ng 50 parts (tingnan ang file QUALITY CONTROL.XLS (template and solution). Anong mga konklusyon ang maibibigay ng naturang sample?

Solusyon

Bumuo tayo ng 95% confidence interval para sa mean at standard deviation gamit StatPro/Statistical Inference/One-Sample na Pagsusuri(Larawan 101
).

Susunod, gamit ang pagpapalagay ng isang normal na pamamahagi ng mga diameters, kinakalkula namin ang proporsyon ng mga may sira na produkto, na nagtatakda ng maximum na paglihis ng 0.065. Gamit ang mga kakayahan ng talahanayan ng pagpapalit (ang kaso ng dalawang mga parameter), inilalagay namin ang pag-asa ng proporsyon ng mga depekto sa average na halaga at karaniwang paglihis (Larawan 102).
).

Agwat ng kumpiyansa para sa pagkakaiba sa pagitan ng dalawang paraan

Isa ito sa pinaka mahahalagang aplikasyon paraang istatistikal. Mga halimbawa ng mga sitwasyon.

    Gustong malaman ng manager ng tindahan ng damit kung magkano o mas kaunti ang ginagastos ng karaniwang babaeng customer sa tindahan kaysa sa karaniwang lalaking customer.

    Ang dalawang airline ay lumilipad ng magkatulad na ruta. Gusto ng isang organisasyon ng consumer na ihambing ang pagkakaiba sa pagitan ng average na inaasahang oras ng pagkaantala ng flight para sa parehong airline.

    Ang kumpanya ay nagpapadala ng mga kupon para sa indibidwal na species mga kalakal sa isang lungsod at hindi nagpapadala sa iba. Gusto ng mga manager na ihambing ang average na dami ng pagbili ng mga produktong ito sa susunod na dalawang buwan.

    Ang isang dealer ng kotse ay madalas na nakikipag-ugnayan sa mga mag-asawa sa mga presentasyon. Upang maunawaan ang kanilang mga personal na reaksyon sa pagtatanghal, ang mga mag-asawa ay madalas na hiwalay na kapanayamin. Nais suriin ng manager ang pagkakaiba sa mga rating na ibinigay ng mga lalaki at babae.

Kaso ng mga independiyenteng sample

Ang pagkakaiba sa pagitan ng mga paraan ay magkakaroon ng t-distribution na may n 1 + n 2 - 2 degrees ng kalayaan. Ang agwat ng kumpiyansa para sa μ 1 - μ 2 ay ipinahayag ng kaugnayan:

Ang problemang ito ay maaaring malutas hindi lamang gamit ang mga formula sa itaas, kundi pati na rin ang paggamit ng mga karaniwang tool ng StatPro. Upang gawin ito, ito ay sapat na upang gamitin

Agwat ng kumpiyansa para sa pagkakaiba sa pagitan ng mga sukat

Hayaan ang mathematical na inaasahan ng mga pagbabahagi. Hayaan ang kanilang mga sample na pagtatantya, na binuo mula sa mga sample ng laki n 1 at n 2, ayon sa pagkakabanggit. Pagkatapos ay isang pagtatantya para sa pagkakaiba. Samakatuwid, ang agwat ng kumpiyansa ng pagkakaibang ito ay ipinahayag bilang:

Dito, ang z cr ay isang value na nakuha mula sa isang normal na distribution gamit ang mga espesyal na talahanayan (halimbawa, 1.96 para sa isang 95% confidence interval).

Ang karaniwang error ng pagtatantya ay ipinahayag sa kasong ito ng kaugnayan:

.

Halimbawa

Ang tindahan, naghahanda para sa isang malaking benta, ay gumawa ng mga sumusunod na hakbang: pananaliksik sa marketing. 300 ang napili pinakamahusay na mamimili, na random na hinati sa dalawang grupo ng 150 miyembro bawat isa. Ang lahat ng napiling mamimili ay pinadalhan ng mga imbitasyon upang lumahok sa pagbebenta, ngunit ang mga miyembro lamang ng unang pangkat ang nakatanggap ng kupon na nagbibigay sa kanila ng 5% na diskwento. Sa panahon ng pagbebenta, ang mga pagbili ng lahat ng 300 napiling mamimili ay naitala. Paano mabibigyang-kahulugan ng isang tagapamahala ang mga resulta at gumawa ng paghatol tungkol sa pagiging epektibo ng mga kupon? (tingnan ang file COUPONS.XLS (template at solusyon)).

Solusyon

Para sa aming partikular na kaso, sa 150 na customer na nakatanggap ng discount coupon, 55 ang bumili sa pagbebenta, at sa 150 na hindi nakatanggap ng coupon, 35 lang ang bumili (Fig. 103
). Pagkatapos ang mga halaga ng mga proporsyon ng sample ay 0.3667 at 0.2333, ayon sa pagkakabanggit. At ang sample na pagkakaiba sa pagitan ng mga ito ay katumbas ng 0.1333, ayon sa pagkakabanggit. Sa pag-aakalang 95% ang pagitan ng kumpiyansa, makikita natin mula sa normal na talahanayan ng pamamahagi z cr = 1.96. Ang pagkalkula ng karaniwang error ng sample na pagkakaiba ay 0.0524. Sa wakas ay nalaman namin na ang mas mababang limitasyon ng 95% na agwat ng kumpiyansa ay 0.0307, ​​​​at itaas na limitasyon 0.2359 ayon sa pagkakabanggit. Ang mga resultang nakuha ay maaaring bigyang-kahulugan sa paraang para sa bawat 100 customer na nakatanggap ng discount coupon, maaari naming asahan mula 3 hanggang 23 bagong customer. Gayunpaman, dapat nating tandaan na ang konklusyon na ito mismo ay hindi nangangahulugan ng pagiging epektibo ng paggamit ng mga kupon (dahil sa pagbibigay ng diskwento, nawawalan tayo ng kita!). Ipakita natin ito gamit ang partikular na data. Magpanggap na tayo ang average na laki ang pagbili ay katumbas ng 400 rubles, kung saan 50 rubles. may tubo para sa tindahan. Kung gayon ang inaasahang kita sa 100 customer na hindi nakatanggap ng kupon ay:

50 0.2333 100 = 1166.50 kuskusin.

Mga katulad na kalkulasyon para sa 100 customer na nakatanggap ng coupon give:

30 0.3667 100 = 1100.10 kuskusin.

Ang pagbaba sa average na kita sa 30 ay ipinaliwanag sa pamamagitan ng ang katunayan na, gamit ang diskwento, ang mga customer na nakatanggap ng isang kupon ay sa average na gagawa ng isang pagbili para sa 380 rubles.

Kaya, ang pangwakas na konklusyon ay nagpapahiwatig ng hindi pagiging epektibo ng paggamit ng naturang mga kupon sa partikular na sitwasyong ito.

Magkomento. Ang problemang ito ay maaaring malutas gamit ang mga karaniwang tool ng StatPro. Upang gawin ito, ito ay sapat na upang mabawasan sa problema ng pagtantya ng pagkakaiba sa pagitan ng dalawang average gamit ang pamamaraan, at pagkatapos ay ilapat StatPro/Statistical Inference/Two-Sample Analysis upang bumuo ng agwat ng kumpiyansa para sa pagkakaiba sa pagitan ng dalawang average na halaga.

Pagkontrol sa Haba ng Pagitan ng Kumpiyansa

Ang haba ng agwat ng kumpiyansa ay nakasalalay sa sumusunod na mga kondisyon :

    direktang data (standard deviation);

    antas ng kahalagahan;

    laki ng sample.

Laki ng sample para sa pagtatantya ng mean

Una, isaalang-alang natin ang problema sa pangkalahatang kaso. Tukuyin natin ang halaga ng kalahati ng haba ng agwat ng kumpiyansa na ibinigay sa atin bilang B (Larawan 104
). Alam namin na ang agwat ng kumpiyansa para sa mean na halaga ng ilang random variable X ay ipinahayag bilang , Saan . Naniniwala:

at pagpapahayag n, nakukuha natin .

Sa kasamaang palad, eksaktong halaga Hindi natin alam ang pagkakaiba ng random variable X. Bilang karagdagan, hindi natin alam ang halaga ng tcr, dahil ito ay nakasalalay sa n sa pamamagitan ng bilang ng mga antas ng kalayaan. Sa sitwasyong ito, magagawa natin ang mga sumusunod. Sa halip na variance s, gumagamit kami ng ilang pagtatantya ng variance batay sa anumang magagamit na pagpapatupad ng random variable na pinag-aaralan. Sa halip na ang halaga ng t cr, ginagamit namin ang halaga ng z cr para sa normal na distribusyon. Ito ay lubos na katanggap-tanggap, dahil ang mga function ng density ng pamamahagi para sa normal at t-distribusyon ay napakalapit (maliban sa kaso ng maliit na n). Kaya, ang kinakailangang pormula ay tumatagal ng anyo:

.

Dahil ang formula ay nagbibigay, sa pangkalahatan, hindi integer na mga resulta, ang pag-round na may labis na resulta ay kinukuha bilang ang nais na laki ng sample.

Halimbawa

Plano ng fast food restaurant na palawakin ang assortment nito gamit ang bagong uri ng sandwich. Upang masuri ang pangangailangan para dito, pinaplano ng manager na random na pumili ng bilang ng mga bisita mula sa mga nakasubok na nito at hilingin sa kanila na i-rate ang kanilang saloobin sa bagong produkto sa sukat mula 1 hanggang 10. Nais tantyahin ng manager ang inaasahang bilang ng mga puntos na matatanggap ng bagong produkto ng produkto at bumuo ng 95% confidence interval para sa pagtatantyang ito. Kasabay nito, nais niyang ang kalahating lapad ng pagitan ng kumpiyansa ay hindi lalampas sa 0.3. Ilang bisita ang kailangan niyang makapanayam?

tulad ng sumusunod:

Dito r ots ay isang pagtatantya ng proporsyon p, at ang B ay isang ibinigay na kalahati ng haba ng agwat ng kumpiyansa. Ang isang labis na pagtatantya para sa n ay maaaring makuha gamit ang halaga r ots= 0.5. Sa kasong ito, ang haba ng agwat ng kumpiyansa ay hindi lalampas sa tinukoy na halaga B para sa anumang tunay na halaga ng p.

Halimbawa

Hayaang magplano ang manager mula sa nakaraang halimbawa na tantyahin ang bahagi ng mga customer na mas gusto ang isang bagong uri ng produkto. Gusto niyang bumuo ng 90% confidence interval na ang kalahating haba ay hindi lalampas sa 0.05. Ilang kliyente ang dapat isama sa random na sample?

Solusyon

Sa aming kaso, ang halaga ng z cr = 1.645. Samakatuwid, ang kinakailangang dami ay kinakalkula bilang .

Kung ang tagapamahala ay may dahilan upang maniwala na ang nais na p-value ay, halimbawa, humigit-kumulang 0.3, pagkatapos ay sa pamamagitan ng pagpapalit ng halagang ito sa formula sa itaas, makakakuha tayo ng isang mas maliit na random na sample na halaga, katulad ng 228.

Formula para sa pagtukoy random na laki ng sample sa kaso ng pagkakaiba sa pagitan ng dalawang paraan nakasulat bilang:

.

Halimbawa

May customer service center ang ilang kumpanya ng kompyuter. SA Kamakailan lamang tumaas ang bilang ng mga reklamo ng customer tungkol sa mahinang kalidad ng serbisyo. SA sentro ng serbisyo Mayroong pangunahing dalawang uri ng mga empleyado: ang mga walang gaanong karanasan, ngunit nakatapos ng mga espesyal na kurso sa paghahanda, at ang mga may malawak na praktikal na karanasan, ngunit hindi nakatapos ng mga espesyal na kurso. Nais ng kumpanya na suriin ang mga reklamo ng customer sa nakalipas na anim na buwan at ihambing ang average na bilang ng mga reklamo para sa bawat isa sa dalawang grupo ng mga empleyado. Ipinapalagay na ang mga numero sa mga sample para sa parehong grupo ay magiging pareho. Ilang empleyado ang dapat isama sa sample upang makakuha ng 95% interval na may kalahating haba na hindi hihigit sa 2?

Solusyon

Narito ang σ ots ay isang pagtatantya ng karaniwang paglihis ng parehong mga random na variable sa ilalim ng pagpapalagay na sila ay malapit. Kaya, sa aming problema kailangan naming makuha ang pagtatantya na ito. Ito ay maaaring gawin, halimbawa, tulad ng sumusunod. Ang pagkakaroon ng pagtingin sa data sa mga reklamo ng customer sa nakalipas na anim na buwan, maaaring mapansin ng isang manager na ang bawat empleyado ay karaniwang tumatanggap ng mula 6 hanggang 36 na reklamo. Alam na para sa isang normal na pamamahagi halos lahat ng mga halaga ay hindi hihigit sa tatlong beses na inalis mula sa mean standard deviations, maaaring makatwirang naniniwala siya na:

, mula sa kung saan σ ots = 5.

Ang pagpapalit ng halagang ito sa formula, nakukuha namin .

Formula para sa pagtukoy random na laki ng sample kung sakaling matantya ang pagkakaiba sa pagitan ng mga proporsyon ay may anyo:

Halimbawa

Ang ilang kumpanya ay may dalawang pabrika na gumagawa ng mga katulad na produkto. Nais ng isang manager ng kumpanya na ihambing ang porsyento ng mga may sira na produkto sa parehong mga pabrika. Ayon sa magagamit na impormasyon, ang rate ng depekto sa parehong mga pabrika ay mula 3 hanggang 5%. Ito ay nilayon na bumuo ng 99% confidence interval na may kalahating haba na hindi hihigit sa 0.005 (o 0.5%). Ilang produkto ang dapat piliin mula sa bawat pabrika?

Solusyon

Narito ang p 1ots at p 2ots ay mga pagtatantya ng dalawang hindi kilalang bahagi ng mga depekto sa 1st at 2nd factory. Kung maglalagay tayo ng p 1ots = p 2ots = 0.5, pagkatapos ay makakakuha tayo ng overestimated na halaga para sa n. Ngunit dahil sa aming kaso mayroon kaming ilang priori na impormasyon tungkol sa mga pagbabahaging ito, kinukuha namin ang itaas na pagtatantya ng mga pagbabahagi na ito, katulad ng 0.05. Nakukuha namin

Kapag tinatantya ang ilang parameter ng populasyon mula sa sample na data, kapaki-pakinabang na magbigay hindi lamang pagtatantya ng punto parameter, ngunit nagsasaad din ng agwat ng kumpiyansa na nagpapakita kung saan maaaring nasa ang eksaktong halaga ng tinantyang parameter.

Sa kabanatang ito, nakilala rin namin ang mga quantitative na relasyon na nagpapahintulot sa amin na bumuo ng mga ganoong agwat para sa iba't ibang mga parameter; natutunan ang mga paraan upang makontrol ang haba ng agwat ng kumpiyansa.

Tandaan din na ang problema sa pagtatantya ng mga laki ng sample (ang problema sa pagpaplano ng isang eksperimento) ay maaaring malutas gamit ang mga karaniwang tool ng StatPro, katulad StatPro/Statistical Inference/Sample Size Selection.

Ang "Katren-Style" ay nagpapatuloy sa paglalathala ng cycle ni Konstantin Kravchik tungkol sa medikal na istatistika. Sa dalawang nakaraang artikulo, tinalakay ng may-akda ang pagpapaliwanag ng mga konsepto tulad ng at.

Konstantin Kravchik

Mathematician-analyst. Espesyalista sa larangan istatistikal na pananaliksik sa medisina at humanidades

lungsod ng Moscow

Kadalasan sa mga artikulo sa Klinikal na pananaliksik makakatagpo ka ng mahiwagang parirala: “confidence interval” (95 % CI o 95 % CI - confidence interval). Halimbawa, ang artikulo ay maaaring sumulat: "Upang masuri ang kahalagahan ng mga pagkakaiba, ginamit namin T-test ng mag-aaral na may pagkalkula ng 95 % confidence interval.”

Ano ang halaga ng "95 % confidence interval" at bakit ito kinakalkula?

Ano ang confidence interval? - Ito ang saklaw kung saan ang tunay na populasyon ay nangangahulugan ng kasinungalingan. Mayroon bang "hindi totoo" na mga average? Sa isang kahulugan, oo, ginagawa nila. Sa aming ipinaliwanag na imposibleng sukatin ang parameter ng interes sa buong populasyon, kaya ang mga mananaliksik ay kontento sa isang limitadong sample. Sa sample na ito (halimbawa, batay sa timbang ng katawan) mayroong isang average na halaga (isang tiyak na timbang), kung saan hinuhusgahan namin ang average na halaga sa buong populasyon. Gayunpaman, hindi malamang na ang average na timbang sa isang sample (lalo na ang isang maliit) ay magkakasabay sa average na timbang sa pangkalahatang populasyon. Samakatuwid, mas tama na kalkulahin at gamitin ang hanay ng mga average na halaga ng populasyon.

Halimbawa, isipin na ang 95% confidence interval (95% CI) para sa hemoglobin ay 110 hanggang 122 g/L. Nangangahulugan ito na mayroong 95% na pagkakataon na ang tunay na average na halaga ng hemoglobin sa populasyon ay nasa pagitan ng 110 at 122 g/L. Sa madaling salita, hindi natin alam karaniwan hemoglobin sa pangkalahatang populasyon, ngunit maaari naming ipahiwatig ang isang hanay ng mga halaga para sa katangiang ito na may 95 % na posibilidad.

Partikular na nauugnay ang mga agwat ng kumpiyansa para sa mga pagkakaiba sa mga paraan sa pagitan ng mga grupo, o laki ng epekto kung tawagin ang mga ito.

Sabihin nating ikinumpara natin ang pagiging epektibo ng dalawang paghahanda ng bakal: ang isa na matagal nang nasa merkado at ang isa na kakarehistro pa lang. Pagkatapos ng kurso ng therapy, sinuri namin ang konsentrasyon ng hemoglobin sa mga pinag-aralan na grupo ng mga pasyente, at kinakalkula ng statistical program na ang pagkakaiba sa pagitan ng mga average na halaga ng dalawang grupo ay, na may 95 % na posibilidad, sa saklaw mula 1.72 hanggang 14.36 g/l (Talahanayan 1).

mesa 1. Subukan para sa mga independiyenteng sample
(ang mga pangkat ay inihambing sa antas ng hemoglobin)

Dapat itong bigyang-kahulugan bilang mga sumusunod: sa ilang mga pasyente sa pangkalahatang populasyon na kumukuha bagong gamot, ang hemoglobin ay magiging mas mataas sa average ng 1.72–14.36 g/l kaysa sa mga umiinom ng kilalang gamot.

Sa madaling salita, sa pangkalahatang populasyon, ang pagkakaiba sa average na mga halaga ng hemoglobin sa pagitan ng mga grupo ay nasa loob ng mga limitasyong ito na may 95% na posibilidad. Bahala na ang mananaliksik kung ito ay marami o kaunti. Ang punto ng lahat ng ito ay hindi kami nagtatrabaho sa isang average na halaga, ngunit sa isang hanay ng mga halaga, samakatuwid, mas mapagkakatiwalaan naming tinatantya ang pagkakaiba sa isang parameter sa pagitan ng mga pangkat.

Sa mga pakete ng istatistika, sa pagpapasya ng mananaliksik, maaari mong independiyenteng paliitin o palawakin ang mga hangganan ng agwat ng kumpiyansa. Sa pamamagitan ng pagpapababa ng mga probabilidad ng agwat ng kumpiyansa, pinaliit namin ang hanay ng mga paraan. Halimbawa, sa 90 % CI ang hanay ng mga paraan (o pagkakaiba sa paraan) ay magiging mas makitid kaysa sa 95 %.

Sa kabaligtaran, ang pagtaas ng posibilidad sa 99 % ay nagpapalawak sa hanay ng mga halaga. Kapag naghahambing ng mga grupo, ang mas mababang limitasyon ng CI ay maaaring tumawid sa zero mark. Halimbawa, kung pinalawak namin ang mga hangganan ng agwat ng kumpiyansa sa 99 %, kung gayon ang mga hangganan ng agwat ay mula sa -1 hanggang 16 g/l. Nangangahulugan ito na sa pangkalahatang populasyon ay may mga pangkat, ang pagkakaiba sa pagitan ng kung saan para sa katangiang pinag-aaralan ay katumbas ng 0 (M = 0).

Gamit ang isang confidence interval, maaari mong suriin istatistikal na hypotheses. Kung ang pagitan ng kumpiyansa ay tumawid sa zero na halaga, kung gayon ang null hypothesis, na ipinapalagay na ang mga pangkat ay hindi naiiba sa parameter na pinag-aaralan, ay totoo. Ang halimbawa ay inilarawan sa itaas kung saan pinalawak namin ang mga hangganan sa 99 %. Sa isang lugar sa pangkalahatang populasyon, nakakita kami ng mga grupo na hindi naiiba sa anumang paraan.

95% confidence interval ng pagkakaiba sa hemoglobin, (g/l)


Ipinapakita ng figure ang 95% na agwat ng kumpiyansa para sa pagkakaiba sa ibig sabihin ng mga halaga ng hemoglobin sa pagitan ng dalawang grupo. Ang linya ay dumadaan sa zero mark, samakatuwid mayroong isang pagkakaiba sa pagitan ng mga paraan ng zero, na nagpapatunay sa null hypothesis na ang mga grupo ay hindi naiiba. Ang saklaw ng pagkakaiba sa pagitan ng mga pangkat ay mula -2 hanggang 5 g/L. Nangangahulugan ito na ang hemoglobin ay maaaring bumaba ng 2 g/L o tumaas ng 5 g/L.

Ang pagitan ng kumpiyansa ay napaka mahalagang tagapagpahiwatig. Salamat dito, makikita mo kung ang mga pagkakaiba sa mga grupo ay dahil sa pagkakaiba sa paraan o dahil sa isang malaking sample, dahil sa isang malaking sample ang mga pagkakataon na makahanap ng mga pagkakaiba ay mas malaki kaysa sa isang maliit na sample.

Sa pagsasagawa, maaaring ganito ang hitsura nito. Kumuha kami ng sample ng 1000 tao, sinukat ang mga antas ng hemoglobin at nalaman na ang agwat ng kumpiyansa para sa pagkakaiba sa ibig sabihin ay mula 1.2 hanggang 1.5 g/l. Ang antas ng istatistikal na kahalagahan sa kasong ito p

Nakikita namin na ang konsentrasyon ng hemoglobin ay tumaas, ngunit halos hindi mahahalata, samakatuwid, istatistikal na kahalagahan tumpak na lumitaw dahil sa laki ng sample.

Ang mga pagitan ng kumpiyansa ay maaaring kalkulahin hindi lamang para sa mga paraan, kundi pati na rin para sa mga proporsyon (at mga ratio ng panganib). Halimbawa, interesado kami sa agwat ng kumpiyansa ng mga proporsyon ng mga pasyente na nakamit ang pagpapatawad habang umiinom ng binuong gamot. Ipagpalagay natin na ang 95 % CI para sa mga proporsyon, ibig sabihin, para sa proporsyon ng mga naturang pasyente, ay nasa hanay na 0.60–0.80. Kaya, masasabi nating mayroon ang ating gamot therapeutic effect mula 60 hanggang 80 % ng mga kaso.

Ipagpalagay na mayroon kaming isang malaking bilang ng mga item na may normal na pamamahagi ng ilang mga katangian (halimbawa, isang buong bodega ng mga gulay na may parehong uri, ang laki at bigat nito ay nag-iiba). Gusto mong malaman ang karaniwang mga katangian ng buong batch ng mga kalakal, ngunit wala kang oras o pagnanais na sukatin at timbangin ang bawat gulay. Naiintindihan mo na hindi ito kailangan. Ngunit ilang piraso ang kailangang kunin para sa isang spot check?

Bago magbigay ng ilang mga formula na kapaki-pakinabang para sa sitwasyong ito, alalahanin natin ang ilang notasyon.

Una, kung susukatin natin ang buong bodega ng mga gulay (ang hanay ng mga elementong ito ay tinatawag na pangkalahatang populasyon), malalaman natin sa lahat ng katumpakan na magagamit sa amin ang average na timbang ng buong batch. Tawagin natin itong average X avg .g en . - pangkalahatang average. Alam na natin kung ano ang ganap na natutukoy kung ang ibig sabihin ng halaga at paglihis nito ay kilala . Totoo, habang hindi kami X average na gen s Hindi natin alam ang pangkalahatang populasyon. Maaari lamang kaming kumuha ng isang partikular na sample, sukatin ang mga halaga na kailangan namin at kalkulahin para sa sample na ito pareho ang average na halaga ng X avg at ang standard deviation S na pinili.

Ito ay kilala na kung ang aming sample check ay naglalaman ng isang malaking bilang ng mga elemento (karaniwan ay n ay mas malaki kaysa sa 30), at sila ay kinuha random talaga, pagkatapos ay s ang pangkalahatang populasyon ay halos hindi mag-iiba mula sa pagpili ng S ..

Bilang karagdagan, para sa kaso ng normal na pamamahagi maaari naming gamitin ang mga sumusunod na formula:

May posibilidad na 95%


May posibilidad na 99%



SA pangkalahatang pananaw may posibilidad na P (t)


Ang kaugnayan sa pagitan ng halaga ng t at ng probabilidad na halaga P (t), kung saan nais nating malaman ang pagitan ng kumpiyansa, ay maaaring kunin mula sa sumusunod na talahanayan:


Kaya, natukoy namin kung saang saklaw ang average na halaga para sa populasyon ay namamalagi (na may ibinigay na posibilidad).

Maliban kung mayroon kaming sapat na malaking sample, hindi namin masasabi iyon populasyon may s = S piliin Bilang karagdagan, sa kasong ito ang pagiging malapit ng sample sa normal na pamamahagi ay may problema. Sa kasong ito, ginagamit din namin ang S select sa halip s sa formula:




ngunit ang halaga ng t para sa isang nakapirming probabilidad na P(t) ay depende sa bilang ng mga elemento sa sample n. Kung mas malaki ang n, mas malapit ang magreresultang agwat ng kumpiyansa sa halagang ibinigay ng formula (1). Ang mga halaga ng t sa kasong ito ay kinuha mula sa isa pang talahanayan (T-test ng Mag-aaral), na ipinakita namin sa ibaba:

Ang mga halaga ng t-test ng mag-aaral para sa posibilidad na 0.95 at 0.99


Halimbawa 3. 30 katao ang random na pinili mula sa mga empleyado ng kumpanya. Ayon sa sample, lumabas na ang average na suweldo (bawat buwan) ay 30 libong rubles na may karaniwang paglihis ng 5 libong rubles. Tukuyin ang average na suweldo sa kumpanya na may posibilidad na 0.99.

Solusyon: Ayon sa kundisyon mayroon kaming n = 30, X avg. =30000, S=5000, P = 0.99. Upang mahanap ang agwat ng kumpiyansa, gagamitin namin ang formula na tumutugma sa t test ng Estudyante. Mula sa talahanayan para sa n = 30 at P = 0.99 nakita namin ang t = 2.756, samakatuwid,


mga. hinahanap na katiwala pagitan 27484< Х ср.ген < 32516.

Kaya, na may posibilidad na 0.99 maaari nating sabihin na ang pagitan (27484; 32516) ay naglalaman sa loob mismo ng average na suweldo sa kumpanya.

Inaasahan namin na gagamitin mo ang pamamaraang ito, at hindi kinakailangan na mayroon kang isang talahanayan sa bawat oras. Ang mga kalkulasyon ay maaaring awtomatikong isagawa sa Excel. Habang nasa Excel file, i-click ang fx button sa tuktok na menu. Pagkatapos, piliin ang uri ng "statistical" sa mga function, at mula sa iminungkahing listahan sa window - STUDAR DISCOVER. Pagkatapos, sa prompt, paglalagay ng cursor sa field na "probability", ipasok ang halaga ng inverse probability (i.e. sa aming kaso, sa halip na probabilidad na 0.95, kailangan mong i-type ang probabilidad na 0.05). Malamang spreadsheet ay pinagsama-sama sa paraang ang resulta ay sumasagot sa tanong na may posibilidad na tayo ay magkamali. Katulad nito, sa Degree of Freedom field, maglagay ng value (n-1) para sa iyong sample.



Bago sa site

>

Pinaka sikat