Bahay Oral cavity Hanapin ang 95 confidence interval. Mga sample at agwat ng kumpiyansa

Hanapin ang 95 confidence interval. Mga sample at agwat ng kumpiyansa

Agwat ng kumpiyansa para sa inaasahan sa matematika - ito ay isang agwat na kinakalkula mula sa data na, na may kilalang probabilidad, ay naglalaman ng mathematical na inaasahan ng pangkalahatang populasyon. Ang natural na pagtatantya para sa mathematical na inaasahan ay ang arithmetic mean ng mga naobserbahang halaga nito. Samakatuwid, sa buong aralin ay gagamitin natin ang mga katagang "average" at "average na halaga". Sa mga problema sa pagkalkula ng agwat ng kumpiyansa, ang isang sagot na kadalasang kinakailangan ay tulad ng "Ang agwat ng kumpiyansa ng average na numero [halaga sa isang partikular na problema] ay mula sa [mas maliit na halaga] hanggang sa [mas malaking halaga]." Gamit ang isang agwat ng kumpiyansa, maaari mong suriin hindi lamang ang mga average na halaga, kundi pati na rin ang tiyak na timbang ng isang partikular na katangian ng pangkalahatang populasyon. Ang mga average na halaga, dispersion, standard deviation at error, kung saan makakarating tayo sa mga bagong kahulugan at formula, ay tinalakay sa aralin Mga katangian ng sample at populasyon .

Mga pagtatantya ng punto at pagitan ng mean

Kung ang average na halaga ng populasyon ay tinatantya ng isang numero (punto), kung gayon ang isang tiyak na average, na kinakalkula mula sa isang sample ng mga obserbasyon, ay kinuha bilang isang pagtatantya ng hindi kilalang average na halaga ng populasyon. Sa kasong ito, ang halaga ng average na sample ay random variable- hindi tumutugma sa average na halaga ng populasyon. Samakatuwid, kapag ipinapahiwatig ang ibig sabihin ng sample, dapat mong sabay na ipahiwatig ang error sa sampling. Ang sukat ng error sa sampling ay ang karaniwang error, na ipinahayag sa parehong mga yunit bilang ang ibig sabihin. Samakatuwid, ang sumusunod na notasyon ay kadalasang ginagamit: .

Kung ang pagtatantya ng average ay kailangang iugnay sa isang tiyak na posibilidad, kung gayon ang parameter ng interes sa populasyon ay dapat na tantyahin hindi sa pamamagitan ng isang numero, ngunit sa pamamagitan ng isang pagitan. Ang agwat ng kumpiyansa ay isang agwat kung saan, na may tiyak na posibilidad P matatagpuan ang halaga ng tinantyang indicator ng populasyon. Ang pagitan ng kumpiyansa kung saan ito ay malamang P = 1 - α ang random na variable ay matatagpuan, kinakalkula tulad ng sumusunod:

,

α = 1 - P, na makikita sa apendiks sa halos anumang aklat sa mga istatistika.

Sa pagsasagawa, hindi alam ang ibig sabihin at pagkakaiba ng populasyon, kaya ang pagkakaiba ng populasyon ay pinapalitan ng sample na variance, at ang ibig sabihin ng populasyon ng sample mean. Kaya, ang agwat ng kumpiyansa sa karamihan ng mga kaso ay kinakalkula tulad ng sumusunod:

.

Ang formula ng confidence interval ay maaaring gamitin upang tantyahin ang ibig sabihin ng populasyon kung

  • ang karaniwang paglihis ng populasyon ay kilala;
  • o ang karaniwang paglihis ng populasyon ay hindi alam, ngunit ang laki ng sample ay higit sa 30.

Ang sample mean ay isang walang pinapanigan na pagtatantya ng average ng populasyon. Sa turn, ang sample variance ay hindi isang walang pinapanigan na pagtatantya ng pagkakaiba-iba ng populasyon. Upang makakuha ng walang pinapanigan na pagtatantya ng pagkakaiba-iba ng populasyon sa sample na formula ng pagkakaiba, laki ng sample n dapat palitan ng n-1.

Halimbawa 1. Ang impormasyon ay nakolekta mula sa 100 random na napiling mga cafe sa isang tiyak na lungsod na ang average na bilang ng mga empleyado sa kanila ay 10.5 na may karaniwang paglihis na 4.6. Tukuyin agwat ng kumpiyansa 95% ng mga manggagawa sa cafe.

nasaan ang kritikal na halaga ng karaniwang normal na distribusyon para sa antas ng kahalagahan α = 0,05 .

Kaya, ang 95% confidence interval para sa average na bilang ng mga empleyado ng cafe ay mula 9.6 hanggang 11.4.

Halimbawa 2. Para sa isang random na sample mula sa populasyon ng 64 na mga obserbasyon, ang mga sumusunod na kabuuang halaga ay kinakalkula:

kabuuan ng mga halaga sa mga obserbasyon,

kabuuan ng mga squared deviations ng mga halaga mula sa mean .

Kalkulahin ang 95% na agwat ng kumpiyansa para sa inaasahan sa matematika.

Kalkulahin natin ang karaniwang paglihis:

,

Kalkulahin natin ang average na halaga:

.

Pinapalitan namin ang mga halaga sa expression para sa agwat ng kumpiyansa:

nasaan ang kritikal na halaga ng karaniwang normal na distribusyon para sa antas ng kahalagahan α = 0,05 .

Nakukuha namin:

Kaya, ang 95% na agwat ng kumpiyansa para sa inaasahan ng matematika ng sample na ito ay mula 7.484 hanggang 11.266.

Halimbawa 3. Para sa random na sample ng populasyon ng 100 obserbasyon, ang kinakalkula na mean ay 15.2 at ang standard deviation ay 3.2. Kalkulahin ang 95% confidence interval para sa inaasahang halaga, pagkatapos ay ang 99% confidence interval. Kung ang sample power at ang variation nito ay mananatiling hindi nagbabago at ang confidence coefficient ay tumaas, magpapaliit ba o lalawak ang confidence interval?

Pinapalitan namin ang mga halagang ito sa expression para sa agwat ng kumpiyansa:

nasaan ang kritikal na halaga ng karaniwang normal na distribusyon para sa antas ng kahalagahan α = 0,05 .

Nakukuha namin:

.

Kaya, ang 95% na agwat ng kumpiyansa para sa mean ng sample na ito ay mula 14.57 hanggang 15.82.

Muli naming pinapalitan ang mga halagang ito sa expression para sa agwat ng kumpiyansa:

nasaan ang kritikal na halaga ng karaniwang normal na distribusyon para sa antas ng kahalagahan α = 0,01 .

Nakukuha namin:

.

Kaya, ang 99% na agwat ng kumpiyansa para sa mean ng sample na ito ay mula 14.37 hanggang 16.02.

Tulad ng nakikita natin, habang tumataas ang koepisyent ng kumpiyansa, tumataas din ang kritikal na halaga ng karaniwang normal na distribusyon, at, dahil dito, ang mga panimulang punto at pagtatapos ng pagitan ay matatagpuan sa malayo mula sa mean, at sa gayon ang agwat ng kumpiyansa para sa pag-asa sa matematika ay tumataas. .

Mga pagtatantya ng punto at pagitan ng tiyak na gravity

Ang bahagi ng ilang sample na katangian ay maaaring bigyang-kahulugan bilang pagtatantya ng punto tiyak na gravity p ng parehong katangian sa pangkalahatang populasyon. Kung kailangang iugnay ang value na ito sa probabilidad, dapat kalkulahin ang confidence interval ng specific gravity p katangian sa populasyon na may posibilidad P = 1 - α :

.

Halimbawa 4. Sa ilang lungsod mayroong dalawang kandidato A At B tumatakbong mayor. Ang 200 residente ng lungsod ay random na na-survey, kung saan 46% ang tumugon na iboboto nila ang kandidato A, 26% - para sa kandidato B at 28% ang hindi alam kung sino ang kanilang iboboto. Tukuyin ang 95% confidence interval para sa proporsyon ng mga residente ng lungsod na sumusuporta sa kandidato A.

Ang anumang sample ay nagbibigay lamang ng tinatayang ideya ng pangkalahatang populasyon, at ang lahat ng sample na istatistikal na katangian (mean, mode, variance...) ay ilang pagtatantya o pagsasabi ng pagtatantya ng mga pangkalahatang parameter, na sa karamihan ng mga kaso ay hindi posibleng kalkulahin dahil sa hindi naa-access ng pangkalahatang populasyon (Figure 20).

Figure 20. Sampling error

Ngunit maaari mong tukuyin ang agwat kung saan, na may isang tiyak na antas ng posibilidad, ang tunay (pangkalahatan) na halaga ng istatistikal na katangian ay namamalagi. Ang agwat na ito ay tinatawag d agwat ng kumpiyansa (CI).

Kaya ang pangkalahatang average na halaga na may posibilidad na 95% ay nasa loob

mula hanggang, (20)

saan t halaga ng talahanayan Pagsusulit ng mag-aaral para sa α =0.05 at f= n-1

Ang isang 99% CI ay maaari ding matagpuan, sa kasong ito t pinili para sa α =0,01.

Ano ang praktikal na kahalagahan ng isang agwat ng kumpiyansa?

    Ang isang malawak na agwat ng kumpiyansa ay nagpapahiwatig na ang sample mean ay hindi tumpak na sumasalamin sa ibig sabihin ng populasyon. Ito ay kadalasang dahil sa hindi sapat na laki ng sample, o sa heterogeneity nito, i.e. malaking pagpapakalat. Binibigyan nila pareho Malaking pagkakamali average at, nang naaayon, isang mas malawak na CI. At ito ang batayan para bumalik sa yugto ng pagpaplano ng pananaliksik.

    Ang itaas at mas mababang mga limitasyon ng CI ay nagbibigay ng isang pagtatantya kung ang mga resulta ay magiging makabuluhan sa klinikal

Isaalang-alang natin ang ilang detalye sa tanong ng istatistikal at klinikal na kahalagahan ng mga resulta ng pag-aaral ng mga katangian ng grupo. Tandaan natin na ang gawain ng mga istatistika ay tuklasin ang hindi bababa sa ilang mga pagkakaiba sa pangkalahatang populasyon batay sa sample na data. Ang hamon para sa mga clinician ay tuklasin ang mga pagkakaiba (hindi lamang ang anumang pagkakaiba) na makakatulong sa pagsusuri o paggamot. At ang mga istatistikal na konklusyon ay hindi palaging batayan para sa mga klinikal na konklusyon. Kaya, ang makabuluhang pagbaba ng hemoglobin ng 3 g/l ayon sa istatistika ay hindi isang dahilan para sa pag-aalala. At, sa kabaligtaran, kung ang ilang problema sa katawan ng tao ay hindi laganap sa antas ng buong populasyon, hindi ito dahilan upang hindi harapin ang problemang ito.

Isasaalang-alang namin ang sitwasyong ito sa halimbawa.

Ang mga mananaliksik ay nagtaka kung ang mga batang lalaki na dumanas ng ilang uri ng nakakahawang sakit ay nahuhuli sa kanilang mga kapantay sa paglaki. Para sa layuning ito, ito ay isinagawa sample survey, kung saan nakibahagi ang 10 batang lalaki na dumanas ng sakit na ito. Ang mga resulta ay ipinakita sa Talahanayan 23.

Talahanayan 23. Mga resulta ng pagpoproseso ng istatistika

mababang limitasyon

itaas na limitasyon

Mga Pamantayan (cm)

karaniwan

Mula sa mga kalkulasyon na ito ay sumusunod na ang sample karaniwang taas mga batang lalaki 10 taong gulang na nagdusa ng ilan impeksyon, malapit sa normal (132.5 cm). Gayunpaman, ang mas mababang limitasyon ng agwat ng kumpiyansa (126.6 cm) ay nagpapahiwatig na mayroong 95% na posibilidad na ang tunay na average na taas ng mga batang ito ay tumutugma sa konsepto ng "maikling taas", i.e. ang mga batang ito ay bansot.

Sa halimbawang ito, klinikal na makabuluhan ang mga resulta ng mga kalkulasyon ng agwat ng kumpiyansa.

Ang isa sa mga pamamaraan para sa paglutas ng mga problema sa istatistika ay ang pagkalkula ng agwat ng kumpiyansa. Ginagamit ito bilang isang mas kanais-nais na alternatibo pagtatantya ng punto na may maliit na sample size. Dapat pansinin na ang proseso ng pagkalkula ng agwat ng kumpiyansa mismo ay medyo kumplikado. Ngunit pinapayagan ka ng mga tool sa programa ng Excel na gawing simple ito. Alamin natin kung paano ito ginagawa sa pagsasanay.

Ginagamit ang paraang ito para sa pagtatantya ng pagitan ng iba't ibang istatistikal na dami. Ang pangunahing gawain ng pagkalkula na ito ay upang mapupuksa ang mga kawalan ng katiyakan ng pagtatantya ng punto.

Sa Excel, mayroong dalawang pangunahing opsyon para sa pagsasagawa ng mga kalkulasyon gamit ang pamamaraang ito: kapag alam ang pagkakaiba at kapag hindi alam. Sa unang kaso, ang function ay ginagamit para sa mga kalkulasyon TIWALA.NORM, at sa pangalawa - PINAGTItiwala.ESTUDYANTE.

Paraan 1: function ng CONFIDENCE NORM

Operator TIWALA.NORM, na kabilang sa pangkat ng istatistika ng mga pag-andar, ay unang lumitaw sa Excel 2010. Ang mga naunang bersyon ng program na ito ay gumagamit ng analogue nito TIWALA. Ang layunin ng operator na ito ay kalkulahin ang isang normal na ibinabahagi na agwat ng kumpiyansa para sa average ng populasyon.

Ang syntax nito ay ang mga sumusunod:

CONFIDENCE.NORM(alpha;standard_off;size)

"Alpha"— isang argumentong nagsasaad ng antas ng kahalagahan na ginagamit upang kalkulahin ang antas ng kumpiyansa. Ang antas ng kumpiyansa ay katumbas ng sumusunod na expression:

(1-"Alpha")*100

« Karaniwang lihis» - Ito ay isang argumento, ang kakanyahan nito ay malinaw sa pangalan. Ito ang karaniwang paglihis ng iminungkahing sample.

"Laki"— argumento na tumutukoy sa laki ng sample.

Ang lahat ng mga argumento sa operator na ito ay kinakailangan.

Function TIWALA ay may eksaktong parehong mga argumento at posibilidad tulad ng nauna. Ang syntax nito ay:

TRUST(alpha, standard_off, size)

Tulad ng nakikita mo, ang mga pagkakaiba ay nasa pangalan lamang ng operator. Tinukoy na function para sa mga dahilan ng compatibility, iniwan sa Excel 2010 at mas bagong mga bersyon sa isang espesyal na kategorya "Pagkatugma". Sa mga bersyon ng Excel 2007 at mas maaga, ito ay naroroon sa pangunahing pangkat ng mga istatistikal na operator.

Ang limitasyon sa pagitan ng kumpiyansa ay tinutukoy gamit ang sumusunod na formula:

X+(-)NORMA NG PAGTITIWALA

saan X ay ang average na halaga ng sample, na matatagpuan sa gitna ng napiling hanay.

Ngayon tingnan natin kung paano kalkulahin ang agwat ng kumpiyansa gamit ang isang partikular na halimbawa. 12 mga pagsubok ang isinagawa, na nagresulta sa iba't ibang mga resulta, na nakalista sa talahanayan. Ito ang ating kabuuan. Ang standard deviation ay 8. Kailangan nating kalkulahin ang confidence interval sa 97% confidence level.

  1. Piliin ang cell kung saan ipapakita ang resulta ng pagproseso ng data. Mag-click sa pindutan "Insert Function".
  2. Lumilitaw Function Wizard. Pumunta sa kategorya "Istatistika" at i-highlight ang pangalan "TIWALA.NORM". Pagkatapos nito, mag-click sa pindutan "OK".
  3. Bubukas ang window ng mga argumento. Ang mga patlang nito ay natural na tumutugma sa mga pangalan ng mga argumento.
    Ilagay ang cursor sa unang field - "Alpha". Dito dapat nating ipahiwatig ang antas ng kahalagahan. Sa ating natatandaan, ang ating antas ng pagtitiwala ay 97%. Kasabay nito, sinabi namin na ito ay kinakalkula sa ganitong paraan:

    (1-level ng tiwala)/100

    Iyon ay, pinapalitan ang halaga, nakukuha natin:

    Sa pamamagitan ng mga simpleng kalkulasyon nalaman natin na ang argumento "Alpha" katumbas 0,03 . Ilagay ang value na ito sa field.

    Tulad ng nalalaman, ayon sa kondisyon ang karaniwang paglihis ay katumbas ng 8 . Samakatuwid, sa larangan "Karaniwang lihis" isulat lamang ang numerong ito.

    Sa field "Laki" kailangan mong ipasok ang bilang ng mga elemento ng pagsubok na ginawa. Tulad ng naaalala natin, ang kanilang 12 . Ngunit para ma-automate ang formula at hindi ito i-edit sa tuwing magsasagawa tayo ng bagong pagsubok, itakda natin ang halagang ito hindi sa ordinaryong numero, ngunit gamit ang operator. SURIIN. Kaya, ilagay natin ang cursor sa field "Laki", at pagkatapos ay mag-click sa tatsulok, na matatagpuan sa kaliwa ng formula bar.

    Lumilitaw ang isang listahan ng mga kamakailang ginamit na function. Kung ang operator SURIIN ay ginamit mo kamakailan, dapat itong nasa listahang ito. Sa kasong ito, kailangan mo lamang i-click ang pangalan nito. Kung hindi, kung hindi mo mahanap ito, pagkatapos ay pumunta sa punto "Iba pang mga function...".

  4. Lumilitaw ang isang pamilyar na Function Wizard. Bumalik tayo muli sa grupo "Istatistika". Pina-highlight namin ang pangalan doon "SURIIN". Mag-click sa pindutan "OK".
  5. Ang window ng argumento para sa pahayag sa itaas ay lilitaw. Ang function na ito ay idinisenyo upang kalkulahin ang bilang ng mga cell sa isang tinukoy na hanay na naglalaman ng mga numerong halaga. Ang syntax nito ay ang mga sumusunod:

    COUNT(value1,value2,…)

    Grupo ng argumento "Mga halaga" ay isang reference sa hanay kung saan mo gustong kalkulahin ang bilang ng mga cell na puno ng numeric data. Maaaring magkaroon ng hanggang 255 ganoong mga argumento sa kabuuan, ngunit sa aming kaso kailangan lang namin ng isa.

    Ilagay ang cursor sa field "Halaga1" at, habang pinipigilan ang kaliwang pindutan ng mouse, piliin sa sheet ang hanay na naglalaman ng aming koleksyon. Pagkatapos ang kanyang address ay ipapakita sa field. Mag-click sa pindutan "OK".

  6. Pagkatapos nito, isasagawa ng application ang pagkalkula at ipapakita ang resulta sa cell kung saan ito matatagpuan. Sa aming partikular na kaso, ang formula ay ganito ang hitsura:

    CONFIDENCE NORM(0.03,8,COUNT(B2:B13))

    Ang kabuuang resulta ng mga kalkulasyon ay 5,011609 .

  7. Ngunit hindi lang iyon. Tulad ng natatandaan natin, ang limitasyon sa pagitan ng kumpiyansa ay kinakalkula sa pamamagitan ng pagdaragdag at pagbabawas ng resulta ng pagkalkula mula sa sample mean. TIWALA.NORM. Sa ganitong paraan, kinakalkula ang kanan at kaliwang mga hangganan ng agwat ng kumpiyansa, ayon sa pagkakabanggit. Ang sample mean mismo ay maaaring kalkulahin gamit ang operator AVERAGE.

    Ang operator na ito ay idinisenyo upang kalkulahin ang arithmetic mean ng isang napiling hanay ng mga numero. Mayroon itong sumusunod na medyo simpleng syntax:

    AVERAGE(number1,number2,…)

    Pangangatwiran "Numero" maaaring magkahiwalay numerical value, at isang link sa mga cell o kahit sa buong hanay na naglalaman ng mga ito.

    Kaya, piliin ang cell kung saan ipapakita ang pagkalkula ng average na halaga, at mag-click sa pindutan "Insert Function".

  8. Nagbubukas Function Wizard. Balik sa kategorya "Istatistika" at pumili ng pangalan mula sa listahan "AVERAGE". Gaya ng nakasanayan, mag-click sa pindutan "OK".
  9. Bubukas ang window ng mga argumento. Ilagay ang cursor sa field "Number1" at pagpindot sa kaliwang pindutan ng mouse, piliin ang buong hanay ng mga halaga. Matapos ipakita ang mga coordinate sa field, mag-click sa pindutan "OK".
  10. Pagkatapos AVERAGE ipinapakita ang resulta ng pagkalkula sa isang elemento ng sheet.
  11. Gumagawa kami ng kalkulasyon kanang hangganan agwat ng kumpiyansa. Upang gawin ito, pumili ng isang hiwalay na cell at ilagay ang sign «=» at dagdagan ang mga nilalaman ng mga elemento ng sheet kung saan matatagpuan ang mga resulta ng mga pagkalkula ng function AVERAGE At TIWALA.NORM. Upang maisagawa ang pagkalkula, pindutin ang pindutan Pumasok. Sa aming kaso, nakuha namin ang sumusunod na formula:

    Resulta ng pagkalkula: 6,953276

  12. Sa parehong paraan, kinakalkula namin ang kaliwang limitasyon ng agwat ng kumpiyansa, sa pagkakataong ito lamang mula sa resulta ng pagkalkula AVERAGE ibawas ang resulta ng pagkalkula ng operator TIWALA.NORM. Ang resultang pormula para sa aming halimbawa ay ang sumusunod na uri:

    Resulta ng pagkalkula: -3,06994

  13. Sinubukan naming ilarawan nang detalyado ang lahat ng mga hakbang para sa pagkalkula ng agwat ng kumpiyansa, kaya inilarawan namin nang detalyado ang bawat formula. Ngunit maaari mong pagsamahin ang lahat ng mga aksyon sa isang formula. Ang pagkalkula ng tamang hangganan ng agwat ng kumpiyansa ay maaaring isulat tulad ng sumusunod:

    AVERAGE(B2:B13)+CONFIDENCE.NORM(0.03,8,COUNT(B2:B13))

  14. Ang isang katulad na pagkalkula para sa kaliwang hangganan ay magiging ganito:

    AVERAGE(B2:B13)-CONFIDENCE.NORM(0.03,8,COUNT(B2:B13))

Paraan 2: TRUSTED STUDENT function

Bilang karagdagan, ang Excel ay may isa pang function na nauugnay sa pagkalkula ng agwat ng kumpiyansa - PINAGTItiwala.ESTUDYANTE. Ito ay lumitaw lamang sa Excel 2010. Kinakalkula ng operator na ito ang pagitan ng kumpiyansa ng populasyon gamit ang pamamahagi ng Mag-aaral. Ito ay napaka-maginhawang gamitin kapag ang pagkakaiba at, nang naaayon, ang karaniwang paglihis ay hindi alam. Ang operator syntax ay:

CONFIDENCE.STUDENT(alpha,standard_off,size)

Tulad ng nakikita mo, ang mga pangalan ng mga operator ay nanatiling hindi nagbabago sa kasong ito.

Tingnan natin kung paano kalkulahin ang mga hangganan ng isang agwat ng kumpiyansa na may hindi kilalang standard deviation gamit ang halimbawa ng parehong populasyon na isinasaalang-alang namin sa nakaraang pamamaraan. Kunin natin ang antas ng tiwala bilang huling pagkakataon sa 97%.

  1. Piliin ang cell kung saan isasagawa ang pagkalkula. Mag-click sa pindutan "Insert Function".
  2. Sa binuksan Function Wizard pumunta sa kategorya "Istatistika". Pumili ng pangalan "TRUSTED STUDENT". Mag-click sa pindutan "OK".
  3. Ang window ng mga argumento para sa tinukoy na operator ay inilunsad.

    Sa field "Alpha", dahil ang antas ng kumpiyansa ay 97%, isinusulat namin ang numero 0,03 . Sa pangalawang pagkakataon ay hindi kami magtatagal sa mga prinsipyo ng pagkalkula ng parameter na ito.

    Pagkatapos nito, ilagay ang cursor sa field "Karaniwang lihis". Sa pagkakataong ito ang indicator na ito ay hindi alam sa amin at kailangang kalkulahin. Ginagawa ito gamit ang isang espesyal na function - STDEV.V. Upang buksan ang window ng operator na ito, mag-click sa tatsulok sa kaliwa ng formula bar. Kung hindi namin mahanap ang nais na pangalan sa listahan na bubukas, pagkatapos ay pumunta sa item "Iba pang mga function...".

  4. Nagsisimula Function Wizard. Lumipat sa kategorya "Istatistika" at markahan ang pangalan dito "STDEV.B". Pagkatapos ay mag-click sa pindutan "OK".
  5. Bubukas ang window ng mga argumento. Ang gawain ng operator STDEV.V ay upang matukoy ang standard deviation ng isang sample. Mukhang ganito ang syntax nito:

    STANDARD DEVIATION.B(number1;number2;…)

    Ito ay hindi mahirap hulaan na ang argumento "Numero" ay ang address ng elemento ng pagpili. Kung ang pagpili ay inilagay sa isang array, pagkatapos ay maaari kang gumamit lamang ng isang argumento upang magbigay ng isang link sa hanay na ito.

    Ilagay ang cursor sa field "Number1" at, gaya ng nakasanayan, pagpindot sa kaliwang pindutan ng mouse, piliin ang koleksyon. Matapos ang mga coordinate ay nasa field, huwag magmadali upang pindutin ang pindutan "OK", dahil magiging mali ang resulta. Una kailangan nating bumalik sa window ng mga argumento ng operator PINAGTItiwala.ESTUDYANTE upang idagdag ang huling argumento. Upang gawin ito, mag-click sa kaukulang pangalan sa formula bar.

  6. Ang window ng argumento para sa pamilyar na function ay bubukas muli. Ilagay ang cursor sa field "Laki". Muli, mag-click sa tatsulok na pamilyar na tayo upang pumunta sa pagpili ng mga operator. Tulad ng naiintindihan mo, kailangan namin ng isang pangalan "SURIIN". Simula nung ginamit namin function na ito kapag nagkalkula sa nakaraang pamamaraan, ito ay naroroon sa listahang ito, kaya i-click lamang ito. Kung hindi mo ito mahanap, pagkatapos ay sundin ang algorithm na inilarawan sa unang paraan.
  7. Sabay sa window ng arguments SURIIN, ilagay ang cursor sa field "Number1" at habang pinipigilan ang pindutan ng mouse, piliin ang koleksyon. Pagkatapos ay mag-click sa pindutan "OK".
  8. Pagkatapos nito, ang programa ay nagsasagawa ng pagkalkula at ipinapakita ang halaga ng pagitan ng kumpiyansa.
  9. Upang matukoy ang mga hangganan, kakailanganin nating kalkulahin muli ang sample mean. Ngunit, ibinigay na ang pagkalkula algorithm gamit ang formula AVERAGE katulad ng sa nakaraang pamamaraan, at kahit na ang resulta ay hindi nagbago, hindi namin ito tatalakayin nang detalyado sa pangalawang pagkakataon.
  10. Pagdaragdag ng mga resulta ng pagkalkula AVERAGE At PINAGTItiwala.ESTUDYANTE, nakuha namin ang tamang hangganan ng agwat ng kumpiyansa.
  11. Pagbabawas mula sa mga resulta ng pagkalkula ng operator AVERAGE resulta ng pagkalkula PINAGTItiwala.ESTUDYANTE, mayroon kaming kaliwang limitasyon ng agwat ng kumpiyansa.
  12. Kung ang pagkalkula ay nakasulat sa isang formula, ang pagkalkula ng tamang hangganan sa aming kaso ay magiging ganito:

    AVERAGE(B2:B13)+CONFIDENCE.STUDENT(0.03,STDEV.B(B2:B13),COUNT(B2:B13))

  13. Alinsunod dito, ang formula para sa pagkalkula ng kaliwang hangganan ay magiging ganito:

    AVERAGE(B2:B13)-CONFIDENCE.STUDENT(0.03,STDEV.B(B2:B13),COUNT(B2:B13))

Tulad ng nakikita mo, ang mga tool Mga programang Excel gawing posible na makabuluhang pasimplehin ang pagkalkula ng agwat ng kumpiyansa at mga hangganan nito. Para sa mga layuning ito, ang mga hiwalay na operator ay ginagamit para sa mga sample na ang pagkakaiba ay kilala at hindi alam.

Target– turuan ang mga mag-aaral ng mga algorithm para sa pagkalkula ng mga pagitan ng kumpiyansa ng mga istatistikal na parameter.

Kapag nagpoproseso ng data sa istatistika, ang kinakalkulang arithmetic mean, coefficient of variation, correlation coefficient, difference criteria at iba pang point statistics ay dapat makatanggap ng quantitative confidence limits, na nagpapahiwatig ng posibleng pagbabago ng indicator sa mas maliit at malalaking direksyon sa loob ng confidence interval.

Halimbawa 3.1 . Ang pamamahagi ng calcium sa serum ng dugo ng mga unggoy, tulad ng dati nang itinatag, ay nailalarawan sa pamamagitan ng mga sumusunod na sample indicator: = 11.94 mg%; = 0.127 mg%; n= 100. Kinakailangang matukoy ang agwat ng kumpiyansa para sa pangkalahatang average ( ) na may posibilidad na may kumpiyansa P = 0,95.

Ang pangkalahatang average ay matatagpuan na may tiyak na posibilidad sa pagitan:

, Saan – sample na arithmetic mean; t- pagsusulit ng mag-aaral; – pagkakamali ng arithmetic mean.

Gamit ang talahanayan na "Mga halaga ng t-test ng mag-aaral" nakita namin ang halaga na may posibilidad na kumpiyansa na 0.95 at ang bilang ng mga antas ng kalayaan k= 100-1 = 99. Ito ay katumbas ng 1.982. Kasama ang mga halaga ng arithmetic mean at statistical error, pinapalitan namin ito sa formula:

o 11.69
12,19

Kaya, na may posibilidad na 95%, masasabi na ang pangkalahatang average ng normal na distribusyon na ito ay nasa pagitan ng 11.69 at 12.19 mg%.

Halimbawa 3.2 . Tukuyin ang mga limitasyon ng 95% confidence interval para sa pangkalahatang pagkakaiba-iba () pamamahagi ng calcium sa dugo ng mga unggoy, kung ito ay kilala na
= 1.60, sa n = 100.

Upang malutas ang problema maaari mong gamitin ang sumusunod na formula:

saan – statistical error ng dispersion.

Nahanap namin ang sampling variance error gamit ang formula:
. Ito ay katumbas ng 0.11. Ibig sabihin t- criterion na may posibilidad na kumpiyansa na 0.95 at ang bilang ng mga antas ng kalayaan k= 100–1 = 99 ay kilala mula sa nakaraang halimbawa.

Gamitin natin ang formula at makuha ang:

o 1.38
1,82

Mas tumpak, ang agwat ng kumpiyansa ng pangkalahatang pagkakaiba ay maaaring mabuo gamit ang (chi-square) - Pearson test. Ang mga kritikal na puntos para sa pamantayang ito ay ibinibigay sa isang espesyal na talahanayan. Kapag ginagamit ang pamantayan Upang makabuo ng agwat ng kumpiyansa, ginagamit ang isang dalawang panig na antas ng kahalagahan. Para sa mas mababang limitasyon, ang antas ng kahalagahan ay kinakalkula gamit ang formula
, para sa tuktok -
. Halimbawa, para sa antas ng kumpiyansa = 0,99= 0,010,= 0.990. Alinsunod dito, ayon sa talahanayan ng pamamahagi ng mga kritikal na halaga , na may kalkuladong antas ng kumpiyansa at bilang ng mga antas ng kalayaan k= 100 – 1= 99, hanapin ang mga halaga
At
. Nakukuha namin
katumbas ng 135.80, at
katumbas ng 70.06.

Upang mahanap ang mga limitasyon ng kumpiyansa para sa pangkalahatang pagkakaiba-iba gamit Gamitin natin ang mga formula: para sa mas mababang hangganan
, para sa upper bound
. Palitan natin ang mga nahanap na halaga para sa data ng problema sa mga formula:
= 1,17;
= 2.26. Kaya, na may posibilidad ng kumpiyansa P= 0.99 o 99% pangkalahatang pagkakaiba ay nasa hanay mula 1.17 hanggang 2.26 mg% kasama.

Halimbawa 3.3 . Sa 1000 buto ng trigo mula sa batch na natanggap sa elevator, 120 buto ang natagpuang infected ng ergot. Kinakailangang matukoy ang posibleng mga hangganan ng pangkalahatang proporsyon ng mga nahawaang buto sa isang naibigay na batch ng trigo.

Maipapayo na matukoy ang mga limitasyon ng kumpiyansa para sa pangkalahatang bahagi para sa lahat ng posibleng mga halaga nito gamit ang formula:

,

saan n - bilang ng mga obserbasyon; m– ganap na sukat ng isa sa mga grupo; t- normalized na paglihis.

Ang sample na proporsyon ng mga nahawaang buto ay
o 12%. May posibilidad na may kumpiyansa R= 95% normalized deviation ( t-Pagsusulit ng mag-aaral sa k =
)t = 1,960.

Pinapalitan namin ang magagamit na data sa formula:

Kaya't ang mga hangganan ng agwat ng kumpiyansa ay katumbas ng = 0.122–0.041 = 0.081, o 8.1%; = 0.122 + 0.041 = 0.163, o 16.3%.

Kaya, na may posibilidad na kumpiyansa na 95% masasabi na ang pangkalahatang proporsyon ng mga nahawaang binhi ay nasa pagitan ng 8.1 at 16.3%.

Halimbawa 3.4 . Ang koepisyent ng pagkakaiba-iba na nagpapakilala sa pagkakaiba-iba ng calcium (mg%) sa serum ng dugo ng mga unggoy ay katumbas ng 10.6%. Laki ng sample n= 100. Kinakailangang matukoy ang mga hangganan ng 95% na agwat ng kumpiyansa para sa pangkalahatang parameter Cv.

Mga limitasyon ng agwat ng kumpiyansa para sa pangkalahatang koepisyent ng pagkakaiba-iba Cv ay tinutukoy ng mga sumusunod na formula:

At
, Saan K intermediate value na kinakalkula ng formula
.

Alam iyon nang may kumpiyansa na posibilidad R= 95% normalized deviation (Pagsusuri ng mag-aaral sa k =
)t = 1.960, kalkulahin muna natin ang halaga SA:

.

o 9.3%

o 12.3%

Kaya, ang pangkalahatang koepisyent ng pagkakaiba-iba na may 95% na antas ng kumpiyansa ay nasa hanay mula 9.3 hanggang 12.3%. Sa paulit-ulit na mga sample, ang koepisyent ng variation ay hindi lalampas sa 12.3% at hindi bababa sa 9.3% sa 95 na mga kaso sa 100.

Mga tanong para sa pagpipigil sa sarili:

Mga problema para sa malayang solusyon.

1. Ang average na porsyento ng taba sa gatas sa panahon ng paggagatas ng Kholmogory crossbred cows ay ang mga sumusunod: 3.4; 3.6; 3.2; 3.1; 2.9; 3.7; 3.2; 3.6; 4.0; 3.4; 4.1; 3.8; 3.4; 4.0; 3.3; 3.7; 3.5; 3.6; 3.4; 3.8. Magtatag ng mga pagitan ng kumpiyansa para sa pangkalahatang mean sa 95% na antas ng kumpiyansa (20 puntos).

2. Sa 400 hybrid rye na halaman, ang mga unang bulaklak ay lumitaw sa average na 70.5 araw pagkatapos ng paghahasik. Ang karaniwang paglihis ay 6.9 araw. Tukuyin ang error ng mean at confidence interval para sa pangkalahatang mean at variance sa antas ng kabuluhan W= 0.05 at W= 0.01 (25 puntos).

3. Kapag pinag-aaralan ang haba ng mga dahon ng 502 specimens ng mga strawberry sa hardin, nakuha ang sumusunod na data: = 7.86 cm; σ = 1.32 cm, =± 0.06 cm Tukuyin ang mga pagitan ng kumpiyansa para sa ibig sabihin ng populasyon ng aritmetika na may mga antas ng kabuluhan na 0.01; 0.02; 0.05. (25 puntos).

4. Sa isang pag-aaral ng 150 adultong lalaki, ang average na taas ay 167 cm, at σ = 6 cm Ano ang mga limitasyon ng pangkalahatang mean at pangkalahatang pagkakaiba na may posibilidad na kumpiyansa na 0.99 at 0.95? (25 puntos).

5. Ang pamamahagi ng calcium sa serum ng dugo ng mga unggoy ay nailalarawan sa pamamagitan ng mga sumusunod na selektibong tagapagpahiwatig: = 11.94 mg%, σ = 1,27, n = 100. Bumuo ng 95% confidence interval para sa pangkalahatang mean ng distribution na ito. Kalkulahin ang koepisyent ng pagkakaiba-iba (25 puntos).

6. Napag-aralan na pangkalahatang nilalaman nitrogen sa plasma ng dugo ng mga albino rats na may edad 37 at 180 araw. Ang mga resulta ay ipinahayag sa gramo bawat 100 cm 3 ng plasma. Sa edad na 37 araw, 9 na daga ang may: 0.98; 0.83; 0.99; 0.86; 0.90; 0.81; 0.94; 0.92; 0.87. Sa edad na 180 araw, 8 daga ang may: 1.20; 1.18; 1.33; 1.21; 1.20; 1.07; 1.13; 1.12. Magtakda ng mga pagitan ng kumpiyansa para sa pagkakaiba sa antas ng kumpiyansa na 0.95 (50 puntos).

7. Tukuyin ang mga hangganan ng 95% na agwat ng kumpiyansa para sa pangkalahatang pagkakaiba-iba ng pamamahagi ng calcium (mg%) sa serum ng dugo ng mga unggoy, kung para sa pamamahagi na ito ang laki ng sample ay n = 100, statistical error ng sample variance s σ 2 = 1.60 (40 puntos).

8. Tukuyin ang mga hangganan ng 95% na agwat ng kumpiyansa para sa pangkalahatang pagkakaiba ng distribusyon ng 40 spikelet ng trigo sa haba (σ 2 = 40.87 mm 2). (25 puntos).

9. Ang paninigarilyo ay itinuturing na pangunahing salik na nagdudulot ng mga nakahahadlang na sakit sa baga. Ang passive smoking ay hindi itinuturing na isang kadahilanan. Nag-alinlangan ang mga siyentipiko sa hindi nakakapinsala ng passive na paninigarilyo at sinuri ang pagkamatagusin respiratory tract sa mga hindi naninigarilyo, pasibo at aktibong naninigarilyo. Upang makilala ang estado ng respiratory tract, kinuha namin ang isa sa mga tagapagpahiwatig ng pag-andar panlabas na paghinga– maximum na mid-expiratory flow rate. Ang pagbaba sa tagapagpahiwatig na ito ay tanda ng pagbara sa daanan ng hangin. Ang data ng survey ay ipinapakita sa talahanayan.

Bilang ng mga taong sinuri

Maximum na mid-expiratory flow rate, l/s

Karaniwang lihis

Mga hindi naninigarilyo

magtrabaho sa isang lugar na hindi naninigarilyo

nagtatrabaho sa isang mausok na silid

paninigarilyo

humihithit ng isang maliit na bilang ng mga sigarilyo

average na bilang ng mga naninigarilyo

humihithit ng malaking bilang ng sigarilyo

Gamit ang data ng talahanayan, maghanap ng 95% na agwat ng kumpiyansa para sa pangkalahatang mean at pangkalahatang pagkakaiba para sa bawat pangkat. Ano ang mga pagkakaiba sa pagitan ng mga pangkat? Ipakita ang mga resulta nang grapiko (25 puntos).

10. Tukuyin ang mga hangganan ng 95% at 99% na agwat ng kumpiyansa para sa pangkalahatang pagkakaiba sa bilang ng mga biik sa 64 na farrow, kung ang istatistikal na error ng sample na pagkakaiba s σ 2 = 8.25 (30 puntos).

11. Ito ay kilala na ang average na timbang ng mga kuneho ay 2.1 kg. Tukuyin ang mga hangganan ng 95% at 99% na agwat ng kumpiyansa para sa pangkalahatang mean at pagkakaiba sa n= 30, σ = 0.56 kg (25 puntos).

12. Ang nilalaman ng butil ng tainga ay sinukat para sa 100 tainga ( X), haba ng tainga ( Y) at ang masa ng butil sa tainga ( Z). Maghanap ng mga agwat ng kumpiyansa para sa pangkalahatang mean at pagkakaiba sa P 1 = 0,95, P 2 = 0,99, P 3 = 0.999 kung = 19, = 6.766 cm, = 0.554 g; σ x 2 = 29.153, σ y 2 = 2. 111, σ z 2 = 0. 064. (25 puntos).

13. Sa 100 random na piniling mga tainga ng winter wheat, ang bilang ng mga spikelet ay binilang. Ang sample na populasyon ay nailalarawan sa pamamagitan ng mga sumusunod na tagapagpahiwatig: = 15 spikelet at σ = 2.28 pcs. Tukuyin kung anong katumpakan ang nakuhang average na resulta ( ) at bumuo ng agwat ng kumpiyansa para sa pangkalahatang mean at pagkakaiba sa 95% at 99% na antas ng kabuluhan (30 puntos).

14. Bilang ng mga tadyang sa mga shell ng fossil mollusk Mga Orthambonite calligramma:

Ito ay kilala na n = 19, σ = 4.25. Tukuyin ang mga hangganan ng agwat ng kumpiyansa para sa pangkalahatang mean at pangkalahatang pagkakaiba sa antas ng kabuluhan W = 0.01 (25 puntos).

15. Upang matukoy ang ani ng gatas sa isang komersyal na dairy farm, ang produktibidad ng 15 baka ay tinutukoy araw-araw. Ayon sa datos para sa taon, ang bawat baka ay nagbibigay sa karaniwan ng sumusunod na dami ng gatas bawat araw (l): 22; 19; 25; 20; 27; 17; tatlumpu; 21; 18; 24; 26; 23; 25; 20; 24. Bumuo ng mga pagitan ng kumpiyansa para sa pangkalahatang pagkakaiba at ang ibig sabihin ng arithmetic. Maaari ba nating asahan na ang average na taunang ani ng gatas bawat baka ay 10,000 litro? (50 puntos).

16. Upang matukoy ang average na ani ng trigo para sa negosyong pang-agrikultura, ang paggapas ay isinagawa sa mga trial plot na 1, 3, 2, 5, 2, 6, 1, 3, 2, 11 at 2 ektarya. Ang pagiging produktibo (c/ha) mula sa mga plot ay 39.4; 38; 35.8; 40; 35; 42.7; 39.3; 41.6; 33; 42; 29 ayon sa pagkakabanggit. Bumuo ng mga pagitan ng kumpiyansa para sa pangkalahatang variance at arithmetic mean. Maaari ba nating asahan na ang average na ani ng agrikultura ay magiging 42 c/ha? (50 puntos).

Ang agwat ng kumpiyansa ay dumating sa amin mula sa larangan ng mga istatistika. Ito ay isang tiyak na hanay na nagsisilbing tantyahin ang isang hindi kilalang parameter na may mataas na antas ng pagiging maaasahan. Ang pinakamadaling paraan upang ipaliwanag ito ay sa pamamagitan ng isang halimbawa.

Ipagpalagay na kailangan mong pag-aralan ang ilang random na variable, halimbawa, ang bilis ng pagtugon ng server sa isang kahilingan ng kliyente. Sa tuwing ita-type ng user ang address ng isang partikular na site, tumutugon ang server sa iba't ibang bilis. Kaya, ang oras ng pagtugon sa ilalim ng pag-aaral ay random. Kaya, ang agwat ng kumpiyansa ay nagpapahintulot sa amin na matukoy ang mga hangganan ng parameter na ito, at pagkatapos ay maaari naming sabihin na may 95% na posibilidad na ang server ay nasa saklaw na aming kinakalkula.

O kailangan mong malaman kung gaano karaming tao ang nakakaalam trademark mga kumpanya. Kapag kinakalkula ang agwat ng kumpiyansa, posibleng sabihin, halimbawa, na may 95% na posibilidad, ang bahagi ng mga mamimili na nakakaalam nito ay nasa saklaw mula 27% hanggang 34%.

Ang malapit na nauugnay sa terminong ito ay ang dami posibilidad ng kumpiyansa. Kinakatawan nito ang posibilidad na ang nais na parameter ay kasama sa pagitan ng kumpiyansa. Kung gaano kalaki ang ating gustong hanay ay depende sa halagang ito. Kung mas malaki ang halaga na kailangan, mas makitid ang pagitan ng kumpiyansa, at kabaliktaran. Kadalasan ito ay nakatakda sa 90%, 95% o 99%. Ang halagang 95% ang pinakasikat.

Ang tagapagpahiwatig na ito ay naiimpluwensyahan din ng pagpapakalat ng mga obserbasyon at ang kahulugan nito ay batay sa pag-aakalang sumusunod ang katangian sa ilalim ng pag-aaral Ang pahayag na ito ay kilala rin bilang Batas ni Gauss. Ayon sa kanya, ang normal ay isang distribusyon ng lahat ng probabilities ng isang tuluy-tuloy na random variable na maaaring ilarawan ng probability density. Kung ang palagay tungkol sa normal na pamamahagi naging mali, maaaring mali ang pagtatasa.

Una, alamin natin kung paano kalkulahin ang agwat ng kumpiyansa para sa Mayroong dalawang posibleng mga kaso dito. Ang dispersion (ang antas ng pagkalat ng isang random na variable) ay maaaring malaman o hindi. Kung ito ay kilala, kung gayon ang aming agwat ng kumpiyansa ay kinakalkula gamit ang sumusunod na formula:

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - tanda,

t - parameter mula sa talahanayan ng pamamahagi ng Laplace,

σ ay ang square root ng variance.

Kung ang pagkakaiba ay hindi alam, maaari itong kalkulahin kung alam natin ang lahat ng mga halaga ng nais na tampok. Ang sumusunod na formula ay ginagamit para dito:

σ2 = х2ср - (хср)2, kung saan

х2ср - average na halaga ng mga parisukat ng pinag-aralan na katangian,

(хср)2 ang parisukat ng katangiang ito.

Ang formula kung saan kinakalkula ang agwat ng kumpiyansa sa kasong ito ay bahagyang nagbabago:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - sample average,

α - tanda,

Ang t ay isang parameter na matatagpuan gamit ang talahanayan ng pamamahagi ng Mag-aaral t = t(ɣ;n-1),

sqrt(n) - square root ng kabuuang sample size,

s ay ang square root ng variance.

Isaalang-alang ang halimbawang ito. Ipagpalagay na batay sa mga resulta ng 7 pagsukat, ang pinag-aralan na katangian ay natukoy na katumbas ng 30 at ang sample na pagkakaiba ay katumbas ng 36. Ito ay kinakailangan upang mahanap, na may posibilidad na 99%, isang agwat ng kumpiyansa na naglalaman ng totoo halaga ng sinusukat na parameter.

Una, tukuyin natin kung ano ang katumbas ng t: t = t (0.99; 7-1) = 3.71. Gamit ang formula sa itaas, nakukuha namin:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 - 3.71*36 / (sqrt(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Ang agwat ng kumpiyansa para sa pagkakaiba ay kinakalkula kapwa sa kaso ng isang kilalang mean at kapag walang data sa inaasahan sa matematika, at tanging ang halaga ng puntong walang pinapanigan na pagtatantya ng pagkakaiba ang nalalaman. Hindi kami magbibigay ng mga formula para sa pagkalkula dito, dahil ang mga ito ay medyo kumplikado at, kung nais, ay palaging matatagpuan sa Internet.

Tandaan lamang natin na madaling matukoy ang agwat ng kumpiyansa gamit ang Excel o isang serbisyo sa network, na tinatawag na ganoong paraan.



Bago sa site

>

Pinaka sikat