Bahay Pagpapagaling ng ngipin ng mga bata Agwat ng kumpiyansa para sa mathematical na inaasahan ng isang normal na distribusyon na may alam na pagkakaiba. Mga agwat ng kumpiyansa para sa pagtatantya ng inaasahan sa matematika

Agwat ng kumpiyansa para sa mathematical na inaasahan ng isang normal na distribusyon na may alam na pagkakaiba. Mga agwat ng kumpiyansa para sa pagtatantya ng inaasahan sa matematika

At iba pa. Lahat ng mga ito ay mga pagtatantya ng kanilang mga theoretical analogues, na maaaring makuha kung hindi isang sample, ngunit isang pangkalahatang populasyon ay magagamit. Ngunit sayang, ang pangkalahatang populasyon ay napakamahal at kadalasang hindi naa-access.

Ang konsepto ng pagtatantya ng pagitan

Ang anumang sample na pagtatantya ay may ilang pagkalat, dahil ay isang random na variable depende sa mga halaga sa isang partikular na sample. Samakatuwid, para sa mas maaasahang istatistikal na konklusyon, dapat malaman ng isang tao hindi lamang ang pagtatantya ng punto, kundi pati na rin ang pagitan, na may mataas na posibilidad. γ Sinasaklaw ng (gamma) ang nasuri na tagapagpahiwatig θ (theta).

Pormal, ito ay dalawang ganoong halaga (mga istatistika) T 1 (X) At T 2 (X), Ano T 1< T 2 , kung saan sa isang naibigay na antas ng posibilidad γ natugunan ang kondisyon:

Sa madaling salita, malamang γ o higit pa ang tunay na tagapagpahiwatig ay nasa pagitan ng mga punto T 1 (X) At T 2 (X), na tinatawag na lower at upper bounds agwat ng kumpiyansa.

Ang isa sa mga kondisyon para sa pagbuo ng mga agwat ng kumpiyansa ay ang pinakamataas na makitid nito, i.e. ito ay dapat na maikli hangga't maaari. Ang pagnanais ay medyo natural, dahil... sinusubukan ng mananaliksik na mas tumpak na i-localize ang lokasyon ng nais na parameter.

Ito ay sumusunod na ang agwat ng kumpiyansa ay dapat sumasakop sa pinakamataas na posibilidad ng pamamahagi. at ang pagtatasa mismo ay dapat nasa gitna.

Iyon ay, ang posibilidad ng paglihis (ng tunay na tagapagpahiwatig mula sa pagtatantya) pataas ay katumbas ng posibilidad ng paglihis pababa. Dapat ding tandaan na para sa mga asymmetric distribution ang pagitan sa kanan ay hindi katumbas ng pagitan umalis.

Ang figure sa itaas ay malinaw na nagpapakita na mas malaki ang posibilidad ng kumpiyansa, mas malawak ang pagitan - isang direktang relasyon.

Ito ay isang maikling panimula sa teorya ng pagtatantya ng pagitan ng hindi kilalang mga parameter. Magpatuloy tayo sa paghahanap ng mga limitasyon ng kumpiyansa para sa inaasahan sa matematika.

Agwat ng kumpiyansa para sa inaasahan sa matematika

Kung ang orihinal na data ay ibinahagi sa , ang average ay magiging isang normal na halaga. Ito ay sumusunod mula sa panuntunan na ang isang linear na kumbinasyon ng mga normal na halaga ay mayroon ding isang normal na distribusyon. Samakatuwid, upang kalkulahin ang mga probabilidad na maaari nating gamitin ang mathematical apparatus ng normal na batas sa pamamahagi.

Gayunpaman, mangangailangan ito ng pag-alam ng dalawang parameter - inaasahan at pagkakaiba-iba, na karaniwang hindi alam. Maaari mong, siyempre, gumamit ng mga pagtatantya sa halip na mga parameter (arithmetic mean at ), ngunit pagkatapos ay ang distribusyon ng average ay hindi magiging ganap na normal, ito ay bahagyang patagin pababa. Ang katotohanang ito ay matalinong napansin ng mamamayang si William Gosset mula sa Ireland, na inilathala ang kanyang natuklasan sa Marso 1908 na isyu ng journal na Biometrica. Para sa mga layunin ng pagiging lihim, pinirmahan ni Gosset ang kanyang sarili na Estudyante. Ito ay kung paano lumitaw ang Student t-distribution.

Gayunpaman, ang normal na distribusyon ng data na ginamit ni K. Gauss sa pagsusuri ng error mga obserbasyon sa astronomiya, ay napakabihirang sa buhay sa lupa at medyo mahirap itatag (mga 2 libong obserbasyon ang kailangan para sa mataas na katumpakan). Samakatuwid, pinakamahusay na itapon ang pagpapalagay ng normalidad at gumamit ng mga pamamaraan na hindi nakadepende sa pamamahagi ng orihinal na data.

Ang tanong ay lumitaw: ano ang pamamahagi ng ibig sabihin ng aritmetika kung ito ay kinakalkula mula sa data hindi kilalang pamamahagi? Ang sagot ay ibinigay ng kilalang in probability theory Central limit theorem(CPT). Sa matematika mayroong ilang mga variant nito (sa buong sa mahabang taon ang mga pormulasyon ay napino), ngunit lahat ng mga ito, sa halos pagsasalita, ay bumaba sa pahayag na ang kabuuan ng isang malaking bilang ng mga independiyenteng random na mga variable ay sumusunod sa isang normal na batas sa pamamahagi.

Kapag kinakalkula ang arithmetic mean, ang kabuuan ng mga random na variable ay ginagamit. Mula dito lumalabas na ang arithmetic mean ay may normal na distribusyon, kung saan ang inaasahan ay ang inaasahan ng orihinal na data, at ang pagkakaiba ay .

Mga matatalinong tao alam kung paano patunayan ang CLT, ngunit ibe-verify namin ito sa tulong ng isang eksperimento na isinagawa sa Excel. Gayahin natin ang isang sample ng 50 pare-parehong ipinamahagi na random variable (gamit ang Excel function na RANDBETWEEN). Pagkatapos ay gagawa kami ng 1000 tulad ng mga sample at kalkulahin ang arithmetic mean para sa bawat isa. Tingnan natin ang kanilang pamamahagi.

Makikita na ang distribusyon ng average ay malapit sa normal na batas. Kung gagawing mas malaki ang sample size at number, mas magiging maganda ang pagkakatulad.

Ngayong nakita na natin sa sarili nating mga mata ang bisa ng CLT, maaari nating, gamit ang , kalkulahin ang mga pagitan ng kumpiyansa para sa arithmetic mean, na sumasaklaw sa tunay na mean o mathematical na inaasahan na may ibinigay na posibilidad.

Upang itakda ang itaas at mas mababang mga limitasyon, kailangan mong malaman ang mga parameter normal na pamamahagi. Bilang isang patakaran, wala, kaya ginagamit ang mga pagtatantya: ibig sabihin ng aritmetika At sample na pagkakaiba-iba. Uulitin ko, ang pamamaraang ito ay nagbibigay ng isang mahusay na approximation lamang sa malalaking sample. Kapag maliit ang mga sample, kadalasang inirerekomendang gamitin ang pamamahagi ng Mag-aaral. Huwag maniwala! Ang distribusyon ng Mag-aaral para sa mean ay nangyayari lamang kapag ang orihinal na data ay karaniwang ipinamamahagi, iyon ay, halos hindi kailanman. Samakatuwid, ito ay mas mahusay na agad na ilagay pinakamababang bar ayon sa dami ng kinakailangang data at gumamit ng mga asymptotically correct na pamamaraan. Sabi nila, sapat na ang 30 obserbasyon. Kumuha ng 50 - hindi ka magkakamali.

T 1.2– lower at upper limits ng confidence interval

– sample na arithmetic mean

s 0– karaniwang paglihis ng sample (walang pinapanigan)

n – laki ng sample

γ – probabilidad ng kumpiyansa (karaniwang katumbas ng 0.9, 0.95 o 0.99)

c γ =Φ -1 ((1+γ)/2)– ang kabaligtaran na halaga ng karaniwang normal na distribution function. Sa madaling salita, ito ang bilang ng mga karaniwang error mula sa arithmetic mean hanggang sa mas mababa o itaas na limitasyon(ang ipinahiwatig na tatlong probabilidad ay tumutugma sa mga halaga 1.64, 1.96 at 2.58).

Ang kakanyahan ng formula ay ang arithmetic mean ay kinuha at pagkatapos ay isang tiyak na halaga ay itabi mula dito ( kasama ang γ) mga karaniwang error ( s 0 /√n). Ang lahat ay alam, kunin ito at isaalang-alang ito.

dati paggamit ng masa Ang isang PC ay ginamit upang makuha ang mga halaga ng normal na function ng pamamahagi at ang kabaligtaran nito. Ginagamit pa rin ang mga ito ngayon, ngunit mas epektibong gumamit ng mga yari na formula ng Excel. Ang lahat ng elemento mula sa formula sa itaas ( , at ) ay madaling kalkulahin sa Excel. Ngunit mayroong isang handa na pormula para sa pagkalkula ng agwat ng kumpiyansa - TIWALA.NORM. Ang syntax nito ay ang mga sumusunod.

CONFIDENCE.NORM(alpha;standard_off;size)

alpha– antas ng kahalagahan o antas ng kumpiyansa, na sa notasyong pinagtibay sa itaas ay katumbas ng 1- γ, i.e. ang posibilidad na ang mathematicalang inaasahan ay nasa labas ng confidence interval. Sa posibilidad ng kumpiyansa 0.95, alpha ay 0.05, atbp.

standard_off– karaniwang paglihis ng sample na data. Hindi na kailangang kalkulahin ang karaniwang error; Ang Excel mismo ay hahatiin sa ugat ng n.

laki– laki ng sample (n).

Ang resulta ng function na CONFIDENCE NORM ay ang pangalawang termino mula sa formula para sa pagkalkula ng agwat ng kumpiyansa, i.e. kalahating pagitan Alinsunod dito, ang mas mababa at itaas na mga puntos ay ang average ± ang nakuhang halaga.

Kaya, posible na bumuo ng isang unibersal na algorithm para sa pagkalkula ng mga agwat ng kumpiyansa para sa arithmetic mean, na hindi nakasalalay sa pamamahagi ng orihinal na data. Ang presyo para sa pagiging pangkalahatan ay ang asymptotic na kalikasan nito, i.e. ang pangangailangang gumamit ng medyo malalaking sample. Gayunpaman, sa edad makabagong teknolohiya ang pagkolekta ng kinakailangang dami ng data ay karaniwang hindi mahirap.

Pagsubok ng mga istatistikal na hypotheses gamit ang mga agwat ng kumpiyansa

(module 111)

Ang isa sa mga pangunahing problema na nalutas sa istatistika ay. Ang kakanyahan nito ay maikli ang sumusunod. Ipinapalagay, halimbawa, na ang inaasahan populasyon katumbas ng ilang halaga. Pagkatapos ang pamamahagi ng sample ay nangangahulugan na maaaring maobserbahan para sa isang naibigay na inaasahan ay itinayo. Susunod, tinitingnan nila kung saan sa conditional distribution na ito matatagpuan ang tunay na average. Kung lumampas ito sa mga katanggap-tanggap na limitasyon, kung gayon ang hitsura ng naturang average ay napaka-malamang, at kung ang eksperimento ay paulit-ulit nang isang beses, ito ay halos imposible, na sumasalungat sa hypothesis na iniharap, na matagumpay na tinanggihan. Kung ang average ay hindi lalampas kritikal na antas, kung gayon ang hypothesis ay hindi tinatanggihan (ngunit hindi rin napatunayan!).

Kaya, sa tulong ng mga agwat ng kumpiyansa, sa aming kaso para sa inaasahan, maaari mo ring subukan ang ilang mga hypotheses. Napakadaling gawin. Sabihin natin na ang arithmetic mean para sa isang partikular na sample ay katumbas ng 100. Ang hypothesis ay nasubok na ang inaasahang halaga ay, sabihin nating, 90. Iyon ay, kung ilalagay natin ang tanong sa primitively, ito ay ganito ang tunog: maaari ba iyon sa totoo halaga ng mean na katumbas ng 90, ang naobserbahang average ay naging 100?

Upang masagot ang tanong na ito, kakailanganin mo ng karagdagang impormasyon tungkol sa average parisukat na paglihis at laki ng sample. Ipagpalagay natin na ang standard deviation ay 30 at ang bilang ng mga obserbasyon ay 64 (upang madaling makuha ang ugat). Kung gayon ang karaniwang error ng mean ay 30/8 o 3.75. Upang kalkulahin ang 95% na agwat ng kumpiyansa, kakailanganin mong magdagdag ng dalawang karaniwang error sa bawat panig ng mean (mas tiyak, 1.96). Ang confidence interval ay magiging humigit-kumulang 100±7.5 o mula 92.5 hanggang 107.5.

Ang karagdagang pangangatwiran ay ang mga sumusunod. Kung ang value na sinusuri ay nasa loob ng confidence interval, hindi ito sumasalungat sa hypothesis, dahil nasa loob ng mga limitasyon ng mga random na pagbabagu-bago (na may posibilidad na 95%). Kung ang puntong sinusuri ay nasa labas ng agwat ng kumpiyansa, kung gayon ang posibilidad ng naturang kaganapan ay napakaliit, sa anumang kaso sa ibaba ng katanggap-tanggap na antas. Nangangahulugan ito na ang hypothesis ay tinanggihan bilang sumasalungat sa naobserbahang data. Sa aming kaso, ang hypothesis tungkol sa inaasahang halaga ay nasa labas ng agwat ng kumpiyansa (ang nasubok na halaga na 90 ay hindi kasama sa pagitan na 100±7.5), kaya dapat itong tanggihan. Ang pagsagot sa primitive na tanong sa itaas, dapat itong sabihin: hindi, hindi, sa anumang kaso, ito ay napakabihirang mangyari. Kadalasan, ipinapahiwatig nila ang tiyak na posibilidad ng maling pagtanggi sa hypothesis (p-level), at hindi ang tinukoy na antas kung saan itinayo ang agwat ng kumpiyansa, ngunit higit pa sa ibang pagkakataon.

Tulad ng nakikita mo, ang pagbuo ng isang agwat ng kumpiyansa para sa average (o inaasahan sa matematika) ay hindi mahirap. Ang pangunahing bagay ay upang maunawaan ang kakanyahan, at pagkatapos ay magpapatuloy ang mga bagay. Sa pagsasagawa, karamihan sa mga kaso ay gumagamit ng 95% na agwat ng kumpiyansa, na humigit-kumulang dalawang karaniwang error ang lapad sa magkabilang panig ng mean.

Yun lang muna. Lahat ng pinakamahusay!

Hayaan ang isang random na variable (maaari nating pag-usapan ang tungkol sa isang pangkalahatang populasyon) na ipamahagi ayon sa isang normal na batas, kung saan ang pagkakaiba D = 2 (> 0) ay kilala. Mula sa pangkalahatang populasyon (sa hanay ng mga bagay kung saan tinutukoy ang isang random na variable), isang sample ng laki n ang ginawa. Ang sample na x 1 , x 2 ,..., x n ay itinuturing bilang isang set ng n independiyenteng random na mga variable na ibinahagi sa parehong paraan tulad ng (ang diskarte na ipinaliwanag sa itaas sa teksto).

Ang mga sumusunod na pagkakapantay-pantay ay tinalakay at napatunayan nang mas maaga:

Mx 1 = Mx 2 = ... = Mx n = M;

Dx 1 = Dx 2 = ... = Dx n = D;

Ito ay sapat na upang patunayan lamang (inaalis namin ang patunay) na ang random na variable ay nasa sa kasong ito ay ipinamamahagi din ayon sa normal na batas.

Tukuyin natin ang hindi kilalang dami ng M sa pamamagitan ng a at piliin, batay sa ibinigay na pagiging maaasahan, ang numerong d > 0 upang ang kundisyon ay masiyahan:

P(- a< d) = (1)

Dahil ang random na variable ay ibinahagi ayon sa normal na batas na may inaasahan sa matematika M = M = a at pagkakaiba-iba D = D / n = 2 / n, nakuha namin ang:

P(- a< d) =P(a - d < < a + d) =

Ito ay nananatiling pumili d upang ang pagkakapantay-pantay ay humahawak

Para sa sinuman, maaari mong gamitin ang talahanayan upang maghanap ng numerong t tulad ng (t)= / 2. Ang numerong ito ay tinatawag na t minsan. dami.

Ngayon mula sa pagkakapantay-pantay

tukuyin natin ang halaga ng d:

Nakukuha namin ang huling resulta sa pamamagitan ng pagpapakita ng formula (1) sa form:

Ang kahulugan ng huling formula ay ang mga sumusunod: na may pagiging maaasahan, ang agwat ng kumpiyansa

sumasaklaw sa hindi kilalang parameter a = M ng populasyon. Maaari mong sabihin ito nang iba: pagtatantya ng punto tinutukoy ang halaga ng parameter M na may katumpakan d= t / at pagiging maaasahan.

Gawain. Hayaang magkaroon ng pangkalahatang populasyon na may isang tiyak na katangian na ibinahagi ayon sa isang normal na batas na may pagkakaiba-iba na katumbas ng 6.25. Isang sample na laki ng n = 27 ang kinuha at ang average na sample value ng katangian ay nakuha = 12. Humanap ng confidence interval na sumasaklaw sa hindi alam na mathematical expectation ng pinag-aralan na katangian ng pangkalahatang populasyon na may reliability = 0.99.

Solusyon. Una, gamit ang talahanayan para sa Laplace function, makikita natin ang halaga ng t mula sa pagkakapantay-pantay (t) = / 2 = 0.495. Batay sa nakuhang halaga t = 2.58, tinutukoy namin ang katumpakan ng pagtatantya (o kalahati ng haba ng agwat ng kumpiyansa) d: d = 2.52.58 / 1.24. Mula dito nakuha namin ang kinakailangang agwat ng kumpiyansa: (10.76; 13.24).

istatistikal na hypothesis pangkalahatang variasyonal

Agwat ng kumpiyansa para sa mathematical na inaasahan ng isang normal na distribusyon na may hindi kilalang pagkakaiba

Hayaan ang isang random na variable na ibinahagi ayon sa isang normal na batas na may hindi alam na matematikal na inaasahan M, na tinutukoy namin ng titik a. Gumawa tayo ng sample ng volume n. Alamin natin ang average na sample at naitama ang sample variance s 2 gamit ang mga kilalang formula.

Random na halaga

ibinahagi ayon sa batas ng Mag-aaral na may n - 1 antas ng kalayaan.

Ang gawain ay upang makahanap ng isang numero t para sa isang naibigay na pagiging maaasahan at ang bilang ng mga antas ng kalayaan n - 1 upang ang pagkakapantay-pantay

o katumbas na pagkakapantay-pantay

Dito sa mga bracket ay nakasulat ang kondisyon na ang halaga ng hindi kilalang parameter a ay kabilang sa isang tiyak na pagitan, na kung saan ay ang agwat ng kumpiyansa. Ang mga hangganan nito ay nakasalalay sa pagiging maaasahan gayundin sa mga parameter ng sampling at s.

Upang matukoy ang halaga ng t ayon sa magnitude, binabago namin ang pagkakapantay-pantay (2) sa anyo:

Ngayon ayon sa talahanayan para sa random variable t, ibinahagi ayon sa batas ng Estudyante, gamit ang probabilidad 1 - at ang bilang ng mga antas ng kalayaan n - 1, makikita natin ang t. Ang pormula (3) ay nagbibigay ng sagot sa problemang iniharap.

Gawain. Sa panahon ng control test ng 20 electric lamp average na tagal ang kanilang trabaho ay katumbas ng 2000 oras na may karaniwang paglihis (kinakalkula bilang square root ng naitama na sample variance) na katumbas ng 11 oras. Ito ay kilala na ang oras ng pagpapatakbo ng isang lampara ay isang karaniwang ibinahagi na random na variable. Tukuyin na may reliability na 0.95 ang isang confidence interval para sa mathematical expectation ng random variable na ito.

Solusyon. Halaga 1 - sa kasong ito ay katumbas ng 0.05. Ayon sa talahanayan ng pamamahagi ng Mag-aaral, na may bilang ng mga antas ng kalayaan na katumbas ng 19, makikita natin ang: t = 2.093. Kalkulahin natin ngayon ang katumpakan ng pagtatantya: 2.093121/ = 56.6. Mula dito nakukuha natin ang kinakailangang agwat ng kumpiyansa: (1943.4; 2056.6).

Hayaang kunin ang isang sample mula sa isang pangkalahatang populasyon na napapailalim sa batas normal pamamahagi XN( m; ). Ang pangunahing pagpapalagay na ito ng mga istatistika ng matematika ay batay sa gitnang teorama ng limitasyon. Hayaang malaman ang pangkalahatang standard deviation , ngunit ang matematikal na inaasahan ng teoretikal na pamamahagi ay hindi alam m(average na halaga).

Sa kasong ito, ang ibig sabihin ng sample , na nakuha sa panahon ng eksperimento (seksyon 3.4.2), ay magiging isang random na variable din m;
). Pagkatapos ay ang "normalized" na paglihis
N(0;1) – ay isang karaniwang normal na random variable.

Ang gawain ay upang makahanap ng isang pagtatantya ng pagitan para sa m. Bumuo tayo ng two-sided confidence interval para sa m upang ang tunay na pag-asa sa matematika ay pag-aari niya na may ibinigay na posibilidad (kaasahan) .

Magtakda ng ganoong agwat para sa halaga
- nangangahulugan ito ng paghahanap ng pinakamataas na halaga ng dami na ito
at pinakamababa
, na siyang mga hangganan ng kritikal na rehiyon:
.

kasi ang posibilidad na ito ay pantay
, pagkatapos ay ang ugat ng equation na ito
ay matatagpuan gamit ang Laplace function tables (Talahanayan 3, Appendix 1).

Pagkatapos ay may posibilidad ito ay maaaring argued na ang random variable
, ibig sabihin, ang nais na pangkalahatang average ay kabilang sa pagitan
. (3.13)

Sukat
(3.14)

tinawag katumpakan mga pagtatasa.

Numero
dami normal na pamamahagi - ay matatagpuan bilang isang argumento ng Laplace function (Talahanayan 3, Appendix 1), na isinasaalang-alang ang kaugnayan 2Ф( u)=, ibig sabihin. F( u)=
.

Baligtarin, ayon sa tinukoy na halaga ng paglihis maaaring matagpuan kung anong posibilidad ang hindi alam na pangkalahatang ibig sabihin ay kabilang sa pagitan
. Upang gawin ito kailangan mong kalkulahin

. (3.15)

Hayaang kunin ang isang random na sample mula sa pangkalahatang populasyon gamit ang paulit-ulit na paraan ng pagpili. Mula sa Eq.
maaaring matagpuan pinakamababa dami ng resampling n, kinakailangan para sa agwat ng kumpiyansa na may ibinigay na pagiging maaasahan hindi lumampas sa preset na halaga . Ang kinakailangang laki ng sample ay tinatantya gamit ang formula:

. (3.16)

Mag-explore tayo katumpakan ng pagtatantya
:

1) Habang lumalaki ang laki ng sample n magnitude bumababa, at samakatuwid ang katumpakan ng pagtatantya nadadagdagan.

2) C pagtaas pagiging maaasahan ng pagtatasa tumataas ang halaga ng argumento u(dahil F(u) tumataas monotonically) at samakatuwid nadadagdagan . Sa kasong ito, ang pagtaas sa pagiging maaasahan binabawasan katumpakan ng pagtatasa nito .

Pagsusuri
(3.17)

tinawag klasiko(Saan t- isang tiyak na parameter depende sa At n), dahil nailalarawan nito ang pinakamadalas na nakakaharap na mga batas sa pamamahagi.

3.5.3 Mga agwat ng kumpiyansa para sa pagtantya ng inaasahan sa matematika ng isang normal na distribusyon na may hindi kilalang standard deviation 

Ipaalam na ang populasyon ay napapailalim sa batas ng normal na distribusyon XN( m;), kung saan ang halaga root ibig sabihin ng square mga paglihis hindi kilala.

Upang makabuo ng agwat ng kumpiyansa para sa pagtatantya ng pangkalahatang mean sa kasong ito, ginagamit ang mga istatistika
, pagkakaroon ng Student distribution na may k= n–1 antas ng kalayaan. Ito ay sumusunod mula sa katotohanan na N(0;1) (tingnan ang seksyon 3.5.2), at
(tingnan ang seksyon 3.5.3) at mula sa kahulugan ng pamamahagi ng Mag-aaral (bahagi 1. seksyon 2.11.2).

Hanapin natin ang katumpakan ng klasikal na pagtatantya ng distribusyon ng Mag-aaral: i.e. hahanapin natin t mula sa formula (3.17). Hayaan ang posibilidad na matupad ang hindi pagkakapantay-pantay
ibinigay ng pagiging maaasahan :

. (3.18)

Dahil ang TSt( n-1), ito ay malinaw na t depende sa At n, kaya karaniwan silang nagsusulat
.

(3.19)

saan
– Pag-andar ng pamamahagi ng mag-aaral na may n-1 antas ng kalayaan.

Paglutas ng equation na ito para sa m, nakukuha namin ang pagitan
na mapagkakatiwalaang  ay sumasaklaw sa hindi alam na parameter m.

Magnitude t , n-1, ginagamit upang matukoy ang pagitan ng kumpiyansa ng isang random na variable T(n-1), ipinamahagi ayon sa t-test na may n-1 degree ng kalayaan ang tawag Koepisyent ng mag-aaral. Dapat itong matagpuan ayon sa mga ibinigay na halaga n at  mula sa mga talahanayang “Mga kritikal na punto ng pamamahagi ng Mag-aaral”. (Talahanayan 6, Appendix 1), na kumakatawan sa mga solusyon sa equation (3.19).

Bilang resulta, nakukuha namin ang sumusunod na expression katumpakan agwat ng kumpiyansa para sa pagtatantya ng inaasahan sa matematika (pangkalahatang ibig sabihin), kung hindi alam ang pagkakaiba:

(3.20)

Kaya, mayroong isang pangkalahatang pormula para sa pagbuo ng mga agwat ng kumpiyansa para sa inaasahan sa matematika ng populasyon:

nasaan ang katumpakan ng agwat ng kumpiyansa depende sa kilala o hindi alam na pagpapakalat ay matatagpuan ayon sa mga formula, ayon sa pagkakabanggit 3.16. at 3.20.

Suliranin 10. Ang ilang mga pagsubok ay isinagawa, ang mga resulta nito ay nakalista sa talahanayan:

x i

Nabatid na sinusunod nila ang batas ng normal na pamamahagi sa
. Maghanap ng rating m* para sa pag-asa sa matematika m, bumuo ng 90% confidence interval para dito.

Solusyon:

Kaya, m(2.53;5.47).

Suliranin 11. Ang lalim ng dagat ay sinusukat ng isang aparato na ang sistematikong error ay 0, at ang mga random na error ay ipinamamahagi ayon sa normal na batas, na may karaniwang paglihis. =15m. Gaano karaming mga independiyenteng sukat ang dapat gawin upang matukoy ang lalim na may mga error na hindi hihigit sa 5 m sa antas ng kumpiyansa na 90%?

Solusyon:

Ayon sa kondisyon ng problemang mayroon tayo XN( m; ), Saan =15m, =5m, =0.9. Hanapin natin ang volume n.

1) Sa ibinigay na pagiging maaasahan = 0.9, makikita natin mula sa Mga Talahanayan 3 (Appendix 1) ang argumento ng Laplace function u = 1.65.

2) Pag-alam sa tinukoy na katumpakan ng pagtatantya =u=5, hanapin natin
. Meron kami

. Samakatuwid ang bilang ng mga pagsubok n25.

Suliranin 12. Pagsa-sample ng temperatura t para sa unang 6 na araw ng Enero ay ipinakita sa talahanayan:

Hanapin ang agwat ng kumpiyansa para sa inaasahan sa matematika m populasyon na may posibilidad ng kumpiyansa
at suriin ang pangkalahatan karaniwang lihis s.

Solusyon:


At
.

2) Walang pinapanigan na pagtatantya hanapin ito gamit ang formula
:

=-175

=234.84

;
;

=-192

=116


.

3) Dahil ang pangkalahatang pagkakaiba ay hindi alam, ngunit ang pagtatantya nito ay kilala, pagkatapos ay tantiyahin ang matematikal na inaasahan m ginagamit namin ang distribusyon ng Mag-aaral (Talahanayan 6, Appendix 1) at formula (3.20).

kasi n 1 =n 2 =6, pagkatapos ,
, s 1 =6.85 mayroon kaming:
, kaya -29.2-4.1<m 1 < -29.2+4.1.

Samakatuwid -33.3<m 1 <-25.1.

Katulad din natin,
, s 2 = 4.8, kaya

–34.9< m 2 < -29.1. Тогда доверительные интервалы примут вид: m 1 (-33.3;-25.1) at m 2 (-34.9;-29.1).

Sa mga inilapat na agham, halimbawa, sa mga disiplina sa konstruksiyon, ang mga talahanayan ng agwat ng kumpiyansa ay ginagamit upang masuri ang katumpakan ng mga bagay, na ibinibigay sa nauugnay na literatura ng sanggunian.

Hayaang bumuo ang CB X ng pangkalahatang populasyon at hayaang ang β ay ang hindi kilalang parameter CB X. Kung pare-pareho ang istatistikal na pagtatantya sa *, kung gayon mas malaki ang sukat ng sample, mas tumpak na makuha natin ang halaga ng β. Gayunpaman, sa pagsasagawa, wala kaming napakalaking sample, kaya hindi namin magagarantiya ang higit na katumpakan.

Hayaang ang b* ay isang istatistikal na pagtatantya para sa c. Halaga |in* - in| ay tinatawag na katumpakan ng pagtatantya. Malinaw na ang katumpakan ay CB, dahil ang β* ay isang random na variable. Tukuyin natin ang isang maliit na positibong numero 8 at hinihiling na ang katumpakan ng pagtatantya |в* - в| ay mas mababa sa 8, ibig sabihin. | sa* - sa |< 8.

Ang pagiging maaasahan g o posibilidad ng kumpiyansa ng isang pagtatantya sa sa * ay ang posibilidad na g kung saan ang hindi pagkakapantay-pantay |sa * - sa|< 8, т. е.

Karaniwan, ang pagiging maaasahan ng g ay tinukoy nang maaga, at ang g ay itinuturing na isang numerong malapit sa 1 (0.9; 0.95; 0.99; ...).

Dahil ang hindi pagkakapantay-pantay |sa * - sa|< S равносильно двойному неравенству в* - S < в < в* + 8, то получаем:

Ang interval (sa * - 8, sa * + 5) ay tinatawag na confidence interval, ibig sabihin, ang confidence interval ay sumasaklaw sa hindi alam na parameter sa may probability y. Tandaan na ang mga dulo ng agwat ng kumpiyansa ay random at nag-iiba mula sa sample hanggang sa sample, kaya mas tumpak na sabihin na ang agwat (sa * - 8, sa * + 8) ay sumasaklaw sa hindi kilalang parameter sa, sa halip na sa ay kabilang dito. pagitan.

Hayaang tukuyin ang populasyon sa pamamagitan ng isang random na variable X, na ibinahagi ayon sa isang normal na batas, at ang standard deviation a ay kilala. Ang hindi alam ay ang matematikal na inaasahan a = M (X). Kinakailangang hanapin ang agwat ng kumpiyansa para sa a para sa isang naibigay na pagiging maaasahan y.

Sample ibig sabihin

ay isang istatistikal na pagtatantya para sa xr = a.

Teorama. Ang random variable xB ay may normal na distribution kung ang X ay may normal na distribution at M (XB) = a,

A (XB) = a, kung saan a = y/B (X), a = M (X). l/i

Ang agwat ng kumpiyansa para sa a ay may anyo:

Nahanap namin ang 8.

Gamit ang ratio

kung saan ang Ф(r) ay ang Laplace function, mayroon kaming:

P ( | XB - isang |<8} = 2Ф

talahanayan ng mga halaga ng Laplace function na nakita namin ang halaga ng t.

Ang pagkakaroon ng itinalaga

T, nakukuha natin ang F(t) = g Dahil ang g ay ibinigay, pagkatapos ay sa pamamagitan ng

Mula sa pagkakapantay-pantay nalaman namin na ang pagtatantya ay tumpak.

Nangangahulugan ito na ang agwat ng kumpiyansa para sa isang ay may anyo:

Ibinigay ang isang sample mula sa populasyon X

ng kay" X2 Xm
n. n1 n2 nm

n = U1 + ... + nm, kung gayon ang pagitan ng kumpiyansa ay magiging:

Halimbawa 6.35. Hanapin ang agwat ng kumpiyansa para sa pagtatantya ng mathematical expectation a ng normal na distribution na may reliability na 0.95, alam ang sample mean Xb = 10.43, sample size n = 100 at standard deviation s = 5.

Gamitin natin ang formula

Hayaang maipamahagi nang normal ang random variable X ng populasyon, na isinasaalang-alang na alam ang variance at standard deviation s ng distribution na ito. Kinakailangang tantyahin ang hindi alam na inaasahan sa matematika gamit ang sample mean. Sa kasong ito, bumababa ang gawain sa paghahanap ng agwat ng kumpiyansa para sa inaasahan sa matematika na may pagiging maaasahan b. Kung tinukoy mo ang halaga ng probabilidad ng kumpiyansa (pagiging maaasahan) b, makikita mo ang posibilidad na mahulog sa pagitan para sa hindi kilalang inaasahan sa matematika gamit ang formula (6.9a):

kung saan ang Ф(t) ay ang Laplace function (5.17a).

Bilang resulta, maaari tayong bumuo ng isang algorithm para sa paghahanap ng mga hangganan ng agwat ng kumpiyansa para sa inaasahan sa matematika kung ang pagkakaiba D = s 2 ay kilala:

  1. Itakda ang halaga ng pagiging maaasahan – b.
  2. Mula sa (6.14) ipahayag ang Ф(t) = 0.5× b. Piliin ang halaga ng t mula sa talahanayan para sa Laplace function batay sa halaga Ф(t) (tingnan ang Appendix 1).
  3. Kalkulahin ang deviation e gamit ang formula (6.10).
  4. Isulat ang pagitan ng kumpiyansa gamit ang formula (6.12) na may posibilidad na b ang hindi pagkakapantay-pantay ay mayroong:

.

Halimbawa 5.

Ang random variable X ay may normal na distribusyon. Maghanap ng mga agwat ng kumpiyansa para sa isang pagtatantya na may pagiging maaasahan b = 0.96 ng hindi alam na inaasahan sa matematika a, kung ibinigay:

1) pangkalahatang karaniwang paglihis s = 5;

2) sample average;

3) laki ng sample n = 49.

Sa formula (6.15) ng pagtatantya ng pagitan ng inaasahan sa matematika A may pagiging maaasahan b lahat ng dami maliban sa t ay kilala. Ang halaga ng t ay matatagpuan gamit ang (6.14): b = 2Ф(t) = 0.96. Ф(t) = 0.48.

Gamit ang talahanayan sa Appendix 1 para sa Laplace function na Ф(t) = 0.48, hanapin ang katumbas na halaga t = 2.06. Kaya naman, . Sa pamamagitan ng pagpapalit ng kinakalkula na halaga ng e sa formula (6.12), maaari kang makakuha ng agwat ng kumpiyansa: 30-1.47< a < 30+1,47.

Ang kinakailangang agwat ng kumpiyansa para sa isang pagtatantya na may pagiging maaasahan b = 0.96 ng hindi alam na inaasahan sa matematika ay katumbas ng: 28.53< a < 31,47.



Bago sa site

>

Pinaka sikat