Bahay Pinahiran ng dila Kung may anyo ang serye ng variation. Serye ng variation at variation, saklaw ng variation

Kung may anyo ang serye ng variation. Serye ng variation at variation, saklaw ng variation

Variational ay tinatawag na serye ng pamamahagi na binuo sa isang quantitative na batayan. Ang mga halaga ng mga quantitative na katangian sa mga indibidwal na yunit ng populasyon ay hindi pare-pareho at naiiba nang higit pa o mas kaunti sa bawat isa.

pagkakaiba-iba- pagbabagu-bago, pagbabago ng halaga ng isang katangian sa mga yunit ng populasyon. Hiwalay mga numerong halaga ang mga katangiang makikita sa populasyon na pinag-aaralan ay tinatawag mga pagpipilian mga halaga. Hindi sapat na average na halaga para sa buong katangian pinipilit tayo ng populasyon na dagdagan ang mga average na halaga ng mga tagapagpahiwatig na nagbibigay-daan sa amin upang masuri ang tipikal ng mga average na ito sa pamamagitan ng pagsukat ng pagkakaiba-iba (variation) ng katangiang pinag-aaralan.

Ang pagkakaroon ng pagkakaiba-iba ay dahil sa impluwensya ng isang malaking bilang ng mga kadahilanan sa pagbuo ng antas ng katangian. Ang mga salik na ito ay kumikilos nang may hindi pantay na lakas at sa iba't ibang direksyon. Ginagamit ang mga indeks ng pagkakaiba-iba upang ilarawan ang sukatan ng pagkakaiba-iba ng katangian.

Mga gawain istatistikal na pag-aaral mga pagkakaiba-iba:

  • 1) pag-aaral ng kalikasan at antas ng pagkakaiba-iba ng mga katangian sa mga indibidwal na yunit ng populasyon;
  • 2) pagtukoy sa papel ng mga indibidwal na kadahilanan o kanilang mga grupo sa pagkakaiba-iba ng ilang mga katangian ng populasyon.

Ginamit sa mga istatistika mga espesyal na pamamaraan pag-aaral ng pagkakaiba-iba batay sa paggamit ng isang sistema ng mga tagapagpahiwatig, Sa kung saan sinusukat ang pagkakaiba-iba.

Ang pag-aaral ng mga pagkakaiba-iba ay may mahalaga. Ang pagsukat ng mga pagkakaiba-iba ay kinakailangan kapag nagsasagawa ng sampling, ugnayan at pagsusuri ng pagkakaiba-iba atbp. Ermolaev O.Yu. Mga istatistika ng matematika para sa mga psychologist: Textbook [Text]/ O.Yu. Ermolaev. - M.: Flint Publishing House ng Moscow Psychological and Social Institute, 2012. - 335 p.

Sa pamamagitan ng antas ng pagkakaiba-iba ay maaaring hatulan ng isa ang homogeneity ng populasyon, ang katatagan ng mga indibidwal na halaga ng mga katangian at ang tipikal ng average. Sa kanilang batayan, ang mga tagapagpahiwatig ng pagiging malapit ng ugnayan sa pagitan ng mga katangian at mga tagapagpahiwatig para sa pagtatasa ng katumpakan ng sample na pagmamasid ay binuo.

Ang pagkakaiba ay ginawa sa pagitan ng pagkakaiba-iba sa espasyo at pagkakaiba-iba sa oras.

Ang pagkakaiba-iba sa espasyo ay nauunawaan bilang ang pagbabagu-bago ng mga halaga ng katangian sa mga yunit ng populasyon na kumakatawan sa mga indibidwal na teritoryo. Ang pagkakaiba-iba sa paglipas ng panahon ay nangangahulugan ng pagbabago sa mga halaga ng isang katangian sa iba't ibang panahon oras.

Upang pag-aralan ang pagkakaiba-iba sa mga hilera ng pamamahagi, ang lahat ng mga variant ng mga halaga ng katangian ay nakaayos sa pataas o pababang pagkakasunud-sunod. Ang prosesong ito ay tinatawag na series ranking.

Ang pinaka mga simpleng palatandaan mga pagkakaiba-iba ay minimum at maximum- ang pinakamaliit at pinakamataas na halaga mga palatandaan sa pinagsama-samang. Ang bilang ng mga pag-uulit ng mga indibidwal na variant ng mga halaga ng tampok ay tinatawag na dalas ng pag-uulit (fi). Ito ay maginhawa upang palitan ang mga frequency sa mga frequency - wi. Ang dalas ay isang kamag-anak na tagapagpahiwatig ng dalas, na maaaring ipahayag sa mga fraction ng isang yunit o porsyento at nagbibigay-daan sa iyong ihambing ang mga serye ng variation sa magkaibang numero mga obserbasyon. Ipinahayag ng formula:

kung saan ang Xmax, Xmin ay ang pinakamataas at pinakamababang halaga ng katangian sa pinagsama-samang; n - bilang ng mga pangkat.

Upang sukatin ang pagkakaiba-iba ng isang katangian, ginagamit ang iba't ibang absolute at relative indicator. Kabilang sa mga ganap na tagapagpahiwatig ng variation ang hanay ng variation, average na linear deviation, dispersion, at standard deviation. Kasama sa mga relatibong indicator ng oscillation ang coefficient of oscillation, relative linear deviation, at coefficient of variation.

Paghahanap ng halimbawa serye ng pagkakaiba-iba

Mag-ehersisyo. Para sa sample na ito:

  • a) Hanapin ang serye ng variation;
  • b) Buuin ang function ng pamamahagi;

Hindi.=42. Mga halimbawang elemento:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

Solusyon.

  • a) pagbuo ng isang ranggo na serye ng pagkakaiba-iba:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • b) pagbuo ng isang discrete variation series.

Kalkulahin natin ang bilang ng mga pangkat sa serye ng variation gamit ang formula ng Sturgess:

Kunin natin ang bilang ng mga pangkat na katumbas ng 7.

Alam ang bilang ng mga pangkat, kinakalkula namin ang laki ng agwat:

Para sa kaginhawaan ng pagbuo ng talahanayan, kukunin namin ang bilang ng mga pangkat na katumbas ng 8, ang pagitan ay magiging 1.

kanin. 1 Ang dami ng mga benta ng mga kalakal ng isang tindahan para sa isang tiyak na tagal ng panahon

Tinutukoy ng pagkakaiba-iba mga pagkakaiba sa mga halaga ng isang katangian sa iba't ibang mga yunit ng isang naibigay na populasyon sa parehong panahon (point in time). Ang mga dahilan para sa mga pagkakaiba-iba ay iba't ibang kondisyon pagkakaroon ng iba't ibang yunit ng kabuuan. Halimbawa, kahit na ang kambal sa kurso ng kanilang buhay ay nakakakuha ng mga pagkakaiba sa taas, timbang, pati na rin sa mga katangian tulad ng antas ng edukasyon, kita, bilang ng mga bata, atbp.

Ang pagkakaiba-iba ay lumitaw bilang isang resulta ng katotohanan na ang mga halaga ng katangian mismo ay nabuo sa ilalim ng kabuuang impluwensya ng iba't ibang mga kondisyon, na pinagsama sa iba't ibang paraan sa bawat indibidwal na kaso. Kaya, ang halaga ng anumang opsyon ay layunin.

Ang pagkakaiba-iba ay katangian sa lahat ng mga phenomena ng kalikasan at lipunan, nang walang pagbubukod, maliban sa mga legal na itinatag na mga kahulugan ng normatibo ng mga indibidwal na katangiang panlipunan. Ang mga pag-aaral ng pagkakaiba-iba sa mga istatistika ay may malaking halaga, tumulong upang maunawaan ang kakanyahan ng hindi pangkaraniwang bagay na pinag-aaralan. Ang paghahanap ng pagkakaiba-iba, pag-alam sa mga sanhi nito, pagkilala sa impluwensya ng mga indibidwal na kadahilanan ay nagbibigay mahalagang impormasyon para sa pagpapatupad ng mga desisyon sa pamamahala na nakabatay sa siyentipiko.

Ang average na halaga ay nagbibigay ng isang pangkalahatang katangian ng katangian ng populasyon, ngunit hindi ito nagbubunyag ng istraktura nito. Ang average na halaga ay hindi nagpapakita kung paano ang mga variant ng average na katangian ay matatagpuan sa paligid nito, kung sila ay ibinahagi malapit sa average o lumihis mula dito. Ang average sa dalawang populasyon ay maaaring pareho, ngunit sa isang bersyon ang lahat ng mga indibidwal na halaga ay naiiba mula dito nang hindi gaanong mahalaga, at sa isa pa, ang mga pagkakaibang ito ay malaki, i.e. sa unang kaso ang pagkakaiba-iba ng katangian ay maliit, at sa pangalawa ito ay malaki, ito ay napakahalaga para sa pagkilala sa kahalagahan ng average na halaga.

Upang ang pinuno ng isang organisasyon, isang tagapamahala, o isang mananaliksik ay makapag-aral ng variation at pamahalaan ito, ang mga istatistika ay bumuo ng mga espesyal na pamamaraan para sa pag-aaral ng variation (isang sistema ng mga indicator). Sa kanilang tulong, ang pagkakaiba-iba ay matatagpuan at ang mga katangian nito ay nailalarawan. Kasama sa mga tagapagpahiwatig ng pagkakaiba-iba : hanay ng variation, average linear deviation, koepisyent ng variation.

Serye ng pagkakaiba-iba at mga anyo nito

Serye ng pagkakaiba-iba- ito ay isang nakaayos na pamamahagi ng mga yunit ng isang populasyon, madalas ayon sa pagtaas (mas madalas na pagbaba) mga halaga ng isang katangian at pagbibilang ng bilang ng mga yunit na may isang partikular na halaga ng katangian. Kapag ang bilang ng mga yunit ng populasyon ay malaki, ang ranggo na serye ay nagiging mahirap, ang pagtatayo nito ay tumatagal matagal na panahon. Sa ganoong sitwasyon, ang isang serye ng pagkakaiba-iba ay itinayo sa pamamagitan ng pagpapangkat ng mga yunit ng populasyon ayon sa mga halaga ng katangiang pinag-aaralan.

May mga sumusunod mga anyo ng serye ng pagkakaiba-iba :

  1. Serye ng ranggo ay kumakatawan sa isang listahan ng mga indibidwal na yunit ng populasyon sa pataas (pababang) pagkakasunud-sunod ng katangiang pinag-aaralan.
  2. Discrete variation series - ito ay isang talahanayan na binubuo ng dalawang linya o mga graph: mga tiyak na halaga ng iba't ibang katangian x at ang bilang ng mga yunit ng populasyon na may ibinigay na halaga f - ang katangian ng dalas. Ito ay itinayo kapag ang katangian ay nakakuha ng pinakamalaking bilang ng mga halaga.
  3. Serye ng pagitan.

Natutukoy ang hanay ng pagkakaiba-iba bilang ganap na halaga ng pagkakaiba sa pagitan ng maximum at minimum na mga halaga (mga variant) ng katangian:

Ang hanay ng mga pagkakaiba-iba ay nagpapakita lamang matinding paglihis ng katangian at hindi sumasalamin sa mga indibidwal na paglihis ng lahat ng mga opsyon sa serye. Nailalarawan nito ang mga limitasyon ng pagbabago sa isang iba't ibang katangian at nakadepende sa pagbabagu-bago ng dalawang matinding opsyon at ganap na hindi nauugnay sa mga frequency sa serye ng variation, ibig sabihin, sa likas na katangian ng pamamahagi, na nagbibigay sa halagang ito ng random na karakter. Upang pag-aralan ang pagkakaiba-iba, kailangan mo ng isang tagapagpahiwatig na sumasalamin sa lahat ng mga pagbabago sa katangian ng pagkakaiba-iba at nagbibigay pangkalahatang katangian. Ang pinakasimpleng tagapagpahiwatig ng ganitong uri ay ang average na linear deviation.

Serye ng pamamahagi ng istatistika– ito ay isang maayos na pamamahagi ng mga yunit ng populasyon sa mga pangkat ayon sa isang tiyak na magkakaibang katangian.
Depende sa katangiang pinagbabatayan ng pagbuo ng serye ng pamamahagi, mayroong attributive at variational distribution series.

Ang pagkakaroon ng isang karaniwang katangian ay ang batayan para sa pagbuo ng isang istatistikal na populasyon, na kumakatawan sa mga resulta ng isang paglalarawan o pagsukat. karaniwang mga tampok mga bagay sa pananaliksik.

Ang paksa ng pag-aaral sa istatistika ay nagbabago (nag-iiba-iba) ng mga katangian o istatistikal na katangian.

Mga uri ng istatistikal na katangian.

Ang mga serye ng pamamahagi ay tinatawag na katangian binuo ayon sa pamantayan ng kalidad. Attributive– ito ay isang palatandaan na may pangalan (halimbawa, propesyon: mananahi, guro, atbp.).
Ang serye ng pamamahagi ay karaniwang ipinakita sa anyo ng mga talahanayan. Sa mesa Ipinapakita ng 2.8 ang serye ng pamamahagi ng katangian.
Talahanayan 2.8 - Pamamahagi ng mga species legal na tulong mga serbisyong ibinibigay ng mga abogado sa mga mamamayan ng isa sa mga rehiyon ng Russian Federation.

Serye ng pagkakaiba-iba– ito ang mga halaga ng katangian (o mga pagitan ng mga halaga) at ang kanilang mga frequency.
Ang mga serye ng pagkakaiba-iba ay serye ng pamamahagi, na binuo sa isang quantitative na batayan. Ang anumang serye ng variation ay binubuo ng dalawang elemento: mga opsyon at frequency.
Ang mga variant ay itinuturing na mga indibidwal na halaga ng isang katangian na kinukuha nito sa isang serye ng variation.
Ang mga frequency ay ang mga bilang ng mga indibidwal na variant o bawat pangkat ng isang serye ng variation, i.e. Ito ang mga numerong nagpapakita kung gaano kadalas nangyayari ang ilang mga opsyon sa isang serye ng pamamahagi. Tinutukoy ng kabuuan ng lahat ng mga frequency ang laki ng buong populasyon, ang dami nito.
Ang mga frequency ay mga frequency na ipinahayag bilang mga fraction ng isang yunit o bilang isang porsyento ng kabuuan. Alinsunod dito, ang kabuuan ng mga frequency ay katumbas ng 1 o 100%. Binibigyang-daan ng serye ng variation ang isa na matantya ang anyo ng batas sa pamamahagi batay sa aktwal na data.

Depende sa likas na katangian ng pagkakaiba-iba ng katangian, mayroong discrete at interval variation series.
Ang isang halimbawa ng isang discrete variation series ay ibinigay sa talahanayan. 2.9.
Talahanayan 2.9 - Pamamahagi ng mga pamilya ayon sa bilang ng mga inookupahang silid sa mga indibidwal na apartment noong 1989 sa Russian Federation.

Ang unang column ng talahanayan ay nagpapakita ng mga opsyon para sa isang discrete variation series, ang pangalawang column ay naglalaman ng mga frequency ng variation series, at ang pangatlo ay naglalaman ng frequency indicator.

Serye ng pagkakaiba-iba

SA populasyon isang tiyak na quantitative na katangian ang sinisiyasat. Ang isang sample ng volume ay random na kinuha mula dito n, iyon ay, ang bilang ng mga sample na elemento ay katumbas ng n. Sa unang yugto ng pagproseso ng istatistika, sumasaklaw mga sample, i.e. pag-order ng numero x 1 , x 2 , …, x n Paakyat. Ang bawat naobserbahang halaga x i tinawag opsyon. Dalas m i ay ang bilang ng mga obserbasyon ng halaga x i sa sample. Relatibong dalas (dalas) w i ay ang frequency ratio m i sa laki ng sample n: .
Kapag nag-aaral ng mga serye ng variation, ginagamit din ang mga konsepto ng accumulated frequency at accumulated frequency. Hayaan x ilang numero. Pagkatapos ang bilang ng mga pagpipilian , na ang mga halaga ay mas mababa x, ay tinatawag na accumulated frequency: para sa x i n ay tinatawag na accumulated frequency w i max.
Ang isang katangian ay tinatawag na discretely variable kung ang mga indibidwal na halaga nito (mga variant) ay naiiba sa bawat isa sa pamamagitan ng isang tiyak na halaga (karaniwan ay isang integer). Ang serye ng variation ng naturang katangian ay tinatawag na discrete variation series.

Talahanayan 1. Pangkalahatang view ng isang discrete variation frequency series

Mga katangiang halagax i x 1 x 2 x n
Mga frequencym i m 1 m 2 m n

Ang isang katangian ay tinatawag na patuloy na nag-iiba-iba kung ang mga halaga nito ay naiiba sa bawat isa sa pamamagitan ng isang arbitraryong maliit na halaga, i.e. ang isang palatandaan ay maaaring tumagal ng anumang halaga sa isang tiyak na agwat. Ang isang tuluy-tuloy na serye ng variation para sa naturang katangian ay tinatawag na interval.

Talahanayan 2. Pangkalahatang view ng pagkakaiba-iba ng pagitan ng serye ng mga frequency

Talahanayan 3. Mga graphic na larawan ng serye ng variation

hileraPolygon o histogramEmpirical distribution function
discrete
Pagitan
Sa pamamagitan ng pagsusuri sa mga resulta ng mga obserbasyon, natutukoy kung gaano karaming mga variant na halaga ang nahuhulog sa bawat tiyak na agwat. Ipinapalagay na ang bawat pagitan ay kabilang sa isa sa mga dulo nito: alinman sa lahat ng mga kaso na natitira (mas madalas) o sa lahat ng mga kaso sa kanan, at ang mga frequency o frequency ay nagpapakita ng bilang ng mga opsyon na nakapaloob sa loob ng tinukoy na mga hangganan. Mga Pagkakaiba a i – a i +1 ay tinatawag na mga partial interval. Upang pasimplehin ang mga kasunod na kalkulasyon, ang serye ng pagkakaiba-iba ng agwat ay maaaring palitan ng isang may kondisyon na discrete. Sa kasong ito, ang average na halaga i-Ang pagitan ay kinuha bilang isang pagpipilian x i, at ang kaukulang dalas ng pagitan m i– para sa dalas ng agwat na ito.
Para sa graphical na representasyon ng variation series, ang pinakakaraniwang ginagamit ay polygon, histogram, cumulative curve at empirical distribution function.

Sa mesa 2.3 (Pagpapangkat ng populasyon ng Russia ayon sa average na kita ng bawat kapita noong Abril 1994) ay ipinakita serye ng pagkakaiba-iba ng pagitan.
Ito ay maginhawa upang pag-aralan ang serye ng pamamahagi gamit ang isang graphical na imahe, na nagpapahintulot sa isa na hatulan ang hugis ng pamamahagi. Ang isang visual na representasyon ng katangian ng mga pagbabago sa mga frequency ng serye ng variation ay ibinibigay ng polygon at histogram.
Ginagamit ang polygon kapag naglalarawan ng discrete variation series.
Hayaan, halimbawa, graphical na ilarawan ang pamamahagi ng stock ng pabahay ayon sa uri ng apartment (Talahanayan 2.10).
Talahanayan 2.10 - Pamamahagi ng stock ng pabahay ng urban area ayon sa uri ng apartment (conditional figures).


kanin. Lugar ng pamamahagi ng pabahay


Hindi lamang ang mga halaga ng dalas, kundi pati na rin ang mga frequency ng serye ng pagkakaiba-iba ay maaaring i-plot sa mga ordinate axes.
Ang histogram ay ginagamit upang ilarawan ang isang serye ng pagkakaiba-iba ng pagitan. Kapag bumubuo ng isang histogram, ang mga halaga ng mga pagitan ay naka-plot sa abscissa axis, at ang mga frequency ay inilalarawan ng mga parihaba na binuo sa kaukulang mga agwat. Ang taas ng mga haligi sa kaso ng pantay na pagitan ay dapat na proporsyonal sa mga frequency. Ang histogram ay isang graph kung saan ang isang serye ay inilalarawan bilang mga bar na magkatabi.
Ilarawan natin nang grapiko ang serye ng pamamahagi ng pagitan na ibinigay sa talahanayan. 2.11.
Talahanayan 2.11 - Pamamahagi ng mga pamilya ayon sa laki ng tirahan bawat tao (conditional figures).
N p/p Mga grupo ng mga pamilya ayon sa laki ng tirahan bawat tao Bilang ng mga pamilya na may partikular na laki ng tirahan Pinagsama-samang bilang ng mga pamilya
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
KABUUAN 115 ----


kanin. 2.2. Histogram ng pamamahagi ng mga pamilya ayon sa laki ng living space bawat tao


Gamit ang data ng naipon na serye (Talahanayan 2.11), bumuo kami pinagsama-samang pamamahagi.


kanin. 2.3. Pinagsama-samang pamamahagi ng mga pamilya ayon sa laki ng tirahan bawat tao


Ang representasyon ng isang serye ng variation sa anyo ng isang cumulate ay partikular na epektibo para sa mga serye ng variation na ang mga frequency ay ipinahayag bilang mga fraction o mga porsyento ng kabuuan ng mga frequency ng serye.
Kung babaguhin natin ang mga axes kapag graphical na naglalarawan ng isang serye ng variation sa anyo ng mga cumulates, pagkatapos ay makukuha natin ogiva. Sa Fig. Ang 2.4 ay nagpapakita ng isang ogive na binuo batay sa data sa Talahanayan. 2.11.
Ang isang histogram ay maaaring ma-convert sa isang polygon ng pamamahagi sa pamamagitan ng paghahanap ng mga midpoint ng mga gilid ng mga parihaba at pagkatapos ay ikonekta ang mga puntong ito sa mga tuwid na linya. Ang resultang polygon ng pamamahagi ay ipinapakita sa Fig. 2.2 na may tuldok-tuldok na linya.
Kapag bumubuo ng isang histogram ng pamamahagi ng isang serye ng pagkakaiba-iba na may hindi pantay na mga agwat, hindi ang mga frequency na naka-plot kasama ang ordinate axis, ngunit ang density ng pamamahagi ng katangian sa kaukulang mga agwat.
Ang density ng pamamahagi ay ang dalas na kinakalkula sa bawat lapad ng pagitan ng yunit, i.e. kung gaano karaming mga yunit sa bawat pangkat ang bawat yunit ng halaga ng pagitan. Ang isang halimbawa ng pagkalkula ng density ng pamamahagi ay ipinakita sa talahanayan. 2.12.
Talahanayan 2.12 - Pamamahagi ng mga negosyo ayon sa bilang ng mga empleyado (conditional figures)
N p/p Mga grupo ng mga negosyo ayon sa bilang ng mga empleyado, mga tao. Bilang ng mga negosyo Laki ng pagitan, mga tao. Densidad ng pamamahagi
A 1 2 3=1/2
1 Hanggang sa 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
KABUUAN 147 ---- ----

Maaari ding gamitin upang graphical na kumatawan sa serye ng variation pinagsama-samang kurba. Gamit ang isang pinagsama-samang (sum curve), isang serye ng mga naipon na frequency ay inilalarawan. Natutukoy ang mga pinagsama-samang frequency sa pamamagitan ng sunud-sunod na pagbubuod ng mga frequency sa mga grupo at ipinapakita kung gaano karaming mga unit sa populasyon ang may mga attribute value na hindi hihigit sa value na isinasaalang-alang.


kanin. 2.4. Ogive ng pamamahagi ng mga pamilya ayon sa laki ng living space bawat tao

Kapag bumubuo ng mga pinagsama-samang serye ng pagkakaiba-iba ng pagitan, ang mga variant ng serye ay naka-plot sa kahabaan ng abscissa axis, at ang mga naipon na frequency ay naka-plot sa kahabaan ng ordinate axis.

Ang isang espesyal na lugar sa pagsusuri sa istatistika ay nabibilang sa pagpapasiya ng average na antas ng katangian o kababalaghan na pinag-aaralan. Ang average na antas ng isang katangian ay sinusukat ng mga average na halaga.

Ang average na halaga ay nagpapakilala sa pangkalahatang dami ng antas ng katangiang pinag-aaralan at isang pangkat na pag-aari ng istatistikal na populasyon. Ito ay nag-level out, nagpapahina ng mga random na paglihis ng mga indibidwal na obserbasyon sa isang direksyon o iba pa at itinatampok ang pangunahing, tipikal na katangian ng katangiang pinag-aaralan.

Ang mga average ay malawakang ginagamit:

1. Upang masuri ang katayuan sa kalusugan ng populasyon: mga katangian ng pisikal na pag-unlad (taas, timbang, circumference ng dibdib, atbp.), Pagkilala sa pagkalat at tagal ng iba't ibang mga sakit, pagsusuri ng mga demograpikong tagapagpahiwatig (mahahalagang paggalaw ng populasyon, average na pag-asa sa buhay, pagpaparami ng populasyon, karaniwang populasyon at iba pa).

2. Upang pag-aralan ang mga aktibidad ng mga institusyong medikal, mga medikal na tauhan at tasahin ang kalidad ng kanilang trabaho, planuhin at tukuyin ang mga pangangailangan ng populasyon para sa iba't ibang uri ng pangangalagang medikal (average na bilang ng mga kahilingan o pagbisita bawat residente bawat taon, average na haba ng pananatili ng isang pasyente sa isang ospital, average na tagal ng pagsusuri ng pasyente, average na pagkakaroon ng mga doktor, kama, atbp.).

3. Upang makilala ang sanitary at epidemiological state (average na air dust content sa workshop, average na lugar bawat tao, average na pagkonsumo ng mga protina, taba at carbohydrates, atbp.).

4. Upang matukoy ang mga medikal at physiological na tagapagpahiwatig sa normal at pathological na mga kondisyon, kapag nagpoproseso ng data ng laboratoryo, upang maitaguyod ang pagiging maaasahan ng mga resulta ng isang sample na pag-aaral sa panlipunan, kalinisan, klinikal, at eksperimentong pag-aaral.

Ang pagkalkula ng mga average na halaga ay isinasagawa batay sa serye ng pagkakaiba-iba. Serye ng pagkakaiba-iba ay isang qualitatively homogenous na set ng istatistika, ang mga indibidwal na yunit kung saan nailalarawan ang dami ng mga pagkakaiba ng katangian o phenomenon na pinag-aaralan.

Ang quantitative variation ay maaaring may dalawang uri: discontinuous (discrete) at continuous.

Ang isang discontinuous (discrete) na katangian ay ipinahayag lamang bilang isang integer at hindi maaaring magkaroon ng anumang mga intermediate na halaga (halimbawa, ang bilang ng mga pagbisita, ang populasyon ng site, ang bilang ng mga bata sa pamilya, ang kalubhaan ng sakit sa mga puntos , atbp.).

Ang isang tuluy-tuloy na pag-sign ay maaaring tumagal sa anumang mga halaga sa loob ng ilang mga limitasyon, kabilang ang mga fractional, at ipinahayag lamang ng humigit-kumulang (halimbawa, timbang - para sa mga matatanda maaari itong limitado sa mga kilo, at para sa mga bagong silang - gramo; taas, presyon ng dugo, oras ginugol sa pagpapatingin sa isang pasyente, at iba pa).



Ang digital na halaga ng bawat indibidwal na katangian o phenomenon na kasama sa serye ng variation ay tinatawag na variant at itinalaga ng titik V . Ang iba pang mga notasyon ay matatagpuan din sa matematikal na panitikan, halimbawa x o y.

Ang isang serye ng variation, kung saan ang bawat opsyon ay ipinahiwatig nang isang beses, ay tinatawag na simple. Ang ganitong mga serye ay ginagamit sa karamihan ng mga istatistikal na problema sa kaso ng computer data processing.

Habang tumataas ang bilang ng mga obserbasyon, malamang na mangyari ang paulit-ulit na mga halaga ng variant. Sa kasong ito, ito ay nilikha pinagsama-samang serye ng variation, kung saan ang bilang ng mga pag-uulit ay ipinahiwatig (dalas, na tinutukoy ng titik " R »).

Serye ng variation ng ranggo binubuo ng mga opsyon na nakaayos sa pataas o pababang pagkakasunud-sunod. Parehong simple at nakapangkat na serye ay maaaring isama sa pagraranggo.

Serye ng pagkakaiba-iba ng pagitan pinagsama-sama upang gawing simple ang mga kasunod na kalkulasyon na isinagawa nang hindi gumagamit ng isang computer, na may napakalaking bilang ng mga yunit ng pagmamasid (higit sa 1000).

Patuloy na serye ng variation kasama ang mga halaga ng opsyon, na maaaring maging anumang halaga.

Kung sa isang serye ng pagkakaiba-iba ang mga halaga ng isang katangian (mga variant) ay ibinibigay sa anyo ng mga indibidwal na tiyak na numero, kung gayon ang naturang serye ay tinatawag discrete.

Ang mga pangkalahatang katangian ng mga halaga ng katangian na makikita sa serye ng pagkakaiba-iba ay ang mga average na halaga. Kabilang sa mga ito, ang pinaka ginagamit ay: arithmetic mean M, fashion Mo at median Ako. Ang bawat isa sa mga katangiang ito ay natatangi. Hindi nila maaaring palitan ang isa't isa at magkasama lamang sila ay kumakatawan sa mga tampok ng serye ng pagkakaiba-iba nang lubos at sa isang condensed form.

Fashion (Mo) pangalanan ang halaga ng pinakamadalas na nagaganap na mga opsyon.

Median (ako) – ito ang halaga ng opsyon na naghahati sa ranggo na serye ng variation sa kalahati (sa bawat panig ng median ay may kalahati ng opsyon). Sa mga bihirang kaso, kapag mayroong simetriko na serye ng variation, ang mode at median ay pantay sa isa't isa at nag-tutugma sa halaga ng arithmetic mean.

Ang pinakakaraniwang katangian ng mga halaga ng opsyon ay ibig sabihin ng aritmetika halaga( M ). Sa panitikan ng matematika ito ay tinutukoy .

Ang ibig sabihin ng aritmetika (M, ) ay isang pangkalahatang quantitative na katangian ng isang tiyak na katangian ng phenomena na pinag-aaralan, na bumubuo ng qualitatively homogeneous statistical population. May mga simple at may timbang na arithmetic average. Ang simpleng arithmetic mean ay kinakalkula para sa isang simpleng serye ng variation sa pamamagitan ng pagbubuod ng lahat ng opsyon at paghahati sa kabuuan na ito sa kabuuang bilang ng mga opsyon na kasama sa serye ng variation na ito. Ang mga kalkulasyon ay isinasagawa ayon sa pormula:

,

saan: M - simpleng ibig sabihin ng aritmetika;

Σ V - pagpipilian sa halaga;

n- bilang ng mga obserbasyon.

Sa pangkat na serye ng variation, tinutukoy ang weighted arithmetic mean. Ang formula para sa pagkalkula nito:

,

saan: M - arithmetic weighted average;

Σ Vp - ang kabuuan ng mga produkto ng variant sa pamamagitan ng kanilang mga frequency;

n- bilang ng mga obserbasyon.

Sa isang malaking bilang ng mga obserbasyon, sa kaso ng mga manu-manong kalkulasyon, ang paraan ng mga sandali ay maaaring gamitin.

Ang arithmetic mean ay may mga sumusunod na katangian:

· kabuuan ng mga paglihis mula sa average ( Σ d ) ay katumbas ng zero (tingnan ang Talahanayan 15);

· kapag pina-multiply (hinahati) ang lahat ng opsyon sa parehong salik (divisor), ang arithmetic mean ay pina-multiply (hinati) ng parehong salik (divisor);

· kung idaragdag mo (babawas) ang parehong numero sa lahat ng mga opsyon, ang arithmetic mean ay tataas (bumababa) ng parehong numero.

Ang mga average na aritmetika, na kinuha sa kanilang sarili, nang hindi isinasaalang-alang ang pagkakaiba-iba ng serye kung saan sila kinakalkula, ay maaaring hindi ganap na sumasalamin sa mga katangian ng serye ng pagkakaiba-iba, lalo na kapag kinakailangan ang paghahambing sa iba pang mga average. Ang mga average na malapit sa halaga ay maaaring makuha mula sa mga serye na may iba't ibang antas ng scattering. Kung mas malapit ang mga indibidwal na opsyon sa isa't isa sa mga tuntunin ng kanilang mga quantitative na katangian, mas kaunti pagpapakalat (oscillation, variability) serye, mas tipikal ang average nito.

Ang mga pangunahing parameter na nagbibigay-daan sa amin upang masuri ang pagkakaiba-iba ng isang katangian ay:

· Saklaw;

· Malawak;

· Karaniwang lihis;

· Ang koepisyent ng pagkakaiba-iba.

Ang pagkakaiba-iba ng isang katangian ay maaaring humigit-kumulang na hinuhusgahan ng saklaw at amplitude ng serye ng variation. Ang hanay ay nagpapahiwatig ng maximum (V max) at minimum (V min) na mga opsyon sa serye. Ang amplitude (A m) ay ang pagkakaiba sa pagitan ng mga opsyong ito: A m = V max - V min.

Ang pangunahing, karaniwang tinatanggap na sukatan ng pagkakaiba-iba ng isang serye ng variation ay pagpapakalat (D ). Ngunit ang madalas na ginagamit ay isang mas maginhawang parameter na kinakalkula batay sa pagpapakalat - ang karaniwang paglihis ( σ ). Isinasaalang-alang nito ang magnitude ng paglihis ( d ) ng bawat serye ng variation mula sa arithmetic mean nito ( d=V - M ).

Dahil ang mga paglihis mula sa average ay maaaring maging positibo at negatibo, kapag pinagsama-sama ay binibigyan nila ang halagang "0" (S d=0). Upang maiwasan ito, ang mga halaga ng paglihis ( d) ay itinaas sa pangalawang kapangyarihan at na-average. Kaya, ang dispersion ng isang variation series ay ang mean square ng deviations ng isang variant mula sa arithmetic mean at kinakalkula ng formula:

.

Ito ang pinakamahalagang katangian ng pagkakaiba-iba at ginagamit upang kalkulahin ang maraming pamantayan sa istatistika.

Dahil ang dispersion ay ipinahayag bilang parisukat ng mga paglihis, ang halaga nito ay hindi maaaring gamitin kumpara sa arithmetic mean. Para sa mga layuning ito ito ay ginagamit karaniwang lihis, na itinalaga ng sign na "Sigma" ( σ ). Inilalarawan nito ang average na paglihis ng lahat ng variant ng isang serye ng variation mula sa arithmetic mean na halaga sa parehong mga yunit bilang ang average na halaga mismo, upang magamit ang mga ito nang magkasama.

Ang karaniwang paglihis ay tinutukoy ng formula:

Ang tinukoy na formula ay inilapat kapag ang bilang ng mga obserbasyon ( n ) higit sa 30. Na may mas maliit na bilang n ang standard deviation value ay magkakaroon ng error na nauugnay sa mathematical offset ( n - 1). Sa pagsasaalang-alang na ito, ang isang mas tumpak na resulta ay maaaring makuha sa pamamagitan ng pagsasaalang-alang ng naturang bias sa pormula para sa pagkalkula ng karaniwang paglihis:

karaniwang lihis (s ) ay isang pagtatantya ng standard deviation ng isang random variable X kaugnay sa inaasahan nitong matematika batay sa isang walang pinapanigan na pagtatantya ng pagkakaiba nito.

Sa mga halaga n > 30 karaniwang paglihis ( σ ) at karaniwang paglihis ( s ) ay magiging pareho ( σ = s ). Samakatuwid, sa karamihan ng mga praktikal na manwal ang mga pamantayang ito ay itinuturing na may iba't ibang kahulugan. Sa isang programa Pagkalkula ng Excel maaaring isagawa ang karaniwang paglihis gamit ang function na =STDEV(range). At upang makalkula ang karaniwang paglihis, kailangan mong lumikha ng naaangkop na formula.

Ang ibig sabihin ng parisukat o karaniwang paglihis ay nagbibigay-daan sa iyo upang matukoy kung magkano ang mga halaga ng isang katangian ay maaaring mag-iba mula sa average na halaga. Ipagpalagay na mayroong dalawang lungsod na may parehong average na pang-araw-araw na temperatura sa tag-araw. Ang isa sa mga lungsod na ito ay matatagpuan sa baybayin, at ang isa pa sa kontinente. Ito ay kilala na sa mga lungsod na matatagpuan sa baybayin, ang mga pagkakaiba sa temperatura ng araw ay mas maliit kaysa sa mga lungsod na matatagpuan sa loob ng bansa. Samakatuwid, ang karaniwang paglihis ng mga temperatura sa araw para sa baybaying lungsod ay magiging mas mababa kaysa sa pangalawang lungsod. Sa pagsasagawa, nangangahulugan ito na ang average na temperatura ng hangin ng bawat isa tiyak na araw sa isang lungsod na matatagpuan sa kontinente ay higit na mag-iiba mula sa karaniwan kaysa sa isang lungsod sa baybayin. Bilang karagdagan, pinapayagan ka ng karaniwang paglihis na suriin ang mga posibleng paglihis ng temperatura mula sa average na may kinakailangang antas ng posibilidad.

Ayon sa teorya ng posibilidad, sa mga phenomena na sumusunod sa normal na batas sa pamamahagi, mayroong isang mahigpit na ugnayan sa pagitan ng mga halaga ng arithmetic mean, standard deviation at mga pagpipilian ( tatlong sigma na panuntunan). Halimbawa, 68.3% ng mga halaga ng iba't ibang katangian ay nasa loob ng M ± 1 σ , 95.5% - sa loob ng M ± 2 σ at 99.7% - sa loob ng M ± 3 σ .

Ang halaga ng karaniwang paglihis ay nagpapahintulot sa amin na hatulan ang likas na katangian ng homogeneity ng serye ng pagkakaiba-iba at ang pangkat ng pag-aaral. Kung ang halaga ng karaniwang paglihis ay maliit, kung gayon ito ay nagpapahiwatig ng isang medyo mataas na homogeneity ng hindi pangkaraniwang bagay na pinag-aaralan. Ang arithmetic mean sa kasong ito ay dapat ituring na medyo katangian para sa isang naibigay na serye ng variation. Gayunpaman, ang masyadong maliit na halaga ng sigma ay nag-iisip tungkol sa isang artipisyal na pagpili ng mga obserbasyon. Sa isang napakalaking sigma, ang arithmetic mean ay nagpapakilala sa serye ng variation sa isang mas mababang lawak, na nagpapahiwatig ng makabuluhang pagkakaiba-iba ng katangian o phenomenon na pinag-aaralan o ang heterogeneity ng pangkat na pinag-aaralan. Gayunpaman, ang paghahambing ng halaga ng standard deviation ay posible lamang para sa mga feature ng parehong dimensyon. Sa katunayan, kung ihahambing natin ang pagkakaiba-iba ng mga timbang ng mga bagong panganak na bata at matatanda, palagi tayong makakakuha ng mas mataas na mga halaga ng sigma sa mga matatanda.

Ang paghahambing ng pagkakaiba-iba ng mga tampok ng iba't ibang dimensyon ay maaaring gawin gamit ang koepisyent ng pagkakaiba-iba. Ito ay nagpapahayag ng pagkakaiba-iba bilang isang porsyento ng mean, na nagpapahintulot sa paghahambing iba't ibang palatandaan. Ang koepisyent ng pagkakaiba-iba sa medikal na literatura ay ipinahiwatig ng tanda na " SA ", at sa matematika " v"at kinakalkula ng formula:

.

Ang mga halaga ng koepisyent ng pagkakaiba-iba na mas mababa sa 10% ay nagpapahiwatig ng maliit na scattering, mula 10 hanggang 20% ​​- tungkol sa average, higit sa 20% - tungkol sa malakas na scattering sa paligid ng arithmetic mean.

Ang average na arithmetic ay karaniwang kinakalkula batay sa data sample na populasyon. Sa paulit-ulit na pag-aaral, sa ilalim ng impluwensya ng mga random na phenomena, maaaring magbago ang arithmetic mean. Ito ay dahil sa ang katunayan na, bilang isang panuntunan, bahagi lamang ng posibleng mga yunit ng pagmamasid ang pinag-aralan, iyon ay, ang sample na populasyon. Ang impormasyon tungkol sa lahat ng posibleng unit na kumakatawan sa phenomenon na pinag-aaralan ay maaaring makuha sa pamamagitan ng pag-aaral sa buong populasyon, na hindi laging posible. Kasabay nito, para sa layunin ng pag-generalize ng pang-eksperimentong data, ang halaga ng average sa pangkalahatang populasyon ay interesado. Samakatuwid, upang makabuo ng isang pangkalahatang konklusyon tungkol sa hindi pangkaraniwang bagay na pinag-aaralan, ang mga resulta na nakuha batay sa sample na populasyon ay dapat ilipat sa pangkalahatang populasyon gamit ang mga istatistikal na pamamaraan.

Upang matukoy ang antas ng kasunduan sa pagitan ng isang sample na pag-aaral at ng pangkalahatang populasyon, ito ay kinakailangan upang tantiyahin ang laki ng error na hindi maaaring hindi arises sa panahon ng sample na pagmamasid. Ang error na ito ay tinatawag na " Ang pagkakamali ng pagiging kinatawan"o "Average na error ng arithmetic mean." Ito talaga ang pagkakaiba sa pagitan ng mga average na nakuha mula sa sample istatistikal na pagmamasid, at mga katulad na halaga na makukuha sa patuloy na pag-aaral ng parehong bagay, i.e. kapag nag-aaral ng pangkalahatang populasyon. Dahil ang sample mean ay isang random na variable, ang naturang pagtataya ay isinasagawa na may antas ng posibilidad na katanggap-tanggap sa mananaliksik. SA medikal na pananaliksik ito ay hindi bababa sa 95%.

Ang error sa pagiging representatibo ay hindi maaaring malito sa mga error sa pagpaparehistro o mga error sa atensyon (mga slip, maling kalkulasyon, typo, atbp.), na dapat mabawasan ng mga sapat na pamamaraan at tool na ginamit sa panahon ng eksperimento.

Ang laki ng error sa pagiging representatibo ay depende sa laki ng sample at sa pagkakaiba-iba ng katangian. Paano mas malaking bilang obserbasyon, mas malapit ang sample sa populasyon at mas maliit ang error. Kung mas maraming variable ang sign, mas malaki ang statistical error.

Sa pagsasagawa, upang matukoy ang error sa pagiging kinatawan sa serye ng variation, ginagamit ang sumusunod na formula:

,

saan: m - pagkakamali ng pagiging kinatawan;

σ - karaniwang lihis;

n– bilang ng mga obserbasyon sa sample.

Mula sa formula ay malinaw na ang laki average na error ay direktang proporsyonal sa karaniwang paglihis, ibig sabihin, ang pagkakaiba-iba ng katangiang pinag-aaralan, at inversely proportional sa square root ng bilang ng mga obserbasyon.

Kapag nagsasagawa ng pagsusuri sa istatistika batay sa pagkalkula ng mga kamag-anak na halaga, hindi kinakailangan ang pagbuo ng serye ng variation. Sa kasong ito, ang pagpapasiya ng average na error para sa mga kamag-anak na tagapagpahiwatig ay maaaring isagawa gamit ang isang pinasimple na formula:

,

saan: R– ang halaga ng kamag-anak na tagapagpahiwatig, na ipinahayag bilang isang porsyento, ppm, atbp.;

q– ang kapalit ng P at ipinahayag bilang (1-P), (100-P), (1000-P), atbp., depende sa batayan kung saan kinakalkula ang indicator;

n– bilang ng mga obserbasyon sa sample na populasyon.

Gayunpaman, ang tinukoy na pormula para sa pagkalkula ng error sa pagiging kinatawan para sa mga kamag-anak na halaga ay maaari lamang mailapat kapag ang halaga ng tagapagpahiwatig ay mas mababa kaysa sa base nito. Sa isang bilang ng mga kaso ng pagkalkula ng masinsinang tagapagpahiwatig, ang kundisyong ito ay hindi natutugunan, at ang tagapagpahiwatig ay maaaring ipahayag bilang isang bilang na higit sa 100% o 1000%. Sa ganoong sitwasyon, ang isang serye ng pagkakaiba-iba ay itinayo at ang error sa representasyon ay kinakalkula gamit ang formula para sa mga average na halaga batay sa karaniwang paglihis.

Ang pagtataya ng halaga ng arithmetic mean sa populasyon ay isinasagawa sa pamamagitan ng pagpahiwatig ng dalawang halaga – ang minimum at maximum. Ang mga matinding halaga na ito posibleng mga paglihis, kung saan maaaring magbago ang nais na average na halaga ng populasyon ay tinatawag na “ Mga hangganan ng tiwala».

Ang mga postulates ng probability theory ay napatunayan na sa isang normal na pamamahagi ng isang katangian na may posibilidad na 99.7%, ang matinding mga halaga ng mga paglihis ng average ay hindi lalampas sa halaga ng triple ang error sa representasyon ( M ± 3 m ); sa 95.5% – hindi hihigit sa dalawang beses ang average na error ng average na halaga ( M ± 2 m ); sa 68.3% – hindi hihigit sa isang karaniwang error ( M ± 1 m ) (Larawan 9).

P%

kanin. 9. Probability density normal na pamamahagi.

Tandaan na ang pahayag sa itaas ay totoo lamang para sa isang tampok na sumusunod sa normal na batas ng pamamahagi ng Gaussian.

Karamihan sa mga pang-eksperimentong pag-aaral, kabilang sa larangan ng medisina, ay nauugnay sa mga sukat, ang mga resulta nito ay maaaring tumagal sa halos anumang halaga sa isang naibigay na agwat, samakatuwid, bilang panuntunan, ang mga ito ay inilarawan ng isang modelo ng tuluy-tuloy na mga random na variable. Sa pagsasaalang-alang na ito, ang karamihan sa mga istatistikal na pamamaraan ay isinasaalang-alang ang patuloy na pamamahagi. Isa sa mga distribusyon na ito, na may pangunahing papel sa mga istatistika ng matematika, ay normal, o Gaussian, distribusyon.

Ito ay dahil sa maraming dahilan.

1. Una sa lahat, maraming mga eksperimentong obserbasyon ang maaaring matagumpay na mailarawan gamit ang normal na distribusyon. Dapat pansinin kaagad na walang mga distribusyon ng empirical data na magiging eksaktong normal, dahil ang isang normal na ipinamamahagi random na halaga ay nasa hanay mula hanggang , na hindi kailanman nangyayari sa pagsasanay. Gayunpaman, ang normal na pamamahagi ay madalas na gumagana nang maayos bilang isang pagtatantya.

Kung ang mga sukat ng timbang, taas at iba pang mga physiological parameter ng katawan ng tao ay isinasagawa - kahit saan ang mga resulta ay naiimpluwensyahan ng isang napakalaking bilang ng mga random na kadahilanan ( natural na dahilan at mga error sa pagsukat). Bukod dito, bilang isang patakaran, ang epekto ng bawat isa sa mga salik na ito ay hindi gaanong mahalaga. Ipinapakita ng karanasan na ang mga resulta sa mga ganitong kaso ay halos normal na maipamahagi.

2. Nagiging normal ang maraming distribusyon na nauugnay sa random sampling habang tumataas ang volume ng huli.

3. Ang normal na distribusyon ay angkop na angkop bilang pagtatantya ng iba pang tuluy-tuloy na distribusyon (halimbawa, skewed).

4. Ang normal na distribusyon ay may bilang na paborable mga katangian ng matematika, na higit na nagbigay nito malawak na aplikasyon sa mga istatistika.

Kasabay nito, dapat tandaan na sa medikal na data mayroong maraming mga eksperimentong pamamahagi na hindi maaaring inilarawan ng isang normal na modelo ng pamamahagi. Para sa layuning ito, bumuo ang mga istatistika ng mga pamamaraan na karaniwang tinatawag na "Nonparametric".

Ang pagpili ng isang istatistikal na paraan na angkop para sa pagproseso ng data mula sa isang partikular na eksperimento ay dapat gawin depende sa kung ang nakuhang data ay kabilang sa normal na batas sa pamamahagi. Ang pagsubok sa hypothesis para sa subordination ng isang sign sa normal na batas sa pamamahagi ay isinasagawa gamit ang isang frequency distribution histogram (graph), pati na rin ang isang bilang ng mga istatistikal na pamantayan. Sa kanila:

Asymmetry criterion ( b );

Pamantayan para sa pagsusuri para sa kurtosis ( g );

Pagsusulit sa Shapiro-Wilks ( W ) .

Ang isang pagsusuri sa likas na katangian ng pamamahagi ng data (tinatawag ding pagsubok para sa normalidad ng distribusyon) ay isinasagawa para sa bawat parameter. Upang kumpiyansa na hatulan kung ang pamamahagi ng isang parameter ay tumutugma sa normal na batas, isang sapat na malaking bilang ng mga yunit ng pagmamasid (hindi bababa sa 30 mga halaga) ay kinakailangan.

Para sa isang normal na distribusyon, ang skewness at kurtosis na pamantayan ay kumukuha ng halaga na 0. Kung ang distribusyon ay inilipat sa kanan b > 0 (positibong kawalaan ng simetrya), na may b < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона g =0. Sa g > 0 ang distribution curve ay mas matalas kung g < 0 пик более сглаженный, чем функция нормального распределения.

Upang suriin ang normalidad gamit ang Shapiro–Wilks test, kailangan mong hanapin ang halaga ng pamantayang ito gamit ang mga istatistikal na talahanayan sa kinakailangang antas kahalagahan at depende sa bilang ng mga yunit ng pagmamasid (degrees of freedom). Appendix 1. Ang normality hypothesis ay tinatanggihan sa maliliit na halaga ng pamantayang ito, bilang panuntunan, sa w <0,8.

Ang paraan ng pagpapangkat ay nagpapahintulot din sa iyo na sukatin pagkakaiba-iba(variability, fluctuation) ng mga palatandaan. Kapag ang bilang ng mga yunit sa isang populasyon ay medyo maliit, ang pagkakaiba-iba ay sinusukat batay sa ranggo na bilang ng mga yunit na bumubuo sa populasyon. Ang serye ay tinatawag niraranggo, kung ang mga yunit ay nakaayos sa pataas (pababang) pagkakasunud-sunod ng katangian.

Gayunpaman, ang ranggo na serye ay lubos na nagpapahiwatig kapag ang isang paghahambing na katangian ng pagkakaiba-iba ay kinakailangan. Bilang karagdagan, sa maraming mga kaso kailangan nating harapin ang mga istatistikal na populasyon na binubuo ng isang malaking bilang ng mga yunit, na halos mahirap katawanin sa anyo ng isang partikular na serye. Kaugnay nito, para sa isang paunang pangkalahatang kakilala sa istatistikal na data at lalo na upang mapadali ang pag-aaral ng pagkakaiba-iba sa mga katangian, ang mga phenomena at proseso sa ilalim ng pag-aaral ay karaniwang pinagsama sa mga grupo, at ang mga resulta ng pagpapangkat ay ipinakita sa anyo ng mga talahanayan ng pangkat.

Kung ang talahanayan ng pangkat ay may dalawang hanay lamang - mga pangkat ayon sa isang napiling katangian (mga opsyon) at ang bilang ng mga pangkat (dalas o dalas), ito ay tinatawag malapit sa pamamahagi.

Saklaw ng pamamahagi - ang pinakasimpleng uri ng structural grouping batay sa isang katangian, na ipinapakita sa isang group table na may dalawang column na naglalaman ng mga variant at frequency ng katangian. Sa maraming mga kaso, na may tulad na isang structural grouping, i.e. Sa pagsasama-sama ng serye ng pamamahagi, magsisimula ang pag-aaral ng paunang istatistikal na materyal.

Ang isang istrukturang pagpapangkat sa anyo ng isang serye ng pamamahagi ay maaaring gawing isang tunay na istrukturang pagpapangkat kung ang mga napiling grupo ay nailalarawan hindi lamang sa pamamagitan ng mga frequency, kundi pati na rin ng iba pang mga istatistikal na tagapagpahiwatig. Ang pangunahing layunin ng serye ng pamamahagi ay pag-aralan ang pagkakaiba-iba ng mga katangian. Ang teorya ng serye ng pamamahagi ay binuo nang detalyado sa pamamagitan ng mga istatistika ng matematika.

Ang serye ng pamamahagi ay nahahati sa katangian(pagpapangkat ayon sa mga katangiang katangian, halimbawa, paghahati sa populasyon ayon sa kasarian, nasyonalidad, katayuan sa pag-aasawa, atbp.) at pagkakaiba-iba(pagpapangkat ayon sa dami ng mga katangian).

Serye ng pagkakaiba-iba ay isang talahanayan ng pangkat na naglalaman ng dalawang hanay: pagpapangkat ng mga yunit ayon sa isang quantitative na katangian at ang bilang ng mga yunit sa bawat pangkat. Ang mga agwat sa serye ng pagkakaiba-iba ay karaniwang nabuo nang pantay at sarado. Ang serye ng variation ay ang sumusunod na pagpapangkat ng populasyon ng Russia sa pamamagitan ng average na per capita monetary income (Talahanayan 3.10).

Talahanayan 3.10

Pamamahagi ng populasyon ng Russia sa pamamagitan ng average na per capita na kita noong 2004-2009.

Mga pangkat ng populasyon ayon sa average na per capita cash income, rub./month

Populasyon sa pangkat, % ng kabuuan

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Mahigit 25,000.0

Buong populasyon

Ang mga serye ng pagkakaiba-iba, sa turn, ay nahahati sa discrete at interval. discrete pinagsasama-sama ng serye ng variation ang mga variant ng mga discrete na katangian na nag-iiba sa loob ng makitid na limitasyon. Ang isang halimbawa ng isang discrete variation series ay ang pamamahagi ng mga pamilyang Ruso ayon sa bilang ng mga anak na mayroon sila.

Pagitan pinagsasama-sama ng serye ng variation ang mga variant ng alinman sa tuluy-tuloy na katangian o discrete na katangian na nag-iiba-iba sa malawak na hanay. Ang pagitan ay ang pagkakaiba-iba ng serye ng pamamahagi ng populasyon ng Russia sa pamamagitan ng average na per capita na kita ng pera.

Ang discrete variation series ay hindi masyadong madalas na ginagamit sa pagsasanay. Samantala, ang pag-compile ng mga ito ay hindi mahirap, dahil ang komposisyon ng mga grupo ay tinutukoy ng mga partikular na variant na talagang mayroon ang pinag-aralan na mga katangian ng pagpapangkat.

Ang mga serye ng pagkakaiba-iba ng pagitan ay mas malawak. Kapag pinagsama-sama ang mga ito, isang mahirap na tanong ang lumitaw tungkol sa bilang ng mga grupo, pati na rin ang laki ng mga agwat na dapat itatag.

Ang mga prinsipyo para sa paglutas ng isyung ito ay itinakda sa kabanata sa pamamaraan para sa pagbuo ng mga istatistikal na pagpapangkat (tingnan ang talata 3.3).

Ang mga serye ng pagkakaiba-iba ay isang paraan ng pagbagsak o pag-compress ng magkakaibang impormasyon sa isang compact na anyo; mula sa kanila ang isa ay maaaring gumawa ng isang medyo malinaw na paghatol tungkol sa likas na katangian ng pagkakaiba-iba, at pag-aralan ang mga pagkakaiba sa mga katangian ng mga phenomena na kasama sa set na pinag-aaralan. Ngunit ang pinakamahalagang kahalagahan ng serye ng variation ay na sa kanilang batayan ang mga espesyal na pangkalahatang katangian ng variation ay kinakalkula (tingnan ang Kabanata 7).



Bago sa site

>

Pinaka sikat