Bahay Pinahiran ng dila Ang serye ng variation ay binubuo ng: Kahulugan ng serye ng variation

Ang serye ng variation ay binubuo ng: Kahulugan ng serye ng variation

Bilang resulta ng pagkabisado ng kabanatang ito, ang mag-aaral ay dapat: alam

  • mga tagapagpahiwatig ng pagkakaiba-iba at ang kanilang relasyon;
  • mga pangunahing batas ng pamamahagi ng mga katangian;
  • ang kakanyahan ng pamantayan ng pahintulot; magagawang
  • kalkulahin ang mga indeks ng variation at goodness-of-fit na pamantayan;
  • matukoy ang mga katangian ng pamamahagi;
  • suriin ang mga pangunahing katangian ng numero ng serye ng pamamahagi ng istatistika;

sariling

  • mga pamamaraan ng istatistikal na pagsusuri ng serye ng pamamahagi;
  • mga pangunahing kaalaman pagsusuri ng pagkakaiba-iba;
  • mga diskarte para sa pagsuri sa mga serye ng pamamahagi ng istatistika para sa pagsunod sa mga pangunahing batas ng pamamahagi.

Mga tagapagpahiwatig ng pagkakaiba-iba

Sa istatistikal na pananaliksik katangian ng iba't ibang statistical aggregates, ang pag-aaral ng pagkakaiba-iba sa mga katangian ng indibidwal mga yunit ng istatistika populasyon, gayundin ang katangian ng distribusyon ng mga yunit sa kabuuan katangiang ito. pagkakaiba-iba - ito ay mga pagkakaiba sa mga indibidwal na halaga ng isang katangian sa mga yunit ng populasyon na pinag-aaralan. Ang pag-aaral ng pagkakaiba-iba ay may malaking praktikal na kahalagahan. Sa antas ng pagkakaiba-iba, maaaring hatulan ng isa ang mga limitasyon ng pagkakaiba-iba ng isang katangian, ang homogeneity ng populasyon para sa isang partikular na katangian, ang tipikal ng average, at ang relasyon ng mga salik na tumutukoy sa pagkakaiba-iba. Ang mga tagapagpahiwatig ng pagkakaiba-iba ay ginagamit upang makilala at ayusin ang mga istatistikal na populasyon.

Ang mga resulta ng buod at pagpapangkat ng mga materyales sa pagmamasid sa istatistika, na ipinakita sa anyo ng serye ng pamamahagi ng istatistika, ay kumakatawan sa isang nakaayos na pamamahagi ng mga yunit ng populasyon na pinag-aaralan sa mga pangkat ayon sa pamantayan ng pagpapangkat (iba-iba). Kung ang isang kalidad na katangian ay kinuha bilang batayan para sa pagpapangkat, kung gayon ang naturang serye ng pamamahagi ay tinatawag katangian(pamamahagi ayon sa propesyon, kasarian, kulay, atbp.). Kung ang isang serye ng pamamahagi ay itinayo sa isang dami na batayan, kung gayon ang naturang serye ay tinatawag pagkakaiba-iba(pamamahagi ayon sa taas, timbang, suweldo, atbp.). Upang makabuo ng isang serye ng pagkakaiba-iba ay nangangahulugang ayusin ang dami ng pamamahagi ng mga yunit ng populasyon sa pamamagitan ng mga katangiang halaga, bilangin ang bilang ng mga yunit ng populasyon na may mga halagang ito (dalas), at ayusin ang mga resulta sa isang talahanayan.

Sa halip na dalas ng isang variant, posibleng gamitin ang ratio nito sa kabuuang dami ng mga obserbasyon, na tinatawag na frequency (relative frequency).

Mayroong dalawang uri serye ng pagkakaiba-iba: discrete at interval. Discrete na serye- Ito ay isang serye ng pagkakaiba-iba, ang pagtatayo nito ay batay sa mga katangian na may mga hindi tuloy-tuloy na pagbabago (mga discrete na katangian). Kasama sa huli ang bilang ng mga empleyado sa negosyo, kategorya ng taripa, bilang ng mga bata sa pamilya, atbp. Ang isang discrete variation series ay kumakatawan sa isang table na binubuo ng dalawang column. Ang unang column ay nagpapahiwatig ng partikular na halaga ng attribute, at ang pangalawang column ay nagpapahiwatig ng bilang ng mga unit sa populasyon na may partikular na halaga ng attribute. Kung ang isang katangian ay may tuluy-tuloy na pagbabago (halaga ng kita, haba ng serbisyo, halaga ng mga nakapirming assets ng negosyo, atbp., na sa loob ng ilang mga limitasyon ay maaaring tumagal sa anumang mga halaga), kung gayon para sa katangiang ito posible na bumuo serye ng pagkakaiba-iba ng pagitan. Kapag gumagawa ng serye ng pagkakaiba-iba ng pagitan, ang talahanayan ay mayroon ding dalawang column. Ang una ay nagpapahiwatig ng halaga ng katangian sa pagitan ng "mula - hanggang" (mga opsyon), ang pangalawa ay nagpapahiwatig ng bilang ng mga yunit na kasama sa pagitan (dalas). Dalas (dalas ng pag-uulit) - ang bilang ng mga pag-uulit ng isang partikular na variant ng mga halaga ng katangian. Ang mga pagitan ay maaaring sarado o bukas. Ang mga saradong agwat ay limitado sa magkabilang panig, i.e. may parehong mas mababang ("mula") at isang itaas na hangganan ("sa"). Ang mga bukas na pagitan ay may isang hangganan: alinman sa itaas o ibaba. Kung ang mga pagpipilian ay nakaayos sa pataas o pababang pagkakasunud-sunod, kung gayon ang mga hilera ay tinatawag niraranggo.

Para sa serye ng variation, mayroong dalawang uri ng mga opsyon sa pagtugon sa dalas: naipon na dalas at naipon na dalas. Ang naipon na dalas ay nagpapakita kung gaano karaming mga obserbasyon ang halaga ng katangian na kinuha ang mga halaga na mas mababa sa isang naibigay na isa. Ang naipon na dalas ay natutukoy sa pamamagitan ng pagbubuod ng mga halaga ng dalas ng isang katangian para sa isang naibigay na grupo sa lahat ng mga frequency ng mga nakaraang grupo. Ang naipon na dalas ay nagpapakilala tiyak na gravity mga yunit ng pagmamasid kung saan ang mga halaga ng katangian ay hindi lalampas sa itaas na limitasyon ng pangkat ng data. Kaya, ang naipon na dalas ay nagpapakita ng proporsyon ng mga opsyon sa kabuuan na may halagang hindi hihigit sa ibinigay. Ang dalas, dalas, ganap at kamag-anak na densidad, naipon na dalas at dalas ay mga katangian ng magnitude ng variant.

Ang mga pagkakaiba-iba sa mga katangian ng mga yunit ng istatistika ng populasyon, pati na rin ang likas na katangian ng pamamahagi, ay pinag-aralan gamit ang mga tagapagpahiwatig at katangian ng serye ng pagkakaiba-iba, na kinabibilangan ng average na antas ng serye, ang average na linear deviation, ang standard deviation, dispersion , coefficients ng oscillation, variation, asymmetry, kurtosis, atbp.

Ang mga average na halaga ay ginagamit upang makilala ang sentro ng pamamahagi. Ang average ay isang pangkalahatang istatistikal na katangian kung saan ang tipikal na antas ng isang katangian na taglay ng mga miyembro ng populasyon na pinag-aaralan ay binibilang. Gayunpaman, maaaring may mga kaso ng coincidence ng mga arithmetic na paraan na may iba't ibang mga pattern ng pamamahagi, samakatuwid, bilang mga istatistikal na katangian ng serye ng pagkakaiba-iba, ang tinatawag na structural na paraan ay kinakalkula - mode, median, pati na rin ang mga quantiles, na naghahati sa serye ng pamamahagi sa pantay. mga bahagi (quartile, deciles, percentiles, atbp. ).

Fashion - Ito ang halaga ng isang katangian na nangyayari sa serye ng pamamahagi nang mas madalas kaysa sa iba pang mga halaga nito. Para sa discrete series, ito ang opsyon na may pinakamataas na frequency. Sa serye ng pagkakaiba-iba ng pagitan, upang matukoy ang mode, kailangan munang matukoy ang pagitan kung saan ito matatagpuan, ang tinatawag na modal interval. Sa variation series na may sa pantay na pagitan ang modal interval ay tinutukoy ng pinakamataas na dalas, sa serye na may hindi pantay na pagitan - ngunit ang pinakamataas na density ng pamamahagi. Ang formula ay pagkatapos ay ginagamit upang matukoy ang mode sa mga hilera sa pantay na pagitan

kung saan ang Mo ay ang halaga ng fashion; xMo - mas mababang limitasyon ng modal interval; h- lapad ng agwat ng modal; / Mo - dalas ng modal interval; / Mo j ay ang dalas ng premodal interval; Ang / Mo+1 ay ang dalas ng pagitan ng post-modal, at para sa isang serye na may hindi pantay na pagitan sa formula ng pagkalkula na ito, sa halip na mga frequency / Mo, / Mo, / Mo, dapat gamitin ang mga density ng pamamahagi. Isip 0 _| , Isip 0> UMO+"

Kung mayroong isang solong mode, ang probability distribution ng random variable ay tinatawag na unimodal; kung mayroong higit sa isang mode, ito ay tinatawag na multimodal (polymodal, multimodal), sa kaso ng dalawang mga mode - bimodal. Bilang isang tuntunin, ang multimodality ay nagpapahiwatig na ang pamamahagi sa ilalim ng pag-aaral ay hindi sumusunod sa batas normal na pamamahagi. Ang mga homogenous na populasyon, bilang panuntunan, ay nailalarawan sa pamamagitan ng mga pamamahagi ng single-vertex. Ipinapahiwatig din ng Multivertex ang heterogeneity ng populasyon na pinag-aaralan. Ang hitsura ng dalawa o higit pang mga vertices ay ginagawang kinakailangan upang muling pagpangkatin ang data upang matukoy ang mas magkakatulad na mga grupo.

Sa isang serye ng pagkakaiba-iba ng pagitan, ang mode ay maaaring matukoy nang grapiko gamit ang isang histogram. Upang gawin ito, gumuhit ng dalawang intersecting na linya mula sa mga tuktok na punto ng pinakamataas na column ng histogram hanggang sa mga tuktok na punto ng dalawang magkatabing column. Pagkatapos, mula sa punto ng kanilang intersection, ang isang patayo ay ibinababa sa abscissa axis. Ang halaga ng feature sa x-axis na naaayon sa perpendicular ay ang mode. Sa maraming mga kaso, kapag tinutukoy ang isang populasyon bilang isang pangkalahatang tagapagpahiwatig, ang kagustuhan ay ibinibigay sa mode kaysa sa arithmetic mean.

Median - Ito sentral na kahalagahan katangian, ito ay taglay ng sentral na miyembro ng ranggo na serye ng pamamahagi. Sa discrete series, upang mahanap ang halaga ng median, tukuyin muna ito serial number. Upang gawin ito, kung ang bilang ng mga yunit ay kakaiba, ang isa ay idinagdag sa kabuuan ng lahat ng mga frequency, at ang bilang ay hinati sa dalawa. Kung mayroong isang pantay na bilang ng mga yunit sa isang hilera, magkakaroon ng dalawang median na yunit, kaya sa kasong ito ang median ay tinukoy bilang ang average ng mga halaga ng dalawang median na yunit. Kaya, ang median sa isang discrete variation series ay ang value na naghahati sa serye sa dalawang bahagi na naglalaman ng parehong bilang ng mga opsyon.

Sa serye ng pagitan, pagkatapos matukoy ang serial number ng median, ang medial interval ay matatagpuan gamit ang mga naipon na frequency (frequencies), at pagkatapos ay gamit ang formula para sa pagkalkula ng median, ang halaga ng median mismo ay tinutukoy:

kung saan Ako ang median na halaga; x Ako - mas mababang limitasyon ng median interval; h- lapad ng median interval; - ang kabuuan ng mga frequency ng serye ng pamamahagi; /D - naipon na dalas ng pre-median interval; / Me - dalas ng median interval.

Ang median ay makikita sa graphic na paraan gamit ang isang cumulate. Upang gawin ito, sa sukat ng mga naipon na frequency (frequencies) ng pinagsama-samang, mula sa punto na tumutugma sa ordinal na numero ng median, isang tuwid na linya ay iguguhit parallel sa abscissa axis hanggang sa ito ay intersects sa cumulate. Susunod, mula sa punto ng intersection ng ipinahiwatig na linya na may pinagsama-samang, isang patayo ay ibinaba sa abscissa axis. Ang halaga ng katangian sa x-axis na tumutugma sa iginuhit na ordinate (perpendicular) ay ang median.

Ang median ay nailalarawan sa pamamagitan ng mga sumusunod na katangian.

  • 1. Hindi ito nakadepende sa mga attribute value na nasa magkabilang gilid nito.
  • 2. Ito ay may pag-aari ng minimality, na nangangahulugan na ang kabuuan ng ganap na mga paglihis ng mga halaga ng katangian mula sa median ay kumakatawan sa isang minimum na halaga kumpara sa paglihis ng mga halaga ng katangian mula sa anumang iba pang halaga.
  • 3. Kapag pinagsasama ang dalawang distribusyon sa mga kilalang median, imposibleng mahulaan nang maaga ang halaga ng median ng bagong distribusyon.

Ang mga katangian ng median ay malawakang ginagamit sa pagdidisenyo ng mga lokasyon ng punto. nakapila- mga paaralan, klinika, gasolinahan, water point, atbp. Halimbawa, kung ito ay binalak na magtayo ng isang klinika sa isang partikular na bloke ng lungsod, kung gayon ito ay mas kapaki-pakinabang na hanapin ito sa isang punto sa bloke na hindi hinahati ang haba ng bloke, ngunit ang bilang ng mga residente.

Ang ratio ng mode, median at arithmetic mean ay nagpapahiwatig ng likas na katangian ng pamamahagi ng katangian sa pinagsama-samang at nagbibigay-daan sa amin upang masuri ang simetrya ng pamamahagi. Kung x Ako pagkatapos ay mayroong isang kanang panig na kawalaan ng simetrya ng serye. Sa normal na pamamahagi X - Ako - Mo.

K. Pearson based alignment iba't ibang uri natukoy ng mga curve na para sa moderately asymmetric distributions ang mga sumusunod na tinatayang relasyon sa pagitan ng arithmetic mean, median at mode ay wasto:

kung saan Ako ang median na halaga; Mo - kahulugan ng fashion; x arithm - ang halaga ng arithmetic mean.

Kung may pangangailangan na pag-aralan ang istraktura ng serye ng pagkakaiba-iba nang mas detalyado, pagkatapos ay kalkulahin ang mga katangiang halaga na katulad ng median. Ang ganitong mga katangiang halaga ay naghahati sa lahat ng mga yunit ng pamamahagi sa pantay na mga numero; sila ay tinatawag na quantiles o gradients. Ang mga quantile ay nahahati sa mga quartile, deciles, percentiles, atbp.

Hinahati ng mga kwartil ang populasyon sa apat na pantay na bahagi. Ang unang quartile ay kinakalkula nang katulad sa median gamit ang formula para sa pagkalkula ng unang quartile, na dati nang natukoy ang unang quarterly interval:

kung saan ang Qi ay ang halaga ng unang quartile; xQ^- mas mababang limitasyon ng unang quartile range; h- lapad ng pagitan ng unang quarter; /, - mga frequency ng serye ng pagitan;

Pinagsama-samang dalas sa pagitan bago ang unang quartile interval; Jq ( - dalas ng unang quartile interval.

Ang unang quartile ay nagpapakita na 25% ng mga yunit ng populasyon ay mas mababa kaysa sa halaga nito, at 75% ay higit pa. Ang pangalawang quartile ay katumbas ng median, i.e. Q 2 = Ako.

Sa pamamagitan ng pagkakatulad, ang ikatlong quartile ay kinakalkula, na unang natagpuan ang ikatlong quarterly interval:

kung saan ang mas mababang limitasyon ng ikatlong hanay ng kuwarts; h- lapad ng ikatlong quartile interval; /, - mga frequency ng serye ng pagitan; /X" - naipon na dalas sa pagitan ng nauna

G

ikatlong quartile interval; Ang Jq ay ang dalas ng ikatlong quartile interval.

Ang ikatlong quartile ay nagpapakita na 75% ng mga yunit ng populasyon ay mas mababa kaysa sa halaga nito, at 25% ay higit pa.

Ang pagkakaiba sa pagitan ng ikatlo at unang quartile ay ang interquartile range:

kung saan ang Aq ay ang halaga ng interquartile range; Q 3 - ikatlong quartile na halaga; Q, ay ang halaga ng unang quartile.

Hinahati ng mga desiles ang populasyon sa 10 pantay na bahagi. Ang decile ay isang halaga ng isang katangian sa isang serye ng pamamahagi na tumutugma sa ikasampu ng laki ng populasyon. Sa pamamagitan ng pagkakatulad sa mga quartile, ang unang decile ay nagpapakita na 10% ng mga yunit ng populasyon ay mas mababa kaysa sa halaga nito, at 90% ay mas malaki, at ang ikasiyam na decile ay nagpapakita na 90% ng mga yunit ng populasyon ay mas mababa kaysa sa halaga nito, at 10% ay mas malaki. Ang ratio ng ikasiyam at unang deciles, i.e. Ang decile coefficient ay malawakang ginagamit sa pag-aaral ng pagkakaiba-iba ng kita upang sukatin ang ratio ng mga antas ng kita ng 10% na pinaka-mayaman at 10% ng hindi gaanong mayaman na populasyon. Hinahati ng mga porsyento ang ranggo na populasyon sa 100 pantay na bahagi. Ang pagkalkula, kahulugan, at paggamit ng mga percentile ay katulad ng mga decile.

Quartiles, deciles at iba pa mga katangian ng istruktura maaaring matukoy nang grapiko sa pamamagitan ng pagkakatulad sa median gamit ang mga cumulates.

Upang sukatin ang laki ng pagkakaiba-iba, ang mga sumusunod na tagapagpahiwatig ay ginagamit: hanay ng pagkakaiba-iba, average na linear deviation, standard deviation, dispersion. Ang magnitude ng hanay ng variation ay ganap na nakasalalay sa randomness ng pamamahagi ng mga matinding miyembro ng serye. Ang tagapagpahiwatig na ito ay interesado sa mga kaso kung saan mahalagang malaman kung ano ang amplitude ng mga pagbabago sa mga halaga ng isang katangian:

saan R- ang halaga ng hanay ng pagkakaiba-iba; x max - pinakamataas na halaga ng katangian; x tt - pinakamababang halaga ng katangian.

Kapag kinakalkula ang hanay ng variation, ang halaga ng karamihan ng mga miyembro ng serye ay hindi isinasaalang-alang, habang ang variation ay nauugnay sa bawat halaga ng miyembro ng serye. Ang mga tagapagpahiwatig na mga average na nakuha mula sa mga paglihis ng mga indibidwal na halaga ng isang katangian mula sa kanilang average na halaga ay walang ganitong disbentaha: ang average na linear deviation at ang standard deviation. Mayroong direktang kaugnayan sa pagitan ng mga indibidwal na paglihis mula sa karaniwan at ang pagkakaiba-iba ng isang partikular na katangian. Kung mas malakas ang pagbabagu-bago, mas marami ganap na sukat mga paglihis mula sa karaniwan.

Ang average na linear deviation ay ang arithmetic mean ng ganap na mga halaga mga paglihis ng mga indibidwal na opsyon mula sa kanilang average na halaga.

Average na Linear Deviation para sa Ungrouped Data

kung saan ang /pr ay ang halaga ng average na linear deviation; x, - ay ang halaga ng katangian; X - P - bilang ng mga yunit sa populasyon.

Average na linear deviation ng pinagsama-samang serye

kung saan / vz - ang halaga ng average na linear deviation; x, ay ang halaga ng katangian; X - ang average na halaga ng katangian para sa populasyon na pinag-aaralan; / - ang bilang ng mga yunit ng populasyon sa isang hiwalay na pangkat.

Mga palatandaan ng mga paglihis sa sa kasong ito ay binabalewala, kung hindi, ang kabuuan ng lahat ng mga paglihis ay magiging katumbas ng zero. Ang average na linear deviation, depende sa pagpapangkat ng nasuri na data, ay kinakalkula gamit ang iba't ibang mga formula: para sa nakapangkat at hindi nakapangkat na data. Ang average na linear deviation, dahil sa kondisyon nito, na hiwalay sa iba pang mga indicator ng pagkakaiba-iba, ay ginagamit sa pagsasanay na medyo bihira (sa partikular, upang makilala ang katuparan ng mga obligasyong kontraktwal para sa pagkakapareho ng paghahatid; sa pagsusuri ng turnover banyagang kalakalan, komposisyon ng mga manggagawa, ritmo ng produksyon, kalidad ng mga produkto, isinasaalang-alang teknolohikal na katangian produksyon, atbp.).

Ang karaniwang paglihis ay nagpapakilala kung gaano sa average ang mga indibidwal na halaga ng katangian na pinag-aaralan ay lumihis mula sa average na halaga ng populasyon, at ipinahayag sa mga yunit ng pagsukat ng katangian na pinag-aaralan. Ang karaniwang paglihis, bilang isa sa mga pangunahing sukatan ng pagkakaiba-iba, ay malawakang ginagamit sa pagtatasa ng mga limitasyon ng pagkakaiba-iba ng isang katangian sa isang homogenous na populasyon, sa pagtukoy ng mga ordinate na halaga ng isang normal na curve ng pamamahagi, pati na rin sa mga kalkulasyon na nauugnay sa ang organisasyon ng sample na pagmamasid at pagtatatag ng katumpakan ng mga katangian ng sample. Ang standard deviation ng ungrouped data ay kinakalkula gamit ang sumusunod na algorithm: ang bawat deviation mula sa mean ay squared, lahat ng squares ay summed, pagkatapos kung saan ang kabuuan ng mga parisukat ay hinati sa bilang ng mga termino ng serye at ang square root ay nakuha mula sa quotient:

kung saan ang isang Iip ay ang halaga ng karaniwang paglihis; Xj- halaga ng katangian; X- ang average na halaga ng katangian para sa populasyon na pinag-aaralan; P - bilang ng mga yunit sa populasyon.

Para sa pinagsama-samang nasuri na data, ang standard deviation ng data ay kinakalkula gamit ang weighted formula

saan - karaniwang halaga ng paglihis; Xj- halaga ng katangian; X - ang average na halaga ng katangian para sa populasyon na pinag-aaralan; f x - ang bilang ng mga yunit ng populasyon sa isang partikular na pangkat.

Ang expression sa ilalim ng ugat sa parehong mga kaso ay tinatawag na pagkakaiba-iba. Kaya, ang pagpapakalat ay kinakalkula bilang ang average na parisukat ng mga paglihis ng mga halaga ng katangian mula sa kanilang average na halaga. Para sa hindi timbang (simple) na mga halaga ng katangian, ang pagkakaiba ay tinutukoy bilang mga sumusunod:

Para sa mga may timbang na mga halaga ng katangian

Mayroon ding isang espesyal na pinasimple na paraan para sa pagkalkula ng pagkakaiba-iba: sa pangkalahatan

para sa hindi timbang (simple) na mga halaga ng katangian para sa timbang na mga halaga ng katangian
gamit ang zero-based na pamamaraan

kung saan ang isang 2 ay ang halaga ng pagpapakalat; x, - ay ang halaga ng katangian; X - average na halaga ng katangian, h- halaga ng pagitan ng pangkat, t 1 - timbang (A =

Ang dispersion ay may independiyenteng pagpapahayag sa mga istatistika at tumutukoy sa numero ang pinakamahalagang tagapagpahiwatig mga pagkakaiba-iba. Ito ay sinusukat sa mga yunit na tumutugma sa parisukat ng mga yunit ng pagsukat ng katangiang pinag-aaralan.

Ang dispersion ay may mga sumusunod na katangian.

  • 1. Ang pagkakaiba ng isang pare-parehong halaga ay zero.
  • 2. Ang pagbabawas ng lahat ng mga halaga ng isang katangian ng parehong halaga A ay hindi nagbabago sa halaga ng pagpapakalat. Nangangahulugan ito na ang average na parisukat ng mga deviations ay maaaring kalkulahin hindi mula sa ibinigay na mga halaga ng isang katangian, ngunit mula sa kanilang mga deviations mula sa ilang pare-parehong numero.
  • 3. Pagbabawas ng anumang mga katangiang halaga sa k beses binabawasan ang pagpapakalat sa pamamagitan ng k 2 beses, at ang standard deviation ay nasa k beses, i.e. ang lahat ng mga halaga ng katangian ay maaaring hatiin ng ilang pare-parehong numero (sabihin, ayon sa halaga ng agwat ng serye), ang karaniwang paglihis ay maaaring kalkulahin, at pagkatapos ay i-multiply sa isang pare-parehong numero.
  • 4. Kung kalkulahin natin ang average na parisukat ng mga deviations mula sa anumang halaga At na naiiba sa isang degree o iba pa mula sa arithmetic mean, kung gayon ito ay palaging mas malaki kaysa sa average na parisukat ng mga deviations na kinakalkula mula sa arithmetic mean. Ang average na parisukat ng mga deviations ay magiging mas malaki sa pamamagitan ng isang napaka-tiyak na halaga - sa pamamagitan ng parisukat ng pagkakaiba sa pagitan ng average at ito conventionally kinuha halaga.

Ang pagkakaiba-iba ng isang alternatibong katangian ay binubuo sa pagkakaroon o kawalan ng pinag-aralan na ari-arian sa mga yunit ng populasyon. Sa dami, ang pagkakaiba-iba ng isang alternatibong katangian ay ipinahayag ng dalawang halaga: ang pagkakaroon ng isang yunit ng pinag-aralan na ari-arian ay tinutukoy ng isa (1), at ang kawalan nito ay tinutukoy ng zero (0). Ang proporsyon ng mga yunit na may ari-arian na pinag-aaralan ay tinutukoy ng P, at ang proporsyon ng mga yunit na walang ari-arian na ito ay tinutukoy ng G. Kaya, ang pagkakaiba ng isang alternatibong katangian ay katumbas ng produkto ng proporsyon ng mga yunit na nagtataglay ng ari-arian na ito (P) sa pamamagitan ng proporsyon ng mga yunit na hindi nagtataglay ng ari-arian na ito. (G). Ang pinakamalaking pagkakaiba-iba sa populasyon ay nakakamit sa mga kaso kung saan ang bahagi ng populasyon, na bumubuo ng 50% ng kabuuang dami ng populasyon, ay may katangian, at ang isa pang bahagi ng populasyon, na katumbas din ng 50%, ay walang katangiang ito, at ang dispersion ay umabot sa pinakamataas na halaga na 0.25, t .e. P = 0.5, G= 1 - P = 1 - 0.5 = 0.5 at o 2 = 0.5 0.5 = 0.25. Ang mas mababang limitasyon ng tagapagpahiwatig na ito ay zero, na tumutugma sa isang sitwasyon kung saan walang pagkakaiba-iba sa pinagsama-samang. Ang praktikal na aplikasyon ng pagkakaiba-iba ng isang alternatibong katangian ay ang pagbuo mga pagitan ng kumpiyansa kapag nagsasagawa ng sample observation.

Paano mas kaunting halaga variance at standard deviation, mas homogenous ang populasyon at magiging mas tipikal ang average. Sa pagsasagawa ng mga istatistika, madalas na kailangang ihambing ang mga pagkakaiba-iba iba't ibang palatandaan. Halimbawa, kawili-wiling ihambing ang mga pagkakaiba-iba sa edad ng mga manggagawa at kanilang mga kwalipikasyon, haba ng serbisyo at sahod, gastos at tubo, haba ng serbisyo at produktibidad ng paggawa, atbp. Para sa gayong mga paghahambing, ang mga tagapagpahiwatig ng ganap na pagkakaiba-iba ng mga katangian ay hindi angkop: imposibleng ihambing ang pagkakaiba-iba ng karanasan sa trabaho, na ipinahayag sa mga taon, na may pagkakaiba-iba ng sahod, na ipinahayag sa rubles. Upang maisagawa ang mga naturang paghahambing, pati na rin ang mga paghahambing ng pagkakaiba-iba ng parehong katangian sa ilang mga populasyon na may iba't ibang mga average na arithmetic, ginagamit ang mga tagapagpahiwatig ng pagkakaiba-iba - ang koepisyent ng oscillation, linear coefficient mga pagkakaiba-iba at koepisyent ng pagkakaiba-iba, na nagpapakita ng lawak kung saan ang mga matinding halaga ay nagbabago sa average.

Oscillation coefficient:

saan V R - halaga ng oscillation coefficient; R- halaga ng hanay ng pagkakaiba-iba; X -

Linear coefficient ng variation".

saan Vj- ang halaga ng linear coefficient ng variation; ako - ang halaga ng average na linear deviation; X - ang average na halaga ng katangian para sa populasyon na pinag-aaralan.

Ang koepisyent ng pagkakaiba-iba:

saan V a - koepisyent ng halaga ng pagkakaiba-iba; a ay ang halaga ng karaniwang paglihis; X - ang average na halaga ng katangian para sa populasyon na pinag-aaralan.

Ang koepisyent ng oscillation ay ang ratio ng porsyento ng saklaw ng pagkakaiba-iba sa average na halaga ng katangiang pinag-aaralan, at ang linear na koepisyent ng pagkakaiba-iba ay ang ratio ng average na linear na paglihis sa average na halaga ng katangiang pinag-aaralan, na ipinahayag bilang isang porsyento. Ang coefficient of variation ay ang porsyento ng standard deviation sa average na halaga ng katangiang pinag-aaralan. Bilang isang kamag-anak na halaga, na ipinahayag bilang isang porsyento, ang koepisyent ng pagkakaiba-iba ay ginagamit upang ihambing ang antas ng pagkakaiba-iba ng iba't ibang mga katangian. Gamit ang koepisyent ng pagkakaiba-iba, ang homogeneity ng isang istatistikal na populasyon ay tinasa. Kung ang koepisyent ng variation ay mas mababa sa 33%, kung gayon ang populasyon na pinag-aaralan ay homogenous at mahina ang variation. Kung ang koepisyent ng variation ay higit sa 33%, ang populasyon na pinag-aaralan ay heterogenous, ang variation ay malakas, at ang average na halaga ay hindi tipikal at hindi maaaring gamitin bilang pangkalahatang indicator ng populasyon na ito. Bilang karagdagan, ang mga coefficient ng variation ay ginagamit upang ihambing ang pagkakaiba-iba ng isang katangian sa iba't ibang populasyon. Halimbawa, upang masuri ang pagkakaiba-iba sa haba ng serbisyo ng mga manggagawa sa dalawang negosyo. Kung mas mataas ang halaga ng koepisyent, mas makabuluhan ang pagkakaiba-iba ng katangian.

Batay sa kinakalkula na mga quartile, posible ring kalkulahin ang relatibong tagapagpahiwatig ng quarterly variation gamit ang formula

kung saan Q 2 At

Ang interquartile range ay tinutukoy ng formula

Ginagamit ang quartile deviation sa halip na ang range ng variation para maiwasan ang mga disadvantages na nauugnay sa paggamit ng extreme value:

Para sa serye ng pagkakaiba-iba ng hindi pantay na pagitan, kinakalkula din ang density ng pamamahagi. Ito ay tinukoy bilang ang quotient ng kaukulang dalas o dalas na hinati sa halaga ng pagitan. Sa hindi pantay na serye ng agwat, ginagamit ang ganap at kamag-anak na mga density ng pamamahagi. Ang absolute distribution density ay ang dalas sa bawat yunit ng haba ng agwat. Relatibong densidad ng pamamahagi - dalas bawat haba ng pagitan ng yunit.

Ang lahat ng nasa itaas ay totoo para sa serye ng pamamahagi na ang batas sa pamamahagi ay mahusay na inilarawan ng normal na batas sa pamamahagi o malapit dito.

Ang konsepto ng isang serye ng pagkakaiba-iba. Ang unang hakbang sa pag-systematize ng statistical observation materials ay ang bilangin ang bilang ng mga unit na may partikular na katangian. Sa pamamagitan ng pag-aayos ng mga unit sa pataas o pababang pagkakasunud-sunod ng kanilang quantitative na katangian at pagbibilang ng bilang ng mga yunit na may partikular na halaga ng katangian, nakakakuha tayo ng serye ng variation. Ang isang serye ng variation ay nagpapakilala sa pamamahagi ng mga yunit ng isang tiyak na istatistikal na populasyon ayon sa ilang quantitative na katangian.

Binubuo ang serye ng variation ng dalawang column, ang kaliwang column ay naglalaman ng mga value ng iba't ibang katangian, na tinatawag na variant at denoted (x), at ang kanang column ay naglalaman ng mga absolute number na nagpapakita kung ilang beses nangyayari ang bawat variant. Ang mga indicator sa column na ito ay tinatawag na frequency at itinalagang (f).

Ang serye ng pagkakaiba-iba ay maaaring ipakita sa eskematiko sa anyo ng Talahanayan 5.1:

Talahanayan 5.1

Uri ng serye ng variation

Mga Pagpipilian (x)

Mga frequency (f)

Sa kanang hanay, maaari ding gamitin ang mga kamag-anak na tagapagpahiwatig, na nagpapakilala sa bahagi ng dalas ng mga indibidwal na opsyon sa kabuuang kabuuan ng mga frequency. Ang mga kamag-anak na tagapagpahiwatig na ito ay tinatawag na mga frequency at conventionally na tinutukoy ng , i.e. . Ang kabuuan ng lahat ng mga frequency ay katumbas ng isa. Ang mga frequency ay maaari ding ipahayag bilang mga porsyento, at pagkatapos ang kanilang kabuuan ay magiging katumbas ng 100%.

Maaaring iba-iba ang mga palatandaan magkaibang karakter. Ang mga variant ng ilang mga katangian ay ipinahayag sa mga integer, halimbawa, ang bilang ng mga kuwarto sa isang apartment, ang bilang ng mga aklat na nai-publish, atbp. Ang mga palatandaang ito ay tinatawag na discontinuous o discrete. Ang mga variant ng iba pang mga katangian ay maaaring tumagal sa anumang mga halaga sa loob ng ilang mga limitasyon, tulad ng, halimbawa, ang pagpapatupad ng mga nakaplanong gawain, sahod atbp. Ang mga palatandaang ito ay tinatawag na tuloy-tuloy.

Discrete variation series. Kung ang mga variant ng serye ng variation ay ipinahayag sa anyo mga discrete na dami, kung gayon ang naturang serye ng variation ay tinatawag na discrete, ito hitsura ipinakita sa talahanayan. 5.2:

Talahanayan 5.2

Pamamahagi ng mga mag-aaral ayon sa mga marka ng pagsusulit

Mga rating (x)

Bilang ng mga mag-aaral (f)

Sa % ng kabuuang ()

Ang likas na katangian ng pamamahagi sa discrete series ay inilalarawan nang grapiko sa anyo ng isang polygon ng pamamahagi, Fig. 5.1.

kanin. 5.1. Pamamahagi ng mga mag-aaral ayon sa mga markang nakuha sa pagsusulit.

Serye ng pagkakaiba-iba ng pagitan. Para sa tuluy-tuloy na mga katangian, ang mga serye ng pagkakaiba-iba ay itinayo bilang mga pagitan, i.e. ang mga halaga ng katangian sa kanila ay ipinahayag sa anyo ng mga pagitan "mula at hanggang". Sa kasong ito, ang pinakamababang halaga ng katangian sa naturang pagitan ay tinatawag na mas mababang limitasyon ng pagitan, at ang pinakamataas ay tinatawag na itaas na limitasyon pagitan.

Ang mga serye ng pagkakaiba-iba ng pagitan ay binuo kapwa para sa mga hindi tuluy-tuloy na katangian (discrete) at para sa mga nag-iiba-iba sa isang malaking hanay. Ang mga interval row ay maaaring may pantay o hindi pantay na pagitan. Sa pang-ekonomiyang kasanayan, karamihan sa mga hindi pantay na pagitan ay ginagamit, unti-unting tumataas o bumababa. Ang pangangailangang ito ay lumitaw lalo na sa mga kaso kung saan ang pagbabagu-bago ng isang katangian ay nangyayari nang hindi pantay at sa loob ng malalaking limitasyon.

Isaalang-alang natin ang uri ng serye ng pagitan na may pantay na pagitan, talahanayan. 5.3:

Talahanayan 5.3

Pamamahagi ng mga manggagawa ayon sa produksyon

Output, t.r. (X)

Bilang ng mga manggagawa (f)

Pinagsama-samang dalas (f´)

Ang serye ng pamamahagi ng pagitan ay graphic na inilalarawan sa anyo ng isang histogram, Fig. 5.2.

Fig.5.2. Pamamahagi ng mga manggagawa ayon sa produksyon

Naipon (cumulative) frequency. Sa pagsasagawa, kailangang baguhin ang serye ng pamamahagi sa pinagsama-samang serye, binuo ayon sa naipon na mga frequency. Sa kanilang tulong, matutukoy mo ang mga structural average na nagpapadali sa pagsusuri ng data ng serye ng pamamahagi.

Natutukoy ang mga pinagsama-samang frequency sa pamamagitan ng sunud-sunod na pagdaragdag sa mga frequency (o frequency) ng unang pangkat ng mga indicator na ito ng mga kasunod na grupo ng serye ng pamamahagi. Ang mga cumulate at ogive ay ginagamit upang ilarawan ang mga serye ng pamamahagi. Upang mabuo ang mga ito, ang mga halaga ng discrete na katangian (o ang mga dulo ng mga agwat) ay minarkahan sa abscissa axis, at ang pinagsama-samang kabuuan ng mga frequency (cumulates) ay minarkahan sa ordinate axis, Fig. 5.3.

kanin. 5.3. Pinagsama-samang pamamahagi ng mga manggagawa ayon sa produksyon

Kung ang mga kaliskis ng mga frequency at mga pagpipilian ay baligtad, i.e. ang abscissa axis ay sumasalamin sa mga naipon na frequency, at ang ordinate axis ay nagpapakita ng mga halaga ng mga variant, pagkatapos ay ang curve na nagpapakilala sa pagbabago ng mga frequency mula sa grupo patungo sa grupo ay tatawaging distribution ogive, Fig. 5.4.

kanin. 5.4. Ogiva ng pamamahagi ng mga manggagawa ayon sa produksyon

Ang mga serye ng variation na may pantay na pagitan ay nagbibigay ng isa sa pinakamahalagang kinakailangan para sa serye ng istatistika mga pamamahagi, na tinitiyak ang kanilang pagiging maihahambing sa oras at espasyo.

Densidad ng pamamahagi. Gayunpaman, ang mga frequency ng mga indibidwal na hindi pantay na pagitan sa pinangalanang serye ay hindi direktang maihahambing. Sa ganitong mga kaso, upang matiyak ang kinakailangang paghahambing, ang density ng pamamahagi ay kinakalkula, i.e. tukuyin kung gaano karaming mga yunit sa bawat pangkat ang bawat yunit ng halaga ng pagitan.

Kapag bumubuo ng isang graph ng pamamahagi ng isang serye ng pagkakaiba-iba na may hindi pantay na mga agwat, ang taas ng mga parihaba ay tinutukoy sa proporsyon hindi sa mga frequency, ngunit sa mga tagapagpahiwatig ng density ng pamamahagi ng mga halaga ng katangian na pinag-aaralan sa kaukulang mga pagitan.

Ang pagbubuo ng serye ng variation at ang graphical na representasyon nito ay ang unang hakbang sa pagproseso ng inisyal na datos at ang unang yugto sa pagsusuri ng populasyon na pinag-aaralan. Susunod na hakbang sa pagsusuri ng mga serye ng pagkakaiba-iba ay ang pagpapasiya ng pangunahing pangkalahatang tagapagpahiwatig, na tinatawag na mga katangian ng serye. Ang mga katangiang ito ay dapat magbigay ng ideya ng average na halaga ng katangian sa mga yunit ng populasyon.

average na halaga. Ang average na halaga ay isang pangkalahatang katangian ng katangiang pinag-aaralan sa populasyon na pinag-aaralan, na sumasalamin sa karaniwang antas nito sa bawat yunit ng populasyon sa ilalim ng mga partikular na kondisyon ng lugar at oras.

Ang average na halaga ay palaging pinangalanan at may parehong dimensyon bilang katangian ng mga indibidwal na yunit ng populasyon.

Bago kalkulahin ang mga average na halaga, kinakailangan na pangkatin ang mga yunit ng populasyon na pinag-aaralan, na tinutukoy ang mga qualitatively homogenous na grupo.

Ang average na kinakalkula para sa populasyon sa kabuuan ay tinatawag na pangkalahatang average, at para sa bawat grupo - mga average ng grupo.

Mayroong dalawang uri ng mga average: kapangyarihan (arithmetic mean, harmonic mean, geometric mean, quadratic mean); istruktura (mode, median, quartiles, deciles).

Ang pagpili ng average para sa pagkalkula ay depende sa layunin.

Mga uri ng mga average ng kapangyarihan at mga pamamaraan para sa kanilang pagkalkula. Sa pagsasagawa ng pagpoproseso ng istatistika nakolektang materyal manggaling iba't ibang gawain, na nangangailangan ng iba't ibang mga average upang malutas.

Nakukuha ng mga istatistika ng matematika ang iba't ibang mga average mula sa mga formula ng power average:

nasaan ang average na halaga; x - mga indibidwal na pagpipilian (mga halaga ng tampok); z – exponent (na may z = 1 – arithmetic mean, z = 0 geometric mean, z = - 1 – harmonic mean, z = 2 – square mean).

Gayunpaman, ang tanong kung anong uri ng average ang dapat ilapat sa bawat indibidwal na kaso ay nireresolba ng tiyak na pagsusuri populasyon na pinag-aaralan.

Ang pinakakaraniwang uri ng average sa mga istatistika ay ibig sabihin ng aritmetika. Ito ay kinakalkula sa mga kaso kung saan ang dami ng average na katangian ay nabuo bilang ang kabuuan ng mga halaga nito para sa mga indibidwal na yunit ng istatistikal na populasyon na pinag-aaralan.

Depende sa likas na katangian ng pinagmumulan ng data, ang arithmetic mean ay tinutukoy sa iba't ibang paraan:

Kung ang data ay ungrouped, pagkatapos ay ang pagkalkula ay isinasagawa gamit ang simpleng average na formula

Pagkalkula ng arithmetic mean sa discrete na serye nangyayari ayon sa formula 3.4.

Pagkalkula ng arithmetic mean sa isang serye ng pagitan. Sa isang serye ng pagkakaiba-iba ng agwat, kung saan ang halaga ng isang katangian sa bawat pangkat ay karaniwang itinuturing na gitna ng agwat, ang arithmetic mean ay maaaring mag-iba mula sa mean na kinakalkula mula sa hindi nakapangkat na data. Bukod dito, kung mas malaki ang pagitan sa mga pangkat, mas malaki ang posibleng mga paglihis ng average na kinakalkula mula sa nakapangkat na data mula sa average na kinakalkula mula sa hindi nakagrupong data.

Kapag kinakalkula ang average sa isang serye ng pagkakaiba-iba ng pagitan, upang maisagawa ang mga kinakailangang kalkulasyon, ang isa ay gumagalaw mula sa mga pagitan patungo sa kanilang mga midpoint. At pagkatapos ay kinakalkula ang average gamit ang weighted arithmetic average formula.

Mga katangian ng arithmetic mean. Ang ibig sabihin ng aritmetika ay may ilang mga katangian na ginagawang posible na gawing simple ang mga kalkulasyon; isaalang-alang natin ang mga ito.

1. Ang arithmetic mean ng pare-parehong mga numero ay katumbas ng pare-parehong bilang na ito.

Kung x = a. Pagkatapos .

2. Kung ang mga timbang ng lahat ng mga opsyon ay binago nang proporsyonal, ibig sabihin. pagtaas o pagbaba ng parehong bilang ng beses, pagkatapos ay hindi magbabago ang arithmetic mean ng bagong serye.

Kung ang lahat ng mga timbang f ay nababawasan ng k beses, kung gayon .

3. Ang kabuuan ng mga positibo at negatibong paglihis ng mga indibidwal na opsyon mula sa average, na pinarami ng mga timbang, ay katumbas ng zero, i.e.

Kung, kung gayon. Mula rito.

Kung ang lahat ng mga opsyon ay nabawasan o nadagdagan ng anumang numero, ang arithmetic mean ng bagong serye ay bababa o tataas ng parehong halaga.

Bawasan natin ang lahat ng pagpipilian x sa a, ibig sabihin. x´ = xa.

Pagkatapos

Ang arithmetic mean ng orihinal na serye ay maaaring makuha sa pamamagitan ng pagdaragdag sa pinababang mean ng numerong naunang ibinawas mula sa mga opsyon. a, ibig sabihin. .

5. Kung ang lahat ng mga opsyon ay nabawasan o nadagdagan k beses, pagkatapos ay ang arithmetic mean ng bagong serye ay bababa o tataas ng parehong halaga, i.e. V k minsan.

Hayaan mo na .

Samakatuwid, i.e. upang makuha ang average ng orihinal na serye, ang arithmetic average ng bagong serye (na may mga pinababang opsyon) ay dapat na tumaas ng k minsan.

Harmonic ibig sabihin. Ang harmonic mean ay ang reciprocal ng arithmetic mean. Ito ay ginagamit kapag ang istatistikal na impormasyon ay hindi naglalaman ng mga frequency para sa mga indibidwal na variant ng populasyon, ngunit ipinakita bilang kanilang produkto (M = xf). Ang harmonic mean ay kakalkulahin gamit ang formula 3.5

Ang praktikal na aplikasyon ng harmonic mean ay upang kalkulahin ang ilang mga indeks, sa partikular, ang index ng presyo.

Geometric ibig sabihin. Kapag gumagamit ng geometric mean, ang mga indibidwal na halaga ng isang katangian ay, bilang panuntunan, mga kamag-anak na halaga ng dinamika, na binuo sa anyo ng mga halaga ng chain, bilang isang ratio sa nakaraang antas ng bawat antas sa isang serye ng mga dinamika. Ang average sa gayon ay nagpapakilala sa average na rate ng paglago.

Katamtaman geometric na dami ay ginagamit din upang matukoy ang katumbas na halaga mula sa pinakamataas at pinakamababang halaga ng isang katangian. Halimbawa, Insurance Company nagtatapos ng mga kontrata para sa pagkakaloob ng mga serbisyo ng seguro sa sasakyan. Depende sa partikular na nakasegurong kaganapan pagbabayad ng insurance maaaring mula sa $10,000 hanggang $100,000 bawat taon. Ang average na halaga ng mga pagbabayad sa insurance ay magiging USD.

Ang geometric mean ay isang dami na ginamit bilang average ng mga ratio o sa serye ng pamamahagi, na kinakatawan bilang geometric na pag-unlad, kapag z = 0. Ang average na ito ay maginhawa upang gamitin kapag ang pansin ay binabayaran hindi sa ganap na pagkakaiba, ngunit sa mga ratio ng dalawang numero.

Ang mga formula para sa pagkalkula ay ang mga sumusunod

nasaan ang mga variant ng katangian na ina-average; - produkto ng mga pagpipilian; f– dalas ng mga pagpipilian.

Ang geometric na mean ay ginagamit sa mga kalkulasyon ng average na taunang rate ng paglago.

Mean square. Ang mean square formula ay ginagamit upang sukatin ang antas ng pagbabagu-bago ng mga indibidwal na halaga ng isang katangian sa paligid ng arithmetic mean sa serye ng pamamahagi. Kaya, kapag kinakalkula ang mga tagapagpahiwatig ng pagkakaiba-iba, ang average ay kinakalkula mula sa mga squared deviations ng mga indibidwal na halaga ng isang katangian mula sa arithmetic mean.

Ang root mean square value ay kinakalkula gamit ang formula

Sa pananaliksik sa ekonomiya, ang binagong mean square ay malawakang ginagamit sa pagkalkula ng mga indicator ng variation ng isang katangian, tulad ng dispersion at standard deviation.

Pamumuno ng karamihan. Mayroong sumusunod na ugnayan sa pagitan ng mga average ng kapangyarihan - kung mas malaki ang exponent, mas malaki ang halaga ng average, Talahanayan 5.4:

Talahanayan 5.4

Relasyon sa pagitan ng mga average

z halaga

Relasyon sa pagitan ng mga average

Ang relasyong ito ay tinatawag na majorancy rule.

Mga katamtamang istruktura. Upang makilala ang istraktura ng populasyon, ginagamit ang mga espesyal na tagapagpahiwatig, na maaaring tawaging mga average na istruktura. Kasama sa mga indicator na ito ang mode, median, quartiles at deciles.

Fashion. Ang Mode (Mo) ay ang pinakamadalas na nagaganap na halaga ng isang katangian sa mga yunit ng populasyon. Ang mode ay ang halaga ng attribute na tumutugma sa pinakamataas na punto ng theoretical distribution curve.

Ang fashion ay malawakang ginagamit sa komersyal na kasanayan kapag pinag-aaralan ang demand ng consumer (kapag tinutukoy ang mga sukat ng mga damit at sapatos na malawak na hinihiling), at nagre-record ng mga presyo. Maaaring may ilang mod sa kabuuan.

Pagkalkula ng mode sa isang discrete series. Sa isang discrete series, ang mode ay ang variant na may pinakamataas na frequency. Isaalang-alang natin ang paghahanap ng mode sa isang discrete series.

Pagkalkula ng mode sa isang serye ng pagitan. Sa isang serye ng pagkakaiba-iba ng pagitan, ang mode ay tinatayang itinuturing na sentral na variant ng modal interval, i.e. ang pagitan na may pinakamataas na dalas (frequency). Sa loob ng agwat, kailangan mong hanapin ang halaga ng katangian na ang mode. Para sa isang serye ng pagitan, ang mode ay tutukuyin ng formula

kung saan ang mas mababang limitasyon ng modal interval; – ang halaga ng modal interval; – dalas na naaayon sa modal interval; – dalas bago ang modal interval; – dalas ng agwat kasunod ng modal.

Median. Ang Median () ay ang halaga ng katangian ng gitnang yunit ng ranggo na serye. Ang isang ranggo na serye ay isang serye kung saan ang mga halaga ng katangian ay nakasulat sa pataas o pababang pagkakasunud-sunod. O ang median ay isang value na naghahati sa bilang ng isang nakaayos na serye ng variation sa dalawang magkapantay na bahagi: ang isang bahagi ay may value ng iba't ibang katangian na mas mababa sa average na opsyon, at ang isa ay may value na mas malaki.

Upang mahanap ang median, tukuyin muna ang ordinal na numero nito. Upang gawin ito, kung ang bilang ng mga yunit ay kakaiba, ang isa ay idinagdag sa kabuuan ng lahat ng mga frequency at ang lahat ay nahahati sa dalawa. Sa pantay na bilang ng mga unit, ang median ay makikita bilang ang halaga ng attribute ng isang unit, ang serial number nito ay tinutukoy ng kabuuang kabuuan ng mga frequency na hinati sa dalawa. Alam ang serial number ng median, madaling mahanap ang halaga nito gamit ang mga naipon na frequency.

Pagkalkula ng median sa isang discrete series. Ayon sa sample na survey, nakuha ang data sa pamamahagi ng mga pamilya ayon sa bilang ng mga bata, talahanayan. 5.5. Upang matukoy ang median, una nating tinutukoy ang ordinal na numero nito

Sa mga pamilyang ito ang bilang ng mga bata ay katumbas ng 2, samakatuwid = 2. Kaya, sa 50% ng mga pamilya ang bilang ng mga bata ay hindi lalampas sa 2.

– naipon na dalas bago ang median na pagitan;

Sa isang banda, ito ay isang napaka-positibong pag-aari dahil sa kasong ito, ang epekto ng lahat ng sanhi na nakakaapekto sa lahat ng yunit ng populasyon na pinag-aaralan ay isinasaalang-alang. Sa kabilang banda, kahit na ang isang obserbasyon na kasama sa mapagkukunan ng data sa pamamagitan ng pagkakataon ay maaaring makabuluhang baluktot ang ideya ng antas ng pag-unlad ng katangian na pinag-aaralan sa populasyon na isinasaalang-alang (lalo na sa maikling serye).

Quartiles at deciles. Sa pamamagitan ng pagkakatulad sa paghahanap ng median sa variation series, mahahanap mo ang halaga ng isang katangian para sa anumang unit ng ranggo na serye. Kaya, sa partikular, mahahanap mo ang halaga ng katangian para sa mga yunit na naghahati ng isang serye sa 4 na pantay na bahagi, sa 10, atbp.

Quartiles. Ang mga opsyon na naghahati sa ranggo na serye sa apat na pantay na bahagi ay tinatawag na quartile.

Sa kasong ito, nakikilala nila: ang mas mababang (o una) quartile (Q1) - ang halaga ng katangian para sa isang yunit ng ranggo na serye, na hinahati ang populasyon sa ratio na ¼ hanggang ¾ at ang itaas (o pangatlo) quartile ( Q3) - ang halaga ng attribute para sa unit ng ranggo na serye, na hinahati ang populasyon sa ratio na ¾ hanggang ¼.

– mga frequency ng quartile interval (ibababa at itaas)

Ang mga pagitan na naglalaman ng Q1 at Q3 ay tinutukoy ng mga naipon na frequency (o mga frequency).

Deciles. Bilang karagdagan sa mga quartile, ang mga decile ay kinakalkula - mga opsyon na naghahati sa ranggo na serye sa 10 pantay na bahagi.

Ang mga ito ay itinalaga ng D, ang unang decile D1 ay naghahati sa serye sa ratio na 1/10 at 9/10, ang pangalawang D2 - 2/10 at 8/10, atbp. Kinakalkula ang mga ito ayon sa parehong pamamaraan ng median at quartile.

Parehong nabibilang ang median, quartile, at deciles sa tinatawag na ordinal statistics, na nauunawaan bilang isang opsyon na sumasakop sa isang partikular na ordinal na lugar sa ranggo na serye.

Serye ng pagkakaiba-iba - isang serye kung saan inihahambing (sa antas ng pagtaas o pagbaba) mga pagpipilian at katumbas mga frequency

Ang mga opsyon ay mga indibidwal na quantitative expression ng isang katangian. Ipinapahiwatig ng isang Latin na titik V . Ang klasikal na pag-unawa sa terminong "variant" ay ipinapalagay na ang bawat natatanging halaga ng isang katangian ay tinatawag na isang variant, nang hindi isinasaalang-alang ang bilang ng mga pag-uulit.

Halimbawa, sa variation series ng systolic blood pressure indicator na sinusukat sa sampung pasyente:

110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

Mayroong 6 na halaga lamang na magagamit:

110, 120, 130, 140, 160, 170.

Ang dalas ay isang numerong nagsasaad kung gaano karaming beses inuulit ang isang opsyon. Tinutukoy ng isang Latin na titik P . Ang kabuuan ng lahat ng mga frequency (na, siyempre, ay katumbas ng bilang ng lahat ng mga pinag-aralan) ay tinutukoy bilang n.

    Sa aming halimbawa, ang mga frequency ay kukuha ng mga sumusunod na halaga:
  • para sa opsyon 110 frequency P = 1 (nagaganap ang value 110 sa isang pasyente),
  • para sa opsyon 120 frequency P = 2 (ang value 120 ay nangyayari sa dalawang pasyente),
  • para sa opsyon na 130 frequency P = 3 (nagaganap ang value 130 sa tatlong pasyente),
  • para sa opsyon 140 frequency P = 2 (value 140 ay nangyayari sa dalawang pasyente),
  • para sa opsyon 160 frequency P = 1 (nagaganap ang value 160 sa isang pasyente),
  • para sa opsyon na 170 frequency P = 1 (nagaganap ang value 170 sa isang pasyente),

Mga uri ng serye ng variation:

  1. simple lang- ito ay isang serye kung saan ang bawat opsyon ay nangyayari nang isang beses lamang (lahat ng mga frequency ay katumbas ng 1);
  2. sinuspinde- isang serye kung saan lumalabas ang isa o higit pang mga opsyon nang higit sa isang beses.

Ang serye ng variation ay ginagamit upang ilarawan ang malalaking array ng mga numero; sa form na ito na ang mga nakolektang data ng karamihan sa mga medikal na pag-aaral ay unang ipinakita. Upang makilala ang serye ng pagkakaiba-iba, kinakalkula ang mga espesyal na tagapagpahiwatig, kabilang ang mga average na halaga, mga tagapagpahiwatig ng pagkakaiba-iba (ang tinatawag na dispersion), at mga tagapagpahiwatig ng pagiging kinatawan ng sample na data.

Mga tagapagpahiwatig ng serye ng pagkakaiba-iba

1) Ang arithmetic mean ay isang pangkalahatang tagapagpahiwatig na nagpapakilala sa laki ng katangiang pinag-aaralan. Ang ibig sabihin ng arithmetic ay tinutukoy bilang M , ay ang pinakakaraniwang uri ng average. Ang ibig sabihin ng aritmetika ay kinakalkula bilang ratio ng kabuuan ng mga halaga ng tagapagpahiwatig ng lahat ng mga yunit ng pagmamasid sa bilang ng lahat ng mga paksang pinag-aralan. Ang paraan para sa pagkalkula ng arithmetic mean ay naiiba para sa isang simple at may timbang na serye ng variation.

Formula para sa pagkalkula simpleng arithmetic average:

Formula para sa pagkalkula weighted arithmetic average:

M = Σ(V * P)/ n

​ 2) Ang mode ay isa pang average na halaga ng serye ng variation, na tumutugma sa pinakamadalas na paulit-ulit na opsyon. O, sa ibang paraan, ito ang opsyon na tumutugma sa pinakamataas na dalas. Tinutukoy bilang Mo . Ang mode ay kinakalkula lamang para sa may timbang na serye, dahil sa mga simpleng hanay wala sa mga opsyon ang inuulit at lahat ng frequency ay katumbas ng isa.

Halimbawa, sa variation series ng mga halaga ng heart rate:

80, 84, 84, 86, 86, 86, 90, 94;

ang halaga ng mode ay 86, dahil ang pagpipiliang ito ay nangyayari nang 3 beses, samakatuwid ang dalas nito ay ang pinakamataas.

3) Median - ang halaga ng opsyon na naghahati sa serye ng variation sa kalahati: sa magkabilang panig nito ay may pantay na bilang ng mga opsyon. Ang median, tulad ng arithmetic mean at mode, ay tumutukoy sa mga average na halaga. Tinutukoy bilang Ako

4) Standard deviation (kasingkahulugan: karaniwang lihis, sigma deviation, sigma) - isang sukatan ng pagkakaiba-iba ng serye ng variation. Ito ay isang mahalagang tagapagpahiwatig na pinagsasama ang lahat ng mga kaso ng paglihis mula sa average. Sa katunayan, sinasagot nito ang tanong: gaano kalayo at gaano kadalas kumakalat ang mga variant mula sa ibig sabihin ng aritmetika. Tinutukoy ng isang liham na Griyego σ ("sigma").

Kung ang laki ng populasyon ay higit sa 30 yunit, ang karaniwang paglihis ay kinakalkula gamit ang sumusunod na formula:

Para sa maliliit na populasyon - 30 mga yunit ng pagmamasid o mas kaunti - ang karaniwang paglihis ay kinakalkula gamit ang ibang formula:

Serye ng pagkakaiba-iba: kahulugan, mga uri, pangunahing katangian. Paraan ng pagkalkula
mode, median, arithmetic mean sa medikal at istatistikal na pananaliksik
(ipakita nang may kondisyong halimbawa).

Ang isang serye ng pagkakaiba-iba ay isang serye ng mga numerical na halaga ng katangian na pinag-aaralan, na naiiba sa bawat isa sa magnitude at nakaayos sa isang tiyak na pagkakasunud-sunod (sa pataas o pababang pagkakasunud-sunod). Ang bawat numerical value ng isang serye ay tinatawag na variant (V), at ang mga numerong nagpapakita kung gaano kadalas nangyayari ang isang partikular na variant sa isang partikular na serye ay tinatawag na frequency (p).

Ang kabuuang bilang ng mga kaso ng pagmamasid na bumubuo sa serye ng variation ay tinutukoy ng titik n. Ang pagkakaiba sa kahulugan ng mga katangiang pinag-aaralan ay tinatawag na baryasyon. Kung ang iba't ibang katangian ay walang quantitative measure, ang variation ay tinatawag na qualitative, at ang distribution series ay tinatawag na attributive (halimbawa, distribution ayon sa resulta ng sakit, health status, atbp.).

Kung ang isang iba't ibang katangian ay may quantitative expression, ang naturang variation ay tinatawag na quantitative, at ang distribution series ay tinatawag na variational.

Ang mga serye ng variation ay nahahati sa hindi tuloy-tuloy at tuluy-tuloy - batay sa likas na katangian ng quantitative na katangian; simple at may timbang - batay sa dalas ng paglitaw ng variant.

Sa isang simpleng serye ng variation, ang bawat opsyon ay nangyayari nang isang beses lamang (p=1), sa isang may timbang na serye, ang parehong opsyon ay nangyayari nang ilang beses (p>1). Ang mga halimbawa ng naturang serye ay tatalakayin pa sa teksto. Kung ang quantitative na katangian ay tuloy-tuloy, i.e. Sa pagitan ng mga integer na dami ay may mga intermediate fractional na dami; ang serye ng variation ay tinatawag na tuloy-tuloy.

Halimbawa: 10.0 – 11.9

14.0 – 15.9, atbp.

Kung ang quantitative na katangian ay hindi nagpapatuloy, i.e. ang mga indibidwal na halaga nito (mga variant) ay naiiba sa bawat isa sa pamamagitan ng isang integer at walang mga intermediate fractional na halaga; ang serye ng variation ay tinatawag na discontinuous o discrete.

Gamit ang data ng rate ng puso mula sa nakaraang halimbawa

para sa 21 mag-aaral, gagawa kami ng serye ng variation (Talahanayan 1).

Talahanayan 1

Pamamahagi ng mga medikal na estudyante ayon sa tibok ng puso (bpm)

Kaya, upang bumuo ng isang pagkakaiba-iba serye ay nangangahulugan na ang magagamit mga numerong halaga(mga opsyon) i-systematize, ayusin, i.e. ayusin sa isang tiyak na pagkakasunud-sunod (sa pataas o pababang pagkakasunud-sunod) sa kanilang kaukulang mga frequency. Sa halimbawang isinasaalang-alang, ang mga opsyon ay nakaayos sa pataas na pagkakasunud-sunod at ipinahayag bilang mga integer na discontinuous (discrete) na mga numero, ang bawat opsyon ay nangyayari nang maraming beses, i.e. kami ay nakikitungo sa isang timbang, hindi tuloy-tuloy o discrete variation series.

Bilang isang patakaran, kung ang bilang ng mga obserbasyon sa populasyon ng istatistika na aming pinag-aaralan ay hindi lalampas sa 30, kung gayon sapat na upang ayusin ang lahat ng mga halaga ng katangian na pinag-aaralan sa isang pataas na serye ng pagkakaiba-iba, tulad ng sa Talahanayan. 1, o pababang pagkakasunud-sunod.

Sa isang malaking bilang ng mga obserbasyon (n>30), ang bilang ng mga nagaganap na variant ay maaaring napakalaki; sa kasong ito, ang isang pagitan o pinagsama-samang serye ng variation ay pinagsama-sama, kung saan, upang gawing simple ang kasunod na pagproseso at linawin ang likas na katangian ng pamamahagi, ang mga variant ay pinagsama sa mga pangkat.

Karaniwan ang bilang ng mga opsyon ng pangkat ay mula 8 hanggang 15.

Dapat mayroong hindi bababa sa 5 sa kanila, dahil... kung hindi, ito ay magiging masyadong magaspang, labis na pagpapalaki, na sumisira sa pangkalahatang larawan ng pagkakaiba-iba at lubos na nakakaapekto sa katumpakan ng mga average na halaga. Kapag ang bilang ng mga variant ng pangkat ay higit sa 20-25, ang katumpakan ng pagkalkula ng mga average na halaga ay tumataas, ngunit ang mga katangian ng pagkakaiba-iba ng katangian ay makabuluhang baluktot at ang pagproseso ng matematika ay nagiging mas kumplikado.

Kapag nag-compile ng isang pinagsama-samang serye, kinakailangang isaalang-alang

− ang mga pangkat ng opsyon ay dapat ayusin sa isang tiyak na pagkakasunud-sunod (pataas o pababa);

− dapat magkapareho ang mga pagitan sa mga pangkat ng opsyon;

− ang mga halaga ng mga hangganan ng pagitan ay hindi dapat magkasabay, dahil magiging malabo kung aling mga grupo ang uuriin ang mga indibidwal na variant;

− kinakailangang isaalang-alang ang mga katangian ng husay ng nakolektang materyal kapag nagtatakda ng mga limitasyon ng agwat (halimbawa, kapag pinag-aaralan ang bigat ng mga matatanda, ang isang pagitan ng 3-4 kg ay katanggap-tanggap, at para sa mga bata sa mga unang buwan ng buhay ito hindi dapat lumampas sa 100 g)

Bumuo tayo ng pinagsama-samang (interval) na serye na nagpapakita ng data sa pulso (beats kada minuto) ng 55 medikal na estudyante bago ang pagsusulit: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

Upang bumuo ng nakagrupong serye kailangan mo:

1. Tukuyin ang laki ng pagitan;

2. Tukuyin ang gitna, simula at wakas ng mga pangkat ng serye ng variation.

● Ang laki ng agwat (i) ay tinutukoy ng bilang ng mga dapat na grupo (r), ang bilang nito ay nakatakda depende sa bilang ng mga obserbasyon (n) ayon sa isang espesyal na talahanayan

Bilang ng mga pangkat depende sa bilang ng mga obserbasyon:

Sa aming kaso, para sa 55 mga mag-aaral, maaari kang lumikha ng mula 8 hanggang 10 mga grupo.

Ang halaga ng pagitan (i) ay tinutukoy ng sumusunod na formula -

i = V max-V min/r

Sa aming halimbawa, ang halaga ng pagitan ay 82-58/8= 3.

Kung ang halaga ng pagitan ay isang fractional number, ang resulta ay dapat bilugan sa isang buong numero.

Mayroong ilang mga uri ng mga average:

● arithmetic mean,

● geometric na ibig sabihin,

● harmonic mean,

● root mean square,

● average na progresibo,

● panggitna

SA medikal na istatistika Ang mga average ng aritmetika ay kadalasang ginagamit.

Ang arithmetic mean (M) ay isang generalizing value na tumutukoy kung ano ang tipikal para sa buong populasyon. Ang mga pangunahing pamamaraan para sa pagkalkula ng M ay: ang arithmetic mean method at ang paraan ng mga sandali (conditional deviations).

Ang arithmetic mean method ay ginagamit upang kalkulahin ang simpleng arithmetic mean at ang weighted arithmetic mean. Ang pagpili ng paraan para sa pagkalkula ng arithmetic mean ay depende sa uri ng variation series. Sa kaso ng isang simpleng serye ng variation, kung saan ang bawat opsyon ay nangyayari nang isang beses, ang arithmetic mean simple ay tinutukoy ng formula:

kung saan: M – arithmetic mean value;

V - halaga ng iba't ibang katangian (mga variant);

Σ – nagsasaad ng aksyon – pagsusuma;

n – kabuuang bilang ng mga obserbasyon.

Isang halimbawa ng pagkalkula ng simpleng arithmetic average. Ang bilis ng paghinga (bilang ng paggalaw ng paghinga kada minuto) sa 9 na lalaki na may edad na 35 taon: 20, 22, 19, 15, 16, 21, 17, 23, 18.

Upang matukoy ang average na antas ng respiratory rate sa mga lalaki na may edad na 35 taon, kinakailangan:

1. Bumuo ng serye ng variation, inaayos ang lahat ng opsyon sa pataas o pababang pagkakasunod-sunod. Nakakuha kami ng simpleng serye ng variation, dahil ang mga halaga ng opsyon ay nangyayari nang isang beses lamang.

M = ∑V/n = 171/9 = 19 na paghinga bawat minuto

Konklusyon. Ang rate ng paghinga sa mga lalaking may edad na 35 taon ay nasa average na 19 mga paggalaw ng paghinga sa isang minuto.

Kung ang mga indibidwal na halaga ng isang variant ay paulit-ulit, hindi na kailangang isulat ang bawat variant sa isang linya; sapat na upang ilista ang mga nagaganap na laki ng variant (V) at sa tabi nito ay ipahiwatig ang bilang ng kanilang mga pag-uulit (p ). Ang nasabing serye ng variation, kung saan ang mga opsyon ay, kumbaga, ay tinitimbang ng bilang ng mga frequency na naaayon sa kanila, ay tinatawag na weighted variation series, at ang kinakalkula na average na halaga ay ang weighted arithmetic mean.

Ang weighted arithmetic mean ay tinutukoy ng formula: M= ∑Vp/n

kung saan ang n ay ang bilang ng mga obserbasyon, katumbas ng kabuuan mga frequency – Σр.

Isang halimbawa ng pagkalkula ng arithmetic weighted average.

Ang tagal ng kapansanan (sa mga araw) sa 35 mga pasyente na may acute respiratory disease (ARI) na ginagamot ng isang lokal na doktor sa unang quarter ng kasalukuyang taon ay: 6, 7, 5, 3, 9, 8, 7, 5, 6 , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 araw.

Ang pamamaraan para sa pagtukoy ng average na tagal ng kapansanan sa mga pasyente na may talamak na impeksyon sa paghinga ay ang mga sumusunod:

1. Bumuo tayo ng weighted variation series, dahil Ang mga indibidwal na halaga ng pagpipilian ay paulit-ulit nang maraming beses. Upang gawin ito, maaari mong ayusin ang lahat ng mga pagpipilian sa pataas o pababang pagkakasunud-sunod sa kanilang mga kaukulang frequency.

Sa aming kaso, ang mga pagpipilian ay nakaayos sa pataas na pagkakasunud-sunod

2. Kalkulahin ang arithmetic weighted average gamit ang formula: M = ∑Vp/n = 233/35 = 6.7 araw

Pamamahagi ng mga pasyente na may acute respiratory infection ayon sa tagal ng kapansanan:

Tagal ng kapansanan (V) Bilang ng mga pasyente (p) Vp
∑p = n = 35 ∑Vp = 233

Konklusyon. Ang tagal ng kapansanan sa mga pasyente na may acute respiratory disease ay may average na 6.7 araw.

Ang Mode (Mo) ay ang pinakakaraniwang opsyon sa serye ng variation. Para sa pamamahagi na ipinakita sa talahanayan, ang mode ay tumutugma sa isang opsyon na katumbas ng 10; ito ay nangyayari nang mas madalas kaysa sa iba - 6 na beses.

Pamamahagi ng mga pasyente ayon sa haba ng pananatili sa kama sa ospital (sa mga araw)

V
p

Minsan mahirap matukoy ang eksaktong magnitude ng isang mode dahil maaaring mayroong ilang "pinakakaraniwang" obserbasyon sa data na pinag-aaralan.

Ang Median (Me) ay isang nonparametric indicator na naghahati sa serye ng variation sa dalawang pantay na kalahati: ang parehong bilang ng mga variant ay matatagpuan sa magkabilang panig ng median.

Halimbawa, para sa distribusyon na ipinapakita sa talahanayan, ang median ay 10, dahil sa magkabilang panig ng halagang ito mayroong 14 na opsyon, i.e. ang numero 10 ay sumasakop sentral na posisyon sa seryeng ito ay ang median nito.

Dahil ang bilang ng mga obserbasyon sa halimbawang ito ay pantay (n=34), ang median ay maaaring matukoy tulad ng sumusunod:

Ako = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

Nangangahulugan ito na ang gitna ng serye ay nasa ikalabimpitong opsyon, na tumutugma sa isang median na katumbas ng 10. Para sa pamamahagi na ipinakita sa talahanayan, ang arithmetic mean ay katumbas ng:

M = ∑Vp/n = 334/34 = 10.1

Kaya, para sa 34 na mga obserbasyon mula sa talahanayan. 8, nakuha namin ang: Mo=10, Me=10, ang arithmetic mean (M) ay 10.1. Sa aming halimbawa, ang lahat ng tatlong mga tagapagpahiwatig ay naging pantay o malapit sa isa't isa, kahit na sila ay ganap na naiiba.

Ang arithmetic mean ay ang resultang kabuuan ng lahat ng mga impluwensya; lahat ng mga opsyon nang walang pagbubukod, kabilang ang mga extreme, madalas na hindi tipikal para sa isang partikular na phenomenon o populasyon, ay nakikibahagi sa pagbuo nito.

Ang mode at median, hindi katulad ng arithmetic mean, ay hindi nakasalalay sa halaga ng lahat ng mga indibidwal na halaga ng iba't ibang katangian (ang mga halaga ng matinding variant at ang antas ng pagpapakalat ng serye). Ang arithmetic mean ay nagpapakilala sa buong masa ng mga obserbasyon, ang mode at median ay nagpapakilala sa bulk

Ang isang espesyal na lugar sa pagsusuri sa istatistika ay nabibilang sa pagpapasiya ng average na antas ng katangian o kababalaghan na pinag-aaralan. Ang average na antas ng isang katangian ay sinusukat ng mga average na halaga.

Ang average na halaga ay nagpapakilala sa pangkalahatang dami ng antas ng katangiang pinag-aaralan at isang pangkat na pag-aari ng istatistikal na populasyon. Ito ay nag-level out, nagpapahina ng mga random na paglihis ng mga indibidwal na obserbasyon sa isang direksyon o iba pa at itinatampok ang pangunahing, tipikal na katangian ng katangiang pinag-aaralan.

Ang mga average ay malawakang ginagamit:

1. Upang masuri ang kalagayan ng kalusugan ng populasyon: mga katangian ng pisikal na pag-unlad (taas, timbang, circumference dibdib atbp.), pagtukoy sa pagkalat at tagal iba't ibang sakit, pagsusuri mga tagapagpahiwatig ng demograpiko(natural na paggalaw ng populasyon, average na pag-asa sa buhay, pagpaparami ng populasyon, average na laki ng populasyon, atbp.).

2. Upang pag-aralan ang mga aktibidad ng mga institusyong medikal, mga tauhang medikal at pagtatasa sa kalidad ng kanilang trabaho, pagpaplano at pagtukoy sa mga pangangailangan ng populasyon para sa iba't ibang uri Medikal na pangangalaga(average na bilang ng mga kahilingan o pagbisita bawat residente bawat taon, average na tagal ang pananatili ng pasyente sa ospital, average na tagal pagsusuri sa pasyente, average na pagkakaroon ng mga doktor, kama, atbp.).

3. Upang makilala ang sanitary at epidemiological state (average na air dust content sa workshop, average na lugar bawat tao, average na pagkonsumo ng mga protina, taba at carbohydrates, atbp.).

4. Upang matukoy ang mga medikal at physiological na tagapagpahiwatig sa normal at pathological na mga kondisyon, kapag nagpoproseso ng data ng laboratoryo, upang maitaguyod ang pagiging maaasahan ng mga resulta sample survey sa panlipunan at kalinisan, klinikal, pang-eksperimentong pag-aaral.

Ang pagkalkula ng mga average na halaga ay isinasagawa batay sa serye ng pagkakaiba-iba. Serye ng pagkakaiba-iba ay isang qualitatively homogenous na istatistikal na populasyon, ang mga indibidwal na yunit kung saan nailalarawan ang dami ng mga pagkakaiba ng katangian o phenomenon na pinag-aaralan.

Ang quantitative variation ay maaaring may dalawang uri: discontinuous (discrete) at continuous.

Ang isang discontinuous (discrete) na katangian ay ipinahayag lamang bilang isang integer at hindi maaaring magkaroon ng anumang mga intermediate na halaga (halimbawa, ang bilang ng mga pagbisita, ang populasyon ng site, ang bilang ng mga bata sa pamilya, ang kalubhaan ng sakit sa mga puntos , atbp.).

Ang isang tuluy-tuloy na katangian ay maaaring tumagal sa anumang mga halaga sa loob ng ilang mga limitasyon, kabilang ang mga fractional, at ipinahayag lamang ng humigit-kumulang (halimbawa, timbang - para sa mga matatanda maaari itong limitado sa mga kilo, at para sa mga bagong silang - gramo; taas, presyon ng arterial, oras na ginugol upang makita ang pasyente, atbp.).



Ang digital na halaga ng bawat indibidwal na katangian o phenomenon na kasama sa serye ng variation ay tinatawag na variant at itinalaga ng titik V . Ang iba pang mga notasyon ay matatagpuan din sa matematikal na panitikan, halimbawa x o y.

Ang isang serye ng variation, kung saan ang bawat opsyon ay ipinahiwatig nang isang beses, ay tinatawag na simple. Ang ganitong mga serye ay ginagamit sa karamihan ng mga istatistikal na problema sa kaso ng computer data processing.

Habang tumataas ang bilang ng mga obserbasyon, malamang na mangyari ang paulit-ulit na mga halaga ng variant. Sa kasong ito, ito ay nilikha pinagsama-samang serye ng variation, kung saan ang bilang ng mga pag-uulit ay ipinahiwatig (dalas, na tinutukoy ng titik " R »).

Serye ng variation ng ranggo binubuo ng mga opsyon na nakaayos sa pataas o pababang pagkakasunud-sunod. Parehong simple at nakapangkat na serye ay maaaring isama sa pagraranggo.

Serye ng pagkakaiba-iba ng pagitan pinagsama-sama upang gawing simple ang mga kasunod na kalkulasyon na isinagawa nang hindi gumagamit ng isang computer, na may napakalaking bilang ng mga yunit ng pagmamasid (higit sa 1000).

Patuloy na serye ng variation kasama ang mga halaga ng opsyon, na maaaring maging anumang halaga.

Kung sa isang serye ng pagkakaiba-iba ang mga halaga ng isang katangian (mga variant) ay ibinibigay sa anyo ng mga indibidwal na tiyak na numero, kung gayon ang naturang serye ay tinatawag discrete.

Pangkalahatang katangian ang mga halaga ng katangian na makikita sa serye ng pagkakaiba-iba ay ang mga average na halaga. Kabilang sa mga ito, ang pinaka ginagamit ay: arithmetic mean M, fashion Mo at median Ako. Ang bawat isa sa mga katangiang ito ay natatangi. Hindi nila maaaring palitan ang isa't isa at magkasama lamang sila ay kumakatawan sa mga tampok ng serye ng pagkakaiba-iba nang lubos at sa isang condensed form.

Fashion (Mo) pangalanan ang halaga ng pinakamadalas na nagaganap na mga opsyon.

Median (ako) – ito ang halaga ng opsyon na naghahati sa ranggo na serye ng variation sa kalahati (sa bawat panig ng median ay may kalahati ng opsyon). Sa mga bihirang kaso, kapag mayroong simetriko na serye ng variation, ang mode at median ay pantay-pantay sa isa't isa at tumutugma sa halaga ng arithmetic mean.

Karamihan tipikal na katangian ang pagpipiliang halaga ay ibig sabihin ng aritmetika halaga( M ). Sa panitikan ng matematika ito ay tinutukoy .

Ang ibig sabihin ng aritmetika (M, ) ay isang pangkalahatang quantitative na katangian ng isang tiyak na katangian ng phenomena na pinag-aaralan, na bumubuo ng qualitatively homogeneous statistical population. May mga simple at may timbang na arithmetic average. Ang simpleng arithmetic mean ay kinakalkula para sa isang simpleng serye ng variation sa pamamagitan ng pagsusuma ng lahat ng mga opsyon at paghahati sa kabuuan na ito sa pamamagitan ng kabuuan opsyong kasama sa serye ng variation na ito. Ang mga kalkulasyon ay isinasagawa ayon sa pormula:

,

saan: M - simpleng ibig sabihin ng aritmetika;

Σ V - pagpipilian sa halaga;

n- bilang ng mga obserbasyon.

Sa pangkat na serye ng variation, tinutukoy ang weighted arithmetic mean. Ang formula para sa pagkalkula nito:

,

saan: M - arithmetic weighted average;

Σ Vp - ang kabuuan ng mga produkto ng variant sa pamamagitan ng kanilang mga frequency;

n- bilang ng mga obserbasyon.

Sa isang malaking bilang ng mga obserbasyon, sa kaso ng mga manu-manong kalkulasyon, ang paraan ng mga sandali ay maaaring gamitin.

Ang arithmetic mean ay may mga sumusunod na katangian:

· kabuuan ng mga paglihis mula sa average ( Σ d ) ay katumbas ng zero (tingnan ang Talahanayan 15);

· kapag pina-multiply (hinahati) ang lahat ng opsyon sa parehong salik (divisor), ang arithmetic mean ay pina-multiply (hinati) ng parehong salik (divisor);

· kung idaragdag mo (babawas) ang parehong numero sa lahat ng mga opsyon, ang arithmetic mean ay tataas (bumababa) ng parehong numero.

Ang mga average ng aritmetika, na kinuha sa kanilang sarili, nang hindi isinasaalang-alang ang pagkakaiba-iba ng serye kung saan sila kinakalkula, ay maaaring hindi ganap na sumasalamin sa mga katangian ng serye ng variation, lalo na kapag kinakailangan ang paghahambing sa iba pang mga average. Ang mga average na malapit sa halaga ay maaaring makuha mula sa serye na may iba't ibang antas nakakalat. Kung mas malapit ang mga indibidwal na opsyon sa isa't isa sa mga tuntunin ng kanilang mga quantitative na katangian, mas kaunti pagpapakalat (oscillation, variability) serye, mas tipikal ang average nito.

Ang mga pangunahing parameter na nagbibigay-daan sa amin upang masuri ang pagkakaiba-iba ng isang katangian ay:

· Saklaw;

· Malawak;

· Karaniwang lihis;

· Ang koepisyent ng pagkakaiba-iba.

Ang pagkakaiba-iba ng isang katangian ay maaaring humigit-kumulang na hinuhusgahan ng saklaw at amplitude ng serye ng variation. Ang hanay ay nagpapahiwatig ng maximum (V max) at minimum (V min) na mga opsyon sa serye. Ang amplitude (A m) ay ang pagkakaiba sa pagitan ng mga opsyong ito: A m = V max - V min.

Ang pangunahing, karaniwang tinatanggap na sukatan ng pagkakaiba-iba ng isang serye ng variation ay pagpapakalat (D ). Ngunit ang madalas na ginagamit ay isang mas maginhawang parameter na kinakalkula batay sa pagpapakalat - ang karaniwang paglihis ( σ ). Isinasaalang-alang nito ang magnitude ng paglihis ( d ) ng bawat serye ng variation mula sa arithmetic mean nito ( d=V - M ).

Dahil ang mga paglihis mula sa average ay maaaring maging positibo at negatibo, kapag pinagsama-sama ay binibigyan nila ang halaga na "0" (S d=0). Upang maiwasan ito, ang mga halaga ng paglihis ( d) ay itinaas sa pangalawang kapangyarihan at na-average. Kaya, ang dispersion ng isang variation series ay ang mean square ng deviations ng isang variant mula sa arithmetic mean at kinakalkula ng formula:

.

Siya nga pala ang pinakamahalagang katangian pagkakaiba-iba at ginagamit upang kalkulahin ang maraming istatistikal na pagsusulit.

Dahil ang dispersion ay ipinahayag bilang parisukat ng mga paglihis, ang halaga nito ay hindi maaaring gamitin kumpara sa arithmetic mean. Para sa mga layuning ito ito ay ginagamit karaniwang lihis, na itinalaga ng sign na "Sigma" ( σ ). Inilalarawan nito ang average na paglihis ng lahat ng variant ng isang serye ng variation mula sa arithmetic mean na halaga sa parehong mga yunit bilang ang average na halaga mismo, upang magamit ang mga ito nang magkasama.

Ang karaniwang paglihis ay tinutukoy ng formula:

Ang tinukoy na formula ay inilapat kapag ang bilang ng mga obserbasyon ( n ) higit sa 30. Na may mas maliit na bilang n ang standard deviation value ay magkakaroon ng error na nauugnay sa mathematical offset ( n - 1). Sa pagsasaalang-alang na ito, ang isang mas tumpak na resulta ay maaaring makuha sa pamamagitan ng pagsasaalang-alang ng naturang bias sa pormula para sa pagkalkula ng karaniwang paglihis:

karaniwang lihis (s ) ay isang pagtatantya ng standard deviation ng isang random variable X patungkol sa kanya inaasahan sa matematika batay sa isang walang pinapanigan na pagtatantya ng pagkakaiba nito.

Sa mga halaga n > 30 karaniwang paglihis ( σ ) at karaniwang paglihis ( s ) ay magiging pareho ( σ =s ). Samakatuwid, sa karamihan ng mga praktikal na manwal ang mga pamantayang ito ay itinuturing na may iba't ibang kahulugan. SA Excel program ang pagkalkula ng karaniwang paglihis ay maaaring gawin gamit ang function =STDEV(range). At upang makalkula ang karaniwang paglihis, kailangan mong lumikha ng naaangkop na formula.

Ang ibig sabihin ng parisukat o karaniwang paglihis ay nagbibigay-daan sa iyo upang matukoy kung magkano ang mga halaga ng isang katangian ay maaaring mag-iba mula sa average na halaga. Ipagpalagay na mayroong dalawang lungsod na may parehong average na pang-araw-araw na temperatura sa tag-araw. Ang isa sa mga lungsod na ito ay matatagpuan sa baybayin, at ang isa pa sa kontinente. Ito ay kilala na sa mga lungsod na matatagpuan sa baybayin, ang mga pagkakaiba sa temperatura ng araw ay mas maliit kaysa sa mga lungsod na matatagpuan sa loob ng bansa. Samakatuwid, ang karaniwang paglihis ng mga temperatura sa araw para sa baybaying lungsod ay magiging mas mababa kaysa sa pangalawang lungsod. Sa pagsasagawa, nangangahulugan ito na ang average na temperatura ng hangin ng bawat isa tiyak na araw sa isang lungsod na matatagpuan sa kontinente ay higit na mag-iiba mula sa karaniwan kaysa sa isang lungsod sa baybayin. Bilang karagdagan, pinapayagan ka ng karaniwang paglihis na suriin ang mga posibleng paglihis ng temperatura mula sa average na may kinakailangang antas ng posibilidad.

Ayon sa teorya ng posibilidad, sa mga phenomena na sumusunod sa normal na batas sa pamamahagi, mayroong isang mahigpit na ugnayan sa pagitan ng mga halaga ng arithmetic mean, standard deviation at mga pagpipilian ( tatlong sigma na panuntunan). Halimbawa, 68.3% ng mga halaga ng iba't ibang katangian ay nasa loob ng M ± 1 σ , 95.5% - sa loob ng M ± 2 σ at 99.7% - sa loob ng M ± 3 σ .

Ang halaga ng karaniwang paglihis ay nagpapahintulot sa amin na hatulan ang likas na katangian ng homogeneity ng serye ng pagkakaiba-iba at ang pangkat ng pag-aaral. Kung ang halaga ng karaniwang paglihis ay maliit, kung gayon ito ay nagpapahiwatig ng isang medyo mataas na homogeneity ng hindi pangkaraniwang bagay na pinag-aaralan. Ang arithmetic mean sa kasong ito ay dapat ituring na medyo katangian para sa isang naibigay na serye ng variation. Gayunpaman, ang masyadong maliit na halaga ng sigma ay nag-iisip tungkol sa isang artipisyal na pagpili ng mga obserbasyon. Sa isang napakalaking sigma, ang arithmetic mean ay nagpapakilala sa serye ng variation sa isang mas mababang lawak, na nagpapahiwatig ng makabuluhang pagkakaiba-iba ng katangian o phenomenon na pinag-aaralan o ang heterogeneity ng pangkat na pinag-aaralan. Gayunpaman, ang paghahambing ng halaga ng standard deviation ay posible lamang para sa mga feature ng parehong dimensyon. Sa katunayan, kung ihahambing natin ang pagkakaiba-iba ng mga timbang ng mga bagong panganak na bata at matatanda, palagi tayong makakakuha ng mas mataas na mga halaga ng sigma sa mga matatanda.

Ang paghahambing ng pagkakaiba-iba ng mga tampok ng iba't ibang dimensyon ay maaaring gawin gamit ang koepisyent ng pagkakaiba-iba. Ito ay nagpapahayag ng pagkakaiba-iba bilang isang porsyento ng mean, na nagpapahintulot sa mga paghahambing sa pagitan ng iba't ibang mga katangian. Ang koepisyent ng pagkakaiba-iba sa medikal na literatura ay ipinahiwatig ng tanda na " SA ", at sa matematika " v"at kinakalkula ng formula:

.

Ang mga halaga ng koepisyent ng pagkakaiba-iba na mas mababa sa 10% ay nagpapahiwatig ng maliit na scattering, mula 10 hanggang 20% ​​- tungkol sa average, higit sa 20% - tungkol sa malakas na scattering sa paligid ng arithmetic mean.

Ang arithmetic mean ay karaniwang kinakalkula batay sa data mula sa isang sample na populasyon. Sa paulit-ulit na pag-aaral, sa ilalim ng impluwensya ng mga random na phenomena, maaaring magbago ang arithmetic mean. Ito ay dahil sa ang katunayan na, bilang isang panuntunan, bahagi lamang ng posibleng mga yunit ng pagmamasid ang pinag-aralan, iyon ay, ang sample na populasyon. Ang impormasyon tungkol sa lahat ng posibleng mga yunit na kumakatawan sa kababalaghang pinag-aaralan ay maaaring makuha sa pamamagitan ng pag-aaral ng kabuuan populasyon, na hindi laging posible. Kasabay nito, para sa layunin ng pag-generalize ng pang-eksperimentong data, ang halaga ng average sa pangkalahatang populasyon ay interesado. Samakatuwid, upang makabuo ng isang pangkalahatang konklusyon tungkol sa hindi pangkaraniwang bagay na pinag-aaralan, ang mga resulta na nakuha batay sa sample na populasyon ay dapat ilipat sa pangkalahatang populasyon gamit ang mga istatistikal na pamamaraan.

Upang matukoy ang antas ng kasunduan sa pagitan ng isang sample na pag-aaral at ng pangkalahatang populasyon, ito ay kinakailangan upang tantiyahin ang laki ng error na hindi maaaring hindi arises sa panahon ng sample na pagmamasid. Ang error na ito ay tinatawag na " Ang pagkakamali ng pagiging kinatawan"o "Average na error ng arithmetic mean." Ito talaga ang pagkakaiba sa pagitan ng mga average na nakuha mula sa sample istatistikal na pagmamasid, at mga katulad na halaga na makukuha sa patuloy na pag-aaral ng parehong bagay, i.e. kapag nag-aaral ng pangkalahatang populasyon. Dahil ang sample mean ay isang random na variable, ang naturang pagtataya ay isinasagawa na may antas ng posibilidad na katanggap-tanggap sa mananaliksik. SA medikal na pananaliksik ito ay hindi bababa sa 95%.

Ang error sa pagiging representatibo ay hindi maaaring malito sa mga error sa pagpaparehistro o mga error sa atensyon (mga slip, maling kalkulasyon, typo, atbp.), na dapat mabawasan ng sapat na mga pamamaraan at tool na ginamit sa panahon ng eksperimento.

Ang laki ng error sa pagiging representatibo ay depende sa laki ng sample at sa pagkakaiba-iba ng katangian. Paano mas malaking bilang obserbasyon, mas malapit ang sample sa populasyon at mas maliit ang error. Kung mas maraming variable ang sign, mas malaki ang statistical error.

Sa pagsasagawa, upang matukoy ang error sa pagiging kinatawan sa serye ng variation, ginagamit ang sumusunod na formula:

,

saan: m - pagkakamali ng pagiging kinatawan;

σ - karaniwang lihis;

n– bilang ng mga obserbasyon sa sample.

Mula sa formula ay malinaw na ang laki average na error ay direktang proporsyonal sa karaniwang paglihis, ibig sabihin, ang pagkakaiba-iba ng katangiang pinag-aaralan, at inversely proportional sa square root ng bilang ng mga obserbasyon.

Kapag nagsasagawa ng pagsusuri sa istatistika batay sa pagkalkula ng mga kamag-anak na halaga, hindi kinakailangan ang pagbuo ng serye ng variation. Sa kasong ito, ang pagpapasiya ng average na error para sa mga kamag-anak na tagapagpahiwatig ay maaaring isagawa gamit ang isang pinasimple na formula:

,

saan: R– ang halaga ng kamag-anak na tagapagpahiwatig, na ipinahayag bilang isang porsyento, ppm, atbp.;

q– ang kapalit ng P at ipinahayag bilang (1-P), (100-P), (1000-P), atbp., depende sa batayan kung saan kinakalkula ang indicator;

n– bilang ng mga obserbasyon sa sample na populasyon.

Gayunpaman, ang tinukoy na pormula para sa pagkalkula ng error sa pagiging kinatawan para sa mga kamag-anak na halaga ay maaari lamang mailapat kapag ang halaga ng tagapagpahiwatig ay mas mababa kaysa sa base nito. Sa isang bilang ng mga kaso ng pagkalkula ng masinsinang tagapagpahiwatig, ang kundisyong ito ay hindi natutugunan, at ang tagapagpahiwatig ay maaaring ipahayag bilang isang bilang na higit sa 100% o 1000%. Sa ganoong sitwasyon, ang isang serye ng pagkakaiba-iba ay itinayo at ang error sa pagiging kinatawan ay kinakalkula gamit ang formula para sa mga average na halaga batay sa karaniwang paglihis.

Ang pagtataya ng halaga ng arithmetic mean sa populasyon ay isinasagawa sa pamamagitan ng pagtukoy ng dalawang halaga – ang minimum at maximum. Ang mga matinding halaga na ito posibleng mga paglihis, kung saan maaaring magbago ang nais na average na halaga ng populasyon ay tinatawag na “ Mga hangganan ng tiwala».

Ang mga postulates ng probability theory ay napatunayan na sa isang normal na pamamahagi ng isang katangian na may posibilidad na 99.7%, ang matinding mga halaga ng mga deviations ng average ay hindi lalampas sa halaga ng triple ang representasyon ng error ( M ± 3 m ); sa 95.5% – hindi hihigit sa dalawang beses ang average na error ng average na halaga ( M ± 2 m ); sa 68.3% – hindi hihigit sa isang karaniwang error ( M ± 1 m ) (Larawan 9).

P%

kanin. 9. Probability density ng normal distribution.

Tandaan na ang pahayag sa itaas ay totoo lamang para sa isang tampok na sumusunod sa normal na batas ng pamamahagi ng Gaussian.

Karamihan eksperimental na pananaliksik, kabilang sa larangan ng medisina, ay nauugnay sa mga sukat, ang mga resulta nito ay maaaring tumagal ng halos anumang halaga sa isang naibigay na agwat, samakatuwid, bilang panuntunan, ang mga ito ay inilarawan ng isang modelo ng tuluy-tuloy na mga random na variable. Sa pagsasaalang-alang na ito, ang karamihan sa mga istatistikal na pamamaraan ay isinasaalang-alang ang patuloy na pamamahagi. Isa sa mga distribusyon na ito, na may pangunahing papel sa mga istatistika ng matematika, ay normal, o Gaussian, distribusyon.

Ito ay dahil sa maraming dahilan.

1. Una sa lahat, maraming mga eksperimentong obserbasyon ang maaaring matagumpay na mailarawan gamit ang normal na distribusyon. Dapat pansinin kaagad na walang mga distribusyon ng empirical data na magiging eksaktong normal, dahil ang isang normal na ipinamamahagi random na halaga ay nasa hanay mula hanggang , na hindi kailanman nangyayari sa pagsasanay. Gayunpaman, ang normal na pamamahagi ay madalas na gumagana nang maayos bilang isang pagtatantya.

Kung ang mga sukat ng timbang, taas at iba pang mga physiological parameter ng katawan ng tao ay isinasagawa - kahit saan ang mga resulta ay naiimpluwensyahan ng isang napakalaking bilang ng mga random na kadahilanan ( natural na dahilan at mga error sa pagsukat). Bukod dito, bilang isang patakaran, ang epekto ng bawat isa sa mga salik na ito ay hindi gaanong mahalaga. Ipinapakita ng karanasan na ang mga resulta sa mga ganitong kaso ay halos normal na maipamahagi.

2. Nagiging normal ang maraming distribusyon na nauugnay sa random sampling habang tumataas ang volume ng huli.

3. Ang normal na distribusyon ay angkop na angkop bilang pagtatantya ng iba pang tuluy-tuloy na distribusyon (halimbawa, skewed).

4. Ang normal na distribusyon ay may bilang na paborable mga katangian ng matematika, na higit na nagbigay nito malawak na aplikasyon sa mga istatistika.

Kasabay nito, dapat tandaan na sa medikal na data mayroong maraming mga eksperimentong pamamahagi na hindi maaaring inilarawan ng isang normal na modelo ng pamamahagi. Para sa layuning ito, bumuo ang mga istatistika ng mga pamamaraan na karaniwang tinatawag na "Nonparametric".

Ang pagpili ng isang istatistikal na paraan na angkop para sa pagproseso ng data mula sa isang partikular na eksperimento ay dapat gawin depende sa kung ang nakuhang data ay kabilang sa normal na batas sa pamamahagi. Ang pagsubok sa hypothesis para sa subordination ng isang sign sa normal na batas sa pamamahagi ay isinasagawa gamit ang isang frequency distribution histogram (graph), pati na rin ang isang bilang ng mga istatistikal na pamantayan. Sa kanila:

Asymmetry criterion ( b );

Pamantayan para sa pagsusuri para sa kurtosis ( g );

Pagsusulit ng Shapiro-Wilks ( W ) .

Ang isang pagsusuri sa likas na katangian ng pamamahagi ng data (tinatawag ding pagsubok para sa normalidad ng distribusyon) ay isinasagawa para sa bawat parameter. Upang kumpiyansa na hatulan kung ang pamamahagi ng isang parameter ay tumutugma sa normal na batas, isang sapat na malaking bilang ng mga yunit ng pagmamasid (hindi bababa sa 30 mga halaga) ay kinakailangan.

Para sa isang normal na distribusyon, ang skewness at kurtosis na pamantayan ay kumukuha ng halaga na 0. Kung ang distribusyon ay inilipat sa kanan b > 0 (positibong kawalaan ng simetrya), na may b < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона g =0. Sa g > 0 ang distribution curve ay mas matalas kung g < 0 пик более сглаженный, чем функция нормального распределения.

Upang suriin ang normalidad gamit ang Shapiro–Wilks test, kailangan mong hanapin ang halaga ng pamantayang ito gamit ang mga istatistikal na talahanayan sa kinakailangang antas kahalagahan at depende sa bilang ng mga yunit ng pagmamasid (degrees of freedom). Appendix 1. Ang normality hypothesis ay tinatanggihan sa maliliit na halaga ng pamantayang ito, bilang panuntunan, sa w <0,8.



Bago sa site

>

Pinaka sikat