Bahay Mga gilagid Serye ng pamamahagi. Buod ng istatistika at pagpapangkat

Serye ng pamamahagi. Buod ng istatistika at pagpapangkat

Ang pinakamahalagang bahagi ng istatistikal na pagsusuri ay ang pagbuo ng serye ng pamamahagi (structural grouping) upang i-highlight ang mga katangian at pattern ng populasyon na pinag-aaralan. Depende sa kung aling tampok (quantitative o qualitative) ang kinuha bilang batayan para sa pagpapangkat ng data, ang mga uri ng serye ng pamamahagi ay nakikilala nang naaayon.

Kung ang isang kalidad na katangian ay kinuha bilang batayan para sa pagpapangkat, kung gayon ang naturang serye ng pamamahagi ay tinatawag katangian(pamamahagi ayon sa uri ng paggawa, ayon sa kasarian, ayon sa propesyon, ayon sa relihiyon, nasyonalidad, atbp.).

Kung ang isang serye ng pamamahagi ay itinayo sa isang dami na batayan, kung gayon ang naturang serye ay tinatawag pagkakaiba-iba. Upang makabuo ng isang serye ng pagkakaiba-iba ay nangangahulugan na ayusin ang dami ng pamamahagi ng mga yunit ng populasyon sa pamamagitan ng mga katangiang halaga, at pagkatapos ay bilangin ang bilang ng mga yunit ng populasyon na may mga halagang ito (bumuo ng isang talahanayan ng pangkat).

May tatlong anyo ng serye ng variation: serye ng ranggo, serye ng discrete at serye ng interval.

Serye ng ranggo- ito ang distribusyon ng mga indibidwal na yunit ng populasyon sa pataas o pababang ayos ng katangiang pinag-aaralan. Binibigyang-daan ka ng pagraranggo na madaling hatiin ang dami ng data sa mga pangkat, agad na makita ang pinakamaliit at pinakamataas na halaga katangian, i-highlight ang mga halaga na madalas na paulit-ulit.

Ang iba pang mga anyo ng serye ng pagkakaiba-iba ay mga talahanayan ng pangkat na pinagsama-sama ayon sa likas na katangian ng pagkakaiba-iba sa mga halaga ng katangian na pinag-aaralan. Ayon sa likas na katangian ng pagkakaiba-iba, ang discrete (discontinuous) at tuloy-tuloy na mga katangian ay nakikilala.

Discrete na serye- ito ay isang serye ng pagkakaiba-iba, ang pagbuo ng kung saan ay batay sa mga katangian na may hindi tuloy-tuloy na pagbabago (discrete na mga katangian). Kasama sa huli ang kategorya ng taripa, ang bilang ng mga bata sa pamilya, ang bilang ng mga empleyado sa negosyo, atbp. Ang mga tampok na ito ay maaari lamang tumagal ng isang tiyak na bilang ng mga partikular na halaga.

Ang isang discrete variation series ay kumakatawan sa isang table na binubuo ng dalawang column. Ang unang column ay nagpapahiwatig ng partikular na halaga ng attribute, at ang pangalawang column ay nagpapahiwatig ng bilang ng mga unit sa populasyon na may partikular na halaga ng attribute.

Kung ang isang katangian ay may tuluy-tuloy na pagbabago (halaga ng kita, haba ng serbisyo, halaga ng mga nakapirming assets ng negosyo, atbp., na sa loob ng ilang mga limitasyon ay maaaring tumagal sa anumang mga halaga), kung gayon para sa katangiang ito kinakailangan na bumuo serye ng pagkakaiba-iba ng pagitan.

Ang talahanayan ng pangkat dito ay mayroon ding dalawang column. Ang una ay nagpapahiwatig ng halaga ng katangian sa pagitan ng "mula - hanggang" (mga opsyon), ang pangalawa ay nagpapahiwatig ng bilang ng mga yunit na kasama sa pagitan (dalas).

Dalas (dalas ng pag-uulit) - ang bilang ng mga pag-uulit ng isang partikular na variant ng mga halaga ng katangian, ay tinutukoy na fi, at ang kabuuan ng mga frequency na katumbas ng dami ng populasyon na pinag-aaralan ay tinutukoy

kung saan ang k ay ang bilang ng mga opsyon para sa mga halaga ng katangian

Kadalasan, ang talahanayan ay pupunan ng isang haligi kung saan kinakalkula ang mga naipon na frequency S, na nagpapakita kung gaano karaming mga yunit sa populasyon ang may katangiang halaga na hindi hihigit sa halagang ito.

Ang mga frequency ng f series ay maaaring palitan ng mga frequency w, na ipinahayag sa mga relatibong numero (fraction o porsyento). Kinakatawan nila ang ratio ng mga frequency ng bawat pagitan sa kanilang kabuuang halaga, ibig sabihin.:

Kapag nagtatayo ng isang serye ng pagkakaiba-iba na may mga halaga ng agwat, una sa lahat ay kinakailangan upang maitaguyod ang halaga ng agwat i, na tinukoy bilang ang ratio ng saklaw ng pagkakaiba-iba R sa bilang ng mga pangkat m:

kung saan R = xmax - xmin; m = 1 + 3.322 logn (Sturgess formula); n ay ang kabuuang bilang ng mga yunit sa populasyon.

Upang matukoy ang istraktura ng isang populasyon, ginagamit ang mga espesyal na average na tagapagpahiwatig, na kinabibilangan ng median at mode, o ang tinatawag na structural average. Kung ang arithmetic mean ay kinakalkula batay sa paggamit ng lahat ng variant ng attribute values, ang median at mode ay naglalarawan ng value ng variant na sumasakop sa isang partikular na average na posisyon sa ranking. serye ng pagkakaiba-iba.

Median (Ako)- ito ang value na tumutugma sa opsyong matatagpuan sa gitna ng ranggo na serye.

Para sa isang ranggo na serye na may kakaibang bilang ng mga indibidwal na halaga (halimbawa, 1, 2, 3, 3, 6, 7, 9, 9, 10), ang median ay ang halaga na matatagpuan sa gitna ng serye, i.e. ikalimang magnitude.

Para sa isang ranggo na serye na may pantay na bilang ng mga indibidwal na halaga (halimbawa, 1, 5, 7, 10, 11, 14), ang median ay ang arithmetic mean na halaga, na kinakalkula mula sa dalawang magkatabing halaga.

Iyon ay, upang mahanap ang median, kailangan mo munang matukoy ito serial number(posisyon nito sa ranggo na serye) ayon sa formula

kung saan ang n ay ang bilang ng mga yunit sa pinagsama-samang.

Ang numerical value ng median ay tinutukoy mula sa mga naipon na frequency sa isang discrete variation series. Upang gawin ito, kailangan mo munang ipahiwatig ang pagitan kung saan matatagpuan ang median sa serye ng pagitan ng pamamahagi. Ang median ay ang unang agwat kung saan ang kabuuan ng mga naipon na frequency ay lumampas sa kalahati ng mga obserbasyon mula sa kabuuang bilang ng lahat ng mga obserbasyon.

Numerical na halaga ng median

kung saan ang xMe ay ang mas mababang limitasyon ng median interval; i - halaga ng pagitan; Ang S-1 ay ang naipon na dalas ng pagitan na nauuna sa median; f ay ang dalas ng median na pagitan.

Fashion (Mo) Tinatawag nila ang halaga ng isang katangian na kadalasang nangyayari sa mga yunit ng populasyon. Para sa isang discrete series, ang mode ang magiging opsyon na may pinakamataas na frequency. Upang matukoy ang fashion serye ng pagitan Una, tinutukoy ang modal interval (ang interval na may pinakamataas na frequency). Pagkatapos, sa loob ng agwat na ito, makikita ang halaga ng tampok, na maaaring maging isang mode.

Upang makahanap ng isang partikular na halaga ng mode, kailangan mong gamitin ang formula

kung saan ang xMo ay ang mas mababang limitasyon ng modal interval; Ang iMo ay ang halaga ng modal interval; fMo - dalas ng modal interval; fMo-1 - dalas ng agwat bago ang modal isa; fMo+1 - dalas ng interval kasunod ng modal one.

Laganap ang fashion sa mga aktibidad sa marketing kapag pinag-aaralan ang demand ng consumer, lalo na kapag tinutukoy ang pinakasikat na laki ng damit at sapatos, at kapag kinokontrol ang mga patakaran sa pagpepresyo.

Ang pangunahing layunin ng pagsusuri ng mga serye ng variation ay upang matukoy ang pattern ng pamamahagi, habang hindi kasama ang impluwensya ng mga random na kadahilanan para sa isang naibigay na pamamahagi. Ito ay maaaring makamit sa pamamagitan ng pagtaas ng dami ng populasyon na pinag-aaralan at sabay-sabay na pagbabawas ng pagitan ng serye. Kapag sinubukan naming ilarawan ang data na ito nang grapiko, makakakuha kami ng ilang makinis na hubog na linya, na magiging isang tiyak na limitasyon para sa frequency polygon. Ang linyang ito ay tinatawag na distribution curve.

Sa ibang salita, kurba ng pamamahagi mayroong isang graphical na representasyon sa anyo ng isang tuloy-tuloy na linya ng mga pagbabago sa dalas sa isang serye ng variation, na gumaganang nauugnay sa pagbabago sa opsyon. Ang kurba ng pamamahagi ay sumasalamin sa pattern ng mga pagbabago sa dalas sa kawalan ng mga random na kadahilanan. Pinapadali ng graphical na representasyon ang pagsusuri ng serye ng pamamahagi.

Medyo ilang anyo ng distribution curves ang kilala, kung saan maaaring ihanay ang isang variation series, ngunit sa pagsasagawa ng statistical research, ang pinakakaraniwang ginagamit na form ay ang normal na distribution at ang Poisson distribution.

Ang normal na distribusyon ay nakasalalay sa dalawang parameter: ang arithmetic mean at ang standard deviation. Ang curve nito ay ipinahayag ng equation

kung saan ang y ay ang ordinate ng normal na distribution curve; - standardized deviations; e at π ay mathematical constants; x - mga variant ng serye ng variation; - ang kanilang average na halaga; - karaniwang lihis.

Kung kailangan mong makakuha ng mga teoretikal na frequency f" kapag inihanay ang serye ng variation sa normal na curve ng distribution, maaari mong gamitin ang formula

saan ang kabuuan ng lahat ng empirical frequency ng variation series; h - ang laki ng pagitan sa mga pangkat; - karaniwang lihis; - normalized deviation ng mga opsyon mula sa arithmetic mean; lahat ng iba pang dami ay madaling kalkulahin gamit ang mga espesyal na talahanayan.

Gamit ang formula na ito nakukuha namin teoretikal (probability) distribution, pinapalitan sila empirikal (aktwal) na pamamahagi, hindi sila dapat magkaiba ng karakter sa isa't isa.

Gayunpaman, sa ilang mga kaso, kung ang serye ng pagkakaiba-iba ay isang pamamahagi ayon sa isang discrete na katangian, kung saan habang ang mga halaga ng katangian na x ay tumataas, ang mga frequency ay nagsisimulang bumaba nang husto, at ang arithmetic mean, naman, ay pantay. sa o malapit sa halaga sa dispersion (), ang naturang serye ay nakahanay sa pamamagitan ng Poisson curve.

Poisson curve maaaring ipahayag ng kaugnayan

kung saan ang Px ay ang posibilidad ng paglitaw ng mga indibidwal na halaga ng x; - arithmetic mean ng serye.

Kapag pinapantayan ang empirical data, ang teoretikal na frequency ay maaaring matukoy ng formula

kung saan ang f" ay theoretical frequency; N ang kabuuang bilang ng mga unit ng serye.

Ang paghahambing ng mga nakuha na halaga ng mga teoretikal na frequency f" sa empirical (aktwal) na mga frequency f, kami ay kumbinsido na ang kanilang mga pagkakaiba ay maaaring napakaliit.

Ang isang layunin na katangian ng pagsusulatan sa pagitan ng teoretikal at empirical na mga frequency ay maaaring makuha gamit ang mga espesyal na istatistikal na tagapagpahiwatig, na tinatawag na pamantayan ng kasunduan.

Upang masuri ang kalapitan ng mga empirical at teoretikal na frequency, ang Pearson goodness-of-fit test, Romanovsky goodness-of-fit test, at Kolmogorov goodness-of-fit test ay ginagamit.

Ang pinakakaraniwan ay K. Pearson's goodness-of-fit test, na maaaring kinakatawan bilang kabuuan ng mga ratio ng mga squared na pagkakaiba sa pagitan ng f" at f sa mga teoretikal na frequency:

Ang kinakalkula na halaga ng criterion ay dapat ikumpara sa naka-tabulate (kritikal) na halaga. Halaga ng talahanayan tinutukoy ng isang espesyal na talahanayan, depende ito sa tinatanggap na probabilidad P at ang bilang ng mga antas ng kalayaan k (sa kasong ito k = m - 3, kung saan ang m ay ang bilang ng mga grupo sa serye ng pamamahagi para sa normal na pamamahagi). Kapag kinakalkula ang Pearson goodness-of-fit test, ang mga sumusunod ay dapat sundin: susunod na kondisyon: ang bilang ng mga obserbasyon ay dapat sapat na malaki (n 50), at kung sa ilang mga pagitan ay ang mga teoretikal na frequency< 5, то интервалы объединяют для условия > 5.

Kung , kung gayon ang mga pagkakaiba sa pagitan ng empirical at theoretical frequency distribution ay maaaring random at ang pagpapalagay na ang empirical distribution ay malapit sa normal ay hindi maaaring tanggihan.

Kung sakaling walang mga talahanayan para sa pagtatasa ng randomness ng pagkakaiba sa pagitan ng teoretikal at empirical na mga frequency, maaari mong gamitin pamantayan ng kasunduan V.I. Romanovsky Si KR, na, gamit ang value, ay nagmungkahi na suriin ang lapit ng empirical distribution ng normal distribution curve gamit ang ratio

kung saan ang m ay ang bilang ng mga pangkat; k = (m - 3) - ang bilang ng mga antas ng kalayaan kapag kinakalkula ang mga frequency ng isang normal na distribusyon.

Kung ang kaugnayan sa itaas< 3, то расхождения эмпирических и теоретических частот можно считать случайными, а эмпирическое распределение - соответствующим нормальному. Если отношение >3, kung gayon ang mga pagkakaiba ay maaaring maging lubos na makabuluhan at ang hypothesis tungkol sa normal na pamamahagi dapat tanggihan.

Pamantayan ng kasunduan A.N. Kolmogorov ginagamit sa pagtukoy ng maximum na pagkakaiba sa pagitan ng mga frequency ng empirical at theoretical distribution, na kinakalkula ng formula

kung saan ang D ay ang pinakamataas na halaga ng pagkakaiba sa pagitan ng naipon na empirical at theoretical frequency; - kabuuan ng mga empirical frequency.

Gamit ang mga talahanayan ng mga halaga ng posibilidad, ang pamantayan ay maaaring gamitin upang mahanap ang halaga na tumutugma sa posibilidad na P. Kung ang halaga ng posibilidad na P ay makabuluhan kaugnay sa nahanap na halaga, maaari nating ipagpalagay na ang mga pagkakaiba sa pagitan ng teoretikal at empirikal na mga distribusyon ay hindi gaanong mahalaga.

Ang isang kinakailangang kondisyon kapag ginagamit ang pamantayan ng goodness-of-fit ng Kolmogorov ay isang sapat na malaking bilang ng mga obserbasyon (hindi bababa sa isang daan).

istatistika ng produksyon ng patatas

Batay sa mga indicator sa Talahanayan 2, pinagsama-sama namin ang mga ranggo na hanay para sa produksyon ng patatas sa bawat 100 ektarya ng lupang taniman; sa pamamagitan ng ani ng patatas; sa halaga. Inilalarawan namin ang ugnayan sa pagitan ng mga tagapagpahiwatig na ito nang grapiko.

Ang unang yugto istatistikal na pag-aaral Ang mga pagkakaiba-iba ay ang pagbuo ng isang serye ng pagkakaiba-iba - isang nakaayos na pamamahagi ng mga yunit ng populasyon ayon sa pagtaas (mas madalas) o pagbaba (mas madalas) na mga halaga ng isang katangian.

Mayroong tatlong anyo ng serye ng variation: serye ng ranggo, discrete na serye, serye ng interval. Ang isang serye ng variation ay madalas na tinatawag na isang serye ng pamamahagi.

Ang isang ranggo na serye ay isang listahan ng mga indibidwal na yunit ng isang populasyon sa pataas (pababang) pagkakasunud-sunod ng katangiang pinag-aaralan.

Ang pagraranggo ay isang pamamaraan para sa pag-aayos ng mga bagay ng pag-aaral, na ginagawa batay sa kagustuhan. Ipinapakita ng hanay ng variation kung gaano kalaki ang pagkakaiba sa pagitan ng mga yunit sa populasyon.

Ang ranggo ay isang serial number ng mga value ng attribute, na nakaayos sa pataas o pababang pagkakasunud-sunod ng mga value ng mga ito. Kung ang halaga ng isang katangian ay may parehong quantitative assessment, kung gayon ang ranggo ng lahat ng mga halagang ito ay itinuturing na katumbas ng arithmetic mean ng mga kaukulang bilang ng mga lugar na tinutukoy. Ang mga ranggo na ito ay tinatawag na konektado.

Ang mga graph sa mga istatistika ay isang paraan ng biswal na paglalarawan ng mga istatistikal na tagapagpahiwatig sa anyo mga geometric na hugis at mga palatandaan, mga guhit o mga mapa ng eskematiko. Ang isang visual na imahe ay nagpapadali sa pang-unawa ng impormasyon, nagbibigay-daan sa iyo upang makuha ang isang hanay ng mga tagapagpahiwatig sa pagkakaugnay, kilalanin ang mga uso sa pag-unlad at karaniwang mga ratio ng mga tagapagpahiwatig.

Upang magpakita ng mga dynamics indicator, ipinapayong gumamit ng mga line graph o bar chart. Ang iskedyul ay dapat na nakikita, naiintindihan, madaling basahin at, kung maaari, artistikong dinisenyo, na makaakit ng pansin dito.

Kapag gumagawa ng mga scatter plot, isang hanay ng mga punto ang ginagamit bilang mga graphic na sample; kapag gumagawa ng mga linear - mga linya. Ang pag-chart ay palaging isang malikhaing proseso. Kinakailangan ang ilang paghahanap dito. Pagkatapos lamang mag-compile at maghambing ng ilang draft na bersyon maaari mong matukoy ang tamang komposisyon ng graph, itakda ang sukat at lokasyon ng mga palatandaan sa field ng graph.

Mula sa ranggo na serye ng produksyon ng patatas sa bawat 100 ektarya ng lupang taniman, maaari nating gawin ang sumusunod na konklusyon na ang pinakamababang produksyon ay sinusunod sa distrito ng Balagansky, at ang distrito ng Angarsky ay may pinakamataas na produktibidad ng patatas sa bawat 100 ektarya ng lupang taniman.

Ang pinakamababang ani ay nasa distrito ng Kachugsky - 10 c/ha, at ang pinakamataas sa Usolsky - 195.5 c/ha.

Sa rehiyon ng Chunsky, na may mataas na produksyon ng patatas sa bawat 100 ektarya ng lupang taniman, ang pinakamababang halaga ng 1 c ay katumbas. Ang pinakamataas na gastos ay sinusunod sa rehiyon ng Nizhne-Ilimsky. Ang saklaw ng pagkakaiba-iba sa presyo ng gastos ng isang daang timbang ng patatas ay napakalaki at katumbas ng 1161.01 rubles.

Iba pang mga publikasyon

Pagsusuri ng aktibidad sa ekonomiya ng negosyo
Ang paglipat sa isang ekonomiya ng merkado ay nangangailangan ng negosyo na dagdagan ang kahusayan sa produksyon, pagiging mapagkumpitensya ng mga produkto at serbisyo batay sa pagpapatupad mabisang anyo pamamahala at pamamahala ng produksyon, mga tagumpay ng siyentipiko at teknolohikal na pag-unlad, pag-activate ng...

Pagsusuri ng mga aktibidad sa pananalapi at pang-ekonomiya ng JSC TransContainer
Ang pagsusuri sa pananalapi ay isang proseso batay sa pag-aaral ng data sa pinansiyal na kalagayan enterprise at ang nakaraang pagganap nito upang masuri ang mga kondisyon at pagganap sa hinaharap. Kaya, ang pangunahing gawain ng pagsusuri sa pananalapi ay...

Ipadala ang iyong mabuting gawa sa base ng kaalaman ay simple. Gamitin ang form sa ibaba

Magaling sa site">

Ang mga mag-aaral, nagtapos na mga estudyante, mga batang siyentipiko na gumagamit ng base ng kaalaman sa kanilang pag-aaral at trabaho ay lubos na magpapasalamat sa iyo.

Nai-post sa http:// www. allbest. ru/

Gawain Blg. 1

Batay sa datos istatistikal na pagmamasid ibinigay sa talahanayan, bumuo ng ranggo, pagitan at pinagsama-samang serye ng pamamahagi ng mga negosyong pang-agrikultura ayon sa mga katangian ng salik, at ilarawan ang mga ito nang grapiko.

Magsagawa ng buod ng data. Gamit ang paraan ng pagpapangkat, tukuyin ang pag-asa ng epektibong katangian sa mga negosyong pang-agrikultura sa salik na isa. Bumuo ng mga talahanayan at mga graph ng pagtitiwala. Konklusyon.

salik ng pamamahagi ng serye ng pagpapangkat

Kalidad ng lupa, puntos (x)

(y)

Solusyon:

Konstruksyonniraranggohilera ipinapalagay ng pamamahagi ang pagsasaayos ng lahat ng variant ng serye sa pagtaas ng pagkakasunud-sunod ng katangiang pinag-aaralan (kalidad ng lupa). Ang pag-uuri ay isinagawa sa programa ng TP Excel gamit ang function na "Pag-uuri".

Kalidad ng lupa

Produktibo ng mga gulay na bukas sa lupa

Graphic na representasyon ng ranggo na serye ng pamamahagi

Ang linya sa Fig. 1 ay tinatawag na ogive ni Galton. Ang ogive na ito ay may posibilidad na lumago nang maayos na may maliliit na pagtalon sa ilang mga punto. Upang i-convert ang isang ranggo na serye sa isang serye ng pagitan, mas mainam na hatiin ito sa mga pangkat nang manu-mano.

Konstruksyonpagitanhilera Ang pamamahagi ng mga negosyo ayon sa mga katangiang pinag-aaralan ay nagsasangkot ng pagtukoy sa bilang ng mga grupo (mga agwat).

Upang kalkulahin ang bilang ng mga pangkat, ginagamit namin ang formula:

n=2, kung saan ang N ay ang kabuuang bilang ng mga yunit ng populasyon na pinag-aaralan.

n=2 Ig30 = 2.95424251?3.

Ang halaga ng pantay na pagitan ay kinakalkula gamit ang formula:

i = = = 16.33333

Pinagsama-samahilera- ito ay isang serye kung saan kinakalkula ang mga naipon na frequency. Ipinapakita nito kung gaano karaming mga yunit ng populasyon ang may katangiang halaga na hindi hihigit sa halagang ito, at kinakalkula sa pamamagitan ng sunud-sunod na pagdaragdag ng mga frequency ng mga kasunod na agwat sa dalas ng unang agwat.

Interval at pinagsama-samang serye

dalas- bilang ng mga negosyo sa pangkat;

Tukoy timbang mga negosyo V pangkat- natagpuan ng formula:

(numeromga negosyoVpangkat*100%)/m, kung saan ang m ay ang bilang ng pang-eksperimentong data;

Naipon dalas- natagpuan ng formula: numeromga negosyoVdatipangkat+dalasbinigaymga pangkat.

Histogram ng dalas

Mga pinagsama-samang pamamahagi ng kalidad ng lupa

Mga tagapagpahiwatig ng buod

Numero ng pangkat

Bilang ng mga kumpanya sa pangkat

Produktibo ng mga gulay na bukas sa lupa (kabuuan ayon sa pangkat)

Kalidad ng lupa (kabuuan ayon sa pangkat)

II 61.33333-77.33333

III 77.33333-94.1

Average na Mga Katangian ng Grupo

Pangkat Blg.

Produktibo ng mga gulay na bukas sa lupa

Kalidad ng lupa

II 61.33333-77.33333

III 77.33333-94.1

Sa karaniwan

kung saan, matatagpuan ang column na "bunga ng gulay" ayon sa formula: UUi(Vpangkat) / numeromga negosyoVpangkat;

ang hanay na "Kalidad ng lupa" ay matatagpuan gamit ang formula: UXi(Vpangkat)/numeromga negosyoVpangkat.

Ang pag-asa ng ani ng mga gulay na bukas sa lupa sa kalidad ng lupa.

Sa halimbawang isinasaalang-alang, maaari nating tapusin: sa pagtaas ng kalidad ng lupa, ang ani ng mga gulay na bukas sa lupa ay tumataas, samakatuwid, maaari nating ipagpalagay na mayroong direktang koneksyon sa pagitan ng mga parameter na isinasaalang-alang.

Nai-post sa Allbest.ru

Mga katulad na dokumento

    Analytical grouping ayon sa kadahilanan na batayan. Pagbuo ng variational frequency at cumulative distribution series batay sa equal-interval structural grouping ng mabisang attribute - mga dibidendo na naipon batay sa mga resulta ng performance.

    pagsubok, idinagdag noong 05/07/2009

    Mga pangunahing tagapagpahiwatig ng populasyon at pamamahagi nito sa rehiyon ng Kaluga. Pagbuo ng serye ng pamamahagi ng ranggo at pagitan batay sa isang katangian ng salik sa pagpapangkat. Pagsusuri ng mga tipikal na grupo batay sa mga average na indicator ng populasyon.

    course work, idinagdag noong 10/11/2010

    Konstruksyon gamit ang formula ng Sturgess. Konstruksyon ng serye ng pamamahagi na may mga arbitrary na pagitan. Pagbuo ng serye ng pamamahagi gamit ang standard deviation. Pag-uuri ng serye ng pamamahagi. Pagkalkula ng mga pangunahing katangian ng pagkakaiba-iba.

    course work, idinagdag noong 11/22/2013

    Pagsusuri, pagkalkula at pagbuo ng inisyal serye ng oras feature-function at feature-factor. Pagkalkula ng mga tagapagpahiwatig ng pagkakaiba-iba ng serye ng oras. Quantitative measurement ng closeness ng relasyon sa pagitan ng trait-function at trait-factor gamit ang pair correlation method.

    course work, idinagdag 09/24/2014

    Pagtatasa ng isang populasyon para sa homogeneity nito. Konstruksyon ng ranggo at pagitan ng serye ng pamamahagi. Pagsusuri ng time series gamit ang mga paraan ng pagpapalaki ng mga pagitan at paglipat ng mga average, analytical alignment gamit ang equation ng isang tuwid na linya at isang parabola.

    course work, idinagdag 09/10/2014

    Pagkalkula ng average na marka ng akademiko batay sa mga resulta ng session, pagpapasiya ng tagapagpahiwatig ng mga pagkakaiba-iba sa antas ng kaalaman at ang istraktura ng bilang ng mga mag-aaral sa pamamagitan ng akademikong pagganap. Konstruksyon ng isang serye ng pagitan ng pamamahagi ng mga negosyo. Pagtataya ng mga coefficient ng ugnayan.

    pagsubok, idinagdag noong 08/21/2009

    Konsepto at uri istatistikal na pagpapangkat, na isinagawa sa layuning magtatag ng mga istatistikal na relasyon at pattern, pagtukoy sa istruktura ng populasyon na pinag-aaralan. Ang pagtatayo ng isang serye ng pagitan ng pamamahagi ng mga negosyo batay sa katangiang "lugar ng pagbebenta".

    thesis, idinagdag noong 02/14/2016

    Pangunahing kategorya ng mga istatistika. Ang pagpapangkat ay ang batayan ng siyentipikong pagproseso ng mga istatistikal na datos. Buod ng nilalaman at pinagsama-samang istatistika. Konstruksyon ng variational, ranggo at discrete na serye mga pamamahagi. Pagpapangkat ng mga negosyo ayon sa bilang ng mga manggagawa.

    pagsubok, idinagdag noong 03/17/2015

    Pagkalkula ng absolute, relative, average values, regression at elasticity coefficients, variation indicators, dispersion, construction at analysis ng distribution series. Mga katangian ng analytical alignment ng chain at basic dynamics series.

    course work, idinagdag 05/20/2010

    Pagsasagawa ng isang eksperimental istatistikal na pananaliksik socio-economic phenomena at proseso ng rehiyon ng Smolensk batay sa tinukoy na mga tagapagpahiwatig. Pagbuo ng mga istatistikal na graph, serye ng pamamahagi, serye ng pagkakaiba-iba, ang kanilang paglalahat at pagsusuri.

Ang mga ito ay ipinakita sa anyo ng serye ng pamamahagi at ipinakita sa anyo.

Ang isang serye ng pamamahagi ay isa sa mga uri ng pagpapangkat.

Saklaw ng pamamahagi- kumakatawan sa isang maayos na pamamahagi ng mga yunit ng populasyon na pinag-aaralan sa mga pangkat ayon sa isang tiyak na magkakaibang katangian.

Depende sa katangian na pinagbabatayan ng pagbuo ng serye ng pamamahagi, sila ay nakikilala katangian at pagkakaiba-iba mga hilera ng pamamahagi:

  • Attributive- ay tinatawag na serye ng pamamahagi na binuo ayon sa mga katangian ng husay.
  • Ang mga serye ng pamamahagi na binuo sa pataas o pababang pagkakasunud-sunod ng mga halaga ng isang quantitative na katangian ay tinatawag pagkakaiba-iba.
Ang variation series ng distribution ay binubuo ng dalawang column:

Ang unang hanay ay nagbibigay ng dami ng mga halaga ng iba't ibang katangian, na tinatawag mga pagpipilian at itinalaga. Discrete na opsyon - ipinahayag bilang isang integer. Ang opsyon sa pagitan ay mula sa at hanggang. Depende sa uri ng mga opsyon, maaari kang bumuo ng isang discrete o interval variation series.
Ang ikalawang hanay ay naglalaman ng bilang ng tiyak na opsyon, na ipinahayag sa mga tuntunin ng mga frequency o frequency:

Mga frequency- ito ay mga ganap na numero na nagpapakita kung gaano karaming beses ang isang ibinigay na halaga ng isang katangian ay nangyayari sa pinagsama-samang, na nagsasaad ng . Ang kabuuan ng lahat ng mga frequency ay dapat na katumbas ng bilang ng mga yunit sa buong populasyon.

Mga frequency() ay mga frequency na ipinahayag bilang isang porsyento ng kabuuan. Ang kabuuan ng lahat ng mga frequency na ipinahayag bilang mga porsyento ay dapat na katumbas ng 100% sa mga fraction ng isa.

Graphic na representasyon ng serye ng pamamahagi

Ang serye ng pamamahagi ay biswal na ipinakita gamit ang mga graphical na larawan.

Ang serye ng pamamahagi ay inilalarawan bilang:
  • Polygon
  • Mga histogram
  • Nag-iipon
  • Ogives

Polygon

Kapag gumagawa ng polygon sa pahalang na axis(x axis) ang mga halaga ng iba't ibang katangian ay naka-plot, at sa vertical axis (y axis) ang mga frequency o frequency ay naka-plot.

Ang polygon sa Fig. 6.1 ay batay sa data mula sa micro-census ng populasyon ng Russia noong 1994.

6.1. Pamamahagi ng laki ng sambahayan

Kundisyon: Ang data ay ibinigay sa pamamahagi ng 25 empleyado ng isa sa mga negosyo ayon sa mga kategorya ng taripa:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Gawain: Bumuo ng discrete variation series at ilarawan ito nang grapiko bilang distribution polygon.
Solusyon:
Sa halimbawang ito, ang mga opsyon ay ang grado ng suweldo ng empleyado. Upang matukoy ang mga frequency, kinakailangan upang kalkulahin ang bilang ng mga empleyado na may kaukulang kategorya ng taripa.

Ginagamit ang polygon para sa discrete variation series.

Upang makabuo ng polygon ng pamamahagi (Larawan 1), inilalagay namin ang mga quantitative na halaga ng iba't ibang katangian—mga opsyon—sa abscissa (X) axis, at mga frequency o frequency sa ordinate axis.

Kung ang mga halaga ng isang katangian ay ipinahayag sa anyo ng mga agwat, kung gayon ang naturang serye ay tinatawag na agwat.
Serye ng pagitan ang mga distribusyon ay inilalarawan nang grapiko sa anyo ng isang histogram, cumulate o ogive.

Talahanayan ng istatistika

Kundisyon: Ang data sa laki ng mga deposito ay ibinibigay 20 mga indibidwal sa isang bangko (libong rubles) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Gawain: Bumuo ng serye ng pagkakaiba-iba ng pagitan na may pantay na pagitan.
Solusyon:

  1. Ang paunang populasyon ay binubuo ng 20 yunit (N = 20).
  2. Gamit ang formula ng Sturgess, tinutukoy namin ang kinakailangang bilang ng mga pangkat na ginamit: n=1+3.322*lg20=5
  3. Kalkulahin natin ang halaga ng pantay na pagitan: i=(152 - 2) /5 = 30 thousand rubles
  4. Hatiin natin ang paunang populasyon sa 5 pangkat na may pagitan ng 30 libong rubles.
  5. Ipinakita namin ang mga resulta ng pagpapangkat sa talahanayan:

Sa ganoong pagtatala ng isang tuluy-tuloy na katangian, kapag ang parehong halaga ay nangyayari nang dalawang beses (bilang ang itaas na limitasyon ng isang pagitan at ang mas mababang limitasyon ng isa pang agwat), ang halagang ito ay nabibilang sa pangkat kung saan ang halagang ito ay gumaganap bilang ang pinakamataas na limitasyon.

bar chart

Upang makabuo ng isang histogram, ang mga halaga ng mga hangganan ng mga agwat ay ipinahiwatig sa abscissa axis at, batay sa mga ito, ang mga parihaba ay itinayo, ang taas nito ay proporsyonal sa mga frequency (o mga frequency).

Sa Fig. 6.2. ay nagpapakita ng histogram ng distribusyon ng populasyon ng Russia noong 1997 ayon sa pangkat ng edad.

kanin. 6.2. Pamamahagi ng populasyon ng Russia ayon sa mga pangkat ng edad

Kundisyon: Ang pamamahagi ng 30 empleyado ng kumpanya ayon sa buwanang suweldo ay ibinibigay sahod

Gawain: Ipakita ang graphic na serye ng pagkakaiba-iba ng agwat sa anyo ng isang histogram at i-cumulate.
Solusyon:

  1. Ang hindi kilalang hangganan ng bukas (unang) agwat ay tinutukoy ng halaga ng pangalawang agwat: 7000 - 5000 = 2000 rubles. Sa parehong halaga nakita namin ang mas mababang limitasyon ng unang agwat: 5000 - 2000 = 3000 rubles.
  2. Upang makabuo ng histogram sa isang hugis-parihaba na sistema ng coordinate, inilalagay namin sa kahabaan ng abscissa axis ang mga segment na ang mga halaga ay tumutugma sa mga pagitan ng serye ng varicose.
    Ang mga segment na ito ay nagsisilbing mas mababang base, at ang kaukulang dalas (frequency) ay nagsisilbing taas ng nabuong mga parihaba.
  3. Bumuo tayo ng histogram:

Upang bumuo ng mga cumulates, kinakailangan upang kalkulahin ang mga naipon na frequency (mga frequency). Natutukoy ang mga ito sa pamamagitan ng sunud-sunod na pagbubuod ng mga frequency (frequencies) ng mga naunang agwat at itinalagang S. Ang mga naipon na frequency ay nagpapakita kung gaano karaming mga yunit ng populasyon ang may katangiang halaga na hindi hihigit sa isa na isinasaalang-alang.

Nag-iipon

Ang distribusyon ng isang katangian sa isang serye ng variation sa mga naipon na frequency (mga frequency) ay inilalarawan gamit ang isang cumulate.

Nag-iipon o isang pinagsama-samang kurba, hindi tulad ng isang polygon, ay binuo mula sa mga naipon na frequency o frequency. Sa kasong ito, ang mga halaga ng katangian ay inilalagay sa abscissa axis, at ang mga naipon na frequency o frequency ay inilalagay sa ordinate axis (Fig. 6.3).

kanin. 6.3. Mga pinagsama-samang pamamahagi ng laki ng sambahayan

4. Kalkulahin natin ang mga naipon na frequency:
Ang pinagsama-samang dalas ng unang pagitan ay kinakalkula tulad ng sumusunod: 0 + 4 = 4, para sa pangalawa: 4 + 12 = 16; para sa pangatlo: 4 + 12 + 8 = 24, atbp.

Kapag bumubuo ng isang pinagsama-samang, ang naipon na dalas (dalas) ng kaukulang agwat ay itinalaga sa itaas na limitasyon nito:

Ogiva

Ogiva ay itinayo katulad ng isang pinagsama-samang may pagkakaiba lamang na ang mga naipon na frequency ay inilalagay sa abscissa axis, at ang mga katangiang halaga ay inilalagay sa ordinate axis.

Ang isang uri ng cumulate ay isang concentration curve o Lorentz plot. Upang makabuo ng isang curve ng konsentrasyon, ang isang scale scale sa mga porsyento mula 0 hanggang 100 ay naka-plot sa parehong mga axes ng rectangular coordinate system Kasabay nito, ang mga naipon na frequency ay ipinahiwatig sa abscissa axis, at ang mga naipon na halaga ng bahagi. (sa porsyento) ayon sa dami ng katangian ay ipinahiwatig sa ordinate axis.

Ang pare-parehong pamamahagi ng katangian ay tumutugma sa dayagonal ng parisukat sa graph (Larawan 6.4). Sa hindi pantay na distribusyon, ang graph ay kumakatawan sa isang malukong kurba depende sa antas ng konsentrasyon ng katangian.

6.4. Kurba ng konsentrasyon

Ang konsepto ng buod, pagpapangkat, pag-uuri

Buod– sistematisasyon at pagbubuod: mga ulat ng panahon, mga ulat mula sa mga patlang. Ang buod ay hindi nagpapahintulot sa iyo na pag-aralan ang impormasyon nang detalyado. Ang anumang buod ay dapat na nakabatay sa data grouping, i.e. unang pagpapangkat at pagkatapos ay pagbubuod ng datos.

Pagpapangkat– paghahati ng mga populasyon sa isang bilang ng mga pangkat ayon sa pinakamahalagang katangian.

Mayroong qualitative at quantitative groupings. Mataas na kalidad- katangian, dami– pagkakaiba-iba. Sa turn, ang pagkakaiba-iba ay nahahati sa istruktura at analitikal . Structural ang pagpapangkat ay kinabibilangan ng pagkalkula ng tiyak na gravity ng bawat pangkat. Halimbawa: sa isang negosyo, 80% ay mga manggagawa, 20% ay mga manggagawa sa opisina, kung saan 5% ay mga tagapamahala, 3% ay mga manggagawa sa opisina, 12% ay mga espesyalista. Target analitikal pagpapangkat - upang matukoy ang kaugnayan sa pagitan ng mga katangian: haba ng serbisyo at average na kita, haba ng serbisyo at output, at iba pa.

Kapag nagsasagawa ng pagpapangkat ay kinakailangan:

Pagsasagawa ng isang komprehensibong pagsusuri sa likas na katangian ng hindi pangkaraniwang bagay na pinag-aaralan;

Pagkilala sa isang katangian ng pagpapangkat (isa o higit pa);

Itakda ang mga hangganan ng mga grupo sa paraang ang mga grupo ay makabuluhang naiiba sa isa't isa, at ang mga homogenous na elemento ay pinagsama sa bawat grupo.

Ayon sa antas ng pagiging kumplikado, ang mga pagpapangkat ay maaaring maging simple at kumbinasyon (batay sa mga katangian).

Batay sa paunang impormasyon, ang pangunahin at pangalawang grupo ay nakikilala, pangunahin isinagawa batay sa paunang data ng pagmamasid, pangalawa gumagamit ng data mula sa pangunahing pagpapangkat.

Natutukoy ang bilang ng mga pangkat ayon sa formula ng Sturgess:

saan n- bilang ng mga pangkat, N- pangkalahatang populasyon.

Kung ginamit pantay na pagitan, Iyon halaga ng pagitan katumbas ng .

Mga pagitan maaaring pantay o hindi pantay. Ang huli naman ay nahahati sa mga nagbabago ayon sa batas ng arithmetic o geometric na pag-unlad. Ang una at huling mga pagitan ay maaaring bukas o sarado. Kasama sa mga saradong agwat o hindi kasama ang mga hangganan ng agwat.

Kung ang mga agwat ay sarado at walang sinabi tungkol sa pagsasama ng mga upper bound, pagkatapos ay ipinapalagay namin iyon itaas na mga limitasyon kasama.

Kung ang mga agwat ay bukas, pagkatapos ay tumutok kami sa huling agwat.

Ang katangian sa mga agwat na ito ay maaaring masukat nang hiwalay at tuloy-tuloy (ibig sabihin, hinati). Sa pamamagitan ng tuloy-tuloy na pag-sign, ang mga hangganan ay malapit na 1-10, 10-20, 20-30; kung ang katangian ay nagbabago nang hiwalay, maaaring gamitin ang sumusunod na notasyon: 1 – 10, 11 – 20, 21 – 30.

Kung bukas ang mga pagitan, kung gayon ang halaga ng huling agwat ay katumbas ng nauna, at ang halaga ng una ay katumbas ng pangalawa.

Pag-uuri– pagpapangkat ayon sa kwalitatibong pamantayan. Ito ay medyo matatag, na-standardize at inaprubahan ng mga katawan ng istatistika ng estado.


3.2. Serye ng pamamahagi: mga uri at pangunahing katangian

Sa ilalim malapit sa pamamahagi ay tumutukoy sa isang serye ng data na nagpapakita ng isang sosyo-ekonomikong kababalaghan ayon sa isang pamantayan. Ito pinakasimpleng anyo pagpapangkat batay sa dalawang katangian.

Ang mga serye ng pamamahagi ay nahahati sa qualitative at quantitative, niraranggo at hindi niraranggo, nakapangkat at hindi nakapangkat, na may discrete at tuloy-tuloy na pamamahagi ng katangian.

Ang isang halimbawa ng isang hindi nakagrupo, walang ranggo na serye ng suweldo ay isang payroll. Kasabay nito, ang listahan ng mga empleyado ay maaaring i-ranggo ayon sa alpabeto o ayon sa mga numero ng tauhan. Ang isang halimbawa ng isang ranggo na serye ay isang listahan ng mga koponan, isang ranggo ng mga manlalaro ng tennis.

Serye ng ranggo distribusyon - isang serye ng mga datos na nakaayos sa pababa o pataas na pagkakasunud-sunod ng isang katangian.

Para sa pangkat na naka-rank na serye, ang mga sumusunod na katangian ay nakikilala: variant, frequency o frequency, cumulate at distribution density.

Opsyon()– average na halaga ng pagitan ng katangian. kasi Kapag gumagawa ng pagpapangkat, dapat sundin ang prinsipyo pare-parehong pamamahagi katangian sa bawat pagitan, kung gayon ang variant ay maaaring kalkulahin bilang kalahati ng kabuuan ng mga hangganan ng mga pagitan.

Dalas() ay nagpapakita kung gaano karaming beses naganap ang isang ibinigay na halaga ng katangian. Ang relatibong pagpapahayag ng dalas ay dalas(.) , ibig sabihin. ibahagi, tiyak na gravity mula sa kabuuan ng mga frequency.

Nag-iipon() – naipon na dalas o dalas, pagkalkula sa isang accrual na batayan. Ang dami, mga gastos, kita ay pinagsama-samang kinakalkula, i.e. mga resulta ng pagganap.

Talahanayan 1

Pagpapangkat ng kasalukuyang mga organisasyon ng kredito
sa laki ng nakarehistro awtorisadong kapital

noong 2008 sa Russian Federation



Bago sa site

>

Pinaka sikat