Sākums Smaganas Izplatīšanas sērija. Statistikas kopsavilkums un grupēšana

Izplatīšanas sērija. Statistikas kopsavilkums un grupēšana

Svarīgākā statistiskās analīzes daļa ir sadalījuma rindu (strukturālā grupēšana) konstruēšana, lai izceltu pētāmās populācijas raksturīgās īpašības un modeļus. Atkarībā no tā, kura pazīme (kvantitatīvā vai kvalitatīvā) tiek ņemta par pamatu datu grupēšanai, attiecīgi tiek izdalīti sadalījuma sēriju veidi.

Ja par grupēšanas pamatu ņem kvalitatīvu raksturlielumu, tad šādu sadalījuma sēriju sauc atribūtīvs(sadalījums pēc darba veida, pēc dzimuma, pēc profesijas, pēc reliģijas, tautības utt.).

Ja sadalījuma sērija ir veidota uz kvantitatīvā pamata, tad šādu sēriju sauc variācijas. Konstruēt variāciju sēriju nozīmē organizēt populācijas vienību kvantitatīvo sadalījumu pēc raksturīgajām vērtībām un pēc tam saskaitīt populācijas vienību skaitu ar šīm vērtībām (veidot grupu tabulu).

Ir trīs variāciju sēriju veidi: ranžētas sērijas, diskrētās sērijas un intervālu sērijas.

Sarindota sērija- tas ir atsevišķu populācijas vienību sadalījums pētāmās pazīmes augošā vai dilstošā secībā. Ranking ļauj ērti sadalīt kvantitatīvos datus grupās, nekavējoties noteikt mazāko un augstākā vērtība raksturīgo, iezīmējiet vērtības, kuras visbiežāk atkārtojas.

Citas variāciju sēriju formas ir grupu tabulas, kas sastādītas atbilstoši pētāmā raksturlieluma vērtību variācijas veidam. Pēc variācijas rakstura izšķir diskrētos (pārtrauktos) un nepārtrauktos raksturlielumus.

Diskrētās sērijas- šī ir variāciju sērija, kuras uzbūves pamatā ir raksturlielumi ar nepārtrauktām izmaiņām (diskrēti raksturlielumi). Pēdējie ietver tarifu kategoriju, bērnu skaitu ģimenē, darbinieku skaitu uzņēmumā utt. Šīs funkcijas var aizņemt tikai ierobežotu skaitu konkrētu vērtību.

Diskrētu variantu sērija ir tabula, kas sastāv no divām kolonnām. Pirmajā kolonnā ir norādīta konkrētā atribūta vērtība, bet otrajā kolonnā ir norādīts vienību skaits populācijā ar noteiktu atribūta vērtību.

Ja raksturlielumam ir nepārtrauktas izmaiņas (ienākumu apjoms, darba stāžs, uzņēmuma pamatlīdzekļu izmaksas utt., kas noteiktās robežās var iegūt jebkādas vērtības), tad šim raksturlielumam ir jāveido intervālu variāciju sērijas.

Grupu tabulā arī šeit ir divas kolonnas. Pirmais norāda atribūta vērtību intervālā “no - līdz” (opcijas), otrais norāda intervālā iekļauto vienību skaitu (biežumu).

Biežums (atkārtošanās biežums) - noteikta atribūtu vērtību varianta atkārtojumu skaits tiek apzīmēts ar fi, un tiek apzīmēta biežumu summa, kas vienāda ar pētāmās populācijas apjomu.

kur k ir atribūtu vērtību opciju skaits

Ļoti bieži tabulu papildina kolonna, kurā tiek aprēķinātas uzkrātās frekvences S, kas parāda, cik vienībām populācijā ir raksturīgā vērtība, kas nav lielāka par šo vērtību.

F sērijas frekvences var aizstāt ar frekvencēm w, kas izteiktas relatīvos skaitļos (daļdaļās vai procentos). Tie atspoguļo katra intervāla frekvenču attiecību pret to kopējā summa, t.i.:

Konstruējot variāciju sēriju ar intervālu vērtībām, vispirms ir jānosaka intervāla i vērtība, kas tiek definēta kā variācijas diapazona R attiecība pret grupu skaitu m:

kur R = xmax - xmin; m = 1 + 3,322 logn (Sērdžesa formula); n ir kopējais vienību skaits populācijā.

Iedzīvotāju struktūras noteikšanai tiek izmantoti īpaši vidējie rādītāji, kas ietver mediānu un režīmu jeb tā sauktos strukturālos vidējos. Ja vidējo aritmētisko aprēķina, pamatojoties uz visu atribūtu vērtību variantu izmantošanu, tad mediāna un režīms raksturo tā varianta vērtību, kas ieņem noteiktu vidējo pozīciju reitingā. variāciju sērija.

Mediāna (es)- šī ir vērtība, kas atbilst opcijai, kas atrodas ranžētās sērijas vidū.

Sarindotām sērijām ar nepāra skaitu atsevišķu vērtību (piemēram, 1, 2, 3, 3, 6, 7, 9, 9, 10) mediāna būs vērtība, kas atrodas vērtības centrā. sērija, t.i. piektā lieluma.

Sarindotajai sērijai ar pāra skaitu atsevišķu vērtību (piemēram, 1, 5, 7, 10, 11, 14) mediāna būs vidējā aritmētiskā vērtība, ko aprēķina no divām blakus esošām vērtībām.

Tas ir, lai atrastu mediānu, vispirms tā ir jānosaka sērijas numurs(tā pozīcija ranga sērijā) pēc formulas

kur n ir vienību skaits apkopojumā.

Mediānas skaitlisko vērtību nosaka no uzkrātajām frekvencēm diskrētu variāciju rindā. Lai to izdarītu, vispirms jānorāda intervāls, kurā sadalījuma intervālu sērijā ir atrodama mediāna. Mediāna ir pirmais intervāls, kurā uzkrāto biežumu summa pārsniedz pusi no novērojumiem no visu novērojumu kopskaita.

Mediānas skaitliskā vērtība

kur xMe ir vidējā intervāla apakšējā robeža; i - intervāla vērtība; S-1 ir tā intervāla uzkrātā frekvence, kas ir pirms mediānas; f ir vidējā intervāla frekvence.

Mode (Mo) Viņi sauc par raksturlieluma vērtību, kas visbiežāk sastopama iedzīvotāju vienībās. Diskrētām sērijām režīms būs opcija ar visaugstāko frekvenci. Lai noteiktu modi intervālu sērijas Pirmkārt, tiek noteikts modālais intervāls (intervāls ar visaugstāko frekvenci). Pēc tam šajā intervālā tiek atrasta objekta vērtība, kas var būt režīms.

Lai atrastu noteiktu režīma vērtību, jāizmanto formula

kur xMo ir modālā intervāla apakšējā robeža; iMo ir modālā intervāla vērtība; fMo - modālā intervāla biežums; fMo-1 - intervāla biežums pirms modālā; fMo+1 - intervāla biežums, kas seko modālajam.

Mode ir plaši izplatīta mārketinga aktivitātēs, pētot patērētāju pieprasījumu, īpaši nosakot populārākos apģērbu un apavu izmērus un regulējot cenu politiku.

Galvenais variāciju rindu analīzes mērķis ir identificēt sadalījuma modeli, vienlaikus izslēdzot gadījuma faktoru ietekmi konkrētajam sadalījumam. To var panākt, palielinot pētāmās populācijas apjomu un vienlaikus samazinot sērijas intervālu. Mēģinot attēlot šos datus grafiski, mēs iegūsim gludu izliektu līniju, kas būs noteikta frekvenču daudzstūra robeža. Šo līniju sauc par sadalījuma līkni.

Citiem vārdiem sakot, sadalījuma līkne ir grafisks attēlojums nepārtrauktas frekvences izmaiņu līnijas veidā variāciju sērijā, kas ir funkcionāli saistīta ar opcijas izmaiņām. Sadalījuma līkne atspoguļo frekvences izmaiņu modeli, ja nav nejaušu faktoru. Grafiskais attēlojums atvieglo sadalījuma sēriju analīzi.

Ir zināmas diezgan daudzas sadalījuma līkņu formas, pa kurām var izlīdzināt variāciju rindas, taču statistikas pētījumu praksē visbiežāk lietotās formas ir normālais sadalījums un Puasona sadalījums.

Normālais sadalījums ir atkarīgs no diviem parametriem: vidējā aritmētiskā un standarta novirzes. Tās līkni izsaka vienādojums

kur y ir normālā sadalījuma līknes ordināta; - standartizētās novirzes; e un π ir matemātiskas konstantes; x - variāciju sērijas varianti; - to vidējā vērtība; - standarta novirze.

Ja jums ir jāiegūst teorētiskās frekvences f", izlīdzinot variāciju sēriju pa normālā sadalījuma līkni, varat izmantot formulu

kur ir visu variāciju rindas empīrisko frekvenču summa; h - intervāla lielums grupās; - standarta novirze; - opciju normalizēta novirze no vidējā aritmētiskā; visus pārējos daudzumus var viegli aprēķināt, izmantojot īpašas tabulas.

Izmantojot šo formulu, mēs iegūstam teorētiskais (varbūtību) sadalījums, aizstājot tos empīriskais (faktiskais) sadalījums, pēc rakstura tie nedrīkst atšķirties viens no otra.

Tomēr vairākos gadījumos, ja variāciju rinda ir sadalījums pēc diskrēta raksturlieluma, kur, palielinoties raksturlieluma x vērtībām, frekvences sāk strauji samazināties, un vidējais aritmētiskais, savukārt, ir vienāds. līdz vērtībai vai tuvu tai dispersijai (), šāda sērija ir izlīdzināta ar Puasona līkni.

Puasona līkne var izteikt ar attiecību

kur Px ir x atsevišķu vērtību rašanās varbūtība; - sērijas vidējais aritmētiskais.

Izlīdzinot empīriskos datus, teorētiskās frekvences var noteikt pēc formulas

kur f" ir teorētiskās frekvences; N ir kopējais sērijas vienību skaits.

Salīdzinot iegūtās teorētisko frekvenču f" vērtības ar empīriskajām (faktiskajām) frekvencēm f, esam pārliecināti, ka to atšķirības var būt ļoti mazas.

Objektīvu teorētisko un empīrisko frekvenču atbilstības raksturlielumu var iegūt, izmantojot īpašus statistikas rādītājus, ko sauc par vienošanās kritērijiem.

Lai novērtētu empīrisko un teorētisko frekvenču tuvumu, tiek izmantots Pīrsona piemērotības tests, Romanovska piemērotības tests un Kolmogorova piemērotības tests.

Visizplatītākā ir K. Pīrsona piemērotības tests, ko var attēlot kā f" un f atšķirību kvadrātā attiecību summu pret teorētiskajām frekvencēm:

Aprēķinātā kritērija vērtība jāsalīdzina ar tabulā norādīto (kritisko) vērtību. Tabulas vērtība nosaka ar speciālu tabulu, tas ir atkarīgs no pieņemtās varbūtības P un brīvības pakāpju skaita k (šajā gadījumā k = m - 3, kur m ir grupu skaits sadalījuma rindā normālajam sadalījumam). Aprēķinot Pīrsona piemērotības testu, jāievēro: nākamais nosacījums: novērojumu skaitam jābūt pietiekami lielam (n 50), un ja dažos intervālos teorētiskās frekvences< 5, то интервалы объединяют для условия > 5.

Ja , tad neatbilstības starp empīrisko un teorētisko frekvenču sadalījumu var būt nejaušas, un pieņēmumu, ka empīriskais sadalījums ir tuvu normālam, nevar noraidīt.

Ja nav tabulu teorētisko un empīrisko frekvenču neatbilstības nejaušības novērtēšanai, varat izmantot vienošanās kritērijs V.I. Romanovskis KR, kurš, izmantojot vērtību, ierosināja novērtēt normālā sadalījuma līknes empīriskā sadalījuma tuvumu, izmantojot attiecību

kur m ir grupu skaits; k = (m - 3) - brīvības pakāpju skaits, aprēķinot normālā sadalījuma frekvences.

Ja iepriekš minētā saistība< 3, то расхождения эмпирических и теоретических частот можно считать случайными, а эмпирическое распределение - соответствующим нормальному. Если отношение >3, tad neatbilstības var būt diezgan būtiskas un hipotēze par normālais sadalījums būtu jānoraida.

Vienošanās kritērijs A.N. Kolmogorovs izmanto, lai noteiktu maksimālo neatbilstību starp empīriskā un teorētiskā sadalījuma frekvencēm, ko aprēķina pēc formulas

kur D ir maksimālā starpības vērtība starp uzkrāto empīrisko un teorētisko frekvenci; - empīrisko frekvenču summa.

Izmantojot varbūtības vērtību tabulas, pēc kritērija var atrast varbūtībai P atbilstošo vērtību. Ja varbūtības vērtība P ir nozīmīga attiecībā pret atrasto vērtību, tad varam pieņemt, ka neatbilstības starp teorētisko un empīrisko sadalījumu ir nenozīmīgs.

Nepieciešams nosacījums, izmantojot Kolmogorova atbilstības kritēriju, ir pietiekami liels novērojumu skaits (vismaz simts).

kartupeļu ražošana ierindota statistiski

Pamatojoties uz 2. tabulas rādītājiem, sastādam sarindotas rindas kartupeļu ražošanai uz 100 hektāriem aramzemes; pēc kartupeļu ražas; pēc pašizmaksas. Mēs attēlojam šo rādītāju attiecības grafiski.

Pirmais posms statistiskais pētījums variācijas ir variāciju sērijas konstruēšana - sakārtots populācijas vienību sadalījums atbilstoši pieaugošām (biežāk) vai samazinošām (retāk) raksturlieluma vērtībām.

Ir trīs variāciju sēriju veidi: ranžētas sērijas, diskrētās sērijas, intervālu sērijas. Variāciju sēriju bieži sauc par sadalījuma sēriju.

Sarindota sērija ir atsevišķu populācijas vienību saraksts pētāmā raksturlieluma augošā (dilstošā) secībā.

Ranking ir pētāmo objektu sakārtošanas procedūra, kas tiek veikta pēc izvēles. Variāciju diapazons parāda, cik liela ir atšķirība starp populācijas vienībām.

Rangs ir atribūtu vērtību sērijas numurs, kas sakārtots to vērtību augošā vai dilstošā secībā. Ja raksturlieluma vērtībai ir vienāds kvantitatīvs novērtējums, tad visu šo vērtību rangs tiek uzskatīts par vienādu ar vidējo aritmētisko no atbilstošā noteikto vietu skaita. Šīs rindas sauc par savienotām.

Grafiki statistikā ir veids, kā veidlapā vizuāli attēlot statistikas rādītājus ģeometriskās formas un zīmes, zīmējumi vai shematiskas kartes. Vizuāls attēls atvieglo informācijas uztveri, ļauj fiksēt indikatoru kopumu savstarpējā saistībā, identificēt attīstības tendences un tipiskās rādītāju attiecības.

Lai parādītu dinamikas indikatorus, ieteicams izmantot līniju diagrammas vai joslu diagrammas. Grafikam jābūt vizuālam, saprotamam, viegli lasāmam un, ja iespējams, mākslinieciski noformētam, kas piesaistīs tam uzmanību.

Konstruējot izkliedes diagrammas, kā grafiskie paraugi tiek izmantota punktu kopa; konstruējot lineāros - līnijas. Diagrammu veidošana vienmēr ir radošs process. Šeit ir jāveic neliela meklēšana. Tikai pēc vairāku melnrakstu versiju sastādīšanas un salīdzināšanas var noteikt pareizo grafika sastāvu, iestatīt zīmju mērogu un izvietojumu grafika laukā.

No sarindotās kartupeļu audzēšanas sērijas uz 100 hektāriem aramzemes varam izdarīt šādu secinājumu, ka zemākā produkcija ir Balaganskas rajonā, bet Angarskas rajonā ir visaugstākā kartupeļu ražība uz 100 hektāriem aramzemes.

Vismazākā raža bijusi Kačugska rajonā - 10 c/ha, bet lielākā Usolskā - 195,5 c/ha.

Čunskas reģionā ar augstu kartupeļu produkciju uz 100 hektāriem aramzemes atbilst zemākās izmaksas 1 c. Maksimālās izmaksas tiek novērotas Nizhne-Ilimsky reģionā. Simtsvara kartupeļu pašizmaksas variācijas ir ļoti lielas un vienādas ar 1161,01 rubli.

Citas publikācijas

Uzņēmuma saimnieciskās darbības analīze
Pārejai uz tirgus ekonomiku uzņēmumam ir jāpaaugstina ražošanas efektivitāte, produktu un pakalpojumu konkurētspēja, pamatojoties uz ieviešanu efektīvas formas vadība un ražošanas vadība, zinātnes un tehnoloģiju progresa sasniegumi, aktivizēšana...

AS TransContainer finansiālās un saimnieciskās darbības analīze
Finanšu analīze ir process, kura pamatā ir datu izpēte par finansiālais stāvoklis uzņēmumu un tā iepriekšējo darbību, lai novērtētu nākotnes apstākļus un darbības rezultātus. Tādējādi galvenais finanšu analīzes uzdevums ir...

Ir viegli iesniegt savu labo darbu zināšanu bāzei. Izmantojiet zemāk esošo veidlapu

labs darbs uz vietni">

Studenti, maģistranti, jaunie zinātnieki, kuri izmanto zināšanu bāzi savās studijās un darbā, būs jums ļoti pateicīgi.

Ievietots http:// www. viss labākais. ru/

Uzdevums Nr.1

Pamatojoties uz datiem statistiskais novērojums dots tabulā, konstruēt ranžētu, intervālu un kumulatīvās lauksaimniecības uzņēmumu sadalījuma rindas pēc faktoru pazīmēm un attēlot tās grafiski.

Veiciet datu kopsavilkumu. Izmantojot grupēšanas metodi, noteikt efektīvā raksturlieluma atkarību lauksaimniecības uzņēmumos no faktora viens. Izveidojiet atkarības tabulas un grafikus. Secinājums.

grupēšanas sēriju sadalījuma koeficients

Augsnes kvalitāte, punkti (x)

(y)

Risinājums:

Būvniecībaierindotarinda sadalījumā tiek pieņemts visu sērijas variantu izvietojums pētāmā raksturlieluma (augsnes kvalitātes) pieaugošā secībā. Šķirošana tika veikta programmā TP Excel, izmantojot funkciju “Sorting”.

Augsnes kvalitāte

Atklātas zemes dārzeņu produktivitāte

Sarindotās sadalījuma sērijas grafisks attēlojums

Līniju 1. attēlā sauc par Galtona līniju. Šai saknei ir tendence vienmērīgi augt ar nelieliem lēcieniem dažos punktos. Lai ranžētu sēriju pārveidotu par intervālu sēriju, labāk to sadalīt grupās manuāli.

Būvniecībaintervālsrinda Uzņēmumu sadalījums atbilstoši pētāmajām pazīmēm ietver grupu skaita (intervālu) noteikšanu.

Lai aprēķinātu grupu skaitu, mēs izmantojam formulu:

n=2, kur N ir kopējais pētāmās populācijas vienību skaits.

n=2 Ig30 = 2,95424251?3.

Vienāda intervāla vērtību aprēķina, izmantojot formulu:

i = = = 16,33333

Kumulatīvsrinda- šī ir sērija, kurā tiek aprēķinātas uzkrātās frekvences. Tas parāda, cik populācijas vienībām ir raksturīga vērtība, kas nav lielāka par šo vērtību, un tiek aprēķināta, secīgi pievienojot nākamā intervāla frekvences pirmā intervāla frekvencei.

Intervāls un kumulatīvās sērijas

frekvence- uzņēmumu skaits grupā;

Konkrēts svars uzņēmumiem V grupai- atrasts pēc formulas:

(numursuzņēmumiemVgrupa*100%)/m, kur m ir eksperimentālo datu skaits;

Uzkrāts frekvence- atrasts pēc formulas: numuruuzņēmumiemViepriekšējāgrupai+ frekvencedotsgrupas.

Frekvences histogramma

Augsnes kvalitātes sadalījuma kumulati

Kopsavilkuma rādītāji

Grupas numurs

Uzņēmumu skaits grupā

Atklātā zemes dārzeņu produktivitāte (kopā pa grupām)

Augsnes kvalitāte (kopā pa grupām)

II 61.33333-77.33333

III 77.33333-94.1

Vidējās grupas raksturojums

Grupas Nr.

Atklātas zemes dārzeņu produktivitāte

Augsnes kvalitāte

II 61.33333-77.33333

III 77.33333-94.1

Vidēji

kur aili “dārzeņu raža” atrod pēc formulas: UUi(Vgrupai) / numuruuzņēmumiemVgrupai;

kolonnu "Augsnes kvalitāte" atrod, izmantojot formulu: UXi(Vgrupa)/numursuzņēmumiemVgrupai.

Atklātas zemes dārzeņu ražas atkarība no augsnes kvalitātes.

Aplūkojamajā piemērā varam secināt: paaugstinoties augsnes kvalitātei, pieaug atklātās zemes dārzeņu raža, līdz ar to varam pieņemt tiešas sakarības esamību starp aplūkotajiem parametriem.

Ievietots vietnē Allbest.ru

Līdzīgi dokumenti

    Analītiskā grupēšana pēc faktoriem. Variācijas biežuma un kumulatīvā sadalījuma sēriju konstruēšana, pamatojoties uz efektīvā atribūta vienādu intervālu strukturālo grupēšanu - dividendes, kas uzkrātas, pamatojoties uz darbības rezultātiem.

    tests, pievienots 05.07.2009

    Galvenie iedzīvotāju rādītāji un izplatība Kalugas reģionā. Sarindotu un intervālu sadalījuma rindu konstruēšana, pamatojoties uz vienu grupēšanas faktoru raksturlielumu. Tipisko grupu analīze, pamatojoties uz iedzīvotāju vidējiem rādītājiem.

    kursa darbs, pievienots 11.10.2010

    Būvniecība, izmantojot Stērdžesa formulu. Sadales sēriju veidošana ar patvaļīgiem intervāliem. Sadalījuma sērijas konstruēšana, izmantojot standarta novirzi. Izplatīšanas sēriju klasifikācija. Variācijas galveno raksturlielumu aprēķins.

    kursa darbs, pievienots 22.11.2013

    Sākuma analīze, aprēķins un konstruēšana laika rindas iezīme-funkcija un iezīme-faktors. Laika rindu variācijas rādītāju aprēķins. Kvantitatīvs sakarības starp iezīmi-funkciju un pazīmju-faktoru ciešuma mērījums, izmantojot pāru korelācijas metodi.

    kursa darbs, pievienots 24.09.2014

    Populācijas viendabīguma novērtējums. Randētu un intervālu sadalījuma sēriju konstruēšana. Laika rindu analīze, izmantojot intervālu palielināšanas un mainīgo vidējo vērtību metodes, analītiskā izlīdzināšana, izmantojot taisnes un parabolas vienādojumu.

    kursa darbs, pievienots 10.09.2014

    Vidējā akadēmiskā rezultāta aprēķins, pamatojoties uz sesiju rezultātiem, zināšanu līmeņa variāciju indikatora noteikšana un studentu skaita struktūra pēc sekmēm. Uzņēmumu sadalījuma intervālu sērijas veidošana. Korelācijas koeficientu novērtēšana.

    tests, pievienots 21.08.2009

    Jēdziens un veidi statistiskā grupēšana, ko veic ar mērķi noteikt statistiskās sakarības un modeļus, identificēt pētāmās populācijas struktūru. Uzņēmumu sadalījuma intervālu sērijas izveide, pamatojoties uz atribūtu “tirdzniecības zona”.

    diplomdarbs, pievienots 14.02.2016

    Galvenās statistikas kategorijas. Grupēšana ir statistikas datu zinātniskās apstrādes pamats. Kopsavilkuma saturs un statistikas apkopojums. Konstrukcija variācijas, ranžēta un diskrētas sērijas sadales. Uzņēmumu grupēšana pēc darbinieku skaita.

    tests, pievienots 17.03.2015

    Absolūto, relatīvo, vidējo vērtību, regresijas un elastības koeficientu, variācijas rādītāju, dispersijas, sadalījuma rindu konstruēšana un analīze. Ķēdes un pamata dinamikas rindu analītiskās izlīdzināšanas raksturojums.

    kursa darbs, pievienots 20.05.2010

    Eksperimenta vadīšana statistikas pētījumi sociāli ekonomiskās parādības un procesi Smoļenskas reģionā, pamatojoties uz noteiktiem rādītājiem. Statistisko grafiku, sadalījumu rindu, variāciju rindu konstruēšana, to vispārināšana un novērtēšana.

Tie ir uzrādīti izplatīšanas sēriju veidā un tiek parādīti formā.

Sadalījuma sērija ir viens no grupēšanas veidiem.

Izplatīšanas diapazons- attēlo pētāmās populācijas vienību sakārtotu sadalījumu grupās atbilstoši noteiktai mainīgai pazīmei.

Atkarībā no raksturlielumiem, kas ir sadalījuma sērijas veidošanās pamatā, tos izšķir atributīvs un variācijas sadales rindas:

  • Atribūti- sauc par sadalījuma sērijām, kas konstruētas atbilstoši kvalitatīvajām īpašībām.
  • Tiek sauktas sadalījuma sērijas, kas veidotas kvantitatīvā raksturlieluma vērtību augošā vai dilstošā secībā. variācijas.
Sadalījuma variāciju sērija sastāv no divām kolonnām:

Pirmajā kolonnā ir norādītas mainīgā raksturlieluma kvantitatīvās vērtības, kuras sauc iespējas un ir apzīmēti. Diskrētā opcija — izteikta kā vesels skaitlis. Intervāla opcija svārstās no un līdz. Atkarībā no opciju veida varat izveidot diskrētu vai intervālu variāciju sēriju.
Otrā kolonna satur konkrētās opcijas skaits, izteikts frekvencēs vai frekvencēs:

Frekvences- tie ir absolūtie skaitļi, kas parāda, cik reižu noteikta objekta vērtība kopā sastopama, kas apzīmē . Visu frekvenču summai jābūt vienādai ar vienību skaitu visā populācijā.

Frekvences() ir frekvences, kas izteiktas procentos no kopsummas. Visu biežumu summai, kas izteikta procentos, ir jābūt vienādai ar 100% vieninieka daļās.

Sadalījuma sēriju grafiskais attēlojums

Izplatīšanas sērijas tiek vizuāli prezentētas, izmantojot grafiskos attēlus.

Izplatīšanas sērijas ir attēlotas šādi:
  • Daudzstūris
  • Histogrammas
  • Kumulē
  • Ogives

Daudzstūris

Veidojot daudzstūri uz horizontālā ass(x ass) tiek attēlotas mainīgā raksturlieluma vērtības, un uz vertikālās ass (y ass) tiek attēlotas frekvences vai frekvences.

Daudzstūris attēlā. 6.1 ir balstīts uz datiem no Krievijas iedzīvotāju mikroskaitīšanas 1994. gadā.

6.1. Mājsaimniecības lieluma sadalījums

Stāvoklis: Sniegti dati par viena uzņēmuma 25 darbinieku sadalījumu pa tarifu kategorijām:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Uzdevums: izveidojiet diskrētu variantu sēriju un attēlojiet to grafiski kā sadalījuma daudzstūri.
Risinājums:
Šajā piemērā opcijas ir darbinieka algas pakāpe. Lai noteiktu frekvences, ir jāaprēķina darbinieku skaits ar atbilstošo tarifu kategoriju.

Daudzstūris tiek izmantots diskrētu variāciju sērijām.

Lai izveidotu sadalījuma daudzstūri (1. att.), uz abscisu (X) ass attēlojam mainīgā raksturlieluma — opciju — kvantitatīvās vērtības, bet uz ordinātu ass — frekvences vai frekvences.

Ja raksturlieluma vērtības ir izteiktas intervālu veidā, tad šādu sēriju sauc par intervālu.
Intervālu sērija sadalījumi ir attēloti grafiski histogrammas, kumulatīvās vai ogive veidā.

Statistikas tabula

Stāvoklis: Dati par noguldījumu lielumu ir doti 20 privātpersonām vienā bankā (tūkstoši rubļu) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Uzdevums: izveidojiet intervālu variāciju sēriju ar vienādiem intervāliem.
Risinājums:

  1. Sākotnējā populācija sastāv no 20 vienībām (N = 20).
  2. Izmantojot Stērdžesa formulu, nosakām nepieciešamo izmantoto grupu skaitu: n=1+3,322*lg20=5
  3. Aprēķināsim vienāda intervāla vērtību: i=(152 - 2) /5 = 30 tūkstoši rubļu
  4. Sadalīsim sākotnējo iedzīvotāju skaitu 5 grupās ar intervālu 30 tūkstoši rubļu.
  5. Grupēšanas rezultātus sniedzam tabulā:

Ar šādu nepārtraukta raksturlieluma ierakstīšanu, kad viena un tā pati vērtība notiek divas reizes (kā viena intervāla augšējā robeža un cita intervāla apakšējā robeža), šī vērtība pieder grupai, kurā šī vērtība darbojas kā augšējā robeža.

Histogramma

Lai izveidotu histogrammu, uz abscisu ass tiek norādītas intervālu robežu vērtības un, pamatojoties uz tām, tiek konstruēti taisnstūri, kuru augstums ir proporcionāls frekvencēm (vai frekvencēm).

Attēlā 6.2. parāda histogrammu par Krievijas iedzīvotāju sadalījumu 1997. gadā pa vecuma grupām.

Rīsi. 6.2. Krievijas iedzīvotāju sadalījums pa vecuma grupām

Stāvoklis: Dots 30 uzņēmuma darbinieku sadalījums pa mēnešalgu algas

Uzdevums: grafiski attēlo intervālu variāciju sērijas histogrammas veidā un uzkrāj.
Risinājums:

  1. Atvērtā (pirmā) intervāla nezināmo robežu nosaka otrā intervāla vērtība: 7000 - 5000 = 2000 rubļu. Ar tādu pašu vērtību mēs atrodam pirmā intervāla apakšējo robežu: 5000 - 2000 = 3000 rubļu.
  2. Lai izveidotu histogrammu taisnstūra koordinātu sistēmā, mēs uzzīmējam pa abscisu asi segmentus, kuru vērtības atbilst varikozas sērijas intervāliem.
    Šie segmenti kalpo kā apakšējā bāze, un atbilstošā frekvence (frekvence) kalpo kā izveidoto taisnstūru augstums.
  3. Izveidosim histogrammu:

Lai izveidotu kumulatīvus, ir jāaprēķina uzkrātās frekvences (frekvences). Tos nosaka, secīgi summējot iepriekšējo intervālu frekvences (frekvences), un tās apzīmē ar S. Uzkrātās frekvences parāda, cik daudzām populācijas vienībām ir raksturīga vērtība, kas nav lielāka par aplūkojamo.

Kumulē

Variāciju sērijas raksturlielumu sadalījums pa uzkrātajām frekvencēm (frekvencēm) tiek attēlots, izmantojot kumulātu.

Kumulē vai kumulatīvā līkne, atšķirībā no daudzstūra, tiek veidota no uzkrātajām frekvencēm vai frekvencēm. Šajā gadījumā raksturlieluma vērtības tiek novietotas uz abscisu ass, bet uzkrātās frekvences vai frekvences tiek novietotas uz ordinātu ass (6.3. attēls).

Rīsi. 6.3. Mājsaimniecības lieluma sadalījuma kumulati

4. Aprēķināsim uzkrātās frekvences:
Pirmā intervāla kumulatīvo biežumu aprēķina šādi: 0 + 4 = 4, otrajam: 4 + 12 = 16; trešajam: 4 + 12 + 8 = 24 utt.

Veidojot kumulātu, attiecīgā intervāla uzkrātā frekvence (frekvence) tiek piešķirta tā augšējai robežai:

Ogiva

Ogiva ir konstruēts līdzīgi kā kumulatīvs ar vienīgo atšķirību, ka uzkrātās frekvences ir novietotas uz abscisu ass, bet raksturīgās vērtības tiek novietotas uz ordinātu ass.

Kumulācijas veids ir koncentrācijas līkne vai Lorenca diagramma. Lai izveidotu koncentrācijas līkni, uz abām taisnstūra koordinātu sistēmas asīm tiek uzzīmēta skala procentos no 0 līdz 100. Tajā pašā laikā uz abscisu ass tiek norādītas uzkrātās frekvences un uzkrātās daļas vērtības. (procentos) pēc raksturlieluma tilpuma ir norādīti uz ordinātu ass.

Vienmērīgs raksturlieluma sadalījums atbilst kvadrāta diagonālei grafikā (6.4. att.). Ar nevienmērīgu sadalījumu grafikā ir attēlota ieliekta līkne atkarībā no pazīmes koncentrācijas līmeņa.

6.4. Koncentrācijas līkne

Kopsavilkuma, grupēšanas, klasifikācijas jēdziens

Kopsavilkums– sistematizēšana un summēšana: laika ziņas, ziņojumi no laukiem. Kopsavilkums neļauj detalizēti analizēt informāciju. Jebkuram kopsavilkumam jābūt balstītam uz datu grupēšanu, t.i. vispirms grupējot un pēc tam apkopojot datus.

Grupēšana– populāciju iedalījums vairākās grupās pēc nozīmīgākajām pazīmēm.

Ir kvalitatīvi un kvantitatīvi grupējumi. Augsta kvalitāte- atribūtīvs, kvantitatīvi- variācijas. Savukārt variācijas iedala strukturālajā un analītiskajā . Strukturāls grupēšana ietver katras grupas īpatnējā smaguma aprēķināšanu. Piemērs: uzņēmumā 80% ir strādnieki, 20% ir biroja darbinieki, no kuriem 5% ir vadītāji, 3% ir biroja darbinieki, 12% ir speciālisti. Mērķis analītisks grupējumi - lai noteiktu saistību starp pazīmēm: darba stāžs un vidējā izpeļņa, darba stāžs un izlaide un citi.

Veicot grupēšanu, ir nepieciešams:

pētāmās parādības būtības visaptverošas analīzes veikšana;

Grupēšanas pazīmes (viena vai vairākas) identifikācija;

Iestatiet grupu robežas tā, lai grupas būtiski atšķirtos viena no otras un katrā grupā tiktu apvienoti viendabīgi elementi.

Atbilstoši sarežģītības pakāpei grupējumi var būt vienkārši un kombinēti (pamatojoties uz pazīmēm).

Pamatojoties uz sākotnējo informāciju, tiek izdalītas primārās un sekundārās grupas, primārais veikts, pamatojoties uz sākotnējiem novērojumiem, sekundārais izmanto datus no primārās grupas.

Grupu skaits tiek noteikts pēc Stērdžesa formulas:

Kur n- grupu skaits, N– vispārējie iedzīvotāji.

Ja lieto vienādos intervālos, Tas intervāla vērtība vienāds ar .

Intervāli var būt vienādi vai nevienlīdzīgi. Pēdējie savukārt tiek iedalīti tajos, kas mainās saskaņā ar aritmētikas likumu vai ģeometriskā progresija. Pirmais un pēdējais intervāls var būt atvērts vai slēgts. Slēgtie intervāli ietver vai neietver intervālu robežas.

Ja intervāli ir slēgti un nekas nav teikts par augšējo robežu iekļaušanu, mēs to pieņemam augšējās robežas iekļauts.

Ja intervāli ir atvērti, mēs koncentrējamies uz pēdējo intervālu.

Šajos intervālos raksturlielumu var izmērīt diskrēti un nepārtraukti (t.i., sadalīt). Ar nepārtrauktu zīmi robežas aizveras 1-10, 10-20, 20-30; ja raksturlielums diskrēti mainās, tad var izmantot šādu apzīmējumu: 1 – 10, 11 – 20, 21 – 30.

Ja intervāli ir atvērti, tad pēdējā intervāla vērtība ir vienāda ar iepriekšējo, un pirmā vērtība ir vienāda ar otro.

Klasifikācija– grupēšana pēc kvalitatīviem kritērijiem. Tas ir samērā stabils, standartizēts un valsts statistikas iestāžu apstiprināts.


3.2. Izplatīšanas sērija: veidi un galvenie raksturlielumi

Zem tuvu izplatīšanai attiecas uz datu sēriju, kas raksturo sociāli ekonomisko parādību, pamatojoties uz vienu raksturlielumu. Šis vienkāršākā forma grupējumi, kuru pamatā ir divas pazīmes.

Sadalījuma sērijas tiek iedalītas kvalitatīvās un kvantitatīvās, ranžētās un neranžētās, grupētās un negrupētās, ar diskrētu un nepārtrauktu raksturlieluma sadalījumu.

Negrupētas, nerindotas algu sērijas piemērs ir algu saraksts. Tajā pašā laikā darbinieku sarakstu var sakārtot alfabētiskā secībā vai pēc personāla numuriem. Ranga sērijas piemērs ir komandu saraksts, tenisistu rangs.

Sarindota sērija sadalījums - datu virkne, kas sakārtota raksturlieluma dilstošā vai augošā secībā.

Grupētām ranžētām sērijām izšķir šādus raksturlielumus: variants, biežums vai biežums, kumulācija un sadalījuma blīvums.

Opcija ()– raksturlieluma vidējā intervāla vērtība. Jo Veidojot grupējumu, jāievēro princips vienmērīgs sadalījums raksturlielumu katrā intervālā, tad variantu var aprēķināt kā pusi no intervālu robežu summas.

Biežums() parāda, cik reižu notiek dotā atribūta vērtība. Relatīvā biežuma izteiksme ir frekvence(.) , t.i. dalīties, īpatnējais svars no frekvenču summas.

Kumulē() – uzkrātais biežums vai biežums, aprēķins pēc uzkrāšanas principa. Apjoms, izmaksas, ienākumi tiek aprēķināti kumulatīvi, t.i. darbības rezultātus.

1. tabula

Strāvas grupēšana kredītorganizācijas
pēc reģistrētā lieluma pamatkapitāls

2008. gadā Krievijas Federācijā



Jaunums vietnē

>

Populārākais