Domov Ortopedie Příklad diskrétní variační řady. Konstrukce diskrétní variační řady

Příklad diskrétní variační řady. Konstrukce diskrétní variační řady

Umístění dat statistické pozorování, charakterizující ten či onen jev, je v prvé řadě nutné je seřadit, tzn. dát systematický charakter

anglický statistik. UJReichman o neuspořádaných sbírkách obrazně řekl, že setkání s množstvím nezobecněných dat je ekvivalentní situaci, kdy je člověk bez kompasu vržen do houští. Jaká je systemizace statistických dat ve formě distribučních řad?

Statistické řady rozdělení jsou uspořádané statistické agregáty (tabulka 17). Nejjednodušším typem statistické distribuční řady je řada řazená, tzn. řada čísel ve vzestupném nebo sestupném pořadí, měnící se charakteristiky. Taková řada nám neumožňuje posoudit vzorce vlastní distribuovaným datům: která hodnota má seskupenu většinu ukazatelů, jaké jsou odchylky od této hodnoty; stejně jako celkový obraz distribuce. Za tímto účelem jsou data seskupena a ukazují, jak často se jednotlivá pozorování vyskytují v jejich celkovém počtu (schéma 1a 1).

. Tabulka 17

. Obecná forma statistická řada rozdělení

. Schéma 1. Statistické schéma distribuční série

Rozdělení jednotek populace podle charakteristik, které nemají kvantitativní vyjádření, se nazývá atributivní řada(například rozdělení podniků podle jejich výrobní oblasti)

Řady rozdělení populačních jednotek podle charakteristik, mají kvantitativní vyjádření, se nazývají variační série. V takových řadách jsou hodnoty charakteristiky (možností) ve vzestupném nebo sestupném pořadí

Ve variační distribuční řadě se rozlišují dva prvky: varianta a frekvence . Volba- to je samostatný význam charakteristik seskupení frekvence- číslo, které ukazuje, kolikrát se každá možnost vyskytuje

Další prvek se počítá v matematické statistice variační série -částečně. Ten je definován jako poměr četnosti případů daného intervalu k Celková částkačetnostní část se určuje ve zlomcích jednotky, procenta (%) v ppm (% o)

Variační distribuční řada je tedy řada, ve které jsou možnosti uspořádány vzestupně nebo sestupně a jsou uvedeny jejich frekvence nebo frekvence. Variační řady jsou diskrétní (intervaly) a ostatní intervaly (spojité).

. Diskrétní variační řada- jedná se o distribuční řady, ve kterých varianta jako hodnota kvantitativní charakteristiky může nabývat pouze určité hodnoty. Možnosti se od sebe liší jednou nebo více jednotkami

Počet vyrobených dílů za směnu konkrétním pracovníkem lze tedy vyjádřit pouze jedním konkrétním číslem (6, 10, 12 atd.). Příkladem diskrétní variační řady může být rozdělení pracovníků podle počtu vyrobených dílů (tabulka 18 18).

. Tabulka 18

. Distribuce diskrétních řad _

. Intervalové (průběžné) variační řady- takové distribuční řady, ve kterých je hodnota opcí uvedena ve formě intervalů, tzn. hodnoty vlastností se mohou navzájem lišit o libovolně malé množství. Při konstrukci řady variací perivariantních charakteristik NEP není možné označit každou hodnotu varianty, takže populace je rozdělena do intervalů. Ten druhý může být stejný nebo nestejný. U každého z nich jsou uvedeny frekvence nebo frekvence (tabulka 1 9 19).

V intervalových distribučních řadách s nestejnými intervaly se vypočítávají matematické charakteristiky, jako je hustota distribuce a relativní hustota distribuce na daném intervalu. První charakteristika je určena poměrem frekvence k hodnotě stejného intervalu, druhá - poměrem frekvence k hodnotě stejného intervalu. Ve výše uvedeném příkladu bude hustota distribuce v prvním intervalu 3: 5 = 0,6 a relativní hustota v tomto intervalu je 7,5: 5 = 1,55 %.

. Tabulka 19

. Intervalové distribuční řady _

Odeslat svou dobrou práci do znalostní báze je jednoduché. Použijte níže uvedený formulář

Dobrá práce na web">

Studenti, postgraduální studenti, mladí vědci, kteří využívají znalostní základnu ve svém studiu a práci, vám budou velmi vděční.

Vloženo na http://www.allbest.ru/

ÚKOL1

K dispozici jsou následující údaje o mzdách zaměstnanců v podniku:

Tabulka 1.1

Velikost mzdy v konvenčním doupě. Jednotky

Je nutné sestrojit intervalovou distribuční řadu, podle které se má najít;

1) průměrná mzda;

2) průměrná lineární odchylka;

4) směrodatná odchylka;

5) rozsah variací;

6) koeficient oscilace;

7) lineární koeficient variace;

8) jednoduchý variační koeficient;

10) medián;

11) koeficient asymetrie;

12) Pearsonův index asymetrie;

13) koeficient špičatosti.

Řešení

Jak víte, možnosti (rozpoznané hodnoty) jsou uspořádány ve vzestupném pořadí diskrétní variační série. S velkým počtem možnost (více než 10), i v případě diskrétní variace se konstruují intervalové řady.

Pokud je intervalová řada sestavena se sudými intervaly, pak se rozsah variace vydělí zadaným počtem intervalů. Navíc, pokud je výsledná hodnota celočíselná a jednoznačná (což je vzácné), pak se předpokládá, že délka intervalu je rovna tomuto číslu. V jiných případech vyrobeno zaokrouhlování Nezbytně PROTI boční zvýšit, Tak na poslední zbývající číslice byla sudá. Je zřejmé, že jak se délka intervalu zvyšuje, variační rozsah o částku rovnající se součinu počtu intervalů: o rozdíl mezi vypočtenou a počáteční délkou intervalu

A) Pokud je velikost rozšíření variačního rozsahu nevýznamná, pak se buď přičte k největší, nebo se odečte od nejmenší hodnoty charakteristiky;

b) Je-li velikost rozšíření variačního rozsahu patrná, pak, aby se střed rozsahu neposouval, rozdělí se přibližně na polovinu, přičemž se současně přidá k největšímu a odečte od nejnižší hodnoty podepsat.

Pokud se sestavuje intervalová řada s nestejnými intervaly, pak se proces zjednodušuje, ale přesto musí být délka intervalů vyjádřena jako číslo s poslední sudou číslicí, což značně zjednodušuje následné výpočty číselných charakteristik.

30 je velikost vzorku.

Vytvořme intervalovou distribuční řadu pomocí Sturgesova vzorce:

K = 1 + 3,32*log n,

K - počet skupin;

K = 1 + 3,32 x lg30 = 5,91 = 6

Pomocí vzorce zjistíme rozsah atributu - mzdy pracovníků v podniku - (x).

R= xmax - xmin a děleno 6; R= 195-112=83

Pak bude délka intervalu l pruh = 83:6 = 13,83

Začátek prvního intervalu bude 112. Přidání k 112 l ras = 13,83, dostaneme jeho konečnou hodnotu 125,83, což je také začátek druhého intervalu atd. konec pátého intervalu - 195.

Při hledání frekvencí byste se měli řídit pravidlem: „pokud se hodnota prvku shoduje s hranicí vnitřního intervalu, pak by měla být připsána předchozímu intervalu.“

Získáme intervalovou řadu frekvencí a kumulativní frekvence.

Tabulka 1.2

Mzdu tedy mají 3 zaměstnanci. poplatek od 112 do 125,83 konvenčních peněžních jednotek. Nejvyšší plat poplatek od 181,15 do 195 konvenčních peněžních jednotek. pouze 6 zaměstnanců.

Abychom vypočítali číselné charakteristiky, transformujeme intervalové řady na diskrétní řadu, přičemž jako možnost bereme střed intervalů:

Tabulka 1.3

14131,83

Použití vzorce váženého aritmetického průměru

konvenční peněžní jednotky

Průměrná lineární odchylka:

kde xi je hodnota studovaného znaku pro i-tou jednotku populace,

Průměrná hodnota studovaného znaku.

Vloženo na http://www.allbest.ru/

Zveřejněno na http://www.allbest.ru/

Konvenční peněžní jednotky

Standardní odchylka:

Rozptyl:

Relativní rozsah variace (koeficient oscilace): c= R:,

Relativní lineární odchylka: q = L:

Variační koeficient: V = y:

Oscilační koeficient ukazuje relativní kolísání extrémních hodnot charakteristiky kolem aritmetického průměru a variační koeficient charakterizuje stupeň a homogenitu populace.

c= R: = 83 / 159,485 * 100 % = 52,043 %

Rozdíl mezi krajními hodnotami je tedy o 5,16 % (=94,84 %-100 %) menší než průměrná mzda zaměstnanců v podniku.

q = L: = 17,765/ 159,485*100 % = 11,139 %

V = y: = 21,704/ 159,485*100 % = 13,609 %

Variační koeficient je menší než 33 %, což ukazuje na slabé kolísání mezd pracovníků v podniku, tzn. že průměrná hodnota je typickou charakteristikou dělnických mezd (obyvatelstvo je homogenní).

V intervalových distribučních řadách móda určeno vzorcem -

Frekvence modálního intervalu, tj. intervalu obsahujícího největší počet možností;

Frekvence intervalu před modálním;

Četnost intervalu následujícího po modálním;

Délka modálního intervalu;

Dolní mez modálního intervalu.

Pro určení mediány v intervalové řadě použijeme vzorec

kde je kumulativní (akumulovaná) frekvence intervalu předcházejícího mediánu;

Dolní mez středního intervalu;

Medián intervalové frekvence;

Délka středního intervalu.

Medián intervalu- interval, jehož akumulovaná frekvence (=3+3+5+7) přesahuje polovinu součtu frekvencí - (153,49; 167,32).

Pojďme vypočítat asymetrii a špičatost, pro které vytvoříme nový list:

Tabulka 1.4

Faktické údaje

Vypočítaná data

Vypočítejme moment třetího řádu

Proto je asymetrie rovna

Od 0,3553 0,25 je asymetrie považována za významnou.

Vypočítejme moment čtvrtého řádu

Proto se špičatost rovná

Protože< 0, то эксцесс является плосковершинным.

Stupeň asymetrie lze určit pomocí Pearsonova koeficientu asymetrie (As): oscilace hodnota vzorku obrat Obr.

kde je aritmetický průměr distribuční řady; -- móda; -- standardní odchylka.

Při symetrickém (normálním) rozdělení = Mo je tedy koeficient asymetrie nulový. Je-li As > 0, pak existuje více módů, proto existuje pravotočivá asymetrie.

Pokud As< 0, то méně módy, proto existuje levostranná asymetrie. Koeficient asymetrie se může lišit od -3 do +3.

Rozložení není symetrické, ale má levostrannou asymetrii.

ÚKOL 2

Jaká by měla být velikost vzorku, aby s pravděpodobností 0,954 výběrová chyba nepřesáhla 0,04, pokud je na základě předchozích šetření známo, že rozptyl je 0,24?

Řešení

Velikost vzorku pro neopakující se vzorkování se vypočítá pomocí vzorce:

t - koeficient spolehlivosti (s pravděpodobností 0,954 se rovná 2,0; určeno z tabulek integrálů pravděpodobnosti),

y2=0,24 - standardní odchylka;

10 000 lidí - velikost vzorku;

Dx =0,04 - maximální chyba výběrového průměru.

S pravděpodobností 95,4 % lze konstatovat, že velikost vzorku zajišťující relativní chybu do 0,04 by měla být minimálně 566 rodin.

ÚKOL3

K dispozici jsou následující údaje o příjmech z hlavních činností podniku, miliony rublů.

Chcete-li analyzovat řadu dynamiky, určete následující ukazatele:

1) řetěz a základní:

Absolutní zvýšení;

Rychlosti růstu;

Tempo růstu;

2) průměr

Úroveň řádku dynamiky;

Absolutní nárůst;

Tempo růstu;

Míra nárůstu;

3) absolutní hodnota zvýšení o 1 %.

Řešení

1. Absolutní nárůst (Dy)- toto je rozdíl mezi další úrovní série a předchozí (nebo základní):

řetězec: DN = yi - yi-1,

základní: DN = yi - y0,

уi - úroveň řádku,

i - číslo úrovně řádku,

y0 - úroveň základního roku.

2. Rychlost růstu (út) je poměr následující úrovně řady a předchozí úrovně (nebo základního roku 2001):

řetězec: Tu = ;

základní: Tu =

3. Rychlost růstu (TD) je poměr absolutního růstu k předchozí úrovni, vyjádřený v %.

řetězec: Tu = ;

základní: Tu =

4. Absolutní hodnota 1% nárůst (A)- jedná se o poměr absolutního růstu řetězce k tempu růstu, vyjádřený v %.

A =

Průměrná úroveň řádku vypočítané pomocí vzorce aritmetického průměru.

Průměrná výše příjmu z hlavní činnosti za 4 roky:

Průměrný absolutní nárůst počítá se podle vzorce:

kde n je počet úrovní řady.

V průměru za rok vzrostly příjmy z hlavních činností o 3,333 milionu rublů.

Průměrná roční míra růstu vypočítaný pomocí vzorce geometrického průměru:

уn je konečná úroveň řádku,

y0 - První úroveňřádek.

Tu = 100 % = 102,174 %

Průměrná roční míra růstu počítá se podle vzorce:

T? = Tu - 100 % = 102,74 % - 100 % = 2,74 %.

V průměru za rok se tak výnosy z hlavní činnosti podniku zvýšily o 2,74 %.

ÚKOLYA4

Vypočítat:

1. Jednotlivé cenové indexy;

2. Index obecného obchodního obratu;

3. Souhrnný cenový index;

4. Souhrnný index fyzického objemu prodeje zboží;

5. Rozdělit absolutní nárůst hodnoty obchodního obratu podle faktorů (v důsledku změn cen a počtu prodaného zboží);

6. Ke všem získaným ukazatelům vyvozte stručné závěry.

Řešení

1. Jednotlivé cenové indexy pro výrobky A, B, C činily dle podmínky -

ipA = 1,20; iрБ=1,15; iрВ=1,00.

2. Všeobecný index obchodního obratu vypočítáme pomocí vzorce:

I w = = 1470/1045*100 % = 140,67 %

Obchodní obrat vzrostl o 40,67 % (140,67 %-100 %).

V průměru se ceny komodit zvýšily o 10,24 %.

Výše dodatečných nákladů kupujících ze zvýšení ceny:

w(p) =? p1q1 - ? p0q1 = 1470 - 1333,478 = 136,522 milionů rublů.

V důsledku rostoucích cen museli kupující utratit dalších 136,522 milionu rublů.

4. Obecný index fyzického objemu obchodního obratu:

Fyzický objem obchodního obratu vzrostl o 27,61 %.

5. Stanovme celkovou změnu obchodního obratu ve druhém období ve srovnání s prvním obdobím:

w = 1470-1045 = 425 milionů rublů.

z důvodu změny cen:

W(p) = 1470 - 1333,478 = 136,522 milionů rublů.

v důsledku změn fyzického objemu:

w(q) = 1333,478 - 1045 = 288,478 milionů rublů.

Obrat zboží vzrostl o 40,67 %. Ceny v průměru za 3 zboží vzrostly o 10,24 %. Fyzický objem obchodního obratu vzrostl o 27,61 %.

Obecně se objem prodeje zvýšil o 425 milionů rublů, včetně nárůstu cen o 136,522 milionu rublů a v důsledku zvýšení objemu prodeje - o 288,478 milionu rublů.

ÚKOL5

Následující údaje jsou k dispozici pro 10 továren v jednom odvětví.

Číslo rostliny

Výstup produktu, tisíc ks. (X)

Na základě uvedených údajů:

I) potvrdit ustanovení logické analýzy o přítomnosti lineární korelace mezi faktorovou charakteristikou (objem produktu) a výslednou charakteristikou (spotřeba elektřiny), vykreslit výchozí data do grafu korelačního pole a vyvodit závěry o tvaru vztahu, uveďte jeho vzorec;

2) určit parametry rovnice spojení a vynést výslednou teoretickou přímku do grafu korelačního pole;

3) vypočítat lineární korelační koeficient,

4) vysvětlit význam ukazatelů získaných v odstavcích 2) a 3);

5) pomocí výsledného modelu proveďte prognózu možné spotřeby energie v závodě s objemem výroby 4,5 tisíce kusů.

Řešení

Údaj atributu - objem výroby (faktor), bude označen xi; znak - spotřeba elektřiny (výsledek) přes yi; body se souřadnicemi (x, y) jsou vyneseny na korelačním poli OXY.

Body korelačního pole jsou umístěny podél určité přímky. Proto je vztah lineární, budeme hledat regresní rovnici ve tvaru přímky Уx=ax+b. K jeho nalezení použijeme soustavu normálních rovnic:

Vytvoříme kalkulační tabulku.

Pomocí nalezených průměrů sestavíme systém a vyřešíme jej s ohledem na parametry a a b:

Dostaneme tedy regresní rovnici pro y na x: = 3,57692 x + 3,19231

Na korelačním poli postavíme regresní přímku.

Dosazením hodnot x ze sloupce 2 do regresní rovnice získáme vypočítané (sloupec 7) a porovnáme je s údaji y, což se odráží ve sloupci 8. Mimochodem, správnost výpočtů je potvrzena shoda průměrných hodnot ya.

Součinitellineární korelace vyhodnotí blízkost vztahu mezi charakteristikami x a y a vypočte se pomocí vzorce

Úhlový koeficient přímé regrese a (v x) charakterizuje směr identifikovanéhozávislostiznaménka: pro a>0 jsou stejná, pro a<0- противоположны. Jeho absolutní hodnota - míra změny výsledné charakteristiky, když se charakteristika faktoru změní o jednotku měření.

Volný člen přímé regrese prozrazuje směr a jeho absolutní hodnota je kvantitativním měřítkem vlivu všech ostatních faktorů na výslednou charakteristiku.

Li< 0, pak se zdroj faktoru charakteristické pro jednotlivý objekt použije s méně, a kdy>0 Svyšší účinnost než je průměr pro celý soubor objektů.

Proveďme postregresní analýzu.

Koeficient v x přímé regrese je roven 3,57692 >0, proto s nárůstem (poklesem) výrobního výkonu roste (klesá) spotřeba elektřiny. Zvýšení výkonu výroby o 1 tis. udává průměrné zvýšení spotřeby elektřiny o 3,57692 tis. kWh.

2. Volný člen přímé regrese je roven 3,19231, proto vliv dalších faktorů zvyšuje sílu dopadu výstupu produktu na spotřebu el. absolutní měření o 3,19231 tisíce kWh.

3. Korelační koeficient 0,8235 odhaluje velmi blízkou závislost spotřeby elektřiny na výkonu produktu.

Podle Eq. regresní model snadné dělat předpovědi. K tomu se do regresní rovnice dosadí hodnoty x - objem výroby a předpovídá se spotřeba elektřiny. V tomto případě lze hodnoty x brát nejen v daném rozsahu, ale i mimo něj.

Udělejme předpověď o možné spotřebě energie v závodě s objemem výroby 4,5 tisíce kusů.

3,57692*4,5 + 3,19231= 19,288 45 tisíc kWh.

SEZNAM POUŽITÝCH ZDROJŮ

1. Zacharenkov S.N. Socioekonomická statistika: Učebnice a praktická příručka. -Mn.: BSEU, 2002.

2. Efimova M.R., Petrova E.V., Rumyantsev V.N. Obecná teorie statistiky. - M.: INFRA - M., 2000.

3. Eliseeva I.I. Statistika. - M.: Prospekt, 2002.

4. Obecná teorie statistiky / Pod obecný. vyd. O.E. Bashina, A.A. Spirina. - M.: Finance a statistika, 2000.

5. Socioekonomická statistika: Vzdělávací a praktická. příspěvek / Zacharenkov S.N. a další - Mn.: Jerevanská státní univerzita, 2004.

6. Socioekonomická statistika: učebnice. příspěvek. / Ed. Nesterovich S.R. - Mn.: BSEU, 2003.

7. Teslyuk I.E., Tarlovskaya V.A., Terlizhenko N. Statistics - Minsk, 2000.

8. Charčenko L.P. Statistika. - M.: INFRA - M, 2002.

9. Kharchenko L.P., Dolzhenkova V.G., Ionin V.G. Statistika. - M.: INFRA - M, 1999.

10. Ekonomická statistika / Ed. Yu.N. Ivanova - M., 2000.

Publikováno na Allbest.ru

...

Podobné dokumenty

    Výpočet aritmetického průměru pro intervalové řady distribuce. Definice obecný index fyzický objem obchodního obratu. Analýza absolutní změny celkových výrobních nákladů v důsledku změn fyzického objemu. Výpočet variačního koeficientu.

    test, přidáno 19.07.2010

    Podstata velkoobchodu, maloobchodu a veřejného obchodu. Vzorce pro výpočet individuálních a souhrnných indexů obratu. Výpočet charakteristik intervalové distribuční řady - aritmetický průměr, modus a medián, variační koeficient.

    práce v kurzu, přidáno 05.10.2013

    Výpočet plánovaného a skutečného objemu prodeje, procento plnění plánu, absolutní změna obratu. Stanovení absolutního růstu, průměrných temp růstu a nárůstu peněžních příjmů. Výpočet strukturálních průměrů: mody, mediány, kvartily.

    test, přidáno 24.02.2012

    Intervalové řady rozdělení bank podle objemu zisku. Zjištění modu a mediánu výsledné intervalové distribuční řady pomocí grafické metody a výpočtů. Výpočet charakteristik intervalových distribučních řad. Výpočet aritmetického průměru.

    test, přidáno 15.12.2010

    Vzorce pro stanovení průměrných hodnot intervalové řady - módy, mediány, disperze. Výpočet analytických ukazatelů dynamických řad pomocí řetězových a základních schémat, temp růstu a přírůstků. Koncept konsolidovaného indexu nákladů, cen, výdajů a obratu.

    práce v kurzu, přidáno 27.02.2011

    Pojem a účel, řád a pravidla pro konstrukci variační řady. Analýza homogenity dat ve skupinách. Ukazatele variace (fluktuace) znaku. Stanovení průměrné lineární a kvadratické odchylky, koeficient oscilace a variace.

    test, přidáno 26.04.2010

    Pojem modus a medián jako typické vlastnosti, postup a kritéria pro jejich stanovení. Hledání modu a mediánu v diskrétních a intervalových variačních řadách. Kvartily a decily jako další charakteristiky variační statistické řady.

    test, přidáno 9.11.2010

    Konstrukce intervalové distribuční řady na základě seskupovacích charakteristik. Charakteristika odchylky frekvenčního rozdělení od symetrického tvaru, výpočet ukazatelů špičatosti a asymetrie. Analýza ukazatelů rozvaha nebo výsledovka.

    test, přidáno 19.10.2014

    Převod empirických řad na diskrétní a intervalové. Stanovení průměrné hodnoty pro diskrétní řadu pomocí jejích vlastností. Výpočet pomocí diskrétní řady modu, mediánu, variačních ukazatelů (disperze, odchylka, oscilační koeficient).

    test, přidáno 17.04.2011

    Konstrukce statistické řady rozložení organizací. Grafické určení hodnot modu a mediánu. Blízkost korelační spojení pomocí koeficientu determinace. Stanovení výběrové chyby průměrného počtu zaměstnanců.

Nejjednodušším způsobem, jak shrnout statistický materiál, je sestrojit řady. Souhrnný výsledek statistický výzkum mohou existovat distribuční série. Distribuční řada ve statistice je uspořádané rozdělení jednotek populace do skupin podle jedné charakteristiky: kvalitativní nebo kvantitativní. Pokud je řada konstruována na kvalitativním základě, pak se nazývá atributivní, a pokud na kvantitativním základě, pak se nazývá variační.

Variační řada je charakterizována dvěma prvky: variantou (X) a frekvencí (f). Varianta je samostatná hodnota charakteristiky jednotlivé jednotky nebo skupiny populace. Číslo udávající, kolikrát se daná hodnota atributu vyskytuje, se nazývá frekvence. Pokud je frekvence vyjádřena jako relativní číslo, pak se nazývá frekvence. Variační řada může být intervalová, kdy jsou definovány hranice „od“ a „do“, nebo může být diskrétní, když je studovaná charakteristika charakterizována určitým číslem.

Podívejme se na konstrukci variačních řad na příkladech.

Příklad. a existují údaje o tarifních kategoriích 60 pracovníků v jedné z dílen závodu.

Rozdělte pracovníky podle tarifní kategorie, sestavte variační řadu.

Za tímto účelem zapíšeme všechny hodnoty charakteristiky ve vzestupném pořadí a spočítáme počet pracovníků v každé skupině.

Tabulka 1.4

Rozdělení pracovníků podle kategorií

Pracovní pozice (X)

Počet pracovníků

osoba (f)

v % z celkového počtu (zejména)

Obdrželi jsme variační diskrétní řadu, ve které je studovaná charakteristika (hodnost pracovníka) reprezentována určitým číslem. Pro přehlednost jsou řady variací znázorněny graficky. Na základě této rozvodné řady byla zkonstruována rozvodná plocha.

Rýže. 1.1. Polygon pro rozdělení pracovníků podle tarifních kategorií

Budeme zvažovat konstrukci intervalové řady se stejnými intervaly pomocí následujícího příkladu.

Příklad. Jsou známy údaje o hodnotě fixního kapitálu 50 společností v milionech rublů. Je nutné ukázat rozložení firem podle nákladů na fixní kapitál.

Abychom ukázali rozdělení firem podle nákladů na fixní kapitál, vyřešíme nejprve otázku počtu skupin, které chceme zvýraznit. Předpokládejme, že jsme se rozhodli identifikovat 5 skupin podniků. Poté určíme velikost intervalu ve skupině. K tomu použijeme vzorec

Podle našeho příkladu.

Přičtením hodnoty intervalu k minimální hodnotě atributu získáme skupiny firem podle nákladů na fixní kapitál.

Jednotka s dvojnásobnou hodnotou patří do skupiny, kde působí jako horní limit (tj. hodnota atributu 17 půjde do první skupiny, 24 do druhé atd.).

Spočítejme počet továren v každé skupině.

Tabulka 1.5

Rozdělení firem podle hodnoty fixního kapitálu (v milionech rublů)

Náklady na fixní kapitál
v milionech rublů (X)

Počet firem
(frekvence) (f)

Akumulované frekvence
(kumulativní)

Podle tohoto rozdělení byla získána řada variačních intervalů, ze které vyplývá, že 36 firem má fixní kapitál v hodnotě od 10 do 24 milionů rublů. atd.

Intervalové distribuční řady lze graficky znázornit ve formě histogramu.

Výsledky zpracování dat jsou uvedeny v statistické tabulky. Statistické tabulky obsahují vlastní předmět a predikát.

Subjekt je celek nebo část celku, který je charakterizován.

Predikáty jsou ukazatele, které charakterizují subjekt.

Rozlišují se tabulky: jednoduché a skupinové, kombinační, s jednoduchým a složitým rozvojem predikátu.

Jednoduchá tabulka v předmětu obsahuje seznam jednotlivých jednotek.

Pokud předmět obsahuje seskupení jednotek, pak se taková tabulka nazývá tabulka skupin. Například skupina podniků podle počtu pracovníků, skupiny obyvatel podle pohlaví.

Předmět kombinační tabulky obsahuje seskupení podle dvou nebo více charakteristik. Populace je například rozdělena podle pohlaví do skupin podle vzdělání, věku atp.

Kombinační tabulky obsahují informace, které umožňují identifikovat a charakterizovat vztah řady ukazatelů a vzor jejich změn v prostoru i čase. Aby byla tabulka při rozvíjení jejího předmětu jasná, omezte se na dvě nebo tři charakteristiky, přičemž pro každou z nich vytvořte omezený počet skupin.

Predikát v tabulkách lze rozvíjet různými způsoby. Při jednoduchém vývoji predikátu jsou všechny jeho ukazatele umístěny nezávisle na sobě.

Při komplexním vývoji predikátu se ukazatele vzájemně kombinují.

Při konstrukci jakékoli tabulky je třeba vycházet z účelů studie a obsahu zpracovávaného materiálu.

Statistika využívá kromě tabulek také grafy a diagramy. Graf – statistická data jsou znázorněna pomocí geometrické tvary. Grafy jsou rozděleny na spojnicové a sloupcové, ale mohou existovat i figurové grafy (kresby a symboly), koláčové grafy (kruh je brán jako hodnota celé populace a jsou zobrazeny plochy jednotlivých sektorů specifická gravitace nebo jeho podíl komponenty), radiální diagramy (konstruované na základě polárních souřadnic). Kartogram je kombinace vrstevnicová mapa nebo plán lokality s diagramem.

2. Koncept distribuční série. Diskrétní a intervalové distribuční řady

Distribuční řádky se nazývají seskupení zvláštního typu, ve kterých je pro každou charakteristiku, skupinu charakteristik nebo třídu charakteristik znám počet jednotek ve skupině nebo podíl tohoto počtu na celku. Tito. distribuční série– uspořádaná množina hodnot atributů uspořádaná vzestupně nebo sestupně s odpovídajícími váhami. Distribuční řady lze konstruovat buď pomocí kvantitativních nebo atributových charakteristik.

Distribuční řady konstruované na kvantitativním základě se nazývají variační řady. Oni jsou diskrétní a intervalové. Distribuční řadu lze konstruovat na základě spojitě se měnící charakteristiky (kdy charakteristika může nabývat libovolných hodnot v rámci libovolného intervalu) a na základě diskrétně se měnící charakteristiky (nabývá přesně definovaných celočíselných hodnot).

Oddělený Variační řada distribuce je seřazená sada možností s jejich odpovídajícími frekvencemi nebo podrobnostmi. Varianty diskrétní řady jsou diskrétně plynule se měnící hodnoty charakteristiky, obvykle výsledkem počítání.

Oddělený

Variační řady se obvykle konstruují, pokud se hodnoty studované charakteristiky mohou navzájem lišit alespoň o určitou konečnou hodnotu. V diskrétních řadách jsou specifikovány bodové hodnoty charakteristiky. Příklad : Rozdělení pánských obleků prodaných obchody za měsíc podle velikosti.

Interval

variační řada je uspořádaná množina intervalů různých hodnot náhodná proměnná s odpovídajícími frekvencemi nebo frekvencemi výskytů hodnotových hodnot v každé z nich. Intervalové řady jsou určeny k analýze rozložení plynule se měnící charakteristiky, jejíž hodnota se nejčastěji zaznamenává měřením nebo vážením. Varianty takové řady jsou seskupení.

Příklad : Rozdělení nákupů v obchodě s potravinami podle množství.

Pokud se v diskrétních variačních řadách frekvenční odezva vztahuje přímo k variantě řady, pak v intervalových řadách se vztahuje ke skupině variant.

Je vhodné analyzovat distribuční řady pomocí jejich grafického znázornění, které umožňuje posoudit tvar rozdělení a vzory. Samostatná řada je na grafu znázorněna jako přerušovaná čára - distribuční polygon. Pro jeho konstrukci jsou v pravoúhlém souřadnicovém systému seřazené (uspořádané) hodnoty proměnné charakteristiky vyneseny podél osy úsečky ve stejném měřítku a měřítko pro vyjádření frekvencí je vyneseno podél osy pořadnice.

Intervalové řady jsou znázorněny jako distribuční histogramy(tedy sloupcové grafy).

Při konstrukci histogramu jsou hodnoty intervalů vyneseny na ose x a frekvence jsou znázorněny obdélníky vytvořenými na odpovídajících intervalech. Výška sloupků v případě stejné intervaly musí být úměrné frekvencím.

Jakýkoli histogram lze převést na distribuční polygon, k tomu je nutné propojit vrcholy jeho obdélníků přímými segmenty.

2. Indexová metoda pro analýzu vlivu průměrného výkonu a průměrného počtu zaměstnanců na změny objemu výroby

Indexová metoda slouží k analýze dynamiky a srovnání obecných ukazatelů, jakož i faktorů ovlivňujících změny úrovní těchto ukazatelů. Pomocí indexů je možné identifikovat vliv průměrného výkonu a průměrného počtu zaměstnanců na změny objemu výroby. Tento problém je řešen konstrukcí systému analytických indexů.

Index objemu výroby souvisí s průměrným počtem zaměstnanců a index průměrného výkonu stejně jako objem výroby (Q) souvisí s výkonem ( w) a čísla ( r) .

Můžeme dojít k závěru, že objem výroby se bude rovnat součinu průměrného výkonu a průměrného počtu zaměstnanců:

Q = w r, kde Q je objem výroby,

w - průměrný výkon,

r – průměrný počet zaměstnanců.

Jak vidíte, mluvíme o vztahu jevů ve statice: součin dvou faktorů dává celkový objem výsledného jevu. Je také zřejmé, že toto spojení je funkční, proto je dynamika tohoto spojení studována pomocí indexů. Pro uvedený příklad se jedná o následující systém:

Jw × Jr = Jwr.

Například index objemu výroby Jwr, jako index produktivního jevu, lze rozložit na dva faktorové indexy: index průměrného výstupu (Jw) a index průměrného počtu zaměstnanců (Jr):

Index Index Index

objem průměrné mzdy

výrobní číslo výstupu

Kde J w- index produktivity práce vypočítaný pomocí Laspeyresova vzorce;

Jr- index počtu zaměstnanců vypočtený pomocí Paascheho vzorce.

K určení vlivu jednotlivých faktorů na tvorbu úrovně výkonnostního ukazatele se používají indexové systémy, které umožňují 2 známé hodnoty indexy k určení hodnoty neznámého.

Na základě výše uvedené soustavy indexů lze nalézt i absolutní nárůst objemu výroby, rozložený na vliv faktorů.

1. Obecné zvýšení objemu výroby:

∆wr = ∑w 1 r 1 - ∑w 0 r 0 .

2. Zvýšení v důsledku působení ukazatele průměrného výstupu:

∆wr/w = ∑w 1 r 1 - ∑w 0 r 1 .

3. Zvýšení v důsledku působení ukazatele průměrného počtu zaměstnanců:

∆wr/r = ∑w 0 r 1 - ∑w 0 r 0

∆wr = ∆wr/w + ∆wr/r.

Příklad. Následující údaje jsou známy

Dokážeme určit, jak se měnil objem výroby v relativním a absolutním vyjádření a jak jednotlivé faktory tuto změnu ovlivnily.

Objem výroby byl:

v základním období

w 0 * r 0 = 2 000 * 90 = 180 000,

a ve zprávách

w 1 * r 1 = 2100 * 100 = 210 000.

V důsledku toho se objem výroby zvýšil o 30 000 nebo 1,16%.

∆wr=∑w 1 r 1 - ∑w 0 r 0= (210000-180000)=30000

nebo (210000:180000)*100%=1,16%.

Tato změna v objemu výroby byla způsobena:

1) zvýšení průměrného počtu zaměstnanců o 10 lidí nebo 111,1 %

r1/r0 = 100/90 = 1,11 nebo 111,1 %.

V absolutním vyjádření se díky tomuto faktoru objem výroby zvýšil o 20 000:

w 0 r 1 – w 0 r 0 = w 0 (r 1 -r 0) = 2000 (100-90) = 20 000.

2) zvýšení průměrného výkonu o 105 % nebo 10 000:

w 1 r 1 /w 0 r 1 = 2100*100/2000*100 = 1,05 nebo 105 %.

V absolutním vyjádření je nárůst:

w 1 r 1 – w 0 r 1 = (w 1 -w 0) r 1 = (2100-2000)*100 = 10000.

Kombinovaný vliv faktorů byl tedy:

1. V absolutním vyjádření

10000 + 20000 = 30000

2. V relativním vyjádření

1,11 * 1,05 = 1,16 (116%)

Nárůst je tedy 1,16 %. Oba výsledky byly získány dříve.

Slovo „index“ v překladu znamená ukazatel, ukazatel. Ve statistice je index interpretován jako relativní ukazatel, který charakterizuje změnu jevu v čase, prostoru nebo ve srovnání s plánem. Protože index je relativní hodnota, názvy indexů jsou shodné s názvy relativních hodnot.

V případech, kdy analyzujeme změny v čase porovnávaných produktů, můžeme si položit otázku, jak se mění složky indexu (cena, fyzický objem, struktura výroby nebo tržeb) v různých podmínkách (v různých oblastech) jednotlivé druhy produkty). V tomto ohledu jsou konstruovány indexy konstantního složení, proměnného složení a strukturálních změn.

Index stálého (pevného) složení – Jedná se o index, který charakterizuje dynamiku průměrné hodnoty pro stejnou fixní strukturu populace.

Principem konstrukce indexu konstantního složení je eliminovat dopad změn ve struktuře vah na indexovanou hodnotu výpočtem vážené průměrné úrovně indexovaného ukazatele se stejnými vahami.

Konstantní index složení je ve formě shodný s indexem agregátu. Nejběžnější je agregovaná forma.

Index konstantního složení je počítán s váhami pevně stanovenými na úrovni jednoho období a ukazuje změnu pouze indexované hodnoty. Index konstantního složení eliminuje vliv změn struktury vah na indexovanou hodnotu tím, že počítá váženou průměrnou úroveň indexovaného ukazatele se stejnými vahami. Indexy stálého složení porovnávají ukazatele vypočítané na základě nezměněné struktury jevů.

Popis změn proměnné charakteristiky se provádí pomocí distribučních řad.

Statistické distribuční řady- jedná se o uspořádané rozdělení jednotek statistické populace do samostatných skupin podle určité proměnlivé charakteristiky.

Statistické řady postavené na kvalitativním základě se nazývají atributivní. Pokud je distribuční řada založena na kvantitativní charakteristice, pak řada je variační.

Variační řady se zase dělí na diskrétní a intervalové. V jádru oddělenýřádek distribuce leží diskrétní (nespojité) znaménko, které má konkrétní číselné hodnoty(počet přestupků, počet odvolání občanů právní pomoc). Interval distribuční řada je konstruována na základě spojitého atributu, který může nabývat libovolné hodnoty z daného rozmezí (věk odsouzeného, ​​trest odnětí svobody atd.)

Každá statistická distribuční řada obsahuje dva povinné prvky – řadu a možnosti četnosti. Možnosti (x i) – jednotlivé hodnoty charakteristiky, kterou nabývá v distribuční řadě. Frekvence (f i) jsou číselné hodnoty, které ukazují, kolikrát se určité možnosti vyskytují v distribuční řadě. Součet všech frekvencí se nazývá objem populace.

Frekvence vyjádřené v relativních jednotkách (zlomcích nebo procentech) se nazývají frekvence ( w i). Součet frekvencí je roven jedné, pokud jsou frekvence vyjádřeny jako zlomky jednotky, nebo 100, pokud jsou vyjádřeny v procentech. Použití frekvencí umožňuje porovnat variační řady s různou velikostí populace. Frekvence jsou určeny následujícím vzorcem:

Pro konstrukci diskrétní řady se seřadí všechny jednotlivé hodnoty charakteristiky vyskytující se v řadě a poté se vypočítá frekvence opakování každé hodnoty. Distribuční řada je sestavena v myšlence tabulky sestávající ze dvou řádků a sloupců, z nichž jeden obsahuje hodnoty variant řady x i, ve druhé – hodnoty frekvence fi.

Uvažujme příklad konstrukce diskrétní variační řady.

Příklad 3.1 . Podle ministerstva vnitra byly evidovány trestné činy spáchané ve městě N nezletilými.

17 13 15 16 17 15 15 14 16 13 14 17 14 15 15 16 16 15 14 15 15 14 16 16 14 17 16 15 16 15 13 15 15 13 15 14 15 13 17 14.

Sestrojte diskrétní distribuční řadu.

Řešení .

Nejprve je nutné seřadit údaje o věku nezletilých, tzn. zapište je vzestupně.

13 13 13 13 13 14 14 14 14 14 14 14 14 15 15 15 15 15 15 15 15 15 15 15 15 15 15 16 16 16 16 16 16 16 16 17 17 17 17 17



Tabulka 3.1

Frekvence tedy odrážejí počet lidí daného věku, např. 5 lidem je 13 let, 8 lidem 14 let atd.

Konstrukce interval distribuční řady se provádějí obdobně jako u rovnointervalového seskupování podle kvantitativního kritéria, tj. nejprve se určí optimální počet skupin, do kterých bude populace rozdělena, stanoví se hranice intervalů podle skupin a vypočtou se četnosti .

Ukažme si konstrukci intervalové distribuční řady na následujícím příkladu.

Příklad 3.2 .

Sestavte intervalovou řadu na základě následujícího statistického agregátu - plat právníka v kanceláři, tisíc rublů:

16,0 22,2 25,1 24,3 30,5 32,0 17,0 23,0 19,8 27,5 22,0 18,9 31,0 21,5 26,0 27,4

Řešení.

Vezměme si optimální počet stejně intervalových skupin pro danou statistickou populaci na 4 (máme 16 možností). Velikost každé skupiny je tedy rovna:

a hodnota každého intervalu se bude rovnat:

Hranice intervalů jsou určeny vzorcem:

,

kde jsou dolní a horní hranice i-tého intervalu.

Po vynechání mezivýpočtů intervalových hranic zadáme jejich hodnoty (možnosti) a počet právníků (frekvence) s platy v rámci každého intervalu do tabulky 3.2, která ilustruje výslednou intervalovou řadu.

Tabulka 3.2

Analýza statistických distribučních řad může být provedena pomocí grafická metoda. Grafické znázornění distribučních řad vám umožňuje jasně znázornit vzorce rozložení studované populace zobrazením ve formě polygonu, histogramu a kumulace. Podívejme se na každý z uvedených grafů.

Polygon– přerušovaná čára, jejíž segmenty spojují body se souřadnicemi ( x i;f i). Obvykle se pro obrázek používá mnohoúhelník diskrétní série distribuce. Pro jeho konstrukci jsou na ose x vyneseny seřazené jednotlivé hodnoty atributu. x i, na pořadnici - frekvence odpovídající těmto hodnotám. Výsledkem je, že spojením bodů odpovídajících údajům označeným podél úsečky a ordinát se segmenty se získá přerušovaná čára, nazývaná mnohoúhelník. Uveďme příklad konstrukce frekvenčního polygonu.

Pro ilustraci konstrukce mnohoúhelníku si vezměme výsledek řešení příkladu 3.1 pro sestrojení diskrétní řady - obrázek 1. Věk odsouzených je vynesen podél osy x a počet mladistvých odsouzených daného věku je vykreslen podél pořadová osa. Analýzou tohoto testovacího místa lze říci, že největší počet odsouzených – 14 osob – je ve věku 15 let.

Obrázek 3.1 – Frekvenční rozsah diskrétní řady.

Mnohoúhelník může být také konstruován pro intervalovou řadu, v tomto případě jsou středy intervalů vyneseny podél osy úsečky a odpovídající frekvence jsou vyneseny podél osy pořadnice.

sloupcový graf– stupňovitý obrazec sestávající z obdélníků, jejichž základnami jsou intervaly hodnoty atributu a výšky se rovnají odpovídajícím četnostem. Histogram se používá pouze k zobrazení řad intervalového rozdělení. Pokud jsou intervaly nestejné, pak pro konstrukci histogramu nejsou na svislé ose vyneseny četnosti, ale poměr četnosti k šířce odpovídajícího intervalu. Histogram lze převést na distribuční polygon, pokud jsou středy jeho pruhů vzájemně spojeny segmenty.

Pro ilustraci konstrukce histogramu si vezměme výsledky konstrukce intervalové řady z příkladu 3.2 – obrázek 3.2.

Obrázek 3.2 – Histogram rozdělení platů právníků.

Pro grafické znázornění variačních řad se také používá kumulovat. Kumuluje se– křivka znázorňující řadu nashromážděných frekvencí a spojujících bodů se souřadnicemi ( x i;f i nak). Kumulativní četnosti se vypočítávají postupným sečtením všech četností distribuční řady a ukazují počet jednotek populace, které mají charakteristickou hodnotu ne větší, než je specifikovaná. Ukažme si výpočet kumulovaných četností pro variační intervalovou řadu uvedenou v příkladu 3.2 - tabulka 3.3.

Tabulka 3.3

Pro sestavení kumulací diskrétní distribuční řady se seřazené jednotlivé hodnoty atributu vynesou podél osy úsečky a akumulované frekvence, které jim odpovídají, se vynesou podél osy pořadnice. Při konstrukci kumulativní křivky intervalové řady bude mít první bod úsečku rovnou dolní hranici prvního intervalu a pořadnici rovnou 0. Všechny následující body musí odpovídat horní limit intervalech. Vytvořme kumulaci pomocí dat z tabulky 3.3 - obrázek 3.3.

Obrázek 3.3 – Křivka kumulativního rozdělení platů pro právníky.

Kontrolní otázky

1. Pojem statistické distribuční řady, její hlavní prvky.

2. Typy statistických distribučních řad. Jejich stručný popis.

3. Diskrétní a intervalové distribuční řady.

4. Metodika konstrukce diskrétních distribučních řad.

5. Metodika konstrukce intervalových distribučních řad.

6. Grafické znázornění diskrétních distribučních řad.

7. Grafické znázornění intervalových distribučních řad.

Úkoly

Problém 1. K dispozici jsou následující údaje o výkonu 25 studentů ve skupině TGP na relaci: 5, 4, 4, 4, 3, 2, 5, 3, 4, 4, 4, 3, 2, 5, 2, 5, 5, 2, 3, 3, 5, 4, 2, 3, 3. Sestavte diskrétní variační řadu rozdělení studentů podle známek obdržených během sezení. Pro výslednou řadu vypočítejte Frekvence, kumulované frekvence, kumulované frekvence. Vyvodit závěry.

Problém 2. V kolonii je 1000 odsouzených, jejich rozdělení podle věku je uvedeno v tabulce:

Nakreslete tuto řadu graficky. Vyvodit závěry.

Problém 3. K dispozici jsou následující údaje o podmínkách uvěznění vězňů:

5; 4; 2; 1; 6; 3; 4; 3; 2; 2; 3; 1; 17; 6; 2; 8; 5; 11; 9; 3; 5; 6; 4; 3; 10; 5; 25; 1; 12; 3; 3; 4; 9; 6; 5; 3; 4; 3; 5; 12; 4; 13; 2; 4; 6; 4; 14; 3; 11; 5; 4; 13; 2; 4; 6; 4; 14; 3; 11; 5; 4; 3; 12; 6.

Sestrojte intervalovou řadu rozdělení vězňů podle dob odnětí svobody. Vyvodit závěry.

Problém 4. K dispozici jsou následující údaje o rozložení odsouzených v kraji za sledované období dle věkové skupiny:

Nakreslete tuto řadu graficky a vyvodte závěry.



Novinka na webu

>

Nejoblíbenější