Domov Dětská stomatologie Sestrojte intervalovou distribuční řadu. Konstrukce intervalových variačních řad pro spojitá kvantitativní data

Sestrojte intervalovou distribuční řadu. Konstrukce intervalových variačních řad pro spojitá kvantitativní data

V mnoha případech statistická populace koček zahrnuje velké nebo dokonce více nekonečné číslo možnost, která se nejčastěji vyskytuje s plynulou variací, je prakticky nemožné a nepraktické vytvořit skupinu jednotek pro každou možnost. V takových případech je spojování statistických jednotek do skupin možné pouze na základě intervalu, tzn. taková skupina, která má určité limity pro hodnoty různé charakteristiky. Tyto limity jsou označeny dvěma čísly označujícími horní a dolní limit každé skupiny. Použití intervalů vede k vytvoření intervalové distribuční řady.

Interval rad je variační řada, jejíž varianty jsou prezentovány ve formě intervalů.

Intervalová řada může být tvořena se stejnými a nestejnými intervaly, přičemž volba principu pro konstrukci této řady závisí především na míře reprezentativnosti a vhodnosti statistické populace. Pokud je populace dostatečně velká (reprezentativní) co do počtu jednotek a je svým složením zcela homogenní, pak je vhodné založit tvorbu intervalové řady na rovnosti intervalů. Obvykle se pomocí tohoto principu tvoří intervalová řada pro ty populace, kde je rozsah variace relativně malý, tzn. maximální a minimální možnosti se od sebe obvykle několikrát liší. V tomto případě se hodnota stejných intervalů vypočítá jako poměr rozsahu variace charakteristiky k danému počtu vytvořených intervalů. K určení rovných A interval, lze použít Sturgessův vzorec (obvykle s malou variací intervalových charakteristik a velkým počtem jednotek ve statistické populaci):

kde x i - hodnota stejného intervalu; X max, X min - maximální a minimální možnosti ve statistickém agregátu; n . - počet jednotek v souhrnu.

Příklad. Je vhodné vypočítat velikost stejného intervalu podle hustoty radioaktivní kontaminace cesiem - 137 ve 100 osadách Krasnopolského okresu Mogilevské oblasti, pokud je známo, že počáteční (minimální) možnost je rovna 1 km / km 2, koneč ( maximum) - 65 ki/km 2. Použití vzorce 5.1. dostaneme:

Proto k vytvoření intervalové řady s ve stejných intervalech podle hustoty kontaminace cesiem - 137 sídel Krasnopolského kraje, velikost stejného intervalu může být 8 ki/km 2.

Za podmínek nerovnoměrného rozložení, tzn. když jsou maximální a minimální možnosti stonásobné, při vytváření intervalové řady můžete použít princip nerovný intervalech. Nestejné intervaly se obvykle zvětšují, když přecházíme na větší hodnoty charakteristiky.

Tvar intervalů může být uzavřený nebo otevřený. ZAVŘENO Je obvyklé volat intervaly, které mají dolní i horní hranici. OTEVŘENO intervaly mají pouze jednu hranici: v prvním intervalu je horní hranice, v posledním je dolní hranice.

Hodnocení intervalové řady, zejména v nestejných intervalech, je vhodné provádět s přihlédnutím hustota distribuce, nejjednodušší způsob, jak vypočítat, jaký je poměr místní frekvence (nebo frekvence) k velikosti intervalu.

Chcete-li prakticky vytvořit intervalovou řadu, můžete použít rozložení tabulky. 5.3.

Tabulka 5.3. Postup pro vytvoření intervalové řady osad Krasnopolský okres podle hustoty radioaktivního zamoření cesiem -137

Hlavní výhodou intervalové řady je její maximum kompaktnost. zároveň jsou v intervalové distribuční řadě jednotlivé varianty charakteristiky skryty v odpovídajících intervalech

Při grafickém znázornění intervalové řady v systému pravoúhlých souřadnic jsou horní hranice intervalů vyneseny na ose x a místní frekvence řady jsou vyneseny na ose pořadnice. Grafická konstrukce intervalové řady se liší od konstrukce distribučního polygonu v tom, že každý interval má dolní a horní hranici a dvě úsečky odpovídají jedné hodnotě pořadnice. Na grafu intervalové řady tedy není vyznačen bod jako v mnohoúhelníku, ale přímka spojující dva body. Tyto vodorovné čáry jsou navzájem spojeny svislými čarami a získá se obrazec stupňovitého mnohoúhelníku, který se běžně nazývá histogram distribuce (obr. 5.3).

Na grafická konstrukce intervalové řady na dostatečně velké statistické populaci se histogram blíží symetrický forma distribuce. V případech, kdy je statistický soubor zpravidla malý, asymetrické sloupcový graf.

V některých případech je vhodné vytvořit řadu akumulovaných frekvencí, tzn. kumulativnířádek. Kumulativní řada může být vytvořena na základě diskrétní nebo intervalové distribuční řady. Při grafickém znázornění kumulativní řady v systému pravoúhlých souřadnic se varianty vynesou na osu souřadnic a akumulované frekvence (frekvence) se vynesou na osu pořadnice. Výsledná zakřivená čára se obvykle nazývá kumulativní distribuce (obr. 5.4).

Formování a grafické znázornění různé typy variační řady přispívá ke zjednodušenému výpočtu hlavních statistických charakteristik, které jsou podrobně rozebrány v tématu 6, pomáhá lépe pochopit podstatu zákonitostí rozdělení statistické populace. Analýza variační série nabývá zvláštního významu v případech, kdy je nutné identifikovat a vysledovat vztah mezi možnostmi a frekvencemi (frekvencemi). Tato závislost se projevuje v tom, že počet případů na opci určitým způsobem souvisí s velikostí této opce, tzn. s rostoucími hodnotami proměnlivé charakteristiky prožívají frekvence (frekvence) těchto hodnot určité systematické změny. To znamená, že čísla ve sloupci frekvence (frekvence) nekolísají chaoticky, ale mění se v určitém směru, v určitém pořadí a posloupnosti.

Pokud frekvence vykazují určitou systematičnost ve svých změnách, pak to znamená, že jsme na cestě k identifikaci vzoru. Systém, řád, posloupnost v měnících se frekvencích je odrazem běžné důvody, všeobecné podmínky, charakteristické pro celou populaci.

Nemělo by se předpokládat, že distribuční vzor je vždy uveden v hotové podobě. Existuje poměrně hodně variačních sérií, ve kterých frekvence bizarně poskakují, někdy rostou, jindy klesají. V takových případech je vhodné zjistit, s jakou distribucí se výzkumník zabývá: buď tato distribuce nemá vůbec žádné inherentní vzorce, nebo její povaha ještě nebyla odhalena: První případ je vzácný, ale druhý případ je poměrně častým a velmi rozšířeným jevem.

Při vytváření intervalové řady tedy může být celkový počet statistických jednotek malý a každý interval obsahuje malý počet variant (například 1-3 jednotky). V takových případech nelze počítat s projevem jakéhokoli vzoru. K tomu, aby na základě náhodných pozorování mohl být získán přirozený výsledek, je nutné, aby zákon vstoupil v platnost vysoká čísla, tj. takže pro každý interval by nebylo několik, ale desítky a stovky statistických jednotek. Za tímto účelem se musíme pokusit co nejvíce zvýšit počet pozorování. Tohle je nejvíc správná cesta detekce vzorů v hromadných procesech. Pokud se to nezdá skutečnou příležitost zvýšit počet pozorování, pak lze identifikace vzoru dosáhnout snížením počtu intervalů v distribuční řadě. Snížením počtu intervalů ve variační řadě se tím zvýší počet frekvencí v každém intervalu. To znamená, že náhodné výkyvy každého statistická jednotka se navzájem překrývají, „vyhlazují“ a mění se ve vzor.

Tvorba a konstrukce variačních řad nám umožňuje získat pouze obecný, přibližný obrázek o rozložení statistické populace. Například histogram pouze v hrubé podobě vyjadřuje vztah mezi hodnotami charakteristiky a jejími četnostmi (četnostmi), proto jsou variační řady v podstatě pouze základem pro další, hloubkové studium vnitřní zákonitosti statického rozdělení.

TESTOVACÍ OTÁZKY K TÉMATU 5

1. Co je variace? Co způsobuje variace ve znaku ve statistické populaci?

2. Jaké typy různých charakteristik se mohou ve statistice vyskytovat?

3. Co je variační řada? Jaké typy variačních sérií mohou existovat?

4. Co je řazená řada? Jaké jsou jeho výhody a nevýhody?

5. Co je to diskrétní řada a jaké jsou její výhody a nevýhody?

6. Jaký je postup při tvorbě intervalové řady, jaké jsou její výhody a nevýhody?

7. Co je to grafické znázornění řazených, diskrétních, intervalových distribučních řad?

8. Co je to kumulace rozdělení a co charakterizuje?

Odeslat svou dobrou práci do znalostní báze je jednoduché. Použijte níže uvedený formulář

Dobrá práce na web">

Studenti, postgraduální studenti, mladí vědci, kteří využívají znalostní základnu ve svém studiu a práci, vám budou velmi vděční.

Vloženo na http://www.allbest.ru/

ÚKOL1

K dispozici jsou následující informace o mzdy zaměstnanci ve firmě:

Tabulka 1.1

Výše mzdy v konvenčním vyjádření. doupě. Jednotky

Je nutné sestrojit intervalovou distribuční řadu, podle které se má najít;

1) průměrný plat;

2) průměrná lineární odchylka;

4) směrodatná odchylka;

5) rozsah variací;

6) koeficient oscilace;

7) lineární koeficient variace;

8) jednoduchý variační koeficient;

10) medián;

11) koeficient asymetrie;

12) Pearsonův index asymetrie;

13) koeficient špičatosti.

Řešení

Jak víte, možnosti (rozpoznané hodnoty) jsou uspořádány ve vzestupném pořadí diskrétní variační série. S velkým počtem možnost (více než 10), i v případě diskrétní variace se konstruují intervalové řady.

Pokud je intervalová řada sestavena se sudými intervaly, pak se rozsah variace vydělí zadaným počtem intervalů. Navíc, pokud je výsledná hodnota celočíselná a jednoznačná (což je vzácné), pak se předpokládá, že délka intervalu je rovna tomuto číslu. V jiných případech vyrobeno zaokrouhlování Nezbytně PROTI boční zvýšit, Tak na poslední zbývající číslice byla sudá. Je zřejmé, že jak se délka intervalu zvyšuje, variační rozsah o částku rovnající se součinu počtu intervalů: o rozdíl mezi vypočtenou a počáteční délkou intervalu

A) Pokud je velikost rozšíření variačního rozsahu nevýznamná, pak se buď přičte k největší, nebo se odečte od nejmenší hodnoty charakteristiky;

b) Je-li velikost rozšíření variačního rozsahu patrná, pak, aby se střed rozsahu neposouval, rozdělí se přibližně na polovinu, přičemž se současně přidá k největšímu a odečte od nejnižší hodnoty podepsat.

Pokud se sestavuje intervalová řada s nestejnými intervaly, pak se proces zjednodušuje, ale přesto musí být délka intervalů vyjádřena jako číslo s poslední sudou číslicí, což značně zjednodušuje následné výpočty číselných charakteristik.

30 je velikost vzorku.

Vytvořme intervalovou distribuční řadu pomocí Sturgesova vzorce:

K = 1 + 3,32*log n,

K - počet skupin;

K = 1 + 3,32 x lg30 = 5,91 = 6

Pomocí vzorce zjistíme rozsah atributu - mzdy pracovníků v podniku - (x).

R= xmax - xmin a děleno 6; R= 195-112=83

Pak bude délka intervalu l pruh = 83:6 = 13,83

Začátek prvního intervalu bude 112. Přidání k 112 l ras = 13,83, dostaneme jeho konečnou hodnotu 125,83, což je také začátek druhého intervalu atd. konec pátého intervalu - 195.

Při hledání frekvencí je třeba se řídit pravidlem: „pokud se hodnota prvku shoduje s hranicí vnitřního intervalu, pak by měla být připsána předchozímu intervalu“.

Získáme intervalovou řadu frekvencí a kumulativní frekvence.

Tabulka 1.2

Mzdu tedy mají 3 zaměstnanci. poplatek od 112 do 125,83 konvenčních peněžních jednotek. Nejvyšší plat poplatek od 181,15 do 195 konvenčních peněžních jednotek. pouze 6 zaměstnanců.

Pro výpočet numerických charakteristik transformujeme intervalovou řadu na diskrétní řadu, přičemž jako možnost bereme střed intervalů:

Tabulka 1.3

14131,83

Použití vzorce váženého aritmetického průměru

konvenční peněžní jednotky

Průměrná lineární odchylka:

kde xi je hodnota studovaného znaku pro i-tou jednotku populace,

Průměrná hodnota studovaného znaku.

Vloženo na http://www.allbest.ru/

Zveřejněno na http://www.allbest.ru/

Konvenční peněžní jednotky

Standardní odchylka:

Rozptyl:

Relativní rozsah variace (koeficient oscilace): c= R:,

Relativní lineární odchylka: q = L:

Variační koeficient: V = y:

Oscilační koeficient ukazuje relativní kolísání extrémních hodnot charakteristiky kolem aritmetického průměru a variační koeficient charakterizuje stupeň a homogenitu populace.

c= R: = 83 / 159,485 * 100 % = 52,043 %

Rozdíl mezi krajními hodnotami je tedy o 5,16 % (=94,84 %-100 %) menší než průměrná mzda zaměstnanců v podniku.

q = L: = 17,765/ 159,485*100 % = 11,139 %

V = y: = 21,704/ 159,485*100 % = 13,609 %

Variační koeficient je menší než 33 %, což ukazuje na slabé kolísání mezd pracovníků v podniku, tzn. že průměrná hodnota je typickou charakteristikou dělnických mezd (obyvatelstvo je homogenní).

V intervalových distribučních řadách móda určeno vzorcem -

Frekvence modálního intervalu, tj. intervalu obsahujícího největší počet možností;

Četnost intervalu předcházejícího modálu;

Frekvence intervalu následujícího po modálním;

Délka modálního intervalu;

Dolní mez modálního intervalu.

Pro určení mediány v intervalové řadě použijeme vzorec

kde je kumulativní (akumulovaná) frekvence intervalu předcházejícího mediánu;

Dolní mez středního intervalu;

Medián intervalové frekvence;

Délka středního intervalu.

Medián intervalu- interval, jehož akumulovaná frekvence (=3+3+5+7) přesahuje polovinu součtu frekvencí - (153,49; 167,32).

Pojďme vypočítat asymetrii a špičatost, pro které vytvoříme nový list:

Tabulka 1.4

Faktické údaje

Údaje o výpočtech

Vypočítejme moment třetího řádu

Proto je asymetrie rovna

Od 0,3553 0,25 je asymetrie považována za významnou.

Vypočítejme moment čtvrtého řádu

Proto se špičatost rovná

Protože< 0, то эксцесс является плосковершинным.

Stupeň asymetrie lze určit pomocí Pearsonova koeficientu asymetrie (As): oscilace hodnota vzorku obrat Obr.

kde je aritmetický průměr distribuční řady; -- móda; -- standardní odchylka.

Při symetrickém (normálním) rozdělení = Mo je tedy koeficient asymetrie nulový. Je-li As > 0, pak existuje více módů, proto existuje pravotočivá asymetrie.

Pokud As< 0, то méně módy, proto existuje levostranná asymetrie. Koeficient asymetrie se může lišit od -3 do +3.

Rozložení není symetrické, ale má levostrannou asymetrii.

ÚKOL 2

Jaká by měla být velikost vzorku, aby s pravděpodobností 0,954 výběrová chyba nepřesáhla 0,04, pokud je na základě předchozích šetření známo, že rozptyl je 0,24?

Řešení

Velikost vzorku pro neopakující se vzorkování se vypočítá pomocí vzorce:

t - koeficient spolehlivosti (s pravděpodobností 0,954 se rovná 2,0; určeno z tabulek integrálů pravděpodobnosti),

y2=0,24 - standardní odchylka;

10 000 lidí - velikost vzorku;

Dx =0,04 - maximální chyba výběrového průměru.

S pravděpodobností 95,4 % lze konstatovat, že velikost vzorku zajišťující relativní chybu do 0,04 by měla být minimálně 566 rodin.

ÚKOL3

K dispozici jsou následující údaje o příjmech z hlavních činností podniku, miliony rublů.

Chcete-li analyzovat řadu dynamiky, určete následující ukazatele:

1) řetěz a základní:

Absolutní zvýšení;

Rychlosti růstu;

Tempo růstu;

2) průměr

Úroveň řádku dynamiky;

Absolutní nárůst;

Tempo růstu;

Míra nárůstu;

3) absolutní hodnota zvýšení o 1 %.

Řešení

1. Absolutní nárůst (Dy)- toto je rozdíl mezi další úrovní série a předchozí (nebo základní):

řetězec: DN = yi - yi-1,

základní: DN = yi - y0,

уi - úroveň řádku,

i - číslo úrovně řádku,

y0 - úroveň základního roku.

2. Rychlost růstu (út) je poměr následné úrovně řady a předchozí úrovně (nebo základního roku 2001):

řetězec: Tu = ;

základní: Tu =

3. Rychlost růstu (TD) je poměr absolutního růstu k předchozí úrovni, vyjádřený v %.

řetězec: Tu = ;

základní: Tu =

4. Absolutní hodnota zvýšení o 1 % (A)- jedná se o poměr absolutního růstu řetězce k tempu růstu, vyjádřený v %.

A =

Průměrná úroveň řádku vypočítané pomocí vzorce aritmetického průměru.

Průměrná výše příjmu z hlavních činností za 4 roky:

Průměrný absolutní nárůst vypočítá se podle vzorce:

kde n je počet úrovní řady.

V průměru za rok vzrostly příjmy z hlavních činností o 3,333 milionu rublů.

Průměrná roční míra růstu vypočítaný pomocí vzorce geometrického průměru:

уn je konečná úroveň řádku,

y0 - První úroveňřádek.

Tu = 100 % = 102,174 %

Průměrná roční míra růstu vypočítá se podle vzorce:

T? = Tu - 100 % = 102,74 % - 100 % = 2,74 %.

V průměru za rok se tak výnosy z hlavní činnosti podniku zvýšily o 2,74 %.

ÚKOLYA4

Vypočítat:

1. Jednotlivé cenové indexy;

2. Index obecného obchodního obratu;

3. Souhrnný cenový index;

4. Souhrnný index fyzického objemu prodeje zboží;

5. Rozdělit absolutní nárůst hodnoty obchodního obratu podle faktorů (v důsledku změn cen a počtu prodaného zboží);

6. Ke všem získaným ukazatelům vyvozte stručné závěry.

Řešení

1. Jednotlivé cenové indexy pro produkty A, B, C činily dle podmínky -

ipA = 1,20; iрБ=1,15; iрВ=1,00.

2. Vypočteme obecný index obchodního obratu pomocí vzorce:

I w = = 1470/1045*100 % = 140,67 %

Obchodní obrat vzrostl o 40,67 % (140,67 %-100 %).

V průměru se ceny komodit zvýšily o 10,24 %.

Výše dodatečných nákladů kupujících ze zvýšení ceny:

w(p) =? p1q1 - ? p0q1 = 1470 - 1333,478 = 136,522 milionů rublů.

V důsledku rostoucích cen museli kupující utratit dalších 136,522 milionu rublů.

4. Obecný index fyzického objemu obchodního obratu:

Fyzický objem obchodního obratu vzrostl o 27,61 %.

5. Stanovme celkovou změnu obchodního obratu ve druhém období ve srovnání s prvním obdobím:

w = 1470-1045 = 425 milionů rublů.

z důvodu změny cen:

W(p) = 1470 - 1333,478 = 136,522 milionů rublů.

v důsledku změn fyzického objemu:

w(q) = 1333,478 - 1045 = 288,478 milionů rublů.

Obrat zboží vzrostl o 40,67 %. Ceny v průměru za 3 zboží vzrostly o 10,24 %. Fyzický objem obchodního obratu vzrostl o 27,61 %.

Obecně se objem prodeje zvýšil o 425 milionů rublů, včetně nárůstu cen o 136,522 milionu rublů a v důsledku zvýšení objemu prodeje o 288,478 milionu rublů.

ÚKOL5

Následující údaje jsou k dispozici pro 10 továren v jednom odvětví.

Číslo rostliny

Výstup produktu, tisíc ks. (X)

Na základě uvedených údajů:

I) potvrdit ustanovení logické analýzy o přítomnosti lineární korelace mezi faktorovou charakteristikou (objem produktu) a výslednou charakteristikou (spotřeba elektřiny), vykreslit výchozí data do grafu korelačního pole a vyvodit závěry o tvaru vztahu, uveďte jeho vzorec;

2) určit parametry rovnice spojení a vynést výslednou teoretickou přímku do grafu korelačního pole;

3) vypočítat lineární korelační koeficient,

4) vysvětlit význam ukazatelů získaných v odstavcích 2) a 3);

5) pomocí výsledného modelu proveďte prognózu možné spotřeby energie v závodě s objemem výroby 4,5 tisíce kusů.

Řešení

Údaj atributu - objem výroby (faktor), bude označen xi; znak - spotřeba elektřiny (výsledek) přes yi; body se souřadnicemi (x, y) jsou vyneseny na korelačním poli OXY.

Body korelačního pole jsou umístěny podél určité přímky. Vztah je tedy lineární, budeme hledat regresní rovnici ve tvaru přímky Уx=ax+b. K jeho nalezení použijeme soustavu normálních rovnic:

Vytvoříme kalkulační tabulku.

Pomocí zjištěných průměrů sestavíme systém a vyřešíme jej s ohledem na parametry a a b:

Dostaneme tedy regresní rovnici pro y na x: = 3,57692 x + 3,19231

Na korelačním poli postavíme regresní přímku.

Dosazením hodnot x ze sloupce 2 do regresní rovnice získáme vypočítané (sloupec 7) a porovnáme je s údaji y, což se odráží ve sloupci 8. Mimochodem, správnost výpočtů je potvrzena shoda průměrných hodnot ya.

Součinitellineární korelace vyhodnotí blízkost vztahu mezi charakteristikami x a y a vypočte se pomocí vzorce

Úhlový koeficient přímé regrese a (v x) charakterizuje směr identifikovanéhozávislostiznaménka: pro a>0 jsou stejná, pro a<0- противоположны. Jeho absolutní hodnota - míra změny výsledné charakteristiky, když se charakteristika faktoru změní o jednotku měření.

Volný člen přímé regrese prozrazuje směr a jeho absolutní hodnota je kvantitativním měřítkem vlivu všech ostatních faktorů na výslednou charakteristiku.

Li< 0, pak se zdroj faktoru charakteristické pro jednotlivý objekt použije s méně, a kdy>0 Svyšší účinnost než je průměr pro celý soubor objektů.

Proveďme postregresní analýzu.

Koeficient v x přímé regrese je roven 3,57692 >0, proto s nárůstem (poklesem) výrobního výkonu roste (klesá) spotřeba elektřiny. Zvýšení výkonu výroby o 1 tis. udává průměrné zvýšení spotřeby elektřiny o 3,57692 tis. kWh.

2. Volný člen přímé regrese je roven 3,19231, proto vliv dalších faktorů zvyšuje sílu dopadu výstupu produktu na spotřebu el. absolutní měření o 3,19231 tisíce kWh.

3. Korelační koeficient 0,8235 odhaluje velmi blízkou závislost spotřeby elektřiny na výkonu produktu.

Podle Eq. regresní model snadné dělat předpovědi. K tomu se do regresní rovnice dosadí hodnoty x - objem výroby a předpovídá se spotřeba elektřiny. V tomto případě lze hodnoty x brát nejen v daném rozsahu, ale i mimo něj.

Udělejme předpověď o možné spotřebě energie v závodě s objemem výroby 4,5 tisíce kusů.

3,57692*4,5 + 3,19231= 19,288 45 tisíc kWh.

SEZNAM POUŽITÝCH ZDROJŮ

1. Zacharenkov S.N. Socioekonomická statistika: Učebnice a praktická příručka. -Mn.: BSEU, 2002.

2. Efimova M.R., Petrova E.V., Rumyantsev V.N. Obecná teorie statistiky. - M.: INFRA - M., 2000.

3. Eliseeva I.I. Statistika. - M.: Prospekt, 2002.

4. Obecná teorie statistiky / Pod obecný. vyd. O.E. Bashina, A.A. Spirina. - M.: Finance a statistika, 2000.

5. Socioekonomická statistika: Vzdělávací a praktická. příspěvek / Zacharenkov S.N. a další - Mn.: Jerevanská státní univerzita, 2004.

6. Socioekonomická statistika: učebnice. příspěvek. / Ed. Nesterovich S.R. - Mn.: BSEU, 2003.

7. Teslyuk I.E., Tarlovskaya V.A., Terlizhenko N. Statistics. - Minsk, 2000.

8. Charčenko L.P. Statistika. - M.: INFRA - M, 2002.

9. Kharchenko L.P., Dolzhenkova V.G., Ionin V.G. Statistika. - M.: INFRA - M, 1999.

10. Ekonomická statistika / Ed. Yu.N. Ivanova - M., 2000.

Publikováno na Allbest.ru

...

Podobné dokumenty

    Výpočet aritmetického průměru pro intervalovou distribuční řadu. Definice obecný index fyzický objem obchodního obratu. Analýza absolutní změny celkových výrobních nákladů v důsledku změn fyzického objemu. Výpočet variačního koeficientu.

    test, přidáno 19.07.2010

    Podstata velkoobchodu, maloobchodu a veřejného obchodu. Vzorce pro výpočet individuálních a souhrnných indexů obratu. Výpočet charakteristik intervalové distribuční řady - aritmetický průměr, modus a medián, variační koeficient.

    práce v kurzu, přidáno 05.10.2013

    Výpočet plánovaného a skutečného objemu prodeje, procento plnění plánu, absolutní změna obratu. Stanovení absolutního růstu, průměrných temp růstu a nárůstu peněžních příjmů. Výpočet strukturálních průměrů: mody, mediány, kvartily.

    test, přidáno 24.02.2012

    Intervalové řady rozdělení bank podle objemu zisku. Zjištění modu a mediánu výsledné intervalové distribuční řady grafická metoda a podle výpočtů. Výpočet charakteristik intervalových distribučních řad. Výpočet aritmetického průměru.

    test, přidáno 15.12.2010

    Vzorce pro stanovení průměrných hodnot intervalové řady - módy, mediány, disperze. Výpočet analytických ukazatelů dynamických řad pomocí řetězových a základních schémat, temp růstu a přírůstků. Koncept konsolidovaného indexu nákladů, cen, výdajů a obratu.

    práce v kurzu, přidáno 27.02.2011

    Pojem a účel, řád a pravidla pro konstrukci variační řady. Analýza homogenity dat ve skupinách. Indikátory variace (fluktuace) znaku. Stanovení průměrné lineární a kvadratické odchylky, koeficient oscilace a variace.

    test, přidáno 26.04.2010

    Pojem modus a medián jako typické vlastnosti, postup a kritéria pro jejich stanovení. Hledání modu a mediánu v diskrétních a intervalových variačních řadách. Kvartily a decily jako další charakteristiky variace statistická řada.

    test, přidáno 9.11.2010

    Konstrukce intervalové distribuční řady na základě seskupovacích charakteristik. Charakteristika odchylky frekvenčního rozdělení od symetrického tvaru, výpočet ukazatelů špičatosti a asymetrie. Analýza ukazatelů rozvaha nebo výsledovka.

    test, přidáno 19.10.2014

    Převod empirických řad na diskrétní a intervalové. Stanovení průměrné hodnoty pro diskrétní řadu pomocí jejích vlastností. Výpočet pomocí diskrétní řady modu, mediánu, variačních ukazatelů (disperze, odchylka, oscilační koeficient).

    test, přidáno 17.04.2011

    Konstrukce statistické řady rozložení organizací. Grafické určení hodnot modu a mediánu. Blízkost korelační spojení pomocí koeficientu determinace. Stanovení výběrové chyby průměrného počtu zaměstnanců.

Příklad řešení testu z matematické statistiky

Problém 1

Počáteční údaje : studenti určité skupiny 30 osob složili zkoušku z kurzu „Informatika“. Známky, které studenti obdrží, tvoří následující řadu čísel:

I. Vytvořme variační řadu

m X

w X

m X nak

w X nak

Celkový:

II. Grafické znázornění statistických informací.

III. Číselné charakteristiky vzorku.

1. Aritmetický průměr

2. Geometrický průměr

3. Móda

4. Medián

222222333333333 | 3 34444444445555

5. Rozptyl vzorku

7. Variační koeficient

8. Asymetrie

9. Koeficient asymetrie

10. Přemíra

11. Kurtózní koeficient

Problém 2

Počáteční údaje : Studenti některé skupiny napsali svůj závěrečný test. Skupinu tvoří 30 lidí. Body získané studenty tvoří následující řadu čísel

Řešení

I. Protože charakteristika nabývá mnoha různých hodnot, sestrojíme pro ni intervalovou variační řadu. Chcete-li to provést, nejprve nastavte hodnotu intervalu h. Použijme Stangerův vzorec

Vytvořme intervalovou stupnici. V tomto případě budeme brát jako horní hranici prvního intervalu hodnotu určenou vzorcem:

Horní hranice následujících intervalů určíme pomocí následujícího opakujícího se vzorce:

, Pak

Dokončili jsme konstrukci intervalové stupnice, protože horní mez dalšího intervalu se stala větší nebo rovnou maximální hodnotě vzorku
.

II. Grafické zobrazení intervalových variačních řad

III. Číselné charakteristiky vzorku

Pro zjištění číselných charakteristik vzorku sestavíme pomocnou tabulku

Součet:

1. Aritmetický průměr

2. Geometrický průměr

3. Móda

4. Medián

10 11 12 12 13 13 13 13 14 14 14 14 15 15 15 |15 15 15 16 16 16 16 16 17 17 18 19 19 20 20

5. Rozptyl vzorku

6. Vzorová směrodatná odchylka

7. Variační koeficient

8. Asymetrie

9. Koeficient asymetrie

10. Přemíra

11. Kurtózní koeficient

Problém 3

Stav : hodnota dílku stupnice ampérmetru je 0,1 A. Údaje jsou zaokrouhleny na nejbližší celý dílek. Najděte pravděpodobnost, že během čtení dojde k chybě, která překročí 0,02 A.

Řešení.

Zaokrouhlovací chybu vzorku lze považovat za náhodnou veličinu X, který je rozložen rovnoměrně v intervalu mezi dvěma sousedními celočíselnými dílky. Rovnoměrná hustota distribuce

Kde
- délka intervalu obsahujícího možné hodnoty X; mimo tento interval
V tomto problému je délka intervalu obsahujícího možné hodnoty X, se rovná 0,1, takže

Chyba čtení překročí 0,02, pokud je v intervalu (0,02; 0,08). Pak

Odpovědět: R=0,6

Problém 4

Počáteční údaje: matematické očekávání a směrodatná odchylka normálně rozdělené charakteristiky X respektive rovno 10 a 2. Najděte pravděpodobnost, že jako výsledek testu X bude mít hodnotu obsaženou v intervalu (12, 14).

Řešení.

Použijme vzorec

A teoretické frekvence

Řešení

Pro X ji očekávaná hodnota M(X) a rozptyl D(X). Řešení. Pojďme najít distribuční funkci F(x) náhodná proměnná... chyba vzorku). Pojďme skládat variační řádekŠířka intervalu bude: Pro každou hodnotu řádek Pojďme si spočítat, kolik...

  • Řešení: separovatelná rovnice

    Řešení

    Ve tvaru Chcete-li najít kvocient řešení nehomogenní rovnice pojďme se nalíčit soustava Vyřešme výslednou soustavu... ; +47; +61; +10; -8. Interval sestavení variační řádek. Uveďte statistické odhady průměrné hodnoty...

  • Řešení: Spočítejme řetězové a základní absolutní přírůstky, tempa růstu, tempa růstu. Získané hodnoty shrnujeme v tabulce 1

    Řešení

    Objem výroby. Řešení: Aritmetický průměr intervalu variační řádek se vypočítá následovně: pro... Mezní výběrová chyba s pravděpodobností 0,954 (t=2) bude: Δ w = t*μ = 2*0,0146 = 0,02927 Definujme hranice...

  • Řešení. Podepsat

    Řešení

    O pracovní zkušenost které a vymyšlený vzorek. Vzorová průměrná pracovní zkušenost... těchto zaměstnanců a vymyšlený vzorek. Průměrná doba trvání pro vzorek... 1,16, hladina významnosti α = 0,05. Řešení. Variační řádek tohoto vzorku vypadá takto: 0,71 ...

  • Pracovní učební plán z biologie pro ročníky 10-11 Sestavila: Polikarpova S.V.

    Pracovní tréninkový program

    Nejjednodušší schémata křížení“ 5 L.r. " Řešení elementární genetické problémy“ 6 L.b. " Řešení elementární genetické problémy“ 7 L.r. „..., 110, 115, 112, 110. Komponovat variační řádek, kreslit variační křivky, najděte průměrnou hodnotu charakteristiky...

  • Pro diskrétní charakteristiky je konstruována diskrétní variační řada.

    Abyste mohli sestrojit diskrétní variační řadu, musíte provést následující kroky: 1) seřadit jednotky pozorování ve vzestupném pořadí podle studované hodnoty charakteristiky,

    2) určit všechny možné hodnoty atributu x i, seřadit je vzestupně,

    hodnotu atributu, i .

    četnost hodnoty atributu a označují F i . Součet všech frekvencí řady se rovná počtu prvků ve studované populaci.

    Příklad 1 .

    Seznam známek, které studenti obdrželi u zkoušek: 3; 4; 3; 5; 4; 2; 2; 4; 4; 3; 5; 2; 4; 5; 4; 3; 4; 3; 3; 4; 4; 2; 2; 5; 5; 4; 5; 2; 3; 4; 4; 3; 4; 5; 2; 5; 5; 4; 3; 3; 4; 2; 4; 4; 5; 4; 3; 5; 3; 5; 4; 4; 5; 4; 4; 5; 4; 5; 5; 5.

    Zde je číslo X - školní známkaje diskrétní náhodná veličina a výsledný seznam odhadů jestatistická (pozorovatelná) data .

      uspořádejte pozorovací jednotky ve vzestupném pořadí podle studované charakteristické hodnoty:

    2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5.

    2) určete všechny možné hodnoty atributu x i, seřaďte je vzestupně:

    V tomto příkladu lze všechny odhady rozdělit do čtyř skupin s následujícími hodnotami: 2; 3; 4; 5.

    Volá se hodnota náhodné veličiny odpovídající určité skupině pozorovaných dat hodnotu atributu, možnost (opce) a označte x i .

    Volá se číslo, které ukazuje, kolikrát se odpovídající hodnota charakteristiky vyskytuje v řadě pozorování četnost hodnoty atributu a označují F i .

    Pro náš příklad

    skóre 2 se objeví - 8krát,

    skóre 3 se objeví - 12krát,

    skóre 4 se objeví - 23krát,

    skóre 5 se vyskytuje - 17krát.

    Celkem je zde 60 hodnocení.

    4) přijatá data zapište do tabulky o dvou řádcích (sloupcích) - x i a f i.

    Na základě těchto dat je možné sestavit diskrétní variační řadu

    Série diskrétních variací – jedná se o tabulku, ve které jsou vyskytující se hodnoty studované charakteristiky uvedeny jako jednotlivé hodnoty ve vzestupném pořadí a jejich frekvence

    1. Konstrukce intervalové variační řady

    Kromě diskrétních variačních řad se často setkáváme s metodou seskupování dat, jako je intervalová variační řada.

    Intervalová řada je konstruována, pokud:

      znak má kontinuální povahu změny;

      Bylo mnoho diskrétních hodnot (více než 10)

      frekvence diskrétních hodnot jsou velmi malé (nepřekračují 1-3 při relativně velkém počtu pozorovacích jednotek);

      mnoho diskrétních hodnot prvku se stejnými frekvencemi.

    Intervalová variační řada je způsob seskupování dat ve formě tabulky, která má dva sloupce (hodnoty charakteristiky ve formě intervalu hodnot a frekvence každého intervalu).

    Na rozdíl od diskrétní série hodnoty atributu intervalové řady nejsou reprezentovány jednotlivými hodnotami, ale intervalem hodnot („od - do“).

    Zavolá se číslo, které ukazuje, kolik pozorovacích jednotek spadalo do každého zvoleného intervalu četnost hodnoty atributu a označují F i . Součet všech frekvencí řady se rovná počtu prvků (jednotek pozorování) ve studované populaci.

    Pokud má jednotka charakteristickou hodnotu rovnou horní limit interval, pak by měl být přiřazen k dalšímu intervalu.

    Například dítě s výškou 100 cm spadne do 2. intervalu a ne do prvního; a dítě s výškou 130 cm spadne do posledního intervalu a ne do třetího.

    Na základě těchto dat lze sestavit intervalové variační řady.

    Každý interval má spodní mez (xn), horní mez (xv) a šířku intervalu ( i).

    Hranice intervalu je hodnota atributu, která leží na hranici dvou intervalů.

    výška dítěte (cm)

    výška dítěte (cm)

    množství dětí

    více než 130

    Pokud má interval horní a dolní hranici, pak se nazývá uzavřený interval. Pokud má interval pouze spodní nebo pouze horní hranici, pak je - otevřený interval. Otevřený může být pouze úplně první nebo úplně poslední interval. Ve výše uvedeném příkladu je otevřený poslední interval.

    Šířka intervalu (i) – rozdíl mezi horní a dolní hranicí.

    i = x n - x in

    Předpokládá se, že šířka otevřeného intervalu je stejná jako šířka sousedního uzavřeného intervalu.

    výška dítěte (cm)

    množství dětí

    Šířka intervalu (i)

    pro výpočty 130+20=150

    20 (protože šířka sousedního uzavřeného intervalu je 20)

    Všechny intervalové řady jsou rozděleny na intervalové řady se stejnými intervaly a intervalové řady s nestejnými intervaly . V odsazených řádcích se stejnými intervaly je šířka všech intervalů stejná. V intervalových řadách s nestejnými intervaly je šířka intervalů různá.

    V uvažovaném příkladu - intervalová řada s nestejnými intervaly.

    Pokud je studovaná náhodná proměnná spojitá, pak řazení a seskupování pozorovaných hodnot často neumožňuje identifikaci charakterové rysy mění své hodnoty. To je vysvětleno skutečností, že jednotlivé hodnoty náhodné veličiny se od sebe mohou lišit tak málo, jak je žádoucí, a proto se v souhrnu pozorovaných dat mohou zřídka vyskytnout identické hodnoty veličiny a frekvence varianty se od sebe jen málo liší.

    Je také nepraktické konstruovat diskrétní řadu pro diskrétní náhodnou veličinu, číslo možné hodnoty což je skvělé. V takových případech byste měli stavět intervalové variační řady distribuce.

    Pro konstrukci takové řady je celý interval variace pozorovaných hodnot náhodné veličiny rozdělen do řady dílčí intervaly a počítání četnosti výskytu hodnot hodnot v každém dílčím intervalu.

    Interval variační série volat uspořádanou množinu intervalů různých hodnot náhodné proměnné s odpovídajícími frekvencemi nebo relativními frekvencemi hodnot proměnné spadající do každé z nich.

    K vytvoření intervalové řady potřebujete:

    1. definovat velikost dílčí intervaly;
    2. definovat šířka intervaly;
    3. nastavte jej pro každý interval horní A spodní limit ;
    4. seskupit výsledky pozorování.

    1 . Otázku výběru počtu a šířky seskupovacích intervalů je třeba rozhodnout v každém konkrétním případě na základě cíle výzkum, hlasitost vzorky a stupeň variace charakteristika ve vzorku.

    Přibližný počet intervalů k lze odhadnout pouze na základě velikosti vzorku n jedním z následujících způsobů:

    • podle vzorce Sturges : k = 1 + 3,32 log n ;
    • pomocí tabulky 1.

    stůl 1

    2 . Obecně jsou preferovány prostory stejné šířky. K určení šířky intervalů h vypočítat:

    • rozsah variací R - ukázkové hodnoty: R = x max - x min ,

    Kde xmax A xmin - možnosti maximálního a minimálního odběru vzorků;

    • šířka každého intervalu h určeno podle následujícího vzorce: h = R/k .

    3 . Sečteno a podtrženo první interval x h1 je vybrána tak, že možnost minimálního vzorku xmin klesl přibližně uprostřed tohoto intervalu: x h1 = x min - 0,5 h .

    Střední intervaly získaná přičtením délky dílčího intervalu ke konci předchozího intervalu h :

    x hi = x hi-1 + h.

    Konstrukce intervalové stupnice na základě výpočtu intervalových hranic pokračuje až do hodnoty x ahoj vyhovuje vztahu:

    x ahoj< x max + 0,5·h .

    4 . V souladu s intervalovou stupnicí jsou charakteristické hodnoty seskupeny - pro každý dílčí interval se vypočítá součet četností n i možnost zahrnuta v i tý interval. V tomto případě interval zahrnuje hodnoty náhodné veličiny, které jsou větší nebo rovné spodní hranici a menší než horní hranice intervalu.

    Polygon a histogram

    Pro přehlednost jsou konstruovány různé grafy statistického rozdělení.

    Na základě dat diskrétní variační řady konstruují polygon frekvence nebo relativní frekvence.

    Frekvenční mnohoúhelník x 1 ; n 1 ), (x 2 ; n 2 ), ..., (x k ; n k ). Chcete-li sestrojit frekvenční mnohoúhelník, možnosti jsou vykresleny na ose x. x i , a na pořadnici - odpovídající frekvence n i . Body ( x i ; n i ) jsou spojeny přímými segmenty a získá se frekvenční mnohoúhelník (obr. 1).

    Mnohoúhelník relativních četností nazývá se přerušovaná čára, jejíž segmenty spojují body ( x 1 ; W 1 ), (x 2 ; W 2 ), ..., (x k ; Wk ). Chcete-li sestrojit mnohoúhelník relativních frekvencí, možnosti jsou vyneseny na ose x x i a na svislé ose - odpovídající relativní četnosti W i . Body ( x i ; W i ) jsou spojeny přímými segmenty a získá se mnohoúhelník relativních frekvencí.

    Když souvislé znamení je vhodné stavět histogram .

    Histogram frekvence nazývaný stupňovitý útvar sestávající z obdélníků, jejichž základnami jsou dílčí délkové intervaly h a výšky se rovnají poměru NIH (frekvenční hustota).

    Pro sestavení frekvenčního histogramu se na osu vodorovné úsečky rozloží dílčí intervaly a nad nimi se ve vzdálenosti nakreslí segmenty rovnoběžné s osou úsečky. NIH .



    Novinka na webu

    >

    Nejoblíbenější