Domov Hygiena Statistické shrnutí a seskupení. Statistické distribuční řady

Statistické shrnutí a seskupení. Statistické distribuční řady

Pojem souhrn, seskupení, klasifikace

souhrn– systemizace a shrnutí: zprávy o počasí, zprávy z polí. Souhrn neumožňuje podrobně analyzovat informace. Jakékoli shrnutí musí být založeno na seskupování dat, tzn. nejprve seskupení a poté shrnutí dat.

Seskupování– rozdělení populací do řady skupin podle nejvýznamnějších charakteristik.

Existují kvalitativní a kvantitativní seskupení. Vysoká kvalita- atributivní, kvantitativní– variační. Variace se zase dělí na strukturální a analytické . Strukturální seskupování zahrnuje výpočet specifické hmotnosti každé skupiny. Příklad: v podniku je 80 % pracovníků, 20 % kancelářských pracovníků, z toho 5 % manažerů, 3 % administrativních pracovníků, 12 % specialistů. cílová analytická seskupení - k identifikaci vztahu mezi charakteristikami: odsloužená doba a průměrný výdělek, odsloužená doba a výkon a další.

Při provádění seskupování je nutné:

Provádění komplexní analýzy povahy studovaného jevu;

Identifikace seskupovacího znaku (jeden nebo několik);

Hranice skupin nastavte tak, aby se skupiny od sebe výrazně lišily a v každé skupině byly kombinovány homogenní prvky.

Podle stupně složitosti mohou být seskupení jednoduchá a kombinační (na základě charakteristik).

Na základě prvotních informací se rozlišují primární a sekundární skupiny, hlavní provedené na základě údajů z počátečního pozorování, sekundární používá data z primárního seskupení.

Počet skupin je určen podle Sturgessova vzorce:

Kde n- počet skupin, N– běžná populace.

Pokud jsou použity stejné intervaly, pak intervalová hodnota rovná .

Intervaly mohou být stejné nebo nestejné. Ty druhé se zase dělí na ty měnící se podle zákona aritmetického resp geometrická progrese. První a poslední interval mohou být otevřené nebo uzavřené. Uzavřené intervaly zahrnují nebo nezahrnují hranice intervalů.

Pokud jsou intervaly uzavřené a nic se neříká o zahrnutí horních mezí, pak předpokládáme, že jsou zahrnuty i horní meze.

Pokud jsou intervaly otevřené, pak se zaměříme na poslední interval.

Charakteristiku v těchto intervalech lze měřit diskrétně a spojitě (tj. dělit). Se souvislým znakem se hranice uzavírají 1-10, 10-20, 20-30; pokud se charakteristika mění diskrétně, lze použít následující zápis: 1 – 10, 11 – 20, 21 – 30.

Pokud jsou intervaly otevřené, pak je hodnota posledního intervalu rovna předchozímu a hodnota prvního je rovna druhému.

Klasifikace– seskupování podle kvalitativních kritérií. Je poměrně stabilní, standardizovaný a schválený orgány státní statistiky.


3.2. Distribuční řady: typy a hlavní charakteristiky

Pod blízko distribuce odkazuje na řadu údajů charakterizujících socioekonomický jev podle jednoho kritéria. Tento nejjednodušší forma seskupení založené na dvou charakteristikách.

Distribuční řady se dělí na kvalitativní a kvantitativní, řazené a neseřazené, seskupené a neseskupené, s diskrétním a spojitým rozdělením charakteristiky.

Příkladem neseskupené, neseřazené řady mezd je výpis mzdy. Zároveň lze seznam zaměstnanců řadit abecedně nebo podle personálních čísel. Příkladem hodnocené série je seznam týmů, pořadí tenistů.

Hodnocená série rozdělení - řada dat uspořádaných v sestupném nebo vzestupném pořadí charakteristiky.

U seskupených řazených řad se rozlišují tyto charakteristiky: varianta, frekvence nebo frekvence, kumulativní a distribuční hustota.

Volba()– průměrná intervalová hodnota charakteristiky. Protože Při vytváření seskupení je třeba dodržet zásadu rovnoměrné rozložení charakteristiku v každém intervalu, pak lze variantu vypočítat jako polovinu součtu hranic intervalů.

Frekvence() ukazuje, kolikrát se daná hodnota atributu vyskytuje. Relativní vyjádření frekvence je frekvence(.) , tj. podíl, měrná váha součtu četností.

Kumuluje se() – kumulovaná frekvence nebo frekvence, výpočet na akruální bázi. Objem, náklady, výnosy se počítají kumulativně, tzn. výkonnostní výsledky.

stůl 1

Seskupování proudu úvěrové organizace
podle velikosti registrovaného základní kapitál

v roce 2008 v Ruské federaci

strana 2

Sestrojme intervalovou variační řadu pro rozdělení okresů podle

poměr průměrného měsíčního důchodu důchodců registrovaných u orgánů sociálního zabezpečení a průměrného měsíčního nominálního naběhlého platu vůči pracovníkům v hospodářství.

Počet skupin potřebných k vytvoření seskupení se vypočítá pomocí Sturgessova vzorce.

N=1+3,32*ln n (1,1)

kde, N - počet skupin;

n - Celkový počet prvků

N=1+3,32*ln 24= 1+3,32*1,38=5,5816=6

Rozdělme celou množinu okresů do 6 skupin a zjistěme hodnotu intervalu pomocí vzorce:

H= (Xmax - Xmin) /n (1,2)

kde Xmax=65,9 je maximální hodnota atributu ve studované řazené řadě (okres č. 24);

Xmin=28,1 - minimální hodnota (region č. 1).

Velikost intervalu bude:

H=(65,9-28,1)/6=6,3

Sestrojme řadu okresních rozdělení, s touto hodnotou intervalu, hodnotou Xmin = 28,1, pak horní hranice první skupiny bude:

28,1+6,3=34,4 atd.

Budeme distribuovat organizace podle zavedené skupiny a spočítejte jejich počet v každé skupině (tabulka 1.2).

Tabulka 1.2

Intervalové řady okresního rozdělení.

Číslo skupiny

Skupiny okresů podle hodnoty poměru prům. částka nashromážděná za měsíc. důchody do st. nominálně narostlý plat, rub.

Počet okresů

Pro názornost si to znázorněme intervalové řady ve formě histogramu (obr. 1.2).


Další materiály:

Cyklické koncepce sociálního vývoje
Sociální změna je přechod společnosti z jiného stavu do jiného. Změna, při které dojde k nevratné komplikaci sociální struktury, se nazývá sociální rozvoj. Existují evoluční a revoluční cesty vývoje...

Sociální funkce a sociální postavení
Definice sociální funkce osobnost je zcela plně odhalena v teorii sociálních rolí. Každý člověk žijící ve společnosti je zahrnut v mnoha různých sociální skupiny(rodina, studijní skupina, přátelská společnost atd.). Například...

Metodologie a metody sociologického výzkumu
Podstata sociologického výzkumu. Společenský život neustále klade na člověka mnoho otázek, na které lze odpovědět pouze pomocí vědecký výzkum, zejména sociologické. Ne každé studium s...

Variační řada představuje uspořádání charakteristických hodnot každé statistické jednotky v určitém pořadí. V tomto případě se jednotlivé hodnoty charakteristiky obvykle nazývají varianta (opce). . Každý člen variační řady (varianta) se nazývá pořadová statistika a počet variant se nazývá pořadí (pořadí) statistiky.

Nejdůležitější vlastnosti variační řady jsou její krajní varianty (X 1 = Xmin; X n = Xmax) a variační rozsah (Rx = Xn – X 1).

Najde variační řady široké uplatnění při prvotním zpracování statistických informací získaných v důsledku toho statistické pozorování. Slouží jako základ pro konstrukci empirické distribuční funkce statistické jednotky jako součást statistické populace. Proto se nazývají variační řady distribuční řádky.

Ve statistice rozlišuje tyto typy variačních řad: řazené, diskrétní, intervalové.

Zařazená (z latiny rang - hodnost) řada- jedná se o řadu rozdělení jednotek statistické populace, ve které jsou varianty charakteristiky ve vzestupném nebo sestupném pořadí. Jakákoli řazená série se skládá z čísel pořadí (1 až n) a odpovídajících možností. Počet možností v seřazené řadě vytvořené podle základní charakteristiky se obvykle rovná počtu jednotek ve statistickém souboru.

Vytvořit seřazenou řadu podle tuto vlastnost(např. podle počtu dělníků hospodářských zvířat ve 100 zemědělských podnicích) můžete využít rozložení tabulky. 5.1.

Tabulka 5.1. Pořadí utváření hodnocené série

Konec práce -

Toto téma patří do sekce:

Statistika

A jídlo Běloruské republiky.. Ministerstvo školství, vědy a personálu..

Pokud potřebujete další materiál k tomuto tématu nebo jste nenašli, co jste hledali, doporučujeme použít vyhledávání v naší databázi děl:

Co uděláme s přijatým materiálem:

Pokud byl pro vás tento materiál užitečný, můžete si jej uložit na svou stránku na sociálních sítích:

Všechna témata v této sekci:

Shundalov B.M.
Obecná teorie statistiky. Tutorial Pro ekonomické speciality vyšší zemědělské vzdělávací instituce. Studijní průvodce s

Předmět statistiky
Slovo „statistika“ pochází z latinského „status“, což znamená stát, stav věcí. To umožňuje zdůraznit teoretickou kognitivní podstatu

Podstata statistického pozorování
Žádný statistický výzkum, jak je uvedeno výše (téma 1), vždy začíná sběrem primárních (počátečních) informací o každé jednotce statistické populace. Ne však všichni

Program statistického pozorování
V první kapitole bylo upozorněno na skutečnost, že každá statistická jednotka jako celek má mnoho různé vlastnosti, vlastnosti, specifické funkce kterým se běžně říká

Seznam znaků zaznamenaných během procesu pozorování se obvykle nazývá statistický pozorovací program
Vývoj programu je jedním z nejdůležitějších teoretických a praktické otázky statistické pozorování. Kvalita programu do značné míry určuje kvalitu shromážděný materiál, jeho spolehlivost a

Formy statistického pozorování
Celá škála statistických pozorování má dvě formy: statistické výkaznictví a speciálně organizovaná statistická pozorování. Statistické výkaznictví

Statistické formuláře
Statistický formulář je banka obsahující otázky ze statistického pozorovacího programu a místo pro jejich zodpovězení. formulář je nositelem statistických informací získaných ve výsledku

Typy statistického pozorování
Statistická pozorování jsou klasifikována do typů, které se mohou lišit podle různých principů. V závislosti na rozsahu pokrytí studovaného objektu lze tedy statistická pozorování dále rozdělit

Metody provádění statistických pozorování
Statistická pozorování lze provádět různými způsoby, mezi nimiž se často vyskytují následující: zpravodajská, expediční, vlastní kalkulace, vlastní registrace, dotazník, korespondent.

Místo, načasování a období statistických pozorování
Z hlediska jakéhokoli statistického pozorování musí být jasně definováno místo tohoto pozorování, tzn. místo, kde se evidují shromážděné informace, vyplňují se statistické údaje

Chyby ve statistickém pozorování a opatření k jejich potírání
Jedním z nejdůležitějších požadavků na výsledky statistického pozorování je jejich přesnost, která je chápána jako míra shody statistických poznatků s

Primární statistický souhrn
Výsledky statistického pozorování obsahují mnohostranné informace o každé jednotce populace nebo objektu a jsou obvykle neuspořádané. Tento výchozí materiál je nezbytný jako první

Podstata a význam relativních statistických ukazatelů
Relativní ukazatele jsou statistické veličiny, vyjadřující míru kvantitativního vztahu mezi absolutními hodnotami charakteristiky a odrážející relativní velikosti jevů a procesů. O

Typy relativních ukazatelů. Ukazatele relativní dynamiky
V závislosti na úlohách řešených pomocí relativních hodnot se rozlišují tyto typy relativních ukazatelů: dynamika, struktura, koordinace, intenzita, srovnání, plnění zakázky,

Ukazatele relativní struktury
Jeden z nejdůležitější vlastnosti všech jevů spočívá v jejich složitosti. I molekula destilované vody se skládá z atomů vodíku a kyslíku. Mnoho jevů přírody, společnosti, člověka

Relativní koordinační ukazatele
Relativními ukazateli koordinace jsou vzájemné vztahy absolutní velikosti komponenty v nějakém absolutním celku. Pro výpočet těchto ukazatelů je jednou z komponent

Indikátory relativní intenzity
Relativní ukazatele intenzity (stupně) představují poměr absolutních velikostí dvou kvalitativně odlišných, ale vzájemně souvisejících charakteristik ve statistické skupině

Relativní srovnávací ukazatele
Relativní ukazatele srovnání (srovnání) se získávají korelací stejných absolutních ukazatelů vztahujících se k různým statistickým jednotkám.

Relativní míra plnění objednávek
Relativní ukazatele plnění zakázky (úkolu, plánu) představují poměr absolutních, skutečně dosažených ukazatelů za určité období nebo k

Relativní ukazatele úrovně ekonomického rozvoje
Indikátory relativní úrovně vývoj ekonomiky nazývat poměr absolutních velikostí dvou kvalitativně odlišných (opačných), ale vzájemně souvisejících charakteristik. S tím

Podstata a význam grafické metody
Absolutní statistické ukazatele získané jako výsledek statistických pozorování a různé relativní ukazatele vypočítané na tomto základě mohou být lepší, hlubší, dostupnější.

Základní požadavky na konstrukci souřadnicových diagramů
Za nejběžnější a nejpohodlnější způsob grafického zobrazení ukazatelů absolutní a relativní dynamiky, srovnávacích ukazatelů atd. je považován souřadnicový diagram.

Metody grafického znázornění indikátorů dynamiky a struktury
V mnoha případech je potřeba reflektovat na stejném souřadnicovém diagramu ne jednu, ale několik čar charakterizujících dynamiku různých absolutních či relativních ukazatelů resp.

Metody grafického zobrazení srovnávacích ukazatelů
V širokém smyslu se srovnání ukazatelů provádí jak v čase, tak v prostoru, tzn. Srovnávací techniky mohou pokrývat dynamiku, strukturu a územní objekty. Proto

Podstata a význam kartogramů a kartodiagramů
V mnoha případech je potřeba je graficky znázornit nejdůležitější znamení, charakteristické pro rozsáhlé územní objekty. V agroprůmyslovém komplexním systému to tak může být osad, zemědělství

Testové otázky k tématu 4
1. Co to je? grafická metoda a na čem je založen? 2. K jakým hlavním účelům se používá grafická metoda? 3. Jak jsou klasifikovány?

Podstata variace. Typy variačních charakteristik
Variace (z lat. variatio - změna) je změna charakteristiky (varianty) ve statistické populaci, tzn. akceptace rozdílnými znalostmi jednotkami populace nebo jejich skupinami

Podle počtu dělníků dobytka
Možnosti čísla hodnosti (č.) Možnost odpovídající číslu hodnosti (č.) Symbol Počet dělníků v hospodářských zvířatech

Distribuce diskrétních řad
Diskrétní (dělící) řada je variační řada, ve které jsou její skupiny tvořeny podle charakteristiky, která se nespojitě mění, tzn. po určité jedničce

Živočišní pracovníci
Volby č. Možnost (hodnota znaménka), X Znaky frekvence Místní frekvence, fl Kumulativní frekvence, fн

Intervalové distribuční řady
V mnoha případech statistická populace koček zahrnuje velké nebo dokonce více nekonečné číslo možnost, která se nejčastěji vyskytuje s plynulou variací, je prakticky nemožná a nepraktická

Podstata průměrů
Variační řady odrážejí širokou škálu jevů a procesů, které tvoří podstatu naší reality. Pro úplnější a hlubší studium jevů a procesů ve světě kolem nás

Aritmetický průměr
Pokud do vzorce 6.2 dosadíte hodnotu K = 1, dostanete aritmetický průměr, tzn. .

V hodnocené distribuční sérii
Pořadí č. Možnosti (charakteristické hodnoty) Symboly Obdělávaná plocha, ha

Distribuční řádek
Předmět číslo. Možnosti Místní frekvence Vážený průměr Možnosti Symboly sklizně

Základní vlastnosti aritmetického průměru
Aritmetický průměr má mnoho matematických vlastností, které mají při jeho výpočtu důležitý matematický význam. Znalost těchto vlastností pomáhá kontrolovat správnost a přesnost

Průměrná chronologická hodnota
Jednou z odrůd aritmetického průměru je chronologický průměr. Průměrná hodnota vypočtená ze souhrnu hodnot charakteristiky v různých okamžicích nebo více různá období PROTI

Střední kvadratická hodnota
Za předpokladu, že je ve vzorci 6.2 nastavena hodnota K = 2. získáme střední čtvercovou hodnotu. V řazené řadě se střední kvadratická hodnota vypočítá pomocí nevážené (pr

Geometrická střední hodnota
Dosadíme-li do vzorce 6.2 hodnotu K = 0, je výsledkem průměr geometrická hodnota, který má jednoduchou (neváženou) a váženou formu. Geometrický průměr je jednoduchý

Harmonická střední hodnota
Záměna vyhrazena v obecný vzorec 6.2 hodnotu K=-1, můžete získat harmonický průměr, který má jednoduchý a vážený tvar. Název střední harmonie

Strukturální průměr. Podstata a smysl módy
V některých případech je pro získání obecné charakteristiky statistického souboru pro jakékoli kritérium nutné použít tzv. strukturální průměry. Tyto zahrnují

Podstata a význam mediánu
Medián – možnosti umístěné uprostřed série variací. Medián v hodnocené řadě je následující. Nejprve spočítejte počet mediánových možností:

Koncept nejjednodušších variačních ukazatelů
Podstata variace byla rozebrána v kapitole 5 učebnice, kde bylo poznamenáno, že variace je fluktuace, změna hodnoty znaku ve statistické populaci, tzn. přijetí jednotkami kolektivně

Standardní odchylka
Směrodatná odchylka se vypočítá na základě střední kvadratické hodnoty. Objevuje se v nevážené (jednoduché) a vážené formě. Pro hodnocené p

Variační koeficient
Variační koeficient je relativní ukazatel, který lze vypočítat pomocí následujícího vzorce:

Testové otázky k tématu 6
1. Jaká je průměrná hodnota a co vyjadřuje? 2. Co je definující vlastnost populace a proč se používá ve statistice? 3. Jaké jsou hlavní typy médií

Podstata obecné a výběrové populace
Ve statistice je kontinuální typ pozorování, jako je například všeobecné sčítání lidu, poměrně vzácný. Přesto je nejčastěji nutné použít neúplná pozorování, která

Koncept stochastické populace
V reálných podmínkách jsou případy statistické práce s běžnou populací poměrně vzácné, a proto není vždy možné získat základní statistické charakteristiky.

Podstata selektivní metopy
Statistická práce je ve většině případů nějak spojena s daty získanými jako výsledek aplikace výběrové metody. Mnoho studií by bylo nemožné, kdyby se nepoužívaly

Výhody a nevýhody vzorkovací metody
Metoda vzorkování má oproti kontinuálnímu pozorování řadu výhod. Za prvé, selektivní pozorování může výrazně ušetřit práci, peníze a čas na jeho realizaci. Sova

Metody výběru, jejich výhody a nevýhody
Výběr statistických jednotek z obecné populace lze provádět různými způsoby a závisí na mnoha podmínkách. Metoda výběru zahrnuje následující metody pro výběr statistických jednotek: případ

Podstata chyb reprezentativnosti a postup jejich výpočtu
Jedním z ústředních problémů v vzorkovací metoda je považován za teoretický výpočet hlavních statistických charakteristik a především průměrné hodnoty atributu v obecném statistickém ukazateli.

Koncept malého vzorku. Bodový odhad základních statistických charakteristik
Použití výběrové metody může být založeno na výběru z obecné populace teoreticky libovolného počtu statistických jednotek. Bylo matematicky prokázáno, že vzorové populace mohou být

Mezní výběrová chyba. Intervalové hodnocení základních statistických charakteristik
Mezní výběrová chyba je nesrovnalost mezi statistickými charakteristikami získanými ve vzorku a obecnou populací, jak je uvedeno výše (vzorec

Techniky pro výpočet velikosti vzorku pro různé metody výběru
Přípravné práce s prováděním pozorování vzorku přímo souvisí se stanovením požadované velikosti vzorku, která závisí na metodě výběru a počtu jednotek v obecném

Pojem sekundárního (komplexního) statistického souhrnu
Výsledky jednoduchého shrnutí, jehož obsah je diskutován v tématu 2, nemohou vždy uspokojit výzkumníka, protože poskytují pouze hlavní myšlenka o studovaném objektu, tzn. ze statistiky t

Typologická seskupení
Typologické seskupení je rozdělení statistické populace do v podstatě stejných kvalitativních typologických skupin. Typologické seskupení

Strukturální seskupení
Strukturální seskupování spočívá v rozdělení homogenního a kvalitativního souboru statistických jednotek do skupin, které charakterizují složení komplexního objektu. Přes strukturální

Podstata a postup provádění jednoduchého a analytického seskupování
Analytické seskupení, ve kterém je statistická populace rozdělena do homogenních skupin podle atributu jednoho faktoru, se nazývá jednoduché.

Analytické seskupení
Ne. Skupiny farem podle dávek hnojiv, t/ha. Frekvenční znaky ve skupinách (počet populačních jednotek ve skupině)

Výkonnostní ukazatele v pěstování brambor
Předmět číslo. Ukazatele Skupiny farem podle dávky hnojiva, t/ha Celkem (průměrně) 10-20

Podstata a význam statistických tabulek
Výsledky zpracování pozorovaných dat pomocí různých statistických metod (souhrny, relativní, průměrné hodnoty, formace, variační řady, variační ukazatele, analytické

Elementární složení statistických tabulek
Komplexní statistické zpracování výsledků pozorování obvykle zahrnuje použití četných tabulek. Proto je každé tabulce přiřazeno individuální číslo.

Typy a formy statistických tabulek
Podle struktury tabulkového předmětu se rozlišují tyto typy statistických tabulek: jednoduché, skupinové a kombinační. Jednoduchá statistická tabulka - hara

Podpůrné a výkonnostní statistické tabulky
Statistické tabulky mohou plnit různé funkční role. Některé z nich slouží např. k shrnutí výsledků statistického pozorování a přispívají k plnění primární funkce

Výsledky výroby, 2003
(kombinační tabulka) Položka č. Skupiny farem podle zatížení zemědělské půdy na 1 traktor, ha Podskupiny farem podle zatížení

Podniky na zpracování lnu agroprůmyslového komplexu v roce 2003
(pracovní list) Položka č. Roční objem zpracování trustů, tuny Počet zaměstnanců, lidí Nosnost a

Návrh statistických tabulek
Dosažení svých cílů s pomocí tabulková metoda možné v případech, kdy nezbytné požadavky o návrhu statistických tabulek. Obvykle by měly mít všechny tabulky

Pojem disperzní metody
Název metody je dán jejím širokým použitím různé typy disperzí, o jejichž podstatě a způsobech výpočtu pojednává šesté téma učebnice. Je vhodné poznamenat, že rozdíl v množství

Sign-výsledek
č. Individuální možnosti Lineární odchylky individuální. možnost z průměrných čtvercových lineárních odchylek

Selské farmy
č. Produktivita, c/ha Lineární odchylky individuální produktivity od průměru, c/ha Kvadrát lineární odchylky výnosu

Pozdní plíseň na výnosech brambor
č. Skupiny farem podle podílu ošetřených plodin, % Počet farem ve skupině Průměrný podíl ošetřených plodin,

Sign-výsledek
Číslo skupiny Intervaly podle faktorové charakteristiky Místní frekvence Průměrná varianta efektivní charakteristiky

Typy disperzí. Pravidlo sčítání odchylek
Princip výpočtu disperze (střední kvadratické odchylky) v obecný pohled probíráno v tématu 6. Ve vztahu k disperzní metodě to znamená, že každý typ variace odpovídá určitému

Výnos brambor (první skupina)
Předmět číslo. Produktivita, c/ha Lineární odchylka od průměrného skupinového výnosu Kvadrát lineární odchylky

Koncepce kritéria R. Fishera
Disperzní metoda spočívá v posouzení poměru korigovaného rozptylu, který charakterizuje systematické kolísání skupinových průměrných hodnot studované efektivní charakteristiky, k korigovanému rozptylu

Dvoufaktorový disperzní komplex
Řešení tohoto komplexu je zaměřeno na studium kvalitativního vlivu dvou faktorových charakteristik na vliv dvou faktorových charakteristik na jednu nebo více efektivních charakteristik. Dvoufaktorový komplex

Obiloviny
Podskupina č. Počet farem v podskupině Průměrný výnos c/ha Lineární odchylky výnosu v podskupině od průměru

Vlastnosti multifaktorového disperzního komplexu
Studium kvality komunikace, tzn. význam vlivu několika (tří, čtyř nebo více) charakteristik faktorů na výkonnostní ukazatele, v podstatě dobu trvání kombinovaného užívání

Výnos zrna
Předmět číslo. Variační prvky Symboly Celková variace Systematická variace Zbytková variace

Podstata a typy korelací
V předchozí kapitole bylo ukázáno, že kvalita (významnost) vztahu mezi faktorem a výkonnostními charakteristikami ve statistické populaci se určuje a posuzuje pomocí rozptylu

Základní formy korelace mezi charakteristikami
Identifikaci formy souvislosti mezi charakteristikami předchází určení kauzálního vztahu mezi nimi. Toto je nejdůležitější a odpovědný okamžik správné použití korelační metoda. Podle

Ukazatele těsnosti korelací. Korelační vztah
Jedním z ústředních problémů řešených pomocí korelační metody je stanovení a posouzení kvantitativní míry blízkosti vztahu mezi faktorem a výkonnostními charakteristikami. Na

Přímé párové korelační koeficienty
Pokud je vztah mezi charakteristikami studované dvojice charakteristik vyjádřen ve tvaru blízkém přímé, pak lze míru těsnosti souvislosti mezi těmito charakteristikami vypočítat pomocí koeficientu pr

Pořadový korelační koeficient
Základní statistické charakteristiky v případech, kdy populace, ze kterého je vzorek odebrán, se ukáže být mimo parametry normálního nebo jemu blízkého distribučního zákona

Vícenásobný korelační koeficient
Při studiu těsnosti vztahu mezi několika faktorovými a výkonnostními charakteristikami se vypočítává kumulativní koeficient vícenásobná korelace. Takže při stanovení celkového m

Ukazatele determinace
Při studiu kvantitativního vlivu charakteristik - faktorů na výsledky je důležité určit, jaká část variability výsledné charakteristiky je přímo způsobena vlivem námi studované variace

Podstata, typy a význam regresních rovnic
Regrese je chápána jako funkce určená k popisu závislosti změn efektivních charakteristik pod vlivem kolísání charakteristik - faktorů. Ve statistice byl zaveden pojem regrese

Přímá regresní rovnice
Korelační spojení ve tvaru blízkém přímočarému, může být reprezentován jako rovnice přímky:

Hyperbolická regresní rovnice
Pokud se forma spojení mezi atributem faktoru a atributem výsledku, identifikovaným pomocí souřadnicového diagramu (korelačního pole), blíží hyperbolické, pak je nutné sestavit a vyřešit rovnici

Regrese
Předmět číslo. Znaménkový faktor Znaménko-výsledek Opačná hodnota znaménkového faktoru Druhá mocnina reciproční hodnoty

Hyperbolická regrese
Předmět číslo. Výnos hrachu, c/ha X Náklady na hrách, tisíce rublů/c Y Odhadované hodnoty

Parabolická regresní rovnice
V některých případech empirická data ze statistické populace, vizuálně znázorněná pomocí souřadnicového diagramu, ukazují, že nárůst faktoru je doprovázen zrychleným růstem res.

Parabolická regrese
Předmět číslo. X Y XY X2 X2U X4

Parabolická regrese
Předmět číslo. Specifická gravitace bramborové plodiny, X Sklizeň brambor, tis. U Výpočty hodnot

Vícenásobná regresní rovnice
Využití korelační metody při studiu závislosti výsledku charakteristiky na několika faktorových charakteristikách je tvořeno podle schématu podobného jednoduché (párové) korelaci. Jeden z

Koeficienty pružnosti
Pro smysluplný a dostupný popis (interpretaci) výsledků odrážejících korelačně-regresní závislost mezi charakteristikami prostřednictvím různých regresních rovnic obvykle použijte

Podstata časové řady
Všechny jevy okolního světa procházejí v průběhu času neustálými změnami; časem, tzn. jejich objem, úroveň, složení, struktura atd. se v čase mění. je vhodné poznamenat, že podle

Zemědělské podniky
(na začátku roku; tis.) fyzikální jednotky) Ukazatele 2000 2001 2002 2003

Hlavní ukazatele časové řady
Komplexní analýza časové řady nám umožní odhalit a charakterizovat zákonitosti, které se projevují v různých fázích vývoje jevů, identifikovat trendy a rysy vývoje těchto jevů. V pro

Absolutní úroveň se zvyšuje
Jedním z nejjednodušších ukazatelů vývoje dynamiky je absolutní nárůst hladiny. Absolutní růst je rozdíl mezi dvěma úrovněmi časové řady

Míra růstu úrovně
Pro charakterizaci relativní rychlosti změny ukazatel rychlosti růstu. Míra růstu je poměr jedné úrovně dynamické řady k druhé, který se bere jako základ pro srovnání. rychlost růstu může být

Míra růstu úrovně
Je-li absolutní rychlost nárůstu hladin dynamické řady charakterizována velikostí absolutních nárůstů, pak relativní rychlost nárůstu úrovní je charakterizována rychlostí nárůstu. Teplota při

Absolutní hodnota navýšení o jedno procento
Při analýze časových řad je často kladen úkol: zjistit jak absolutní hodnoty se vyjadřuje jako 1% zvýšení (snížení) úrovní, protože v některých případech se snížením (zpomalením) tempa růstu

Pro roky 1999-2003
Roky Produktivita, c/ha Absolutní zvýšení výnosu, c/ha Rychlost růstu, % Rychlost růstu, %

Techniky pro zarovnání časových řad
K identifikaci časových vzorců to obvykle vyžaduje poměrně velký počet úrovní, časovou řadu. Pokud se časová řada skládá z omezeného počtu úrovní, pak její zarovnání

Metody analytického zarovnání časových řad
Odhalování obecný trend vývoj úrovní časových řad lze provádět pomocí různé techniky analytické zarovnání, které se nejčastěji provádí

Analytické zarovnání pomocí exponenciální křivky
V některých případech, např. při procesu zprovoznění a rozvoje nových výrobních kapacit, se dynamická řada může vyznačovat rychle rostoucí změnou úrovní, tzn. řetězové

Analytické zarovnání pomocí paraboly druhého řádu
Pokud je studovaná dynamická řada charakterizována kladnými absolutními nárůsty se zrychlením vývoje úrovní, pak lze vyrovnání řady provést pomocí paraboly druhého řádu.

Analytické zarovnání pomocí rovnice hyperboly
Pokud je dynamická řada charakterizována doznívajícími absolutními poklesy úrovní (například dynamika pracovní náročnosti výrobků, nabídka práce v zemědělství atd.), pak úroveň

Pojem interpolace a extrapolace úrovní časových řad
V některých případech je nutné najít hodnoty chybějících meziúrovní časové řady na základě jejích známých hodnot. V takových případech lze použít techniku ​​interpolace,

Seskupováním se ve statistice rozumí rozdělení statistické populace do významněji homogenních skupin, charakteristika vybraných skupin soustavy ukazatelů za účelem identifikace typů jevů a studium jejich struktury a vzájemných vztahů. V procesu sumarizace primárního materiálu se jevy rozdělují do skupin podle různých proměnlivých charakteristik.

Variabilní charakteristika je charakteristika, která pro jednotlivé jednotky populace nabývá různého významu.

Úkoly před skupinou:

1. Identifikace těch částí hromadného jevu, které jsou stejnorodé co do kvality a podmínek vývoje a ve kterých působí stejné přírodní vlivy faktorů;

2. Studium a charakterizace struktury a strukturálních změn ve studovaných populacích;

3. Vliv vztahu mezi jednotlivými charakteristikami studovaného jevu.

Hlavní otázkou seskupovací metody je volba seskupovací charakteristiky, od správná volba která určuje výsledky skupiny i práce jako celku.

Po výběru seskupovací charakteristiky je důležité rozdělit jednotky populace do skupin.

Vybrané skupiny musí být kvalitativně homogenní a mít také dostatečně velký počet jednotek, který jim umožní vykazovat typické znaky charakteristické pro hromadné jevy. Proto velká pozornost je věnována určení počtu skupin a jejich hranic. Při řešení této problematiky se zohledňuje typ seskupení, charakter seskupovací charakteristiky a cíle studie.

Seskupíme farmy. Vezměme dojivost jedné krávy v kg jako charakteristiku skupiny. V podnicích v této zóně je velký rozdíl v úrovni užitkovosti mléka. Toto znamení se liší

Pomocí metody statistického seskupování jsou rozdíly mezi farmami z hlediska úrovně mléčné užitkovosti krav různé.

První fází práce je konstrukce řazené série. V řazené řadě jsou všechny hodnoty uspořádány vzestupně nebo sestupně podle seskupovací charakteristiky.

Seřazená řada ukazuje intenzitu změn v hodnotách v rozmezí od 1364 do 6270 kg. seskupovací charakteristika, pomocí ní je možné stanovit ostré přechody a identifikovat jednotky, které se velmi liší hodnotou charakteristiky.

Pro sestavení žebříčku používáme údaje o mléčné užitkovosti krav na farmách v Achinské zóně za rok 2003.

Výsledky uvedeme v tabulce 2.1.

Tabulka 2.1.

Název farmy

Dojivost od 1 krávy za rok, kg

JSC "Beloozerskoye"

JSC Sharypovskoe

JSC "Ivanovskoe"

CJSC "Orakskoye"

JSC "Sakhaptinskoe"

SJSC "Anashenskoye"

CJSC "Energetik"

SZAO "Baraitskoye"

SZAOOT "Igryshenskoye"

Komplex zemědělské výroby "Beloyarsky"

JSC "Pavlovskoe"

JSC "Adadymskoe"

JSC "Krasnopolyanskoe"

JSC "Dorokhovskoe"

JSC "Glyadenskoe"

SKhAOZT "Legostaevskoe"

CJSC "Altaiskoye"

JSC "Svetlolobovskoe"

JSC "Podsosensky"

JSC "Krutojarskoe"

LLP p/z "Achinsky"

JSC "Avangard"

JSC "Malinovský"

SAZT "Navoselovskoe"

JSC "Nazarovskoe"

Pro větší přehlednost znázorníme seřazenou řadu graficky, pro kterou zkonstruujeme Galtonův pazourek.

K tomu umístíme na ose x ve vzestupném pořadí seskupovací charakteristiku a podél osy - hodnotu mléčné užitkovosti krav odpovídající farmě, obr. 2.1.

Seřazené řady farem podle úrovně mléčné užitkovosti krav.

Rozeberme si data ze seřazené řady a její graf – zhodnoťme povahu a intenzitu rozdílů mezi farmami a pokusme se identifikovat výrazně odlišné skupiny farem. Mezi farmami jsou značné rozdíly v úrovni mléčné užitkovosti krav: rozsah kolísání je 6270 - 1364 = 4906 kg na dojnici a úroveň produkce mléka na farmě č. 25 je 4,6krát vyšší než v č. 1 ( 6720/1364).

Ke zvýšení mléčné užitkovosti z farmy na farmu dochází především postupně, plynule, bez velkých skoků, ale dojivost na krávu poslední farmy se výrazně liší od zbytku farem. Tuto farmu však nelze oddělit do samostatné skupiny, a protože rozdíly mezi ostatními farmami jsou malé, nedochází k žádným skokům a neexistují žádná další data naznačující hranice přechodu z jedné skupiny do druhé, lze typické skupiny rozlišit na základě na analýzu hodnocené řady v v tomto případě je to zakázáno. Proto je dále nutné sestrojit intervalovou řadu rozdělení farem.

Intervalová variační řada umožňuje získat představu o počtu a povaze skupin. Nejprve rozhodneme počet skupin, do kterých by měly být rozděleny všechny farmy. Přibližné číslo n lze určit pomocí vzorce (2.1):

n = 1+3,322LgN, (2,1)

kde n je počet skupin, N je množina jednotek.

Tato závislost může v tomto případě sloužit jako vodítko při určování počtu skupin, pokud se rozložení jednotek populace pro danou charakteristiku blíží normálu a jsou použity stejné intervaly ve skupinách.

n = 1+3,322Lg25 = 1+3,322*1,5 ~ 6 skupin.

i = (X max - X min) / n, kde (2,2)

X max - maximální hodnota atributu ve studované seřazené řadě,

X min - minimální hodnota atributu ve studované řazené řadě,

n - počet skupin.

I = (6270 - 1364)/6 = 818

Nyní sestrojíme řadu rozdělení farem s touto intervalovou hodnotou, hodnota X min = 818 kg, pak horní hranice první skupiny bude: Xmin+i = 2182 kg. Tato hranice je také hranicí druhé skupiny. Obdobně jsou stanoveny hranice ostatních skupin. Získaná data jsou uvedena v tabulce 2.2.

Tabulka 2.2

Z intervalové řady rozdělení státních statků (tab. 2.2.) vyplývá, že v souhrnu převažují farmy s dojivostí na krávu (11 farem) od 1364 do 2182 kg. Počet skupin farem s vysokou produktivitou je malý, takže by se měly kombinovat, to znamená, že by se mělo provést sekundární seskupení, protože ve čtvrté skupině není ani jedna farma a jedna v páté, ale každá skupina musí mít alespoň tři farmy.


Intervalové řady rozdělení farem podle úrovně mléčné užitkovosti krav.

Tabulka 2.3

Sekundární seskupování farem podle úrovně mléčné užitkovosti krav.

Porovnáním počtu farem v každé skupině můžeme říci, že počet farem s nízká úroveň produktivita je do značné míry vyšší než u vysoké.

Jsou prezentovány ve formě distribučních řad a jsou prezentovány ve formě.

Distribuční řada je jedním z typů seskupení.

Distribuční rozsah— představuje uspořádané rozdělení studovaných jednotek populace do skupin podle určité proměnlivé charakteristiky.

V závislosti na charakteristice, která je základem tvorby distribuční řady, se rozlišují atributivní a variační distribuční řádky:

  • Atributivní— se nazývají distribuční řady konstruované podle kvalitativních charakteristik.
  • Nazývají se distribuční řady konstruované ve vzestupném nebo sestupném pořadí hodnot kvantitativní charakteristiky variační.
Variační řada distribuce se skládá ze dvou sloupců:

První sloupec poskytuje kvantitativní hodnoty proměnné charakteristiky, které se nazývají možnosti a jsou určeny. Diskrétní opce – vyjádřená jako celé číslo. Možnost intervalu se pohybuje od a do. V závislosti na typu voleb můžete vytvořit diskrétní nebo intervalovou řadu variací.
Druhý sloupec obsahuje počet konkrétní možnosti, vyjádřeno jako frekvence nebo frekvence:

Frekvence- jedná se o absolutní čísla, která ukazují, kolikrát se daná hodnota charakteristiky vyskytuje v souhrnu, což značí . Součet všech frekvencí se musí rovnat počtu jednotek v celé populaci.

Frekvence() jsou četnosti vyjádřené v procentech z celku. Součet všech frekvencí vyjádřený v procentech se musí rovnat 100 % ve zlomcích jedné.

Grafické znázornění distribuční řady

Distribuční série jsou vizuálně prezentovány pomocí grafických obrázků.

Distribuční série jsou znázorněny jako:
  • Polygon
  • Histogramy
  • Kumuluje se
  • Ogives

Polygon

Při konstrukci polygonu na horizontální osa(osa x) jsou vyneseny hodnoty proměnné charakteristiky a na svislé ose (osa y) - frekvence nebo frekvence.

Mnohoúhelník na Obr. 6.1 vychází z údajů z mikrosčítání obyvatel Ruska v roce 1994.

6.1. Rozdělení velikosti domácností

Stav: Jsou uvedeny údaje o rozložení 25 zaměstnanců jednoho z podniků podle tarifních kategorií:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Úkol: Vytvořte diskrétní řadu variací a znázorněte ji graficky jako distribuční polygon.
Řešení:
V tomto příkladu jsou možnostmi platová třída zaměstnance. Pro stanovení frekvencí je nutné vypočítat počet zaměstnanců s odpovídající tarifní kategorií.

Polygon se používá pro diskrétní variační řady.

Pro konstrukci distribučního polygonu (obrázek 1) vyneseme kvantitativní hodnoty proměnlivé charakteristiky - varianty - podél osy x (X) a frekvence nebo frekvence podél osy pořadnice.

Pokud jsou hodnoty charakteristiky vyjádřeny ve formě intervalů, pak se taková řada nazývá interval.
Intervalové řady rozdělení jsou znázorněna graficky ve formě histogramu, kumulace nebo ogive.

Statistická tabulka

Stav: Údaje o velikosti vkladů jsou uvedeny 20 Jednotlivci v jedné bance (tisíc rublů) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Úkol: Sestrojte intervalovou variační řadu se stejnými intervaly.
Řešení:

  1. Počáteční populace se skládá z 20 jednotek (N = 20).
  2. Pomocí Sturgessova vzorce určíme potřebný počet použitých skupin: n=1+3,322*lg20=5
  3. Pojďme vypočítat hodnotu stejný interval: i=(152 - 2) /5 = 30 tisíc rublů
  4. Rozdělme počáteční populaci do 5 skupin s intervalem 30 tisíc rublů.
  5. Výsledky seskupení uvádíme v tabulce:

Při takovém záznamu spojité charakteristiky, kdy se stejná hodnota vyskytuje dvakrát (jako horní mez jednoho intervalu a dolní mez jiného intervalu), pak tato hodnota patří do skupiny, kde tato hodnota působí jako horní mez.

sloupcový graf

Pro konstrukci histogramu jsou hodnoty hranic intervalů vyznačeny podél osy úsečky a na jejich základě jsou konstruovány obdélníky, jejichž výška je úměrná frekvencím (nebo frekvencím).

Na Obr. 6.2. ukazuje histogram rozložení ruské populace v roce 1997 podle věkových skupin.

Rýže. 6.2. Rozložení ruské populace podle věkových skupin

Stav: Je dáno rozdělení 30 zaměstnanců firmy podle měsíční mzdy

Úkol: Zobrazte řadu intervalových variací graficky ve formě histogramu a kumulujte.
Řešení:

  1. Neznámá hranice otevřeného (prvního) intervalu je určena hodnotou druhého intervalu: 7000 - 5000 = 2000 rublů. Se stejnou hodnotou najdeme spodní hranici prvního intervalu: 5000 - 2000 = 3000 rublů.
  2. Abychom vytvořili histogram v pravoúhlém souřadnicovém systému, vyneseme podél osy vodorovné úsečky segmenty, jejichž hodnoty odpovídají intervalům varikózní řady.
    Tyto segmenty slouží jako spodní základna a odpovídající frekvence (frekvence) slouží jako výška vytvořených obdélníků.
  3. Vytvořme histogram:

Pro konstrukci kumulací je nutné vypočítat akumulované frekvence (frekvence). Jsou určeny postupným sečtením četností (četností) předchozích intervalů a jsou označeny S. Akumulované četnosti ukazují, kolik jednotek populace má charakteristickou hodnotu, která není větší než uvažovaná hodnota.

Kumuluje se

Rozložení charakteristiky ve variační řadě přes akumulované frekvence (frekvence) je znázorněno pomocí kumulace.

Kumuluje se nebo kumulativní křivka, na rozdíl od mnohoúhelníku, je konstruována z akumulovaných frekvencí nebo frekvencí. V tomto případě jsou hodnoty charakteristiky umístěny na ose x a nashromážděné frekvence nebo frekvence jsou umístěny na ose pořadnice (obr. 6.3).

Rýže. 6.3. Kumuluje rozdělení podle velikosti domácností

4. Vypočítejme akumulované frekvence:
Kumulativní frekvence prvního intervalu se vypočítá následovně: 0 + 4 = 4, pro druhý: 4 + 12 = 16; pro třetí: 4 + 12 + 8 = 24 atd.

Při konstrukci kumulací se jim přiřadí akumulovaná frekvence (frekvence) odpovídajícího intervalu horní limit:

Ogiva

Ogiva je konstruován podobně jako kumulace, pouze s tím rozdílem, že akumulované frekvence jsou umístěny na ose x a charakteristické hodnoty jsou umístěny na ose pořadnice.

Typ kumulace je koncentrační křivka nebo Lorentzův graf. Pro sestavení koncentrační křivky je na obou osách pravoúhlého souřadnicového systému vynesena stupnice v procentech od 0 do 100. Současně jsou na vodorovné ose uvedeny akumulované frekvence a akumulované hodnoty podílu. (v procentech) objemových charakteristik jsou uvedeny na ose pořadnice.

Rovnoměrné rozložení charakteristiky odpovídá úhlopříčce čtverce na grafu (obr. 6.4). Při nerovnoměrném rozložení představuje graf konkávní křivku v závislosti na úrovni koncentrace znaku.

6.4. Křivka koncentrace

Novinka na webu

>

Nejoblíbenější