У дома Детска стоматология Построяване на пример за интервална вариационна серия. Построяване на интервална серия на разпределение

Построяване на пример за интервална вариационна серия. Построяване на интервална серия на разпределение

Ако изследваната случайна променлива е непрекъсната, тогава класирането и групирането на наблюдаваните стойности често не позволява идентифициране черти на характераварирайки стойностите му. Това се обяснява с факта, че индивидуалните ценности случайна величинамогат да се различават една от друга толкова малко, колкото желаете, и следователно в съвкупността от наблюдаваните данни рядко могат да се появят идентични стойности на величината и честотите на вариантите се различават малко една от друга.

Също така е непрактично да се конструира дискретна серия за дискретна случайна променлива, числото възможни стойностикоето е страхотно. В такива случаи трябва да строите интервални вариационни серии разпределения.

За да се конструира такава серия, целият интервал на вариация на наблюдаваните стойности на случайна променлива се разделя на серия частични интервали и отчитане на честотата на възникване на стойностите на стойността във всеки частичен интервал.

Интервал вариационна серия наричаме подреден набор от интервали с различни стойности на случайна променлива със съответните честоти или относителни честоти на стойностите на променливата, попадащи във всяка от тях.

За изграждане интервални сериинеобходимо:

  1. дефинирам размер частични интервали;
  2. дефинирам ширина интервали;
  3. задайте го за всеки интервал Горна част И долна граница ;
  4. групирайте резултатите от наблюдението.

1 . Въпросът за избора на броя и ширината на груповите интервали трябва да се решава във всеки конкретен случай въз основа на цели изследване, сила на звука проби и степен на вариация характеристика в пробата.

Приблизителен брой интервали к може да се оцени само въз основа на размера на извадката н по един от следните начини:

  • според формулата Стърджъс : k = 1 + 3,32 log n ;
  • използвайки таблица 1.

маса 1

2 . Обикновено се предпочитат пространства с еднаква ширина. За определяне на ширината на интервалите ч изчисли:

  • диапазон на вариация R - примерни стойности: R = x max - x min ,

Където xмакс И xmin - максимални и минимални опции за вземане на проби;

  • ширина на всеки интервал ч определя се по следната формула: h = R/k .

3 . Долен ред първи интервал x h1 е избран така, че опцията за минимална проба xmin падна приблизително в средата на този интервал: x h1 = x min - 0,5 часа .

Междинни интервалиполучен чрез добавяне на дължината на частичния интервал към края на предишния интервал ч :

x hi = x hi-1 +h.

Изграждането на интервална скала въз основа на изчисляването на границите на интервала продължава до стойността x здравей удовлетворява отношението:

x здравей< x max + 0,5·h .

4 . В съответствие с интервалната скала, характерните стойности се групират - за всеки частичен интервал се изчислява сумата от честотите n i опция включена в i ти интервал. В този случай интервалът включва стойности на случайната променлива, които са по-големи или равни на долната граница и по-малки от горната граница на интервала.

Многоъгълник и хистограма

За по-голяма яснота са изградени различни графики на статистическо разпределение.

По дискретни данни вариационна сериястроят многоъгълник честоти или относителни честоти.

Честотен полигон х 1 ; n 1 ), (х 2 ; n 2 ), ..., (x k ; n k ). За да се изгради честотен полигон, опциите се нанасят върху абсцисната ос. x i , а по ординатата - съответните честоти n i . Точки ( x i ; n i ) се свързват с прави отсечки и се получава честотен полигон (фиг. 1).

Многоъгълник на относителните честотинаречена начупена линия, чиито сегменти свързват точки ( х 1 ; W 1 ), (х 2 ; W 2 ), ..., (x k ; седмица ). За да се изгради полигон от относителни честоти, опциите се нанасят върху абсцисната ос x i , а по ординатата - съответните относителни честоти W i . Точки ( x i ; W i ) се свързват с прави отсечки и се получава многоъгълник от относителни честоти.

Кога непрекъснат знак препоръчително е да се изгради хистограма .

Честотна хистограманаречена стъпаловидна фигура, състояща се от правоъгълници, чиито основи са частични интервали от дължина ч , а височините са равни на отношението NIH (честотна плътност).

За да се изгради честотна хистограма, върху абсцисната ос се поставят частични интервали, а над тях на разстояние се чертаят сегменти, успоредни на абсцисната ос. NIH .

Групиране- това е разделяне на съвкупност на групи, които са хомогенни по някакъв признак.

Цел на услугата. С помощта на онлайн калкулатора можете:

  • изградете вариационна серия, изграждане на хистограма и полигон;
  • намиране на показатели за вариация (средно, режим (включително графично), медиана, диапазон на вариация, квартили, децили, коефициент на квартилна диференциация, коефициент на вариация и други показатели);

Инструкции. За да групирате серия, трябва да изберете вида на получената вариационна серия (дискретна или интервална) и да посочите количеството данни (брой редове). Полученото решение се записва във файл на Word (вижте пример за групиране на статистически данни).

Брой входни данни
",0);">

Ако групирането вече е извършено и дискретни вариационни серииили интервални серии, тогава трябва да използвате онлайн калкулатора Variation Indices. Проверка на хипотезата за вида на разпределениетосе извършва чрез услугата Изучаване на формуляра за разпределение.

Видове статистически групировки

Вариационни серии. В случай на наблюдения на дискретна случайна променлива, една и съща стойност може да се срещне няколко пъти. Такива стойности x i на случайна променлива се записват, като се посочва n i броят пъти, в които се появява в n наблюдения, това е честотата на тази стойност.
В случай на непрекъсната случайна променлива на практика се използва групиране.
  1. Типологично групиране- това е разделянето на качествено разнородната изследвана популация на класове, социално-икономически типове, хомогенни групи единици. За да изградите това групиране, използвайте параметъра Дискретни вариационни серии.
  2. Групирането се нарича структурно, при което една хомогенна популация е разделена на групи, които характеризират нейната структура според някаква различна характеристика. За да създадете това групиране, използвайте параметъра Interval series.
  3. Нарича се групиране, което разкрива връзките между изучаваните явления и техните характеристики аналитична група(виж аналитично групиране на сериите).

Принципи за изграждане на статистически групировки

Серия от наблюдения, подредени във възходящ ред, се нарича вариационна серия. Функция за групиранее характеристика, по която една популация се разделя на отделни групи. Нарича се основа на групата. Групирането може да се основава както на количествени, така и на качествени характеристики.
След определяне на основата на групирането трябва да се реши въпросът за броя на групите, на които трябва да се раздели изследваната популация.

Когато се използват персонални компютри за обработка на статистически данни, групирането на обектни единици се извършва по стандартни процедури.
Една такава процедура се основава на използването на формулата на Стърджис за определяне на оптималния брой групи:

k = 1+3,322*log(N)

Където k е броят на групите, N е броят на единиците от съвкупността.

Дължината на частичните интервали се изчислява като h=(x max -x min)/k

След това се отчита броят на наблюденията, които попадат в тези интервали, които се приемат като честоти n i . Няколко честоти, чиито стойности са по-малки от 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Средните стойности на интервалите x i =(c i-1 +c i)/2 се приемат като нови стойности.

Те са представени под формата на разпределителни серии и са представени във формата.

Разпределителната серия е един от видовете групировки.

Диапазон на разпространение— представлява подредено разпределение на единиците от изследваната популация в групи според определена различна характеристика.

В зависимост от характеристиката, залегнала в основата на формирането на сериите на разпространение, те се разграничават атрибутивни и вариационниразпределителни редове:

  • Атрибутивен- се наричат ​​серии на разпределение, изградени по качествени характеристики.
  • Сериите на разпределение, изградени във възходящ или низходящ ред на стойностите на количествена характеристика, се наричат вариационен.
Вариационната серия на разпределението се състои от две колони:

Първата колона предоставя количествени стойности на вариращата характеристика, които се наричат настроикии са обозначени. Дискретна опция - изразява се като цяло число. Опцията за интервал варира от и до. В зависимост от вида на опциите можете да конструирате дискретна или интервална вариационна серия.
Втората колона съдържа номер на конкретна опция, изразено чрез честоти или честоти:

Честоти- това са абсолютни числа, които показват колко пъти дадена стойност на дадена характеристика се среща в съвкупността, които означават . Сумата от всички честоти трябва да бъде равна на броя на единиците в цялата популация.

Честоти() са честоти, изразени като процент от общата сума. Сумата от всички честоти, изразени като проценти, трябва да бъде равна на 100% в части от едно.

Графично представяне на сериите на разпределение

Сериите за разпространение са визуално представени с помощта на графични изображения.

Разпределителните серии са изобразени като:
  • Многоъгълник
  • Хистограми
  • Кумулира
  • Ogives

Многоъгълник

При построяване на многоъгълник на хоризонтална ос(ос x) се нанасят стойностите на вариращата характеристика, а на вертикалната ос (ос y) се нанасят честотите или честотите.

Многоъгълникът на фиг. 6.1 се основава на данни от микропреброяването на населението на Русия през 1994 г.

6.1. Разпределение на размера на домакинствата

Състояние: Представени са данни за разпределението на 25 служители на едно от предприятията по тарифни категории:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Задача: Конструирайте серия от дискретни вариации и я изобразете графично като полигон на разпределение.
Решение:
В този пример опциите са степента на заплащане на служителя. За определяне на честотите е необходимо да се изчисли броят на служителите със съответната тарифна категория.

Полигонът се използва за дискретни вариационни серии.

За да конструираме полигон на разпределение (Фигура 1), ние начертаваме количествените стойности на вариращата характеристика - варианти - по абсцисната (X) ос и честотите или честотите по ординатната ос.

Ако стойностите на дадена характеристика са изразени под формата на интервали, тогава такава серия се нарича интервал.
Интервални серииразпределенията се изобразяват графично под формата на хистограма, кумулат или огива.

Статистическа таблица

Състояние: Дадени са данни за размера на депозитите 20 лицав една банка (хиляда рубли) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Задача: Конструирайте интервална вариационна серия с на равни интервали.
Решение:

  1. Първоначалната популация се състои от 20 единици (N = 20).
  2. С помощта на формулата на Sturgess определяме необходимия брой използвани групи: n=1+3,322*lg20=5
  3. Нека изчислим стойността на равния интервал: i=(152 - 2) /5 = 30 хиляди рубли
  4. Нека разделим първоначалната популация на 5 групи с интервал от 30 хиляди рубли.
  5. Представяме резултатите от групирането в таблицата:

При такъв запис на непрекъсната характеристика, когато една и съща стойност се среща два пъти (както горен лимитедин интервал и долната граница на друг интервал), тогава тази стойност принадлежи към групата, където тази стойност действа като горна граница.

стълбовидна диаграма

За да се изгради хистограма, стойностите на границите на интервалите са посочени по абсцисната ос и въз основа на тях са изградени правоъгълници, чиято височина е пропорционална на честотите (или честотите).

На фиг. 6.2. показва хистограма на разпределението на руското население през 1997 г. по възрастови групи.

Ориз. 6.2. Разпределение на руското население по възрастови групи

Състояние: Дадено е разпределението на 30 служители на фирмата по месечна заплата

Задача: Покажете серията от интервални вариации графично под формата на хистограма и кумулирайте.
Решение:

  1. Неизвестната граница на отворения (първи) интервал се определя от стойността на втория интервал: 7000 - 5000 = 2000 рубли. Със същата стойност намираме долната граница на първия интервал: 5000 - 2000 = 3000 рубли.
  2. За да изградим хистограма в правоъгълна координатна система, начертаваме по оста на абсцисата сегментите, чиито стойности съответстват на интервалите от варикозната серия.
    Тези сегменти служат за долна основа, а съответната честота (честота) служи за височина на образуваните правоъгълници.
  3. Нека изградим хистограма:

За да се конструират кумулати, е необходимо да се изчислят натрупаните честоти (честоти). Те се определят чрез последователно сумиране на честотите (честотите) на предишни интервали и се обозначават с S. Натрупаните честоти показват колко единици от съвкупността имат характерна стойност не по-голяма от разглежданата.

Кумулира

Разпределението на характеристика в вариационна серия върху натрупаните честоти (честоти) се изобразява с помощта на кумулация.

Кумулираили кумулативната крива, за разлика от полигона, се изгражда от натрупани честоти или честоти. В този случай стойностите на характеристиката се поставят на абсцисната ос, а натрупаните честоти или честоти се поставят на ординатната ос (фиг. 6.3).

Ориз. 6.3. Кумулира разпределението на размера на домакинството

4. Нека изчислим натрупаните честоти:
Кумулативната честота на първия интервал се изчислява по следния начин: 0 + 4 = 4, за втория: 4 + 12 = 16; за третата: 4 + 12 + 8 = 24 и т.н.

При конструиране на кумулация натрупаната честота (честота) на съответния интервал се присвоява на горната му граница:

Огива

Огивасе конструира подобно на кумулата с единствената разлика, че натрупаните честоти са поставени на абсцисната ос, а характерните стойности са поставени на ординатната ос.

Тип кумулат е крива на концентрация или графика на Лоренц. За да се построи крива на концентрация, върху двете оси на правоъгълната координатна система се нанася скална скала в проценти от 0 до 100. В същото време натрупаните честоти са посочени на абсцисната ос, а натрупаните стойности на дела. (в проценти) по обем на характеристиката са посочени на ординатната ос.

Равномерното разпределение на характеристиката съответства на диагонала на квадрата на графиката (фиг. 6.4). При неравномерно разпределение графиката представлява вдлъбната крива в зависимост от нивото на концентрация на признака.

6.4. Концентрационна крива

Най-простият начин да обобщим статистически материале изграждането на серии. Обобщен резултат статистически изследванияможе да има серии за разпространение. Серия на разпределение в статистиката е подредено разпределение на единиците от съвкупността в групи според всяка една характеристика: качествена или количествена. Ако серия е изградена на качествена основа, тогава тя се нарича атрибутивна, а ако на количествена основа, тогава се нарича вариационна.

Една вариационна серия се характеризира с два елемента: вариант (X) и честота (f). Вариантът е отделна стойност на характеристика на отделна единица или група от съвкупност. Число, показващо колко пъти се среща дадена стойност на атрибута, се нарича честота. Ако честотата е изразена като относително число, тогава тя се нарича честота. Вариационната серия може да бъде интервална, когато са определени границите "от" и "до", или може да бъде дискретна, когато изследваната характеристика се характеризира с определено число.

Нека да разгледаме изграждането на вариационни серии, използвайки примери.

Пример. и има данни за тарифните категории на 60 работници в един от цеховете на завода.

Разпределете работниците според тарифната категория, изградете вариационна серия.

За да направите това, записваме всички стойности на характеристиката във възходящ ред и преброяваме броя на работниците във всяка група.

Таблица 1.4

Разпределение на работниците по категории

Ранг на работник (X)

Брой работници

човек (е)

в % от общото (по-специално)

Получихме вариационна дискретна серия, в която изследваната характеристика (ранг на работника) е представена с определено число. За по-голяма яснота вариационните серии са изобразени графично. Въз основа на тази серия на разпределение е изградена разпределителна повърхност.

Ориз. 1.1. Полигон за разпределение на работниците по тарифен разряд

Ще разгледаме изграждането на интервална серия с равни интервали, използвайки следния пример.

Пример. Известни са данни за стойността на основния капитал на 50 компании в милиони рубли. Изисква се да се покаже разпределението на фирмите по цена на основен капитал.

За да покажем разпределението на фирмите по стойност на основния капитал, първо решаваме въпроса за броя на групите, които искаме да подчертаем. Да предположим, че решихме да идентифицираме 5 групи предприятия. След това определяме размера на интервала в групата. За целта използваме формулата

Според нашия пример.

Като добавим стойността на интервала към минималната стойност на атрибута, получаваме групи от фирми по цена на основен капитал.

Единица с двойна стойност принадлежи към групата, където действа като горна граница (т.е. стойността на атрибута 17 ще отиде в първата група, 24 във втората и т.н.).

Нека преброим броя на фабриките във всяка група.

Таблица 1.5

Разпределение на фирмите по стойност на основния капитал (млн рубли)

Цената на основния капитал
в милиони рубли (Х)

Брой фирми
(честота) (f)

Натрупани честоти
(кумулативно)

Съгласно това разпределение се получава интервал на вариация, от който следва, че 36 фирми имат основен капитал на стойност от 10 до 24 милиона рубли. и т.н.

Сериите на интервалното разпределение могат да бъдат представени графично под формата на хистограма.

Резултатите от обработката на данните са представени в статистически таблици. Статистическите таблици съдържат собствен субект и предикат.

Предметът е съвкупността или част от съвкупността, която се характеризира.

Предикатите са показатели, които характеризират субекта.

Различават се таблици: прости и групови, комбинирани, с просто и сложно развитие на предиката.

Една проста таблица в темата съдържа списък с отделни единици.

Ако предметът съдържа групиране на единици, тогава такава таблица се нарича групова таблица. Например група предприятия по брой работници, групи от населението по пол.

Предметът на комбинираната таблица съдържа групиране по два или повече признака. Например населението се разделя по пол на групи по образование, възраст и т.н.

Комбинираните таблици съдържат информация, която позволява да се идентифицират и характеризират връзката на редица показатели и модела на техните промени както в пространството, така и във времето. За да направите таблицата ясна, когато развивате нейния предмет, ограничете се до две или три характеристики, образувайки ограничен брой групи за всяка от тях.

Предикатът в таблиците може да се развие по различни начини. С просто развитие на предиката всички негови индикатори са разположени независимо един от друг.

При сложно развитие на предиката индикаторите се комбинират помежду си.

При конструирането на всяка таблица трябва да се изхожда от целите на изследването и съдържанието на обработения материал.

В допълнение към таблиците статистиката използва също графики и диаграми. Диаграма – статистическите данни са изобразени с помощта на геометрични форми. Диаграмите са разделени на линейни и стълбовидни диаграми, но може да има и фигурни диаграми (чертежи и символи), кръгови диаграми (кръгът се приема като стойност на цялата съвкупност и се показват площите на отделните сектори специфично теглоили дял от него компоненти), радиални диаграми (построени на базата на полярни ординати). Картограмата е комбинация контурна картаили план на място със схема.

При конструирането на серия от интервално разпределение се решават три въпроса:

  • 1. Колко интервала трябва да взема?
  • 2. Каква е дължината на интервалите?
  • 3. Каква е процедурата за включване на съвкупност от единици в границите на интервалите?
  • 1. Брой интервалиможе да се определи от Формула на Стърджис:

2. Дължина на интервала или интервална стъпка, обикновено се определя по формулата

Където Р-диапазон на вариация.

3. Редът на включване на единиците на съвкупността в границите на интервала

може да бъде различно, но при изграждането на интервален ред разпределението трябва да бъде строго определено.

Например това: [), в което единиците на съвкупността са включени в долните граници, но не са включени в горните граници, а се прехвърлят към следващия интервал. Изключение от това правило е последният интервал, чиято горна граница включва последно числокласирани серии.

Границите на интервала са:

  • затворен - с две екстремни стойности на атрибута;
  • open - с една крайна стойност на атрибута (предитакъв и такъв номер или надтакъв и такъв номер).

За да усвоим теоретичния материал, въвеждаме обща информацияза решения задача от край до край.

Има условни данни за средния брой мениджъри по продажбите, количеството продадени от тях подобни стоки, индивидуалната пазарна цена за този продукт, както и обема на продажбите на 30 компании в един от регионите на Руската федерация през първото тримесечие на отчетната година (Таблица 2.1).

Таблица 2.1

Първоначална информация за междусекторна задача

Номер

мениджъри,

Цена, хиляди рубли

Обем на продажбите, милиони рубли.

Номер

мениджъри,

Количество продадени стоки, бр.

Цена, хиляди рубли

Обем на продажбите, милиони рубли.

Въз основа на първоначалната информация, както и на допълнителната информация, ще съставим индивидуални задачи. След това ще представим методиката за решаването им и самите решения.

Междусекторна задача. Задача 2.1

Използвайки изходните данни от табл. Изисква се 2.1конструирайте дискретна серия от разпределение на фирмите по количество продадени стоки (Таблица 2.2).

Решение:

Таблица 2.2

Дискретни серии от разпределение на фирмите по количество продадени стоки в един от регионите на Руската федерация през първото тримесечие на отчетната година

Междусекторна задача. Задача 2.2

изисква сеизградете класирана серия от 30 фирми според средния брой мениджъри.

Решение:

15; 17; 18; 20; 20; 20; 22; 22; 24; 25; 25; 25; 27; 27; 27; 28; 29; 30; 32; 32; 33; 33; 33; 34; 35; 35; 38; 39; 39; 45.

Междусекторна задача. Задача 2.3

Използвайки изходните данни от табл. 2.1, задължително:

  • 1. Конструирайте интервална серия от разпределение на фирмите по брой мениджъри.
  • 2. Изчислете честотите на сериите на разпределение на фирмите.
  • 3. Направете изводи.

Решение:

Нека изчислим по формулата на Стърджис (2.5) брой интервали:

Така вземаме 6 интервала (групи).

Дължина на интервала, или интервална стъпка, изчислете по формулата

Забележка.Редът за включване на единиците на съвкупността в границите на интервала е следният: I), при който единиците на популацията се включват в долните граници, но не се включват в горните граници, а се прехвърлят в следващия интервал. Изключение от това правило е последният интервал I ], чиято горна граница включва последния номер на класираната серия.

Изграждаме интервална серия (Таблица 2.3).

Интервални серии от разпределение на фирмите и средния брой мениджъри в един от регионите на Руската федерация през първото тримесечие на отчетната година

Заключение.Най-голямата група фирми е групата със среден брой мениджъри 25-30 души, която включва 8 фирми (27%); Най-малката група със среден брой мениджъри 40-45 души включва само една компания (3%).

Използвайки изходните данни от табл. 2.1, както и интервална серия от разпределение на фирмите по брой мениджъри (Таблица 2.3), изисква сеизградете аналитично групиране на връзката между броя на мениджърите и обема на продажбите на фирмите и въз основа на това направете заключение за наличието (или липсата) на връзка между тези характеристики.

Решение:

Аналитичното групиране се основава на факторни характеристики. В нашата задача факторната характеристика (x) е броят на мениджърите, а резултантната характеристика (y) е обемът на продажбите (Таблица 2.4).

Да строим сега аналитично групиране(Таблица 2.5).

Заключение.Въз основа на данните от изграденото аналитично групиране можем да кажем, че с увеличаване на броя на мениджърите по продажби се увеличава и средният обем на продажбите на компанията в групата, което показва наличието на пряка връзка между тези характеристики.

Таблица 2.4

Помощна таблица за построяване на аналитична групировка

Брой мениджъри, хора,

Фирмен номер

Обем на продажбите, милиони рубли, г

" = 59 f = 9,97

I-™ 4 -Ю.22

74 '25 1PY1

U4 = 7 = 10,61

при = ’ =10,31 30

Таблица 2.5

Зависимостта на обема на продажбите от броя на мениджърите на компанията в един от регионите на Руската федерация през първото тримесечие на отчетната година

КОНТРОЛНИ ВЪПРОСИ
  • 1. Каква е същността на статистическото наблюдение?
  • 2. Назовете етапите на статистическото наблюдение.
  • 3. Какви са организационни формистатистическо наблюдение?
  • 4. Назовете видовете статистическо наблюдение.
  • 5. Какво е статистическо резюме?
  • 6. Назовете видовете статистически отчети.
  • 7. Какво е статистическо групиране?
  • 8. Назовете видовете статистически групировки.
  • 9. Какво е серия за разпространение?
  • 10. Наименувайте структурните елементи на разпределителния ред.
  • 11. Каква е процедурата за изграждане на серия за разпределение?


Ново в сайта

>

Най - известен