У дома Обложен език Ако вариационната серия има формата. Променливост и променливи серии, обхват на променливостта

Ако вариационната серия има формата. Променливост и променливи серии, обхват на променливостта

Вариационенсе наричат ​​серии на разпределение, построени на количествена основа. Стойностите на количествените характеристики в отделните единици на съвкупността не са постоянни и се различават повече или по-малко една от друга.

Вариация- колебание, променливост на стойността на дадена характеристика сред единиците от съвкупността. Отделно числови стойностихарактеристики, открити в изследваната популация, се наричат настроикистойности. Недостатъчна средна стойност за пълни характеристикипопулацията ни принуждава да допълваме средните стойности с показатели, които ни позволяват да оценим типичността на тези средни стойности чрез измерване на променливостта (вариацията) на изследваната характеристика.

Наличието на вариация се дължи на влиянието на голям брой фактори върху формирането на нивото на признака. Тези фактори действат с различна сила и в различни посоки. Индексите на вариация се използват за описание на мярката за вариабилност на признака.

Задачи статистическо изследваневариации:

  • 1) изследване на естеството и степента на вариация на характеристиките в отделни единици от съвкупността;
  • 2) определяне на ролята на отделни фактори или техните групи в изменението на определени характеристики на населението.

Използва се в статистиката специални методиизследвания на вариациите въз основа на използването на система от индикатори, спо който се измерва вариацията.

Изследването на вариациите има важно. Измерването на вариациите е необходимо при извършване на вземане на проби, корелация и дисперсионен анализи т.н. Ермолаев О.Ю. Математическа статистика за психолози: Учебник [Текст]/ О.Ю. Ермолаев. - М .: Издателство "Флинт" на Московския психологически и социален институт, 2012. - 335 с.

По степента на вариация може да се прецени хомогенността на популацията, стабилността на индивидуалните стойности на характеристиките и типичността на средната стойност. На тяхна основа са разработени показатели за близостта на връзката между характеристиките и показатели за оценка на точността на извадковото наблюдение.

Прави се разлика между изменение в пространството и изменение във времето.

Променливостта в пространството се разбира като колебание на стойностите на атрибутите сред популационните единици, представляващи отделни територии. Вариация във времето означава промяна в стойностите на дадена характеристика в различни периодивреме.

За да се проучат вариациите в редовете за разпределение, всички варианти на стойностите на атрибутите се подреждат във възходящ или низходящ ред. Този процес се нарича класиране на редове.

Повечето прости знацивариациите са минимум и максимум- най-малко и най-висока стойностзнаци в съвкупност. Броят на повторенията на отделните варианти на стойностите на характеристиките се нарича честота на повторение (fi). Удобно е да замените честотите с честоти - wi. Честотата е относителен показател за честота, който може да бъде изразен в части от единица или процент и ви позволява да сравнявате вариационни серии с различен номернаблюдения. Изразява се с формулата:

където Xmax, Xmin са максималните и минималните стойности на характеристиката в съвкупността; n - брой групи.

За измерване на вариацията на дадена характеристика се използват различни абсолютни и относителни показатели. Абсолютните показатели за вариация включват диапазона на вариация, средно линейно отклонение, дисперсия и стандартно отклонение. Относителните показатели за трептене включват коефициент на трептене, относително линейно отклонение и коефициент на вариация.

Пример за намиране вариационна серия

Упражнение.За тази проба:

  • а) Намерете вариационната серия;
  • б) Конструирайте функцията на разпределение;

№=42. Примерни елементи:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

Решение.

  • а) изграждане на класирана вариационна серия:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • б) изграждане на дискретна вариационна серия.

Нека изчислим броя на групите във вариационната серия, използвайки формулата на Стърджис:

Нека вземем броя на групите равен на 7.

Знаейки броя на групите, изчисляваме размера на интервала:

За удобство при конструирането на таблицата ще вземем броя на групите, равен на 8, интервалът ще бъде 1.

Ориз. 1 Обемът на продажбите на стоки от магазин за определен период от време

Вариацията определяразлики в стойностите на дадена характеристика между различни единици от дадена популация за един и същи период (точка във времето). Причините за вариациите са различни условиясъществуването на различни единици от съвкупността. Например, дори близнаците в хода на живота си придобиват разлики в ръста, теглото, както и в такива характеристики като ниво на образование, доход, брой деца и т.н.

Вариацията възниква в резултат на факта, че самите стойности на атрибута се формират под общото влияние на различни условия, които се комбинират по различни начини във всеки отделен случай. Следователно стойността на всяка опция е обективна.

Вариацията е характернакъм всички явления на природата и обществото без изключение, с изключение на законово установените нормативни значения на индивидуалните социални характеристики. Изследванията на вариациите в статистиката имат страхотна цена, помагат да се разбере същността на изучаваното явление. Намирането на вариация, откриването на причините за нея, идентифицирането на влиянието на отделните фактори дава важна информацияза реализиране на научно обосновани управленски решения.

Средната стойност дава обобщена характеристика на характеристиката на съвкупността, но не разкрива нейната структура. Средната стойност не показва как вариантите на осреднената характеристика са разположени около нея, дали са разпределени близо до средната или се отклоняват от нея. Средната стойност в две популации може да е еднаква, но в едната версия всички индивидуални стойности се различават незначително от нея, а в другата тези разлики са големи, т.е. в първия случай вариацията на характеристиката е малка, а във втория е голяма, това е много важно за характеризиране на значимостта на средната стойност.

За да може ръководителят на организацията, мениджърът или изследователят да изучава вариацията и да я управлява, статистиката е разработила специални методи за изучаване на вариацията (система от показатели). С тяхна помощ се открива вариация и се характеризират нейните свойства. Вариационните индикатори включват : диапазон на вариация, средно линейно отклонение, коефициент на вариация.

Вариационна серия и нейните форми

Вариационни серии- това е подредено разпределение на единици от популация, често според нарастващи (по-рядко намаляващи) стойности на характеристика и преброяване на броя единици с определена стойност на характеристиката. Когато броят на единиците на съвкупността е голям, класираната серия става тромава, изграждането й отнема дълго време. В такава ситуация се изгражда вариационна серия чрез групиране на единици от съвкупността според стойностите на изследваната характеристика.

Има следните форми на вариационна серия :

  1. Класирани сериипредставлява списък на отделни единици от съвкупността във възходящ (низходящ) ред на изследваната характеристика.
  2. Дискретни вариационни серии - това е таблица, състояща се от два реда или графики: специфични стойности на променливата характеристика x и броя на единиците от популацията с дадена стойност f - честотната характеристика. Той се конструира, когато атрибутът приеме най-голям брой стойности.
  3. Интервални серии.

Определя се диапазонът на вариациякак абсолютна стойностразликата между максималните и минималните стойности (варианти) на характеристиката:

Диапазонът на вариация показва само екстремни отклонения на характеристиката и не отразява индивидуалните отклонения на всички опции в серията. Той характеризира границите на изменение на различна характеристика и зависи от колебанията на две екстремни опции и абсолютно не е свързан с честотите в серията вариации, т.е. с естеството на разпределението, което придава на тази стойност случаен характер. За да анализирате вариацията, имате нужда от индикатор, който отразява всички колебания в характеристиката на вариацията и дава основни характеристики. Най-простият индикатор от този тип е средното линейно отклонение.

Статистически редове на разпределение– това е подредено разпределение на единиците от съвкупността в групи според определена различна характеристика.
В зависимост от характеристиката, лежаща в основата на формирането на разпределителните серии, има атрибутивни и вариационни серии на разпределение.

Наличието на обща характеристика е в основата на формирането на статистическа съвкупност, която представлява резултатите от описание или измерване Общи чертиобекти на изследване.

Предмет на изследване в статистиката са променящите се (вариращи) характеристики или статистически характеристики.

Видове статистически характеристики.

Сериите на разпределение се наричат ​​атрибутивниизградени по критерии за качество. Атрибутивен– това е знак, който има име (например професия: шивачка, учител и др.).
Сериите на разпределение обикновено се представят под формата на таблици. В табл 2.8 показва сериите за разпределение на атрибутите.
Таблица 2.8 - Разпределение на видовете правна помощуслуги, предоставяни от адвокати на граждани на един от регионите на Руската федерация.

Вариационни серии– това са стойностите на характеристиката (или интервали от стойности) и техните честоти.
Вариационните серии са серии на разпределение, изграден на количествена основа. Всяка вариационна серия се състои от два елемента: опции и честоти.
Вариантите се считат за индивидуални стойности на характеристика, която тя приема в серия от вариации.
Честотите са числата на отделните варианти или всяка група от вариационна серия, т.е. Това са числа, показващи колко често се появяват определени опции в серия за разпространение. Сумата от всички честоти определя размера на цялата популация, нейния обем.
Честотите са честоти, изразени като части от единица или като процент от общата сума. Съответно сумата от честотите е равна на 1 или 100%. Вариационната серия позволява да се оцени формата на закона за разпределение въз основа на действителни данни.

В зависимост от характера на изменението на признака има дискретни и интервални вариационни серии.
Пример за серия от дискретни вариации е даден в табл. 2.9.
Таблица 2.9 - Разпределение на семействата по броя на заетите стаи в отделни апартаменти през 1989 г. в Руската федерация.

Първата колона на таблицата представя опции за серия от дискретни вариации, втората колона съдържа честотите на серията вариации, а третата съдържа индикатори за честота.

Вариационни серии

IN населениеопределена количествена характеристика се изследва. Проба от обема се извлича произволно от него н, тоест броят на примерните елементи е равен на н. На първия етап от статистическата обработка, вариращипроби, т.е. подреждане на номера x 1, x 2, …, x nВъзходящ. Всяка наблюдавана стойност x iНаречен опция. Честота m iе броят на наблюденията на стойността x iв пробата. Относителна честота (честота) w iе честотното съотношение m iдо размера на извадката н: .
При изучаване на вариационни серии се използват и понятията натрупана честота и натрупана честота. Позволявам хнякакво число. След това броят на опциите , чиито стойности са по-малки х, се нарича акумулирана честота: за x i нсе нарича акумулирана честота w i max.
Една характеристика се нарича дискретно променлива, ако нейните индивидуални стойности (варианти) се различават една от друга с определена крайна стойност (обикновено цяло число). Серията от вариации на такава характеристика се нарича серия от дискретни вариации.

Таблица 1. Общ изглед на серия от честоти на дискретни вариации

Характерни стойностиx i х 1 х 2 x n
Честотиm i m 1 м 2 m n

Една характеристика се нарича непрекъснато променяща се, ако нейните стойности се различават една от друга с произволно малка сума, т.е. един знак може да приеме произволна стойност в определен интервал. Серия от непрекъснати вариации за такава характеристика се нарича интервал.

Таблица 2. Общ изглед на интервалните вариационни серии от честоти

Таблица 3. Графични изображения на вариационната серия

РедетеМногоъгълник или хистограмаЕмпирична функция на разпределение
Отделен
Интервал
Чрез преглед на резултатите от наблюденията се определя колко вариантни стойности попадат във всеки конкретен интервал. Предполага се, че всеки интервал принадлежи към един от своите краища: или във всички случаи вляво (по-често), или във всички случаи вдясно, а честотите или честотите показват броя на опциите, съдържащи се в определените граници. Разлики a i – a i +1се наричат ​​частични интервали. За да се опростят последващите изчисления, интервалните вариационни серии могат да бъдат заменени с условно дискретни. В този случай средната стойност аз-интервалът се приема като опция x iи съответната интервална честота m i– за честотата на този интервал.
За графично представяне на вариационни серии най-често използваните са полигон, хистограма, кумулативна крива и емпирична функция на разпределение.

В табл 2.3 (Представено е групиране на руското население по среден доход на глава от населението през април 1994 г.) интервални вариационни серии.
Удобно е да се анализират серии на разпределение с помощта на графично изображение, което позволява да се прецени формата на разпределението. Визуално представяне на характера на промените в честотите на вариационните серии е дадено от многоъгълник и хистограма.
Многоъгълникът се използва при изобразяване на дискретни вариационни серии.
Нека, например, изобразим графично разпределението на жилищния фонд по тип апартамент (Таблица 2.10).
Таблица 2.10 - Разпределение на жилищния фонд на градската зона по тип апартамент (условни числа).


Ориз. Жилищна разпределителна зона


Не само честотните стойности, но и честотите на вариационните серии могат да бъдат нанесени върху ординатните оси.
Хистограмата се използва за изобразяване на серия от интервални вариации. При конструирането на хистограма стойностите на интервалите се нанасят върху абсцисната ос, а честотите се изобразяват с правоъгълници, изградени върху съответните интервали. Височината на колоните в случай на равни интервали трябва да бъде пропорционална на честотите. Хистограмата е графика, в която серия е изобразена като ленти, съседни една на друга.
Нека изобразим графично серията интервално разпределение, дадена в табл. 2.11.
Таблица 2.11 - Разпределение на семействата по размер на жилищната площ на човек (условни цифри).
N p/p Групи семейства според размера на жилищната площ на човек Брой семейства с даден размер на жилищна площ Кумулативен брой семейства
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
ОБЩА СУМА 115 ----


Ориз. 2.2. Хистограма на разпределението на семействата по размер на жилищната площ на човек


Използвайки данните от натрупаната серия (Таблица 2.11), ние конструираме кумулативно разпределение.


Ориз. 2.3. Кумулативно разпределение на семействата по размер на жилищната площ на човек


Представянето на вариационна серия под формата на кумулация е особено ефективно за вариационна серия, чиито честоти са изразени като части или проценти от сбора на честотите на серията.
Ако променим осите при графично изобразяване на вариационна серия под формата на кумулати, тогава получаваме огива. На фиг. 2.4 е показан огив, конструиран въз основа на данните от табл. 2.11.
Хистограмата може да бъде преобразувана в многоъгълник на разпределение чрез намиране на средните точки на страните на правоъгълниците и след това свързване на тези точки с прави линии. Полученият разпределителен полигон е показан на фиг. 2.2 с пунктирана линия.
При конструиране на хистограма на разпределението на вариационна серия с неравни интервали по ординатната ос се нанасят не честотите, а плътността на разпределението на характеристиката в съответните интервали.
Плътността на разпределение е честотата, изчислена за единица ширина на интервала, т.е. колко единици във всяка група са на единица интервална стойност. Пример за изчисляване на плътността на разпределение е представен в табл. 2.12.
Таблица 2.12 - Разпределение на предприятията по брой заети (условни числа)
N p/p Групи предприятия по брой служители, души. Брой предприятия Размер на интервала, хора. Плътност на разпространение
А 1 2 3=1/2
1 До 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
ОБЩА СУМА 147 ---- ----

Може да се използва и за графично представяне на вариационни серии кумулативна крива. С помощта на кумулативна (сумарна крива) се изобразява поредица от натрупани честоти. Кумулативните честоти се определят чрез последователно сумиране на честотите в групите и показват колко единици в популацията имат стойности на атрибути, които не са по-големи от разглежданата стойност.


Ориз. 2.4. Огива за разпределение на семействата според размера на жилищната площ на човек

Когато се конструират кумулациите на интервална вариационна серия, вариантите на серията се нанасят по абсцисната ос, а натрупаните честоти се нанасят по ординатната ос.

Специално място в статистическия анализ заема определянето на средното ниво на изследваната характеристика или явление. Средното ниво на черта се измерва чрез средни стойности.

Средната стойност характеризира общото количествено ниво на изучавания признак и е групово свойство на статистическата съвкупност. Той изравнява, отслабва случайните отклонения на отделните наблюдения в една или друга посока и подчертава основното, типично свойство на изследваната характеристика.

Средните стойности са широко използвани:

1. Да се ​​оцени здравословното състояние на населението: характеристики на физическото развитие (височина, тегло, гръдна обиколка и др.), Идентифициране на разпространението и продължителността на различни заболявания, анализ на демографски показатели (жизнено движение на населението, средна продължителност на живота, възпроизводство на населението, средно население и др.).

2. Да проучи дейността на лечебните заведения, медицинския персонал и да оцени качеството на тяхната работа, да планира и определи нуждите на населението от различни видове медицинска помощ (среден брой заявки или посещения на жител на година, средна продължителност на престоя на пациент в болница, средна продължителност на прегледа пациент, средна наличност на лекари, легла и др.).

3. Да характеризира санитарно-епидемиологичното състояние (средно съдържание на прах във въздуха в цеха, средна площ на човек, средна консумация на протеини, мазнини и въглехидрати и др.).

4. Да се ​​​​определят медицински и физиологични показатели в нормални и патологични състояния, при обработка на лабораторни данни, за установяване на надеждността на резултатите от пробно изследване в социални, хигиенни, клинични и експериментални изследвания.

Изчисляването на средните стойности се извършва въз основа на вариационни серии. Вариационни сериие качествено хомогенна статистическа съвкупност, чиито отделни единици характеризират количествените различия на изследваната характеристика или явление.

Количествената вариация може да бъде два вида: прекъсната (дискретна) и непрекъсната.

Прекъснатият (дискретен) атрибут се изразява само като цяло число и не може да има никакви междинни стойности (например броя на посещенията, популацията на сайта, броя на децата в семейството, тежестта на заболяването в точки и т.н.).

Непрекъснатият знак може да приема всякакви стойности в определени граници, включително дробни, и се изразява само приблизително (например тегло - за възрастни може да бъде ограничено до килограми, а за новородени - грамове; височина, кръвно налягане, време прекарано в преглед на пациент и т.н.).



Цифровата стойност на всяка отделна характеристика или явление, включено в серията вариации, се нарича вариант и се обозначава с буквата V . В математическата литература се срещат и други означения, например х или г.

Вариационна серия, при която всяка опция е посочена веднъж, се нарича проста.Такива серии се използват в повечето статистически задачи в случай на компютърна обработка на данни.

С нарастването на броя на наблюденията се появяват повтарящи се стойности на варианти. В този случай се създава групирани вариационни серии, където е посочен броят на повторенията (честота, означена с буквата „ Р »).

Класирани вариационни сериисе състои от опции, подредени във възходящ или низходящ ред. Както простите, така и групираните серии могат да бъдат съставени с класиране.

Интервални вариационни сериикомпилиран, за да се опростят последващите изчисления, извършени без използването на компютър, с много голям брой единици за наблюдение (повече от 1000).

Непрекъснати вариационни сериивключва стойности на опции, които могат да бъдат всякакви стойности.

Ако в една вариационна серия стойностите на дадена характеристика (варианти) са дадени под формата на отделни специфични числа, тогава такава серия се нарича отделен.

Общите характеристики на стойностите на характеристиката, отразени в серията вариации, са средните стойности. Сред тях най-използвани са: средно аритметично М,мода мои медиана азВсяка от тези характеристики е уникална. Те не могат да се заменят един друг и само заедно представят особеностите на вариационната серия доста пълно и в съкратен вид.

Мода (Мо) назовете стойността на най-често срещаните опции.

Медиана (аз) – това е стойността на опцията, разделяща класираната вариационна серия наполовина (от всяка страна на медианата има половината от опцията). В редки случаи, когато има симетрична вариационна серия, модата и медианата са равни една на друга и съвпадат със стойността на средната аритметична.

Най-типичната характеристика на стойностите на опциите е средноаритметичностойност ( М ). В математическата литература се обозначава .

Средноаритметично (М, ) е обща количествена характеристика на определена характеристика на изследваните явления, съставляващи качествено хомогенна статистическа съвкупност. Има прости и претеглени средни аритметични. Простата средна аритметична стойност се изчислява за проста серия от вариации чрез сумиране на всички опции и разделяне на тази сума на общия брой опции, включени в тази серия от вариации. Изчисленията се извършват по формулата:

,

Където: М - средно аритметично;

Σ V - опция за сума;

н- брой наблюдения.

В групираните вариационни серии се определя среднопретеглената аритметична стойност. Формулата за изчисляването му:

,

Където: М - средноаритметично претеглено;

Σ Vp - сумата от произведенията на варианта по техните честоти;

н- брой наблюдения.

При голям брой наблюдения, в случай на ръчни изчисления, може да се използва методът на моментите.

Средната аритметична има следните свойства:

· сума на отклоненията от средното ( Σ д ) е равно на нула (виж таблица 15);

· при умножаване (деление) на всички опции с един и същи коефициент (делител), средноаритметичното се умножава (дели) на един и същ коефициент (делител);

· ако добавите (извадите) едно и също число към всички опции, средноаритметичното се увеличава (намалява) със същото число.

Средните аритметични стойности, взети сами по себе си, без да се вземе предвид променливостта на серията, от която са изчислени, може да не отразяват напълно свойствата на вариационната серия, особено когато е необходимо сравнение с други средни стойности. Средни стойности, които са близки по стойност, могат да бъдат получени от серии с различна степен на разсейване. Колкото отделните варианти са по-близки един до друг по своите количествени характеристики, толкова по-малко дисперсия (колебания, променливост)серия, толкова по-типична е нейната средна стойност.

Основните параметри, които ни позволяват да оценим променливостта на даден признак, са:

· Обхват;

· Амплитуда;

· Стандартно отклонение;

· Коефициентът на вариация.

Променливостта на даден признак може приблизително да се прецени по диапазона и амплитудата на вариационните серии. Диапазонът показва максималните (V max) и минималните (V min) опции в серията. Амплитудата (A m) е разликата между тези опции: A m = V max - V min.

Основната, общоприета мярка за променливостта на вариационна серия е дисперсия (д ). Но най-често се използва по-удобен параметър, изчислен на базата на дисперсия - стандартното отклонение ( σ ). Той взема предвид големината на отклонението ( д ) на всяка вариационна серия от нейната средна аритметична ( d=V - М ).

Тъй като отклоненията от средната стойност могат да бъдат положителни и отрицателни, когато се сумират, те дават стойност „0“ (S d=0). За да избегнете това, стойностите на отклонението ( д) се повдигат на втора степен и се осредняват. По този начин дисперсията на вариационна серия е средният квадрат на отклоненията на варианта от средноаритметичната стойност и се изчислява по формулата:

.

Това е най-важната характеристика на променливостта и се използва за изчисляване на много статистически критерии.

Тъй като дисперсията се изразява като квадрат на отклоненията, нейната стойност не може да се използва в сравнение със средната аритметична стойност. За тези цели се използва стандартно отклонение, което е обозначено със знака „Сигма“ ( σ ). Той характеризира средното отклонение на всички варианти на вариационна серия от средноаритметичната стойност в същите единици като самата средна стойност, така че те могат да се използват заедно.

Стандартното отклонение се определя по формулата:

Посочената формула се прилага, когато броят на наблюденията ( н ) повече от 30. С по-малко число н стойността на стандартното отклонение ще има грешка, свързана с математическото отместване ( н - 1). В тази връзка може да се получи по-точен резултат, като се вземе предвид такова отклонение във формулата за изчисляване на стандартното отклонение:

стандартно отклонение (с ) е оценка на стандартното отклонение на случайна променлива хспрямо неговото математическо очакване, базирано на безпристрастна оценка на неговата дисперсия.

С ценности н > 30 стандартно отклонение ( σ ) и стандартно отклонение ( с ) ще бъде същото ( σ = s ). Следователно в повечето практически ръководства тези критерии се считат за различни значения.В програма Ексел изчислениестандартното отклонение може да се извърши с помощта на функцията =STDEV(диапазон). И за да изчислите стандартното отклонение, трябва да създадете подходяща формула.

Средният квадрат или стандартното отклонение ви позволява да определите колко стойностите на дадена характеристика могат да се различават от средната стойност. Да предположим, че има два града с еднаква средна дневна температура през лятото. Единият от тези градове е разположен на брега, а другият на континента. Известно е, че в градовете, разположени на брега, разликите в дневните температури са по-малки, отколкото в градовете, разположени във вътрешността. Следователно стандартното отклонение на дневните температури за крайбрежния град ще бъде по-малко, отколкото за втория град. На практика това означава, че средната температура на въздуха на всеки определен денв град, разположен на континента, ще се различава повече от средното, отколкото в град на брега. В допълнение, стандартното отклонение ви позволява да оцените възможните температурни отклонения от средната стойност с необходимото ниво на вероятност.

Според теорията на вероятностите, при явления, които се подчиняват на нормалния закон за разпределение, има строга връзка между стойностите на средната аритметична стойност, стандартното отклонение и опциите ( правило три сигма). Например, 68,3% от стойностите на различна характеристика са в рамките на M ± 1 σ , 95,5% - в рамките на M ± 2 σ и 99,7% - в рамките на М ± 3 σ .

Стойността на стандартното отклонение ни позволява да преценим естеството на хомогенността на вариационните серии и изследваната група. Ако стойността на стандартното отклонение е малка, това показва доста висока хомогенност на изследваното явление. Средната аритметична стойност в този случай трябва да се счита за доста характерна за дадена вариационна серия. Твърде малката сигма стойност обаче кара човек да мисли за изкуствен подбор на наблюдения. При много голяма сигма средната аритметична характеризира вариационните серии в по-малка степен, което показва значителна променливост на изследваната характеристика или явление или хетерогенността на изследваната група. Сравняването на стойността на стандартното отклонение обаче е възможно само за характеристики с едно и също измерение. Наистина, ако сравним разнообразието от тегла на новородени деца и възрастни, винаги ще получаваме по-високи сигма стойности при възрастни.

Сравнението на променливостта на характеристики с различни измерения може да се направи с помощта на коефициент на вариация. Той изразява разнообразието като процент от средната стойност, което позволява сравнение различни знаци. Коефициентът на вариация в медицинската литература се обозначава със знака „ СЪС "и по математика" v“ и се изчислява по формулата:

.

Стойностите на коефициента на вариация под 10% показват малко разсейване, от 10 до 20% - около средно, повече от 20% - за силно разсейване около средноаритметичната стойност.

Средната аритметична стойност обикновено се изчислява въз основа на данни извадкова популация. При повтарящи се изследвания, под влияние на случайни явления, средната аритметична стойност може да се промени. Това се дължи на факта, че по правило се изследва само част от възможните единици за наблюдение, тоест извадковата съвкупност. Информация за всички възможни единици, представящи изследваното явление, може да бъде получена чрез изучаване на цялата популация, което не винаги е възможно. В същото време, с цел обобщаване на експериментални данни, представлява интерес стойността на средната в генералната съвкупност. Следователно, за да се формулира общо заключение за изследваното явление, резултатите, получени на базата на извадковата съвкупност, трябва да се прехвърлят към генералната съвкупност с помощта на статистически методи.

За да се определи степента на съответствие между изследване на извадка и общата съвкупност, е необходимо да се оцени големината на грешката, която неизбежно възниква по време на наблюдението на извадката. Тази грешка се нарича " Грешка в представителността"или „Средна грешка на средноаритметичната стойност." Всъщност това е разликата между средните стойности, получени от извадката статистическо наблюдение, и подобни стойности, които биха се получили при непрекъснато изследване на същия обект, т.е. при изучаване на обща популация. Тъй като средната стойност на извадката е случайна променлива, такава прогноза се извършва с ниво на вероятност, приемливо за изследователя. IN медицински изследванияе най-малко 95%.

Грешката в представителността не може да бъде объркана с грешки при регистрация или грешки на вниманието (недостатъци, грешни изчисления, печатни грешки и т.н.), които трябва да бъдат сведени до минимум чрез подходящи методи и инструменти, използвани по време на експеримента.

Големината на грешката на представителност зависи както от размера на извадката, така и от променливостта на признака. как по-голям бройнаблюдения, колкото по-близо е извадката до популацията и толкова по-малка е грешката. Колкото по-променлив е знакът, толкова по-голяма е статистическата грешка.

На практика за определяне на грешката на представителност във вариационни серии се използва следната формула:

,

Където: м – грешка в представителността;

σ - стандартно отклонение;

н– брой наблюдения в извадката.

От формулата става ясно, че размерът средна грешкае право пропорционална на стандартното отклонение, т.е. променливостта на изследваната характеристика, и обратно пропорционална на квадратния корен от броя на наблюденията.

Когато се извършва статистически анализ въз основа на изчисляване на относителни стойности, не е необходимо да се конструира вариационна серия. В този случай определянето на средната грешка за относителните показатели може да се извърши по опростена формула:

,

Където: Р– стойността на относителния показател, изразена в проценти, ppm и др.;

р– реципрочната стойност на P и изразена като (1-P), (100-P), (1000-P) и т.н., в зависимост от базата, на която се изчислява показателят;

н– брой наблюдения в извадката.

Посочената формула за изчисляване на грешката на представителност за относителни стойности обаче може да се приложи само когато стойността на индикатора е по-малка от неговата база. В редица случаи на изчисляване на интензивни показатели това условие не е изпълнено и показателят може да бъде изразен като число над 100% или 1000%. В такава ситуация се изгражда вариационна серия и грешката на представителност се изчислява с помощта на формулата за средни стойности, базирани на стандартното отклонение.

Прогнозирането на стойността на средната аритметична в популацията се извършва чрез посочване на две стойности - минимална и максимална. Тези екстремни стойности възможни отклонения, в рамките на които желаната средна стойност на популацията може да варира, се наричат ​​„ Граници на доверието».

Постулатите на теорията на вероятностите са доказали, че при нормално разпределение на характеристика с вероятност от 99,7%, екстремните стойности на отклоненията от средната стойност няма да бъдат по-големи от стойността на утроената грешка на представителността ( М ± 3 м ); в 95,5% – не повече от два пъти средната грешка на средната стойност ( М ± 2 м ); в 68,3% – не повече от една средна грешка ( М ± 1 м ) (фиг. 9).

P%

Ориз. 9. Плътност на вероятността нормална дистрибуция.

Обърнете внимание, че горното твърдение е вярно само за функция, която се подчинява на нормалния закон за разпределение на Гаус.

Мнозинство експериментални изследвания, включително в областта на медицината, се свързва с измервания, чиито резултати могат да приемат почти всякакви стойности в даден интервал, следователно, като правило, те се описват чрез модел на непрекъснати случайни променливи. В това отношение повечето статистически методи разглеждат непрекъснати разпределения. Едно от тези разпределения, което има фундаментална роля в математическа статистика, е нормално или гаусово разпределение.

Това се дължи на редица причини.

1. На първо място, много експериментални наблюдения могат да бъдат успешно описани с помощта на нормалното разпределение. Веднага трябва да се отбележи, че няма разпределения на емпирични данни, които биха били точно нормални, тъй като нормално разпределени произволна стойносте в диапазона от до , което никога не се среща на практика. Нормалното разпределение обаче много често работи добре като приближение.

Независимо дали се извършват измервания на тегло, височина и други физиологични параметри на човешкото тяло - навсякъде резултатите се влияят от много голям брой случайни фактори ( естествени причинии грешки при измерване). Освен това, като правило, ефектът от всеки от тези фактори е незначителен. Опитът показва, че резултатите в такива случаи ще бъдат приблизително нормално разпределени.

2. Много разпределения, свързани със случайното вземане на проби, стават нормални, когато обемът на последното се увеличава.

3. Нормалното разпределение е много подходящо като приближение на други непрекъснати разпределения (например, изкривено).

4. Нормалното разпределение има редица благоприятни математически свойства, което до голяма степен го осигури широко приложениев статистиката.

В същото време трябва да се отбележи, че в медицинските данни има много експериментални разпределения, които не могат да бъдат описани с нормален модел на разпределение. За тази цел статистиката е разработила методи, които обикновено се наричат ​​„непараметрични“.

Изборът на статистически метод, който е подходящ за обработка на данни от конкретен експеримент, трябва да се направи в зависимост от това дали получените данни принадлежат към нормалния закон на разпределение. Тестването на хипотезата за подчинението на знака на нормалния закон за разпределение се извършва с помощта на хистограма (графика) на честотното разпределение, както и редица статистически критерии. Между тях:

Критерий за асиметрия ( b );

Критерий за тестване за ексцес ( ж );

Тест на Шапиро-Уилкс ( У ) .

За всеки параметър се извършва анализ на характера на разпределението на данните (наричан още тест за нормалност на разпределението). За да се прецени уверено дали разпределението на даден параметър отговаря на нормалния закон, е необходим достатъчно голям брой единици за наблюдение (поне 30 стойности).

За нормално разпределение критериите за изкривяване и ексцес приемат стойност 0. Ако разпределението е изместено надясно b > 0 (положителна асиметрия), с b < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона ж =0. При ж > 0 кривата на разпределение е по-остра, ако ж < 0 пик более сглаженный, чем функция нормального распределения.

За да проверите за нормалност с помощта на теста на Шапиро-Уилкс, трябва да намерите стойността на този критерий, като използвате статистически таблици на изисквано нивозначимост и в зависимост от броя на единиците за наблюдение (степени на свобода). Приложение 1. Хипотезата за нормалност се отхвърля при малки стойности на този критерий, като правило, при w <0,8.

Методът на групиране също ви позволява да измервате вариация(променливост, колебание) на знаците. Когато броят на единиците в популацията е относително малък, вариацията се измерва въз основа на класирания брой единици, които съставляват популацията. Сериалът се нарича класиран,ако единиците са подредени във възходящ (низходящ) ред на характеристиката.

Класираните серии обаче са доста показателни, когато е необходима сравнителна характеристика на вариацията. Освен това в много случаи трябва да имаме работа със статистически съвкупности, състоящи се от голям брой единици, които на практика е трудно да се представят под формата на определена серия. В тази връзка, за първоначално общо запознаване със статистически данни и особено за улесняване на изучаването на вариациите в характеристиките, изследваните явления и процеси обикновено се обединяват в групи, а резултатите от групирането се представят под формата на групови таблици.

Ако една групова таблица има само две колони - групи по избран признак (опции) и брой групи (честота или честота), тя се нарича близко разпространение.

Диапазон на разпространение -най-простият тип структурно групиране въз основа на една характеристика, показана в групова таблица с две колони, съдържащи варианти и честоти на характеристиката. В много случаи при такова структурно групиране, т.е. Със съставянето на редове за разпределение започва изучаването на изходния статистически материал.

Структурно групиране под формата на серия на разпределение може да се превърне в истинско структурно групиране, ако избраните групи се характеризират не само с честоти, но и с други статистически показатели. Основната цел на сериите за разпределение е да изследват вариациите на характеристиките. Теорията на редовете на разпределение е разработена подробно от математическата статистика.

Разпределителните серии са разделени на атрибутивни(групиране според атрибутивни характеристики, например разделяне на населението по пол, националност, семейно положение и т.н.) и вариационен(групиране по количествени признаци).

Вариационни сериие групова таблица, която съдържа две колони: групиране на единици по един количествен признак и брой единици във всяка група. Интервалите във вариационните серии обикновено се образуват равни и затворени. Вариационната серия е следното групиране на руското население по среден паричен доход на глава от населението (Таблица 3.10).

Таблица 3.10

Разпределение на населението на Русия по среден доход на глава от населението през 2004-2009 г.

Групи от населението по среден паричен доход на глава от населението, рубли / месец

Население в групата, % от общото

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Над 25 000,0

Цялото население

Вариационните серии от своя страна се делят на дискретни и интервални. Отделенвариационните серии комбинират варианти на дискретни характеристики, които варират в тесни граници. Пример за дискретна вариационна серия е разпределението на руските семейства по броя на децата, които имат.

Интервалвариационните серии комбинират варианти на непрекъснати характеристики или дискретни характеристики, вариращи в широк диапазон. Интервалът е вариационната серия на разпределението на руското население по среден паричен доход на глава от населението.

Дискретните вариационни серии не се използват много често на практика. Междувременно съставянето им не е трудно, тъй като съставът на групите се определя от специфичните варианти, които действително притежават изследваните групови характеристики.

Интервалните вариационни серии са по-разпространени. При съставянето им възниква труден въпрос за броя на групите, както и за размера на интервалите, които трябва да се установят.

Принципите за решаване на този проблем са изложени в главата относно методологията за конструиране на статистически групи (вижте параграф 3.3).

Вариационните серии са средство за свиване или компресиране на разнообразна информация в компактна форма; от тях може да се направи доста ясна преценка за естеството на вариацията и да се изучат разликите в характеристиките на явленията, включени в изследваната група. Но най-важното значение на вариационните редове е, че на тяхна основа се изчисляват специалните обобщаващи характеристики на вариацията (виж Глава 7).



Ново в сайта

>

Най - известен