У дома венците Първичният пазар е критерият на Фишер. Критерият на Фишер се използва за тестване на хипотезата, че дисперсиите на две популации са равни - документ

Първичният пазар е критерият на Фишер. Критерият на Фишер се използва за тестване на хипотезата, че дисперсиите на две популации са равни - документ

Критерий на Фишер

Критерият на Фишер се използва за проверка на хипотезата, че дисперсиите на две общи популации, разпределени по нормалния закон. Това е параметричен критерий.

F тестът на Fisher се нарича коефициент на дисперсия, тъй като се формира като съотношение на две безпристрастни оценки на дисперсиите, които се сравняват.

Нека в резултат на наблюденията се получат две проби. От тях вариациите и имайки И степени на свобода. Ще приемем, че първата проба е взета от популация с дисперсия , а вторият е от генералната съвкупност с дисперсия . Излага се нулева хипотеза за равенството на двете дисперсии, т.е. H0:
или . За да се отхвърли тази хипотеза, е необходимо да се докаже значимостта на разликата при дадено ниво на значимост
.

Стойността на критерия се изчислява по формулата:

Очевидно, ако дисперсиите са равни, стойността на критерия ще бъде равна на единица. В други случаи ще бъде по-голямо (по-малко) от едно.

Тестът има разпределение на Фишер
. Тест на Фишер - двустранен тест и нулева хипотеза
отхвърлен в полза на алтернатива
ако . Ето къде
– обемът съответно на първата и втората проба.

Системата STATISTICA реализира едностранен тест на Фишер, т.е. максималната дисперсия винаги се приема като качество. В този случай нулевата хипотеза се отхвърля в полза на алтернативата ако.

Пример

Нека поставим задачата да сравним ефективността на обучението на две групи ученици. Нивото на постижения характеризира нивото на управление на процеса на обучение, а дисперсията е качеството на управление на обучението, степента на организация на процеса на обучение. И двата индикатора са независими и общ случайтрябва да се разглеждат заедно. Нивото на академичните постижения (математическо очакване) на всяка група ученици се характеризира със средни аритметични стойности и , а качеството се характеризира със съответните извадкови дисперсии на оценките: и . При оценката на нивото на текущото представяне се оказа, че то е еднакво и за двамата ученици: = = 4,0. Примерни отклонения:
И
. Числа на степените на свобода, съответстващи на тези оценки:
И
. Оттук, за да установим разликите в ефективността на ученето, можем да използваме стабилността на академичното представяне, т.е. Нека проверим хипотезата.

Нека изчислим
(трябва да има голямо отклонение в числителя), . Според таблиците ( STATISTICAВероятностРазпределениеКалкулатор) намираме , което е по-малко от изчисленото, следователно нулевата хипотеза трябва да бъде отхвърлена в полза на алтернативата. Това заключение може да не задоволи изследователя, тъй като той се интересува от истинската стойност на съотношението
(винаги имаме голямо отклонение в числителя). При проверка на едностранен критерий получаваме, че е по-малко от изчислената по-горе стойност. Така че нулевата хипотеза трябва да бъде отхвърлена в полза на алтернативата.

Тест на Fisher в програма STATISTICA в Windows среда

За пример за тестване на хипотеза (критерий на Фишер), ние използваме (създаваме) файл с две променливи (fisher.sta):

Ориз. 1. Таблица с две независими променливи

За да се провери хипотезата е необходимо в основни статистики ( ОсновенСтатистикаиМаси) изберете t-тест за независими променливи. ( t-тест, независим, по променливи).

Ориз. 2. Тестване на параметрични хипотези

След като изберете променливи и натиснете клавиша РезюмеИзчисляват се стойностите на стандартните отклонения и критерия на Фишер. Освен това се определя нивото на значимост стр, при което разликата е незначителна.

Ориз. 3. Резултати от тестване на хипотези (F-тест)

Използвайки ВероятностКалкулатори като зададете стойностите на параметрите, можете да изградите графика на разпределението на Фишер с маркирана изчислена стойност.

Ориз. 4. Област на приемане (отхвърляне) на хипотезата (F-критерий)

Източници.

    Тестване на хипотези за връзката между две дисперсии

URL: /tryfonov3/terms3/testdi.htm

    Лекция 6. :8080/resources/math/mop/lections/lection_6.htm

    F – Критерий на Фишер

URL: /home/portal/applications/Multivariatadvisor/F-Fisher/F-Fisheer.htm

    Теория и практика на вероятностните статистически изследвания.

URL: /active/referats/read/doc-3663-1.html

    F – Критерий на Фишер

Критерий на Фишерви позволява да сравните дисперсиите на извадката на две независими извадки. За да изчислите F emp, трябва да намерите съотношението на дисперсиите на две проби, така че по-голямата дисперсия да е в числителя, а по-малката - в знаменателя. Формулата за изчисляване на критерия на Фишер е:

където са дисперсиите съответно на първата и втората извадка.

Тъй като според условието на критерия стойността на числителя трябва да бъде по-голяма или равна на стойността на знаменателя, стойността на F emp винаги ще бъде по-голяма или равна на единица.

Броят на степените на свобода също се определя просто:

к 1 =n л - 1 за първата проба (т.е. за пробата, чиято дисперсия е по-голяма) и к 2 = н 2 - 1 за втората проба.

В Приложение 1 критичните стойности на критерия на Фишер се намират чрез стойностите на k 1 (горния ред на таблицата) и k 2 (лявата колона на таблицата).

Ако t em >t crit, тогава нулевата хипотеза се приема, в противен случай се приема алтернативата.

Пример 3.Тестването е проведено в два трети класа умствено развитиедесет ученици на теста TURMSH. Получените средни стойности не се различават значително, но психологът се интересува от въпроса дали има разлики в степента на хомогенност на показателите за умствено развитие между класовете.

Решение. За теста на Фишер е необходимо да се сравнят дисперсиите на резултатите от тестовете в двата класа. Резултатите от теста са представени в таблицата:

Таблица 3.

Студентски номера

Първи клас

Втори клас

След като изчислим дисперсиите за променливите X и Y, получаваме:

с х 2 =572.83; с г 2 =174,04

След това, използвайки формула (8) за изчисление, използвайки F критерия на Фишер, намираме:

Според таблицата от Приложение 1 за критерия F със степени на свобода и в двата случая k = 10 - 1 = 9 намираме F crit = 3,18 (<3.29), следовательно, в терминах статистических гипотез можно утвер­ждать, что Н 0 (гипотеза о сходстве) может быть отвергнута на уровне 5%, а принимается в этом случае гипотеза Н 1 . Иcследователь может утверждать, что по степени однородности такого показа­теля, как умственное развитие, имеется различие между выбор­ками из двух классов.

6.2 Непараметрични тестове

Сравнявайки на око (в проценти) резултатите преди и след всяко въздействие, изследователят стига до извода, че ако се наблюдават разлики, значи има разлика в сравняваните проби. Този подход е категорично неприемлив, тъй като за проценти е невъзможно да се определи нивото на надеждност в разликите. Процентите, взети сами по себе си, не позволяват да се направят статистически надеждни заключения. За да се докаже ефективността на всяка интервенция, е необходимо да се идентифицира статистически значима тенденция в отклонението (изместването) на индикаторите. За да разреши такива проблеми, изследователят може да използва редица критерии за дискриминация. По-долу ще разгледаме непараметрични тестове: знаков тест и хи-квадрат тест.

)

Изчисляване на критерия φ*

1. Определете онези стойности на атрибута, които ще бъдат критерий за разделяне на субектите на тези, които „имат ефект“ и тези, които „нямат ефект“. Ако характеристиката се измерва количествено, използвайте критерия λ, за да намерите оптималната точка на разделяне.

2. Начертайте таблица с четири клетки (синоним: четири полета) с две колони и два реда. Първата колона е „има ефект“; втора колона - „без ефект“; първи ред отгоре - 1 група (проба); втори ред - група 2 (проба).

4. Пребройте броя на субектите в първата проба, които нямат ефект, и въведете това число в горната дясна клетка на таблицата. Изчислете сумата от горните две клетки. Той трябва да съвпада с броя на предметите от първа група.

6. Пребройте броя на субектите във втората проба, които нямат ефект, и въведете това число в долната дясна клетка на таблицата. Изчислете сумата от двете долни клетки. Той трябва да съвпада с броя на субектите във втората група (проба).

7. Определете процента на субектите, които „имат ефект“, като съотнесете техния брой към общия брой субекти в дадена група (извадка). Запишете получените проценти съответно в горната лява и долната лява клетка на таблицата в скоби, за да не ги объркате с абсолютни стойности.

8. Проверете дали един от сравняваните проценти е равен на нула. Ако случаят е такъв, опитайте да промените това, като преместите точката за разделяне на групата в една или друга посока. Ако това е невъзможно или нежелателно, изоставете критерия φ* и използвайте критерия χ2.

9. Определете по табл. XII Приложение 1 ъгли φ за всеки от сравняваните проценти.

където: φ1 - ъгъл, съответстващ на по-големия процент;

φ2 - ъгъл, съответстващ на по-малкия процент;

N1 - брой наблюдения в проба 1;

N2 - брой наблюдения в проба 2.

11. Сравнете получената стойност φ* с критичните стойности: φ* ≤1,64 (p<0,05) и φ* ≤2,31 (р<0,01).

Ако φ*emp ≤φ*cr. H0 се отхвърля.

Ако е необходимо, определете точното ниво на значимост на полученото φ*emp съгласно табл. XIII Приложение 1.

Този метод е описан в много ръководства (Plokhinsky N.A., 1970; Gubler E.V., 1978; Ivanter E.V., Korosov A.V., 1992 и др.) Това описание се основава на версията на метода, която е разработена и представена от E.V. Гублер.

Предназначение на критерия φ*

Критерият на Фишер е предназначен да сравни две проби според честотата на поява на ефекта (индикатора), който представлява интерес за изследователя. Колкото по-голям е, толкова по-надеждни са разликите.

Описание на критерия

Критерият оценява надеждността на разликите между онези проценти от две проби, в които е записан ефектът (показателят), който ни интересува. Образно казано, сравняваме 2-те най-добри парчета, изрязани от 2 пая, и решаваме кое е наистина по-голямо.

Същността на ъгловата трансформация на Фишър е да преобразува процентите в стойности на централен ъгъл, които се измерват в радиани. По-голям процент ще съответства на по-голям ъгъл φ, а по-малък процент ще съответства на по-малък ъгъл, но връзките тук не са линейни:

където P е процентът, изразен в части от единица (виж Фиг. 5.1).

С увеличаване на несъответствието между ъглите φ 1 и φ 2 и увеличаване на броя на пробите, стойността на критерия се увеличава. Колкото по-голяма е стойността на φ*, толкова по-вероятно е разликите да са значителни.

Хипотези

з 0 : Съотношение на лицата, в които се проявява изследваният ефект, в проба 1 няма повече, отколкото в проба 2.

з 1 : Делът на индивидите, които проявяват изследвания ефект, е по-голям в проба 1, отколкото в проба 2.

Графично представяне на критерия φ*

Методът на ъглова трансформация е малко по-абстрактен от другите критерии.

Формулата, следвана от E.V. Gubler при изчисляване на стойностите на φ, предполага, че 100% съставлява ъгъл φ=3.142, тоест закръглена стойност π=3.14159... Това ни позволява да представим сравнените проби под формата на два полукръга, всеки от които символизира 100% от съвкупността от своята извадка. Процентите на субектите с „ефект“ ще бъдат представени като сектори, образувани от централните ъгли φ. На фиг. Фигура 5.2 показва два полукръга, илюстриращи Пример 1. В първата извадка 60% от участниците са решили проблема. Този процент съответства на ъгъла φ=1,772. Във втората извадка 40% от субектите са решили проблема. Този процент съответства на ъгъл φ =1,369.

Критерият φ* ви позволява да определите дали един от ъглите наистина е статистически значимо по-добър от другия за дадени размери на извадката.

Ограничения на критерия φ*

1. Нито една от сравняваните пропорции не трябва да е нула. Формално няма пречки за прилагането на метода φ в случаите, когато делът на наблюденията в една от извадките е равен на 0. Въпреки това, в тези случаи резултатът може да се окаже неоправдано завишен (Gubler E.V., 1978, p. 86).

2. Горна няма ограничение в критерия φ - пробите могат да бъдат толкова големи, колкото желаете.

Нисък граница - 2 наблюдения в една от пробите. Трябва обаче да се спазват следните съотношения в броя на две проби:

а) ако една проба има само 2 наблюдения, тогава втората трябва да има поне 30:

б) ако една от пробите има само 3 наблюдения, тогава втората трябва да има поне 7:

в) ако една от пробите има само 4 наблюдения, тогава втората трябва да има поне 5:

г) прин 1 , н 2 ≥ 5 Възможни са всякакви сравнения.

По принцип също е възможно да се сравняват проби, които не отговарят на това условие, например с релациятан 1 =2, н 2 = 15, но в тези случаи няма да е възможно да се установят съществени разлики.

Критерият φ* няма други ограничения.

Нека да разгледаме няколко примера, за да илюстрираме възможноститекритерий φ*.

Пример 1: сравнение на проби по качествено определена характеристика.

Пример 2: сравнение на проби по количествено измерена характеристика.

Пример 3: сравнение на проби както по ниво, така и по разпределение на характеристика.

Пример 4: Използване на критерия φ* в комбинация с критериях Колмогоров-Смирнов, за да се постигне най-точен резултат.

Пример 1 - сравнение на проби по качествено определен признак

При това използване на критерия, ние сравняваме процента на субекти в една проба, характеризираща се с някакво качество, с процента на субекти в друга проба, характеризираща се със същото качество.

Да кажем, че се интересуваме дали две групи ученици се различават по успеха си при решаването на нов експериментален проблем. В първата група от 20 души с нея са се справили 12 души, а във втората извадка от 25 души - 10. В първия случай процентът на решилите задачата ще бъде 12/20·100%=60%, а във втория 10/25·100%= 40%. Различават ли се значително тези проценти предвид данните?н 1 Ин 2 ?

Изглежда, че дори „на око“ може да се определи, че 60% е значително по-високо от 40%. Въпреки това, в действителност, тези разлики, предвид даннитен 1 , н 2 ненадежден.

Нека да го проверим. Тъй като се интересуваме от факта на решаването на даден проблем, ще считаме успеха при решаването на експериментален проблем като „ефект“, а неуспеха при решаването му като липса на ефект.

Да формулираме хипотези.

з 0 : Съотношение на лицатаВ първата група няма повече хора, които са изпълнили задачата, отколкото във втората група.

з 1 : Делът на хората, изпълнили задачата в първата група, е по-голям, отколкото във втората група.

Сега нека изградим така наречената таблица с четири клетки или четири полета, която всъщност е таблица с емпирични честоти за две стойности на атрибута: „има ефект“ - „няма ефект“.

Таблица 5.1

Таблица с четири клетки за изчисляване на критерия при сравняване на две групи субекти според процента на решилите задачата.

Групи

„Има ефект“: проблемът е решен

„Няма ефект“: проблемът не е решен

суми

Количество

предмети

% дял

Количество

предмети

% дял

1 група

(60%)

(40%)

2-ра група

(40%)

(60%)

суми

В таблица с четири клетки, като правило, колоните „Има ефект“ и „Няма ефект“ са маркирани в горната част, а редовете „Група 1“ и „Група 2“ са отляво. Всъщност в сравненията участват само полета (клетки) A и B, тоест проценти в колоната „Има ефект“.

Според табл.XIIПриложение 1 определя стойностите на φ, съответстващи на процентните дялове във всяка от групите.

Сега нека изчислим емпиричната стойност на φ*, използвайки формулата:

където φ 1 - ъгъл, съответстващ на по-големия % дял;

φ 2 - ъгъл, съответстващ на по-малкия % дял;

н 1 - брой наблюдения в проба 1;

н 2 - брой наблюдения в проба 2.

В такъв случай:

Според табл.XIIIВ Приложение 1 определяме какво ниво на значимост съответства на φ* ем=1,34:

р=0,09

Също така е възможно да се установят критични стойности на φ *, съответстващи на нивата, приети в психологията статистическа значимост:

Нека изградим "ос на значимост".

Получената емпирична стойност φ* е в зоната на незначимост.

Отговор: з 0 приет. Процентът на хората, изпълнили задачатаVв първата група не повече, отколкото във втората група.

Човек може само да симпатизира на изследовател, който смята разликите от 20% и дори 10% за значими, без да провери надеждността им с помощта на критерия φ*. В този случай, например, само разлики от най-малко 24,3% биха били значими.

Изглежда, че когато сравняваме две проби на каквато и да е качествена основа, критерият φ може да ни направи по-скоро тъжни, отколкото щастливи. Това, което изглежда значително, може да не е така от статистическа гледна точка.

Критерият на Фишер има много повече възможности да угоди на изследователя, когато сравняваме две проби според количествено измерените характеристики и може да променя „ефекта“.

Пример 2 - сравнение на две проби по количествено измерена характеристика

При това използване на критерия, ние сравняваме процента субекти в една извадка, които постигат определено ниво на стойност на атрибута, с процента субекти, които постигат това ниво в друга извадка.

В проучване на G. A. Tlegenova (1990) от 70 млади ученици от професионални училища на възраст от 14 до 16 години, 10 субекта с висок резултат по скалата на агресивността и 11 субекта с нисък резултат по скалата на агресивността бяха избрани въз основа на резултатите. на проучване, използващо Фрайбургския въпросник за личността. Необходимо е да се установи дали групите от агресивни и неагресивни младежи се различават по дистанцията, която спонтанно избират в разговор със съученик. Данните на Г. А. Тлегенова са представени в табл. 5.2. Можете да забележите, че агресивните млади мъже по-често избират разстояние от 50cm или дори по-малко, докато неагресивните момчета по-често избират разстояние, по-голямо от 50 cm.

Сега можем да считаме разстояние от 50 см за критично и да приемем, че ако разстоянието, избрано от субекта, е по-малко или равно на 50 см, тогава „има ефект“, а ако избраното разстояние е по-голямо от 50 см, тогава "няма ефект." Виждаме, че в групата на агресивните младежи ефектът се наблюдава в 7 от 10, т.е. в 70% от случаите, а в групата на неагресивните младежи - в 2 от 11, т.е. в 18,2% от случаите. . Тези проценти могат да бъдат сравнени с помощта на метода φ*, за да се установи значимостта на разликите между тях.

Таблица 5.2

Показатели за разстоянието (в см), избрано от агресивни и неагресивни млади мъже в разговор със съученик (според G.A. Tlegenova, 1990)

Група 1: момчета с висок резултат по скалата за агресивностFPI- Р (н 1 =10)

Група 2: момчета с ниски стойности по скалата на агресивносттаFPI- Р (н 2 =11)

d(c м )

% дял

d(c М )

% дял

"Яжте

ефект"

д≤50 см

18,2%

"Не

ефект"

d>50см

80 QO

81,8%

суми

100%

100%

Средно аритметично

5b:o

77.3

Да формулираме хипотези.

з 0 д 50 см, в групата на агресивните момчета няма повече, отколкото в групата на неагресивните момчета.

з 1 : Пропорция на хората, които избират разстояниед50 см, повече в групата на агресивните младежи, отколкото в групата на неагресивните младежи. Сега нека изградим така наречената таблица с четири клетки.

Таблица 53

Таблица с четири клетки за изчисляване на критерия φ* при сравняване на групи от агресивни (nf=10) и неагресивни млади мъже (n2=11)

Групи

"Има ефект": д≤50

"Без ефект." д>50

суми

Брой предмети

(% дял)

Брой предмети

(% дял)

1 група - агресивни младежи

(70%)

(30%)

2 група - неагресивни младежи

(180%)

(81,8%)

Сума

Според табл.XIIПриложение 1 определя стойностите на φ, съответстващи на процентните дялове на „ефекта“ във всяка от групите.

Получената емпирична стойност φ* е в зоната на значимост.

Отговор: з 0 отхвърлени. Приетоз 1 . Делът на хората, които избират дистанция в разговор по-малка или равна на 50 см, е по-голям в групата на агресивните младежи, отколкото в групата на неагресивните младежи

Въз основа на получените резултати можем да заключим, че по-агресивните млади мъже по-често избират разстояние под половин метър, докато неагресивните младежи по-често избират разстояние, по-голямо от половин метър. Виждаме, че агресивните млади мъже всъщност общуват на границата между интимната (0-46 см) и личната зона (от 46 см). Помним обаче, че интимното разстояние между партньорите е прерогатив не само на близки, добри отношения, ноИръкопашен бой (Холд. T., 1959).

Пример 3 - сравнение на проби както по ниво, така и по разпределение на характеристиката.

В този случай на употреба можем първо да тестваме дали групите се различават по нива на дадена черта и след това да сравним разпределенията на чертата в двете проби. Такава задача може да бъде уместна, когато се анализират разликите в обхватите или формата на разпределението на оценките, получени от субекти, използващи всяка нова техника.

В изследване на Р. Т. Чиркина (1995) за първи път е използван въпросник, насочен към идентифициране на тенденцията да се изтласкват от паметта факти, имена, намерения и методи на действие поради лични, семейни и професионални комплекси. Въпросникът е създаден с участието на Е. В. Сидоренко въз основа на материали от книгата 3. Фройд „Психопатология на ежедневието“. Извадка от 50 студенти от Педагогическия институт, неженени, без деца, на възраст от 17 до 20 години, беше изследвана с помощта на този въпросник, както и с техниката Menester-Corzini за идентифициране на интензивността на чувството за лична недостатъчност,или"комплекс за малоценност" (МанастирЖ. Дж., КорсиниР. Дж., 1982).

Резултатите от проучването са представени в табл. 5.4.

Може ли да се каже, че има значими връзки между показателя енергия на потискане, диагностициран с помощта на въпросник, и показателите за интензивността на чувството за собствена недостатъчност?

Таблица 5.4

Индикатори за интензивността на чувството за лична недостатъчност в групи от студенти с висока (nj=18) и ниска (n2=24) енергия на изместване

Група 1: енергия на изместване от 19 до 31 точки (н 1 =181

Група 2: енергия на изместване от 7 до 13 точки (н 2 =24)

0; 0; 0; 0; 0

20; 20

30; 30; 30; 30; 30; 30; 30

50; 50

60; 60

0; 0

5; 5; 5; 5

10; 10; 10; 10; 10; 10

15; 15

20; 20; 20; 20

30; 30; 30; 30; 30; 30

суми

Средно аритметично

26,11

15,42

Въпреки факта, че средната стойност в групата с по-енергична репресия е по-висока, в нея се наблюдават и 5 нулеви стойности. Ако сравним хистограмите на разпределението на оценките в двете извадки, се разкрива ярък контраст между тях (фиг. 5.3).

За да сравним две разпределения, можем да приложим тестаχ 2 или критерийλ , но за това ще трябва да увеличим ранговете и в допълнение, в двете извадкин <30.

Критерият φ* ще ни позволи да проверим ефекта от несъответствието между две разпределения, наблюдавани в графиката, ако се съгласим да приемем, че „има ефект“, ако индикаторът за чувство на недостатъчност е много нисък (0) или обратно , много високи стойности (С30), и че „няма ефект“, ако индикаторът за чувство на недостатъчност приема средни стойности от 5 до 25.

Да формулираме хипотези.

з 0 : Екстремните стойности на индекса на дефицит (0 или 30 или повече) в групата с по-енергична репресия не са по-чести, отколкото в групата с по-малко енергична репресия.

з 1 : Екстремните стойности на индекса на дефицит (0 или 30 или повече) в групата с по-енергична репресия са по-чести, отколкото в групата с по-малко енергична репресия.

Нека създадем таблица с четири клетки, удобна за по-нататъшно изчисляване на критерия φ*.

Таблица 5.5

Таблица с четири клетки за изчисляване на критерия φ* при сравняване на групи с по-високи и по-ниски енергии на репресия въз основа на съотношението на показателите за недостатъчност

Групи

„Има ефект“: индикаторът за дефицит е 0 или >30

„Без ефект“: индекс на повреда от 5 до 25

суми

(88,9%)

(11,1%)

(33,3%)

(66,7%)

суми

Според табл.XIIВ Приложение 1 определяме стойностите на φ, съответстващи на сравнените проценти:

Нека изчислим емпиричната стойност на φ*:

Критични стойности на φ * за всякаквин 1 , н 2 , както помним от предишния пример, са:

ТаблицаXIIIПриложение 1 ни позволява по-точно да определим нивото на значимост на получения резултат: стр<0,001.

Отговор: з 0 отхвърлени. Приетоз 1 . Екстремни стойности на индекса на дефицит (0 или 30 или повече) в групата с по-голяма енергия на репресия се срещат по-често, отколкото в групата с по-малко енергия на репресия.

И така, субекти с по-голяма репресивна енергия могат да имат както много високи (30 или повече), така и много ниски (нула) показатели за чувството за собствена недостатъчност. Може да се предположи, че те потискат както своята неудовлетвореност, така и нуждата от успех в живота. Тези предположения се нуждаят от допълнителни тестове.

Полученият резултат, независимо от неговата интерпретация, потвърждава възможностите на критерия φ* при оценка на разликите във формата на разпределение на признак в две извадки.

В първоначалната извадка имаше 50 души, но 8 от тях бяха изключени от разглеждането като имащи среден резултат по индекса на репресивна енергия (14-15). Техните показатели за интензивността на чувството за недостатъчност също са средни: 6 стойности по 20 точки всяка и 2 стойности по 25 точки всяка.

Мощните възможности на критерия φ* могат да бъдат проверени чрез потвърждаване на напълно различна хипотеза при анализиране на материалите от този пример. Можем да докажем например, че в група с по-голяма репресивна енергия степента на недостатъчност е все още по-висока, въпреки парадоксалния характер на нейното разпределение в тази група.

Да формулираме нови хипотези.

з 0 Най-високите стойности на индекса на дефицит (30 или повече) в групата с по-голяма репресивна енергия не са по-чести, отколкото в групата с по-малко репресивна енергия.

з 1 : Най-високите стойности на индекса на дефицит (30 или повече) в групата с по-голяма репресивна енергия се срещат по-често, отколкото в групата с по-малко репресивна енергия. Нека изградим таблица с четири полета, използвайки данните в Таблица. 5.4.

Таблица 5.6

Таблица с четири клетки за изчисляване на критерия φ* при сравняване на групи с по-голяма и по-малка енергия на репресия според нивото на индикатора за недостатъчност

Групи

Индикаторът за повреда „Има ефект“* е по-голям или равен на 30

„Няма ефект“: степента на неуспех е по-малка 30

суми

Група 1 - с по-голяма енергия на преместване

(61,1%)

(38.9%)

Група 2 - с по-ниска енергия на изместване

(25.0%)

(75.0%)

суми

Според табл.XIIIВ Приложение 1 определяме, че този резултат съответства на нивото на значимост p = 0,008.

Отговор: Но се отхвърля. ПриетоHj: Най-високите показатели за недостатъчност (30 или повече точки) в групатасс по-голяма енергия на изместване се срещат по-често, отколкото в групата с по-малка енергия на изместване (p = 0,008).

И така, успяхме да докажем товаVгрупаспри по-енергична репресия преобладават екстремни стойности на показателя за недостатъчност и фактът, че този показател надвишава стойностите сидостигаточно в тази група.

Сега можем да се опитаме да докажем, че в групата с по-висока репресивна енергия по-често се срещат по-ниски стойности на индекса на недостатъчност, въпреки факта, че средната стойностV тази група има повече (26,11 срещу 15,42 в групатас по-малко изместване).

Да формулираме хипотези.

з 0 : Най-ниски проценти на дефицит (нула) в групатас репресиите с по-голяма енергия не са по-чести, отколкото в групатас по-малко енергия на изместване.

з 1 : Има най-ниски нива на дефицит (нула).V група с по-голяма репресивна енергия по-често, отколкото в групатас по-малко енергична репресия. Нека групираме данните в нова таблица с четири клетки.

Таблица 5.7

Таблица с четири клетки за сравняване на групи с различни енергии на потискане въз основа на честотата на нулевите стойности на индикатора за дефицит

Групи

„Има ефект“: индикаторът за повреда е 0

„Без ефект“ на недостатъчност

индикаторът не е равен на 0

суми

Група 1 - с по-голяма енергия на преместване

(27,8%)

(72,2%)

1 група - с по-малка енергия на изместване

(8,3%)

(91,7%)

суми

Определяме стойностите на φ и изчисляваме стойността на φ*:

Отговор: з 0 отхвърлени. Най-ниските индекси на недостатъчност (нула) в групата с по-голяма репресивна енергия са по-чести, отколкото в групата с по-малко репресивна енергия (p<0,05).

Като цяло получените резултати могат да се считат за доказателство за частично съвпадение на понятията за комплекс при З. Фройд и А. Адлер.

Показателно е, че между показателя енергия на потискане и показателя интензитет на чувството за собствена недостатъчност в извадката като цяло се получава положителна линейна корелация (p = +0.491, p<0,01). Как мы можем убедиться, применение критерия φ* позволяет проникнуть в более тонкие и содержательно значимые соотношения между этими двумя показателями.

Пример 4 - използване на критерия φ* в комбинация с критерия λ Колмогоров-Смирнов, за да постигнем максимума точенрезултат

Ако пробите се сравняват според каквито и да било количествено измерени показатели, възниква проблемът с идентифицирането на точката на разпределение, която може да се използва като критична точка при разделянето на всички субекти на тези, които „имат ефект“ и тези, които „нямат ефект“.

По принцип точката, в която бихме разделили групата на подгрупи, където има ефект и където няма ефект, може да бъде избрана съвсем произволно. Можем да се интересуваме от всеки ефект и следователно можем да разделим и двете проби на две части по всяко време, стига да има някакъв смисъл.

За да се увеличи максимално мощността на φ* теста обаче, е необходимо да се избере точката, в която разликите между двете сравнявани групи са най-големи. Най-точно можем да направим това с помощта на алгоритъм за изчисляване на критерияλ , което ви позволява да откриете точката на максимално несъответствие между две проби.

Възможност за комбиниране на критерии φ* иλ описан от E.V. Gubler (1978, стр. 85-88). Нека се опитаме да използваме този метод при решаването на следния проблем.

В съвместно проучване на M.A. Курочкина, Е.В. Сидоренко и Ю.А. Churakov (1992) в Обединеното кралство провежда проучване на английски общопрактикуващи лекари от две категории: а) лекари, които подкрепят медицинската реформа и вече са превърнали приемните си кабинети в организации за държане на средства със собствен бюджет; б) лекари, чиито кабинети все още не разполагат със собствени средства и са изцяло осигурени от държавния бюджет. Бяха изпратени въпросници на извадка от 200 лекари, представителни за общата съвкупност от английски лекари по отношение на представителството на хора от различен пол, възраст, стаж и месторабота - в големите градове или в провинцията.

На въпросника са отговорили 78 лекари, от които 50 са работили в чакални със средства и 28 от чакални без средства. Всеки от лекарите трябваше да прогнозира какъв ще бъде делът на приетите със средства през следващата 1993 година. Само 70 лекари от 78 изпратили отговори отговориха на този въпрос. Разпределението на техните прогнози е представено в табл. 5.8 поотделно за групата лекари със средства и групата лекари без средства.

Различават ли се по нещо прогнозите на лекарите със средства и тези без средства?

Таблица 5.8

Разпределение на прогнозите на общопрактикуващите лекари за това какъв ще бъде делът на спешните кабинети със средства през 1993 г.

Прогнозиран дял

приемни със средства

лекари с фонда (н 1 =45)

лекари без фонд (н 2 =25)

суми

1. от 0 до 20%

4

5

9

2. от 21 до 40%

15

И

26

3. от 41 до 60%

18

5

23

4. от 61 до 80%

7

4

И

5. от 81 до 100%

1

0

1

суми

45

25

70

Нека определим точката на максимално несъответствие между двете разпределения на отговора, като използваме алгоритъм 15 от точка 4.3 (виж таблица 5.9).

Таблица 5.9

Изчисляване на максималната разлика в натрупаните честоти в разпределенията на прогнозите на лекарите от две групи

Прогнозиран дял на приема със средства (%)

Емпирични честоти на избор за дадена категория отговор

Емпирични честоти

Кумулативни емпирични честоти

Разлика (д)

лекари с фонда(н 1 =45)

лекари без фонд (н 2 =25)

е* ъъъ 1

е* a2

е* e1

е* a1

1. от 0 до 20%

2. от 21 до 40%

3. от 41 до 60%

4. от 61 до 80%

5. от 81 до 100%

4

15

18

7

1

5

11

5

4

0

0,089 0,333 0,400 0,156 0,022

0,200 0,440 0,200 0,160 0

0,089 0,422 0,822 0,978 1,000

0,200

0,640

0,840

1,000

1,000

0111

0,218 0,018 0,022

0

Максималната разлика, открита между две натрупани емпирични честоти, е0,218.

Тази разлика се оказва натрупана във втората категория на прогнозата. Нека се опитаме да използваме горната граница на тази категория като критерий за разделяне на двете проби на подгрупа, където „има ефект“ и подгрупа, където „няма ефект“. Ще приемем, че има „ефект“, ако даден лекар прогнозира от 41 до 100% от приема със средства в1993 година и че няма „никакъв ефект“, ако даден лекар прогнозира от 0 до 40% от приема със средства в1993 година. Комбинираме прогнозни категории 1 и 2 от една страна и прогнозни категории 3, 4 и 5 от друга. Полученото разпределение на прогнозите е представено в табл. 5.10.

Таблица 5.10

Разпределение на прогнози за лекари с пари и лекари без пари

Прогнозиран дял от приема със средства (%1

Емпирични честоти за избор на дадена прогнозна категория

суми

лекари с фонда(н 1 =45)

лекари без фонд(н 2 =25)

1. от 0 до 40%

19

16

35

2. от 41 до 100%

26

9

35

суми

45

25

70

Можем да използваме получената таблица (Таблица 5.10), за да тестваме различни хипотези, като сравняваме произволни две нейни клетки. Спомняме си, че това е така наречената таблица с четири клетки или четири полета.

Тук се интересуваме дали лекарите, които вече имат средства, прогнозират по-голям бъдещ растеж на това движение от лекарите, които нямат средства. Затова условно считаме, че „има ефект”, когато прогнозата попада в категорията от 41 до 100%. За да опростим изчисленията, сега трябва да завъртим масата на 90°, като я завъртим по посока на часовниковата стрелка. Можете дори да направите това буквално, като завъртите книгата заедно с масата. Сега можем да преминем към работния лист за изчисляване на критерия φ* - Ъглова трансформация на Фишер.

Таблица 5.11

Таблица с четири клетки за изчисляване на φ* теста на Fisher за идентифициране на разликите в прогнозите на две групи общопрактикуващи лекари

Група

Има ефект - прогноза от 41 до 100%

Без ефект - прогноза от 0 до 40%

Обща сума

азгрупа - лекари, взели фонд

26 (57.8%)

19 (42.2%)

45

IIгрупа - лекари, които не са взели касата

9 (36.0%)

16 (64.0%)

25

Обща сума

35

35

70

Да формулираме хипотези.

з 0 : Съотношение на лицатапредвиждайки разпределението на средствата към 41%-100% от всички лекарски кабинети, в групата на лекарите със средства няма повече, отколкото в групата на лекарите без средства.

з 1 : Делът на хората, които прогнозират разпределението на средствата до 41%-100% от всички приема, е по-голям в групата на лекарите със средства, отколкото в групата на лекарите без средства.

Определяне на стойностите на φ 1 и φ 2 според таблXIIПриложение 1. Припомнете си, че φ 1 винаги е ъгълът, съответстващ на по-големия процент.

Сега нека определим емпиричната стойност на критерия φ*:

Според табл.XIIIВ Приложение 1 определяме на какво ниво на значимост отговаря тази стойност: p = 0,039.

Използвайки същата таблица в Приложение 1, можете да определите критичните стойности на критерия φ*:

Отговор: Но се отхвърля (р=0,039). Делът на хората, които прогнозират разпределението на средства към41-100 % на всички приеми в групата на лекарите, които са поели касата, надвишава този дял в групата на лекарите, които не са поели касата.

С други думи, лекарите, които вече работят в чакалните си на отделен бюджет, прогнозират тази година по-широко разпространение на тази практика от лекарите, които все още не са се съгласили да преминат на самостоятелен бюджет. Има много интерпретации на този резултат. Например, може да се предположи, че лекарите от всяка група подсъзнателно смятат поведението си за по-типично. Това също може да означава, че лекарите, които вече са приели самофинансиране, са склонни да преувеличават обхвата на това движение, тъй като трябва да обосноват решението си. Установените различия може да означават и нещо, което е напълно извън обхвата на въпросите, поставени в изследването. Например, че дейността на лекарите, работещи на самостоятелен бюджет, допринася за изострянето на различията в позициите на двете групи. Те бяха по-активни, когато се съгласиха да вземат средствата, бяха по-активни, когато си направиха труда да отговорят на въпросника по пощата; те са по-активни, когато прогнозират, че други лекари ще бъдат по-активни в получаването на средства.

По един или друг начин можем да сме сигурни, че установеното ниво на статистически разлики е максимално възможното за тези реални данни. Установихме с помощта на критерияλ точката на максимално разминаване между двете разпределения и именно в тази точка пробите бяха разделени на две части.

Вашата марка.

Функцията FISCHER връща трансформацията на Fisher на аргументите на X. Тази трансформация създава функция, която има нормално, а не изкривено разпределение. Функцията FISCHER се използва за тестване на хипотезата с помощта на коефициента на корелация.

Описание на функцията FISCHER в Excel

Когато работите с тази функция, трябва да зададете стойността на променливата. Струва си да се отбележи веднага, че има някои ситуации, в които тази функция няма да доведе до резултати. Това е възможно, ако променливата:

  • не е число. В такава ситуация функцията FISCHER ще върне стойността на грешка #VALUE!;
  • има стойност по-малка от -1 или по-голяма от 1. В този случай функцията FISCHER ще върне стойността за грешка #NUM!.

Уравнението, което се използва за математическо описание на функцията FISCHER е:

Z"=1/2*ln(1+x)/(1-x)

Нека да разгледаме използването на тази функция, използвайки 3 конкретни примера.



Оценка на връзката между печалба и разходи с помощта на функцията FISHER

Пример 1. Използвайки данни за дейността на търговските организации, е необходимо да се направи оценка на връзката между печалбата Y (милиона рубли) и разходите X (милиона рубли), използвани за разработване на продукта (показано в таблица 1).

Таблица 1 – Изходни данни:

хY
1 210 000 000,00 рубли95 000 000,00 рубли
2 1 068 000 000,00 рубли76 000 000,00 рубли
3 1 005 000 000,00 рубли78 000 000,00 рубли
4 610 000 000,00 рубли89 000 000,00 рубли
5 768 000 000,00 рубли77 000 000,00 рубли
6 799 000 000,00 рубли85 000 000,00 рубли

Схемата за решаване на такива проблеми е следната:

  1. Изчислено линеен коефициенткорелации r xy ;
  2. Значимостта на коефициента на линейна корелация се проверява на базата на t-критерия на Стюдънт. В този случай се излага и тества хипотеза, че коефициентът на корелация е равен на нула. T-статистиката се използва за проверка на тази хипотеза. Ако хипотезата се потвърди, t-статистиката има разпределение на Стюдънт. Ако изчислената стойност t p > t cr, тогава хипотезата се отхвърля, което показва значимостта на коефициента на линейна корелация и следователно статистическата значимост на връзката между X и Y;
  3. Определя се интервална оценка за статистически значим линеен корелационен коефициент.
  4. Интервална оценка за коефициента на линейна корелация се определя въз основа на обратната z-трансформация на Fisher;
  5. Изчислява се стандартната грешка на коефициента на линейна корелация.

Резултатите от решаването на този проблем с функциите, използвани в Excel, са показани на фигура 1.


Фигура 1 – Пример за изчисления.

Не.Име на индикатораФормула за изчисление
1 Коефициент на корелация=КОРЕЛ(B2:B7;C2:C7)
2 Изчислена стойност на t-теста tp=ABS(C8)/SQRT(1-POWER(C8,2))*SQRT(6-2)
3 Таблични стойности на t-теста trh=ОТКРИВАНЕ НА ПРОУЧВАНЕ(0,05;4)
4 Таблица стойност на стандарта нормална дистрибуциязи=NORMSINV((0,95+1)/2)
5 Стойност на трансформация на Fisher z=FISHER(C8)
6 Лява оценка на интервала за z=C12-C11*ROOT(1/(6-3))
7 Дясна интервална оценка за z=C12+C11*ROOT(1/(6-3))
8 Лява оценка на интервала за rxy=FISHEROBR(C13)
9 Оценка на десния интервал за rxy=FISHEROBR(C14)
10 Стандартно отклонение за rxy=ROOT((1-C8^2)/4)

По този начин, с вероятност от 0,95, коефициентът на линейна корелация е в диапазона от (–0,386) до (–0,990) със стандартна грешка от 0,205.

Проверка на статистическата значимост на регресията с помощта на функцията FASTER

Пример 2: Тествайте статистическата значимост на уравнението множествена регресияИзползвайки F теста на Фишер, направете заключения.

За да проверим значимостта на уравнението като цяло, излагаме хипотезата H 0 за статистическата незначимост на коефициента на детерминация и противоположната хипотеза H 1 за статистическата значимост на коефициента на детерминация:

H 1: R 2 ≠ 0.

Нека проверим хипотезите с помощта на F теста на Фишер. Индикаторите са показани в таблица 2.

Таблица 2 - Изходни данни

За целта използваме функцията в Excel:

ПО-БЪРЗО (α;p;n-p-1)

  • α е вероятността, свързана с дадено разпределение;
  • p и n са съответно числителят и знаменателят на степените на свобода.

Като знаем, че α = 0,05, p = 2 и n = 53, получаваме следната стойност за F crit (вижте Фигура 2).


Фигура 2 – Пример за изчисления.

Така можем да кажем, че F изчислено > F критично. В резултат на това се приема хипотезата H 1 за статистическата значимост на коефициента на детерминация.

Изчисляване на стойността на индикатора за корелация в Excel

Пример 3. Използване на данни от 23 предприятия за: X е цената на продукт А, хиляди рубли; Y е печалбата на търговско предприятие, милиони рубли, тяхната зависимост се изучава. Степен регресионен моделдаде следното: ∑(yi-yx) 2 = 50000; ∑(yi-yср) 2 = 130000. Какъв корелационен показател може да се определи от тези данни? Изчислете стойността на корелационния индикатор и, като използвате критерия на Фишер, направете заключение за качеството на регресионния модел.

Нека определим F crit от израза:

F изчислено = R 2 /23*(1-R 2)

където R е коефициентът на определяне, равен на 0,67.

Така изчислената стойност F calc = 46.

За да определим F crit, ние използваме разпределението на Fisher (виж Фигура 3).


Фигура 3 – Пример за изчисления.

По този начин получената оценка на регресионното уравнение е надеждна.

Значимостта на уравнението на множествената регресия като цяло, както и в сдвоената регресия, се оценява с помощта на критерия на Фишер:

, (2.22)

Където
– фактор сбор от квадрати за степен на свобода;
– остатъчна сума от квадрати за степен на свобода;
– коефициент (индекс) на множествена детерминация;
– брой параметри за променливи линейна регресиясъвпада с броя на факторите, включени в модела); – брой наблюдения.

Оценява се значимостта не само на уравнението като цяло, но и на фактора, допълнително включен в регресионния модел. Необходимостта от такава оценка се дължи на факта, че не всеки фактор, включен в модела, може значително да увеличи дела на обяснената вариация в резултантния признак. Освен това, ако има няколко фактора в модела, те могат да бъдат въведени в модела в различни последователности. Поради корелацията между факторите, значимостта на един и същи фактор може да бъде различна в зависимост от последователността на въвеждането му в модела. Мярката за оценка на включването на фактор в модела е частната
-критерий, т.е. .

Частно
-критерият се основава на сравняване на увеличението на факторната дисперсия поради влиянието на допълнително включен фактор с остатъчната дисперсия за една степен на свобода за регресионния модел като цяло. IN общ изгледза фактор частен
-критерият ще бъде определен като

, (2.23)

Където
– коефициент на множествена детерминация за модел с пълен набор от фактори,
– същия показател, но без включване на фактора в модела ,– брой наблюдения,
– брой параметри в модела (без свободен член).

Действителната стойност на коефициента
- критерият се сравнява с таблицата на ниво значимост
и брой степени на свобода: 1 и
. Ако действителната стойност надвишава
, след това допълнителното включване на фактора в модела е статистически обоснован и коефициентът на чиста регресия при фактор статистически значим. Ако действителната стойност е по-малка от табличната стойност, тогава допълнително включване на фактора в модела не увеличава значително дела на обяснената вариация в черта следователно е неуместно включването му в модела; Коефициентът на регресия за този фактор в този случай е статистически незначим.

За двуфакторно уравнение частните
- критериите имат формата:

,
. (2.23a)

Използване на лични
-критерий, може да се провери значимостта на всички регресионни коефициенти при допускането, че всеки съответен фактор въведени в уравнението на множествената регресия последни.

-Тест на студент за уравнение на множествена регресия.

Частно
-критерий оценява значимостта на чистите регресионни коефициенти. Познавайки величината , възможно е да се определи -критерий за коефициента на регресия при -m фактор, , а именно:

. (2.24)

Оценяване на значимостта на чистите коефициенти на регресия чрез -Тестът на Стюдънт може да се извърши без изчисляване на частичното
- критерии. В този случай, както при регресията по двойки, за всеки фактор се използва формулата:

, (2.25)

Където – чист коефициент на регресия при фактора ,– средна квадратична (стандартна) грешка на регресионния коефициент .

За уравнение на множествена регресия средната квадратична грешка на регресионния коефициент може да се определи по следната формула:

, (2.26)

Където ,– стандартно отклонение за характеристиката ,
– коефициент на определяне за уравнението на множествената регресия,
– коефициент на детерминация за зависимостта на фактора с всички други фактори в уравнението на множествената регресия;
– брой степени на свобода за остатъчната сума на квадратите на отклоненията.

Както можете да видите, за да използвате тази формула, имате нужда от междуфакторна корелационна матрица и изчисляването на съответните коефициенти на определяне, използвайки я
. И така, за уравнението
оценка на значимостта на регресионните коефициенти ,,включва изчисляването на три коефициента на определяне на междуфактори:
,
,
.

Връзката между показателите на частичния коефициент на корелация, частична
- критерии и -Тестът на Стюдънт за коефициенти на чиста регресия може да се използва в процедурата за избор на фактор. Елиминирането на факторите при конструиране на регресионно уравнение по метода на елиминиране може практически да се извърши не само чрез частични коефициенти на корелация, изключвайки на всяка стъпка фактора с най-малката незначителна стойност на частичния коефициент на корелация, но и чрез стойности И . Частно
-критерият се използва широко при конструирането на модел, като се използва методът на включване на променливи и методът на поетапната регресия.



Ново в сайта

>

Най - известен