У дома Устна кухина Надеждност на коефициента на корелация. Тест: Оценяване на значимостта на коефициентите на регресия и корелация с помощта на f-теста на Стюдънт

Надеждност на коефициента на корелация. Тест: Оценяване на значимостта на коефициентите на регресия и корелация с помощта на f-теста на Стюдънт

Някои изследователи, след като са изчислили стойността на коефициента на корелация, спират дотук. Но от гледна точка на компетентната експериментална методология трябва да се определи и нивото на значимост (т.е. степента на надеждност) на този коефициент.

Нивото на значимост на коефициента на корелация се изчислява с помощта на таблицата с критични стойности. По-долу е даден фрагмент от тази таблица, който ни позволява да определим нивото на значимост на получения коефициент.

Избираме реда, който съответства на размера на извадката. В нашия случай n = 10. Избираме в този ред табличната стойност, която е малко по-малка от емпиричната (или точно равна на нея, което е изключително рядко). Това число с удебелен шрифт е 0,632. Отнася се за колона с ниво на значимост p = 0,05. Тоест всъщност емпиричната стойност е междинна между колоните p = 0,05 и p = 0,01, следователно 0,05  p  0,01. По този начин отхвърляме нулевата хипотеза и заключаваме, че полученият резултат (R xy = 0,758) е значим на ниво p< 0,05 (это уровень статистической значимости): R эмп >R cr (стр< 0,05) H 0 ,  Н 1 ! ст. зн.

На ежедневен език това може да се тълкува по следния начин: можем да очакваме, че тази сила на връзката ще се появи в извадката по-рядко от пет случая от 100, ако тази връзка е следствие от случайност.

    1. Регресионен анализ

х(височина)

Y(тегло)

М х = 166,6

М г = 58,3

х = 6 , 54

г = 8 , 34

Регресионният анализ се използва за изследване на връзката между две величини, измерени в интервална скала. Този тип анализ включва изграждането на регресионно уравнение, което ви позволява да опишете количествено зависимостта на една характеристика от друга (коефициентът на корелация на Pearson показва наличието или отсъствието на връзка, но не описва тази връзка). Познавайки произволната стойност на една от характеристиките и използвайки това уравнение, изследователят може с определена степен на вероятност да предскаже съответната стойност на втората характеристика. Линейната зависимост на характеристиките се описва от следния тип уравнение:

y = a +b г * х ,

Където А -свободен член на уравнението, равен на издигането на графиката в точка х=0спрямо абсцисната ос, b – ъгловият коефициент на наклона на регресионната линия е равен на тангенса на ъгъла на наклона на графиката към абсцисната ос (при условие, че мащабът на стойностите на двете оси е еднакъв).

Познавайки стойностите на изследваните характеристики, можете да определите стойността на свободния термин и коефициента на регресия, като използвате следните формули:

а =М г b г * М х

В нашия случай:
;

а = 58,3 – 0,97 * 166,6 = -103,3

По този начин формулата за тегло спрямо височина е следната: y = 0,969 * х – 103,3

Съответната графика е показана по-долу.

Ако е необходимо да се опише връзката между височината и теглото ( хот при), след това стойностите АИ bстават различни и формулите трябва да бъдат съответно модифицирани:

х= а +b х * при

а =М х b х * М г

В този случай външният вид на графиката също се променя.

Коефициентът на регресия е тясно свързан с коефициента на корелация. Последното е средното геометрично на регресионните коефициенти на характеристиките:

Квадратът на коефициента на корелация се нарича коефициент на детерминация. Стойността му определя процентното взаимно влияние на променливите. В нашия случай Р 2 = 0,76 2 = 0,58 . Това означава, че 58% от общата дисперсия в Y се обяснява с влиянието на променливата X, останалите 42% се дължат на влиянието на фактори, които не са взети предвид в уравнението.

Трябва да се отбележи, че истински индикатор за степента на линейна връзка между променливите е теоретичен коефициент на корелация, което се изчислява въз основа на данни от цялата популация (т.е. всички възможни стойностииндикатори):

Където - теоретична ковариационна мярка, което се изчислява като математическото очакване на произведенията на отклонения на SV
И от техните математически очаквания.

По правило не можем да изчислим теоретичния коефициент на корелация. Въпреки това, от факта, че коефициентът на вземане на проби не е равен на нула
не следва, че теоретичният коефициент също е
(т.е. индикаторите могат да бъдат линейно независими). Че. Въз основа на данни от случайна извадка не може да се твърди, че има връзка между показателите.

Извадковият коефициент на корелация е оценка на теоретичния коефициент, т.к изчислява се само за част от стойностите на променливите.

Винаги съществува грешка на коефициента на корелация. Тази грешка е несъответствието между корелационния коефициент на обема на пробата а коефициентът на корелация за съвкупността се определя по формулите:

при
; И
при
.

Тестването на значимостта на коефициента на линейна корелация означава да се тества доколко можем да се доверим на примерните данни.

За целта се тества нулевата хипотеза
че стойността на корелационния коефициент за генералната съвкупност е нула, т.е. няма корелация в популацията. Алтернативна хипотеза е
.

За да проверим тази хипотеза, ние изчисляваме - статистика ( -Тест на Стюдент:

.

Което има студентско разпределение с
степени на свобода 1.

Критичната стойност се определя от таблиците за разпределение на Student
.

Ако изчислената критериална стойност
, тогава нулевата хипотеза се отхвърля, т.е. изчисленият коефициент на корелация се различава значително от нула с вероятност
.

Ако
, тогава нулевата хипотеза не може да бъде отхвърлена. В този случай е възможно истинската стойност на корелационния коефициент да е нула, т.е. връзката между показателите може да се счита за статистически незначима.

Пример 1. Таблицата показва данни за 8 години за общия доход и разходи за крайно потребление .

Изследвайте и измервайте близостта на връзката между дадени показатели.

Тема 4. Сдвоена линейна регресия. Метод на най-малките квадрати

Коефициентът на корелация показва степента на близост на връзката между две характеристики, но не отговаря на въпроса как промяната на една характеристика с една единица от нейното измерение влияе върху промяната на друга характеристика. За да се отговори на този въпрос се използват методи на регресионен анализ.

Регресионен анализкомплекти формазависимости между случайна променлива и променливи стойности
, и стойностите
се считат за точно посочени.

Регресионно уравнениее формула за статистическата връзка между променливите.

Ако тази формула е линейна, тогава говорим за линейна регресия.Формулата за статистическата връзка между две променливи се нарича регресия по двойки(няколко променливи – многократни).

Изборът на формула за зависимост се нарича спецификациярегресионни уравнения. Извиква се оценка на стойностите на параметрите на избраната формула параметризация.

Как да оцените стойностите на параметрите и да проверите надеждността на направените оценки?

Да погледнем чертежа

    В графика (а) връзката хИ прие близка до линейна, права линия 1 тук е близо до точките на наблюдение и последните се отклоняват от нея само в резултат на относително малки случайни влияния.

    Графика (b) показва реалната връзка между количествата хИ присе описва от нелинейна функция 2 и каквато и права линия да начертаем (например 1), отклоненията на точките от нея ще бъдат неслучайни.

    В графика (c) връзката между променливите хИ прилипсва и резултатите от параметризирането на всяка формула на зависимост ще бъдат неуспешни.

Отправната точка за анализ на иконометричните връзки обикновено е оценката линейна зависимостпроменливи. Винаги можете да опитате да начертаете права линия, която ще бъде „най-близо“ до точките за наблюдение в тяхната съвкупност (например на фигура (c) права линия 1 ще бъде по-добра от права линия 2).

Теоретично уравнение на линейна регресия по двойкиима формата:


,

Където
са наречени теоретични параметри (теоретични коефициенти) регресия; -случайно отклонение(случайна грешка).

Най-общо ще представим теоретичния модел във формата:

.

За да се определят стойностите на теоретичните коефициенти на регресия, е необходимо да се знаят всички стойности на променливите хИ Y, т.е. всичко общо население, което е практически невъзможно.

Задачата е следната: по налични данни от наблюдения
,
необходимо е да се оценят стойностите на параметрите
.

Позволявам Аоценка на параметъра
,bоценка на параметъра .

Тогава изчисленото регресионно уравнение е:
,

Където
теоретични стойности на зависимата променлива г, - наблюдавани стойности на грешки . Това уравнение се нарича емпирично регресионно уравнение. Ще го запишем във формата
.

Основата за оценка на параметрите на линейната регресия е Метод на най-малките квадрати (MNC)е метод за оценка на параметрите на линейна регресия, който минимизира сумата от квадратните отклонения на наблюденията на зависимата променлива от желаната линейна функция.

функция Qе квадратична функциядва параметъра аИ b. защото той е непрекъснат, изпъкнал и ограничен отдолу (
), така че достига минимум. Необходимо условие за съществуването на минимум е равенството на нула на неговите частни производни по отношение на аИ b:


.

Разделяйки двете уравнения на системата на н, получаваме:


или

В противен случай можете да напишете:

И - стандартни отклонения на стойностите на същите характеристики.

Че. линията на регресия минава през точката със средните стойности хИ при
, А коефициент на регресия b е пропорционална на ковариационния индекс и коефициента линейна корелация.

Ако освен регресия YНа хза същите емпирични стойности, регресионното уравнение на X върху Y (
, Където
), след това произведението на коефициентите
:

.

ДА СЕ коефициент на регресия  това е стойност, показваща колко мерни единици ще се промени стойността при промяна на стойността за единица от неговото измерение. Коефициентът се определя по същия начин .

В научните изследвания често има нужда да се намери връзка между резултата и факторните променливи (добива на реколтата и количеството на валежите, височината и теглото на човек в хомогенни групи по пол и възраст, сърдечна честота и телесна температура и т.н.).

Вторите са признаци, които допринасят за промени в тези, свързани с тях (първият).

Концепцията за корелационен анализ

Има много Въз основа на горното можем да кажем, че корелационният анализ е метод, използван за тестване на хипотезата за статистическа значимостдве или повече променливи, ако изследователят може да ги измери, но не и да ги промени.

Има и други определения на въпросното понятие. Корелационният анализ е метод на обработка, който включва изследване на коефициентите на корелация между променливите. В този случай коефициентите на корелация между една двойка или много двойки характеристики се сравняват, за да се установят статистически връзки между тях. Корелационният анализ е метод за изследване на статистическата зависимост между случайни величини с незадължително наличие на строг функционален характер, при който динамиката на една случайна величина води до динамиката математическо очакванедруг.

Концепцията за фалшива корелация

При провеждане корелационен анализнеобходимо е да се вземе предвид, че може да се извърши по отношение на всякакъв набор от характеристики, често абсурдни във връзка една с друга. Понякога те нямат причинно-следствена връзка помежду си.

В този случай те говорят за фалшива корелация.

Проблеми на корелационния анализ

Въз основа на горните определения можем да формулираме следните задачи на описания метод: получаване на информация за една от търсените променливи с помощта на друга; определят близостта на връзката между изследваните променливи.

Корелационният анализ включва определяне на връзката между изследваните характеристики и следователно задачите на корелационния анализ могат да бъдат допълнени със следното:

  • идентифициране на факторите, които имат най-голямо влияние върху резултантната характеристика;
  • идентифициране на неизследвани досега причини за връзки;
  • изграждане на корелационен модел с неговия параметричен анализ;
  • изследване на значимостта на комуникационните параметри и тяхната интервална оценка.

Връзка между корелационен анализ и регресия

Методът на корелационния анализ често не се ограничава до намиране на близостта на връзката между изследваните величини. Понякога се допълва от съставянето на регресионни уравнения, които се получават с помощта на едноименния анализ и които представляват описание на корелационната зависимост между резултантната и факторната (факторна) характеристика (характеристики). Този метод, заедно с разглеждания анализ, представлява метода

Условия за използване на метода

Ефективните фактори зависят от един до няколко фактора. Методът на корелационния анализ може да се използва, ако има голям брой наблюдения за стойността на ефективни и факторни показатели (фактори), докато изследваните фактори трябва да бъдат количествени и отразени в конкретни източници. Първият може да се определи от нормалния закон - в този случай резултатът от корелационния анализ е корелационните коефициенти на Пиърсън или, ако характеристиките не се подчиняват на този закон, се използва коефициентът рангова корелацияКопиеносец.

Правила за избор на фактори за корелационен анализ

При използване този методнеобходимо е да се определят факторите, влияещи върху показателите за ефективност. Те се избират, като се вземе предвид фактът, че трябва да има причинно-следствени връзки между показателите. В случай на създаване на многофакторен корелационен модел се избират тези, които оказват значително влияние върху резултантния индикатор, като за предпочитане е да не се включват взаимозависими фактори с двоен корелационен коефициент над 0,85 в корелационния модел, както и тези за които връзката с резултантния параметър няма линеен или функционален характер.

Показване на резултатите

Резултатите от корелационния анализ могат да бъдат представени в текстова и графична форма. В първия случай те се представят като коефициент на корелация, във втория - под формата на точкова диаграма.

При липса на корелация между параметрите, точките на диаграмата са разположени хаотично, средната степен на връзка се характеризира с по-голяма степен на подреденост и се характеризира с повече или по-малко равномерно разстояние на маркираните знаци от медианата. Силната връзка обикновено е права и при r=1 точковият график е плоска линия. Обратната корелация се различава в посоката на графиката от горния ляв до долния десен, директната корелация - от долния ляв до горния десен ъгъл.

3D представяне на точкова диаграма

В допълнение към традиционния 2D точков график, сега се използва 3D графично представяне на корелационния анализ.

Използва се и матрица на точкова диаграма, която показва всички сдвоени графики в една фигура в матричен формат. За n променливи матрицата съдържа n реда и n колони. Диаграмата, разположена в пресечната точка на i-тия ред и j-тата колона, е диаграма на променливите Xi спрямо Xj. По този начин всеки ред и колона е едно измерение, една клетка показва диаграма на разсейване на две измерения.

Оценка на плътността на връзката

Тясността на корелационната връзка се определя от коефициента на корелация (r): силна - r = ±0,7 до ±1, средна - r = ±0,3 до ±0,699, слаба - r = 0 до ±0,299. Тази класификация не е строга. Фигурата показва малко по-различна диаграма.

Пример за приложение на метода на корелационния анализ

Във Великобритания е направено интересно проучване. То е посветено на връзката между тютюнопушенето и рака на белия дроб и е извършено чрез корелационен анализ. Това наблюдение е представено по-долу.

Изходни данни за корелационен анализ

Професионална група

смъртност

Фермери, лесовъди и рибари

Миньори и работници в кариерата

Производители на газ, кокс и химикали

Производители на стъкло и керамика

Работници в пещи, ковачници, леярни и валцови цехове

Работници по електротехника и електроника

Инженерни и сродни професии

Дървообработваща промишленост

Кожарски майстори

Текстилни работници

Производители на работно облекло

Работници в хранително-вкусовата, питейната и тютюневата промишленост

Производители на хартия и печат

Производители на други продукти

Строители

Бояджии и декоратори

Машинисти на стационарни двигатели, кранове и др.

Работници, които не са включени другаде

Транспортни и комуникационни работници

Складови работници, склададжии, опаковчици и работници на пълначни машини

Офис работници

Продавачи

Работници в областта на спорта и отдиха

Администратори и управители

Професионалисти, техници и художници

Започваме корелационен анализ. По-добре е да започнете решението за яснота с графичен метод, за което ще построим точкова диаграма.

Демонстрира пряка връзка. Въпреки това е трудно да се направи недвусмислено заключение само на базата на графичния метод. Затова ще продължим да извършваме корелационен анализ. Пример за изчисляване на коефициента на корелация е представен по-долу.

Използвайки софтуер (MS Excel ще бъде описан по-долу като пример), определяме коефициента на корелация, който е 0,716, което означава силна връзка между изследваните параметри. Нека определим статистическата надеждност на получената стойност, като използваме съответната таблица, за която трябва да извадим 2 от 25 двойки стойности, в резултат получаваме 23 и използвайки този ред в таблицата, намираме r критично за p = 0,01 (тъй като това са медицински данни, по-строга зависимост, в други случаи p=0,05 е достатъчно), което е 0,51 за този корелационен анализ. Примерът показа, че изчисленото r е по-голямо от критичното r и стойността на корелационния коефициент се счита за статистически надеждна.

Използване на софтуер при извършване на корелационен анализ

Описаният тип статистическа обработка на данни може да се извърши с помощта на софтуер, по-специално MS Excel. Корелацията включва изчисляване на следните параметри с помощта на функции:

1. Коефициентът на корелация се определя с помощта на функцията CORREL (масив1; масив2). Array1,2 - клетка от интервала от стойности на резултантните и факторните променливи.

Коефициентът на линейна корелация се нарича още коефициент на корелация на Pearson и следователно, започвайки с Excel 2007, можете да използвате функцията със същите масиви.

Графичното показване на корелационния анализ в Excel се извършва с помощта на панела „Диаграми“ с избора „Диаграма на разсейване“.

След като посочим първоначалните данни, получаваме графика.

2. Оценяване на значимостта на коефициента на двойна корелация с помощта на t-теста на Стюдънт. Изчислената стойност на t-критерия се сравнява с табличната (критична) стойност на този показател от съответната таблица със стойности на разглеждания параметър, като се вземат предвид определеното ниво на значимост и броя на степените на свобода. Тази оценка се извършва с помощта на функцията STUDISCOVER(вероятност; степени_на_свобода).

3. Матрица от двойни корелационни коефициенти. Анализът се извършва с помощта на инструмента Data Analysis, в който е избрана Correlation. Статистическата оценка на коефициентите на корелация на двойки се извършва чрез сравняването им абсолютна стойностс таблична (критична) стойност. Когато изчисленият коефициент на двойна корелация надвиши критичния, можем да кажем, като вземем предвид дадената степен на вероятност, че нулевата хипотеза за значимостта на линейната зависимост не се отхвърля.

Накрая

Използването на метода на корелационния анализ в научните изследвания ни позволява да определим връзката между различни фактории показатели за ефективност. Необходимо е да се вземе предвид, че висок коефициент на корелация може да се получи от абсурдна двойка или набор от данни и следователно този виданализът трябва да се извършва върху достатъчно голям масив от данни.

След получаване на изчислената стойност на r е препоръчително да я сравните с критичното r, за да потвърдите статистическата надеждност на определена стойност. Корелационният анализ може да се извърши ръчно с помощта на формули или с помощта на софтуер, по-специално MS Excel. Тук можете също да изградите диаграма на разсейване с цел визуално представяне на връзката между изследваните фактори на корелационния анализ и получената характеристика.

Етап 3. Намиране на връзки между данни

Линейна корелация

Последният етап от задачата за изучаване на връзките между явленията е да се оцени близостта на връзката с помощта на корелационни показатели. Този етап е много важен за идентифициране на зависимости между факторни и работни характеристики и следователно за възможността за диагностициране и прогнозиране на изследваното явление.

Диагноза(от гръцката диагноза разпознаване) - определяне на същността и характеристиките на състоянието на обект или явление въз основа на цялостното му изследване.

Прогноза(от гръцката прогноза предвиждане, предсказание) - всяка конкретна прогноза, преценка за състоянието на всяко явление в бъдещето (прогноза за времето, резултат от избори и др.). Прогнозата е научно обоснована хипотеза за вероятното бъдещо състояние на изследваната система, обект или явление и показатели, характеризиращи това състояние. Прогнозиране – разработване на прогнози, спец Научно изследванеконкретни перспективи за развитие на всяко явление.

Нека си припомним определението за корелация:

Корелация– зависимост между случайни величини, изразяваща се в това, че разпределението на една величина зависи от стойността на друга величина.

Наблюдава се корелация не само между количествени, но и качествени характеристики. Съществуват различни начинии показатели за оценка на близостта на връзките. Ще се спрем само на корелационен коефициент на линейна двойка , който се използва, когато има линейна връзка между случайни променливи. На практика често има нужда да се определи нивото на връзка между случайни променливи с различни размери, така че е желателно да има някаква безразмерна характеристика на тази връзка. Такава характеристика (мярка за връзка) е коефициентът на линейна корелация r xy, което се определя по формулата

Където , .

Означавайки и , можем да получим следния израз за изчисляване на коефициента на корелация

.

Ако въведем понятието нормализирано отклонение , което изразява отклонението на корелираните стойности от средната стойност в части от стандартното отклонение:



тогава изразът за коефициента на корелация ще приеме формата

.

Ако изчислите коефициента на корелация въз основа на крайните стойности на първоначалния случайни променливиот таблицата за изчисление, тогава коефициентът на корелация може да се изчисли с помощта на формулата

.

Свойства на коефициента на линейна корелация:

1). Коефициентът на корелация е безразмерна величина.

2). |r| £1 или .

3). , а,б= const, – стойността на коефициента на корелация няма да се промени, ако всички стойности на случайните променливи X и Y се умножат (или разделят) на константа.

4). , а,б= const, – стойността на коефициента на корелация няма да се промени, ако всички стойности на случайните променливи X и Y се увеличат (или намалят) с константа.

5). Има връзка между коефициента на корелация и коефициента на регресия:

Стойностите на коефициентите на корелация могат да се интерпретират, както следва:

Количествени критерии за оценка на близостта на комуникацията:

За прогностични цели, стойности с |r| > 0,7.

Коефициентът на корелация ни позволява да заключим, че има линейна зависимост между две случайни променливи, но не показва коя от променливите причинява промяната в другата. Всъщност връзка между две случайни променливи може да съществува без причинно-следствена връзка между самите стойности, т.к. промяна в двете случайни променливи може да бъде причинена от промяна (влияние) на третата.

Коефициент на корелация r xyе симетричен по отношение на разглежданите случайни променливи хИ Y. Това означава, че за определяне на коефициента на корелация е напълно безразлично коя от величините е независима и коя зависима.

Значение на коефициента на корелация

Дори и за независими величиникоефициентът на корелация може да е различен от нула поради случайно разсейване на резултатите от измерването или поради малка извадка от случайни променливи. Следователно трябва да се провери значимостта на коефициента на корелация.

Значимостта на коефициента на линейна корелация се проверява въз основа на t-тест на Стюдънт :

.

Ако T > t кр(P,n-2), тогава линеен коефициенткорелацията е значима и следователно статистическата връзка също е значима хИ Y.

.

За по-лесно изчисление са създадени таблици със стойности на доверителните граници на корелационните коефициенти за различни числастепени на свобода f = n–2 (двустранен тест) и различни нива на значимост а= 0,1; 0,05; 0,01 и 0,001. Корелацията се счита за значима, ако изчисленият корелационен коефициент надвишава стойността на доверителната граница на корелационния коефициент за дадения fИ а.

За големите нИ а= 0,01 стойността на доверителната граница на корелационния коефициент може да се изчисли с помощта на приблизителната формула

.

Въведение. 2

1. Оценка на значимостта на коефициентите на регресия и корелация с помощта на f-критерия на Стюдънт. 3

2. Изчисляване на значимостта на коефициентите на регресия и корелация с помощта на f-критерия на Стюдънт. 6

Заключение. 15

След конструирането на регресионното уравнение е необходимо да се провери неговата значимост: като използвате специални критерии, определете дали получената зависимост е изразено с уравнениеторегресия, случаен, т.е. може ли да се използва за прогнозни цели и за факторен анализ. В статистиката са разработени методи за стриктно тестване на значението на използването на регресионни коефициенти дисперсионен анализи изчисляване на специални критерии (например F-критерий). Свободен тест може да се извърши чрез изчисляване на средното относително линейно отклонение (e), т.нар средна грешкаприближения:

Нека сега преминем към оценка на значимостта на регресионните коефициенти bj и конструиране на доверителен интервал за параметрите на регресионния модел Ru (J=l,2,..., p).

Блок 5 - оценка на значимостта на коефициентите на регресия въз основа на стойността на ^-теста на Стюдънт. Изчислените стойности на ta се сравняват с допустимата стойност

Блок 5 - оценка на значимостта на регресионните коефициенти въз основа на стойността на ^-критерия. Изчислените стойности на t0n се сравняват с допустимата стойност 4,/, която се определя от таблиците на t-разпределението за дадена вероятност за грешка (a) и броя на степените на свобода (/).

В допълнение към проверката на значимостта на целия модел е необходимо да се тества значимостта на коефициентите на регресия с помощта на Student /-теста. Минималната стойност на регресионния коефициент br трябва да съответства на условието bifob- ^t, където bi е стойността на коефициента на регресионното уравнение в естествена скала за i-та факторна характеристика; ах - средна квадратична грешка на всеки коефициент. несравнимост на коефициентите D по тяхната значимост;

Допълнителният статистически анализ се отнася до тестването на значимостта на регресионните коефициенти. За да направим това, намираме стойността на ^-критерия за регресионните коефициенти. В резултат на тяхното сравнение се определя най-малкият ^-критерий. Факторът, чийто коефициент отговаря на най-малкия ^-критерий, се изключва от по-нататъшния анализ.

За да се оцени статистическата значимост на коефициентите на регресия и корелация, t-тестът на Стюдънт и доверителни интерваливсеки от показателите. Излага се хипотеза за случайния характер на показателите, т.е. за тяхната незначителна разлика от нула. Оценяването на значимостта на коефициентите на регресия и корелация с помощта на f-тест на Student се извършва чрез сравняване на техните стойности с големината на случайната грешка:

Оценяването на значимостта на чистите регресионни коефициенти с помощта на /-теста на Стюдънт се свежда до изчисляване на стойността

Качеството на труда е характеристика на конкретния труд, отразяваща степента на неговата сложност, интензивност (интензивност), условия и значение за икономическото развитие. К.т. се измерва чрез тарифна система, която позволява да се диференцират заплатите в зависимост от нивото на квалификация (сложността на работата), условията, тежестта на труда и неговата интензивност, както и значението на отделните отрасли и производства, региони, територии за развитието на икономиката на страната. К.т. намира израз в заплатиработници, развиващи се на пазара на труда под влияние на търсенето и предлагането работна сила(специфични видове труд). К.т. - сложни по структура

Получените оценки на относителната важност на отделните икономически, социални и екологични последици от проекта допълнително осигуряват основа за сравняване на алтернативни проекти и техните опции, използвайки „комплексния точков безразмерен критерий за социална и екологично-икономическа ефективност“ на проекта Ek, изчислен (в средни оценки на значимост), използвайки формулата

Вътрешноотрасловото регулиране осигурява различия в заплащането на работниците в даден отрасъл в зависимост от значението на отделните видове производство в даден отрасъл, от сложността и условията на труд, както и от използваните форми на възнаграждение.

Получената рейтингова оценка на анализираното предприятие по отношение на стандартното предприятие, без да се отчита значимостта на отделните показатели, е сравнителна. Когато сравнявате рейтингите на няколко предприятия най-висок рейтингима предприятие с минималната стойност на получената сравнителна оценка.

Разбирането на качеството на даден продукт като мярка за неговата полезност поставя практически важен въпросотносно измерването му. Нейното решаване се постига чрез изследване на значението на отделните свойства за задоволяване на конкретна потребност. Значимостта дори на едно и също свойство може да бъде различна в зависимост от условията на потребление на продукта. Следователно полезността на продукта в различни обстоятелстваупотребите му са различни.

Вторият етап на работа е изучаване на статистически данни и идентифициране на връзката и взаимодействието на показателите, определяне на значимостта на отделните фактори и причините за промените в общите показатели.

Всички разглеждани показатели са обединени в едно по такъв начин, че резултатът е цялостна оценка на всички анализирани аспекти от дейността на предприятието, като се вземат предвид условията на неговата дейност, като се вземе предвид степента на значимост на отделните показатели за различни видовеинвеститори:

Коефициентите на регресия показват интензивността на влиянието на факторите върху показателя за ефективност. Ако се извърши предварителна стандартизация на факторните показатели, тогава b0 е равно на средната стойност на ефективния показател в агрегата. Коефициентите b, b2 ..... bl показват с колко единици нивото на ефективния индикатор се отклонява от средната му стойност, ако стойностите на факторния индикатор се отклоняват от средната стойност, равна на нула с единица стандартно отклонение. По този начин коефициентите на регресия характеризират степента на значимост на отделните фактори за повишаване на нивото на показателя за ефективност. Конкретните стойности на регресионните коефициенти се определят от емпирични данни според метода най-малки квадрати(в резултат на решаване на системи от нормални уравнения).

2. Изчисляване на значимостта на коефициентите на регресия и корелация с помощта на f-теста на Стюдънт

Нека разгледаме линейната форма на многофакторни връзки не само като най-простата, но и като формата, предоставена от приложните софтуерни пакети за компютри. Ако връзката между отделен фактор и резултантния атрибут не е линейна, тогава уравнението се линеаризира чрез заместване или трансформиране на стойността на факторния атрибут.

Обща формауравнението на многомерната регресия има формата:


където k е броят на факторните характеристики.

За да се опрости системата от уравнения на най-малките квадрати, необходими за изчисляване на параметрите на уравнение (8.32), обикновено се въвеждат отклоненията на отделните стойности на всички характеристики от средните стойности на тези характеристики.

Получаваме система от k уравнения на най-малките квадрати:

Решавайки тази система, получаваме стойностите на условно чистите коефициенти на регресия b. Свободният член на уравнението се изчислява по формулата


Терминът "условно чист коефициент на регресия" означава, че всяка от стойностите bj измерва общото средно отклонение на получената характеристика от нейната средна стойност, когато даден фактор xj се отклонява от средната си стойност с единица от нейното измерване и при условие, че всички други фактори, включени в регресионното уравнение, фиксирани на средни стойности, не се променят, не варират.

По този начин, за разлика от сдвоения коефициент на регресия, условният чист коефициент на регресия измерва влиянието на даден фактор, абстрахирайки се от връзката на вариацията на този фактор с вариацията на други фактори. Ако беше възможно да се включат в уравнението на регресията всички фактори, влияещи върху вариацията на получената характеристика, тогава стойностите на bj. могат да се считат за мерки за чистото влияние на факторите. Но тъй като наистина е невъзможно да се включат всички фактори в уравнението, тогава коефициентите bj. не е свободен от примеса на влиянието на фактори, които не са включени в уравнението.

Невъзможно е да се включат всички фактори в регресионното уравнение поради една от трите причини или всички наведнъж, тъй като:

1) някои фактори може да са неизвестни съвременна наука, познаването на всеки процес винаги е непълно;

2) липсва информация за някои от известните теоретични фактори или е ненадеждна;

3) размерът на изследваната популация (извадка) е ограничен, което позволява включването на ограничен брой фактори в регресионното уравнение.

Коефициенти на условна чиста регресия bj. са именувани числа, изразени в различни мерни единици и поради това са несравними помежду си. За преобразуването им в съпоставими относителни показатели се използва същата трансформация, както за получаване на коефициента на двойна корелация. Получената стойност се нарича стандартизиран коефициентрегресия или?-коеф.


Коефициентът на фактора xj определя мярката на влиянието на изменението на фактора xj върху изменението на резултантната характеристика y, като се абстрахира от съпътстващото изменение на други фактори, включени в регресионното уравнение.

Полезно е да се изразят коефициентите на условно чиста регресия под формата на относителни сравними показатели за връзка, коефициенти на еластичност:

Коефициентът на еластичност на фактора xj казва, че когато стойността на даден фактор се отклонява от средната си стойност с 1% и абстрахирайки се от съпътстващото отклонение на други фактори, включени в уравнението, получената характеристика ще се отклонява от средната си стойност с ej процента от y. По-често коефициентите на еластичност се интерпретират и прилагат от гледна точка на динамиката: с увеличаване на коефициента x с 1% от средната му стойност, получената характеристика ще се увеличи с процент от средната му стойност.

Нека разгледаме изчислението и интерпретацията на многофакторното регресионно уравнение, като използваме същите 16 ферми като пример (Таблица 8.1). Получен знак - ниво брутен доходи три фактора, влияещи върху него, са представени в табл. 8.7.

Нека припомним още веднъж, че за да се получат надеждни и достатъчно точни показатели за корелация е необходима по-голяма съвкупност.


Таблица 8.7

Ниво на брутния доход и неговите фактори

Номера на ферми

Брутен доход, rub./ra

Разходи за труд, човекодни/ха x1

дял от обработваема земя,

Добив на мляко на 1 крава,

Таблица 8.8 Индикатори на регресионното уравнение

Зависима променлива: y

Коефициент на регресия

Константа-240.112905

Std. грешка на оцен. = 79.243276


Решението е извършено с помощта на програмата “Microstat” за компютър. Ето и таблиците от разпечатката: табл. 8.7 дава средните стойности и стандартните отклонения на всички характеристики. Таблица 8.8 съдържа регресионни коефициенти и тяхната вероятностна оценка:

първата колона "var" - променливи, т.е. фактори; втората колона „регресионен коефициент” - условно чисти регресионни коефициенти bj; трета колона „std. errr" - средни грешки при оценката на регресионните коефициенти; четвърта колона - стойности на t-теста на Student с 12 степени на свобода на вариация; пета колона “prob” - вероятността на нулевата хипотеза спрямо регресионните коефициенти;

шеста колона “частично r2” - частни коефициенти на детерминация. Съдържанието и методологията за изчисляване на индикаторите в колони 3-6 се обсъждат допълнително в глава 8. „Константа“ е свободният член на регресионното уравнение a; „Std. грешка на est.“ - средна квадратична грешка при оценката на ефективната характеристика с помощта на регресионното уравнение. Уравнението се получи множествена регресия:

y = 2,26x1 - 4,31x2 + 0,166x3 - 240.

Това означава, че размерът на брутния доход на 1 хектар земеделска земя средно се е увеличил с 2,26 рубли. с увеличение на разходите за труд с 1 час/дка; намалява средно с 4,31 рубли. с увеличение на дела на обработваемата земя в земеделските земи с 1% и увеличение с 0,166 рубли. с увеличение на млечността на крава с 1 кг. Отрицателната стойност на свободния термин е съвсем естествена и, както вече беше отбелязано в параграф 8.2, ефективният знак е, че брутният доход става нула много преди факторите да достигнат нулеви стойности, което е невъзможно в производството.

Отрицателна стойност на коефициента за х^ е сигнал за значителни затруднения в икономиката на изследваните ферми, където растениевъдството е нерентабилно, а само животновъдството е рентабилно. При рационални методи на земеделие и нормални цени (равновесни или близки до тях) за продуктите от всички сектори доходите не трябва да намаляват, а да се увеличават с увеличаване на най-плодородния дял от земеделската земя - обработваемата земя.

Въз основа на данните от предпоследните два реда на табл. 8.7 и таблица. 8.8 изчисляваме p-коефициентите и коефициентите на еластичност по формули (8.34) и (8.35).

Както вариацията в равнището на дохода, така и евентуалната му промяна в динамиката се влияят най-силно от фактора х3 - продуктивността на кравите, и най-слабо от х2 - дела на обработваемата земя. Стойностите P2/ ще бъдат използвани допълнително (Таблица 8.9);

Таблица 8.9 Сравнително влияние на факторите върху нивото на доходите

Фактори xj


И така, получихме, че?-коефициентът на фактора xj се отнася към коефициента на еластичност на този фактор, както коефициентът на вариация на фактора се отнася към коефициента на вариация на резултантната характеристика. Тъй като, както се вижда от последния ред на таблицата. 8.7, коефициентите на вариация на всички фактори са по-малки от коефициента на вариация на получената характеристика; всички?-коефициенти са по-малки от коефициентите на еластичност.

Нека разгледаме връзката между сдвоения и условно чистия коефициент на регресия, използвайки фактора -с като пример. двойки линейно уравнениевръзката y с x има формата:

y = 3.886x1 – 243.2

Условно чистият регресионен коефициент при x1 е само 58% от двойния. Останалите 42% се дължат на факта, че вариацията х1 е придружена от вариация на факторите х2 х3, което от своя страна влияе върху резултантния признак. Връзките на всички характеристики и техните двойни коефициенти на регресия са представени в графиката на връзките (фиг. 8.2).


Ако сумираме оценките на прякото и косвеното влияние на вариацията x1 върху y, т.е. произведението на сдвоените регресионни коефициенти по всички „пътеки“ (фиг. 8.2), получаваме: 2,26 + 12,55 0,166 + (-0,00128) (- 4,31) + (-0,00128) 17,00 0,166 = 4,344.

Тази стойност е още по-голяма двойка коефициентвръзки x1 с y. Следователно косвеното влияние на вариацията x1 чрез фактори, които не са включени в уравнението, е обратното, което дава общо:

1 Айвазян С.А., Мхитарян В.С. Приложна статистика и основи на иконометрията. Учебник за ВУЗ. - М.: ЕДИНСТВО, 2008, - 311 с.

2 Джонстън Дж. Иконометрични методи. - М.: Статистика, 1980. – 282s.

3 Dougherty K. Въведение в иконометрията. - М.: INFRA-M, 2004, - 354 с.

4 Dreyer N., Smith G., Applied регресионен анализ. - М.: Финанси и статистика, 2006, - 191 с.

5 Магнус Ю.Р., Картишев П.К., Пересецки А.А. Иконометрия. Начален курс.-М .: Дело, 2006, – 259 с.

6 Семинар по иконометрия/Изд. I.I. Елисеева - М.: Финанси и статистика, 2004, - 248 с.

7 Иконометрия/Изд. I.I. Елисеева - М.: Финанси и статистика, 2004, - 541 с.

8 Кремер Н., Путко Б. Иконометрия: ЮНИТИ-ДАНА, 200, – 281 с.


Айвазян С.А., Мхитарян В.С. Приложна статистика и основи на иконометрията. Учебник за ВУЗ. - М.: ЕДИНСТВО, 2008, – стр. 23.

Кремер Н., Путко Б. Иконометрия.- М.: UNITY-DANA, 200, – p.64

Драйер Н., Смит Г., Приложен регресионен анализ. - М .: Финанси и статистика, 2006, - стр. 57.

Семинар по иконометрия/Изд. И. И. Елисеева - М.: Финанси и статистика, 2004 г., с. 172.



Ново в сайта

>

Най - известен