У дома хигиена Оценка на параметрите на регресионното уравнение. Оценка на параметрите на линейната регресия

Оценка на параметрите на регресионното уравнение. Оценка на параметрите на линейната регресия

Регресионното уравнение винаги се допълва с индикатор за близостта на връзката. Използвайки линейна регресиятакъв показател е коефициентът на линейна корелация r yt. Има различни модификации на формулата линеен коефициенткорелации.

Трябва да се има предвид, че стойността на коефициента на линейна корелация оценява близостта на връзката между разглежданите характеристики в нейната линейна форма. Следователно близост абсолютна стойностлинеен коефициент на корелация до нула не означава, че няма връзка между характеристиките.

За оценка на качеството на селекцията линейна функцияизчислява се квадратът на коефициента на линейна корелация r yt 2, наречен коефициент на детерминация. Коефициентът на детерминация характеризира съотношението на дисперсията на ефективната характеристика при t, обяснено чрез регресия в общата дисперсия на ефективната характеристика.

Уравнението на нелинейната регресия, както в линейна зависимост, се допълва от корелационен показател, а именно корелационния индекс R.

Парабола от втори порядък, като многочлен на повече висок ред, когато се линеаризира, приема формата на уравнението множествена регресия. Ако е нелинейно спрямо обясненото уравнение с променливарегресията по време на линеаризацията е под формата на линейно уравнение на сдвоена регресия, след което за оценка на близостта на връзката може да се използва линеен коефициент на корелация, чиято стойност в този случай ще съвпадне с индекса на корелация.

Ситуацията е различна, когато трансформациите на уравнението в линейна форма включват зависима променлива. В този случай коефициентът на линейна корелация, базиран на трансформираните стойности на характеристиките, дава само приблизителна оценка на близостта на връзката и не съвпада числено с индекса на корелация. Да, за степенна функция

след преминаване към логаритмично линейното уравнение

lny = lna + blnx

линеен коефициент на корелация може да се намери не за действителните стойности на променливите x и y, а за техните логаритми, т.е. r lnylnx. Съответно, квадратът на неговата стойност ще характеризира съотношението на факторната сума на квадратните отклонения към общото, но не за y, а за неговите логаритми:

Междувременно при изчисляване на индекса на корелация се използват сумите на квадратните отклонения на характеристиката y, а не техните логаритми. За тази цел се определят теоретичните стойности на получената характеристика, т.е. като антилогаритъм на стойността, изчислена от уравнението и остатъчната сума на квадратите като.

Знаменателят на изчислението R 2 yx включва общата сума на квадратните отклонения на действителните стойности y от средната им стойност, а знаменателят r 2 lnxlny участва в изчислението. Числителите и знаменателите на разглежданите показатели се различават съответно:

  • - в индекса на корелация и
  • - в коефициента на корелация.

Поради сходството на резултатите и простотата на изчисленията с помощта на компютърни програми, коефициентът на линейна корелация се използва широко за характеризиране на близостта на връзката за нелинейни функции.

Въпреки близостта на стойностите на R и r или R и r в нелинейни функции с трансформация на стойността на характеристиката y, трябва да се помни, че ако с линейна зависимост на характеристиките, същият коефициент на корелация характеризира регресия, трябва да се помни, че ако при линейна зависимост на характеристиките един и същ коефициент на корелация характеризира регресията както и, тъй като, тогава при криволинейна зависимост за функцията y=j(x) не е равен за регресия x =f(y).

Тъй като изчисляването на индекса на корелация използва съотношението на фактора и обща сумаквадратни отклонения, тогава има същото значение като коефициента на детерминация. В специални изследвания стойността на нелинейните зависимости се нарича индекс на определяне.

Оценката на значимостта на индекса на корелация се извършва по същия начин, както оценката на надеждността на коефициента на корелация.

Индексът на корелация се използва за тестване на значимостта на общото нелинейно регресионно уравнение с помощта на теста на Fisher F.

Стойността m характеризира броя на степените на свобода за факторната сума на квадратите, а (n - m - 1) - броя на степените на свобода на остатъчната сума на квадратите.

За степенна функция m = 1 и формулата на F-критерия приема същата форма като за линейна зависимост:

За парабола от втора степен

y = a 0 + a 1 x + a 2 x 2 + em = 2

F-критерият също може да се изчисли в таблицата дисперсионен анализрегресионни резултати, както е показано за линейната функция.

Индексът на определяне може да се сравни с коефициента на определяне, за да се обоснове възможността за използване на линейна функция. Колкото по-голяма е кривата на регресионната линия, толкова по-малък е коефициентът на детерминация е индексът на детерминация. Сходството на тези показатели означава, че не е необходимо да се усложнява формата на регресионното уравнение и може да се използва линейна функция.

На практика, ако разликата между индекса на детерминация и коефициента на детерминация не надвишава 0,1, тогава приемането на линейна форма на връзката се счита за оправдано.

Ако t fact >t таблица, тогава разликите между разглежданите корелационни показатели са значителни и замяната на нелинейната регресия с уравнение на линейна функция е невъзможна. Практически, ако стойността t< 2, то различия между R yx и r yx несущественны, и, следовательно, возможно применение линейной регрессии, даже если есть предположения о некоторой нелинейности рассматриваемых соотношений признаков фактора и результата.

Корелационен анализ.

Сдвоено регресионно уравнение.

Използване на графичния метод.

Този метод се използва за визуално изобразяване на формата на връзка между изследваните икономически показатели. За да направите това, се изчертава графика в правоъгълна координатна система, отделните стойности на резултантната характеристика Y се нанасят по ординатната ос, а индивидуалните стойности на факторната характеристика X се нанасят по абсцисната ос.

Множеството от точки на резултатната и факторната характеристика се наричат корелационно поле.

Въз основа на корелационното поле може да се изложи хипотеза (напр население), че връзката между всички възможни стойности на X и Y е линейна.

Уравнението на линейната регресия е y = bx + a + ε

Тук ε е случайна грешка (отклонение, смущение).

Причини за наличието на случайна грешка:

1. Липса на включване на значими обяснителни променливи в регресионния модел;

2. Агрегиране на променливи. Например функцията за общо потребление е опит общ изразсъвкупност от индивидуални решения за разходи. Това е само приближение на индивидуални отношения, които имат различни параметри.

3. Неправилно описание на структурата на модела;

4. Неправилна функционална спецификация;

5. Грешки при измерване.

Тъй като отклоненията ε i за всяко конкретно наблюдение i са случайни и техните стойности в извадката са неизвестни, тогава:

1) от наблюдения x i и y i могат да се получат само оценки на параметрите α и β

2) Оценки на параметрите α и β регресионен моделса съответно стойностите на a и b, които са произволни по природа, т.к съответстват на произволна извадка;

Тогава оценяващото регресионно уравнение (конструирано от примерни данни) ще има формата y = bx + a + ε, където e i са наблюдаваните стойности (оценки) на грешките ε i , а a и b са съответно оценки на параметрите α и β на регресионния модел, които трябва да бъдат намерени.

За оценка на параметрите α и β - се използва методът на най-малките квадрати (метод на най-малките квадрати). Метод най-малки квадратидава най-добрите (последователни, ефективни и безпристрастни) оценки на параметрите на регресионното уравнение.

Но само ако са изпълнени определени предпоставки по отношение на случайния член (ε) и независимата променлива (x).

Формално, OLS критерият може да бъде написан по следния начин:

S = ∑(y i - y * i) 2 → мин

Система от нормални уравнения.

a n + b∑x = ∑y

a∑x + b∑x 2 = ∑y x

За нашите данни системата от уравнения има формата

15a + 186,4 b = 17,01

186,4 a + 2360,9 b = 208,25

От първото уравнение изразяваме Аи заместваме във второто уравнение:

Получаваме емпирични регресионни коефициенти: b = -0.07024, a = 2.0069

Регресионно уравнение (емпирично регресионно уравнение):

y = -0,07024 x + 2,0069

Емпирични регресионни коефициенти аИ bса само оценки на теоретичните коефициенти β i, а самото уравнение отразява само общата тенденция в поведението на разглежданите променливи.

За да изчислим регресионните параметри, ще изградим изчислителна таблица (Таблица 1)

1. Параметри на регресионното уравнение.

Примерни средства.

Примерни отклонения:

Стандартно отклонение

1.1. Коефициент на корелация

Ковариация.

Изчисляваме индикатора за близост на връзката. Този показател е примерният коефициент на линейна корелация, който се изчислява по формулата:

Коефициентът на линейна корелация приема стойности от –1 до +1.

Връзките между характеристиките могат да бъдат слаби и силни (близки). Техните критерии се оценяват по скалата на Chaddock:

0.1 < r xy < 0.3: слабая;

0.3 < r xy < 0.5: умеренная;

0.5 < r xy < 0.7: заметная;

0.7 < r xy < 0.9: высокая;

0.9 < r xy < 1: весьма высокая;

В нашия пример връзката между черта Y и фактор X е висока и обратна.

Освен това корелационният коефициент на линейната двойка може да се определи чрез регресионния коефициент b:

1.2. Регресионно уравнение(оценка на регресионно уравнение).

Уравнението на линейната регресия е y = -0,0702 x + 2,01

Коефициентите на уравнение на линейна регресия могат да получат икономическо значение.

Коефициентът на регресия b = -0,0702 показва средното изменение на ефективния показател (в мерни единици y) с увеличаване или намаляване на стойността на фактора x за единица измерване. В този пример, с увеличение от 1 единица, y намалява средно с -0,0702.

Коефициентът a = 2,01 формално показва прогнозираното ниво на y, но само ако x = 0 е близо до стойностите на извадката.

Но ако x=0 е далеч от примерните стойности на x, тогава буквалното тълкуване може да доведе до неправилни резултати и дори ако регресионната линия описва наблюдаваните примерни стойности сравнително точно, няма гаранция, че това също ще такъв е случаят при екстраполиране наляво или надясно.

Като заместим подходящите x стойности в регресионното уравнение, можем да определим подравнените (прогнозирани) стойности на показателя за ефективност y(x) за всяко наблюдение.

Връзката между y и x определя знака на регресионния коефициент b (ако > 0 - пряка връзка, в противен случай - обратна). В нашия пример връзката е обратна.

1.3. Коефициент на еластичност.

Не е препоръчително да се използват регресионни коефициенти (в пример b) за пряка оценка на влиянието на факторите върху резултатна характеристика, ако има разлика в мерните единици на резултатния показател y и факторната характеристика x.

За тези цели се изчисляват коефициентите на еластичност и бета коефициентите.

Средният коефициент на еластичност E показва с какъв процент средно ще се промени резултатът в съвкупността приот средната му стойност при промяна на фактора хс 1% от средната му стойност.

Коефициентът на еластичност се намира по формулата:

Коефициентът на еластичност е по-малък от 1. Следователно, ако X се промени с 1%, Y ще се промени с по-малко от 1%. С други думи, влиянието на X върху Y не е значително.

Бета коефициент

Бета коефициентпоказва с каква част от стойността на стандартното си отклонение ще се промени средната стойност на получената характеристика, когато факторната характеристика се промени със стойността на стандартното си отклонение със стойността на останалите независими променливи, фиксирани на постоянно ниво:

Тези. увеличаването на x със стандартното отклонение S x ще доведе до намаляване на средната стойност на Y с 0,82 стандартно отклонение S y .

1.4. Грешка в приближението.

Нека оценим качеството на регресионното уравнение, като използваме грешката на абсолютното приближение. Средна грешка на приближаване - средно отклонение на изчислените стойности от действителните:

Грешка в приближението в рамките на 5%-7% показва добро съответствие на регресионното уравнение с оригиналните данни.

Тъй като грешката е по-малка от 7%, това уравнение може да се използва като регресия.

Линейната регресия се свежда до намиране на уравнение на формата

Първият израз позволява дадени стойности на фактора хизчислете теоретичните стойности на получената характеристика, като замените действителните стойности на фактора в нея х. В графиката теоретичните стойности лежат на права линия, която представлява линията на регресия.

Конструкцията на линейната регресия се свежда до оценка на нейните параметри - АИ b. Класическият подход за оценка на параметрите на линейната регресия се основава на метод на най-малките квадрати (LSM).

За да се намери минимумът, е необходимо да се изчислят частните производни на сумата (4) за всеки от параметрите - АИ b- и ги приравнете към нула.

(5)

Нека се трансформираме, получаваме система от нормални уравнения:

(6)

В тази система н-размер на извадката, сумите се изчисляват лесно от оригиналните данни. Решаваме системата по отношение на АИ b, получаваме:

(7)

. (8)

Израз (7) може да бъде записан в друга форма:

(9)

Където ковариация на признака, факторна дисперсия х.

Параметър bНаречен регресионен коефициент.Стойността му показва средната промяна в резултата с промяна на коефициента с една единица. Възможността за ясна икономическа интерпретация на регресионния коефициент е направена линейно уравнениерегресията е доста често срещана в иконометричните изследвания.

Формално а- значение гпри х=0.Ако хняма и не може да има нулева стойност, тогава тази интерпретация на свободния термин аняма смисъл. Параметър аможе да няма икономическо съдържание. Опитите за икономическо тълкуване могат да доведат до абсурд, особено когато а< 0. Интерпретировать можно лишь знак при параметре а.Ако а> 0, тогава относителната промяна в резултата настъпва по-бавно от промяната във фактора. Нека сравним тези относителни промени:

< при > 0, > 0

Понякога се записва линейно уравнение на регресия по двойки за отклонения от средната стойност:

Където , . В този случай свободният член е равен на нула, което е отразено в израз (10). Този факт следва от геометрични съображения: същата права линия (3) съответства на уравнението на регресията, но когато се оценява регресията в отклонения, началото на координатите се премества в точката с координати . В този случай в израз (8) и двете суми ще бъдат равни на нула, което ще доведе до равенство на свободния член на нула.

Нека разгледаме като пример функцията на разходите за група предприятия, произвеждащи един вид продукт



Таблица 1.

Продуктова продукция хиляди единици () Производствени разходи, милиона рубли ()
31,1
67,9
141,6
104,7
178,4
104,7
141,6
Общо: 22 770,0

Системата от нормални уравнения ще изглежда така:

Решавайки го, получаваме a= -5.79, b=36.84.

Регресионното уравнение е:

Заместване на стойностите в уравнението х, нека намерим теоретичните стойности г(последната колона на таблицата).

величина аняма икономически смисъл. Ако променливите хИ гизразено чрез отклонения от средните нива, тогава регресионната линия на графиката ще минава през началото на координатите. Оценката на регресионния коефициент няма да се промени:

, Където , .

Като друг пример, разгледайте функцията на потребление на формуляра:

,

където C е потреблението, г- доходи, К,Л-настроики. Това уравнение на линейна регресия обикновено се използва заедно с уравнението на баланса:

,

Където аз– размер на инвестицията, r- спестявания.

За простота приемете, че доходите се изразходват за потребление и инвестиции. Така се разглежда системата от уравнения:

Наличието на балансово равенство налага ограничения върху стойността на регресионния коефициент, който не може да бъде по-голям от единица, т.е. .

Да приемем, че функцията на потребление е:

.

Коефициентът на регресия характеризира склонността към потребление. Това показва, че от всяка хиляда рубли доход средно 650 рубли се изразходват за потребление, а 350 рубли. инвестирани. Ако изчислим регресията на размера на инвестицията върху дохода, т.е. , тогава регресионното уравнение ще бъде . Това уравнение не е необходимо да се дефинира, тъй като е получено от функцията на потреблението. Коефициентите на регресия на тези две уравнения са свързани с равенството:

Ако коефициентът на регресия се окаже по-голям от единица, тогава не само доходите, но и спестяванията се изразходват за потребление.



Коефициентът на регресия във функцията на потреблението се използва за изчисляване на множителя:

Тук м≈2,86, така че допълнителната инвестиция е 1 хил. Рубли. На дългосроченще доведе, при равни други условия, до допълнителен доход от 2,86 хиляди рубли.

При линейната регресия коефициентът на линейна корелация действа като индикатор за близостта на връзката r:

Стойностите му са в границите: . Ако b> 0, тогава кога b< 0 . Според примера това означава много тясна зависимост на производствените разходи от обема на продукцията.

За да оцените качеството на напасване на линейна функция, изчислете коефициент на детерминациякато квадрат на линейния корелационен коефициент r 2. Той характеризира дела на дисперсията на получената характеристика гобяснено чрез регресия в общата дисперсия на резултантния признак:

Стойността характеризира дела на дисперсията г, причинени от влиянието на други фактори, които не са взети предвид в модела.

В примера. Уравнението на регресията обяснява 98,2% от дисперсията, а други фактори представляват 1,8%, това е остатъчната дисперсия.

Предварителни условия на OLS (условия на Гаус-Марков)

Както бе споменато по-горе, връзката между гИ хпри двойната регресия не е функционална, а корелационна. Следователно оценките на параметрите аИ bса случайни променливи, чиито свойства значително зависят от свойствата на случайния компонент ε. За да се получат най-добри резултати с помощта на най-малките квадрати, трябва да бъдат изпълнени следните предпоставки по отношение на случайното отклонение (условия на Гаус-Марков):

1 0 . Очаквана стойностслучайното отклонение е нула за всички наблюдения: .

20. Дисперсията на случайните отклонения е постоянна: .

Осъществимостта на тази предпоставка се нарича хомоскедастизъм(постоянство на дисперсията на отклонението). Невъзможността на тази предпоставка се нарича хетероскедастичност(непостоянство на дисперсията на отклонението)

трийсет . Случайни отклонения εiИ ε jса независими един от друг за:

Осъществимостта на това условие се нарича липса на автокорелация.

4 0 . Случайната дисперсия трябва да е независима от обяснителните променливи.

Обикновено това условие се изпълнява автоматично, ако обяснителните променливи в даден модел не са случайни. В допълнение, осъществимостта на тази предпоставка за иконометричните модели не е толкова критична в сравнение с първите три.

Ако посочените предпоставки са изпълнени, тогава Теорема на Гаус-Маркова: Оценките (7) и (8), получени с помощта на OLS, имат най-малката вариация в класа на всички линейни безпристрастни оценки .

По този начин, ако са изпълнени условията на Гаус-Марков, оценките (7) и (8) са не само безпристрастни оценки на регресионните коефициенти, но и най-ефективните, т.е. имат най-малката дисперсия в сравнение с други оценки на тези параметри, които са линейни по отношение на стойностите y i.

Именно разбирането за важността на условията на Гаус-Марков отличава компетентния изследовател, използващ регресионен анализ, от некомпетентния. Ако тези условия не са изпълнени, изследователят трябва да е наясно с това. Ако е възможно коригиращо действие, тогава анализаторът трябва да може да го предприеме. Ако ситуацията не може да бъде коригирана, изследователят трябва да може да прецени колко сериозно това може да повлияе на резултатите.

За да предвидите с помощта на регресионно уравнение, трябва да изчислите регресионните коефициенти и уравнения. И тук има още един проблем, засягащ точността на прогнозата. Тя се крие във факта, че обикновено не всички възможни стойностипроменливи X и Y, т.е. генералната съвкупност на съвместното разпределение при проблемите с прогнозирането не е известна, известна е само извадка от тази генерална съвкупност. В резултат на това при прогнозиране, в допълнение към случайния компонент, възниква друг източник на грешки - грешки, причинени от непълно съответствие на извадката с генералната съвкупност и произтичащите от това грешки при определяне на коефициентите на регресионното уравнение.

С други думи, поради факта, че населението е неизвестно, точни стойностикоефициенти и регресионни уравнения не могат да бъдат определени. Използвайки извадка от тази неизвестна съвкупност, могат да се получат само оценки на истинските коефициенти и.

За да бъдат минимални грешките при прогнозиране в резултат на такава замяна, оценката трябва да се извърши по метод, който гарантира получените безпристрастни и ефективни стойности. Методът осигурява безпристрастни оценки, ако, когато се повтори няколко пъти с нови проби от същата популация, условието и е изпълнено. Методът осигурява ефективни оценки, ако при многократно повторение с нови проби от същата популация се осигури минималната дисперсия на коефициентите a и b, т.е. условия и са изпълнени.

В теорията на вероятностите е доказана теорема, според която ефективността и безпристрастните оценки на коефициентите на уравнението на линейната регресия въз основа на извадкови данни се осигуряват чрез прилагане на метода на най-малките квадрати.

Същността на метода на най-малките квадрати е следната. За всяка пробна точка се записва уравнение на формата . След това се открива грешката между изчислените и действителните стойности. Решение на оптимизационния проблем за намиране на такива стойности и които осигуряват минималната сума от квадратни грешки за всички n точки, т.е. решение на проблема с търсенето , дава безпристрастни и ефективни оценки на коефициентите и . За случая на сдвоена линейна регресия това решение има формата:

Трябва да се отбележи, че безпристрастните и ефективни оценки на истинските стойности на регресионните коефициенти за генералната съвкупност, получени по този начин от извадка, изобщо не гарантират срещу грешки, когато се прилагат еднократно. Гаранцията е, че в резултат на многократно повторение на тази операция с други проби от същата популация се гарантира по-малко количество грешки в сравнение с всеки друг метод и разпространението на тези грешки ще бъде минимално.

Получените коефициенти на регресионното уравнение определят позицията на регресионната линия, тя е главната ос на облака, образуван от точките на оригиналната проба. И двата коефициента имат много определено значение. Коефициентът показва стойността при , но в много случаи няма смисъл; освен това често също няма смисъл; следователно дадената интерпретация на коефициента трябва да се използва внимателно. По-универсално тълкуване на значението е следното. Ако , тогава относителната промяна в независимата променлива (процентна промяна) винаги е по-малка от относителната промяна в зависимата променлива.

Коефициентът показва колко единици ще се промени зависимата променлива, когато независимата променлива се промени с една единица. Коефициентът често се нарича коефициент на регресия, като се подчертава, че е по-важен от . По-специално, ако вместо стойностите на зависимите и независимите променливи вземем техните отклонения от техните средни стойности, тогава регресионното уравнение се трансформира във формата . С други думи, в трансформираната координатна система всяка регресионна линия минава през началото на координатите (фиг. 13) и няма коефициент.

Фигура 13. Позиция на регресионната зависимост в трансформираната координатна система.

Параметрите на регресионното уравнение ни казват как зависимите и независимите променливи са свързани една с друга, но не ни казват нищо за степента на близост на връзката, т.е. показва позицията на главната ос на облака от данни, но не казва нищо за степента на плътност на връзката (колко тесен или широк е облакът).

За териториите на областта са предоставени данни за 200Х.

Номер на региона Средна жизнена заплата на глава от населението на ден на един трудоспособен човек, rub., x Средна дневна заплата, rub., y
1 78 133
2 82 148
3 87 134
4 79 154
5 89 162
6 106 195
7 67 139
8 88 158
9 73 152
10 87 162
11 76 159
12 115 173

Упражнение:

1. Конструирайте корелационно поле и формулирайте хипотеза за формата на връзката.

2. Изчислете параметрите на уравнението на линейната регресия

4. Използвайки средния (общ) коефициент на еластичност, дайте сравнителна оценка на силата на връзката между фактора и резултата.

7. Изчислете прогнозната стойност на резултата, ако прогнозната стойност на фактора се увеличи с 10% от средното си ниво. Определете прогнозния доверителен интервал за нивото на значимост.

Решение:

Нека решим тази задачаизползвайки Excel.

1. Чрез сравняване на наличните данни x и y, например, класирането им в нарастващ ред на фактор x, може да се наблюдава наличието на пряка връзка между характеристиките, когато увеличаването на средния жизнен минимум на глава от населението увеличава среднодневния заплата. Въз основа на това можем да направим предположението, че връзката между характеристиките е пряка и може да бъде описана с уравнение на права линия. Същото заключение се потвърждава и от графичен анализ.

За да създадете корелационно поле, можете да използвате Excel PPP. Въведете първоначалните данни в последователност: първо x, след това y.

Изберете областта от клетки, която съдържа данни.

След това изберете: Вмъкване / Точков график / Точков график с маркерикакто е показано на фигура 1.

Фигура 1 Конструкция на корелационното поле

Анализът на корелационното поле показва наличието на близка до праволинейна зависимост, тъй като точките са разположени почти в права линия.

2. Да се ​​изчислят параметрите на уравнението на линейната регресия
Нека използваме вградената статистическа функция LINEST.

За това:

1) Отворете съществуващ файл, съдържащ анализираните данни;
2) Изберете област 5x2 от празни клетки (5 реда, 2 колони), за да покажете резултатите от регресионната статистика.
3) Активирайте Съветник за функции: в главното меню изберете Формули / Вмъкване на функция.
4) В прозореца Категорияприемате Статистически, в прозореца на функцията - LINEST. Щракнете върху бутона Добрекакто е показано на фигура 2;

Фигура 2 Диалогов прозорец на съветника за функции

5) Попълнете аргументите на функцията:

Известни стойности за

Известни стойности на x

Константа - булева стойност, което показва наличието или липсата на свободен член в уравнението; ако Constant = 1, тогава свободният член се изчислява по обичайния начин, ако Constant = 0, тогава свободният член е 0;

Статистика- логическа стойност, която показва дали да се покаже допълнителна информация за регресионния анализ или не. Ако Статистика = 1, тогава Допълнителна информациясе показва, ако статистика = 0, тогава се показват само оценки на параметрите на уравнението.

Щракнете върху бутона Добре;

Фигура 3 Диалогов прозорец за аргументи на функция LINEST

6) Първият елемент от финалната таблица ще се появи в горната лява клетка на избраната област. За да отворите цялата таблица, натиснете бутона , а след това към клавишната комбинация ++ .

Допълнителна регресионна статистика ще бъде изведена в реда, показан на следната диаграма:

Стойност на коефициента b Коефициент стойност
Стандартна грешка b Стандартна грешка a
Стандартна грешка y
F-статистика
Регресионна сума на квадратите

Фигура 4 Резултат от изчисляването на функцията LINEST

Получихме нивото на регресия:

Ние заключаваме: С увеличение на средния жизнен минимум на глава от населението с 1 rub. средната дневна заплата се увеличава средно с 0,92 рубли.

Означава 52% вариация заплати(y) се обяснява с изменението на фактора x - средния жизнен минимум на глава от населението, а 48% - с действието на други фактори, които не са включени в модела.

Използвайки изчисления коефициент на определяне, може да се изчисли коефициентът на корелация: .

Връзката се оценява като близка.

4. Използвайки средния (общ) коефициент на еластичност, определяме силата на влиянието на фактора върху резултата.

За уравнение на права линия определяме средния (общ) коефициент на еластичност, като използваме формулата:

Ще намерим средните стойности, като изберете областта от клетки с x стойности и изберете Формули / Автосума / Среднои ще направим същото със стойностите на y.

Фигура 5 Изчисляване на средните стойности на функцията и аргумент

Така, ако средната издръжка на живот на глава от населението се промени с 1% от средната си стойност, средната дневна заплата ще се промени средно с 0,51%.

Използване на инструмент за анализ на данни Регресияна разположение:
- резултати от регресионна статистика,
- резултати от дисперсионен анализ,
- резултати доверителни интервали,
- остатъци и графики за напасване на регресионна линия,
- остатъци и нормална вероятност.

Процедурата е следната:

1) проверете достъпа до Пакет за анализ. В главното меню изберете: Файл/Опции/Добавки.

2) В падащия списък контролИзбери предмет Excel добавкии натиснете бутона Отивам.

3) В прозореца Добавкипоставете отметка в квадратчето Пакет за анализи след това щракнете върху бутона Добре.

Ако Пакет за анализне е в списъка с полета Налични добавки, Натисни бутона Прегледза извършване на търсене.

Ако получите съобщение, че пакетът за анализ не е инсталиран на вашия компютър, щракнете даза да го инсталирате.

4) В главното меню изберете: Данни / Анализ на данни / Инструменти за анализ / Регресияи след това щракнете върху бутона Добре.

5) Попълнете диалоговия прозорец за входни и изходни параметри на данни:

Интервал на въвеждане Y- диапазон, съдържащ данни на резултатния атрибут;

Интервал на въвеждане X- диапазон, съдържащ данни за факторната характеристика;

Етикети- флаг, който показва дали първият ред съдържа имена на колони или не;

Константа - нула- флаг, показващ наличието или липсата на свободен член в уравнението;

Изходен интервал- достатъчно е да посочите горната лява клетка на бъдещия диапазон;

6) Нов работен лист - можете да зададете произволно име за новия лист.

След това щракнете върху бутона Добре.

Фигура 6 Диалогов прозорец за въвеждане на параметри за инструмента за регресия

Резултатите от регресионния анализ за данните за проблема са представени на фигура 7.

Фигура 7 Резултат от използването на инструмента за регресия

5. Нека да оценим използването средна грешкаапроксимационно качество на уравненията. Нека използваме резултатите от регресионния анализ, представен на фигура 8.

Фигура 8 Резултат от използването на инструмента за регресия „Изтегляне на остатъка“

Нека създадем нова таблица, както е показано на фигура 9. В колона C изчисляваме относителна грешкаприближение по формулата:

Фигура 9 Изчисляване на средната грешка на приближението

Средната грешка на приближението се изчислява по формулата:

Качеството на изработения модел се оценява като добро, тъй като не надвишава 8 - 10%.

6. От таблица c регресионна статистика(Фигура 4) записваме действителната стойност на F-теста на Фишер:

Тъй като при 5% ниво на значимост, тогава можем да заключим, че регресионното уравнение е значимо (връзката е доказана).

8. Оценяване статистическа значимостЩе извършим регресионни параметри, като използваме t-статистиката на Student и като изчислим доверителния интервал на всеки индикатор.

Излагаме хипотезата H 0 за статистически незначима разлика между показателите и нулата:

.

за броя на степените на свобода

Фигура 7 показва действителните t-статистически стойности:

T-тестът за корелационния коефициент може да се изчисли по два начина:

Метод I:

Където - случайна грешка на коефициента на корелация.

Ще вземем данните за изчисление от таблицата на фигура 7.

Метод II:

Действителните t-статистически стойности надвишават стойностите на таблицата:

Следователно хипотезата H 0 се отхвърля, т.е. регресионните параметри и корелационният коефициент не се различават от нула случайно, а са статистически значими.

Доверителният интервал за параметър a се определя като

За параметър a границите от 95%, както е показано на фигура 7, бяха:

Доверителният интервал за регресионния коефициент се определя като

За коефициента на регресия b границите от 95%, както е показано на фигура 7, са:

Анализът на горната и долната граница на доверителните интервали води до заключението, че с вероятност параметрите a и b, намирайки се в зададените граници, не приемат нулеви стойности, т.е. не са статистически незначими и значително различни от нула.

7. Получените оценки на регресионното уравнение позволяват то да се използва за прогнозиране. Ако прогнозираните разходи за живот са:

Тогава прогнозната стойност на разходите за живот ще бъде:

Изчисляваме грешката на прогнозата по формулата:

Където

Ние също така ще изчислим дисперсията с помощта на Excel PPP. За това:

1) Активирайте Съветник за функции: в главното меню изберете Формули / Вмъкване на функция.

3) Попълнете диапазона, съдържащ числените данни на факторната характеристика. Кликнете Добре.

Фигура 10 Изчисляване на дисперсията

Получихме стойността на дисперсията

За да изчислим остатъчната дисперсия за степен на свобода, ще използваме резултатите от анализа на дисперсията, както е показано на фигура 7.

Доверителните интервали за прогнозиране на индивидуални стойности на y с вероятност от 0,95 се определят от израза:

Интервалът е доста широк, най-вече поради малкия обем на наблюденията. Като цяло прогнозата за средната месечна работна заплата се оказа достоверна.

Условието на задачата е взето от: Workshop on econometrics: Proc. помощ / I.I. Елисеева, С.В. Куришева, Н.М. Гордеенко и др.; Изд. И.И. Елисеева. - М.: Финанси и статистика, 2003. - 192 с.: ил.



Ново в сайта

>

Най - известен