Додому Гігієна Оцінка параметрів регресійного рівняння. Оцінка параметрів лінійної регресії

Оцінка параметрів регресійного рівняння. Оцінка параметрів лінійної регресії

Рівняння регресії завжди доповнюється показником тісноти зв'язку. При використанні лінійної регресіїяк такий показник виступає лінійний коефіцієнт кореляції r yt . Існують різні модифікації формули лінійного коефіцієнтакореляції.

Слід пам'ятати, що величина лінійного коефіцієнта кореляції оцінює тісноту зв'язку аналізованих ознак її лінійної формі. Тому близькість абсолютної величинилінійного коефіцієнта кореляції до нуля ще означає відсутність зв'язку між ознаками.

Для оцінки якості підбору лінійної функціїрозраховується квадрат лінійного коефіцієнта кореляції r yt 2, званий коефіцієнтом детермінації. p align="justify"> Коефіцієнт детермінації характеризує частку дисперсії результативної ознаки у t, що пояснюється регресією, в загальній дисперсії результативної ознаки.

Рівняння нелінійної регресії, як і лінійної залежності, Доповнюється показником кореляції, а саме індексом кореляції R.

Парабола другого порядку, як і поліном більше високого порядку, при ліанеризації набуває вигляду рівняння множинної регресії. Якщо ж нелінійне щодо пояснюваної змінної рівняннярегресії при лінеаризації приймає форму лінійного рівняння парної регресії, то для оцінки тісноти зв'язку може бути використаний лінійний коефіцієнт кореляції, величина якого в цьому випадку збігається з індексом кореляції.

Інша справа, коли перетворення рівняння в лінійну форму пов'язані із залежною змінною. У цьому випадку лінійний коефіцієнт кореляції за перетвореними значеннями ознак дає лише наближену оцінку тісноти зв'язку та чисельно не збігається з індексом кореляції. Так, для статечної функції

після переходу до логарифмічно лінійного рівняння

lny = lna + blnx

може бути знайдений лінійний коефіцієнт кореляції задля фактичних значень змінних х і у, а їх логарифмів, тобто r lnylnx . Відповідно квадрат його значення характеризуватиме відношення факторної суми квадратів відхилень до загальної, але не для у, а для його логарифмів:

Тим часом при розрахунку індексу кореляції використовуються суми квадратів відхилень ознаки у, а чи не їх логарифмів. З цією метою визначаються теоретичні значення результативної ознаки, тобто як антилогарифм розрахованої за рівнянням величини і залишкова сума квадратів як.

У знаменнику розрахунку R 2 yx бере участь загальна сума квадратів відхилень фактичних значень від їх середньої величини, а в розрахунку r 2 lnxlny бере участь. Відповідно розрізняються чисельники та знаменники аналізованих показників:

  • - в індексі кореляції та
  • - у коефіцієнті кореляції.

Внаслідок близькості результатів та простоти розрахунків з використанням комп'ютерних програм для характеристики тісноти зв'язку з нелінійних функцій широко використовується лінійний коефіцієнт кореляції.

Незважаючи на близькість значень R і r або R і r в нелінійних функціях з перетворенням значення ознаки, слід пам'ятати, що якщо при лінійній залежності ознак один і той же коефіцієнт кореляції характеризує регресію, як слід пам'ятати, що якщо при лінійній залежності ознак один і той самий коефіцієнт кореляції характеризує регресію як, і, оскільки, то при криволінійної залежності функції y=j(x) не дорівнює регресії x=f(y).

Оскільки в розрахунку індексу кореляції використовується співвідношення факторної та загальної сумиквадратів відхилень, має той самий сенс, як і коефіцієнт детермінації. У спеціальних дослідженнях величину нелінійних зв'язків називають індексом детермінації.

Оцінка суттєвості індексу кореляції проводиться, як і і оцінка надійності коефіцієнта кореляції.

Індекс кореляції використовується для перевірки суттєвості загалом рівняння нелінійної регресії за F-критерієм Фішера.

Величина m характеризує число ступенів свободи для факторної суми квадратів, а (n – m – 1) – число ступенів свободи для залишкової суми квадратів.

Для статечної функції m = 1 і формула F - критерію набуде того ж вигляду, що і при лінійній залежності:

Для параболи другого ступеня

y = a 0 + a 1 x + a 2 x 2 +еm = 2

Розрахунок F-критерію можна вести і в таблиці дисперсійного аналізурезультати регресії, як це було показано для лінійної функції.

Індекс детермінації можна порівнювати з коефіцієнтом детермінації для обґрунтування можливості застосування лінійної функції. Чим більша кривизна лінії регресії, тим величина коефіцієнта детермінації менша за індекс детермінації. Близькість цих показників означає, що не потрібно ускладнювати форму рівняння регресії і можна використовувати лінійну функцію.

Практично, якщо величина різниці між індексом детермінації та коефіцієнтом детермінації не перевищує 0,1, то припущення про лінійну форму зв'язку вважається виправданим.

Якщо t факт t табл, то відмінності між аналізованими показниками кореляції істотні і заміна нелінійної регресії рівнянням лінійної функції неможлива. Фактично, якщо величина t< 2, то различия между R yx и r yx несущественны, и, следовательно, возможно применение линейной регрессии, даже если есть предположения о некоторой нелинейности рассматриваемых соотношений признаков фактора и результата.

Кореляційний аналіз.

Рівняння парної регресії.

Використання графічного методу.

Цей метод застосовують для наочного зображення форми зв'язку між економічними показниками, що вивчаються. Для цього у прямокутній системі координат будують графік, по осі ординат відкладають індивідуальні значення результативної ознаки Y, а по осі абсцис - індивідуальні значення факторної ознаки X.

Сукупність точок результативної та факторної ознак називається полем кореляції.

З поля кореляції можна висунути гіпотезу (для генеральної сукупності) про те, що зв'язок між усіма можливими значеннями X та Y носить лінійний характер.

Лінійне рівняння регресії має вигляд y = bx + a + ε

Тут - випадкова помилка (відхилення, обурення).

Причини існування випадкової помилки:

1. Невключення до регресійної моделі значних пояснюючих змінних;

2. Агрегування змінних. Наприклад, функція сумарного споживання – це спроба загального виразусукупності рішень окремих індивідів про витрати. Це лише апроксимація окремих співвідношень, які мають різні параметри.

3. Неправильний опис структури моделі;

4. Неправильна функціональна специфікація;

5. Помилки виміру.

Оскільки відхилення ε i кожного конкретного спостереження i – випадкові та його значення у вибірці невідомі, то:

1) за спостереженнями x i та y i можна отримати лише оцінки параметрів α та β

2) Оцінками параметрів α та β регресійної моделіє відповідно величини і b, які мають випадковий характер, т.к. відповідають випадковій вибірці;

Тоді оцінне рівняння регресії (побудоване за вибірковими даними) матиме вигляд y = bx + a + ε, де e i – значення (оцінки) помилок ε i , що спостерігаються, а і b відповідно оцінки параметрів α і β регресійної моделі, які слід знайти.

Для оцінки параметрів і - використовують МНК (метод найменших квадратів). Метод найменших квадратівдає найкращі (заможні, ефективні та незміщені) оцінки параметрів рівняння регресії.

Але тільки в тому випадку, якщо виконуються певні передумови щодо випадкового члена (ε) та незалежної змінної (x).

Формально критерій МНК можна записати так:

S = ∑(y i - y * i) 2 → min

Система звичайних рівнянь.

a n + b∑x = ∑y

a∑x + b∑x 2 = ∑y x

Для наших даних система рівнянь має вигляд

15a + 186.4 b = 17.01

186.4 a + 2360.9 b = 208.25

З першого рівняння виражаємо аі підставимо на друге рівняння:

Отримуємо емпіричні коефіцієнти регресії: b = -0.07024, a = 2.0069

Рівняння регресії (емпіричне рівняння регресії):

y = -0.07024 x + 2.0069

Емпіричні коефіцієнти регресії aі bє лише оцінками теоретичних коефіцієнтів β i , а саме рівняння відображає лише загальну тенденцію в поведінці змінних, що розглядаються.

Для розрахунку параметрів регресії збудуємо розрахункову таблицю (табл. 1)

1. Параметри рівняння регресії.

Вибіркові середні.

Вибіркові дисперсії:

Середньоквадратичне відхилення

1.1. Коефіцієнт кореляції

Коваріація.

Розраховуємо показник тісноти зв'язку. Таким показником є ​​вибірковий лінійний коефіцієнт кореляції, який розраховується за такою формулою:

Лінійний коефіцієнт кореляції набуває значення від –1 до +1.

Зв'язки між ознаками можуть бути слабкими та сильними (тісними). Їхні критерії оцінюються за шкалою Чеддока:

0.1 < r xy < 0.3: слабая;

0.3 < r xy < 0.5: умеренная;

0.5 < r xy < 0.7: заметная;

0.7 < r xy < 0.9: высокая;

0.9 < r xy < 1: весьма высокая;

У нашому прикладі зв'язок між ознакою Y фактором X висока та зворотна.

Крім того, коефіцієнт лінійної парної кореляції може бути визначений через коефіцієнт регресії b:

1.2. Рівняння регресії(Оцінка рівняння регресії).

Лінійне рівняння регресії має вигляд y = -0.0702 x + 2.01

Коефіцієнтам рівняння лінійної регресії можна надати економічний сенс.

p align="justify"> Коефіцієнт регресії b = -0.0702 показує середня зміна результативного показника (в одиницях вимірювання у) з підвищенням або зниженням величини фактора х на одиницю його вимірювання. У цьому прикладі із збільшенням на 1 одиницю y знижується загалом на -0.0702.

Коефіцієнт a = 2.01 формально показує прогнозований рівень у, але у разі, якщо х=0 перебуває близько з вибірковими значеннями.

Але якщо х=0 знаходиться далеко від вибіркових значень х, то буквальна інтерпретація може призвести до невірних результатів, і навіть якщо лінія регресії досить точно описує значення вибірки, що спостерігається, немає гарантій, що також буде при екстраполяції вліво або вправо.

Підставивши в рівняння регресії відповідні значення x, можна визначити вирівняні (передбачені) значення результативного показника y(x) для кожного спостереження.

Зв'язок між у них визначає знак коефіцієнта регресії b (якщо > 0 - прямий зв'язок, інакше - зворотний). У нашому прикладі зв'язок зворотний.

1.3. Коефіцієнт еластичності.

Коефіцієнти регресії (у прикладі b) небажано використовувати для безпосередньої оцінки впливу факторів на результативну ознаку в тому випадку, якщо існує відмінність одиниць вимірювання результативного показника у факторної ознаки х.

З цією метою обчислюються коефіцієнти еластичності і бета - коефіцієнти.

Середній коефіцієнт еластичності E показує, наскільки відсотків у середньому за сукупністю зміниться результат увід своєї середньої величини за зміни фактора xна 1% від середнього значення.

Коефіцієнт еластичності знаходиться за формулою:

p align="justify"> Коефіцієнт еластичності менше 1. Отже, при зміні Х на 1%, Y зміниться менш ніж на 1%. Іншими словами - вплив Х на Y не суттєво.

Бета – коефіцієнт

Бета – коефіцієнтпоказує, яку частину величини свого середнього квадратичного відхилення зміниться у середньому значення результативного ознаки при зміні факторного ознаки на величину його середньоквадратичного відхилення при фіксованому постійному значенні інших незалежних змінних:

Тобто. збільшення x на величину середньоквадратичного відхилення S x призведе до зменшення середнього значення Y на 0.82 середньоквадратичного відхилення S y.

1.4. Помилка апроксимації.

Оцінимо якість рівняння регресії за допомогою помилки абсолютної апроксимації. Середня помилка апроксимації - середнє відхилення розрахункових значень від фактичних:

Помилка апроксимації в межах 5%-7% свідчить про хороший вибір рівняння регресії до вихідних даних.

Оскільки помилка менше 7%, то дане рівняння можна використовувати як регресію.

Лінійна регресія зводиться до знаходження рівняння виду

Перше вираз дозволяє за заданими значеннями фактора xрозрахувати теоретичні значення результативної ознаки, підставляючи в нього фактичні значення фактора x. На графіку теоретичні значення лежать на прямій, яка є лінією регресії.

Побудова лінійної регресії зводиться до оцінки її параметрів. аі b. Класичний підхід до оцінювання параметрів лінійної регресії заснований на метод найменших квадратів (МНК).

Для знаходження мінімуму треба обчислити приватні похідні суми (4) за кожним із параметрів - аі b- І прирівняти їх до нуля.

(5)

Перетворюємо, отримуємо систему нормальних рівнянь:

(6)

У цій системі n-обсяг вибірки, суми легко розраховуються із вихідних даних. Вирішуємо систему щодо аі b, отримуємо:

(7)

. (8)

Вираз (7) можна записати в іншому вигляді:

(9)

де коваріація ознак, дисперсія фактора x.

Параметр bназивається коефіцієнтом регресії.Його величина показує середню зміну результату із зміною фактора на одну одиницю. Можливість чіткої економічної інтерпретації коефіцієнта регресії зробила лінійне рівняннярегресії є досить поширеним в економетричних дослідженнях.

Формально a- значення yпри x = 0.Якщо xне має і не може мати нульового значення, то таке трактування вільного члена aне має сенсу. Параметр aможе мати економічного змісту. Спроби економічно інтерпретувати його можуть призвести до абсурду, особливо при a< 0. Интерпретировать можно лишь знак при параметре a.Якщо a> 0, відносна зміна результату відбувається повільніше, ніж зміна фактора. Порівняємо ці відносні зміни:

< при > 0, > 0

Іноді лінійне рівняння парної регресії записують для відхилень від середніх значень:

де , . У цьому вільний член дорівнює нулю, як і відбито у виразі (10). Цей факт випливає з геометричних міркувань: рівняння регресії відповідає та ж пряма (3), але в оцінці регресії в відхиленнях початок координат переміщається в точку з координатами . При цьому у виразі (8) обидві суми дорівнюватимуть нулю, що і спричинить рівність нуля вільного члена.

Розглянемо як приклад по групі підприємств, що випускають один вид продукції, функцію витрат



Табл. 1.

Випуск продукції тис. од. () Витрати виробництво, млн.руб.()
31,1
67,9
141,6
104,7
178,4
104,7
141,6
Разом: 22 770,0

Система нормальних рівнянь матиме вигляд:

Вирішуючи її, отримуємо a = -5,79, b = 36,84.

Рівняння регресії має вигляд:

Підставивши в рівняння значення х, знайдемо теоретичні значення y(Остання колонка таблиці).

Величина aнемає економічного сенсу. Якщо змінні xі yвисловити через відхилення від середніх рівнів, то лінія регресії на графіку пройде через початок координат. Оцінка коефіцієнта регресії у своїй не зміниться:

де , .

Як інший приклад розглянемо функцію споживання як:

,

де С-споживання, y-дохід, K,L-параметри. Дане рівняння лінійної регресії зазвичай використовується у зв'язку з балансовою рівністю:

,

де I- Розмір інвестицій, r- Заощадження.

Для простоти припустимо, що дохід витрачається споживання та інвестиції. Таким чином, розглядається система рівнянь:

Наявність балансової рівності накладає обмеження на величину коефіцієнта регресії, яка може бути більше одиниці, тобто. .

Припустимо, що функція споживання становила:

.

Коефіцієнт регресії характеризує схильність до споживання. Він показує, що з кожної тисячі карбованців доходу споживання витрачається загалом 650 крб., а 350 крб. інвестується. Якщо розрахувати регресію обсягу інвестицій від доходу, тобто. , то рівняння регресії становитиме . Це рівняння можна і не визначати, оскільки воно виводиться із функції споживання. Коефіцієнти регресії цих двох рівнянь пов'язані рівністю:

Якщо коефіцієнт регресії виявляється більше одиниці, то , і споживання витрачаються як доходи, а й заощадження.



Коефіцієнт регресії функції споживання використовується для розрахунку мультиплікатора:

Тут m≈2,86, тому додаткові вкладення 1 тис. крб. на довгий термінприведуть за інших рівних умов додаткового доходу 2,86 тис. крб.

При лінійній регресії як показник тісноти зв'язку виступає лінійний коефіцієнт кореляції r:

Його значення перебувають у межах: . Якщо b> 0, то при b< 0 . За даними прикладу , що означає дуже тісну залежність витрат за виробництво від величини обсягу своєї продукції.

Для оцінки якості підбору лінійної функції розраховується коефіцієнт детермінаціїяк квадрат лінійного коефіцієнта кореляції r 2. Він характеризує частку дисперсії результативної ознаки y, що пояснюється регресією, у загальній дисперсії результативної ознаки:

Розмір характеризує частку дисперсії y, Викликану впливом інших, не врахованих у моделі факторів.

У прикладі. Рівнянням регресії пояснюється 98,2% дисперсії, але в інші чинники припадає 1,8%, це залишкова дисперсія.

Передумови МНК (умови Гауса-Маркова)

Як було сказано вище, зв'язок між yі xу парній регресії не функціональної, а кореляційної. Тому оцінки параметрів aі bє випадковими величинамивластивості яких істотно залежать від властивостей випадкової складової ε. Для отримання МНК найкращих результатів необхідно виконання наступних передумов щодо випадкового відхилення (умови Гауса – Маркова):

1 0 . Математичне очікуваннявипадкового відхилення дорівнює нулю всім спостережень: .

2 0 . Дисперсія випадкових відхилень стала: .

Виконаність цієї причини називається гомоскедастичністю(Постійністю дисперсії відхилень). Нездійсненність цієї причини називається гетероскедастичністю(незмінністю дисперсії відхилень)

3 0 . Випадкові відхилення ε iі ε jє незалежними один від одного для:

Виконання цієї умови називається відсутністю автокореляції.

4 0 . Випадкове відхилення має бути незалежно від змінних, що пояснюють.

Зазвичай ця умова виконується автоматично, якщо пояснюючі змінні цієї моделі є випадковими. З іншого боку, здійсненність цієї передумови для економетричних моделей менш критична проти першими трьома.

При здійсненності зазначених передумов має місце теорема Гауса-Маркова: оцінки (7) та (8), отримані за МНК, мають найменшу дисперсію у класі всіх лінійних незміщених оцінок .

Отже, і під час умов Гаусса-Маркова оцінки (7) і (8) не лише несмещенными оцінками коефіцієнтів регресії, а й найефективнішими, тобто. мають найменшу дисперсію порівняно з будь-якими іншими оцінками даних параметрів, лінійними щодо величин y i.

Саме розуміння важливості умов Гаусса-Маркова відрізняє компетентного дослідника, який використовує регресійний аналіз від некомпетентного. Якщо ці умови не виконані, дослідник має це усвідомлювати. Якщо коригувальні дії можливі, то аналітик має бути спроможним їх виконати. Якщо ситуацію виправити неможливо, дослідник може бути здатний оцінити, наскільки серйозно це може вплинути на результати.

Для прогнозування за допомогою рівняння регресії необхідно обчислити коефіцієнти та рівняння регресії. І тут існує ще одна проблема, що позначається на точності прогнозування. Вона полягає в тому, що зазвичай немає всіх можливих значеньзмінних Х та У, тобто. генеральна сукупність спільного розподілу завдання прогнозування не відома, відома лише вибірка з цієї генеральної сукупності. В результаті цього при прогнозуванні крім випадкової складової виникає ще одне джерело помилок - помилки, викликані не повною відповідністю вибірки генеральної сукупності і похибками, що породжуються цим, у визначенні коефіцієнтів рівняння регресії.

Іншими словами внаслідок того, що генеральна сукупність не відома, точні значеннякоефіцієнтів та рівняння регресії визначити неможливо. Використовуючи вибірку з цієї невідомої генеральної сукупності можна лише отримати оцінки та справжніх коефіцієнтів.

Для того, щоб помилки прогнозування в результаті такої заміни були мінімальними, оцінку необхідно здійснювати методом, який гарантує незміщеність та ефективність отриманих значень. Метод забезпечує незміщені оцінки, якщо при неодноразовому його повторенні з новими вибірками з однієї й тієї ж генеральної сукупності забезпечується виконання умов і . p align="justify"> Метод забезпечує ефективні оцінки, якщо при неодноразовому його повторенні з новими вибірками з однієї і тієї ж генеральної сукупності забезпечується мінімальна дисперсія коефіцієнтів a і b, тобто. виконуються умови та .

Теорема ймовірності доведена теорема згідно з якою ефективність і несмещенность оцінок коефіцієнтів рівняння лінійної регресії за даними вибірки забезпечується при застосуванні методу найменших квадратів.

Суть методу найменших квадратів ось у чому. Для кожної з точок вибірки записуються рівняння виду . Потім знаходяться помилка між розрахунковим та фактичним значеннями. Розв'язання оптимізаційної задачі знаходження таких значень і які забезпечують мінімальну суму квадратів помилок всім n точок, тобто. вирішення задачі пошуку , дає незміщені та ефективні оцінки коефіцієнтів та . Для випадку парної лінійної регресії це рішення має вигляд:

Слід зазначити, що отримані таким чином за вибіркою незміщені та ефективні оцінки справжніх значень коефіцієнтів регресії для генеральної сукупності не гарантують від помилки при одноразовому застосуванні. Гарантія полягає в тому, що в результаті багаторазового повторення цієї операції з іншими вибірками з тієї ж генеральної сукупності гарантована менша сума помилок порівняно будь-яким іншим способом і розкид цих помилок буде мінімальним.

Отримані коефіцієнти рівняння регресії визначають положення регресійної прямої, вона є головною віссю хмари, утвореної точками вихідної вибірки. Обидва коефіцієнти мають цілком певний зміст. Коефіцієнт показує значення при , але в багатьох випадках не має сенсу, крім того часто також не має сенсу, тому наведеним трактуванням коефіцієнта потрібно користуватися обережно. Більш універсальне трактування сенсу у наступному. Якщо , то відносна зміна незалежної змінної (зміна у відсотках) завжди менша ніж відносна зміна залежної змінної.

Коефіцієнт показує, наскільки одиниць зміниться залежна змінна при зміні незалежної змінної на одну одиницю. Коефіцієнт часто називають коефіцієнтом регресії підкреслюючи цим, що він важливіший ніж . Зокрема, якщо замість значень залежної та незалежної змінних взяти їх відхилення від своїх середніх значень, то рівняння регресії перетворюється на вигляд . Іншими словами, у системі перетворених координат будь-яка лінія регресії проходить через початок координат (рис 13) і коефіцієнт відсутній.

Рис 13. Положення регресійної залежності у системі перетворених координат.

Параметри рівняння регресії свідчать, як пов'язані між собою залежна і незалежна змінна, але нічого не говорять про ступінь тісноти зв'язку, тобто. показують положення головної осі хмари даних, але не нічого не говорить про ступінь тісноти зв'язку (наскільки вузько або широко хмара).

Територіями регіону наводяться дані за 200Х р.

Номер регіону Середньодушовий прожитковий мінімум на день одного працездатного, руб., х Середньоденна заробітна плата, руб., у
1 78 133
2 82 148
3 87 134
4 79 154
5 89 162
6 106 195
7 67 139
8 88 158
9 73 152
10 87 162
11 76 159
12 115 173

Завдання:

1. Побудуйте поле кореляції та сформулюйте гіпотезу про форму зв'язку.

2. Розрахуйте параметри рівняння лінійної регресії

4. Дайте за допомогою середнього (загального) коефіцієнта еластичності порівняльну оцінку сили зв'язку фактора із результатом.

7. Розрахуйте прогнозне значення результату, якщо прогнозне значення фактора збільшиться на 10% його середнього рівня. Визначте довірчий інтервал прогнозу рівня значущості .

Рішення:

Вирішимо дане завданняза допомогою Excel.

1. Зіставивши наявні дані х і у, наприклад, ранжирувавши їх у порядку зростання фактора х, можна спостерігати наявність прямої залежності між ознаками, коли збільшення середньодушового прожиткового мінімуму збільшує середньоденну заробітну плату. Виходячи з цього, можна зробити припущення, що зв'язок між ознаками прямий і його можна описати рівнянням прямий. Той самий висновок підтверджується і основі графічного аналізу.

Щоб побудувати поле кореляції, можна скористатися ППП Excel. Введіть вихідні дані у послідовності: спочатку х, потім у.

Виділіть область клітинок, що містить дані.

Потім оберіть: Вставка / Точкова діаграма / Точкова з маркерамияк показано малюнку 1.

Малюнок 1 Побудова поля кореляції

Аналіз поля кореляції показує наявність близької прямолінійної залежності, оскільки точки розташовані практично по прямій лінії.

2. Для розрахунку параметрів рівняння лінійної регресії
скористаємося вбудованою статистичною функцією Лінейн.

Для цього:

1) Відкрийте існуючий файл, що містить дані, що аналізуються;
2) Виділіть область порожніх осередків 5×2 (5 рядків, 2 стовпці) для виведення результатів регресійної статистики.
3) Активізуйте Майстер функцій: у головному меню виберіть Формули / Вставити функцію.
4) У вікні Категоріяви берете Статистичні, у вікні функція - Лінейн. Клацніть по кнопці ОКяк показано на малюнку 2;

Рисунок 2 Діалогове вікно «Майстер функцій»

5) Заповніть аргументи функції:

Відомі значення у

Відомі значення х

Константа - логічне значення, що вказує на наявність або відсутність вільного члена в рівнянні; якщо Константа = 1, вільний член розраховується звичайним чином, якщо Константа = 0, то вільний член дорівнює 0;

Статистика- логічне значення, яке вказує, виводити додаткову інформацію щодо регресійного аналізу чи ні. Якщо Статистика = 1, то додаткова інформаціявиводиться, якщо Статистика = 0, виводяться лише оцінки параметрів рівняння.

Клацніть по кнопці ОК;

Рисунок 3 Діалогове вікно аргументів функції ЛІНІЙН

6) У лівому верхньому осередку виділеної області з'явиться перший елемент підсумкової таблиці. Щоб розкрити всю таблицю, натисніть клавішу , а потім на комбінацію клавіш ++ .

Додаткова регресійна статистика буде виводитись у порядку, зазначеному в наступній схемі:

Значення коефіцієнта b Значення коефіцієнта a
Стандартна помилка b Стандартна помилка a
Стандартна помилка y
F-статистика
Регресійна сума квадратів

Рисунок 4 Результат обчислення функції ЛІНІЙН

Набули рівняння регресії:

Робимо висновок: Зі збільшенням середньодушового прожиткового мінімуму на 1 руб. середньоденна вести збільшується загалом на 0,92 крб.

Це означає, що 52% варіації заробітної плати(у) пояснюється варіацією фактора х – середньодушового прожиткового мінімуму, а 48% – дією інших факторів, не включених до моделі.

За обчисленим коефіцієнтом детермінації можна розрахувати коефіцієнт кореляції: .

Зв'язок оцінюється як тісний.

4. За допомогою середнього (загального) коефіцієнта еластичності визначимо силу впливу фактора на результат.

Для рівняння прямий середній (загальний) коефіцієнт еластичності визначимо за такою формулою:

Середні значення знайдемо, виділивши область осередків зі значеннями х, і виберемо Формули / Автосума / Середнє, і те саме зробимо зі значеннями у.

Рисунок 5 Розрахунок середніх значень функції та аргумент

Таким чином, за зміни середньодушового прожиткового мінімуму на 1% від свого середнього значення середньоденна заробітна плата зміниться в середньому на 0,51%.

За допомогою інструмента аналізу даних Регресіяможна отримати:
- результати регресійної статистики,
- результати дисперсійного аналізу,
- результати довірчих інтервалів,
- залишки та графіки підбору лінії регресії,
- залишки та нормальну ймовірність.

Порядок дій наступний:

1) перевірте доступ до Пакету аналізу. У головному меню виберіть: Файл/Параметри/Надбудови.

2) У списку, що розкривається Управліннявиберіть пункт Надбудови Excelта натисніть кнопку Перейти.

3) У вікні Надбудовивстановіть прапорець Пакет аналізу, а потім натисніть кнопку ОК.

Якщо Пакет аналізувідсутня у списку поля Доступні надбудови, натисніть кнопку Огляд, щоб здійснити пошук.

Якщо відображається повідомлення про те, що пакет аналізу не встановлено на комп'ютері, натисніть кнопку Так, щоб встановити його.

4) У головному меню послідовно виберіть: Дані / Аналіз даних / Інструменти аналізу / Регресія, а потім натисніть кнопку ОК.

5) Заповніть діалогове вікно введення даних та параметрів виведення:

Вхідний інтервал Y- Діапазон, що містить дані результативної ознаки;

Вхідний інтервал X- Діапазон, що містить дані факторної ознаки;

Мітки- прапорець, який вказує, чи містить перший рядок назви стовпців чи ні;

Константа - нуль- Прапорець, що вказує на наявність або відсутність вільного члена у рівнянні;

Вихідний інтервал- Досить вказати ліву верхню комірку майбутнього діапазону;

6) Новий робочий лист – можна задати довільне ім'я нового листа.

Потім натисніть кнопку ОК.

Рисунок 6 Діалогове вікно введення параметрів інструменту Регресія

Результати регресійного аналізу даних завдань представлені малюнку 7.

Рисунок 7 Результат застосування інструменту регресія

5. Оцінимо за допомогою середньої помилкиапроксимації якість рівнянь. Скористаємося результатами регресійного аналізу, представленого на Рисунку 8.

Рисунок 8 Результат застосування інструменту регресія «Виведення залишку»

Складемо нову таблицю як показано малюнку 9. У графі З розрахуємо відносну помилкуапроксимації за формулою:

Рисунок 9 Розрахунок середньої помилки апроксимації

Середня помилка апроксимації розраховується за формулою:

Якість побудованої моделі оцінюється як хороша, тому що не перевищує 8 – 10%.

6. З таблиці з регресійною статистикою(Малюнок 4) випишемо фактичне значення F-критерію Фішера:

Оскільки при 5%-ном рівні значимості, можна дійти невтішного висновку про значимість рівняння регресії (зв'язок доведено).

8. Оцінку статистичної значимостіпараметрів регресії проведемо за допомогою t-статистики Стьюдента та шляхом розрахунку довірчого інтервалу кожного з показників.

Висуваємо гіпотезу Н 0 про статистично незначну відмінність показників від нуля:

.

для числа ступенів свободи

На малюнку 7 є фактичні значення t-статистики:

t-критерій для коефіцієнта кореляції можна розрахувати двома способами:

I спосіб:

де - Випадкова помилка коефіцієнта кореляції.

Дані для розрахунку візьмемо з таблиці на малюнку 7.

II спосіб:

Фактичні значення t-статистики перевищують табличні значення:

Тому гіпотеза Н 0 відхиляється, тобто параметри регресії та коефіцієнт кореляції не випадково відрізняються від нуля, а статистично значущі.

Довірчий інтервал для параметра a визначається як

Для параметра a 95% межі як показано на малюнку 7 склали:

Довірчий інтервал для коефіцієнта регресії визначається як

Для коефіцієнта регресії b 95% межі як показано на малюнку 7 склали:

Аналіз верхньої та нижньої меж довірчих інтервалів призводить до висновку про те, що з ймовірністю параметри a і b, перебуваючи у зазначених межах, не набувають нульових значень, тобто. є статистично незначущими і істотно відмінні від нуля.

7. Отримані оцінки рівняння регресії дають змогу використовувати його для прогнозу. Якщо прогнозне значення прожиткового мінімуму становитиме:

Тоді прогнозне значення прожиткового мінімуму становитиме:

Помилку прогнозу розрахуємо за такою формулою:

де

Дисперсію вважатимемо також за допомогою ППП Excel. Для цього:

1) Активізуйте Майстер функцій: у головному меню виберіть Формули / Вставити функцію.

3) Заповніть діапазон, що містить числові дані факторної ознаки. Натисніть ОК.

Рисунок 10 Розрахунок дисперсії

Набули значення дисперсії

Для підрахунку залишкової дисперсії на один ступінь свободи скористаємося результатами дисперсійного аналізу, як показано на Рисунку 7.

Довірчі інтервали прогнозу індивідуальних значень у при ймовірності 0,95 визначаються виразом:

Інтервал досить широкий, передусім, рахунок малого обсягу спостережень. Загалом виконаний прогноз середньомісячної заробітної плати виявився надійним.

Умову задачі взято з: Практикум з економетрики: Навч. посібник/І.І. Єлісєєва, С.В. Куришева, Н.М. Гордєєнко та ін; За ред. І.І. Єлісєєвої. – М.: Фінанси та статистика, 2003. – 192 с.: іл.



Нове на сайті

>

Найпопулярніше