У дома Детска стоматология За тестване на статистическата значимост се използва регресионно уравнение. Оценяване на значимостта на регресионното уравнение и неговите коефициенти

За тестване на статистическата значимост се използва регресионно уравнение. Оценяване на значимостта на регресионното уравнение и неговите коефициенти

Оценяване на значимостта на уравнение множествена регресия

Изграждането на емпирично регресионно уравнение е началният етап на иконометричния анализ. Първото регресионно уравнение, съставено от извадка, много рядко е задоволително по отношение на определени характеристики. Следователно следващ най-важната задачаИконометричният анализ е тест за качеството на регресионно уравнение. В иконометрията е възприета добре установена схема за такава проверка.

Така че проверката на статистическото качество на изчисленото регресионно уравнение се извършва с помощта на следните указания:

· проверка на значимостта на регресионното уравнение;

· Преглед статистическа значимосткоефициенти на регресионно уравнение;

· проверка на свойствата на данните, чиято осъществимост е приета при оценката на уравнението (проверка на осъществимостта на предпоставките на OLS).

Тестването на значимостта на уравнението на множествената регресия, както и двойната регресия, се извършва с помощта на теста на Фишер. IN в такъв случай(за разлика от регресията по двойки) се излага нулева хипотеза H 0че всички регресионни коефициенти са равни на нула ( b 1=0, б 2=0, … , b m=0). Критерият на Фишер се определя по следната формула:

Където дфакт - факторна дисперсия, обяснена с регресия, за една степен на свобода; д ost - остатъчна дисперсия за степен на свобода; R 2- коеф многократно определяне; T хв регресионното уравнение (в сдвоените линейна регресия T= 1); П -брой наблюдения.

Получената стойност на F-теста се сравнява с табличната стойност при определено ниво на значимост. Ако действителната му стойност е по-голяма от стойността в таблицата, тогава хипотезата Ноотхвърля се незначимостта на регресионното уравнение и се приема алтернативната хипотеза за статистическата му значимост.

Използвайки критерия на Фишер, можете да оцените значимостта не само на регресионното уравнение като цяло, но и значимостта на допълнителното включване на всеки фактор в модела. Такава оценка е необходима, за да не се натоварва моделът с фактори, които не оказват съществено влияние върху резултата. Освен това, тъй като моделът се състои от няколко фактора, те могат да бъдат въведени в него в различни последователности и тъй като има корелация между факторите, значението на включването на един и същ фактор в модела може да варира в зависимост от последователността, в която в него се въвеждат фактори.

За да се оцени значимостта на включването на допълнителен фактор в модела, се изчислява частичният критерий на Фишер Fxi.Базира се на сравняване на нарастването на факторната дисперсия поради включването на допълнителен фактор в модела с остатъчната дисперсия за една степен на свобода за регресията като цяло. Следователно формулата за изчисление частен F-тестзащото факторът ще има следния вид:

Където R 2 yx 1 x 2… xi… xp -коефициент на множествена детерминация за модел с пълен комплект Пфактори ; R 2 yx 1 x 2… x i -1 x i +1… xp- коефициент на множествена детерминация за модел, който не включва фактор x i;П- брой наблюдения; T- брой параметри за фактори хв регресионното уравнение.

Действителната стойност на частичния тест на Фишер се сравнява с табличната при ниво на значимост 0,05 или 0,1 и съответния брой степени на свобода. Ако действителната стойност F xiнадвишава F маса, след това допълнителното включване на фактора x iв модела е статистически обосновано, а „чистият” регресионен коефициент b iпри фактор x iстатистически значим. Ако F xiпо-малко F маса, то допълнителното включване на фактора в модела не увеличава значително дела на обяснената вариация в резултата y,и следователно включването му в модела няма смисъл; коефициентът на регресия за този фактор в този случай е статистически незначим.

Използвайки частичния тест на Фишер, можете да тествате значимостта на всички регресионни коефициенти при допускането, че всеки съответен фактор x iсе въвежда последно в уравнението на множествената регресия и всички други фактори вече са включени в модела по-рано.

Оценка на значимостта на “чистите” коефициенти на регресия b iот t тест на ученикаможе да се извърши без изчисляване на частни Е- критерии. В този случай, както при сдвоената регресия, формулата се прилага за всеки фактор

t bi = b i / m bi,

Където b i- коефициент на “чиста” регресия с фактора x i ; m bi- стандартна грешка на регресионния коефициент b i .

За оценка на значимостта и значимостта на коефициента на корелация се използва t-тестът на Student.

Средната грешка на коефициента на корелация се намира по формулата:

н
и въз основа на грешката се изчислява t-критерият:

Изчислената стойност на t-теста се сравнява с табличната стойност, намерена в таблицата за разпределение на Стюдънт при ниво на значимост 0,05 или 0,01 и брой степени на свобода n-1. Ако изчислената стойност на t-теста е по-голяма от стойността в таблицата, тогава коефициентът на корелация се счита за значим.

В случай на криволинейна връзка, F-тестът се използва за оценка на значимостта на корелационната връзка и регресионното уравнение. Изчислява се по формулата:

или

където η е съотношението на корелация; n – брой наблюдения; m – брой параметри в регресионното уравнение.

Изчислената F стойност се сравнява с табличната за приетото ниво на значимост α (0,05 или 0,01) и броя на степените на свобода k 1 =m-1 и k 2 =n-m. Ако изчислената стойност на F надвишава таблицата, връзката се счита за значима.

Значимостта на регресионния коефициент се установява с помощта на t-теста на Student, който се изчислява по формулата:

където σ 2 и i е дисперсията на регресионния коефициент.

Изчислява се по формулата:

където k е броят на факторните характеристики в регресионното уравнение.

Коефициентът на регресия се счита за значим, ако t a 1 ≥t cr. t cr се намира в таблицата на критичните точки на разпределението на Стюдънт при приетото ниво на значимост и броя на степените на свобода k=n-1.

4.3 Корелационен и регресионен анализ в Excel

Нека проведем корелационен и регресионен анализ на връзката между добива и разходите за труд на 1 центнер зърно. За да направите това, отворете лист на Excel и въведете стойностите на факторната характеристика в клетки A1: A30 добива на зърнени култури, в клетки B1:B30, стойността на получената характеристика е цената на труда за 1 центнер зърно. В менюто Инструменти изберете опцията Анализ на данни. Щраквайки с левия бутон върху този елемент, ще отворим инструмента за регресия. Щракнете върху бутона OK и диалоговият прозорец Regression се появява на екрана. В полето Интервал на въвеждане Y въведете стойностите на резултантната характеристика (маркиране на клетки B1: B30), в полето Интервал на въвеждане X въведете стойностите на факторната характеристика (маркиране на клетки A1: A30). Маркирайте нивото на вероятност от 95% и изберете Нов работен лист. Кликнете върху бутона OK. На работния лист се появява таблицата „ЗАКЛЮЧЕНИЕ НА РЕЗУЛТАТИТЕ“, която показва резултатите от изчисляването на параметрите на уравнението на регресията, коефициента на корелация и други показатели, които ви позволяват да определите значимостта на коефициента на корелация и параметрите на уравнението на регресията.

ЗАКЛЮЧВАНЕ НА РЕЗУЛТАТИТЕ

Регресионна статистика

множествено число Р

R-квадрат

Нормализирано R-квадрат

Стандартна грешка

Наблюдения

Дисперсионен анализ

Значение F

Регресия

Коефициенти

Стандартна грешка

t-статистика

P-стойност

Долни 95%

Топ 95%

Най-ниски 95,0%

Топ 95,0%

Y-пресечка

Променлива X 1

В тази таблица „Множество R“ е коефициентът на корелация, „R-квадрат“ е коефициентът на определяне. “Коефициенти: Y-пресечна” - свободен член на регресионното уравнение 2.836242; “Променлива X1” – регресионен коефициент -0.06654. Има и стойности на F-тест на Fisher 74.9876, t-тест на Student 14.18042, „Стандартна грешка 0.112121“, които са необходими за оценка на значимостта на корелационния коефициент, параметрите на регресионното уравнение и цялото уравнение.

Въз основа на данните в таблицата ще изградим регресионно уравнение: y x ​​​​= 2.836-0.067x. Коефициентът на регресия a 1 = -0,067 означава, че при увеличаване на добива на зърно с 1 ц/ха разходите за труд за 1 ц зърно намаляват с 0,067 човекочаса.

Коефициентът на корелация е r=0,85>0,7, следователно връзката между изследваните характеристики в тази популация е тясна. Коефициентът на детерминация r 2 =0,73 показва, че 73% от изменението на ефективния признак (разходите на труд за 1 ц зърно) се дължи на действието на факторния признак (добив на зърно).

В таблицата на критичните точки на разпределението на Fisher-Snedecor намираме критичната стойност на F-теста при ниво на значимост 0,05 и броя на степените на свобода k 1 =m-1=2-1=1 и k 2 =n-m=30-2=28, то е равно на 4,21. Тъй като изчислената стойност на критерия е по-голяма от табличната (F=74.9896>4.21), регресионното уравнение се счита за значимо.

За да оценим значимостта на коефициента на корелация, нека изчислим t-теста на Student:

IN
В таблицата на критичните точки на разпределението на Стюдънт намираме критичната стойност на t-теста при ниво на значимост 0,05 и броя на степените на свобода n-1=30-1=29, той е равен на 2,0452. Тъй като изчислената стойност е по-голяма от стойността в таблицата, коефициентът на корелация е значителен.

Оценка на значимостта на параметрите на регресионното уравнение

Значимостта на параметрите на уравнението на линейната регресия се оценява с помощта на теста на Стюдънт:

Ако Tкалк. > T cr, тогава основната хипотеза се приема ( H o), показваща статистическата значимост на регресионните параметри;

Ако Tкалк.< T cr, тогава се приема алтернативната хипотеза ( H 1), което показва статистическата незначимост на регресионните параметри.

Където m a , m b– стандартни грешки на параметрите аИ б:

(2.19)

(2.20)

Критичната (таблична) стойност на критерия се намира с помощта на статистически таблици на разпределението на Стюдънт (Приложение Б) или с помощта на таблици Excel(раздел на съветника за функцията „Статистически“):

T cr = STUDARIST( а=1-Р; k=n-2), (2.21)

Където k=n-2също представлява броя на степените на свобода .

Оценката на статистическата значимост може да се приложи и към коефициента на линейна корелация

Където г-н– стандартна грешка при определяне на стойностите на коефициента на корелация r yx

(2.23)

По-долу има опции за задачи за практически и лабораторна работапо темите от втори раздел.

Въпроси за самопроверка за раздел 2

1. Посочете основните компоненти на иконометричния модел и тяхната същност.

2. Основното съдържание на етапите на иконометричното изследване.

3. Същността на подходите за определяне на параметрите на линейната регресия.

4. Същност и особености на приложение на метода най-малки квадратипри определяне на параметрите на регресионното уравнение.

5. Какви показатели се използват за оценка на близостта на връзката между изследваните фактори?

6. Същност линеен коефициенткорелации.

7. Същност на коефициента на детерминация.

8. Същност и основни характеристики на процедурите за оценка на адекватността (статистическа значимост) регресионни модели.

9. Оценка на адекватността на линейните регресионни модели чрез коефициента на апроксимация.

10. Същността на подхода за оценка на адекватността на регресионните модели с помощта на критерия на Фишер. Дефиниция на емпирични и критични стойностикритерий.

11. Същността на понятието „вариантен анализ” във връзка с иконометричните изследвания.

12. Същност и основни характеристики на процедурата за оценка на значимостта на параметрите линейно уравнениерегресия.

13. Характеристики на използването на разпределението на Стюдънт при оценка на значимостта на параметрите на уравнение на линейна регресия.

14. Каква е задачата за прогнозиране на единични стойности на изследваното социално-икономическо явление?

1. Конструиране на корелационно поле и формулиране на предположение за формата на уравнението за връзката на изследваните фактори;

2. Запишете основните уравнения на метода на най-малките квадрати, направете необходимите трансформации, съставете таблица за междинни изчисления и определете параметрите на уравнението на линейната регресия;

3. Проверете правилността на изчисленията, извършени с помощта на стандартни процедурии функции електронни таблици Excel.

4. Анализирайте резултатите, формулирайте изводи и препоръки.

1. Изчисляване на стойността на коефициента на линейна корелация;

2. Изграждане на маса дисперсионен анализ;

3. Оценка на коефициента на детерминация;

4. Проверете коректността на изчисленията с помощта на стандартни процедури и функции на електронни таблици на Excel.

5. Анализирайте резултатите, формулирайте изводи и препоръки.

4. Извършване на обща оценка на адекватността на избраното регресионно уравнение;

1. Оценка на адекватността на уравнението въз основа на стойностите на коефициента на приближение;

2. Оценка на адекватността на уравнението въз основа на стойностите на коефициента на детерминация;

3. Оценка на адекватността на уравнението с помощта на критерия на Фишер;

4. Извършване на обща оценка на адекватността на параметрите на регресионното уравнение;

5. Проверете правилността на изчисленията, като използвате стандартни процедури и функции на електронни таблици на Excel.

6. Анализирайте резултатите, формулирайте изводи и препоръки.

1. Използване на стандартни процедури на Excel Spreadsheet Functions Wizard (от раздели „Математически” и „Статистически”);

2. Подготовка на данни и особености на използване на функцията LINEST;

3. Подготовка на данни и характеристики на използването на функцията „ПРЕДВИЖДАНЕ“.

1. Използване на стандартни процедури на пакета за анализ на данни от електронни таблици на Excel;

2. Подготовка на данни и особености на прилагане на процедурата „РЕГРЕСИЯ”;

3. Интерпретация и синтез на данни от таблицата за регресионен анализ;

4. Интерпретация и синтез на данни от дисперсионния анализ на таблицата;

5. Интерпретация и обобщение на данни от таблицата за оценка на значимостта на параметрите на регресионното уравнение;

Когато изпълнявате лабораторна работа въз основа на една от опциите, трябва да изпълните следните конкретни задачи:

1. Изберете формата на уравнението за връзката на изследваните фактори;

2. Определяне на параметрите на регресионното уравнение;

3. Оценка на тясната връзка на изследваните фактори;

4. Оценка на адекватността на избраното регресионно уравнение;

5. Оценете статистическата значимост на параметрите на регресионното уравнение.

6. Проверете правилността на изчисленията, като използвате стандартни процедури и функции на електронни таблици на Excel.

7. Анализирайте резултатите, формулирайте изводи и препоръки.

Задачи за практическа и лабораторна работа по темата „Сдвоена линейна регресия и корелация в иконометричните изследвания“.

Опция 1 Вариант 2 Вариант 3 Вариант 4 Вариант 5
х г х г х г х г х г
Вариант 6 Вариант 7 Вариант 8 Вариант 9 Вариант 10
х г х г х г х г х г

При социално-икономическите изследвания често е необходимо да се работи в ограничена популация или с извадкови данни. Следователно, след математическите параметри на регресионното уравнение, е необходимо те и уравнението като цяло да бъдат оценени за статистическа значимост, т.е. необходимо е да се уверите, че полученото уравнение и неговите параметри се формират под въздействието на неслучайни фактори.

На първо място се оценява статистическата значимост на уравнението като цяло. Оценката обикновено се извършва с помощта на F теста на Fisher. Изчисляването на F-критерия се основава на правилото за добавяне на дисперсии. А именно общата дисперсионна характеристика-резултат = факторна дисперсия + остатъчна дисперсия.

Действителната цена

Теоретична цена
Чрез конструиране на регресионно уравнение можете да изчислите теоретичната стойност на характеристиката на резултата, т.е. изчислено с помощта на регресионното уравнение, като се вземат предвид неговите параметри.

Тези стойности ще характеризират атрибута на резултата, формиран под влиянието на факторите, включени в анализа.

Винаги има несъответствия (остатъци) между действителните стойности на атрибута резултат и тези, изчислени на базата на регресионното уравнение, поради влиянието на други фактори, които не са включени в анализа.

Разликата между теоретичните и действителните стойности на атрибута резултат се нарича остатък. Обща вариация на резултатната черта:

Промяната в атрибута на резултата, причинена от промяна в характеристиките на факторите, включени в анализа, се оценява чрез сравнения на теоретичните стойности на резултатите. характеристика и нейните средни стойности. Остатъчна вариация чрез сравнение на теоретичните и действителните стойности на получената характеристика. Общата дисперсия, остатъчната и действителната имат различен брой степени на свобода.

Общ, П- брой единици в изследваната популация

действително, П- брой фактори, включени в анализа

Остатъчен

F тестът на Fisher се изчислява като съотношението към и се изчислява за една степен на свобода.

Използването на теста на Fisher F като оценка на статистическата значимост на регресионно уравнение е много логично. - това е резултатът. характеристика, определяща се от включените в анализа фактори, т.е. това е пропорцията на обяснения резултат. знак. - това е (разновидност) на резултатен атрибут, причинен от фактори, чието влияние не се взема предвид, т.е. не са включени в анализа.

Че. F-тестът е предназначен да оценява значителноизлишък над . Ако не е значително по-ниска от и още повече, ако надвишава, тогава анализът не включва тези фактори, които действително влияят върху резултатния атрибут.

F тестът на Fisher е табличен, действителната стойност се сравнява с табличната стойност. Ако , тогава регресионното уравнение се счита за статистически значимо. Ако, напротив, уравнението не е статистически значимо и не може да се използва на практика, значимостта на уравнението като цяло показва статистическата значимост на корелационните показатели.

След като се оцени уравнението като цяло, е необходимо да се оцени статистическата значимост на параметрите на уравнението. Тази оценка се извършва с помощта на t-статистиката на Student. t-статистиката се изчислява като съотношението на параметрите на уравнението (по модул) към тяхната стандартна средна квадратична грешка. Ако се оценява еднофакторен модел, тогава се изчисляват 2 статистики.

Във всички компютърни програми изчисляването на стандартната грешка и t-статистиката за параметрите се извършва с изчисляването на самите параметри. T-статистиката е таблична. Ако стойността е , тогава параметърът се счита за статистически значим, т.е. формирани под въздействието на неслучайни фактори.

Изчисляването на t-статистиката по същество означава тестване на нулевата хипотеза, че параметърът е незначителен, т.е. равенството му на нула. При еднофакторен модел се оценяват 2 хипотези: и

Нивото на значимост на приемането на нулевата хипотеза зависи от нивото на приемане вероятност за доверие. Така че, ако изследователят зададе нивото на вероятност на 95%, ще бъде изчислено нивото на значимост на приемане, следователно, ако нивото на значимост е ≥ 0,05, то се приема и параметрите се считат за статистически незначими. Ако , тогава алтернативата се отхвърля и приема: и .

Статистическите софтуерни пакети също осигуряват нивото на значимост за приемане на нулевите хипотези. Оценяването на значимостта на регресионното уравнение и неговите параметри може да даде следните резултати:

Първо, уравнението като цяло е значимо (според F-теста) и всички параметри на уравнението също са статистически значими. Това означава, че полученото уравнение може да се използва за вземане и на двете управленски решения, и за прогнозиране.

Второ, според F-теста уравнението е статистически значимо, но поне един от параметрите на уравнението не е значим. Уравнението може да се използва за вземане на управленски решения по отношение на анализираните фактори, но не може да се използва за прогнозиране.

Трето, уравнението не е статистически значимо или според F-теста уравнението е значимо, но всички параметри на полученото уравнение не са значими. Уравнението не може да се използва за никакви цели.

За да може регресионното уравнение да бъде разпознато като модел на връзката между резултата-атрибут и фактор-атрибутите, е необходимо всички най-важните фактори, определящи резултата, така че съдържателната интерпретация на параметрите на уравнението да съответства на теоретично обосновани връзки в изследваното явление. Коефициентът на детерминация R2 трябва да бъде > 0,5.

Когато се съставя уравнение на множествена регресия, препоръчително е да се извърши оценка, като се използва така нареченият коригиран коефициент на детерминация (R 2). Стойността на R2 (както и корелацията) нараства с броя на факторите, включени в анализа. Стойността на коефициента е особено надценена при малки популации. За да се потисне отрицателното влияние, R 2 и корелациите се коригират, като се вземе предвид броят на степените на свобода, т.е. броя на свободно вариращите елементи, когато са включени определени фактори.

Коригиран коефициент на детерминация

П– размер на популацията/брой наблюдения

к– брой фактори, включени в анализа

n-1– брой степени на свобода

(1-R 2)- стойността на остатъка/необяснимата дисперсия на получената характеристика

Винаги по-малко R 2. въз основа на които можете да сравните оценките на уравненията с различни числаанализирани фактори.

34. Проблеми на изучаването на динамичните редове.

Времевите редове се наричат ​​времеви редове или времеви редове. Динамичният ред е подредена във времето поредица от показатели, характеризиращи определено явление (обем на БВП от 90 до 98). Целта на изучаването на динамичните редове е да се идентифицира моделът на развитие на изследваното явление (основната тенденция) и да се прогнозира въз основа на това. От дефиницията на RD следва, че всяка серия се състои от два елемента: време t и ниво на серията (тези специфични стойности на индикатора, въз основа на които се изгражда серията RD). Сериите DR могат да бъдат 1) моментни - серии, чиито показатели се записват в даден момент, на определена дата, 2) интервални - серии, чиито показатели са получени за определен период от време (1. съвкупност от Санкт Петербург 2. обем на БВП за периода). Разделянето на сериите на моментни и интервални е необходимо, тъй като това определя спецификата на изчисляване на някои показатели на серията DR. Сумиране на нивата интервални сериидава смислено интерпретируем резултат, което не може да се каже за сумирането на нивата на моментните серии, тъй като последните съдържат многократно броене. Най-важният проблем при анализа на динамичните редове е проблемът за сравнимостта на нивата на редовете. Тази концепция е много разнообразна. Нивата трябва да са сравними по отношение на методите на изчисление и по отношение на територията и обхвата на единиците от населението. Ако серията DR е конструирана по отношение на разходите, тогава всички нива трябва да бъдат представени или изчислени в сравними цени. При конструирането на интервални серии нивата трябва да характеризират еднакви периоди от време. Когато се конструират моментни серии, нивата трябва да се записват на една и съща дата. Серията DR може да бъде пълна или непълна. В официалните публикации се използват непълни редове (1980,1985,1990,1995,1996,1997,1998,1999...). Цялостен анализ RD включва проучване на следните точки:

1. изчисляване на показатели за промени в нивата на РЗ

2. изчисляване на средни RD показатели

3. идентифициране на основната тенденция на серията, изграждане на трендови модели

4. оценка на автокорелацията в РД, изграждане на авторегресивни модели

5. RD корелация (проучване на връзките между m/y DR серии)

6. прогнозиране на пътеката за рулиране.

35. Индикатори за промени в нивата на динамичните редове .

IN общ изглед RowD може да бъде представен:

y – ниво на DR, t – момент или период от време, към който принадлежи нивото (индикатора), n – дължина на серията DR (брой периоди). при изучаване на поредица от динамика се изчисляват следните показатели: 1. абсолютен растеж, 2. коефициент на растеж (скорост на растеж), 3. ускорение, 4. коефициент на растеж (скорост на растеж), 5. абсолютна стойност 1% увеличение. Изчисляваните показатели могат да бъдат: 1. верижни - получават се чрез сравняване на всяко ниво от серията с непосредствено предходното, 2. базисни - получават се чрез сравняване с нивото, избрано като база за сравнение (освен ако не е изрично посочено, 1-вото ниво на серията е взета за основа). 1. Абсолютни увеличения на веригата:. Показва колко повече или по-малко. Верижните абсолютни увеличения се наричат ​​индикатори за скоростта на промяна на нивата времеви редове. Базов абсолютен растеж: . Ако серийните нива са относителни показатели, изразени в %, тогава абсолютното увеличение се изразява в точки на промяна. 2. темп на растеж (темп на растеж):Изчислява се като съотношение на нивата на серията към непосредствено предходните (коефициенти на растеж на веригата) или към нивото, взето като база за сравнение (коефициенти на базов растеж): . Характеризира колко пъти всяко ниво от серията > или< предшествующего или базисного. На основе коэффициентов роста рассчитываются темпы роста. Это коэффициенты роста, выраженные в %ах: 3. въз основа на абсолютни увеличения се изчислява индикаторът - ускоряване на абсолютния растеж: . Ускорението е абсолютно увеличение на абсолютните увеличения. Оценява как се променят самите печалби, независимо дали са стабилни или се ускоряват (увеличават). 4. темп на растеже съотношението на растежа към базата за сравнение. Изразено в %: ; . Темпът на растеж е темпът на растеж минус 100%. Показва колко % е даденото ниво на серията > или< предшествующего либо базисного. 5. абсолютное значение 1% прироста. Рассчитывается как отношение абсолютного прироста к темпу прироста, т.е.: - сотая доля предыдущего уровня. Все эти показатели рассчитываются для оценки степени изменения уровней ряда. Цепные коэффициенты и темпы роста называются показателями интенсивности изменения уровней ДРядов.

2. Изчисляване на средни RD показатели Изчисляват се средни нива на редове, средни абсолютни увеличения, средни темпове на растеж и средни темпове на растеж. Средните показатели се изчисляват с цел да се обобщи информацията и да се направи възможно сравняването на нивата и показателите на тяхното изменение в различни серии. 1. среден ред нивоа) за интервален динамичен ред се изчислява с помощта на простата средна аритметична стойност: , където n е броят на нивата в динамичния ред; б) за моментни серии средното ниво се изчислява по специфична формула, която се нарича хронологична средна стойност: . 2. среден абсолютен прирастизчислено на базата на верижни абсолютни увеличения на базата на простата средна аритметична стойност:

. 3. Среден темп на растежизчислени на базата на коефициенти на нарастване на веригата, използвайки формулата за средна геометрична стойност: . Когато се коментират средните показатели на серията DR, е необходимо да се посочат 2 точки: периодът, който характеризира анализирания показател, и интервалът от време, за който е изградена серията DR. 4. Среден темп на растеж: . 5. среден темп на растеж: .

Регресионният анализ е статистически метод за изследване, който ви позволява да покажете зависимостта на определен параметър от една или повече независими променливи. В предкомпютърната ера използването му е било доста трудно, особено когато става въпрос за големи обеми данни. Днес, след като научихте как да създавате регресия в Excel, можете да решавате сложни статистически проблеми само за няколко минути. По-долу са конкретни примери от областта на икономиката.

Видове регресия

Самото това понятие е въведено в математиката през 1886 г. Регресията се случва:

  • линеен;
  • параболичен;
  • успокоителен;
  • експоненциален;
  • хиперболичен;
  • демонстративен;
  • логаритмичен.

Пример 1

Нека разгледаме проблема за определяне на зависимостта на броя на напусналите членове на екипа от средната заплата в 6 промишлени предприятия.

Задача. В шест предприятия анализирахме средномесечно заплатии броя на служителите, напуснали поради по желание. В табличен вид имаме:

Брой хора, които напускат

Заплата

30 000 рубли

35 000 рубли

40 000 рубли

45 000 рубли

50 000 рубли

55 000 рубли

60 000 рубли

За задачата за определяне на зависимостта на броя на напусналите работници от средната заплата в 6 предприятия, регресионният модел има формата на уравнението Y = a 0 + a 1 x 1 +...+a k x k, където x i са влияещи променливи, a i са регресионните коефициенти, а k е броят на факторите.

За този проблем Y е индикаторът за напускане на служители, а влияещият фактор е заплатата, която означаваме с X.

Използване на възможностите на процесора за електронни таблици Excel

Регресионният анализ в Excel трябва да бъде предшестван от прилагане на вградени функции към съществуващи таблични данни. За тези цели обаче е по-добре да използвате много полезната добавка „Analysis Pack“. За да го активирате трябва:

  • от раздела „Файл“ отидете в секцията „Опции“;
  • в прозореца, който се отваря, изберете реда „Добавки“;
  • кликнете върху бутона „Отиди“, разположен по-долу, вдясно от реда „Управление“;
  • поставете отметка в квадратчето до името „Пакет за анализ“ и потвърдете действията си, като щракнете върху „Ok“.

Ако всичко е направено правилно, необходимият бутон ще се появи от дясната страна на раздела „Данни“, разположен над работния лист на Excel.

в Excel

Сега, когато разполагаме с всички необходими виртуални инструменти за извършване на иконометрични изчисления, можем да започнем да решаваме нашия проблем. За това:

  • Кликнете върху бутона „Анализ на данни“;
  • в прозореца, който се отваря, щракнете върху бутона „Регресия“;
  • в раздела, който се показва, въведете диапазона от стойности за Y (броят на напусналите служители) и за X (техните заплати);
  • Потвърждаваме действията си с натискане на бутона „Ok“.

В резултат на това програмата автоматично ще попълни нова електронна таблица с данни от регресионен анализ. Забележка! Excel ви позволява ръчно да зададете местоположението, което предпочитате за тази цел. Например, това може да е същият лист, където се намират стойностите Y и X, или дори нова работна книга, специално проектирана да съхранява такива данни.

Анализ на регресионните резултати за R-квадрат

В Excel данните, получени по време на обработката на данните в разглеждания пример, имат формата:

На първо място, трябва да обърнете внимание на стойността на R-квадрат. Представлява коефициента на детерминация. В този пример R-квадрат = 0,755 (75,5%), т.е. изчислените параметри на модела обясняват връзката между разглежданите параметри със 75,5%. Колкото по-висока е стойността на коефициента на детерминация, толкова по-подходящ е избраният модел за конкретна задача. Смята се, че правилно описва реалната ситуация, когато стойността на R-квадрат е над 0,8. Ако R-квадрат<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

Анализ на коефициентите

Числото 64.1428 показва каква ще бъде стойността на Y, ако всички променливи xi в модела, който разглеждаме, бъдат нулирани. С други думи, може да се твърди, че стойността на анализирания параметър се влияе и от други фактори, които не са описани в конкретен модел.

Следващият коефициент -0.16285, разположен в клетка B18, показва тежестта на влиянието на променливата X върху Y. Това означава, че средната месечна заплата на служителите в рамките на разглеждания модел влияе върху броя на напусналите с тежест -0.16285, т.е. степента на неговото влияние е съвсем малка. Знакът "-" показва, че коефициентът е отрицателен. Това е очевидно, тъй като всеки знае, че колкото по-висока е заплатата в предприятието, толкова по-малко хора изразяват желание да прекратят трудовия договор или да напуснат.

Множествена регресия

Този термин се отнася до уравнение на връзка с няколко независими променливи от формата:

y=f(x 1 +x 2 +…x m) + ε, където y е резултантната характеристика (зависима променлива), а x 1, x 2,…x m са факторни характеристики (независими променливи).

Оценка на параметъра

За множествената регресия (MR) тя се извършва с помощта на метода на най-малките квадрати (OLS). За линейни уравнения от формата Y = a + b 1 x 1 +…+b m x m + ε конструираме система от нормални уравнения (вижте по-долу)

За да разберете принципа на метода, разгледайте двуфакторния случай. Тогава имаме ситуация, описана с формулата

От тук получаваме:

където σ е дисперсията на съответния атрибут, отразена в индекса.

OLS е приложимо към уравнението на MR в стандартизирана скала. В този случай получаваме уравнението:

в които t y, t x 1, ... t xm са стандартизирани променливи, за които средните стойности са равни на 0; β i са стандартизираните регресионни коефициенти, а стандартното отклонение е 1.

Моля, имайте предвид, че всички β i в този случай са посочени като нормализирани и централизирани, следователно тяхното сравнение помежду си се счита за правилно и приемливо. Освен това е обичайно да се отсяват факторите, като се отхвърлят тези с най-ниските стойности на βi.

Проблем с използване на уравнение на линейна регресия

Да предположим, че имаме таблица с динамиката на цените за конкретен продукт N през последните 8 месеца. Необходимо е да се вземе решение за целесъобразността на закупуването на партида от него на цена от 1850 рубли/т.

номер на месеца

име на месеца

цена на продукта N

1750 рубли на тон

1755 рубли на тон

1767 рубли на тон

1760 рубли на тон

1770 рубли на тон

1790 рубли на тон

1810 рубли на тон

1840 рубли на тон

За да разрешите този проблем в процесора за електронни таблици на Excel, трябва да използвате инструмента „Анализ на данни“, който вече е известен от примера, представен по-горе. След това изберете секцията „Регресия“ и задайте параметрите. Трябва да се помни, че в полето „Интервал на въвеждане Y“ трябва да се въведе диапазон от стойности за зависимата променлива (в този случай цените на стоките през определени месеци от годината), а в „Интервал на въвеждане X“ - за независимата променлива (номер на месеца). Потвърдете действието, като щракнете върху „Ok“. На нов лист (ако е посочено) получаваме данни за регресия.

Използвайки ги, построяваме линейно уравнение от вида y=ax+b, където параметрите a и b са коефициентите на линията с името на номера на месеца и коефициентите и линиите „Y-пресечна точка” от листа с резултатите от регресионния анализ. Така уравнението на линейната регресия (LR) за задача 3 се записва като:

Цена на продукта N = 11.714* номер на месеца + 1727.54.

или в алгебрична нотация

y = 11,714 x + 1727,54

Анализ на резултатите

За да се реши дали полученото уравнение на линейна регресия е адекватно, се използват коефициентите на множествена корелация (MCC) и детерминация, както и тестът на Fisher и t тестът на Student. В електронната таблица на Excel с регресионни резултати те се наричат ​​съответно множество R, R-квадрат, F-статистика и t-статистика.

KMC R дава възможност да се оцени близостта на вероятностната връзка между независимите и зависимите променливи. Високата му стойност показва доста силна връзка между променливите „Брой месец“ и „Цена на продукт N в рубли за 1 тон“. Естеството на тази връзка обаче остава неизвестно.

Квадратът на коефициента на определяне R2 (RI) е числена характеристика на дела на общото разсейване и показва разсейването на коя част от експерименталните данни, т.е. стойностите на зависимата променлива съответстват на уравнението на линейната регресия. В разглежданата задача тази стойност е равна на 84,8%, т.е. статистическите данни се описват с висока степен на точност от полученото SD.

F-статистиката, наричана още тест на Фишер, се използва за оценка на значимостта на линейна връзка, опровергавайки или потвърждавайки хипотезата за нейното съществуване.

(Тест на Студент) помага да се оцени значимостта на коефициента за неизвестен или свободен член на линейна връзка. Ако стойността на t-теста > tcr, тогава хипотезата за незначимостта на свободния член на линейното уравнение се отхвърля.

В разглежданата задача за свободния член с помощта на инструменти на Excel се получи, че t = 169.20903 и p = 2.89E-12, т.е. имаме нулева вероятност правилната хипотеза за незначимостта на свободния член да бъде отхвърлена. . За коефициента за неизвестното t=5.79405 и p=0.001158. С други думи, вероятността правилната хипотеза за незначимостта на коефициента за неизвестно да бъде отхвърлена е 0,12%.

По този начин може да се твърди, че полученото уравнение на линейна регресия е адекватно.

Проблемът с осъществимостта на закупуването на пакет от акции

Множествената регресия в Excel се извършва с помощта на същия инструмент за анализ на данни. Нека разгледаме конкретен проблем с приложението.

Ръководството на компанията NNN трябва да вземе решение дали е целесъобразно да закупи 20% дял в МММ АД. Цената на пакета (SP) е 70 милиона щатски долара. Специалистите на NNN са събрали данни за подобни транзакции. Беше решено да се оцени стойността на дяловото участие според такива параметри, изразени в милиони щатски долари, като:

  • дължими сметки (VK);
  • годишен обем на оборота (VO);
  • вземания (VD);
  • себестойност на дълготрайните активи (COF).

Освен това се използва параметърът на дълга към заплатите на предприятието (V3 P) в хиляди щатски долари.

Решение, използващо процесор за електронни таблици Excel

На първо място, трябва да създадете таблица с изходни данни. Изглежда така:

  • извикайте прозореца „Анализ на данни“;
  • изберете секцията „Регресия“;
  • В полето “Input interval Y” въведете диапазона от стойности на зависимите променливи от колона G;
  • Щракнете върху иконата с червена стрелка вдясно от прозореца „Интервал на въвеждане X“ и маркирайте диапазона от всички стойности от колони B, C, D, F на листа.

Маркирайте елемента „Нов работен лист“ и щракнете върху „Ok“.

Получаване на регресионен анализ за даден проблем.

Проучване на резултатите и изводи

Ние „събираме“ регресионното уравнение от закръглените данни, представени по-горе в електронната таблица на Excel:

SP = 0.103*SOF + 0.541*VO - 0.031*VK +0.405*VD +0.691*VZP - 265.844.

В по-позната математическа форма може да се запише като:

y = 0,103*x1 + 0,541*x2 - 0,031*x3 +0,405*x4 +0,691*x5 - 265,844

Данните за МММ АД са представени в таблицата:

Като ги заместим в регресионното уравнение, получаваме цифра от 64,72 милиона щатски долара. Това означава, че акциите на МММ АД не си струва да се купуват, тъй като тяхната стойност от 70 милиона щатски долара е доста завишена.

Както можете да видите, използването на електронната таблица на Excel и регресионното уравнение направи възможно вземането на информирано решение относно осъществимостта на много специфична транзакция.

Сега знаете какво е регресия. Обсъдените по-горе примери в Excel ще ви помогнат да решите практически проблеми в областта на иконометрията.



Ново в сайта

>

Най - известен