Начало венците Модели за експоненциално изглаждане и прогнозиране на времеви редове. Прогнозиране на базата на експоненциално изглаждане

Модели за експоненциално изглаждане и прогнозиране на времеви редове. Прогнозиране на базата на експоненциално изглаждане

1. Основни методически положения.

Простият метод на експоненциално изглаждане използва претеглена (експоненциална) подвижна средна на всички данни от предишни наблюдения. Този модел най-често се прилага за данни, при които е необходимо да се оцени наличието на връзка между анализираните показатели (тенденция) или зависимостта на анализираните данни. Целта на експоненциалното изглаждане е да се оцени текущо състояние, резултатите от които ще определят всички последващи прогнози.

Експоненциалното изглаждане осигуряваПостоянно актуализиране на модела с помощта на най-новите данни. Този метод се основава на осредняване (изглаждане) на времеви серии от минали наблюдения в низходяща (експоненциална) посока. Тоест на по-скорошните събития се придава по-голяма тежест. Теглото се задава, както следва: за последното наблюдение теглото ще бъде α, за предпоследното - (1-α), за това, което е било преди него - (1-α) 2 и т.н.

В изгладена форма нова прогноза (за времеви период t+1) може да бъде представена като среднопретеглена стойност на последното наблюдение на количество в момент t и неговата предишна прогноза за същия период t. Освен това теглото α се присвоява на наблюдаваната стойност, а теглото (1- α) се присвоява на прогнозата; се приема, че 0< α<1. Это правило в общем виде можно записать следующим образом.

Нова прогноза = [α*(последно наблюдение)]+[(1- α)*последна прогноза]

къде е предвидената стойност следващ период;

α – изглаждаща константа;

Y t – наблюдение на стойността за текущ период t;

Предишната изгладена прогноза на тази стойност за период t.

Експоненциалното изглаждане е процедура за непрекъснато преразглеждане на прогнозните резултати в светлината на най-новите събития.

Изглаждащата константа α е претеглен фактор. Реалната му стойност се определя от степента, в която текущото наблюдение трябва да повлияе на прогнозираната стойност. Ако α е близо до 1, тогава прогнозата значително взема предвид големината на грешката на последната прогноза. Обратно, за малки стойности на α, прогнозираната стойност е най-близка до предишната прогноза. Може да се разглежда като претеглена средна стойност на всички минали наблюдения, като теглата намаляват експоненциално с остаряването на данните.



Таблица 2.1

Сравнение на влиянието на различни стойности на изглаждащите константи

Константата α е ключът към анализа на данните. Ако се изисква прогнозираните стойности да са стабилни и случайните отклонения да са изгладени, е необходимо да изберете малка стойност на α. Голяма стойност на константата α има смисъл, ако е необходим бърз отговор на промените в спектъра на наблюденията.

2. Практически пример за експоненциално изглаждане.

Представени са данни на компанията за обема на продажбите (хиляди единици) за седем години, изглаждащата константа е взета равна на 0,1 и 0,6. Данните за 7 години представляват тестовата част; въз основа на тях е необходимо да се оцени ефективността на всеки модел. За експоненциално изглаждане на серии първоначалната стойност се приема равна на 500 (първата стойност на действителните данни или средната стойност за 3-5 периода се записва в изгладената стойност за второто тримесечие).

Таблица 2.2

Изходни данни

време Реална стойност (действителна) Изгладена стойност Грешка в прогнозата
година четвърт 0,1 0,1
Excel според формулата
#N/A 0,00
500,00 -150,00
485,00 485,00 -235,00
461,50 461,50 -61,50
455,35 455,35 -5,35
454,82 454,82 -104,82
444,33 444,33 -244,33
419,90 419,90 -119,90
407,91 407,91 -57,91
402,12 402,12 -202,12
381,91 381,91 -231,91
358,72 358,72 41,28
362,84 362,84 187,16
381,56 381,56 -31,56
378,40 378,40 -128,40
365,56 365,56 184,44
384,01 384,01 165,99
400,61 400,61 -0,61
400,55 400,55 -50,55
395,49 395,49 204,51
415,94 415,94 334,06
449,35 449,35 50,65
454,41 454,41 -54,41
448,97 448,97 201,03
469,07 469,07 380,93

На фиг. Фигура 2.1 представя прогноза, базирана на експоненциално изглаждане с изглаждаща константа, равна на 0,1.



ориз. 2.1. Експоненциално изглаждане

Решение в Excel.

1. Изберете менюто „Инструменти“ – „Анализ на данни“. В списъка с инструменти за анализ изберете Експоненциално изглаждане. Ако в менюто „Инструменти“ няма анализ на данни, тогава трябва да инсталирате „Пакет за анализ“. За да направите това, намерете елемента „Настройки“ в „Опции“ и в появилия се диалогов прозорец поставете отметка в квадратчето „Пакет за анализ“ и щракнете върху OK.

2. На екрана ще се отвори диалоговият прозорец, показан на фиг. 2.2.

3. В полето „интервал на въвеждане“ въведете стойностите на изходните данни (плюс една свободна клетка).

4. Поставете отметка в квадратчето „етикети“ (ако диапазонът на въвеждане съдържа имена на колони).

5. Въведете стойността (1-α) в полето „фактор на затихване“.

6. В полето „Интервал за въвеждане“ въведете стойността на клетката, в която искате да видите получените стойности.

7. Поставете отметка в квадратчето „Опции“ - „Извеждане на графика“, за да го създадете автоматично.

ориз. 2.2. Диалогов прозорец за експоненциално изглаждане

3. Лабораторна работа.

Има първоначални данни за обемите на производство на маслодобивно предприятие за 2 години, представени в таблица 2.3:

Таблица 2.3

Изходни данни

Извършете експоненциално изглаждане на серията. Вземете експоненциалния коефициент на изглаждане равен на 0,1; 0,2; 0,3. Коментирайте получените резултати. Можете да използвате статистическите данни, представени в Приложение 1.

Проблемите с прогнозирането се основават на промени в определени данни във времето (продажби, търсене, предлагане, БВП, въглеродни емисии, население...) и проектирането на тези промени в бъдещето. За съжаление, тенденциите, идентифицирани от исторически данни, могат да бъдат нарушени от много непредвидени обстоятелства. Така че данните в бъдеще може да се различават значително от случилото се в миналото. Това е проблемът на прогнозирането.

Съществуват обаче техники (наречени експоненциално изглаждане), които ви позволяват не само да се опитате да предскажете бъдещето, но и да определите количествено несигурността на всичко, свързано с прогнозата. Численото изразяване на несигурност чрез създаване на прогнозни интервали е наистина безценно, но често се пренебрегва в света на прогнозите.

Изтеглете бележката в или формат, примери във формат

Изходни данни

Да приемем, че сте фен на „Властелинът на пръстените“ и вече три години правите и продавате мечове (фиг. 1). Нека изведем продажбите графично (фиг. 2). Търсенето се удвои за три години - може би това е тенденция? Ще се върнем към тази идея малко по-късно. Графиката има няколко пика и спадове, което може да е знак за сезонност. По-конкретно, пиковете се случват в месеци с номера 12, 24 и 36, които се оказват декември. Но може би това е просто съвпадение? Нека разберем.

Просто експоненциално изглаждане

Методите за експоненциално изглаждане разчитат на прогнозиране на бъдещето от данни от миналото, където по-новите наблюдения имат по-голяма тежест от по-старите. Това претегляне е възможно благодарение на изглаждащите константи. Първият метод за експоненциално изглаждане, който ще опитаме, се нарича просто експоненциално изглаждане (SES). Той използва само една изглаждаща константа.

Простото експоненциално изглаждане предполага, че вашите данни за времеви редове се състоят от два компонента: ниво (или средно) и някаква грешка около тази стойност. Няма тенденция или сезонни колебания - просто има ниво, около което търсенето се колебае, заобиколено от малки грешки тук и там. Като дава предпочитание на по-нови наблюдения, TEC може да причини промени в това ниво. На езика на формулите,

Търсене в момент t = ниво + случайна грешка около нивото в момент t

И така, как намирате приблизителната стойност на нивото? Ако приемем, че всички времеви стойности имат една и съща стойност, тогава трябва просто да изчислим тяхната средна стойност. Това обаче е лоша идея. Трябва да се отдаде по-голяма тежест на последните наблюдения.

Нека създадем няколко нива. Нека изчислим базова линияпрез първата година:

ниво 0 = средно търсене за първата година (месеци 1-12)

За търсенето на мечове то е 163. Използваме ниво 0 (163) като прогноза за търсенето за месец 1. Търсенето за месец 1 е 165, тоест това е 2 меча над ниво 0. Струва си да актуализирате базовата апроксимация. Уравнението за просто експоненциално изглаждане е:

ниво 1 = ниво 0 + няколко процента × (търсене 1 – ниво 0)

ниво 2 = ниво 1 + няколко процента × (търсене 2 – ниво 1)

и т.н. „Няколко процента“ се нарича изглаждаща константа и се обозначава с алфа. Това може да бъде всяко число от 0 до 100% (0 до 1). По-късно ще научите как да изберете алфа стойността. Като цяло стойността за различни точки във времето:

Ниво текущ период = ниво предишен период +
алфа × (текущ период на търсене – ниво предишен период)

Бъдещото търсене е равно на последно изчисленото ниво (фиг. 3). Тъй като не знаете какво е алфа, задайте клетка C2 на 0,5, за да започнете. След като моделът е изграден, намерете алфа, така че сумата на квадратната грешка - E2 (или стандартното отклонение - F2) да е минимална. За да направите това, стартирайте опцията Намиране на решение. За да направите това, преминете през менюто ДАННИ –> Намиране на решение, и инсталирайте в прозореца Опции за търсене на решениенеобходимите стойности (фиг. 4). За да покажете резултатите от прогнозата на диаграма, първо изберете диапазона A6:B41 и изградете проста линейна диаграма. След това щракнете с десния бутон върху диаграмата и изберете опцията Изберете данни.В прозореца, който се отваря, създайте втори ред и вмъкнете прогнози от диапазона A42:B53 в него (фиг. 5).

Може би имате тенденция

За да проверите това предположение, достатъчно е да се побере линейна регресияпод данните за търсенето и извършете t тест за покачването на тази тренд линия (както в ). Ако наклонът на линията е различен от нула и е статистически значим (при тестване с помощта на t-теста на Student, стойността rпо-малко от 0,05), данните имат тенденция (фиг. 6).

Използвахме функцията LINEST, която връща 10 описателни статистики (ако не сте използвали тази функция преди, препоръчвам я) и функцията INDEX, която ви позволява да „извадите“ само трите необходими статистики, а не целия набор. Оказа се, че наклонът е 2,54 и той е значителен, тъй като тестът на Стюдънт показа, че 0,000000012 е значително по-малко от 0,05. Така че тенденция има и остава само да я включим в прогнозата.

Експоненциално изглаждане на Holt с корекция на тренда

Често се нарича двойно експоненциално изглаждане, защото има не един изглаждащ параметър - алфа, а два. Ако времевата последователност има линеен тренд, тогава:

търсене за време t = ниво + t × тенденция + произволно отклонение на нивото в момент t

Holt Exponential Smoothing with Trend Adjustment има две нови уравнения, едното за нивото, докато се движи във времето, а другото за тренда. Уравнението на нивото съдържа изглаждащ параметър алфа, а уравнението на тенденцията съдържа гама. Ето как изглежда новото уравнение на ниво:

ниво 1 = ниво 0 + тенденция 0 + алфа × (търсене 1 – (ниво 0 + тенденция 0))

имайте предвид, че ниво 0 + тенденция 0е само прогноза в една стъпка от първоначалните стойности до месец 1, така че търсене 1 – (ниво 0 + тенденция 0)- това е едностъпково отклонение. По този начин уравнението за приближение на основно ниво ще бъде:

ниво текущ период = ниво предишен период + тренд предишен период + алфа × (текущ период на търсене – (ниво предишен период) + тенденция предишен период))

Уравнение за актуализиране на тенденцията:

текущ период на тенденция = предходен период на тенденция + гама × алфа × (текущ период на търсене – (ниво предишен период) + предишен период на тенденция))

Изглаждането на Holt в Excel е подобно просто изглаждане(Фиг. 7) и както по-горе, целта е да се намерят два коефициента чрез минимизиране на сумата от квадратните грешки (Фиг. 8). За да получите първоначалното ниво и стойностите на тенденцията (в клетки C5 и D5 на фигура 7), начертайте графика за първите 18 месеца на продажбите и добавете линия на тенденция с уравнение към нея. Въведете първоначалната стойност на тренда от 0,8369 и първоначалното ниво от 155,88 в клетки C5 и D5. Прогнозните данни могат да бъдат представени графично (фиг. 9).

ориз. 7. Експоненциално изглаждане на Холт с корекция на тренда; За да увеличите изображението, щракнете с десния бутон върху него и изберете Отворете изображението в нов раздел

Идентифициране на модели в данните

Има начин да се тества силата на предсказуемия модел - сравнете грешките със самите тях, изместени със стъпка (или няколко стъпки). Ако отклоненията са случайни, тогава моделът не може да бъде подобрен. Възможно е обаче да има сезонен фактор в данните за търсенето. Концепцията за термин за грешка, който е свързан със себе си версия на друг период, се нарича автокорелация (за повече информация относно автокорелацията вижте ). За да изчислите автокорелацията, започнете с данни за грешки в прогнозата за всеки период (колона F на фигура 7 се премества в колона B на фигура 10). След това дефинирайте средна грешкапрогноза (фиг. 10, клетка B39; формула в клетка: =СРЕДНО(B3:B38)). В колона C се изчислява отклонението на прогнозната грешка от средната стойност; формула в клетка C3: =B3-B$39. След това последователно преместете колона C с една колона надясно и ред надолу. Формули в клетки D39: =SUMPRODUCT($C3:$C38,D3:D38), D41: =D39/$C39, D42: =2/SQRT(36), D43: =-2/SQRT(36).

Какво означава една от колоните D:O да е „синхронна“ с колона C. Например, ако колони C и D са синхронни, тогава число, което е отрицателно в една от тях, трябва да бъде отрицателно в другата, положителна? в едно, положително в приятел. Това означава, че сборът от произведенията на двете колони ще бъде значителен (разликите се натрупват). Или, което е същото, отколкото по-близка стойноств диапазона D41:O41 до нула, толкова по-ниска е корелацията на колоната (съответно от D до O) с колона C (фиг. 11).

Една автокорелация по-висока критична стойност. Грешката, изместена с една година, корелира сама със себе си. Това означава 12-месечен сезонен цикъл. И това не е изненадващо. Ако погледнете графиката на търсенето (фиг. 2), се оказва, че има пикове в търсенето всяка Коледа и спадове през април-май. Нека разгледаме техника за прогнозиране, която отчита сезонността.

Мултипликативно експоненциално изглаждане на Holt-Winters

Методът се нарича мултипликативен (от multiplicate - умножавам), защото използва умножение, за да вземе предвид сезонността:

Търсене в момент t = (ниво + t × тенденция) × сезонна корекция за време t × всички оставащи нередовни корекции, които не можем да отчетем

Изглаждането на Holt-Winters се нарича още тройно експоненциално изглаждане, защото има три параметъра на изглаждане (алфа, гама и делта). Например, ако има 12-месечен сезонен цикъл:

Прогноза за месец 39 = (ниво 36 + 3 × тенденция 36) x сезонност 27

Когато се анализират данни, е необходимо да се установи какво е тенденция в серия от данни и какво е сезонност. За да извършите изчисления по метода на Holt-Winters, трябва:

  • Гладки исторически данни с помощта на метода на пълзящата средна.
  • Сравнете изгладена версия на времева серия от данни с оригинала, за да получите груба оценка на сезонността.
  • Вземете нови данни без сезонния компонент.
  • Намерете приближения за ниво и тенденция въз основа на тези нови данни.

Започнете с необработените данни (колони A и B на Фигура 12) и добавете колона C с изгладените пълзящи средни стойности. Тъй като сезонността има 12-месечни цикли, има смисъл да се използва 12-месечна средна стойност. Има малък проблем с тази средна стойност. 12 е четно число. Ако изгладите търсенето от месец 7, трябва ли да го считате за средно търсене от месеци 1 до 12 или от месеци 2 до 13? За да преодолеете тази трудност, трябва да изгладите търсенето с помощта на „2x12 подвижна средна“. Тоест, вземете половината от двете средни стойности от месеци 1 до 12 и от месеци 2 до 13. Формулата в клетка C8: =(СРЕДНО(B3:B14)+СРЕДНО(B2:B13))/2.

Изгладени данни за месеци 1–6 и 31–36 не могат да бъдат получени, тъй като няма достатъчно предишни и следващи периоди. За по-голяма яснота оригиналните и изгладени данни могат да бъдат отразени в диаграмата (фиг. 13).

Сега в колона D разделете първоначалната стойност на изгладената и получете приблизителната стойност за сезонна корекция (колона D на фиг. 12). Формулата в клетка D8 е =B8/C8. Обърнете внимание на скоковете от 20% над нормалното търсене през месеци 12 и 24 (декември), докато спадове се наблюдават през пролетта. Тази техника за изглаждане ви даде две точкови оценкиза всеки месец (общо 24 месеца). Колона E намира средната стойност на тези два фактора. Формула в клетка E1: =СРЕДНО(D14,D26). За по-голяма яснота нивото на сезонните колебания може да се представи графично (фиг. 14).

Сега могат да се получат сезонно изгладени данни. Формулата в клетка G1 е: =B2/E2. Изградете графика въз основа на данните в колона G, допълнете я с линия на тенденция, покажете уравнението на тенденцията на диаграмата (фиг. 15) и използвайте коефициентите в следващите изчисления.

Оформете нов лист, както е показано на фиг. 16. Заменете стойностите в диапазона E5:E16 от фиг. 12 области E2:E13. Вземете стойностите на C16 и D16 от уравнението на тренд линията на фиг. 15. Задайте стойностите на изглаждащите константи да започват от 0,5. Разтегнете стойностите в ред 17, за да покриете диапазона от месеци 1 до 36. Изпълнете Намиране на решениеза оптимизиране на коефициентите на изглаждане (фиг. 18). Формулата в клетка B53 е: =(C$52+(A53-A$52)*D$52)*E41.

Сега трябва да проверите автокорелациите в направената прогноза (фиг. 18). Тъй като всички стойности са разположени между горната и долната граница, разбирате, че моделът е свършил добра работа за разбиране на структурата на стойностите на търсенето.

Изграждане на доверителен интервал за прогнозата

И така, имаме напълно работеща прогноза. Как задавате горни и долни граници, които могат да се използват за правене на реалистични предположения? Симулацията Монте Карло, с която вече сте се сблъсквали (вижте също), ще ви помогне с това. Идеята е да се генерират бъдещи сценарии на поведение на търсенето и да се идентифицира групата, в която попадат 95% от тях.

Премахнете прогнозата от клетки B53:B64 от листа на Excel (вижте Фиг. 17). Ще запишете търсенето там въз основа на симулацията. Последният може да се генерира с помощта на функцията NORMINV. За следващите месеци просто трябва да му предоставите средната стойност (0), стандартното разпределение (10,37 от клетка $H$2) и произволно числоот 0 до 1. Функцията ще върне отклонението с вероятност, съответстваща на камбанообразна крива. Поставете симулацията на грешка в една стъпка в клетка G53: =NORMIN(RAND(),0,H$2). Разтегнете тази формула до G64 и ще получите симулации на грешки в прогнозата за 12 месеца прогноза в една стъпка (Фигура 19). Вашите симулационни стойности ще се различават от тези, показани на фигурата (ето защо това е симулация!).

С несигурността на прогнозата имате всичко необходимо за актуализиране на нивото, тенденцията и сезонния коефициент. Затова изберете клетки C52:F52 и ги разтегнете до ред 64. В резултат на това имате симулирана грешка в прогнозата и самата прогноза. Въз основа на обратното можем да предвидим стойностите на търсенето. Вмъкнете формулата в клетка B53: =F53+G53 и я разтегнете до B64 (фиг. 20, диапазон B53:F64). Сега можете да натиснете бутона F9, актуализирайки прогнозата всеки път. Поставете резултатите от 1000 симулации в клетки A71:L1070, като всеки път транспонирате стойностите от диапазона B53:B64 в диапазона A71:L71, A72:L72, ... A1070:L1070. Ако това ви притеснява, напишете малко VBA код.

Сега имате 1000 сценария за всеки месец и можете да използвате функцията PERCENTILE, за да получите горната и долната граница в средата на 95% доверителен интервал. В клетка A66 формулата е: =ПЕРЦЕНТИЛ(A71:A1070,0,975), а в клетка A67: =ПЕРЦЕНТИЛ(A71:A1070,0,025).

Както обикновено, за яснота, данните могат да бъдат представени графично (фиг. 21).

Има две интересни точки в графиката:

  • Грешката става по-широка с времето. Това има смисъл. Несигурността се натрупва с всеки изминал месец.
  • По същия начин грешката се увеличава в части, падащи през периоди на сезонно увеличение на търсенето. С последващото си падане грешката се свива.

Написано по книгата на Джон Форман. – М.: Alpina Publisher, 2016. – С. 329–381

Експоненциалното изглаждане е по-сложен среднопретеглен метод. Всяка нова прогноза се основава на предишната прогноза плюс процента на разликата между тази прогноза и действителната стойност на серията в този момент.

F t = F t -1 + (A t -1 - F t -1) (2)

където: Ft – прогноза за период t

F t -1– прогноза за период t-1

– изглаждаща константа

A t - 1 – реално търсене или продажби за периода t-1

Изглаждащата константа е процент от прогнозната грешка. Всяка нова прогноза е равна на предишната прогноза плюс процент от предишната грешка.

Чувствителността на корекцията на прогнозата към грешка се определя от константата на изглаждане, колкото по-близка е нейната стойност до 0, толкова по-бавно прогнозата ще се адаптира към грешките на прогнозата (т.е. колкото по-голяма е степента на изглаждане). Обратно, колкото по-близо е стойността до 1,0, толкова по-висока е чувствителността и по-малко изглаждане.

Изборът на изглаждаща константа до голяма степен е въпрос на свободен избор или проба и грешка. Целта е да се избере изглаждаща константа, така че, от една страна, прогнозата да остане достатъчно чувствителна към реални промени в данните от времевия ред, а от друга страна, да изглади добре скоковете, причинени от случайни фактори. Често използваните стойности варират от 0,05 до 0,50.

Експоненциалното изглаждане е един от най-широко използваните методи за прогнозиране, отчасти поради минималните изисквания за съхранение на данни и лекотата на изчисление, и отчасти поради лекотата, с която системата от коефициенти на значимост може да бъде променена просто чрез промяна на стойността на .

Таблица 3. Експоненциално изглаждане

Точка Действително търсене α = 0,1 α = 0,4
прогноза грешка прогноза грешка
10 000 - - - -
11 200 10 000 11 200-10 000=1 200 10 000 11 200-10 000=1 200
11 500 10 000+0,1(11 200-10 000)=10 120 11 500-10 120=1 380 10 000+0,4(11 200-10 000)=10 480 11 500-10 480=1 020
13 200 10 120+0,1(11 500-10 120)=10 258 13 200-10 258=2 942 10 480+0,4(11 500-10 480)=10 888 13 200-10 888=2 312
14 500 10 258+0,1(13 200-10 258)=10 552 14 500-10 552=3 948 10 888+0,4(13 200-10 888)=11 813 14 500-11 813=2 687
- 10 552+0,1(14 500-10 552)=10 947 - 11 813+0,4(14 500-11 813)=12 888 -



Методи за тенденция

Има две важни методи, който може да се използва за разработване на прогнози, когато има тенденция. Един от тях включва използването на уравнение на тренда; друг – разширяване на експоненциалното изглаждане.

Уравнение на тенденцията:

Линейно уравнениетенденциите изглеждат така:

Y t = a + δ∙ t (3)

където: t – категоричен брой периодиот време на време t= 0;

Yt– прогноза за периода t;

α - значение Ytпри t=0

δ – наклон на линията.

Директни коефициенти α И δ , може да се изчисли от статистически данни за определен период, като се използват следните две уравнения:

δ= , (4)

α = , (5)

където: п – брой периоди,

г– стойност на динамичния ред

Таблица 3. Ниво на тенденция.

Период (t) година Ниво на продажби (y) t∙y t 2
10 000 10 000
11 200 22 400
11 500 34 500
13 200 52 800
14 500 72 500
Общо: - 60 400 192 200

Нека изчислим коефициентите на тренд линията:

δ=

И така, линията на тренда Y t = α + δ ∙ t

в нашия случай, Y t = 43 900+1 100 ∙t,

Къде t = 0за период 0.

Нека създадем уравнение за периоди 6 (2015) и 7 (2016):

– прогноза за 2015г.

Y 7 = 43 900+1 100*7 = 51 600

Нека изградим графика:

Експоненциално изглаждане на тенденциите

Може да се използва форма на просто експоненциално изглаждане, когато времевият ред разкрие тенденция. Тази вариация се нарича трендово експоненциално изглаждане или понякога двойно изглаждане. Различава се от обикновеното експоненциално изглаждане, което се използва само когато данните варират около някаква средна стойност или имат резки или постепенни промени.

Ако серия показва тенденция и се използва просто експоненциално изглаждане, тогава всички прогнози ще изостават от тенденцията. Например, ако данните се увеличат, тогава всяка прогноза ще бъде подценена. Напротив, намаляването на данните дава надценена прогноза. Графичното показване на данните може да покаже кога двойното изглаждане би било за предпочитане пред единичното изглаждане.

Коригираната спрямо тенденцията прогноза (TAF) се състои от два елемента: изгладена грешка и коефициент на тенденция.

TAF t +1 = S t + T t, (6)

където: S t – изгладена прогноза;

T t – оценка на текущата тенденция

И S t = TAF t + α 1 (A t - TAF t) , (7)

T t = T t-1 + α 2 (TAF t –TAF t-1 – T t-1) (8)

Къде α 1, α 2– изглаждащи константи.

За да използвате този метод, трябва да изберете стойностите на α 1, α 2 (чрез обичайния избор) и да направите първоначална прогнозаи оценка на тенденциите.

Таблица 4. Експоненциална тенденция на изглаждане.

Прост и логически ясен модел на времеви редове изглежда така:

Къде b е константа и ε - случайна грешка. Константа b е относително стабилен във всеки интервал от време, но може също така да се променя бавно с течение на времето. Един от интуитивните начини за подчертаване на смисъла b на данните е да се използва изглаждане на пълзяща средна, при което на най-новите наблюдения се присвояват по-големи тегла от предпоследните, на предпоследните по-големи тегла от предпоследните и т.н. Простото експоненциално изглаждане е проектирано точно по този начин. Тук експоненциално намаляващи тегла се присвояват на по-стари наблюдения и, за разлика от подвижната средна, всички предишни наблюдения от серията се вземат предвид, а не само тези, които попадат в определен прозорец. Точната формула за просто експоненциално изглаждане е:

Когато тази формула се прилага рекурсивно, всяка нова изгладена стойност (която също е прогноза) се изчислява като среднопретеглената стойност на текущото наблюдение и изгладената серия. Очевидно резултатът от изглаждането зависи от параметъра α . Ако α е равно на 1, тогава предишните наблюдения се игнорират напълно. Ако a е 0, тогава текущите наблюдения се игнорират. Ценности α между 0 и 1 дават междинни резултати. Емпирични изследванияпоказа, че простото експоненциално изглаждане често дава достатъчно точна прогноза.

На практика обикновено се препоръчва да се α по-малко от 0,30. Въпреки това, изборът на по-голямо от 0,30 понякога дава по-точна прогноза. Това означава, че е по-добре да се оцени оптимална стойност α въз основа на реални данни, а не на общи препоръки.

На практика оптималният параметър за изглаждане често се намира с помощта на процедура за търсене в мрежа. Възможният диапазон от стойности на параметрите е разделен на решетка с определена стъпка. Например, помислете за мрежа от стойности от α =0,1 до α = 0,9 със стъпки от 0,1. След това се избира тази стойност α , за които сумата от квадратите (или средните квадрати) на остатъците (наблюдавани стойности минус предсказания за стъпка напред) е минимална.

Microsoft Excelима функция за експоненциално изглаждане, която обикновено се използва за изглаждане на нивата на емпиричен времеви ред въз основа на простия метод на експоненциално изглаждане. За да извикате тази функция, изберете командата Инструменти - Анализ на данни от лентата с менюта. На екрана ще се отвори прозорецът Data Analysis, в който трябва да изберете стойността на Exponential smoothing. В резултат на това ще се появи диалогов прозорец Експоненциално изглаждане, представена на фиг. 11.5.


В диалоговия прозорец Експоненциално изглаждане се задават почти същите параметри като в диалоговия прозорец Плъзгаща средна, обсъден по-горе.

1. Диапазон на въвеждане - в това поле се въвежда диапазонът от клетки, съдържащи стойностите на параметъра, който се изследва.

2. Етикети - отметката на тази опция се поставя, ако първият ред (колона) във входния диапазон съдържа заглавие. Ако няма заглавие, отметката трябва да бъде изчистена. В този случай автоматично ще бъдат създадени стандартни имена за данните за изходния диапазон.

3. Коефициент на затихване - в това поле се въвежда стойността на избрания експоненциален коефициент на изглаждане α . Стойността по подразбиране е α = 0,3.

4. Опции за изход - в тази група, освен че можете да посочите диапазона от клетки за изходните данни в полето Изходен диапазон, можете също да поискате диаграмата да се генерира автоматично, като поставите отметка на опцията Изход на диаграмата, и да изчислите стандартните грешки, като поставите отметка опцията Стандартни грешки.

Нека използваме функцията Експоненциално изглажданеза повторно решаване на проблема, обсъден по-горе, но с помощта на метода на просто експоненциално изглаждане. Избраните стойности на параметрите на изглаждане са представени на фиг. 11.5. На фиг. 11.6 са показани изчислените показатели, а на фиг. 11.7 - построени графики.

Тема 3. Изглаждане и прогнозиране на времеви редове на база тренд модели

Целизучаването на тази тема е да се създаде базова база за обучение на мениджъри по специалност 080507 в областта на моделирането различни задачив областта на икономиката, развивайки у студентите системен подход при поставяне и решаване на прогнозни проблеми. Предложеният курс ще позволи на специалистите бързо да се адаптират към практическата работа, да се ориентират по-добре в научна и техническа информация и литература по своята специалност и да бъдат по-уверени при вземането на решения, които възникват в работата им.

Основен задачиизучаване на темата са: студентите получават задълбочени теоретични знания за използването на прогнозни модели, придобиват устойчиви умения за извършване на изследователска работа, способността за решаване на сложни научни проблеми, свързани с изграждането на модели, включително многоизмерни, способността за логически анализ получените резултати и определя начини за намиране на приемливи решения.

достатъчно прост методидентифицирането на тенденциите на развитие е изглаждане на времевия ред, т.е. замяна на действителните нива с изчислени, които имат по-малки вариации от оригиналните данни. Съответната трансформация се нарича филтриране. Нека разгледаме няколко метода за изглаждане.

3.1. Прости средни стойности

Целта на изглаждането е да се изгради прогнозен модел за следващи периоди въз основа на минали наблюдения. При метода на прости средни стойности първоначалните данни се приемат като стойности на променливата Yв моменти от време t, а прогнозната стойност се определя като проста средна стойност за следващия период от време. Формула за изчислениеизглежда като

Къде пброй наблюдения.

Когато стане достъпно ново наблюдение, новополучената прогноза трябва да се вземе предвид при прогнозиране за следващия период. Когато се използва този метод, прогнозата се прави чрез осредняване на всички предишни данни, но недостатъкът на такова прогнозиране е трудността при използването му в модели на тенденции.

3.2. Метод на подвижната средна

Този метод се основава на представяне на серия като сума от сравнително плавен тренд и произволен компонент. Методът се основава на идеята за изчисляване на теоретична стойност въз основа на локално приближение. Да се ​​изгради оценка на тренда в точка tвъз основа на серийни стойности от времевия интервал изчислете теоретичната стойност на серията. Най-разпространеният случай в практиката на изглаждащите серии е, когато всички тегла за елементите на интервала са равни помежду си. Поради тази причина този метод се нарича метод на пълзяща средна,тъй като при извършване на процедурата прозорец с ширина от (2 м + 1)по целия ред. Ширината на прозореца обикновено се приема нечетна, тъй като се изчислява теоретичната стойност централно значение: брой термини k = 2m + 1с еднакъв брой нива отляво и отдясно на момента t.

Формулата за изчисляване на подвижната средна в този случай приема формата:

Дисперсията на подвижната средна се определя като σ 2 /k,къде през σ 2обозначава дисперсията на оригиналните членове на серията, и кинтервал на изглаждане, следователно колкото по-голям е интервалът на изглаждане, толкова по-силно е осредняването на данните и толкова по-малко променлива е идентифицираната тенденция. Най-често изглаждането се извършва с помощта на три, пет и седем члена на оригиналната серия. В този случай трябва да се вземат предвид следните характеристики на плъзгащата се средна: ако разгледаме серия с периодични колебания с постоянна дължина, тогава при изглаждане на базата на пълзяща средна с интервал на изглаждане, равен или кратен на периода, флуктуациите ще бъдат напълно елиминирани. Често изглаждането въз основа на пълзяща средна трансформира серията толкова силно, че идентифицираната тенденция на развитие се появява само в най- общ контур, а по-малките, но важни за анализа детайли (вълни, завои и др.) изчезват; след изглаждане малките вълни понякога могат да променят посоката си към противоположните „дупки“ да се появят на мястото на „върхове“ и обратно. Всичко това изисква предпазливост при използването на проста подвижна средна и ни принуждава да търсим по-фини методи за описание.

Методът на пълзящата средна не предоставя стойности на тренда за първата и последната мчленове на поредицата. Този недостатък е особено забележим, когато дължината на реда е малка.

3.3. Експоненциално изглаждане

Експоненциална средна стойност y tе пример за асиметрична претеглена пълзяща средна, която отчита степента на стареене на данните: по-старата информация с по-малко тегло е включена във формулата за изчисляване на изгладената стойност на нивото на серията

тук — експоненциална средна, заместваща наблюдаваната стойност на серията y t(изглаждането включва всички данни, получени до момента t), α изглаждащ параметър, характеризиращ тежестта на текущото (най-новото) наблюдение; 0< α <1.

Методът се използва за прогнозиране на нестационарни времеви редове със случайни промени в нивото и наклона. Докато се движим по-далеч в миналото от текущия момент във времето, теглото на съответния член на серията бързо (експоненциално) намалява и на практика престава да оказва влияние върху стойността.

Лесно е да се разбере, че последното отношение ни позволява да дадем следната интерпретация на експоненциалната средна: ако — прогноза за серийната стойност y t, тогава разликата е грешката на прогнозата. По този начин прогнозата за следващия момент във времето t+1взема предвид станалото известно в момента tгрешка в прогнозата.

Параметър за изглаждане α е тегловен фактор. В случай α е близо до единица, тогава прогнозата значително отчита големината на грешката на последната прогноза. При малки стойности α прогнозираната стойност е близка до предишната прогноза. Изборът на параметър за изглаждане е доста сложен проблем. Общите съображения са следните: методът е добър за прогнозиране на сравнително гладки серии. В този случай можете да изберете изглаждаща константа, като минимизирате прогнозната грешка с една стъпка напред, изчислена от последната трета от серията. Някои експерти не препоръчват използването на големи стойности на параметъра за изглаждане. На фиг. Фигура 3.1 показва пример на изгладена серия, използваща метода на експоненциално изглаждане с α= 0,1.

ориз. 3.1. Резултатът от експоненциалното изглаждане при α =0,1
(1 оригинална серия; 2 изгладени серии; 3 остатъка)

3.4. Експоненциално изглаждане
като се вземе предвид тенденцията (метод на Холт)

Този метод отчита местната линейна тенденция, присъстваща във времевия ред. Ако има възходяща тенденция във времевия ред, тогава наред с оценката на текущото ниво е необходима и оценка на наклона. В техниката на Holt стойностите на нивото и наклона се изглаждат директно чрез използване на различни константи за всеки параметър. Постоянното изглаждане ви позволява да оцените текущото ниво и наклон, като ги прецизирате всеки път, когато се появят нови наблюдения.

Методът на Holt използва три формули за изчисление:

  1. Експоненциално изгладена серия (оценка на текущото ниво)

(3.2)

  1. Оценка на тенденцията

(3.3)

  1. Прогноза за rпериоди напред

(3.4)

Къде α, β изглаждащи константи от интервала.

Уравнение (3.2) е подобно на уравнение (3.1) за просто експоненциално изглаждане, с изключение на члена на тренда. Константа β необходими за изглаждане на оценката на тенденцията. В прогнозното уравнение (3.3) прогнозната тенденция се умножава по броя на периодите r, на който се основава прогнозата, след което този продукт се добавя към текущото ниво на изгладени данни.

Постоянно α И β се избират субективно или чрез минимизиране на грешката при прогнозиране. Колкото по-големи са теглата, толкова по-бързо ще се реагира на промените и толкова по-плавни ще бъдат данните. По-малките тегла правят структурата на изгладените стойности по-малко гладка.

На фиг. 3.2 показва пример за изглаждане на серия с помощта на метода на Holt със стойности α И β , равно на 0,1.

ориз. 3.2. Резултатът от изглаждането по метода на Холт
при α = 0,1 И β = 0,1

3.5. Експоненциално изглаждане, като се вземат предвид тенденцията и сезонните вариации (метод на Winters)

Когато има сезонни вариации в структурата на данните, трипараметърният експоненциален изглаждащ модел, предложен от Winters, се използва за намаляване на грешките в прогнозата. Този подход е разширение на предишния модел на Холт. За да се отчетат сезонните вариации, тук се използва допълнително уравнение и този метод е напълно описан от четири уравнения:

  1. Експоненциално изгладени серии

(3.5)

  1. Оценка на тенденцията

(3.6)

  1. Оценка на сезонността

.

(3.7)

  1. Прогноза за rпериоди напред

(3.8)

Къде α, β, γ постоянно изглаждане за ниво, тенденция и сезонност, съответно; s- продължителност на периода на сезонни колебания.

Уравнение (3.5) коригира изгладената серия. Терминът в това уравнение взема предвид сезонността в изходните данни. След като се вземат предвид сезонността и тенденцията в уравнения (3.6), (3.7), оценките се изглаждат и се прави прогноза в уравнение (3.8).

Същото като в предишния метод, тежестите α, β, γ могат да бъдат избрани субективно или чрез минимизиране на грешката при прогнозиране. Преди да приложите уравнение (3.5), е необходимо да определите началните стойности за изгладената серия Лейтенант, тенденция T t, коефициенти на сезонност S t. Обикновено първоначалната стойност на изгладената серия се приема равна на първото наблюдение, тогава тенденцията е равна на нула, а коефициентите на сезонност се задават равни на единица.

На фиг. Фигура 3.3 показва пример за изглаждане на серия с помощта на метода Winters.

ориз. 3.3. Резултат от изглаждане по метода Winters
при α = 0,1 = 0,1; γ = 0,1(1 - оригинална серия; 2 изгладени серии; 3 остатъци)

3.6. Прогнозиране на база трендови модели

Доста често времевите редове имат линеен тренд (тренд). Приемайки линеен тренд, е необходимо да се изгради права линия, която най-точно да отразява промяната в динамиката през разглеждания период. Има няколко метода за конструиране на права линия, но най-обективната от формална гледна точка ще бъде конструкцията, основана на минимизиране на сумата от отрицателни и положителни отклонения на първоначалните стойности на серията от правата линия.

Права линия в двукоординатна система (x,y)може да се определи от пресечната точка на една от координатите прии ъгъл на наклон спрямо оста X.Уравнението на такава линия ще изглежда така Къде а-пресечна точка; bъгъл на наклон.

За да може правата линия да отразява хода на динамиката, е необходимо да се сведе до минимум сумата от вертикални отклонения. Когато се използва проста сума от отклонения като критерий за оценка на минимизирането, резултатът няма да бъде много добър, тъй като отрицателните и положителните отклонения взаимно се компенсират. Минимизирането на сумата от абсолютни стойности също не води до задоволителни резултати, тъй като оценките на параметрите в този случай са нестабилни и има и изчислителни трудности при прилагането на такава процедура за оценка. Следователно най-често използваната процедура е да се минимизира сумата на квадратните отклонения или метод на най-малките квадрати(MNC).

Тъй като серията от начални стойности има колебания, моделът на серията ще съдържа грешки, чиито квадрати трябва да бъдат сведени до минимум

където y i наблюдавана стойност; y i * теоретични стойности на модела; номер на наблюдение.

Когато моделираме тренда на оригиналния времеви ред с помощта на линеен тренд, ние приемаме това

Разделяйки първото уравнение на п, стигаме до следващия

Заместване на получения израз във второто уравнение на системата (3.10), за коефициента б*получаваме:

3.7. Проверка на годността на модела

Като пример на фиг. 3.4 показва линейна регресионна графика между мощността на автомобила Xи цената му при.

ориз. 3.4. График на линейна регресия

Уравнението за този случай е: при=1455,3 + 13,4 X. Визуалният анализ на тази фигура показва, че за редица наблюдения има значителни отклонения от теоретичната крива. Остатъчната диаграма е показана на фиг. 3.5.

ориз. 3.5. Балансова диаграма

Анализът на остатъците от регресионната линия може да осигури полезна мярка за това колко добре изчислената регресия отразява действителните данни. Добрата регресия е тази, която обяснява значителна част от дисперсията и, обратно, лошата регресия не проследява голямо количество вариации в оригиналните данни. Интуитивно е ясно, че всяка допълнителна информация ще подобри модела, т.е. ще намали необяснимата част от вариацията в променливата при. За да анализираме регресията, ще разложим дисперсията на компоненти. Очевидно е, че

Последният член ще бъде равен на нула, тъй като представлява сумата от остатъците, така че стигаме до следния резултат

Къде SS 0, SS 1, SS 2определяне на общата, регресионната и остатъчната сума на квадратите, съответно.

Регресионната сума на квадратите измерва частта от дисперсията, обяснена с линейна връзка; остатъчна част от дисперсията, която не се обяснява с линейна зависимост.

Всяка от тези суми се характеризира със съответния брой степени на свобода (DOF), което определя броя на единиците данни, независими една от друга. С други думи, сърдечната честота е свързана с броя на наблюденията пи броя на параметрите, изчислени от съвкупността от данни. В разглеждания случай да се изчисли SS 0 се определя само една константа (средната стойност), следователно сърдечната честота за SS 0 ще бъде 1), Пулс за SS 2 – (n – 2)и сърдечната честота за SS 1ще бъде n – (n – 1)=1, тъй като има n – 1 постоянни точки в регресионното уравнение. Точно като сумата на квадратите, сърдечните честоти са свързани с връзката

Сумите на квадратите, свързани с разлагането на дисперсията, заедно със съответните HR, могат да бъдат поставени в така наречената таблица за анализ на дисперсията (ANOVA таблица ANalysis Of VAriance) (Таблица 3.1).

Таблица 3.1

ANOVA таблица

Източник

Сбор на квадрати

Среден квадрат

Регресия

SS 2/(n-2)

Използвайки въведеното съкращение за суми от квадрати, определяме коефициент на детерминациякато съотношението на сумата от квадратите на регресията към общата сума от квадратите във формуляра

(3.13)

Коефициентът на детерминация измерва дела на променливостта на променливата Y, което може да се обясни с помощта на информация за променливостта на независимата променлива X.Коефициентът на детерминация се променя от нула, когато Xне влияе Y,до един, когато промяната Yнапълно обяснено от промяната X.

3.8. Регресионен прогнозен модел

Най-добрата прогноза е тази с минимално отклонение. В нашия случай обикновеният OLS произвежда най-добрата прогноза от всички методи, които произвеждат безпристрастни оценки въз основа на линейни уравнения. Прогнозната грешка, свързана с процедурата за прогнозиране, може да дойде от четири източника.

Първо, случайният характер на адитивните грешки, обработвани от линейна регресия, гарантира, че прогнозата ще се отклонява от истинските стойности, дори ако моделът е правилно зададен и неговите параметри са точно известни.

Второ, самият процес на оценка внася грешка в оценката на параметрите; те рядко могат да бъдат равни на истинските стойности, въпреки че средно са равни на тях.

На трето място, в случай на условна прогноза (в случай на точно неизвестни стойности на независимите променливи), се въвежда грешка с прогнозата на обяснителните променливи.

Четвърто, може да възникне грешка, защото спецификацията на модела е неточна.

В резултат на това източниците на грешка могат да бъдат класифицирани, както следва:

  1. характер на променливата;
  2. характер на модела;
  3. грешка, въведена от прогнозата на независими случайни променливи;
  4. грешка в спецификацията.

Ще разгледаме безусловна прогноза, когато независимите променливи се прогнозират лесно и точно. Нека започнем да разглеждаме проблема с качеството на прогнозата със сдвоеното регресионно уравнение.

Постановката на проблема в този случай може да се формулира по следния начин: каква ще бъде най-добрата прогноза y T+1, при условие че в модела y = a + bxпараметри АИ bсе оценяват точно и стойността x T+1известен.

Тогава прогнозираната стойност може да се определи като

Грешката в прогнозата ще бъде

.

Грешката на прогнозата има две свойства:

Получената дисперсия е минимална сред всички възможни оценки, базирани на линейни уравнения.

въпреки че Аи b са известни, грешката в прогнозата се появява поради факта, че при Т+1може да не лежи на линията на регресия поради грешка ε T+1, предмет на нормално разпределение с нулева средна стойност и дисперсия σ 2. За да проверим качеството на прогнозата, въвеждаме нормализирана стойност

След това можете да определите 95% доверителен интервал, както следва:

Къде β 0,05квантили на нормалното разпределение.

Границите на интервала от 95% могат да бъдат определени като

Имайте предвид, че в този случай ширината доверителен интервалне зависи от размера X,а границите на интервала са прави линии, успоредни на линията на регресия.

По-често, когато се конструира регресионна линия и се проверява качеството на прогнозата, е необходимо да се оценят не само регресионните параметри, но и дисперсията на прогнозната грешка. Може да се покаже, че в този случай дисперсията на грешката зависи от стойността (), където е средната стойност на независимата променлива. Освен това, колкото по-дълъг е сериалът, толкова по-точна е прогнозата. Грешката на прогнозата намалява, ако стойността на X T+1 е близо до средната стойност на независимата променлива и, обратно, когато се отдалечава от средната стойност, прогнозата става по-малко точна. На фиг. Фигура 3.6 показва резултатите от прогнозата, използвайки уравнение на линейна регресия за 6 времеви интервала напред, заедно с доверителните интервали.

ориз. 3.6. Прогноза чрез уравнение на линейна регресия

Както се вижда от фиг. 3.6, тази линия на регресия не описва оригиналните данни достатъчно добре: има голяма вариация спрямо линията на напасване. За качеството на модела може да се съди и по остатъците, които, ако моделът е задоволителен, трябва да се разпределят приблизително по нормалния закон. На фиг. Фигура 3.7 показва графика на остатъците, конструирана с помощта на вероятностна скала.

Фиг.3.7. Балансова диаграма

Когато се използва такава скала, данните, които се подчиняват на нормалния закон, трябва да лежат на права линия. Както следва от горната фигура, точките в началото и края на периода на наблюдение се отклоняват до известна степен от правата линия, което показва, че избраният модел под формата на уравнение на линейна регресия не е с достатъчно високо качество.

В табл Таблица 3.2 показва прогнозните резултати (втора колона) заедно с 95% доверителни интервали (съответно долна трета и горна четвърта колона).

Таблица 3.2

Прогнозни резултати

3.9. Многовариантен регресионен модел

При многовариантна регресия данните за всеки случай включват стойностите на зависимата променлива и всяка независима променлива. Зависима променлива гтова е случайна променлива, свързана с независимите променливи чрез следната връзка:

където трябва да се определят коефициентите на регресия; ε компонент на грешката, съответстващ на отклонението на стойностите на зависимата променлива от истинската връзка (приема се, че грешките са независими и имат нормално разпределение с нулево математическо очакване и неизвестна дисперсия σ ).

За даден набор от данни оценките на регресионните коефициенти могат да бъдат намерени с помощта на OLS. Ако оценките на OLS са означени с , тогава съответната регресионна функция ще има формата:

Остатъците са оценки на компонента на грешката и са подобни на остатъците в случай на проста линейна регресия.

Статистическият анализ на многовариантен регресионен модел се извършва подобно на обикновения линеен регресионен анализ. Стандартните пакети за статистически софтуер правят възможно получаването на OLS оценки за параметрите на модела и оценките на техните стандартни грешки. Като алтернатива можете да получите стойността t-статистика за проверка на значимостта на отделните членове на регресионния модел и стойността Е-статистика за проверка на значимостта на регресионната зависимост.

Формата на разделяне на сумите на квадратите в случай на многовариантна регресия е подобна на израза (3.13), но връзката за сърдечната честота ще бъде както следва

Нека подчертаем още веднъж, че ппредставлява обема на наблюденията и кброй променливи в модела. Общата вариация на зависима променлива се състои от два компонента: вариацията, обяснена от независимите променливи чрез регресионната функция, и необяснимата вариация.

Таблицата ANOVA за случая на многовариантна регресия ще има формата, показана в табл. 3.3.

Таблица 3.3

ANOVA таблица

Източник

Сбор на квадрати

Среден квадрат

Регресия

SS 2/(n-k-1)

Като пример за многовариантна регресия ще използваме данни от пакета Statistica (файл с данни Бедност.Sta)Представените данни са базирани на сравнение на резултатите от преброяването от 1960 г. и 1970 г. за произволна извадка от 30 страни. Имената на държавите бяха въведени като имена на низове и имената на всички променливи в този файл са дадени по-долу:

POP_CHNG изменение на населението за 1960-1970 г.;

N_EMPLD брой на заетите в селското стопанство;

PT_POOR процент семейства, живеещи под прага на бедността;

TAX_RATE данъчна ставка;

PT_PHONE процент апартаменти с телефон;

PT_RURAL процент от селското население;

ВЪЗРАСТ средна възраст.

Като зависима променлива избираме знака Pt_Poor, а като независими - всички останали. Изчислените коефициенти на регресия между избраните променливи са дадени в табл. 3.4

Таблица 3.4

Коефициенти на регресия

Тази таблица показва регресионните коефициенти ( IN) и стандартизирани регресионни коефициенти ( Бета). Използване на коефициенти INсе установява формата на регресионното уравнение, което в този случай има формата:

Включването само на тези променливи от дясната страна се дължи на факта, че само тези знаци имат вероятностна стойност rпо-малко от 0,05 (вижте четвъртата колона на таблица 3.4).

Библиография

  1. Басовски Л. Е.Прогнозиране и планиране в пазарни условия. – М.: Инфра – М, 2003.
  2. Бокс Дж., Дженкинс Г.Анализ на времеви редове. Брой 1. Прогноза и управление. – М.: Мир, 1974.
  3. Боровиков В. П., Ивченко Г. И.Прогнозиране в системата Statistica в Windows среда. – М.: Финанси и статистика, 1999.
  4. херцог В.Обработка на данни на компютър в примери. – Санкт Петербург: Питър, 1997.
  5. Ивченко Б. П., Мартищенко Л. А., Иванцов И. Б.Информационна микроикономика. Част 1. Методи за анализ и прогнозиране. – Санкт Петербург: Нордмед-Издат, 1997.
  6. Кричевски М. Л.Въведение в изкуствените невронни мрежи: Учебник. надбавка. – СПб.: СПб. състояние морска техника. университет, 1999.
  7. Сошникова Л. А., Тамашевич В. Н., Уебе Г. и др.Многомерен статистически анализ в икономиката. – М.: Единство-Дана, 1999.


Ново в сайта

>

Най-популярни