Додому Ортопедія Розробка прогнозу за допомогою методу ковзної середньої. Приклад розв'язання задачі

Розробка прогнозу за допомогою методу ковзної середньої. Приклад розв'язання задачі

Поглиблений аналіз часових рядів потребує більш складних методик математичної статистики. За наявності в динамічних рядах значної випадкової помилки (шуму) застосовують один із двох простих прийомів- згладжування або вирівнювання шляхом укрупнення інтервалу обчислення групових середніх. Цей метод дозволяє підвищити наочність низки, якщо більшість «шумових» складових перебувають усередині інтервалів. Однак, якщо «шум» не узгоджується з періодичністю, розподіл рівнів показників стає грубим, що обмежує можливості детального аналізузміни явища у часі.

Точніші характеристики виходять, якщо використовують ковзні середні - широко застосовуваний спосіб для згладжування показників середнього ряду. Він ґрунтується на переході від початкових значень ряду до середніх у певному інтервалі часу. У цьому випадку інтервал часу при обчисленні кожного наступного показника ковзає по тимчасовому ряду.

Застосування ковзного середнього корисно при невизначених тенденціях динамічного ряду або при сильному впливі на показники викидів, що циклічно повторюються (різно виділяються варіанти або інтервенція).

Чим більший інтервал згладжування, тим паче плавний вигляд має діаграма ковзних середніх. При виборі величини інтервалу згладжування необхідно виходити з величини динамічного ряду і змістовного сенсу динаміки, що відображається. Велика величина динамічного ряду з більшим числом вихідних точокдозволяє використовувати більші часові інтервали згладжування (5, 7, 10 і т.д.). Якщо процедура ковзного середнього використовується для не сезонного згладжування ряду, то найчастіше величину інтервалу згладжування приймають рівною 3 або 5. https://tvoipolet.ru/iz-moskvi-v-nyu-jork/ - відмінна можливість вибрати авіакомпанію на переліт з Москви у Нью-Йорк

Наведемо приклад обчислення ковзної середньої кількості господарств з високою врожайністю (понад 30 ц/га) (табл. 10.3).

Таблиця 10.3 Згладжування динамічного ряду укрупненням інтервалів і ковзним середнім

Обліковий рік

Число господарств з високою врожайністю

Суми за три роки

Ковзаючі за три роки

Ковзаючі середні

90,0

89,7

1984

88,7

87,3

87,3

87,0

86,7

83,0

83,0

82,3

82,3

82,6

82,7

82,7

Приклади обчислення ковзного середнього:

1982 (84 + 94 + 92) / 3 = 90,0;

1983 (94 + 92 + 83) / 3 = 89,7;

1984 (92 + 83 + 91) / 3 = 88,7;

1985 (83 + 91 + 88) / 3 = 87,3.

Складається графік. На осі абсцис вказуються роки, на осі ординат – кількість господарств із високою врожайністю. Вказуються координати числа господарств на графіку та з'єднують отримані точки ламаною лінією. Потім вказуються координати ковзної середньої за роками на графіці і з'єднуються точки плавною напівжирною лінією.

Більш складним та результативним методомє згладжування (вирівнювання) рядів динаміки за допомогою різних функційапроксимації. Вони дозволяють формувати плавний рівень загальної тенденції та основну вісь динаміки.

Найбільш ефективним методомзгладжування за допомогою математичних функцій є просте експоненційне згладжування. Цим методом враховуються всі попередні спостереження низки за такою формулою:

S t = α∙X t + (1 - α ) ∙S t - 1 ,

де S t - кожне нове згладжування в момент часу t; S t - 1 - згладжене значення попереднього часу t -1; X t - фактичне значення ряду в момент часу t; α – параметр згладжування.

Якщо α = 1, попередні спостереження повністю ігноруються; за величиною α = 0 ігноруються поточні спостереження; значення між 0 і 1 дають проміжні результати. Змінюючи значення цього параметра можна підібрати найбільш прийнятний варіант вирівнювання. Вибір оптимального значення α здійснюється шляхом аналізу отриманих графічних зображень вихідної та вирівняної кривих або на основі обліку суми квадратів помилок (похибок) обчислених точок. Практичне використання цього методу слід проводити з використанням ЕОМ у програмі MS Excel. Математичне вираз закономірності динаміки даних можна отримати за допомогою функції експоненційного згладжування.

таблиці 4.

Таблиця 4.

Для цього ряду: К = 8, L = -8.

8 3.703 3,46

Знаходимо теоретичні значення характеристики з (n-2) ступенями

t 0,95,n 2=2,365,

тобто. з ймовірністю

стверджувати, що

є тенденція в дисперсії (t K t теор) і є тенденція в середньому, тому що t L t теор. Отже, можна говорити про наявність тренду у тимчасовому

Метод середніх

5.3. Методи механічного згладжування часового ряду

Дуже часто рівні економічних рядів динаміки коливаються,

цьому тенденція розвитку економічного явища у часі прихована випадковими відхиленнями рівнів у той чи інший бік. З метою більш чіткого виявлення тенденції розвитку досліджуваного процесу, у тому числі для подальшого застосування методів прогнозування на основі трендових

моделей, виробляють згладжування (вирівнювання)тимчасових рядів.

Згладжування завжди включає певний спосіб локального усереднення даних, у якому несистематичні компоненти взаємно погашають одне одного.

Методи згладжування часових рядів поділяються на дві основні групи:

1) механічне вирівнювання окремих рівнів часового ряду з

використанням фактичних значень сусідніх рівнів.

2) аналітичне вирівнювання з використанням кривої, проведеної

між конкретними рівнями ряду так, щоб вона відображала тенденцію, властиву ряду, і одночасно звільняла його від незначних

коливань;

Суть методів механічного згладжування полягає у наступному.

Береться кілька перших рівнів часового ряду, що утворюють інтервал згладжування.Для них підбирається поліном, ступінь якого має бути меншим за кількість рівнів, що входять в інтервал згладжування; за допомогою полінома визначаються нові, вирівняні значення рівнів у середині

Метод простий ковзної середньої.

Найпростіший метод згладжування - ковзне середнє,в якому

членів, де m - ширина інтервалу згладжування. Замість середнього можна використовувати медіану значень, що потрапили до інтервалу згладжування.

Якщо необхідно згладити дрібні безладні коливання, то інтервал згладжування беруть якомога більшим. Якщо потрібно зберегти дрібніші коливання, зменшують інтервал згладжування. За інших рівних умов інтервал згладжування рекомендується брати непарним.

Для обчислення згладжених рівнів ряду Y t застосовується формула:

Де p m 1 (при непарному);

В результаті такої процедури виходять (n-m+1) згладжених значень рівнів ряду; при цьому першір і останній рівнів ряду губляться (не згладжуються). -

При парних значенняхт, після процедури згладжування зазвичай поводять центрування отриманого ряду (знаходять середні значення двох послідовних ковзних середніх).

Даний метод застосуємо застосовуємо лише для рядів, що мають лінійну

тенденцію. Якщо процесу характерний нелінійний розвиток, то проста ковзна середня може призвести до істотних спотворень.

Коли тренд вирівнюваного ряду має вигини і для дослідника бажано зберегти хвилі, то кращою є зважена

ковзна середня. При побудові зваженої ковзної середньої на

кожному інтервалі згладжування значення центрального рівня замінюється на розрахункове, що визначається за формулою зваженої середньої арифметичної:

y tw i

де w i - вагові коефіцієнти, що визначаються методом найменших

квадратів, при цьому вирівнювання на кожному інтервалі згладжування здійснюється найчастіше із застосуванням поліномів другого або третього порядків11 .Наприклад, вагові коефіцієнти для інтервалу 5 будуть

наступні: 35 1 [3, 12, 17, 12, 3], а для інтервалу 7: 21 1 [2, 3, 6, 7, 6, 3, 2]

Приклад. Задано часовий ряд обсягу випуску продукції (у тис. руб). Рівні ряду Y (t) наведені в таблиці 5.

Виберемо інтервал згладжування m=3 і проведемо згладжування простої ковзної середньої (третій рядок таблиці) Після згладжування явно видно тенденцію, що зростає.

11 Міхтарян В.С., Архіпова М.Ю. та ін. Економетріка.: Навч. / За ред. Міхтарян В.С. М: ТОВ

«Проспект», 2008, стор 293

Таблиця 5

S(t)ср

S(t)вз

інтервал згладжування

проведемо

згладжування

зваженою

ковзної середньої на основі полінома другого ступеня

(четверта

таблиці), використовуючи наведені

вище вагові

Коефіцієнти.

Метод експонентного згладжування.

Під час дослідження економічних даних іноді важливим є впливом геть процес пізніших спостережень. Це питання вирішує метод

експонентного згладжування. У цьому випадку поточне значення тимчасового

ряду згладжується з урахуванням константи, що згладжує (ваги), зазвичай

позначається. Розрахунок проводиться за такою формулою:

S t Y t (1) S t 1 , (5.4),

Розглядаючи рекурентний процес розкладання для величин S t 1 ,S t 2 і

і т.д. за формулою (5.4), отримаємо:

) j Y t j (1) t Y 0

S t(1

де j - Число періодів відставання від моменту t. Згідно з формулою (5.5)

відносна вага кожного попереднього рівня знижується за експонентом у міру віддалення від моменту, для якого обчислюється згладжене значення.

Звідси і назва цього методу.

При практичному використанні методу виникають проблеми вибору параметра та визначення початкового рівня Y0. Чим більше значення

параметра, тим менше впливає попередніх рівнів У кожному конкретному випадку необхідно вибирати найбільш прийнятне

значення. Найчастіше це робиться на основі перевірки кількох значень.

Завдання вибору початкового значення Y 0 вирішують так: за Y 0

приймається перше значення часового ряду або середнє арифметичне

кількох перших членів низки.

Розглянемо попередній приклад. Проведемо експоненційне

згладжування часового ряду (третій рядок таблиці)

Перше згладжене значення дорівнює першому рівню ряду. Наступне згладжене значення розраховуємо згідно з формулою (5.3), де

Основнийтенденцією розвитку (трендом)називається плавна та стійка зміна рівня явища в часі, вільна від випадкових коливань.

Завдання полягає в тому, щоб виявити загальну тенденціюу зміні рівнів ряду, звільнену від дії різних випадкових факторів. З цією метою ряди динаміки піддаються обробці методами укрупнення інтервалів, згладжування часових рядів.

Методи згладжування можна умовно поділити на два класи: аналітичний та алгоритмічний.

Аналітичнийпідхід заснований на припущенні, що дослідник може поставити загальний виглядфункції, що описує регулярну, невипадкову складову. Наприклад, на основі візуального та змістовного економічного аналізу динаміки часового ряду передбачається, що трендова складова може бути описана за допомогою показової функції .

Тоді на наступному етапі буде проведено статистичну оцінку невідомих коефіцієнтів моделі, а потім визначено згладжені значення рівнів тимчасового рада шляхом підстановки відповідного значення тимчасового параметра «t» в отримане рівняння.

В алгоритмічному підході відмовляються від обмежувального припущення, властивого аналітичному. Процедура цього класу передбачає опису динаміки невипадкової складової з допомогою єдиної функції, вони надають досліднику лише алгоритм розрахунку невипадкової складової у будь-який заданий час «t» . Методи згладжування тимчасових порад за допомогою ковзних середніх відноситься до такого підходу. Одним з найбільш простих методівВивчення основної тенденції у лавах динаміки є укрупнення інтервалів. Він заснований на укрупненні періодів часу, до яких відносяться рівні динаміки (одночасно зменшується кількість інтервалів). Наприклад, радий щодобового випуску продукції замінюється поруч місячного випускупродукції і т.д. Середня, обчислена за укрупненими інтервалами, дозволяє виявляти напрям та характер (прискорення чи уповільнення зростання) основної тенденції розвитку.

Суть різних прийомівзгладжування часових рядів зводиться до заміни фактичних рівнів часового ряду розрахунковими, які меншою мірою схильні до коливань. Виявлення основної тенденції шляхом згладжування часового ряду може здійснюватись також методом ковзної (рухомої) середньої.

Алгоритм згладжування по простий ковзної середньоїможе бути представлений у вигляді наступної послідовності кроків.

1. Визначають довжину інтервалу згладжування S, що включає 1 послідовних рівнів ряду (1 > n). При цьому треба мати на увазі, що чим ширший інтервал згладжування, тим більше поглинаються коливання, і тенденція розвитку носить більш плавний, згладжений характер. Чим сильніше коливання, тим ширшим має бути інтервал згладжування.

2. Розбивають весь період спостереження на ділянки, при цьому інтервал згладжування «ковзає» поруч із кроком, рівним I.

3. Розраховують середні арифметичні з рівнів рада, що утворюють кожну ділянку.

4. Замінюють фактичні значення ряду, що стоять у центрі кожної ділянки, на відповідні середні значення.

При цьому зручно брати довжину інтервалу згладжування 1 у вигляді непарного числа I = 2р + 1, так як у цьому випадку отримані значення ковзної середньої припадають на середній член інтервалу. Параметр р = (m-1) / 2; де m - Тривалість періоду згладжування (5,7,9, 11,13).

Спостереження, які беруться до розрахунку середнього значення називаються активною ділянкою згладжування.

При непарному значенні 1 =2р + 1 ковзна середня може бути визначена за формулою:

де - значення ковзної середньої в момент t;

Фактичне значення i-ro рівня; 2р+1 – довжина інтервалу згладжування.

При побудові зваженої ковзної середньої кожному активному ділянці значення центрального рівня замінюється на розрахункове, що визначається за формулою середньої арифметичної зваженої:

де – вагові коефіцієнти.

Проста ковзна середня враховує всі рівні ряду, що входять в активну ділянку згладжування, з рівними вагами () , а зважена середня приписує кожному рівню вага, що залежить від видалення рівня до рівня, що стоїть у середині активної ділянки. Це викликано тим, що при простий ковзаючій середньої вирівнюванняна кожній активній ділянці проводиться по прямій (поліном першого порядку), а при згладжуванні по виваженій ковзній середній використовують поліноми вищих порядків. Тому метод простий ковзної середньої може розглядатися як окремий випадокметоду виваженої ковзної середньої. Вагові коефіцієнти визначаються за допомогою методу найменших квадратів, причому немає необхідності щоразу обчислювати їх заново при рівнях ряду, що входять до активної ділянки згладжування, оскільки вони будуть однаковими для кожної активної ділянки. У наведеній нижче таблиці представлені вагові коефіцієнти в залежності від довжини інтервалу згладжування.

Таблиця 1.8.2.Ваговыекоэффициенты для виваженої ковзної середньої

Оскільки ваги симетричніщодо центрального рівня, то в таблиці використано символічний запис: наведено ваги для половини рівнів активної ділянки; виділено вагу, що відноситься до рівня, що стоїть у центрі ділянки згладжування. Для рівнів ваги, що залишилися, не наводяться, так як вони можуть бути симетрично відображені.

Зазначимо важливі властивостікоефіцієнтів:

1. вони симетричні щодо центрального рівня;

2. сума ваг з урахуванням загального множника, винесеного за
дужки, що дорівнює одиниці;

3. наявність як позитивних, і негативних терезів
дозволяє згладженою кривою зберігати різні вигини
кривий тренд.

Названі прийоми згладжування динамічних радів (укрупнення інтервалів і метод ковзної середньої) дають можливість визначити лише загальну тенденцію розвитку явища, більш менш звільнену від випадкових і хвилеподібних коливань. Проте отримати узагальнену статистичну модель тренду у вигляді цих методів не можна.

Для того щоб дати кількісну модель, що виражає основну тенденцію зміни рівнів динамічного ряду в часі, використовується аналітичне вирівнювання динаміки.

Відновлення крайових значень

При використанні ковзної середньої з довжиною активної ділянки

1=2р+1 перші та останні «р» рівнів ряду згладити не можна, їх значення губляться. Очевидно, що втрата значень останніх точок - істотний недолік, тому що для дослідника «свіжі» дані мають найбільшу інформаційну цінність.

Розглянемо один із прийомів, що дозволяють відновити втрачені значення часового ряду при використанні простої ковзної середньої. Для цього необхідно:

Обчислити середній абсолютний приріст на останньому
активну ділянку;

Отримати «р» згладжених значень наприкінці часового ряду
шляхом послідовного додавання середнього абсолютного
приросту до останнього згладженого значення.

Аналогічну процедуру можна реалізувати для оцінювання перших рівнів часового ряду.

Розглянемо ще один із можливих способіввідновлення крайових значень. Для визначення «р» перших і «р» останніх втрачених рівнів аналізованого часового ряду можна використовувати розрахункові значення, отримані за допомогою апроксимуючих поліномів того ж ступеня, що й для інших членів ряду. Причому невідомі коефіцієнти поліномів визначаються відповідно по 1=2р+1 першим та останнім рівням часового ряду.

Економетрика 1 модуль
1. В якому законі з'ясовувалися закономірності попиту на основі співвідношень між урожаєм зернових та цінами на зерно?
у законі Кінга
2. Як називається міра розкиду випадкової величини?
дисперсія
3. При дослідженнях яких моделей економетричне дослідження може включати виявлення трендів, лагів, циклічної компоненти?
моделей тимчасових рядів
4. Яка з перерахованих шкал не належить до основних шкал якісних ознак?
шкала відносин
5. Хто започаткував журнал «Економетрика»?
Р. Фріш
6. Що з перерахованого може включати економетричне дослідження на сучасному етапірозвитку щодо моделей за незалежними невпорядкованими спостереженнями?
оцінку параметрів моделі
7. У якій шкалі є природна одиниця виміру, але немає природного початку відліку?
у шкалі різниць
8. Хто з учених створив теорію інтегрованих моделей авторегресії ¾ ковзного середнього?
Дж. Бокс та Г. Дженкінс
9. У якій системі кожна змінна, що пояснюється, розглядається як функція одного і того ж набору факторів?
у системі незалежних рівнянь
10. Яка шкала вимірів відноситься до шкал кількісних ознак?
шкала інтервалів
11. Які економетричні моделі розробили у 80 - на початку 90-х років. Р.Е. Ігл, Т. Боллесльов і Нельсон?
моделі авторегресійної умовної гетероскедастичності
12. Які шкали вимірювань є найпоширенішими та зручнішими?
шкали відносин
13. Якому вченому 1980 р. присуджено Нобелівська преміяза застосування економетричних моделей до аналізу економічних коливань та в економічній політиці?
Л. Клейну
14. У якій країні було створено перше міжнародне економетричне суспільство?
у США
15. Що з перерахованого є постійною складовою випадкової величини?
середньоарифметичне значення
16. Що є метою економетрики як науки? (за Е. Маленво)
емпіричний аналіз економічних законів
17. Хто з дослідників надавав широкого тлумачення економетриці, інтерпретуючи її як будь-яке застосування математики чи статистичних методів вивчення економічних явищ?
Е. Маленво
18. Які компоненти входять до складу випадкових величин у процесі аналізу?
постійна та випадкова компоненти
19. Чому дорівнює середня випадкова компонента, або залишку?
0
20. Хто вперше ввів термін економетрію?
П. Цьємпа
21. Хто із вітчизняних учених на союзному рівні описав динаміку врожайності зернових культур рівняннями з малою кількістю параметрів?
В. Обухів
22. Які розділи містить економетрика?
моделювання даних, невпорядкованих у часі, та теорія часових рядів
23. Які показники економіки неможливо виміряти безпосередньо?
латентні характеристики
24. Хто із вчених займався проблемою циклічності?
К. Жюгляр
25. Хто є автором першої книги з економетрики «Закони заробітної плати: есе зі статистичної економіки»?
Г. Мур

2 модуль
1. Якщо регресія значуща, то
Fнабл>Fкріт
2. Що свідчить величина коефіцієнта регресії?
середня зміна результату із зміною фактора на одну одиницю
3. Що означає збіг середнього від вибіркової оцінки з невідомою величиною відповідного параметра, що шукається, для генеральної сукупності?
незміщеність
4. Якою є регресія, якщо k = 2?
множинної
5. Чим характеризується розсіювання (відхилення) точок спостереження щодо кривої регресії?
залишковою регресією
6. Який коефіцієнт є показником тісноти зв'язку?
лінійний коефіцієнт кореляції
7. Яка величина дорівнює просто середньої суми квадратів залишків (відхилень)?
залишкова регресія
8. Яким виразом визначається коефіцієнт кореляції, що є мірою лінійного зв'язку між випадковими величинами x та y?
r(x, y)=…
9. Якого значення має перевищувати середня помилкаапроксимації?
7-8%
10. Хто ввів термін «регресія»?
Ф. Гальтон
11. Який коефіцієнт функції споживання використовується для розрахунку мультиплікатора?
коефіцієнт регресії
12. За допомогою якого коефіцієнта визначається якість підбору лінійної функції?
за допомогою коефіцієнта детермінації
13. Яким виразом визначається вибірковий коефіцієнт кореляції?
r(x,y) із квадратами
14. Що називають результативною ознакою у регресійному аналізі?
залежну змінну
15. Дисперсію якої змінної досліджує дисперсійний аналіз?
залежною змінною
16. Яка регресія характеризується прозорою інтерпретацією параметрів моделі?
лінійна регресія
17. Який коефіцієнт характеризує частку дисперсії, що пояснюється регресією, у спільній дисперсії результативної ознаки y?
коефіцієнт детермінації
18. Який коефіцієнт показує, на скільки відсотків у середньому за сукупністю зміниться результат y від середньої величини при зміні фактора x на 1% від його (фактора x) середнього значення?
коефіцієнт еластичності
19. Чому дорівнює величина залишкової дисперсії, якщо фактичні значення результативної ознаки збігаються з теоретичними чи розрахунковими значеннями?
0
20. Який метод застосовують з метою оцінки параметрів a, b рівняння регресії?
метод найменших квадратів (МНК)
21. Який метод ґрунтується на вимогі мінімізації суми квадратів відхилень фактичних значень результативної ознаки від розрахункових?
метод найменших квадратів
22. За якого значення k регресія називається парною?
k= 1
23. Що з перерахованого не відноситься до нелінійних регресій за параметрами, що оцінюються?
показова функція
24. Суть якої теореми в тому, що якщо випадкова величинає загальним результатом взаємодії великої кількості інших випадкових величин, жодна з яких не має переважаючого впливу на загальний результат, то така результуюча випадкова величина описуватиметься приблизно нормальним розподілом?
центральної граничної теореми
25. Яким рівнянням описується лінійна регресія?
y = a + bx + ε
(3 помилки)

3 модуль ()1 помилка
1. Як перевіряється гетероскедастичність моделей в асимптотичному тесті Бреуша та Пагана?
за критерієм c2(r)
2. Який критерій дозволяє вибирати найкращу модельз безлічі різних специфікацій і чисельно побудований так, щоб врахувати вплив на якість припасування моделі двох протилежних тенденцій?
критерій Шварца
3. За якою величиною судять про якість моделі?
за середньою відносної помилкиапроксимації
4. Яким виразом описується умова однорідності (гомоскедастичності) спостережень?
s2(yu) =s2(hu+eu) =s2(eu) =s2
5. Який метод можна застосувати за умови діагональності матриці підступів вектора помилок?
метод найменших квадратів
6. Яким виразом визначається абсолютна помилка апроксимації?
yi-y1i=e
7. Що розуміється під мультиколлінеарністю?
високий ступінь корелюваності змінних, що пояснюють
8. Які змінні є вихідними змінними, з яких віднімаються відповідні середні, а отримана різниця ділиться на стандартне відхилення?
стандартизовані змінні
9. Яка помилка на контрольній вибірці свідчить про хорошій якостіпобудованої моделі?
4-9%
10. Яким методом може бути проведено оцінку значущості мультиколінеарності факторів?
методом випробування гіпотези про незалежність змінних
11. Яка змінна має виражатися у вигляді лінійної функції від невідомої змінної?
замінна змінна
12. Дисперсії та коваріації помилок спостережень в узагальненій лінійній моделі множинної регресії
можуть бути довільними
13. У чому полягає другий підхід до вирішення проблеми гетероскедастичності?
у побудові моделей, які враховують гетероскедастичність помилок спостережень
14. Чим у найпростішому випадку парної регресії є стандартизований коефіцієнтрегресії?
лінійним коефіцієнтом кореляції
15. Що з перерахованого використовують для перевірки гіпотези, якщо дослідник припускає, що за час спостережень сталися різкі структурні зміниу вигляді зв'язків між залежною та незалежними змінними?
тест Чоу
16. Чому дорівнює визначник матриці, якщо між факторами є повна лінійна залежністьі всі коефіцієнти кореляції дорівнюють 1?
0
17. За якою формулою розраховують коефіцієнти моделі при використанні методу гребеневої регресії?
bгр= (XTX+DгрIk+ 1)-1XTY
18. За якою формулою, згідно з теоремою Айткена, проводиться оцінка коефіцієнтів моделі?
b= (XW-1X)-1XW-1Y
19. Який із перерахованих тестів не вимагає припущення про нормальність розподілу регресійних залишків?
тест рангової кореляціїСпірмена
20. Як називають змінну, яка має бути в моделі згідно з правильною теорією?
суттєвою
21. Чим ближче до одиниці значення визначника матриці міжфакторної кореляції, тим
менше мультиколлінеарність факторів
22. Який критерій використовується з метою оцінки значимості рівняння регресії загалом?
F-критерія Фішера
23. Який показник фіксує частку поясненої варіації результативної ознаки за рахунок факторів, що розглядаються в регресії?
показник детермінації
24. Які коефіцієнти дозволяють виключати з моделі фактори, що дублюють?
коефіцієнти інтеркореляції
25. Чому дорівнює число ступенів свободи залишкової суми квадратів за лінійної регресії?
n-2
Модуль 4
1. Які етапи включає процес структурного моделювання?
усі перелічені етапи
2. Суть якого методу полягає в частковій заміні непридатної пояснюючої змінної на таку змінну, яка не корелює зі випадковим членом?
методу інструментальних змінних
3. Що являє собою змінна x, що входить у вираз?
обурюючий процес
4. За якої умови загальне рішеннярізницевого рівняння виду має «вибуховий» характер?
при |a1|> 2
5. Як називаються взаємозалежні змінні, які визначаються всередині моделі (всередині самої системи) і позначаються у?
ендогенними змінними
6. У якій моделі на основі коефіцієнтів наведеної форми можна отримати два чи більше значень одного структурного коефіцієнта?
у надідентифікованій
7. Які коефіцієнти називають структурними коефіцієнтами моделі?
коефіцієнти при ендогенних та екзогенних змінних у структурній формі моделі
8. Який метод при обмеженій інформації називається методом найменшого дисперсійного відношення?
метод максимальної правдоподібності
9. Як називаються змінні, що належать до попередніх моментів часу?
лаговими змінними
10. Якщо набір чисел X пов'язаний з іншим набором чисел Y залежністю Y=4X, то дисперсія Y має бути
у 16 разів більше, ніж дисперсія X
11. Який метод застосовується для вирішення системи, що ідентифікується?
непрямий метод найменших квадратів
12. Які змінні розуміються під певними змінними?
екзогенні змінні та лагові ендогенні змінні
13. Який метод використовують, якщо потрібно лише уточнити характер зв'язків змінних?
метод дорожнього аналізу
14. Що дозволяє зробити побудову моделей кореляційної структури?
перевірити гіпотезу про те, що матриця кореляції має певний вигляд
15. Якою є модель, якщо всі її структурні коефіцієнти однозначно визначаються за коефіцієнтами наведеної форми моделі та при цьому кількість параметрів в обох формах моделі однакова?
ідентифікованою
16. Яким виразом визначається залежність споживання на рік із номером t від доходу попередній період y(t- 1)?
C(t) = b+cy(t-1)
17. Як називаються незалежні змінні, які визначаються поза системою та позначаються як х?
екзогенними змінними
18. За якої умови вся модель вважається такою, що ідентифікується?
якщо ідентифіковано хоча б одне рівняння системи
19. У якому випадку модель не є ідентифікованою?
якщо кількість наведених коефіцієнтів менша за кількість структурних коефіцієнтів
20. Які змінні часто доводиться запроваджувати для врахування впливу якісних факторів?
фіктивні змінні
21. Що дозволяє зробити побудову моделей структури середніх?
дослідити структуру середніх одночасно з аналізом дисперсій та підступів
22. Які змінні можуть включати причинні моделі?
явні та латентні змінні
23. За якої умови рівняння не ідентифіковане?
якщо кількість зумовлених змінних, відсутніх у рівнянні, але присутніх у системі, збільшена на одиницю, менша від числа ендогенних змінних у рівнянні
24. При вирішенні виразу способом руху "назад" помилки ei
накопичуються
25. Що дозволяє зробити моделювання коварійної структури?
перевірити гіпотезу про те, що матриця коваріації має певний вигляд

4 модуль
1. Про що свідчать великі значення, близькі до 1, величини (1-а1) моделі коригування помилок (МКО)?
про те, що економічні фактори сильно змінюють результат
2. На скільки ділянок розбивається послідовність перевірки умови стаціонарності ряду?
на дві ділянки
3. Для зменшення амплітуди коливань у згладженого ряду Y(t) необхідно
збільшувати ширину інтервалу згладжування m
4. Яке припущення є одним із апріорних припущень при застосуванні параметричних тестів для перевірки стаціонарності?
припущення про нормальний закон розподілу значень тимчасового ряду
5. Що називається тимчасовим рядом?
послідовність значень ознаки, що приймаються протягом кількох послідовних моментів часу або періодів
6. Як змінюється дисперсія згладженого по квадратичному поліному ряду Y(t) зі збільшенням числа m рівнянь?
зменшується
7. Які тренди корелюють між собою?
тимчасові
8. Що з перерахованого використовують для перевірки стаціонарності часового ряду?
серіальний критерій стаціонарності
9. Як називають кореляційну залежність між послідовними рівнями часового ряду?
автокореляцією рівнів ряду
10. Як називається випадкова змінна із змінною дисперсією?
гетероскедастичної
11. За якої умови згладжування ряду називається центрованим?
при k=l
12. Яким шляхом може бути виключений тимчасовий тренд із результуючої змінної?
шляхом побудови регресії цієї змінної за часом та переходу до залишків, які утворюють нову стаціонарну змінну, вже вільну від тренду
13. За якою формулою розраховуються коефіцієнти, якщо як багаточлен, що згладжує, взяти пряму?
ar = 1/m
14. Який компонент пояснює відхилення від тренду з періодичністю від 2 до 10 років?
циклічна компонента
15. Що у виразі позначають параметром L?
функцію правдоподібності
16. Яка послідовність є білим шумом?
якщо кожна випадкова величина послідовності має нульове середнє та некорельована з іншими елементами послідовності
17. До якого класу належить ряд, якщо він містить одиничні корені та інтегруємо з порядком d?
I(d)
18. Як називається стохастична змінна із постійною дисперсією?
гомоскедастична змінна
19. Який принцип розробки прогнозів передбачає відповідність, максимальне наближення теоретичних моделейдо реальних виробничо-економічних процесів?
адекватність прогнозування
20. Як називається число значень вихідного ряду, які одночасно беруть участь у згладжуванні?
шириною інтервалу згладжування
21. Що стосується основних принципів розробки прогнозів?
системність, адекватність, альтернативність
22. Навіщо застосовується серіальний критерій стаціонарності?
для перевірки стаціонарності часового ряду
23. Як називається модель виду?
авторегресійною умовною гетероскедастичною моделлю (АРУГ-моделлю)
24. Що становить рівняння?
АРСС-процес для (et2)-послідовності
25. Які змінні використовуються у процесі випадкового блукання?
некорельовані нестаціонарні зміни

16.02.15 Віктор Гаврилов

38133 0

Тимчасовим рядом називається послідовність значень, що змінюються у часі. Про деякі прості, але ефективні підходи до роботи з подібними послідовностями я спробую розповісти в цій статті. Прикладів таких даних можна зустріти дуже багато – котирування валют, обсяги продажу, звернення клієнтів, дані у різних прикладних науках (соціологія, метеорологія, геологія, спостереження у фізиці) та багато іншого.

Ряди є поширеною і важливою формою опису даних, оскільки дозволяють спостерігати всю історію зміни значення, що нас цікавить. Це дає нам можливість судити про «типову» поведінку величини та про відхилення від такої поведінки.

Переді мною постало завдання вибрати набір даних, на якому можна було б продемонструвати особливості тимчасових рядів. Я вирішив скористатися статистикою пасажиропотоку на міжнародних авіалініях, оскільки цей набір даних дуже наочний і став свого роду стандартним (http://robjhyndman.com/tsdldata/data/airpass.dat, джерело Time Series Data Library, RJ Hyndman). Ряд визначає кількість пасажирів міжнародних авіаліній на місяць (у тисячах) за період з 1949 по 1960 роки.

Оскільки в мене завжди під рукою, в якій є цікавий інструмент для роботи з рядами, я скористаюся саме ним. Перед імпортуванням даних у файл потрібно додати стовпець з датою, щоб прив'язувати значення часу, і стовпець з іменем ряду для кожного спостереження. Нижче видно, як виглядає мій вихідний файл, який я імпортував у Prognoz Platform за допомогою майстра імпорту безпосередньо із інструмента аналізу часових рядів.

Перше, що ми зазвичай робимо з тимчасовим рядом, відображаємо його на графіку. Prognoz Platform дозволяє побудувати графік, просто перетягнувши ряд в робочу книгу.

Тимчасовий ряд на графіку

Символ 'M' наприкінці імені ряду означає, що ряд має місячну динаміку (інтервал між спостереженнями дорівнює одному місяцю).

Вже з графіка бачимо, що ряд демонструє дві особливості:

  • тренд– на нашому графіку це довгострокове зростання значень, що спостерігаються. Видно, що тренд практично лінійний.
  • сезонність- На графіку це періодичні коливання величини. У наступній статті на тему часових рядів ми дізнаємося, як можна визначити період.

Наш ряд досить «акуратний», проте часто зустрічаються ряди, які, крім двох описаних вище характеристик, демонструють ще одну – наявність «шуму», тобто. випадкових варіацій у тій чи іншій формі. Приклад такого ряду можна побачити на графіці нижче. Це синусоїдальний сигнал, змішаний із випадковою величиною.

При аналізі рядів нас цікавить виявлення їхньої структури та оцінка всіх основних компонентів – тренду, сезонності, шуму та інших особливостей, а також можливість будувати прогнози зміни величини у майбутніх періодах.

Працюючи з рядами наявність шуму часто ускладнює аналіз структури ряду. Щоб унеможливити його вплив і краще побачити структуру ряду, можна використовувати методи згладжування рядів.

Найпростіший метод згладжування рядів – ковзна середня. Ідея у тому, що з будь-якого непарного кількості точок послідовності ряду замінювати центральну точку на середнє арифметичне інших точок:

де x i- Вихідний ряд, s i- Згладжений ряд.

Нижче можна побачити результат застосування даного алгоритму до двох наших рядів. Prognoz Platform за промовчанням пропонує використовувати згладжування з розміром вікна в 5 точок ( kу нашій формулі вище дорівнюватиме 2). Зверніть увагу, що згладжений сигнал вже не так схильний до впливу шуму, проте разом з шумом, звичайно, пропадає і частина корисної інформаціїпро динаміку ряду. Також видно, що згладжений ряд відсутні перші (і також останні) kточок. Це з тим, що згладжування виконується для центральної точки вікна (у разі для третьої точки), після чого вікно зсувається однією точку, і обчислення повторюються. Для другого, випадкового ряду я використовував згладжування з вікном рівним 30, щоб краще виявити структуру ряду, так як ряд «високочастотний», точок дуже багато.

Метод ковзного середнього має певні недоліки:

  • Ковзне середнє неефективне у обчисленні. Для кожної точки середнє необхідно перераховувати за новою. Ми не можемо перевикористати результат, обчислений для попередньої точки.
  • Ковзне середнє не можна продовжити на перші та останні точки ряду. Це може спричинити проблему, якщо нас цікавлять саме ці точки.
  • Ковзне середнє не визначено за межами ряду, і як наслідок, не може використовуватися для прогнозування.

Експонентне згладжування

Найбільш просунутий метод згладжування, який також можна використовувати для прогнозування – експоненційне згладжування, яке іноді називається методом Хольта-Уінтерса (Holt-Winters) на честь імен його творців.

Існує наскільки варіантів даного методу:

  • одинарне згладжування для рядів, у яких немає тренду та сезонності;
  • подвійне згладжування для рядів, які мають тренд, але немає сезонності;
  • потрійне згладжування для рядів, які мають і тренд, і сезонність.

Метод експонентного згладжування обчислює значення згладженого ряду шляхом оновлення значень, розрахованих на попередньому кроці, використовуючи інформацію з поточного кроку. Інформація з попереднього та поточного кроків береться з різними вагами, якими можна керувати.

У найпростішому варіанті одинарного згладжування таке співвідношення:

Параметр α визначає співвідношення між незгладженим значенням на поточному кроці та згладженим значенням з попереднього кроку. При α =1 ми братимемо лише точки вихідного ряду, тобто. ніякого згладжування не буде. При α =0 ряд ми братимемо лише згладжені значення з попередніх кроків, тобто. ряд перетвориться на константу.

Щоб зрозуміти, чому згладжування називається експоненційним, нам потрібно розкрити співвідношення рекурсивно:

Зі співвідношення видно, що всі попередні значення ряду роблять внесок у поточне згладжене значення, однак їхній внесок згасає експоненційно за рахунок зростання ступеня параметра α .

Однак, якщо в даних є тренд, просте згладжування «відставатиме» від нього (або доведеться брати значення α близькими до 1, але тоді згладжування буде недостатнім). Потрібно використовувати подвійне експонентне згладжування.

Подвійне згладжування використовує вже два рівняння – одне рівняння оцінює тренд як різницю між поточним та попереднім згладженим значеннями, потім згладжує тренд простим згладжуванням. Друге рівняння виконує згладжування як у випадку простого варіанта, але у другому доданку використовується сума попереднього згладженого значення та тренду.

Потрійне згладжування включає ще один компонент - сезонність і використовує ще одне рівняння. При цьому розрізняються два варіанти сезонного компонента - адитивний та мультиплікативний. У першому випадку амплітуда сезонного компонента стала і з часом не залежить від базової амплітуди ряду. У другому випадку амплітуда змінюється разом із зміною базової амплітуди низки. Це якраз наш випадок, як видно із графіка. Зі зростанням низки амплітуда сезонних коливань зростає.

Так як наш перший ряд має і тренд, і сезонність, вирішив підібрати параметри потрійного згладжування для нього. У Prognoz Platform це досить просто зробити, тому що при оновленні значення параметра платформа відразу перемальовує графік згладженого ряду, і візуально можна відразу побачити, наскільки добре він описує вихідний ряд. Я зупинився на наступних значеннях:

Як я вирахував період, ми розглянемо в наступній статті про тимчасові ряди.

Зазвичай як перші наближення можна розглядати значення між 0,2 і 0,4. Prognoz Platform також використовує модель із додатковим параметром ɸ що демпфує тренд так, що він наближається до константи в майбутньому. Для ɸ я взяв значення 1, що відповідає звичайній моделі.

Також я зробив прогноз значень низки даним методом на останні 2 роки. На малюнку нижче я помітив точку початку прогнозу, провівши через неї межу. Як видно, вихідний ряд і згладжений дуже непогано збігаються, в тому числі і на період прогнозування - непогано для такого простого методу!

Prognoz Platform також дозволяє автоматично підібрати оптимальні значенняпараметрів, використовуючи систематичний пошук у просторі значень параметрів та мінімізуючи суму квадратів відхилень згладженого ряду від вихідного.

Описані методи дуже прості, їх легко застосовувати, і вони є гарною відправною точкою для аналізу структури та прогнозування часових рядів.

Ще більше про тимчасові ряди читайте у наступній статті.



Нове на сайті

>

Найпопулярніше