Dom Desni Modeli za eksponencijalno izglađivanje i predviđanje vremenskih serija. Predviđanje zasnovano na eksponencijalnom izglađivanju

Modeli za eksponencijalno izglađivanje i predviđanje vremenskih serija. Predviđanje zasnovano na eksponencijalnom izglađivanju

1. Osnovne metodološke odredbe.

Jednostavna metoda eksponencijalnog izglađivanja koristi ponderisani (eksponencijalni) pokretni prosek svih podataka iz prethodnih posmatranja. Ovaj model se najčešće primjenjuje na podatke u kojima je potrebno ocijeniti postojanje veze između analiziranih indikatora (trend) ili ovisnost analiziranih podataka. Svrha eksponencijalnog izglađivanja je procjena trenutno stanje, čiji će rezultati odrediti sve naredne prognoze.

Eksponencijalno izglađivanje obezbeđuje Stalno ažuriranje modela korištenjem najnovijih podataka. Ova metoda se zasniva na usrednjavanju (izglađivanju) vremenskih serija prošlih opservacija u opadajućem (eksponencijalnom) smjeru. To jest, novijim događajima se pridaje veća težina. Težina se dodjeljuje na sljedeći način: za posljednje opažanje težina će biti α, za pretposljednje - (1-α), za ono koje je bilo prije njega - (1-α) 2, itd.

U izglađenom obliku, nova prognoza (za vremenski period t+1) može se predstaviti kao ponderisani prosjek posljednjeg opažanja količine u trenutku t i njene prethodne prognoze za isti period t. Štaviše, težina α se dodeljuje posmatranoj vrednosti, a težina (1- α) se dodeljuje prognozi; pretpostavlja se da je 0< α<1. Это правило в общем виде можно записать следующим образом.

Nova prognoza = [α*(poslednje zapažanje)]+[(1- α)*poslednja prognoza]

gdje je predviđena vrijednost na naredni period;

α – konstanta zaglađivanja;

Y t – opažanje vrijednosti za tekući period t;

Prethodna izglađena prognoza ove vrijednosti za period t.

Eksponencijalno izglađivanje je postupak za kontinuiranu reviziju rezultata prognoze u svjetlu najnovijih događaja.

Konstanta izglađivanja α je ponderisani faktor. Njegova stvarna vrijednost je određena mjerom u kojoj bi trenutno posmatranje trebalo da utiče na predviđenu vrednost. Ako je α blizu 1, tada prognoza značajno uzima u obzir veličinu greške posljednje prognoze. Suprotno tome, za male vrijednosti α, predviđena vrijednost je najbliža prethodnoj prognozi. Može se smatrati ponderisanim prosjekom svih prošlih zapažanja, s ponderima koji se eksponencijalno smanjuju kako podaci stari.



Tabela 2.1

Poređenje uticaja različitih vrednosti konstanti glađenja

Konstanta α je ključ za analizu podataka. Ako je potrebno da predviđene vrijednosti budu stabilne i da se slučajna odstupanja izglade, potrebno je odabrati malu vrijednost α. Velika vrijednost konstante α ima smisla ako je potreban brz odgovor na promjene u spektru opažanja.

2. Praktični primjer eksponencijalnog izglađivanja.

Prikazani su podaci kompanije o obimu prodaje (hiljada jedinica) za sedam godina, a konstanta izravnavanja je uzeta jednaka 0,1 i 0,6. Podaci za 7 godina čine testni dio; na osnovu njih potrebno je proceniti efikasnost svakog modela. Za eksponencijalno ujednačavanje serija, početna vrijednost se uzima jednaka 500 (prva vrijednost stvarnih podataka ili prosječna vrijednost za 3-5 perioda se upisuje u izglađenu vrijednost za 2. kvartal).

Tabela 2.2

Početni podaci

Vrijeme Realna vrijednost (stvarna) Izglađena vrijednost Greška prognoze
godine kvartal 0,1 0,1
Excel prema formuli
#N/A 0,00
500,00 -150,00
485,00 485,00 -235,00
461,50 461,50 -61,50
455,35 455,35 -5,35
454,82 454,82 -104,82
444,33 444,33 -244,33
419,90 419,90 -119,90
407,91 407,91 -57,91
402,12 402,12 -202,12
381,91 381,91 -231,91
358,72 358,72 41,28
362,84 362,84 187,16
381,56 381,56 -31,56
378,40 378,40 -128,40
365,56 365,56 184,44
384,01 384,01 165,99
400,61 400,61 -0,61
400,55 400,55 -50,55
395,49 395,49 204,51
415,94 415,94 334,06
449,35 449,35 50,65
454,41 454,41 -54,41
448,97 448,97 201,03
469,07 469,07 380,93

Na sl. Slika 2.1 predstavlja prognozu zasnovanu na eksponencijalnom izglađivanju sa konstantom izglađivanja jednakom 0,1.



Rice. 2.1. Eksponencijalno izglađivanje

Rješenje u Excelu.

1. Odaberite meni “Alati” – “Analiza podataka”. Na listi Alati za analizu izaberite Eksponencijalno izglađivanje. Ako u meniju „Alati“ nema analize podataka, potrebno je da instalirate „Paket analize“. Da biste to učinili, pronađite stavku "Postavke" u "Opcijama" i u dijaloškom okviru koji se pojavi potvrdite okvir "Paket analize" i kliknite U redu.

2. Na ekranu će se otvoriti dijaloški okvir prikazan na slici 1. 2.2.

3. U polje „input interval“ unesite vrijednosti izvornih podataka (plus jedna slobodna ćelija).

4. Označite polje za potvrdu “oznake” (ako opseg unosa sadrži nazive kolona).

5. Unesite vrijednost (1-α) u polje „faktor atenuacije“.

6. U polje “input interval” unesite vrijednost ćelije u kojoj želite da vidite rezultirajuće vrijednosti.

7. Označite polje za potvrdu “Opcije” - “Izlaz grafa” da biste ga automatski napravili.

Rice. 2.2. Dijaloški okvir za eksponencijalno izglađivanje

3. Laboratorijski zadatak.

Postoje početni podaci o obimu proizvodnje preduzeća za proizvodnju nafte za 2 godine, prikazani u tabeli 2.3:

Tabela 2.3

Početni podaci

Izvršite eksponencijalno izravnavanje serije. Uzmite eksponencijalni koeficijent izglađivanja jednak 0,1; 0,2; 0.3. Komentirajte dobijene rezultate. Možete koristiti statistiku prikazanu u Dodatku 1.

Problemi prognoziranja se zasnivaju na promjenama određenih podataka tokom vremena (prodaja, potražnja, zalihe, BDP, emisije ugljika, stanovništvo...) i projektovanju ovih promjena u budućnost. Nažalost, trendovi identifikovani iz istorijskih podataka mogu biti poremećeni mnogim nepredviđenim okolnostima. Dakle, podaci u budućnosti mogu se značajno razlikovati od onih u prošlosti. Ovo je problem predviđanja.

Međutim, postoje tehnike (zvane eksponencijalno izglađivanje) koje vam omogućavaju ne samo da pokušate predvidjeti budućnost, već i kvantifikovati neizvjesnost svega što je povezano s prognozom. Numeričko izražavanje nesigurnosti kroz kreiranje intervala prognoze je zaista neprocjenjivo, ali se često zanemaruje u svijetu predviđanja.

Preuzmite bilješku u formatu ili, primjere u formatu

Početni podaci

Recimo da ste obožavatelj "Gospodara prstenova" i da već tri godine pravite i prodajete mačeve (Sl. 1). Pokažimo prodaju grafički (slika 2). Potražnja se udvostručila za tri godine – možda je to trend? Na ovu ideju ćemo se vratiti malo kasnije. Grafikon ima nekoliko vrhova i dolina, što može biti znak sezonskog karaktera. Konkretno, vrhunci se javljaju u mjesecima pod brojem 12, 24 i 36, a to je decembar. Ali možda je ovo samo slučajnost? Hajde da saznamo.

Jednostavno eksponencijalno izglađivanje

Metode eksponencijalnog izglađivanja oslanjaju se na predviđanje budućnosti na osnovu podataka iz prošlosti, gdje su novija zapažanja teža od starijih. Ovo ponderisanje je moguće zahvaljujući konstantama izglađivanja. Prva metoda eksponencijalnog izglađivanja koju ćemo isprobati zove se jednostavno eksponencijalno izglađivanje (SES). Koristi samo jednu konstantu izravnavanja.

Jednostavno eksponencijalno izglađivanje pretpostavlja da se podaci vaše vremenske serije sastoje od dvije komponente: nivoa (ili prosjeka) i neke greške oko te vrijednosti. Ne postoji trend ili sezonska fluktuacija – jednostavno postoji nivo oko kojeg tražnja fluktuira, okružena malim greškama tu i tamo. Davanjem prednosti novijim zapažanjima, TEC može uzrokovati pomake na ovom nivou. Jezikom formula,

Potražnja u trenutku t = nivo + slučajna greška oko nivoa u trenutku t

Kako onda pronaći približnu vrijednost nivoa? Ako prihvatimo da sve vremenske vrijednosti imaju istu vrijednost, onda jednostavno treba izračunati njihovu prosječnu vrijednost. Međutim, ovo je loša ideja. Veću težinu treba dati nedavnim zapažanjima.

Kreirajmo nekoliko nivoa. Hajde da izračunamo osnovna linija u prvoj godini:

nivo 0 = prosječna potražnja za prvu godinu (1-12 mjeseci)

Za potražnju za mačevima je 163. Koristimo nivo 0 (163) kao prognozu potražnje za mjesec 1. Potražnja za mjesec 1 je 165, odnosno 2 mača iznad nivoa 0. Vrijedi ažurirati osnovnu aproksimaciju. Jednačina za jednostavno eksponencijalno izglađivanje je:

nivo 1 = nivo 0 + nekoliko procenata × (potražnja 1 – nivo 0)

nivo 2 = nivo 1 + nekoliko procenata × (potražnja 2 – nivo 1)

itd. „Nekoliko procenata“ se naziva konstanta izglađivanja i označava se sa alfa. To može biti bilo koji broj od 0 do 100% (0 do 1). Kasnije ćete naučiti kako odabrati alfa vrijednost. Općenito, vrijednost za različite trenutke u vremenu:

Nivo tekućeg perioda = nivo prethodnog perioda +
alfa × (trenutni period potražnje – nivo prethodnog perioda)

Buduća potražnja je jednaka posljednjem izračunatom nivou (slika 3). Pošto ne znate šta je alfa, postavite ćeliju C2 na 0,5 za početak. Nakon što je model izgrađen, pronađite alfu takvu da je suma kvadratne greške - E2 (ili standardna devijacija - F2) minimalna. Da biste to učinili, pokrenite opciju Pronalaženje rješenja. Da biste to učinili, prođite kroz meni PODACI –> Pronalaženje rješenja, i instalirajte u prozor Opcije pretraživanja rješenja tražene vrijednosti (slika 4). Da biste prikazali rezultate prognoze na grafikonu, prvo odaberite raspon A6:B41 i napravite jednostavan linijski grafikon. Zatim kliknite desnim tasterom miša na dijagram i odaberite opciju Odaberite podatke. U prozoru koji se otvori kreirajte drugi red i u njega ubacite predviđanja iz opsega A42:B53 (slika 5).

Možda imate trend

Da biste provjerili ovu pretpostavku, dovoljno je da se uklopi linearna regresija pod podacima o potražnji i izvršite t test na porast ove linije trenda (kao u ). Ako je nagib prave različit od nule i statistički značajan (u testiranju korištenjem Studentovog t-testa, vrijednost r manji od 0,05), podaci imaju trend (slika 6).

Koristili smo funkciju LINEST koja vraća 10 deskriptivnih statistika (ako ovu funkciju ranije niste koristili, preporučujem je) i funkciju INDEX koja vam omogućava da „izvučete“ samo tri potrebne statistike, a ne cijeli skup. Ispostavilo se da je nagib 2,54, i značajan, budući da je Studentov test pokazao da je 0,000000012 značajno manje od 0,05. Dakle, trend postoji i ostaje samo da se to uključi u prognozu.

Holt eksponencijalno izglađivanje sa podešavanjem trenda

Često se naziva dvostruko eksponencijalno izglađivanje jer nema jedan parametar izglađivanja - alfa, već dva. Ako vremenski niz ima linearni trend, tada:

potražnja za vremenom t = nivo + t × trend + nasumično odstupanje nivoa u trenutku t

Holt eksponencijalno izglađivanje s prilagođavanjem trenda ima dvije nove jednadžbe, jednu za nivo dok se kreće kroz vrijeme, a drugu za trend. Jednačina nivoa sadrži parametar za izglađivanje alfa, a jednačina trenda sadrži gama. Evo kako izgleda nova jednačina nivoa:

nivo 1 = nivo 0 + trend 0 + alfa × (potražnja 1 – (nivo 0 + trend 0))

primetite to nivo 0 + trend 0 je samo prognoza u jednom koraku od početnih vrijednosti do 1. mjeseca, dakle potražnja 1 – (nivo 0 + trend 0)- ovo je jednostepeno odstupanje. Dakle, jednačina aproksimacije osnovnog nivoa će biti:

nivo tekućeg perioda = nivo prethodnog perioda + trend prethodnog perioda + alfa × (tekući period potražnje – (nivo prethodni period) + trend prethodnog perioda))

Jednačina ažuriranja trenda:

trend tekućeg perioda = trend prethodni period + gama × alfa × (tekuće razdoblje potražnje – (nivo prethodnog perioda) + trend prethodnog perioda))

Holt izglađivanje u Excelu je slično jednostavno zaglađivanje(slika 7), a kao i gore, cilj je pronaći dva koeficijenta minimiziranjem sume kvadrata grešaka (slika 8). Da biste dobili početni nivo i vrijednosti trenda (u ćelijama C5 i D5 na slici 7), nacrtajte grafikon za prvih 18 mjeseci prodaje i dodajte mu liniju trenda s jednadžbom. Unesite početnu vrijednost trenda od 0,8369 i početni nivo od 155,88 u ćelije C5 i D5. Podaci prognoze mogu se prikazati grafički (slika 9).

Rice. 7. Holt eksponencijalno izglađivanje sa prilagođavanjem trenda; Da biste uvećali sliku, kliknite desnim tasterom miša na nju i izaberite Otvorite sliku u novoj kartici

Identifikacija obrazaca u podacima

Postoji način da se testira snaga prediktivnog modela - uporedite greške sa samim sobom, pomaknute za korak (ili nekoliko koraka). Ako su odstupanja slučajna, onda se model ne može poboljšati. Međutim, može postojati sezonski faktor u podacima o potražnji. Koncept termina greške koji je u korelaciji sa verzijom samog sebe drugog perioda naziva se autokorelacija (više o autokorelaciji pogledajte ). Da biste izračunali autokorelaciju, počnite sa podacima o grešci prognoze za svaki period (kolona F na slici 7 prelazi u kolonu B na slici 10). Dalje, definirajte prosečna greška prognoza (slika 10, ćelija B39; formula u ćeliji: =PROSEK(B3:B38)). U koloni C izračunajte odstupanje greške prognoze od srednje vrijednosti; formula u ćeliji C3: =B3-B$39. Zatim, uzastopno pomjerite stupac C za jednu kolonu udesno i jedan red naniže. Formule u ćelijama D39: =SUMPRODUCT($C3:$C38,D3:D38), D41: =D39/$C39, D42: =2/SQRT(36), D43: =-2/SQRT(36).

Šta znači da je jedan od stupaca D:O "sinhroni" sa stupcem C Na primjer, ako su stupci C i D sinhroni, onda broj koji je negativan u jednoj od njih mora biti negativan u drugom, pozitivnom? u jednom, pozitivno u prijatelju. To znači da će zbir proizvoda dva stupca biti značajan (razlike se akumuliraju). Ili, što je ista stvar, nego bliža vrijednost u opsegu D41:O41 do nule, to je niža korelacija kolone (od D do O, respektivno) sa kolonom C (slika 11).

Jedna autokorelacija viša kritična vrijednost. Greška pomaknuta za godinu dana korelira sama sa sobom. To znači sezonski ciklus od 12 mjeseci. I to nije iznenađujuće. Ako pogledate grafikon potražnje (Sl. 2), ispostavlja se da svakog Božića postoji vrhunac potražnje i pad u aprilu-maju. Razmotrimo tehniku ​​predviđanja koja uzima u obzir sezonalnost.

Holt-Winters multiplikativno eksponencijalno izglađivanje

Metoda se naziva multiplikativna (od multiplicate - množenje), jer koristi množenje kako bi se uzela u obzir sezonalnost:

Potražnja u trenutku t = (nivo + t × trend) × sezonska prilagodba za vrijeme t × sva preostala nepravilna prilagođavanja koja ne možemo uzeti u obzir

Holt-Wintersovo izglađivanje se naziva i trostruko eksponencijalno izglađivanje jer ima tri parametra izglađivanja (alfa, gama i delta). Na primjer, ako postoji sezonski ciklus od 12 mjeseci:

Prognoza za mjesec 39 = (nivo 36 + 3 × trend 36) x sezonalnost 27

Prilikom analize podataka potrebno je utvrditi šta je trend u nizu podataka, a šta sezonalnost. Da biste izvršili proračune pomoću Holt-Wintersove metode, morate:

  • Glatke historijske podatke koristeći metodu pokretnog prosjeka.
  • Uporedite izglađenu verziju vremenske serije podataka sa originalnom da biste dobili grubu procjenu sezonskosti.
  • Dobijte nove podatke bez sezonske komponente.
  • Pronađite aproksimacije nivoa i trenda na osnovu ovih novih podataka.

Počnite sa sirovim podacima (kolone A i B na slici 12) i dodajte kolonu C sa izglađenim vrednostima pokretnog proseka. Budući da sezonalnost ima ciklus od 12 mjeseci, ima smisla koristiti prosjek od 12 mjeseci. Postoji mali problem sa ovim prosjekom. 12 je paran broj. Ako izgladite potražnju u mjesecu 7, da li biste to smatrali prosječnom potražnjom od 1. do 12. mjeseca ili od 2. do 13. mjeseca? Da biste prevazišli ovu poteškoću, potrebno je da izgladite potražnju koristeći „pokretni prosek 2x12“. Odnosno, uzmite polovinu od dva prosjeka od 1. do 12. mjeseca i od 2. do 13. mjeseca. Formula u ćeliji C8: =(PROSEK(B3:B14)+PROSEK(B2:B13))/2.

Izglađeni podaci za mjesece 1–6 i 31–36 se ne mogu dobiti, jer nema dovoljno prethodnih i narednih perioda. Radi jasnoće, originalni i izglađeni podaci mogu se odraziti na dijagramu (slika 13).

Sada u koloni D podijelite originalnu vrijednost sa izglađenom i dobijete približnu vrijednost sezonskog prilagođavanja (kolona D na slici 12). Formula u ćeliji D8 je =B8/C8. Obratite pažnju na skokove od 20% iznad normalne potražnje u 12. i 24. mjesecu (decembar), dok se sniženja primjećuju u proljeće. Ova tehnika zaglađivanja vam je dala dvoje bodovne procjene za svaki mjesec (ukupno 24 mjeseca). Kolona E nalazi prosjek ova dva faktora. Formula u ćeliji E1: =PROSJEK(D14,D26). Radi jasnoće, nivo sezonskih fluktuacija može se prikazati grafički (slika 14).

Sada se mogu dobiti desezonirani podaci. Formula u ćeliji G1 je: =B2/E2. Izradite grafikon na osnovu podataka u koloni G, dopunite ga linijom trenda, prikažite jednačinu trenda na grafikonu (slika 15) i koristite koeficijente u kasnijim proračunima.

Formirajte novi list kao što je prikazano na sl. 16. Zamijenite vrijednosti u opsegu E5:E16 sa Sl. 12 oblasti E2:E13. Uzmite vrijednosti C16 i D16 iz jednadžbe linije trenda na Sl. 15. Postavite vrijednosti konstanti za izravnavanje da počnu od 0,5. Proširite vrijednosti u redu 17 da pokrijete raspon mjeseci od 1 do 36. Pokrenite Pronalaženje rješenja za optimizaciju koeficijenata izglađivanja (slika 18). Formula u ćeliji B53 je: =(C$52+(A53-A$52)*D$52)*E41.

Sada treba provjeriti autokorelacije u napravljenoj prognozi (slika 18). Budući da se sve vrijednosti nalaze između gornje i donje granice, shvatite da je model dobro shvatio strukturu vrijednosti potražnje.

Izrada intervala pouzdanosti za prognozu

Dakle, imamo potpuno funkcionalnu prognozu. Kako postavljate gornje i donje granice koje se mogu koristiti za stvaranje realnih pretpostavki? U tome će vam pomoći simulacija Monte Carla s kojom ste se već susreli (vidi također). Ideja je da se generišu budući scenariji ponašanja potražnje i identifikuje grupa u koju spada 95% njih.

Uklonite prognozu iz ćelija B53:B64 sa Excel lista (vidi sliku 17). Tamo ćete snimiti potražnju na osnovu simulacije. Potonji se može generirati pomoću funkcije NORMINV. Za naredne mjesece, samo trebate dati srednju vrijednost (0), standardnu ​​distribuciju (10,37 iz ćelije $H$2) i slučajni broj od 0 do 1. Funkcija će vratiti odstupanje s vjerovatnoćom koja odgovara krivulji u obliku zvona. Postavite jednostepenu simulaciju greške u ćeliju G53: =NORMIN(RAND(),0,H$2). Proširite ovu formulu na G64 i dobićete simulacije greške prognoze za 12 mjeseci prognoze u jednom koraku (Slika 19). Vaše simulacijske vrijednosti će se razlikovati od onih prikazanih na slici (zato je to simulacija!).

Uz nesigurnost prognoze, imate sve što vam je potrebno za ažuriranje nivoa, trenda i sezonskog koeficijenta. Dakle, odaberite ćelije C52:F52 i proširite ih na red 64. Kao rezultat, imate simuliranu grešku prognoze i samu prognozu. Na osnovu suprotnog, možemo predvidjeti vrijednosti potražnje. Umetnite formulu u ćeliju B53: =F53+G53 i rastegnite je na B64 (slika 20, opseg B53:F64). Sada možete pritisnuti dugme F9 i svaki put ažurirati prognozu. Postavite rezultate 1000 simulacija u ćelije A71:L1070, svaki put transponujući vrednosti iz opsega B53:B64 u opseg A71:L71, A72:L72, ... A1070:L1070. Ako vam ovo smeta, napišite neki VBA kod.

Sada imate 1000 scenarija za svaki mjesec i možete koristiti funkciju PERCENTIL da biste dobili gornje i donje granice na sredini intervala pouzdanosti od 95%. U ćeliji A66 formula je: =PERCENTIL(A71:A1070,0,975), au ćeliji A67: =PERCENTIL(A71:A1070,0,025).

Kao i obično, radi jasnoće, podaci se mogu prikazati grafički (slika 21).

Na grafikonu su dvije zanimljive tačke:

  • Greška vremenom postaje sve veća. Ovo ima smisla. Neizvjesnost se akumulira svakim mjesecom.
  • Na isti način, greška se povećava u dijelovima koji padaju tokom perioda sezonskog povećanja potražnje. Sa njegovim kasnijim padom, greška se smanjuje.

Napisano prema knjizi Johna Foremana. – M.: Alpina Publisher, 2016. – Str. 329–381

Eksponencijalno izglađivanje je složenija metoda ponderisanog prosjeka. Svaka nova prognoza temelji se na prethodnoj prognozi plus postotak razlike između te prognoze i stvarne vrijednosti serije u tom trenutku.

F t = F t -1 + (A t -1 - F t -1) (2)

gdje: Ft – prognoza za period t

F t -1– prognoza za period t-1

– konstanta zaglađivanja

A t - 1 – stvarna potražnja ili prodaja za period t-1

Konstanta izravnavanja je postotak greške prognoze. Svaka nova prognoza jednaka je prethodnoj prognozi plus postotak prethodne greške.

Osetljivost prilagođavanja prognoze na grešku određena je konstantom izglađivanja, što je njena vrednost bliža 0, to će se prognoza sporije prilagođavati greškama prognoze (tj. veći je stepen izglađivanja). Suprotno tome, što je vrijednost bliža 1,0, to je veća osjetljivost i manje izglađivanje.

Izbor konstante izglađivanja je uglavnom stvar slobodnog izbora ili pokušaja i grešaka. Cilj je odabrati konstantu izglađivanja tako da, s jedne strane, prognoza ostane dovoljno osjetljiva na stvarne promjene podataka vremenske serije, a s druge strane da dobro izgladi skokove uzrokovane slučajnim faktorima. Uobičajene vrijednosti se kreću od 0,05 do 0,50.

Eksponencijalno izglađivanje je jedna od najčešće korištenih metoda predviđanja, dijelom zbog minimalnih zahtjeva za skladištenje podataka i lakoće izračunavanja, a dijelom zbog lakoće s kojom se sistem koeficijenata značajnosti može promijeniti jednostavnom promjenom vrijednosti .

Tabela 3. Eksponencijalno izglađivanje

Period Stvarna potražnja α= 0,1 α = 0,4
prognoza greška prognoza greška
10 000 - - - -
11 200 10 000 11 200-10 000=1 200 10 000 11 200-10 000=1 200
11 500 10 000+0,1(11 200-10 000)=10 120 11 500-10 120=1 380 10 000+0,4(11 200-10 000)=10 480 11 500-10 480=1 020
13 200 10 120+0,1(11 500-10 120)=10 258 13 200-10 258=2 942 10 480+0,4(11 500-10 480)=10 888 13 200-10 888=2 312
14 500 10 258+0,1(13 200-10 258)=10 552 14 500-10 552=3 948 10 888+0,4(13 200-10 888)=11 813 14 500-11 813=2 687
- 10 552+0,1(14 500-10 552)=10 947 - 11 813+0,4(14 500-11 813)=12 888 -



Metode za trend

Postoje dva važne metode, koji se može koristiti za razvoj prognoza kada je prisutan trend. Jedna od njih uključuje korištenje jednadžbe trenda; drugi – proširenje eksponencijalnog izglađivanja.

Jednačina trenda:

Linearna jednadžba trendovi izgledaju ovako:

Y t = a + δ∙ t (3)

gdje: t – definitivno broj perioda s vremena na vrijeme t= 0;

Yt– vremenska prognoza t;

α - značenje Yt at t=0

δ – nagib linije.

Direktni koeficijenti α I δ , može se izračunati iz statističkih podataka za određeni period, koristeći sljedeće dvije jednačine:

δ= , (4)

α = , (5)

gdje: n – broj perioda,

y– vrijednost vremenske serije

Tabela 3. Nivo trenda.

Period (t) Godina Nivo prodaje (y) t∙y t 2
10 000 10 000
11 200 22 400
11 500 34 500
13 200 52 800
14 500 72 500
Ukupno: - 60 400 192 200

Izračunajmo koeficijente linije trenda:

δ=

Dakle, linija trenda Y t = α + δ ∙ t

u našem slučaju, Y t = 43 900+1 100 ∙t,

Gdje t = 0 za period 0.

Napravimo jednačinu za periode 6 (2015) i 7 (2016):

– prognoza za 2015.

Y 7 = 43.900+1.100*7= 51.600

Napravimo graf:

Eksponencijalno izglađivanje trendova

Oblik jednostavnog eksponencijalnog izglađivanja može se koristiti kada vremenska serija otkriva trend. Ova varijacija se naziva eksponencijalno izglađivanje trenda ili ponekad dvostruko izglađivanje. Razlikuje se od jednostavnog eksponencijalnog izglađivanja, koje se koristi samo kada podaci variraju oko neke prosječne vrijednosti ili imaju nagle ili postepene promjene.

Ako serija pokazuje trend i koristi se jednostavno eksponencijalno izglađivanje, tada će sve prognoze zaostajati za trendom. Na primjer, ako se podaci povećaju, tada će svaka prognoza biti potcijenjena. Naprotiv, smanjenje podataka daje precijenjenu prognozu. Grafički prikaz podataka može pokazati kada bi dvostruko izravnavanje bilo poželjnije od jednostrukog.

Trend-prilagođena prognoza (TAF) sastoji se od dva elementa: izglađena greška i faktor trenda.

TAF t +1 = S t + T t, (6)

gdje: S t – uglađena prognoza;

T t – procjena trenutnog trenda

I S t = TAF t + α 1 (A t - TAF t) , (7)

T t = T t-1 + α 2 (TAF t –TAF t-1 – T t-1) (8)

Gdje α 1, α 2– konstante izglađivanja.

Da biste koristili ovu metodu, potrebno je da odaberete vrijednosti α 1, α 2 (uobičajenim odabirom) i napravite početna prognoza i procjenu trendova.

Tabela 4. Eksponencijalni trend izglađivanja.

Jednostavan i logički jasan model vremenske serije izgleda ovako:

Gdje b je konstanta, i ε - slučajna greška. Konstantno b je relativno stabilan u svakom vremenskom intervalu, ali se takođe može sporo mijenjati tokom vremena. Jedan od intuitivnih načina za isticanje značenja b od podataka je korištenje izglađivanja pokretnog prosjeka, u kojem se posljednjim zapažanjima dodijeljuju veće težine od pretposljednjih, pretposljednjim više težine od pretposljednjih itd. Jednostavno eksponencijalno izglađivanje je dizajnirano upravo ovako. Ovdje se eksponencijalno opadajuće težine dodjeljuju starijim opservacijama i, za razliku od pokretnog prosjeka, uzimaju se u obzir sva prethodna opažanja serije, a ne samo ona koja su bila unutar određenog prozora. Tačna formula za jednostavno eksponencijalno izglađivanje je:

Kada se ova formula primenjuje rekurzivno, svaka nova izglađena vrednost (koja je takođe prognoza) se izračunava kao ponderisani prosek trenutnog posmatranja i izglađene serije. Očigledno, rezultat izglađivanja zavisi od parametra α . Ako α jednako 1, tada se prethodna zapažanja potpuno zanemaruju. Ako je a 0, tada se trenutna zapažanja zanemaruju. Vrijednosti α između 0 i 1 daju srednje rezultate. Empirijska istraživanja pokazao da jednostavno eksponencijalno izglađivanje često daje dovoljno tacna prognoza.

U praksi se obično preporučuje uzimanje α manje od 0,30. Međutim, odabir većeg od 0,30 ponekad daje preciznije predviđanje. To znači da je bolje procijeniti optimalna vrijednost α zasnovano na stvarnim podacima, a ne na općim preporukama.

U praksi, optimalni parametar za izravnavanje se često pronalazi korištenjem procedure pretraživanja mreže. Mogući raspon vrijednosti parametara podijeljen je u mrežu s određenim korakom. Na primjer, razmotrite mrežu vrijednosti od α =0,1 do α = 0,9 u koracima od 0,1. Zatim se bira ova vrijednost α , za koji je zbroj kvadrata (ili srednjih kvadrata) reziduala (opažene vrijednosti minus predviđanja korak naprijed) minimalan.

Microsoft Excel ima funkciju eksponencijalnog izglađivanja, koja se obično koristi za izglađivanje nivoa empirijske vremenske serije zasnovane na jednostavnoj metodi eksponencijalnog izglađivanja. Da biste pozvali ovu funkciju, izaberite komandu Alati - Analiza podataka na traci menija. Na ekranu će se otvoriti prozor Data Analysis u kojem treba odabrati vrijednost eksponencijalnog izravnavanja. Kao rezultat, pojavit će se dijaloški okvir Eksponencijalno izglađivanje, predstavljen na sl. 11.5.


U dijaloškom okviru Eksponencijalno izglađivanje, postavljaju se gotovo isti parametri kao u dijaloškom okviru Pokretni prosjek o kojem se govorilo gore.

1. Opseg unosa - u ovo polje se unosi opseg ćelija koje sadrže vrijednosti parametra koji se proučava.

2. Oznake - ova opcija je označena ako prvi red (kolona) u opsegu unosa sadrži naslov. Ako nema naslova, potvrdni okvir treba poništiti. U ovom slučaju, standardni nazivi će se automatski kreirati za podatke o opsegu izlaza.

3. Faktor prigušenja - u ovo polje upisuje se vrijednost odabranog eksponencijalnog koeficijenta izravnavanja α . Zadana vrijednost je α = 0,3.

4. Izlazne opcije - u ovoj grupi, pored specificiranja opsega ćelija za izlazne podatke u polju Output Range, možete zatražiti i da se grafikon automatski generiše provjerom opcije Chart Output, te izračunati standardne greške provjerom opciju Standardne greške.

Koristimo funkciju Eksponencijalno izglađivanje kako bi se ponovo riješio problem o kojem je gore raspravljano, ali koristeći metodu jednostavnog eksponencijalnog izglađivanja. Odabrane vrijednosti parametara izglađivanja prikazane su na Sl. 11.5. Na sl. 11.6 prikazuje izračunate indikatore, a sl. 11.7 - konstruisani grafovi.

Tema 3. Izglađivanje i predviđanje vremenskih serija na osnovu trend modela

Svrha proučavanje ove teme je stvaranje osnovne osnove za obuku menadžera u specijalnosti 080507 u oblasti izgradnje modela razne zadatke u oblasti ekonomije, razvijanje kod studenata sistematskog pristupa postavljanju i rješavanju problema prognoziranja. Predloženi kurs će omogućiti stručnjacima da se brzo prilagode praktičnom radu, bolje snalaze u naučnim i tehničkim informacijama i literaturi u svojoj specijalnosti i budu sigurniji u donošenju odluka koje se javljaju u njihovom radu.

Main zadataka izučavanje teme su: studenti stiču dubinska teorijska znanja o korišćenju prognostičkih modela, stiču održive veštine u izvođenju istraživačkog rada, sposobnost rešavanja složenih naučnih problema povezanih sa konstrukcijom modela, uključujući i višedimenzionalne, sposobnost logičke analize dobijene rezultate i odrediti načine za pronalaženje prihvatljivih odluka.

Dosta jednostavna metoda identifikacija razvojnih trendova je izglađivanje vremenskih serija, tj. zamjena stvarnih nivoa sa izračunatim koji imaju manje varijacije od originalnih podataka. Odgovarajuća transformacija se zove filtriranje. Pogledajmo nekoliko metoda zaglađivanja.

3.1. Jednostavni proseci

Svrha ujednačavanja je da se izgradi model predviđanja za naredne periode na osnovu prošlih zapažanja. U metodi jednostavnih prosjeka, početni podaci se uzimaju kao vrijednosti varijable Y u trenucima vremena t, a vrijednost prognoze je definirana kao jednostavan prosjek za naredni vremenski period. Formula za izračun izgleda kao

Gdje n broj zapažanja.

Kada novo zapažanje postane dostupno, novodobijenu prognozu treba uzeti u obzir prilikom predviđanja za naredni period. Kada se koristi ova metoda, prognoza se radi usrednjavanjem svih prethodnih podataka, međutim, nedostatak takvog predviđanja je teškoća korištenja u trend modelima.

3.2. Metoda pokretnog prosjeka

Ova metoda se zasniva na predstavljanju serije kao zbira prilično glatkog trenda i slučajne komponente. Metoda se temelji na ideji izračunavanja teorijske vrijednosti na temelju lokalne aproksimacije. Za konstruiranje procjene trenda u nekoj tački t na osnovu serijskih vrijednosti iz vremenskog intervala izračunati teorijsku vrijednost serije. Najrasprostranjeniji slučaj u praksi izglađivanja nizova je kada su sve težine za elemente intervala jednake su jedna drugoj. Iz tog razloga se ova metoda naziva metoda pokretnog prosjeka, budući da se prilikom izvođenja postupka otvara prozor širine od (2 m + 1) duž cijelog reda. Širina prozora se obično uzima neparno, jer se za teorijska vrijednost izračunava centralni značaj: broj pojmova k = 2m + 1 sa istim brojem nivoa lijevo i desno od trenutka t.

Formula za izračunavanje pokretnog prosjeka u ovom slučaju ima oblik:

Varijanca pokretnog prosjeka je definirana kao σ 2 /k, gde kroz σ 2 označava disperziju originalnih članova serije, i k interval izglađivanja, dakle, što je veći interval izglađivanja, to je jače usrednjavanje podataka i manje varijabilan identifikovani trend. Najčešće se izglađivanje izvodi pomoću tri, pet i sedam članova originalne serije. U ovom slučaju treba uzeti u obzir sljedeće karakteristike pokretnog prosjeka: ako uzmemo u obzir niz s periodičnim fluktuacijama konstantne dužine, onda kada se izglađuje na osnovu pokretnog prosjeka sa intervalom izravnavanja jednakim ili višekratnim od perioda, fluktuacije će biti potpuno eliminirane. Često, izglađivanje zasnovano na pokretnom prosjeku transformira niz tako snažno da se identificirani trend razvoja pojavljuje samo u većini generalni nacrt, a manji, ali važni za analizu detalji (talasi, krivine, itd.) nestaju; nakon zaglađivanja, mali talasi ponekad mogu da promene pravac tako da se na mestu „vrhova“ pojavljuju suprotne „rupe“ i obrnuto. Sve ovo zahtijeva oprez u korištenju jednostavnog pokretnog prosjeka i tjera nas da tražimo suptilnije metode opisa.

Metoda pokretnog prosjeka ne daje vrijednosti trenda za prvu i posljednju mčlanovi serije. Ovaj nedostatak je posebno uočljiv kada je dužina reda kratka.

3.3. Eksponencijalno izglađivanje

Eksponencijalni prosjek y t je primjer asimetričnog ponderiranog pokretnog prosjeka, koji uzima u obzir stupanj starenja podataka: starije informacije sa manjom težinom uključene su u formulu za izračunavanje izglađene vrijednosti nivoa serije

Evo — eksponencijalni prosek, koji zamenjuje posmatranu vrednost serije y t(izglađivanje uključuje sve podatke primljene do danas t), α parametar izravnavanja koji karakterizira težinu trenutnog (najnovijeg) opažanja; 0< α <1.

Metoda se koristi za predviđanje nestacionarnih vremenskih serija sa slučajnim promjenama nivoa i nagiba. Kako se krećemo dalje u prošlost od trenutnog trenutka u vremenu, težina odgovarajućeg člana serije brzo (eksponencijalno) opada i praktično prestaje da utiče na vrijednost.

Lako je dobiti da nam posljednja relacija omogućava da damo sljedeću interpretaciju eksponencijalnog prosjeka: if — prognoza serijske vrijednosti y t, tada je razlika greška prognoze. Dakle, prognoza za naredni trenutak t+1 uzima u obzir ono što je postalo poznato u ovom trenutku t greška prognoze.

Parametar izglađivanja α je faktor težine. U slučaju α je blizu jedinice, tada prognoza značajno uzima u obzir veličinu greške posljednje prognoze. Pri malim vrijednostima α predviđena vrijednost je bliska prethodnoj prognozi. Odabir parametra za izravnavanje je prilično složen problem. Opća razmatranja su sljedeća: metoda je dobra za predviđanje prilično glatkih serija. U ovom slučaju, možete odabrati konstantu izravnavanja tako što ćete minimizirati grešku predviđanja za jedan korak unaprijed procijenjenu iz posljednje trećine serije. Neki stručnjaci ne preporučuju korištenje velikih vrijednosti parametra izravnavanja. Na sl. Slika 3.1 prikazuje primjer izglađenog niza koristeći metodu eksponencijalnog izglađivanja sa α= 0,1.

Rice. 3.1. Rezultat eksponencijalnog izglađivanja na α =0,1
(1 originalna serija; 2 izglađene serije; 3 ostatka)

3.4. Eksponencijalno izglađivanje
uzimajući u obzir trend (Holtova metoda)

Ova metoda uzima u obzir lokalni linearni trend prisutan u vremenskoj seriji. Ako postoji uzlazni trend u vremenskoj seriji, tada je uz procjenu trenutnog nivoa neophodna i procjena nagiba. U Holt tehnici, vrijednosti nivoa i nagiba se izravnavaju korištenjem različitih konstanti za svaki parametar. Konstantno izglađivanje vam omogućava da procijenite trenutni nivo i nagib, prečišćavajući ih kad god se pojave nova zapažanja.

Holt metoda koristi tri formule za izračunavanje:

  1. Eksponencijalno izglađene serije (procjena trenutnog nivoa)

(3.2)

  1. Procjena trenda

(3.3)

  1. Prognoza za r periodi pred nama

(3.4)

Gdje α, β izglađujuće konstante iz intervala.

Jednačina (3.2) je slična jednačini (3.1) za jednostavno eksponencijalno izglađivanje osim za termin trenda. Konstantno β potrebno da se izgladi procjena trenda. U jednadžbi prognoze (3.3), procjena trenda se množi sa brojem perioda r, na kojem se zasniva prognoza, a zatim se ovaj proizvod dodaje trenutnom nivou izglađenih podataka.

Trajno α I β biraju se subjektivno ili minimiziranjem greške predviđanja. Što su veće težine, to će se brže reagirati na promjene i podaci će biti glatkiji. Manje težine čine strukturu izglađenih vrijednosti manje glatkom.

Na sl. 3.2 pokazuje primjer izglađivanja niza pomoću Holt metode sa vrijednostima α I β , jednako 0,1.

Rice. 3.2. Rezultat izglađivanja pomoću Holt metode
at α = 0,1 I β = 0,1

3.5. Eksponencijalno izglađivanje uzimajući u obzir trendove i sezonske varijacije (Winters metoda)

Kada postoje sezonske varijacije u strukturi podataka, troparametarski model eksponencijalnog izglađivanja koji je predložio Winters koristi se za smanjenje grešaka u prognozi. Ovaj pristup je produžetak Holtovog prethodnog modela. Da bi se uzele u obzir sezonske varijacije, ovdje se koristi dodatna jednadžba, a ova metoda je u potpunosti opisana sa četiri jednačine:

  1. Eksponencijalno izglađene serije

(3.5)

  1. Procjena trenda

(3.6)

  1. Procjena sezonalnosti

.

(3.7)

  1. Prognoza za r periodi pred nama

(3.8)

Gdje α, β, γ stalno izglađivanje za nivo, trend i sezonalnost, respektivno; s- trajanje perioda sezonskih fluktuacija.

Jednačina (3.5) ispravlja izglađenu seriju. Termin u ovoj jednadžbi uzima u obzir sezonskost u izvornim podacima. Nakon uzimanja u obzir sezonalnosti i trenda u jednadžbama (3.6), (3.7), procjene se izglađuju i predviđa se u jednačini (3.8).

Isto kao u prethodnoj metodi, utezi α, β, γ može se odabrati subjektivno ili minimiziranjem greške predviđanja. Prije primjene jednačine (3.5) potrebno je odrediti početne vrijednosti za izglađene serije Lt, trend T t, sezonski koeficijenti S t. Obično se početna vrijednost izglađene serije uzima jednaka prvoj opservaciji, zatim je trend jednak nuli, a koeficijenti sezonskosti se postavljaju jednakima jedan.

Na sl. Slika 3.3 prikazuje primjer izglađivanja niza korištenjem Wintersove metode.

Rice. 3.3. Rezultat zaglađivanja po Winters metodi
at α = 0,1 = 0,1; γ = 0,1(1 - originalna serija; 2 izglađene serije; 3 ostatka)

3.6. Predviđanje zasnovano na trend modelima

Vrlo često vremenske serije imaju linearni trend (trend). Uz pretpostavku linearnog trenda, potrebno je konstruisati pravu liniju koja bi najpreciznije odražavala promjenu dinamike u posmatranom periodu. Postoji nekoliko metoda za konstruisanje prave linije, ali najobjektivnija sa formalne tačke gledišta biće konstrukcija zasnovana na minimiziranju zbira negativnih i pozitivnih odstupanja početnih vrednosti serije od prave.

Prava linija u dvokoordinatnom sistemu (x,y) može se odrediti presječnom točkom jedne od koordinata at i ugao nagiba prema osi X. Jednačina takve linije će izgledati ovako Gdje a- tačka preseka; b ugao nagiba.

Da bi prava linija odražavala tok dinamike, potrebno je minimizirati zbir vertikalnih odstupanja. Kada se kao kriterij za procjenu minimizacije koristi jednostavan zbir odstupanja, rezultat neće biti baš dobar, jer se negativna i pozitivna odstupanja međusobno kompenziraju. Minimiziranje zbira apsolutnih vrijednosti također ne dovodi do zadovoljavajućih rezultata, jer su procjene parametara u ovom slučaju nestabilne, a postoje i računske poteškoće u implementaciji takvog postupka procjene. Stoga je najčešće korištena procedura minimiziranje sume kvadrata odstupanja ili metoda najmanjih kvadrata(MNC).

Budući da serija početnih vrijednosti ima fluktuacije, model serije će sadržavati greške, čiji kvadrati moraju biti minimizirani

gdje je y i posmatrana vrijednost; y i * teorijske vrijednosti modela; broj posmatranja.

Prilikom modeliranja trenda originalne vremenske serije koristeći linearni trend, pretpostavljamo da

Dijeljenje prve jednadžbe sa n, dolazimo do sljedećeg

Zamjena dobijenog izraza u drugu jednačinu sistema (3.10), za koeficijent b* dobijamo:

3.7. Provjera uklapanja modela

Kao primjer na sl. 3.4 prikazuje grafik linearne regresije između snage automobila X i njen trošak at.

Rice. 3.4. Grafikon linearne regresije

Jednačina za ovaj slučaj je: at=1455,3 + 13,4 X. Vizuelna analiza ove slike pokazuje da za brojna opažanja postoje značajna odstupanja od teorijske krive. Grafikon ostatka prikazan je na Sl. 3.5.

Rice. 3.5. Bilans grafikon

Analiza reziduala regresijske linije može pružiti korisnu mjeru koliko dobro procijenjena regresija odražava stvarne podatke. Dobra regresija je ona koja objašnjava značajan dio varijanse i, obrnuto, loša regresija ne prati veliku količinu varijacija u izvornim podacima. Intuitivno je jasno da će svaka dodatna informacija poboljšati model, tj. smanjiti neobjašnjivi dio varijacije u varijabli at. Da bismo analizirali regresiju, rastaviti ćemo varijansu na komponente. Očigledno je da

Posljednji član će biti jednak nuli, jer predstavlja zbir ostataka, pa dolazimo do sljedećeg rezultata

Gdje SS 0, SS 1, SS 2 odrediti ukupni, regresijski i rezidualni zbir kvadrata, respektivno.

Regresijski zbir kvadrata mjeri dio varijanse objašnjen linearnim odnosom; rezidualni dio varijanse koji nije objašnjen linearnim odnosom.

Svaki od ovih zbroja karakterizira odgovarajući broj stupnjeva slobode (DOF), koji određuje broj jedinica podataka neovisnih jedna o drugoj. Drugim rečima, broj otkucaja srca je povezan sa brojem posmatranja n i broj parametara izračunat iz ukupnosti podataka. U slučaju koji se razmatra, izračunati SS 0 određuje se samo jedna konstanta (prosječna vrijednost), dakle broj otkucaja srca za SS 0 će biti (n1), Otkucaji srca za SS 2 – (n – 2) i puls za SS 1će biti n – (n – 1)=1, pošto postoji n – 1 konstantna tačka u jednačini regresije. Baš kao i sumi kvadrata, otkucaji srca su povezani relacijom

Zbroji kvadrata koji su povezani sa dekompozicijom varijanse, zajedno sa odgovarajućim HR, mogu se staviti u tzv. analizu varijanse (ANOVA table ANAlysis Of VARiance) (Tablica 3.1).

Tabela 3.1

ANOVA table

Izvor

Zbir kvadrata

Srednji kvadrat

Regresija

SS 2/(n-2)

Koristeći uvedenu skraćenicu za sume kvadrata, definiramo koeficijent determinacije kao omjer zbira kvadrata regresije i ukupnog zbira kvadrata u obliku

(3.13)

Koeficijent determinacije mjeri udio varijabilnosti varijable Y, što se može objasniti korištenjem informacija o varijabilnosti nezavisne varijable X. Koeficijent determinacije se mijenja od nule kada X ne utiče Y, na jedan kada se promeni Y u potpunosti objašnjeno promjenom X.

3.8. Model regresijske prognoze

Najbolja prognoza je ona sa minimalnom varijansom. U našem slučaju, obični OLS proizvodi najbolju prognozu od svih metoda koje proizvode nepristrasne procjene zasnovane na linearnim jednačinama. Greška prognoze povezana sa procedurom predviđanja može doći iz četiri izvora.

Prvo, slučajna priroda aditivnih grešaka kojima se upravlja linearnom regresijom osigurava da će prognoza odstupiti od pravih vrijednosti čak i ako je model ispravno specificiran i njegovi parametri su precizno poznati.

Drugo, sam proces procene unosi grešku u procenu parametara, oni retko mogu biti jednaki pravim vrednostima, iako su im u proseku jednaki.

Treće, u slučaju uvjetne prognoze (u slučaju točno nepoznatih vrijednosti nezavisnih varijabli), unosi se greška u prognozu varijabli objašnjenja.

Četvrto, može doći do greške jer specifikacija modela nije tačna.

Kao rezultat toga, izvori grešaka se mogu klasificirati na sljedeći način:

  1. priroda varijable;
  2. priroda modela;
  3. greška koju donosi prognoza nezavisnih slučajnih varijabli;
  4. greška u specifikaciji.

Razmotrićemo bezuslovnu prognozu, kada se nezavisne varijable lako i tačno predviđaju. Počnimo da razmatramo problem kvaliteta prognoze sa uparenom regresijskom jednadžbom.

Iskaz problema u ovom slučaju može se formulirati na sljedeći način: koja će biti najbolja prognoza y T+1, pod uvjetom da je u modelu y = a + bx parametri A I b su tačno procijenjene, a vrijednost x T+1 poznato.

Tada se predviđena vrijednost može definirati kao

Greška prognoze će biti

.

Greška predviđanja ima dva svojstva:

Rezultirajuća varijansa je minimalna među svim mogućim procjenama zasnovanim na linearnim jednačinama.

Mada A i b su poznati, greška prognoze se javlja zbog činjenice da na T+1 možda neće ležati na liniji regresije zbog greške ε T+1, podložna normalnoj distribuciji sa nultom srednjom vrijednosti i varijansom σ 2. Da bismo provjerili kvalitetu prognoze, uvodimo normaliziranu vrijednost

Tada možete definirati interval pouzdanosti od 95% na sljedeći način:

Gdje β 0,05 kvantila normalne distribucije.

Granice intervala od 95% mogu se definirati kao

Imajte na umu da je u ovom slučaju širina interval poverenja ne zavisi od veličine X, a granice intervala su prave linije paralelne sa linijom regresije.

Češće je prilikom konstruisanja regresijske linije i provjere kvaliteta prognoze potrebno procijeniti ne samo parametre regresije, već i varijansu greške prognoze. Može se pokazati da u ovom slučaju varijansa greške zavisi od vrijednosti (), gdje je prosječna vrijednost nezavisne varijable. Osim toga, što je serija duža, to je tačnija prognoza. Greška prognoze se smanjuje ako je vrijednost X T+1 blizu prosječne vrijednosti nezavisne varijable, i obrnuto, kada se udalji od prosječne vrijednosti, prognoza postaje manje tačna. Na sl. Slika 3.6 prikazuje rezultate prognoze korištenjem jednadžbe linearne regresije za 6 vremenskih intervala unaprijed zajedno sa intervalima povjerenja.

Rice. 3.6. Prognoza linearnom regresijskom jednadžbom

Kao što se može videti sa sl. 3.6, ova linija regresije ne opisuje dovoljno dobro originalne podatke: postoji velika varijacija u odnosu na liniju uklapanja. O kvalitetu modela može se suditi i po rezidualima, koje, ako je model zadovoljavajući, treba rasporediti približno prema normalnom zakonu. Na sl. Slika 3.7 prikazuje graf reziduala konstruisan korišćenjem skale verovatnoće.

Sl.3.7. Bilans grafikon

Kada se koristi ovakva skala, podaci koji se pridržavaju normalnog zakona moraju ležati na pravoj liniji. Kao što proizilazi iz gornje slike, tačke na početku i kraju perioda posmatranja donekle odstupaju od prave linije, što ukazuje da odabrani model u obliku jednačine linearne regresije nije dovoljno kvalitetan.

U tabeli Tabela 3.2 prikazuje rezultate prognoze (druga kolona) zajedno sa intervalima pouzdanosti od 95% (donja treća i gornja četvrta kolona, ​​respektivno).

Tabela 3.2

Rezultati prognoze

3.9. Multivarijantni regresijski model

U multivarijantnoj regresiji, podaci za svaki slučaj uključuju vrijednosti zavisne varijable i svake nezavisne varijable. Zavisna varijabla y ovo je slučajna varijabla povezana sa nezavisnim varijablama sljedećim odnosom:

gdje se određuju koeficijenti regresije; ε komponenta greške koja odgovara odstupanju vrijednosti zavisne varijable od pravog odnosa (pretpostavlja se da su greške nezavisne i da imaju normalnu distribuciju sa nultim matematičkim očekivanjem i nepoznatom varijansom σ ).

Za dati skup podataka, procjene koeficijenata regresije mogu se naći pomoću OLS-a. Ako su OLS procjene označene sa , tada će odgovarajuća regresijska funkcija imati oblik:

Ostaci su procjene komponente greške i slični su rezidualima u slučaju jednostavne linearne regresije.

Statistička analiza multivarijantnog regresijskog modela provodi se slično jednostavnoj linearnoj regresijskoj analizi. Standardni statistički softverski paketi omogućavaju dobijanje OLS procjena za parametre modela i procjene njihovih standardnih grešaka. Alternativno, možete dobiti vrijednost t-statistiku za provjeru značaja pojedinih termina regresionog modela i vrijednosti F-statistiku za provjeru značajnosti regresijske zavisnosti.

Oblik podjele suma kvadrata u slučaju multivarijantne regresije sličan je izrazu (3.13), ali će odnos za broj otkucaja srca biti sljedeći

Još jednom to naglasimo n predstavlja obim zapažanja, i k broj varijabli u modelu. Ukupna varijacija zavisne varijable sastoji se od dvije komponente: varijacije objašnjene nezavisnim varijablama kroz funkciju regresije i neobjašnjive varijacije.

ANOVA tabela za slučaj multivarijantne regresije će imati oblik prikazan u tabeli. 3.3.

Tabela 3.3

ANOVA table

Izvor

Zbir kvadrata

Srednji kvadrat

Regresija

SS 2/(n-k-1)

Kao primjer multivarijantne regresije koristit ćemo podatke iz paketa Statistica (datoteka sa podacima Poverty.Sta) Prikazani podaci zasnovani su na poređenju rezultata popisa iz 1960. i 1970. godine. za slučajni uzorak od 30 zemalja. Imena zemalja su unesena kao nazivi nizova, a imena svih varijabli u ovoj datoteci su data u nastavku:

POP_CHNG promjena stanovništva za 1960-1970;

N_EMPLD broj zaposlenih u poljoprivredi;

PT_SIROMAN procenat porodica koje žive ispod nivoa siromaštva;

TAX_RATE poreska stopa;

PT_PHONE postotak stanova sa telefonom;

PT_RURAL procenat ruralnog stanovništva;

STAROST srednjih godina.

Kao zavisnu varijablu biramo znak Pt_Poor, a kao nezavisni - sve ostalo. Izračunati koeficijenti regresije između odabranih varijabli dati su u tabeli. 3.4

Tabela 3.4

Regresijski koeficijenti

Ova tabela prikazuje koeficijente regresije ( IN) i standardizirani koeficijenti regresije ( Beta). Korištenje koeficijenata IN uspostavlja se oblik regresione jednadžbe, koja u ovom slučaju ima oblik:

Uključivanje samo ovih varijabli na desnoj strani je zbog činjenice da samo ovi znakovi imaju vrijednost vjerovatnoće r manji od 0,05 (vidi četvrtu kolonu tabele 3.4).

Bibliografija

  1. Basovsky L. E. Predviđanje i planiranje u tržišnim uslovima. – M.: Infra - M, 2003.
  2. Box J., Jenkins G. Analiza vremenskih serija. Izdanje 1. Prognoza i upravljanje. – M.: Mir, 1974.
  3. Borovikov V. P., Ivčenko G. I. Predviđanje u sistemu Statistica u Windows okruženju. – M.: Finansije i statistika, 1999.
  4. Vojvoda V. Obrada podataka na PC-u u primjerima. – Sankt Peterburg: Petar, 1997.
  5. Ivčenko B. P., Martiščenko L. A., Ivancov I. B. Informaciona mikroekonomija. Dio 1. Metode analize i predviđanja. – Sankt Peterburg: Nordmed-Izdat, 1997.
  6. Krichevsky M. L. Uvod u umjetne neuronske mreže: Udžbenik. dodatak. – SPb.: SPb. stanje marine tech. univ., 1999.
  7. Soshnikova L. A., Tamashevich V. N., Uebe G. et al. Multivarijantna statistička analiza u ekonomiji. – M.: Jedinstvo-Dana, 1999.


Novo na sajtu

>

Najpopularniji