Bahay Oral cavity Mga parameter ng equation ng trend. Trend line sa Excel sa iba't ibang chart

Mga parameter ng equation ng trend. Trend line sa Excel sa iba't ibang chart

Ang trend ay isang pattern na naglalarawan sa pagtaas o pagbaba ng isang indicator sa paglipas ng panahon. Kung naglalarawan ka ng anumang mga dynamic na serye (data ng istatistika na isang listahan ng mga naitala na halaga ng isang variable na tagapagpahiwatig sa paglipas ng panahon) sa isang graph, ang isang partikular na anggulo ay madalas na naka-highlight - ang curve ay unti-unting tumataas o bumababa, sa mga ganitong kaso ito ay kaugalian upang sabihin na ang dynamic na serye ay may posibilidad (sa pagtaas o pagbaba, ayon sa pagkakabanggit).

Uso bilang isang modelo

Kung gagawa ka ng isang modelo na naglalarawan sa hindi pangkaraniwang bagay na ito, makakakuha ka ng isang medyo simple at napaka-maginhawang tool sa pagtataya na hindi nangangailangan ng anumang kumplikadong mga kalkulasyon o oras na ginugol sa pagsuri sa kahalagahan o kasapatan ng mga salik na nakakaimpluwensya.

Kaya, ano ang isang trend bilang isang modelo? Ito ay isang set ng mga kalkuladong equation coefficient na nagpapahayag ng regression dependence ng indicator (Y) sa mga pagbabago sa oras (t). Ibig sabihin, ito ay eksaktong kaparehong regression tulad ng mga napag-isipan natin kanina, tanging ang nakakaimpluwensyang salik dito ay ang tagapagpahiwatig ng oras.

Mahalaga!

Sa mga kalkulasyon, ang t ay karaniwang hindi nangangahulugan ng numero ng taon, buwan o linggo, ngunit sa halip ay ang serial number ng panahon sa istatistikal na populasyon na pinag-aaralan - ang serye ng oras. Halimbawa, kung ang isang serye ng oras ay pinag-aralan sa loob ng ilang taon, at ang data ay naitala buwan-buwan, kung gayon ang paggamit ng zero-based na pagnunumero ng mga buwan, mula 1 hanggang 12 at muli mula sa simula, ay sa panimula ay mali. Hindi rin tama kung ang pag-aaral ng isang serye ay magsisimula, halimbawa, sa Marso, upang gamitin ang 3 (ang ikatlong buwan ng taon) bilang halaga ng t; kung ito ang unang halaga sa populasyon na pinag-aaralan, pagkatapos ay ang serial nito dapat 1 ang numero.

Linear na modelo ng trend

Tulad ng anumang iba pang regression, ang isang trend ay maaaring linear (ang antas ng nakakaimpluwensyang salik t ay katumbas ng 1) o nonlinear (ang antas ay mas malaki o mas mababa sa isa). kasi linear regression ay ang pinakasimpleng, bagaman hindi palaging ang pinaka-tumpak, isasaalang-alang namin ang ganitong uri ng trend nang mas detalyado.

Pangkalahatang anyo ng linear trend equation:

Y(t) = a 0 + a 1 *t + Ɛ

Kung ang isang 0 ay isang zero regression coefficient, iyon ay, kung ano ang magiging Y kung ang influencing factor ay katumbas ng zero, ang isang 1 ay isang regression coefficient na nagpapahayag ng antas ng dependence ng pinag-aralan na indicator Y sa nakakaimpluwensyang factor t, Ɛ ay isang random na bahagi o pamantayan ang error ay mahalagang pagkakaiba sa pagitan ng aktwal na mga halaga ng Y at ang mga kinakalkula. t ang tanging salik na nakakaimpluwensya – oras.

Kung mas malinaw ang ugali para sa tagapagpahiwatig na lumago o mahulog, mas malamang na ito ay magiging mas mataas na koepisyent a 1 . Alinsunod dito, ipinapalagay na ang pare-parehong a 0 kasama ang random na bahagi Ɛ ay sumasalamin sa natitirang mga impluwensya ng regression, bilang karagdagan sa oras, iyon ay, lahat ng iba pang posibleng mga salik na nakakaimpluwensya.

Maaari mong kalkulahin ang mga coefficient ng modelo karaniwang pamamaraan hindi bababa sa mga parisukat(MNC). Sa lahat ng mga kalkulasyong ito Microsoft Excel nakayanan ang isang putok sa sarili nitong, at upang makakuha ng isang linear na modelo ng trend o isang handa na pagtataya, mayroong kasing dami ng limang mga pamamaraan, na tatalakayin natin nang hiwalay sa ibaba.

Graphical na paraan ng pagkuha ng linear trend

Sa ito at sa lahat ng karagdagang halimbawa, gagamitin namin ang parehong dynamic na serye - ang antas ng GDP, na kinakalkula at naitala taun-taon, ang pag-aaral ay magaganap sa panahon mula 2004 hanggang 2012;

Magdagdag tayo ng isa pang column sa orihinal na data, na tatawagin nating t at markahan ito ng mga numero sa pataas na pagkakasunud-sunod mga serial number lahat ng naitala na halaga ng GDP para sa tinukoy na panahon mula 2004 hanggang 2012. – 9 na taon o 9 na panahon.

Magdaragdag ang Excel ng walang laman na field - markup para sa hinaharap na graph, piliin ang graph na ito at i-activate ang tab na lalabas sa menu bar - Tagabuo, naghahanap ng isang pindutan Pumili ng data, sa window na bubukas, pindutin ang button Idagdag. Ipo-prompt ka ng pop-up window na pumili ng data para gumawa ng chart. Bilang halaga ng field Pangalan ng serye piliin ang cell na naglalaman ng teksto na pinakamahusay na tumutugma sa pangalan ng graph. Sa bukid Mga halaga ng X ipahiwatig ang pagitan ng mga cell sa column t - ang nakakaimpluwensyang kadahilanan. Sa bukid mga halaga ng Y ipahiwatig ang pagitan ng mga cell ng column na may kilalang halaga GDP (Y) – ang indicator na pinag-aaralan.

Matapos mapunan ang mga tinukoy na patlang, pindutin ang OK na buton nang ilang beses at kumuha ng handa na dynamics graph. Ngayon piliin ang mismong linya ng graph gamit ang kanang pindutan ng mouse at piliin ang item mula sa menu ng konteksto na lilitaw Magdagdag ng trend line

Magbubukas ang isang window upang i-configure ang mga parameter para sa pagbuo ng isang trend line, kung saan kabilang sa mga uri ng modelo ang pipiliin namin Linear, maglagay ng check mark sa tabi ng mga item P magbigay ng equation sa isang diagram At Ilagay ang approximation reliability value R2 sa diagram, magiging sapat na ito para maipakita sa graph ang nabuo nang trend line, pati na rin ang mathematical na bersyon ng pagpapakita ng modelo sa anyo ng isang ready-made equation at indicator ng kalidad ng modelo. R 2. Kung interesado ka sa pagpapakita ng hula sa isang graph upang biswal na masuri ang agwat sa pagitan ng indicator na pinag-aaralan, ipahiwatig sa field Pagtataya nang maaga para sa bilang ng mga panahon ng interes.

Sa totoo lang, iyon lang ang tungkol sa pamamaraang ito, siyempre maaari mong idagdag na ang ipinapakitang linear trend equation ay ang modelo mismo, na maaaring magamit bilang isang formula upang makakuha ng mga kinakalkula na halaga mula sa modelo at, nang naaayon. eksaktong mga halaga pagtataya (ang hula na ipinapakita sa graph ay maaari lamang tantyahin nang humigit-kumulang), na kung ano ang ginawa namin sa halimbawang nakalakip sa artikulo.

Bumuo ng linear na trend gamit ang LINEST formula

Ang kakanyahan ng pamamaraang ito ay bumababa sa paghahanap ng mga linear trend coefficient gamit ang function LINEST, pagkatapos, pinapalitan ang mga nakakaimpluwensyang coefficient na ito sa equation, nakakakuha kami ng predictive na modelo.

Kakailanganin naming pumili ng dalawang katabing mga cell (sa screenshot ito ay mga cell A38 at B38), pagkatapos ay sa formula bar sa itaas (naka-highlight sa pula sa screenshot sa itaas) tinatawag namin ang function sa pamamagitan ng pagsulat ng "=LINEST(", pagkatapos na Excel ay magpapakita ng mga pahiwatig sa kung ano ang kinakailangan para sa mga function na ito, katulad:

  1. pumili ng isang hanay na may mga kilalang halaga ng inilarawan na tagapagpahiwatig Y (sa aming kaso, GDP, sa screenshot ang hanay ay naka-highlight sa asul) at maglagay ng semicolon
  2. ipahiwatig ang hanay ng mga nakakaimpluwensyang salik X (sa aming kaso ito ang t indicator, ang serial number ng mga tuldok, na naka-highlight sa berde sa screenshot) at maglagay ng semicolon
  3. ang susunod na kinakailangang parameter para sa function ay ang pagtukoy kung ang pare-pareho ay kailangang kalkulahin, dahil sa una naming isinasaalang-alang ang isang modelo na may pare-pareho (coefficient a 0 ), pagkatapos ay ilagay ang alinman sa "TRUE" o "1" at isang semicolon
  4. Susunod, kailangan naming ipahiwatig kung kinakailangan ang pagkalkula ng mga parameter ng istatistika (kung isasaalang-alang namin ang opsyong ito, sa una ay kailangan naming maglaan ng hanay "para sa formula" ng ilang linya sa ibaba). Ipahiwatig ang pangangailangan upang makalkula ang mga istatistikal na parameter, ibig sabihin karaniwang halaga ng error para sa mga koepisyent, koepisyent ng determinismo, karaniwang error para sa Y, pamantayan ng Fisher, mga antas ng kalayaan, atbp., magkakaroon lang sila ng kahulugan kapag naiintindihan mo ang ibig sabihin ng mga ito, kung saan itinakda namin ang alinman sa "TOTOO" o "1". Sa kaso ng pinasimpleng pagmomodelo, na sinusubukan naming matutunan, sa yugtong ito ng pagsulat ng formula, itakda ang "FALSE" o "0" at idagdag pagkatapos ng closing bracket ")"
  5. upang "muling buhayin" ang formula, iyon ay, upang gawin itong gumana pagkatapos ng lahat ng kinakailangang mga parameter, hindi sapat na pindutin ang Enter button, kailangan mong pindutin ang tatlong key sa pagkakasunud-sunod: Ctrl, Shift, Enter

Tulad ng makikita mo sa screenshot sa itaas, ang mga cell na pinili namin para sa formula ay napuno ng mga kinakalkula na halaga ng mga coefficient ng regression para sa linear trend, sa cell B38 ang koepisyent ay matatagpuan a 0 , at sa selda A38- koepisyent ng pagtitiwala sa parameter t (o x ), iyon ay a 1 . Pinapalitan namin ang nakuha na mga halaga sa equation ng linear function at makuha ang tapos na modelo sa mathematical expression - y = 169,572.2+138,454.3*t

Upang makakuha ng mga kinakalkula na halaga Y ayon sa modelo at, nang naaayon, para makakuha ng forecast, kailangan mo lang palitan ang formula sa isang Excel cell, at sa halip t magpahiwatig ng isang link sa cell na may kinakailangang numero ng panahon (tingnan ang cell sa screenshot D25).

Upang ihambing ang resultang modelo sa totoong data, maaari kang bumuo ng dalawang graph, kung saan ang X ay ipinapahiwatig mo ang serial number ng panahon, at bilang Y, sa isang kaso - totoong GDP, at sa isa pa - kinakalkula (sa screenshot, ang diagram sa kanan).

Bumuo ng linear na trend gamit ang Regression tool sa Analysis Package

Ang artikulo, sa katunayan, ay ganap na naglalarawan sa pamamaraang ito, ang pagkakaiba lamang ay sa aming paunang data mayroon lamang isang salik na nakakaimpluwensya. X (bilang ng panahon – t ).

Tulad ng makikita mo sa larawan sa itaas, hanay ng data na may mga kilalang halaga ng GDP naka-highlight bilang pagitan ng input Y, at ang kaukulang isa hanay na may mga numero ng panahon t – bilang pagitan ng input X. Ang mga resulta ng mga kalkulasyon ng Package ng Pagsusuri ay ipinapakita sa isang hiwalay na sheet at mukhang isang set ng mga talahanayan (tingnan ang figure sa ibaba) kung saan kami ay interesado sa mga cell na ipininta ko sa dilaw at kulay berde. Sa pamamagitan ng pagkakatulad sa pamamaraan na inilarawan sa artikulo sa itaas, ang isang linear na modelo ng trend ay binuo mula sa nakuha na mga coefficient y=169 572.2+138 454.3*t, batay sa kung aling mga pagtataya ang ginawa.

Pagtataya gamit ang linear trend sa pamamagitan ng TREND function

Ang pamamaraang ito ay naiiba sa mga nauna dahil nilaktawan nito ang mga dating kinakailangang hakbang ng pagkalkula ng mga parameter ng modelo at manu-manong pagpapalit ng mga nakuhang coefficient bilang isang formula sa isang cell upang makakuha ng isang pagtataya ang function na ito ay gumagawa ng isang yari na kinakalkula na halaga ng pagtataya batay sa kilala pinagmumulan ng datos.

Sa target na cell (ang cell kung saan gusto naming makita ang resulta) naglalagay kami ng isang senyas katumbas at tawagan ang magic function sa pamamagitan ng pagsulat ng “ TREND(", pagkatapos ay kailangan mong i-highlight ang , iyon ay, pagkatapos naming maglagay ng semicolon at pumili ng hanay na may alam na mga halaga ng X, iyon ay, na may mga numero ng tuldok t, na tumutugma sa isang column na may mga kilalang halaga ng GDP, muling maglagay ng semicolon at piliin ang cell na may bilang ng panahon kung saan kami gumagawa ng pagtataya (gayunpaman, sa aming kaso, ang numero ng panahon ay maaaring ipahiwatig hindi ng isang link sa ang cell, ngunit sa pamamagitan lamang ng isang numero nang direkta sa formula), pagkatapos ay maglagay ng isa pang semicolon at ipahiwatig TOTOO o 1 , bilang kumpirmasyon para sa pagkalkula ng koepisyent a 0 sa wakas nilagay na namin pagsasara ng panaklong at pindutin ang key Pumasok.

Minus ang pamamaraang ito ay hindi ito nagpapakita ng alinman sa equation ng modelo o mga coefficient nito, kaya naman hindi natin masasabi na batay sa ganoon at ganoong modelo ay nakatanggap tayo ng ganito at ganoong forecast, tulad ng walang pagmuni-muni ng mga parameter ng kalidad ng modelo, gayunpaman coefficient of determination, kung saan masasabi ng isa kung makatuwirang isaalang-alang ang resultang hula o hindi.

Pagtataya gamit ang linear trend gamit ang FORECAST function

Ang kakanyahan ng function na ito ay ganap na magkapareho sa nauna, ang pagkakaiba lamang ay nasa pagkakasunud-sunod kung saan ang paunang data ay nakasulat sa formula at sa katotohanan na walang setting para sa pagkakaroon o kawalan ng isang koepisyent a 0 (iyon ay, ang function ay nagpapahiwatig na ang koepisyent na ito ay umiiral sa anumang kaso)

Tulad ng nakikita mo mula sa figure sa itaas, isinusulat namin ang " =PREDICTION("at saka ipahiwatig cell na may period number, kung saan kinakailangan upang kalkulahin ang halaga ayon sa isang linear na trend, iyon ay, isang forecast, pagkatapos kung saan naglalagay kami ng semicolon, pagkatapos ay piliin hanay ng mga kilalang halaga ng Y, iyon ay column na may mga kilalang halaga ng GDP, pagkatapos ay maglagay ng semicolon at i-highlight saklaw na may mga kilalang halaga ng X, iyon ay na may mga numero ng panahon t, na tumutugma sa column na may mga kilalang halaga ng GDP at, sa wakas, itinakda namin pagsasara ng panaklong at pindutin ang key Pumasok.

Ang mga resulta na nakuha, tulad ng sa pamamaraan sa itaas, ay ang natapos na resulta lamang ng pagkalkula ng hinulaang halaga gamit ang isang linear na modelo ng trend, hindi ito nagpapakita ng anumang mga error o ang modelo mismo sa mga terminong matematika.

Upang ibuod ang artikulo

Masasabi nating ang bawat isa sa mga pamamaraan ay maaaring ang pinakakatanggap-tanggap sa iba, depende sa kasalukuyang layunin na itinakda natin para sa ating sarili. Ang unang tatlong pamamaraan ay nagsalubong sa isa't isa kapwa sa kahulugan at sa mga resulta, at angkop para sa anumang higit pa o hindi gaanong seryosong gawain kung saan ang isang paglalarawan ng modelo at ang kalidad nito ay kinakailangan. Sa turn, ang huling dalawang pamamaraan ay magkapareho din sa isa't isa at magbibigay sa iyo ng sagot sa lalong madaling panahon, halimbawa, sa tanong na: "Ano ang forecast ng benta para sa susunod na taon?"

Mga tagubilin

Ang isang linear na trend ay nagpapahayag ng function: y=ax+b, kung saan ay ang halaga kung saan ang susunod na halaga sa serye ng oras ay tataas; x ay ang bilang ng panahon sa isang partikular na serye ng oras (halimbawa, ang bilang ng buwan, araw o quarter);y ay ang pagkakasunud-sunod ng mga nasuri na halaga (maaaring ito ay mga benta para sa buwan b - ang punto ng intersection, na sa graph ay kasama ang y-axis (minimum na antas). , kung ang halaga ng a ay mas malaki kaysa sa zero, kung gayon ang paglago ay magiging positibo. Sa turn, kung ang a ay mas mababa sa zero, kung gayon ang dynamics ng linear uso magiging negatibo.

Gumamit ng linear na trend upang hulaan ang indibidwal na serye ng oras kung saan tumataas o bumababa ang data pare-pareho ang bilis. Kapag gumagawa ng isang linear uso magagamit mo Excel program. Halimbawa, kung kailangan mo ng linear na trend upang makabuo ng forecast ng benta ayon sa buwan, pagkatapos ay gumawa ng 2 variable sa serye ng oras (oras - buwan at dami ng benta).

Linear equation uso magkakaroon ka ng: y=ax+b, kung saan ang y ay mga dami ng benta, ang x ay buwan. Sa x-axis makukuha mo ang iyong yugto ng panahon (1, 2, 3 - ayon sa buwan: Enero, Pebrero, atbp.), sa mga pagbabago sa y-axis sa dami ng benta. Pagkatapos nito, magdagdag ng linya sa graph uso.

Pahabain ang linya uso para sa pagtataya at pagtukoy ng mga halaga nito. Sa kasong ito, dapat mo lamang malaman ang mga halaga ng oras sa kahabaan ng X axis, at kailangan mong kalkulahin ang mga hinulaang halaga gamit ang dating tinukoy na formula.

Ihambing ang nakuha na hinulaang mga halaga ng linear uso na may aktwal na datos. Sa ganitong paraan matutukoy mo ang pagtaas ng dami ng benta bilang isang porsyento.

Maaari mong ayusin ang mga hinulaang halaga ng linear uso kung sakaling hindi ka nasisiyahan sa paglago, i.e. naiintindihan mo na may mga sangkap na maaaring makaapekto dito. Kung babaguhin mo ang halaga ng "a" sa linear trend y=ax+b pagkatapos ay maaari mong taasan ang slope uso. Ito ay kung paano mo mababago ang slope uso, antas uso, o ang dalawang indicator na ito nang sabay-sabay.

Mga Pinagmulan:

  • linear trend equation

Ang numerical sequence ay kinakatawan ng isang function ng form an=f(n), na tinukoy sa set natural na mga numero. Sa karamihan ng mga kaso, ang f(n) ay pinapalitan ng isang in number sequence. Ang mga numerong a1, a2, …, an ay mga miyembro ng sequence, na may a1 ang una, a2 ang pangalawa, at ak ang k-th. Batay sa data ng function ng pagkakasunud-sunod ng numero, isang graph ang binuo.

Kakailanganin mo

  • - reference na libro sa matematika;
  • - pinuno;
  • - kuwaderno;
  • - isang simpleng lapis;
  • - paunang data.

Mga tagubilin

Bago simulan ang pagbuo, tukuyin na ang function ay isang pagkakasunod-sunod ng numero. Mayroong hindi tumataas o hindi bumababa na pagkakasunod-sunod (an), kung saan, para sa anumang halaga ng n, ang isang hindi pagkakapantay-pantay ng form ay wasto: an≥an+1 o an≤an+1. Sa kondisyon na an>an+1 o an

Kapag gumagawa ng isang pagkakasunud-sunod ng numero, bigyang-pansin ang katotohanan na ang pagkakasunud-sunod (an) ay maaaring limitado mula sa ibaba o mula sa itaas: para dito dapat mayroong

Kadalasan uso daw linear dependence ng uri na pinag-aaralan

kung saan ang y ay ang variable ng interes (halimbawa, productivity) o ang dependent variable;
Ang x ay isang numero na tumutukoy sa posisyon (pangalawa, pangatlo, atbp.) ng taon sa panahon ng pagtataya o isang malayang variable.

Kapag linearly approximating ang relasyon sa pagitan ng dalawang parameter, ang least squares method ay kadalasang ginagamit upang mahanap ang empirical coefficients ng isang linear function. Ang kakanyahan ng pamamaraan ay iyon linear function Ang "pinakamahusay na akma" ay dumadaan sa mga punto ng graph na tumutugma sa minimum ng kabuuan ng mga squared deviations ng sinusukat na parameter. Ang kondisyong ito ay mukhang:

kung saan ang n ay ang dami ng populasyon na pinag-aaralan (ang bilang ng mga yunit ng pagmamasid).

kanin. 5.3. Pagbuo ng trend gamit ang least squares method

Ang mga halaga ng mga constants b at a o ang koepisyent ng variable X at ang libreng termino ng equation ay tinutukoy ng formula:

Sa mesa Ang 5.1 ay nagpapakita ng isang halimbawa ng pagkalkula ng isang linear na trend mula sa data.

Talahanayan 5.1. Pagkalkula ng linear na trend

Mga pamamaraan para sa pagpapakinis ng mga oscillation.

Kung may mga malakas na pagkakaiba sa pagitan ng mga kalapit na halaga, ang trend na nakuha ng paraan ng regression ay mahirap suriin. Kapag nagtataya, kapag ang isang serye ay naglalaman ng data na may malaking pagkalat ng mga pagbabago sa mga kalapit na halaga, dapat mong pakinisin ang mga ito ayon sa ilang mga panuntunan, at pagkatapos ay hanapin ang kahulugan sa hula. Upang ang paraan ng smoothing oscillations
kasama ang: moving average na paraan (n-point average ay kinakalkula), exponential smoothing method. Tingnan natin sila.

Moving Average Method (MAM).

Binibigyang-daan ka ng MSS na pakinisin ang isang serye ng mga halaga upang i-highlight ang isang trend. Kinukuha ng paraang ito ang average (karaniwan ay ang arithmetic mean) ng isang nakapirming bilang ng mga halaga. Halimbawa, isang three-point moving average. Ang unang tatlong halaga, na pinagsama-sama mula sa data para sa Enero, Pebrero at Marso (10 + 12 + 13), ay kinuha at ang average ay tinutukoy na 35: 3 = 11.67.

Ang resultang halaga ng 11.67 ay inilalagay sa gitna ng hanay, i.e. ayon sa linya ng Pebrero. Pagkatapos ay "mag-slide kami ng isang buwan" at kunin ang pangalawang tatlong numero, simula Pebrero hanggang Abril (12 + 13 + 16), at kalkulahin ang average na katumbas ng 41: 3 = 13.67, at sa ganitong paraan pinoproseso namin ang data para sa buong serye. Ang mga resultang average ay kumakatawan sa isang bagong serye ng data para sa pagbuo ng isang trend at ang pagtatantya nito. Ang mas maraming puntos ay kinuha upang kalkulahin ang moving average, mas malakas ang smoothing ng mga pagbabago-bagong nangyayari. Ang isang halimbawa mula sa MBA ng pagbuo ng trend ay ibinigay sa talahanayan. 5.2 at sa Fig. 5.4.

Talahanayan 5.2 Pagkalkula ng trend gamit ang three-point moving average method

Ang likas na katangian ng pagbabagu-bago sa orihinal na data at data na nakuha ng moving average na pamamaraan ay inilalarawan sa Fig. 5.4. Mula sa paghahambing ng mga graph ng serye ng mga paunang halaga (serye 3) at tatlong-puntong mga moving average (serye 4), malinaw na ang mga pagbabago ay maaaring i-smooth out. Paano mas malaking bilang Ang mga puntos ay kasangkot sa hanay ng pagkalkula ng moving average, mas malinaw na lalabas ang trend (row 1). Ngunit ang pamamaraan ng pagpapalaki ng saklaw ay humahantong sa isang pagbawas sa bilang ng mga huling halaga at binabawasan nito ang katumpakan ng hula.

Ang mga pagtataya ay dapat gawin batay sa mga pagtatantya ng linya ng pagbabalik batay sa mga halaga ng paunang data o mga moving average.

kanin. 5.4. Ang katangian ng mga pagbabago sa dami ng benta ayon sa buwan ng taon:
paunang data (hilera 3); gumagalaw na mga average (hanay 4); exponential smoothing(hilera 2); trend na binuo ng paraan ng regression (row 1)

Exponential smoothing na paraan.

Ang isang alternatibong diskarte sa pagbabawas ng pagkalat ng mga halaga ng serye ay ang paggamit ng exponential smoothing na paraan. Ang pamamaraan ay tinatawag na "exponential smoothing" dahil sa katotohanan na ang bawat halaga ng mga yugto ng nakaraan ay nababawasan ng isang salik (1 – α).

Ang bawat smoothed value ay kinakalkula gamit ang isang formula ng form:

St =aYt +(1−α)St−1,

kung saan St ay ang kasalukuyang smoothed halaga;
Yt – kasalukuyang halaga ng serye ng oras; St – 1 – dating smoothed value; Ang α ay isang smoothing constant, 0 ≤ α ≤ 1.

Paano mas kaunting halaga pare-pareho ang α, mas hindi gaanong sensitibo sa mga pagbabago sa trend sa isang partikular na serye ng oras.

Ay uso. Ang isa sa mga pinakasikat na paraan upang imodelo ang trend ng isang time series ay ang paghahanap ng analytical function na nagpapakilala sa dependence ng mga antas ng serye sa oras. Ang pamamaraang ito ay tinatawag na analytical time series alignment.

Maaaring tumagal ang pagtitiwala ng indicator sa oras iba't ibang hugis, kaya nahanap nila iba't ibang function: linear, hyperbola, exponential, function ng kapangyarihan, mga polynomial iba't ibang grado. Ang serye ng oras ay sinusuri katulad ng linear regression.

Mga parameter ng anumang trend maaaring matukoy ng ordinaryong paraan ng least squares gamit ang time t = 1, 2,…, n bilang isang factor, at mga antas ng time series bilang dependent variable. Para sa mga hindi linear na uso Una, ang pamamaraan ng linearization ay isinasagawa.

Kabilang sa mga pinakakaraniwang paraan upang matukoy ang uri ng trend qualitative analysis ng pinag-aralan na serye, pagbuo at pagsusuri ng isang graph ng pagtitiwala ng mga antas ng serye sa oras, pagkalkula ng mga pangunahing tagapagpahiwatig ng dinamika. Para sa parehong mga layunin, madalas mong magagamit at.

Linear na kalakaran

Natutukoy ang uri ng trend sa pamamagitan ng paghahambing ng mga first-order na autocorrelation coefficient. Kung ang isang time series ay may linear na trend, ang mga kalapit na antas nito na yt at yt-1 ay malapit na magkakaugnay. Sa kasong ito, dapat na maximum ang first-order na autocorrelation coefficient ng mga antas ng orihinal na serye. Kung ang isang serye ng oras ay naglalaman ng isang hindi linear na trend, kung gayon ang mas malakas na ang nonlinear na trend ay naka-highlight sa serye ng oras, mas ang mga halaga ng mga ipinahiwatig na coefficient ay mag-iiba.

Ang pagpili ng pinakamahusay na equation kung ang serye ay naglalaman ng , ay maaaring gawin sa pamamagitan ng paghahanap sa mga pangunahing uri ng trend, pagkalkula ng correlation coefficient para sa bawat equation at pagpili ng trend equation na may pinakamataas na halaga ng coefficient.

Mga Pagpipilian sa Trend

Ang mga parameter ng exponential at linear trend ay may pinakasimpleng interpretasyon.

Mga Pagpipilian sa Linear Trend binibigyang kahulugan ang mga sumusunod: a - baseline serye ng oras sa oras t = 0; b - average na ganap na pagtaas sa mga antas ng rad sa paglipas ng panahon.

Exponential Trend Parameter magkaroon ng ganitong interpretasyon. Ang parameter a ay ang paunang antas ng serye ng oras sa oras t = 0. Ang halaga ng exp(b) ay ang average sa bawat yunit ng oras rate ng paglago mga antas ng serye.

Sa pamamagitan ng pagkakatulad sa linear na modelo, ang mga kinakalkula na halaga ng mga antas ng rad ayon sa exponential trend ay maaaring matukoy sa pamamagitan ng pagpapalit ng mga halaga ng oras t = 1,2,..., n sa trend equation, o alinsunod sa ang interpretasyon ng mga parameter ng exponential trend: ang bawat kasunod na antas ng naturang serye ay produkto ng nakaraang antas sa pamamagitan ng kaukulang rate ng paglago

Kung mayroong isang implicit na nonlinear na trend, kinakailangang dagdagan ang mga pamamaraan na inilarawan sa itaas para sa pagpili ng pinakamahusay na equation ng trend na may qualitative analysis ng dynamics ng indicator na pinag-aaralan upang maiwasan ang mga error sa specification kapag pumipili ng uri ng trend. Pagsusuri ng kwalitatibo nagsasangkot ng pag-aaral ng mga problema posibleng availability sa pinag-aralan na serye ng mga turning point at mga pagbabago sa mga rate ng paglago, simula sa isang tiyak na punto ng oras sa ilalim ng impluwensya ng isang bilang ng mga kadahilanan, atbp. Kung ang equation ng trend ay napili nang hindi tama para sa malalaking halaga ng t, ang mga resulta ng pagtataya ang dynamics ng time series gamit ang pinag-aralan na equation ay magiging hindi mapagkakatiwalaang sanhi ng error sa espesipikasyon.

Ilustrasyon posibleng hitsura Ang mga error sa pagtutukoy ay ipinapakita sa figure.

Kung ang pinakamainam na hugis ng trend ay isang parabola, habang sa katunayan ay mayroong isang linear na trend, kung gayon sa malaking t ang parabola at ang linear function ay natural na maglalarawan ng trend sa mga antas ng serye sa ibang paraan.

Ang mga kurba ng paglago na naglalarawan ng mga pattern ng pagbuo ng mga phenomena sa paglipas ng panahon ay resulta ng analytical alignment ng time series. Ang pag-align ng isang serye gamit ang ilang partikular na function sa karamihan ng mga kaso ay lumalabas na isang maginhawang paraan ng paglalarawan ng empirical na data. Ang tool na ito, kung matutugunan ang ilang kundisyon, ay maaari ding gamitin para sa pagtataya. Ang proseso ng leveling ay binubuo ng mga sumusunod na pangunahing hakbang:

Pagpili ng uri ng kurba na ang hugis ay tumutugma sa katangian ng pagbabago serye ng oras;

Pagpapasiya ng mga numerical na halaga (pagtatantya) ng mga parameter ng curve;

Isang posterior quality control ng napiling trend.

Sa modernong PPP, ang lahat ng nakalistang yugto ay ipinapatupad nang sabay-sabay, kadalasan sa loob ng balangkas ng isang pamamaraan.

Ang analytical smoothing gamit ang isa o isa pang function ay ginagawang posible na makakuha ng leveled, o, dahil minsan ay hindi masyadong tama ang tawag sa mga ito, theoretical values ​​of the levels of a time series, i.e., mga level na mapapansin kung ang dynamics ng phenomenon ganap na tumutugma sa kurba. Ang parehong function, mayroon man o walang pagsasaayos, ay ginagamit bilang isang modelo para sa extrapolation (pagtataya).

Ang tanong ng pagpili ng uri ng curve ay ang pangunahing isa kapag nakahanay ng isang serye. Ang lahat ng iba pang bagay ay pantay, ang isang error sa paglutas ng isyung ito ay lumalabas na mas makabuluhan sa mga kahihinatnan nito (lalo na para sa pagtataya) kaysa sa isang error na nauugnay sa istatistikal na pagtatantya ng mga parameter.

Dahil ang anyo ng trend ay may layunin na umiiral, kapag kinikilala ito, ang isa ay dapat magpatuloy mula sa materyal na kalikasan ng hindi pangkaraniwang bagay na pinag-aaralan, paggalugad panloob na mga kadahilanan pag-unlad nito, gayundin panlabas na kondisyon at mga salik na nakakaimpluwensya dito. Pagkatapos lamang ng malalim na makabuluhang pagsusuri, maaari kang magpatuloy sa paggamit mga espesyal na pamamaraan, na binuo ng mga istatistika.

Ang isang napaka-karaniwang pamamaraan para sa pagtukoy ng hugis ng isang trend ay ang graphical na representasyon ng isang time series. Ngunit sa parehong oras, ang impluwensya ng subjective na kadahilanan ay mahusay, kahit na nagpapakita ng mga antas ng level.

Ang pinaka-maaasahang paraan para sa pagpili ng isang trend equation ay batay sa mga katangian ng iba't ibang curve na ginamit sa analytical alignment. Ang diskarte na ito ay nagpapahintulot sa amin na iugnay ang uri ng trend sa ilang mga katangian ng husay ng pag-unlad ng phenomenon. Tila sa amin na sa karamihan ng mga kaso, ang isang praktikal na katanggap-tanggap na pamamaraan ay isa na batay sa isang paghahambing ng mga katangian ng mga pagbabago sa mga rate ng paglago ng dynamic na serye sa ilalim ng pag-aaral na may kaukulang mga katangian ng mga curve ng paglago. Para sa pagkakahanay, pinili ang curve na ang batas ng pagbabago sa paglago ay pinakamalapit sa batas ng pagbabago sa aktwal na data.

Kapag pumipili ng hugis ng curve, isa pang pangyayari ang dapat tandaan. Ang pagtaas ng pagiging kumplikado ng curve sa ilang mga kaso ay maaari talagang tumaas ang katumpakan ng paglalarawan ng trend sa nakaraan, gayunpaman, dahil sa katotohanan na ang mas kumplikadong mga curve ay naglalaman ng higit pang mga parameter at mas mataas na kapangyarihan ng independent variable, ang kanilang mga agwat ng kumpiyansa ay, sa pangkalahatan, ay magiging mas malawak kaysa sa mga mas simpleng kurba para sa parehong yugto ng lead.

Sa kasalukuyan, kapag ginagamit mga espesyal na programa nang walang labis na pagsisikap ay nagbibigay-daan sa iyo upang sabay na bumuo ng ilang mga uri ng mga equation, ang mga pormal ay malawakang ginagamit pamantayan sa istatistika upang matukoy ang pinakamahusay na equation ng trend.

Mula sa itaas, tila, maaari nating tapusin na ang pagpili ng hugis ng isang kurba para sa pag-level ay isang gawain na hindi malulutas nang natatangi, ngunit bumababa sa pagkuha ng ilang mga alternatibo. Ang pangwakas na pagpipilian ay hindi maaaring magsinungaling sa larangan ng pormal na pagsusuri, lalo na kung, gamit ang leveling, ito ay inilaan hindi lamang sa istatistika na ilarawan ang pattern ng antas ng pag-uugali sa nakaraan, ngunit din upang i-extrapolate ang natagpuang pattern sa hinaharap. Kasabay nito, ang iba't ibang mga istatistikal na pamamaraan para sa pagproseso ng data ng pagmamasid ay maaaring magkaroon ng makabuluhang benepisyo kahit man lang sa kanilang tulong, posible na tanggihan ang malinaw na hindi angkop na mga opsyon at sa gayon ay makabuluhang limitahan ang larangan ng pagpili.

Isaalang-alang natin ang mga pinaka ginagamit na uri ng mga equation ng trend:

1. Linear trend form:

kung saan ang antas ng hilera na nakuha bilang isang resulta ng pag-align ng tuwid na linya; – antas ng pagpasok kalakaran; – average na ganap na pagtaas, trend constant.

Ang linear na anyo ng trend ay nailalarawan sa pamamagitan ng pagkakapantay-pantay ng tinatawag na mga unang pagkakaiba (mga ganap na pagtaas) at mga zero second na pagkakaiba, ibig sabihin, acceleration.

2. Parabolic (2nd degree polynomial) trend form:

(3.6)

Para sa ganitong uri ng kurba, ang pangalawang pagkakaiba (pagpabilis) ay pare-pareho, at ang pangatlong pagkakaiba ay zero.

Ang parabolic na hugis ng trend ay tumutugma sa isang pinabilis o mabagal na pagbabago sa mga antas ng serye na may patuloy na acceleration. Kung< 0 и >0, kung gayon ang parisukat na parabola ay may pinakamataas na kung > 0 at< 0 – минимум. Для отыскания экстремума первую производную параболы по t katumbas ng 0 at lutasin ang equation para sa t.

3. Logarithmic trend form:

, (3.7)

kung saan pare-pareho ang uso.

Ang isang logarithmic trend ay maaaring maglarawan ng isang tendensya na nagpapakita ng sarili sa isang pagbagal sa paglago ng mga antas ng isang serye ng mga dinamika sa kawalan ng matinding posibleng kahulugan. Kapag sapat na ang laki t ang logarithmic curve ay nagiging indistinguishable mula sa isang tuwid na linya.

4. Multiplicative (power) form ng trend:

(3.8)

5. Polynomial ng 3rd degree:

Naturally, marami pang mga kurba na naglalarawan sa mga pangunahing uso. Gayunpaman, ang format tulong sa pagtuturo ay hindi nagpapahintulot sa amin na ilarawan ang lahat ng kanilang pagkakaiba-iba. Ang mga diskarte para sa pagbuo ng mga modelo na ipinapakita sa ibaba ay magbibigay-daan sa gumagamit na independiyenteng gumamit ng iba pang mga pag-andar, sa partikular na mga kabaligtaran.

Upang malutas ang gawain ng analytical smoothing ng mga serye ng oras sa STATISTICA system, kakailanganin naming lumikha ng karagdagang variable sa sheet na may paunang data ng variable na "VG2001-2010", na dapat gawing aktibo.

Kailangan nating bumuo ng isang trend equation, na mahalagang isang regression equation kung saan ang "oras" ay isang kadahilanan. Lumilikha kami ng variable na "T" na naglalaman ng mga agwat ng oras na 10 taon (mula 2001 hanggang 2010). Ang variable na "T" ay bubuo ng mga natural na numero mula 1 hanggang 10, na tumutugma sa mga tinukoy na taon.

Ang resulta ay ang sumusunod na worksheet (Fig. 3.6)

kanin. 3.6. Worksheet na may nilikhang variable ng oras

Susunod, isaalang-alang ang pamamaraan na nagpapahintulot sa iyo na bumuo mga modelo ng regression parehong linear at nonlinear na uri. Upang gawin ito, piliin ang: Statistics/Advanced Linear/Nonlinear Models/Nonlinear Estimation (Larawan 3.7). Sa window na lilitaw (Fig. 3.8), piliin ang function Regression na tinukoy ng user, Least Squares (manu-manong pagbuo ng mga modelo ng regression ng user, ang mga parameter ng equation ay matatagpuan gamit ang least squares method (LSM)).

Sa susunod na dialog box (Fig. 3.9) i-click ang button Function na tinatantya upang makapunta sa screen para sa manu-manong pagtukoy sa modelo (Larawan 3.10).

kanin. 3.7. Pagpapatakbo ng isang pamamaraan Mga Istatistika/Advanced Linear/

Mga Nonlinear na Modelo/Nonlinear na Pagtatantya

kanin. 3.8. Window ng pamamaraan Nonlinear Estimation

kanin. 3.9 Procedure window Pagbabalik na Tinukoy ng Gumagamit, Mga Pinakamababang Kuwadrado

kanin. 3.10. Window para sa pagpapatupad ng pamamaraan

mano-manong pagtukoy sa equation ng trend

Sa tuktok ng screen mayroong isang patlang para sa pagpasok ng isang function, sa ibaba ay may mga halimbawa ng pagpasok ng mga function para sa iba't ibang mga sitwasyon.

Bago bumuo ng mga modelo na interesado sa amin, ito ay kinakailangan upang linawin ang ilang mga convention. Mga Variable ng Equation ay tinukoy sa format na " v№", kung saan " v»nagsasaad ng variable ( mula sa Ingles « variable"), at "Hindi" ay ang numero ng column kung saan ito matatagpuan sa talahanayan sa worksheet na may source data. Kung mayroong maraming mga variable, pagkatapos ay mayroong isang pindutan sa kanan Suriin ang mga vars , na nagbibigay-daan sa iyong piliin ang mga ito mula sa listahan ayon sa pangalan at tingnan ang kanilang mga parameter gamit ang button Mag-zoom (Larawan 3.11).

kanin. 3.11. Window para sa pagpili ng variable gamit ang isang button Suriin ang mga vars

Ang mga parameter ng mga equation ay tinutukoy ng anumang mga letrang Latin na hindi tumutukoy sa anumang operasyong matematika. Upang gawing simple ang gawain, iminungkahi na italaga ang mga parameter ng equation tulad ng sa paglalarawan ng mga equation ng trend - Latin na titik « A”, sunod-sunod na pagtatalaga ng mga serial number sa kanila. Mga palatandaan mga operasyong matematikal(pagbabawas, pagdaragdag, pagpaparami, atbp.) ay tinukoy sa karaniwang paraan Windows-format ng aplikasyon. Walang kinakailangang puwang sa pagitan ng mga elemento ng equation.

Kaya, isaalang-alang natin ang unang modelo ng trend - linear, .

Samakatuwid, pagkatapos mag-type ito ay magiging ganito:

,

saan v 1 ay isang column sa sheet na may source data, na naglalaman ng mga value ng orihinal na dynamic na serye; A 0 at A 1 - mga parameter ng equation; v 2 – haligi sa sheet na may orihinal na data, na naglalaman ng mga halaga ng mga agwat ng oras (variable T) (Larawan 3.12).

Pagkatapos nito, pindutin ang pindutan ng dalawang beses OK .

kanin. 3.12. Window para sa pagtatakda ng linear trend equation

kanin. 3.13. Bookmark Mabilis mga pamamaraan para sa pagtatantya ng equation ng trend.

Sa window na lilitaw (Larawan 3.13), maaari kang pumili ng isang paraan para sa pagtantya ng mga parameter ng equation ng regression ( Paraan ng pagtatantya ), kung kinakailangan. Sa aming kaso, kailangan naming pumunta sa bookmark Advanced at pindutin ang pindutan Simulan ang mga halaga (Larawan 3.14). Sa dialog na ito, ang mga panimulang halaga ng mga parameter ng equation ay tinukoy upang mahanap ang mga ito gamit ang paraan ng least squares, i.e. kanilang pinakamababang halaga. Sa una ang mga ito ay nakatakda sa 0.1 para sa lahat ng mga parameter. Sa aming kaso, maaari naming iwanan ang mga halagang ito sa parehong anyo, ngunit kung ang mga halaga sa aming mapagkukunan ng data ay mas mababa sa isa, pagkatapos ay kailangan naming itakda ang mga ito sa anyo ng 0.001 para sa lahat ng mga parameter ng equation ng trend ( Larawan 3.15). Susunod, pindutin ang pindutan OK .

kanin. 3.14. Bookmark Advanced Mga pamamaraan sa pagtatantya ng equation ng trend

kanin. 3.15. Window para sa pagtatakda ng mga panimulang halaga ng mga parameter ng equation ng trend

kanin. 3.16. Bookmark Mabilis mga window ng resulta ng pagsusuri ng regression

Sa bookmark Mabilis (Larawan 3.16) ang kahulugan ng linya ay napakahalaga Isinaalang-alang ang proporsyon ng pagkakaiba , na tumutugma sa koepisyent ng pagpapasiya; Mas mainam na isulat ang halagang ito nang hiwalay, dahil hindi ito ipapakita sa hinaharap, at kakailanganing manu-manong kalkulahin ng user ang koepisyent, at sapat na ang tatlong decimal na lugar. Susunod, pindutin ang pindutan Buod: Mga pagtatantya ng parameter upang makakuha ng data ng parameter linear equation kalakaran (Larawan 3.17).

kanin. 3.17. Mga resulta ng pagkalkula ng mga parameter ng linear trend model

Kolum Tantyahin mga numerong halaga mga parameter ng equation; Karaniwang error - karaniwang error ng parameter; t-halaga – kinakalkula na halaga t-pamantayan; df – bilang ng mga antas ng kalayaan ( n-2); p-level - kinakalkula antas ng kahalagahan; Lo. Conf. Limitahan At pataas. Conf. Limitahan – ayon sa pagkakabanggit ay mas mababa at itaas na limitasyon mga agwat ng kumpiyansa para sa mga parameter ng equation na may tinukoy na probabilidad (tinukoy bilang Antas ng Kumpiyansa sa tuktok na field ng talahanayan).

Alinsunod dito, ang equation ng linear trend model ay may anyo .

Pagkatapos nito, bumalik kami sa pagsusuri at mag-click sa pindutan Pagsusuri ng Pagkakaiba (pagsusuri ng pagkakaiba) sa parehong tab Mabilis (tingnan ang Fig. 3.16).

kanin. 3.18. Mga resulta pagsusuri ng pagkakaiba-iba linear trend model

Limang rating ang ibinibigay sa tuktok na hilera ng header ng talahanayan:

Kabuuan ng mga parisukat – kabuuan ng mga squared deviations; df – bilang ng mga antas ng kalayaan; Mean Squares - average na parisukat; F-halaga – Pamantayan ng mangingisda; p-halaga – kalkuladong antas ng kahalagahan F-pamantayan.

Ang kaliwang column ay nagpapahiwatig ng pinagmulan ng variation:

Regression – pagkakaiba-iba na ipinaliwanag ng trend equation; Nalalabi - pagkakaiba-iba ng mga nalalabi - mga paglihis ng aktwal na mga halaga mula sa mga naayos (nakuha mula sa equation ng trend); Kabuuan – kabuuang pagkakaiba-iba ng variable.

Sa intersection ng mga column at row nakakakuha kami ng mga natatanging tinukoy na indicator, mga formula ng pagkalkula na kung saan ay ipinakita sa talahanayan. 3.2,

Talahanayan 3.2

Pagkalkula ng mga tagapagpahiwatig ng pagkakaiba-iba ng mga modelo ng trend

Pinagmulan df Kabuuan ng mga parisukat Mga parisukat na ibig sabihin F-halaga
Regression m
Nalalabi n-m
Kabuuan n
Nawastong Kabuuan n-1
Regression vs. Nawastong Kabuuan m SSR MSR

nasaan ang mga nakahanay na halaga ng mga antas ng dynamic na serye; - aktwal na mga halaga ng mga antas ng dynamic na serye; – average na halaga ng mga antas ng dynamic na serye.

SSR (Regression Sum of Squares) – kabuuan ng mga parisukat ng mga hinulaang halaga; SSE (Residual Sum of Squares) – ang kabuuan ng mga squared deviations ng teoretikal at aktwal na mga halaga (upang kalkulahin ang nalalabi, hindi maipaliwanag na pagkakaiba-iba); SST (TotalSum of Squares) – ang kabuuan ng una at pangalawang linya (ang kabuuan ng mga parisukat ng aktwal na mga halaga); SSCT (Nawastong Kabuuang Kabuuan ng mga Kuwadrado) – ang kabuuan ng mga squared deviations ng aktwal na mga halaga mula sa average na halaga (upang kalkulahin ang kabuuang dispersion); Regression vs. Nawastong Kabuuang kabuuan ng mga parisukat - pag-uulit ng unang linya; MSR (Mean Squares Regression) – ipinaliwanag ang pagkakaiba-iba; MSE (Residual Mean Squares) – nalalabi, hindi maipaliwanag na pagkakaiba-iba; MSCT (Mean Squares Corrected Total) – inayos ang kabuuang pagkakaiba; Regression vs. Nawastong Kabuuang Mean Squares - pag-uulit ng unang linya; Regression F-value – kinakalkula na halaga F-pamantayan; Regression vs. Nawastong Kabuuang F-value - naayos na kinakalkula na halaga F-pamantayan; n– bilang ng mga antas ng serye; m– bilang ng mga parameter ng equation ng trend.

Dagdag pa ulit sa bookmark Mabilis (tingnan ang Fig. 3.16) pindutin ang pindutan Mga hinulaang halaga, Nalalabi, atbp . Pagkatapos i-click ito, bubuo ang system ng talahanayan na binubuo ng tatlong column (Fig. 3.19).

Naobserbahan - mga sinusunod na halaga (iyon ay, mga antas ng orihinal na serye ng oras);



Bago sa site

>

Pinakasikat