Mājas Pulpīts Vidējā relatīvā tuvinājuma kļūda programmā Excel. Vidējā aproksimācijas kļūda

Vidējā relatīvā tuvinājuma kļūda programmā Excel. Vidējā aproksimācijas kļūda

Kursa darbs

disciplīnā "Ekonometrija"

« Visaptveroša uzņēmumu finanšu un ekonomiskās darbības rādītāju saistību analīze”

Variants Nr.12

Pabeigts:

EET-312 grupas audzēknis

Logunovs N.Ju.

Pārbaudīts:

Asoc. Ishkhanyan M.V.

Maskava 2015

Problēmas formulēšana

1. Korelācijas matricas sastādīšana. Faktoru izvēle

2. Daudzkārtējā vienādojuma konstruēšana lineārā regresija. Vienādojuma parametru interpretācija

3. Determinācijas koeficients, daudzkārtējs koeficients korelācijas

4. Daudzkārtējās lineārās regresijas vienādojuma kvalitātes novērtēšana

4.1.Vidēji relatīvā kļūda tuvinājumi

4.2.Pārbaudīt statistiskā nozīme vienādojumi daudzkārtēja regresija kopumā, izmantojot Fišera F testu

4.3.Daudzkārtējās regresijas vienādojuma parametru statistiskās nozīmīguma pārbaude. Intervālu parametru aplēses

5.Pieteikums regresijas modelis

5.1.Punktu prognoze

5.2.Parciālās elastības koeficienti un vidējie daļējās elastības koeficienti

6. Regresijas modeļa atlieku analīze (Gausa-Markova teorēmas premisu pārbaude)

6.1.Vērtējumi matemātiskās cerības pārpalikumi

6.2.Atlikumu autokorelācijas pārbaude

7. Gregorija Čau kritērijs

Problēmas formulēšana

Norādītas 6 rādītāju vērtības, kas raksturo 53 uzņēmumu saimniecisko darbību. Nepieciešams:

1. Izveidojiet korelācijas matricu. Pielāgojiet neatkarīgo mainīgo kopu (atlasiet 2 faktorus).

4.2. Pārbaudiet daudzkārtējās regresijas vienādojuma statistisko nozīmīgumu kopumā, izmantojot Fišera F testu. Izdariet secinājumus

4.3. Pārbaudiet daudzkārtējās regresijas vienādojuma parametru statistisko nozīmīgumu. Konstruēt parametru intervālu aplēses. Izdariet secinājumus.



5. Regresijas modeļa pielietošana:

5.1. Izmantojot konstruēto vienādojumu, sniedziet punktu prognozi. Atrodiet pētāmā parametra y vērtību, ja pirmā (ar y visciešāk saistītā) faktora vērtība ir 110% no tā vidējās vērtības, otrā faktora vērtība ir 80% no tā vidējās vērtības. Sniedziet rezultāta ekonomisko interpretāciju.

5.2. Atrodiet daļējās elastības koeficientus un vidējos daļējās elastības koeficientus. Interpretējiet rezultātus. Izdariet secinājumus.

6. Analizējiet regresijas modeļa atlikumus (pārbaudiet Gausa-Markova teorēmas prasības):

6.1. Atrodiet atlikumu matemātiskās sagaidāmās aplēses.

6.2. Pārbaudiet, vai atlikumos nav autokorelācijas. Izdariet secinājumu.

7. Sadaliet paraugu divās vienādās daļās. Uzskatot pirmo un pēdējo novērojumu par neatkarīgu paraugu, pārbaudiet hipotēzi par iespēju tos apvienot vienā paraugā, izmantojot Gregorija-Čova kritēriju.

Korelācijas matricas sastādīšana. Faktoru izvēle

Uzņēmuma Nr. Y3 X10 X12 X5 X7 X13
13,26 1,45 167,69 0,78 1,37
10,16 1,3 186,1 0,75 1,49
13,72 1,37 220,45 0,68 1,44
12,85 1,65 169,3 0,7 1,42
10,63 1,91 39,53 0,62 1,35
9,12 1,68 40,41 0,76 1,39
25,83 1,94 102,96 0,73 1,16
23,39 1,89 37,02 0,71 1,27
14,68 1,94 45,74 0,69 1,16
10,05 2,06 40,07 0,73 1,25
13,99 1,96 45,44 0,68 1,13
9,68 1,02 41,08 0,74 1,1
10,03 1,85 136,14 0,66 1,15
9,13 0,88 42,39 0,72 1,23
5,37 0,62 37,39 0,68 1,39
9,86 1,09 101,78 0,77 1,38
12,62 1,6 47,55 0,78 1,35
5,02 1,53 32,61 0,78 1,42
21,18 1,4 103,25 0,81 1,37
25,17 2,22 38,95 0,79 1,41
19,4 1,32 81,32 0,77 1,35
1,48 67,26 0,78 1,48
6,57 0,68 59,92 0,72 1,24
14,19 2,3 107,34 0,79 1,40
15,81 1,37 512,6 0,77 1,45
5,23 1,51 53,81 0,8 1,4
7,99 1,43 80,83 0,71 1,28
17,5 1,82 59,42 0,79 1,33
17,16 2,62 36,96 0,76 1,22
14,54 1,75 91,43 0,78 1,28
6,24 1,54 17,16 0,62 1,47
12,08 2,25 27,29 0,75 1,27
9,49 1,07 184,33 0,71 1,51
9,28 1,44 58,42 0,74 1,46
11,42 1,4 59,4 0,65 1,27
10,31 1,31 49,63 0,66 1,43
8,65 1,12 391,27 0,84 1,5
10,94 1,16 258,62 0,74 1,35
9,87 0,88 75,66 0,75 1,41
6,14 1,07 123,68 0,75 1,47
12,93 1,24 37,21 0,79 1,35
9,78 1,49 53,37 0,72 1,4
13,22 2,03 32,87 0,7 1,2
17,29 1,84 45,63 0,66 1,15
7,11 1,22 48,41 0,69 1,09
22,49 1,72 13,58 0,71 1,26
12,14 1,75 63,99 0,73 1,36
15,25 1,46 104,55 0,65 1,15
31,34 1,6 222,11 0,82 1,87
11,56 1,47 25,76 0,8 1,17
30,14 1,38 29,52 0,83 1,61
19,71 1,41 41,99 0,7 1,34
23,56 1,39 78,11 0,74 1,22

1.Izveidojiet korelācijas matricu. Pielāgojiet neatkarīgo mainīgo kopu (atlasiet 2 faktorus).

Apskatīsim iegūto zīmi Y3 un faktoru īpašības X10, X12, X5, X7, X13 .

Izveidosim korelācijas matricu, izmantojot MS Excel opciju “Datu analīze → Korelācija”:

Y3 X10 X12 X5 X7 X13
Y3 1,0000 0,3653 0,0185 0,2891 0,1736 0,0828
X10 0,3653 1,0000 -0,2198 -0,0166 -0,2061 -0,0627
X12 0,0185 -0,2198 1,0000 0,2392 0,3796 0,6308
X5 0,2891 -0,0166 0,2392 1,0000 0,4147 0,0883
X7 0,1736 -0,2061 0,3796 0,4147 1,0000 0,1939
X13 0,0828 -0,0627 0,6308 0,0883 0,1939 1,0000

Mēs izvēlamies 2 faktorus atbilstoši kritērijiem:

1) savienojumam starp Y un X jābūt maksimālam

2) savienojumam starp Xmi jābūt minimālam

Tādējādi turpmākajos punktos tiks veikts darbs ar faktoriem X10 , X5.

Vairāku lineārās regresijas vienādojuma konstruēšana. Vienādojuma parametru interpretācija.

2. Izveidojiet vairākkārtēju lineārās regresijas vienādojumu. Sniedziet vienādojuma parametru interpretāciju.

Izveidosim regresijas modeli, izmantojot MS Excel analīzes pakotni “Datu analīze→Regression”:

Likmes
Y -20,7163
X 10 5,7169
X 5 34,9321

Regresijas vienādojums izskatīsies šādi:

ŷ = b 0 + b 10 * x 10 + b 5 * x 5

ŷ = -20,7163-5,7169* x 10 +34,9321* x 5

1) b10 ir pozitīvs;

2) b5 ir pozitīvs;

Determinācijas koeficients, daudzkārtējās korelācijas koeficients

3. Atrast determinācijas koeficientu, daudzkārtējās korelācijas koeficientu. Izdariet secinājumus.

Regresijas analīzē, kas veikta, izmantojot MS Excel analīzes pakotni “Datu analīze → Regresija”, atrodam tabulu “Regresijas statistika”:

Vairāki R-savienojumi starp Y3 un X10, X5 ir vāji

R kvadrāts - 22,05% no Y pazīmes variācijas ir izskaidrojamas ar pazīmju X10 un X5 variācijām

Daudzkārtējas lineārās regresijas vienādojuma kvalitātes novērtēšana

4. Novērtējiet daudzkārtējās lineārās regresijas vienādojuma kvalitāti:

Vidējā relatīvā tuvinājuma kļūda

4.1. Atrodiet vidējo relatīvo aproksimācijas kļūdu. Izdariet secinājumus.

Aprēķināsim katra novērojuma paredzamās vērtības vai izmantosim tabulas “Atlikušā izvade” kolonnu “Prognozētais Y” regresijas analīzē, kas veikta, izmantojot MS Excel analīzes pakotni “Datu analīze → Regresija”).

Aprēķināsim katra novērojuma relatīvās kļūdas, izmantojot formulu:

Aprēķināsim vidējo relatīvo aproksimācijas kļūdu, izmantojot formulu:

Secinājums: 20% < А < 50%, качество уравнения среднее (удовлетворительное).

Aproksimācijas kļūda ir viena no visbiežāk sastopamajām problēmām, izmantojot noteiktas avota datu tuvināšanas metodes. Ir dažādi tuvināšanas kļūdu veidi:

Kļūdas, kas saistītas ar avota datu kļūdām;

Kļūdas, kas saistītas ar neatbilstību starp tuvināto modeli un tuvināto datu struktūru.

Programmā Excel ir labi izstrādāta Lineārā funkcija datu apstrādei un tuvināšanai, kurā tiek izmantota sarežģīta matemātika. Lai par to būtu priekšstats, pievērsīsimies (izmantojot F1) šīs izstrādes aprakstošajai daļai, kuru piedāvājam ar saīsinājumiem un dažām izmaiņām apzīmējumā.

Aprēķina statistiku sērijai, izmantojot metodi mazākie kvadrāti lai aprēķinātu taisni, kas vislabāk atbilst pieejamajiem datiem. Funkcija atgriež masīvu, kas apraksta iegūto rindu. Tā kā tiek atgriezts vērtību masīvs, funkcija ir jānorāda kā masīva formula.

Taisnas līnijas vienādojums ir:

y=a+b1*x1+b2*x2+...bn*xn

Sintakse:

LINEST(y;x;konst.;statistika)

Masīvs y - zināmās vērtības y.

Masīvs x - zināmās x vērtības. X masīvā var būt viena vai vairākas mainīgo kopas.

Const ir Būla vērtība, kas norāda, vai fiktīvajam terminam a ir jābūt vienādam ar 0.

Ja arguments const ir TRUE, 1 vai izlaists, a tiek novērtēts kā parasti. Ja arguments const ir FALSE vai 0, tad a ir iestatīts uz 0.

Statistika ir Būla vērtība, kas norāda, vai ir jāatgriež papildu regresijas statistika. Ja statistikas arguments ir TRUE vai 1, tad LINEST atgriež papildu regresijas statistika. Ja statistika ir FALSE, 0 vai izlaista, LINEST atgriež tikai koeficientus un pārtveršanu.

Papildu regresijas statistika:

se1,se2,...,sen - standarta kļūdu vērtības koeficientiem b1,b2,...,bn.

jūra — standarta kļūdas vērtība konstantei a (jūra = #N/A, ja const ir FALSE).

r2 ir determinisma koeficients. Tiek salīdzinātas y faktiskās vērtības un vērtības, kas iegūtas no līnijas vienādojuma; Pamatojoties uz salīdzināšanas rezultātiem, tiek aprēķināts determinisma koeficients, normalizēts no 0 līdz 1. Ja tas ir vienāds ar 1, tad pastāv pilnīga korelācija ar modeli, t.i. nav atšķirības starp y faktiskajām un aprēķinātajām vērtībām. Pretējā gadījumā, ja determinācijas koeficients ir 0, tad regresijas vienādojums nav veiksmīgs, prognozējot y vērtības. Informāciju par r2 aprēķināšanu skatiet sadaļā "Piezīmes" šīs sadaļas beigās.

sey ir standarta kļūda y novērtēšanai.

F-statistika vai F-novērotā vērtība. F-statistika tiek izmantota, lai noteiktu, vai novērotā saistība starp atkarīgo un neatkarīgo mainīgo ir nejauša vai nē.

df - brīvības pakāpes. Brīvības pakāpes ir noderīgas, lai statistikas tabulā atrastu F-kritiskās vērtības. Lai noteiktu modeļa ticamības līmeni, tabulā esošās vērtības jāsalīdzina ar F-statistiku, ko atgriež funkcija LINEST.

ssreg ir kvadrātu regresijas summa.

ssresid ir kvadrātu atlikušā summa.

Tālāk esošajā attēlā parādīta secība, kādā tiek atgriezta papildu regresijas statistika.

Piezīmes

Funkcijas izvēlēto informāciju var iegūt, izmantojot funkciju INDEX, piemēram:

Y-pārtvērums (brīvs termins):

INDEKSS(rinda(y,x),2)

Aproksimācijas precizitāte, izmantojot taisni, ko aprēķina ar funkciju LINEST, ir atkarīga no datu izkliedes pakāpes. Jo tuvāk dati ir taisnai līnijai, jo precīzāks ir funkcijas LINEST izmantotais modelis. Funkcija LINEST izmanto mazākos kvadrātus, lai noteiktu vislabāko atbilstību datiem.

Veicot regresijas analīzi, Microsoft Excel aprēķina katram punktam starpības kvadrātu starp prognozēto y vērtību un faktisko y vērtību. Šo atšķirību kvadrātā summu sauc par atlikušo kvadrātu summu. Pēc tam Microsoft Excel aprēķina starpību kvadrātu summu starp faktiskajām y vērtībām un vidējo y vērtību, ko sauc par kopējo kvadrātu summu (regresijas kvadrātu summa + atlikušā kvadrātu summa). Jo mazāka ir atlikušā kvadrātu summa, salīdzinot ar kopējo kvadrātu summu, jo lielāks ir determinācijas koeficients r2, kas mēra, cik labi regresijas vienādojums izskaidro attiecības starp mainīgajiem.

Ņemiet vērā, ka regresijas vienādojuma paredzētās y vērtības var nebūt pareizas, ja tās ir ārpus y vērtību diapazona, kas tika izmantots vienādojuma definēšanai.

1. piemērs Slīpums un Y krustpunkts

LINEST(((1;9;5;7);(0;4;2;3)) ir vienāds ar (2;1), slīpums = 2 un y krustojums = 1.

Izmantojot F un R2 statistiku

Varat izmantot F statistiku, lai noteiktu, vai rezultāts ar augstu r2 vērtību ir radies nejaušības dēļ. Ja F-novērotais ir lielāks par F-kritisko, tad pastāv sakarība starp mainīgajiem. F-kritisko vērtību var iegūt no F-kritisko vērtību tabulas jebkurā matemātiskās statistikas atsauces grāmatā. Lai atrastu šo vērtību, izmantojot vienpusēju testu, iestatiet Alfa vērtību (Alfa vērtība tiek izmantota, lai norādītu iespējamību kļūdaini secināt, ka pastāv spēcīga sakarība) vienādu ar 0,05 un brīvības pakāpju skaitu ( parasti apzīmē ar v1 un v2), liksim v1 = k = 4 un v2 = n - (k + 1) = 11 - (4 + 1) = 6, kur k ir mainīgo skaits un n ir datu punktu skaits . No atsauces tabulas F-kritiskā vērtība ir 4,53. Novērotā F vērtība ir 459,753674 (šī vērtība tika iegūta piemērā, kuru mēs izlaidām), kas ir ievērojami lielāka par F-kritisko vērtību 4,53. Tāpēc iegūtais regresijas vienādojums ir noderīgs, lai prognozētu vēlamo rezultātu.

Vidējā aproksimācijas kļūda- aprēķināto vērtību vidējā novirze no faktiskajām:

Kur y x ir aprēķinātā vērtība no Eq.

Vidējā aproksimācijas kļūda līdz 15% norāda uz labi pielāgotu vienādojuma modeli.

Septiņām Urālu reģiona teritorijām 199X ir zināmas divu raksturlielumu vērtības.

Nepieciešams:
1. Lai raksturotu y atkarību no x, aprēķiniet šādu funkciju parametrus:
a) lineārs;
b) jauda;
c) demonstratīvs;
d) vienādmalu hiperbola (jums arī jāizdomā, kā iepriekš linearizēt šo modeli).
2. Novērtējiet katru modeli vidējā aproksimācijas kļūda A cf un Fišera F-tests.

Mēs veicam risinājumu, izmantojot tiešsaistes kalkulators Lineārās regresijas vienādojums.
a) lineārās regresijas vienādojums;
Izmantojot grafisko metodi.
Šo metodi izmanto, lai vizuāli attēlotu pētāmo ekonomisko rādītāju saistību formu. Lai to izdarītu, taisnstūrveida koordinātu sistēmā tiek uzzīmēts grafiks, iegūtā raksturlieluma Y individuālās vērtības tiek attēlotas pa ordinātu asi, bet faktora raksturlieluma X individuālās vērtības tiek attēlotas pa abscisu asi.
Tiek saukta rezultējošo un faktoru raksturlielumu punktu kopa korelācijas lauks.


Pamatojoties uz korelācijas lauku, var izvirzīt hipotēzi (par populācija), ka attiecība starp visām iespējamām X un Y vērtībām ir lineāra.
Lineārās regresijas vienādojums ir y = bx + a + ε
Šeit ε ir nejauša kļūda (novirze, traucējumi).
Iemesli nejaušas kļūdas pastāvēšanai:
1. Būtisku skaidrojošo mainīgo neiekļaušana regresijas modelī;
2. Mainīgo lielumu apkopošana. Piemēram, kopējā patēriņa funkcija ir mēģinājums vispārīga izteiksme atsevišķu lēmumu par izdevumiem kopsavilkums. Tas ir tikai tuvinājums atsevišķām attiecībām, kurām ir dažādi parametri.
3. Nepareizs modeļa struktūras apraksts;
4. Nepareiza funkcionālā specifikācija;
5. Mērījumu kļūdas.
Tā kā novirzes ε i katram konkrētajam novērojumam i ir nejaušas un to vērtības paraugā nav zināmas, tad:
1) no novērojumiem x i un y i var iegūt tikai parametru α un β aplēses
2) Regresijas modeļa parametru α un β aplēses ir attiecīgi vērtības a un b, kurām ir nejaušs raksturs, jo atbilst izlases veidam;
Tad novērtējuma regresijas vienādojumam (kas izveidots no izlases datiem) būs forma y = bx + a + ε, kur e i ir kļūdu ε i novērotās vērtības (aplēses) un a un b ir attiecīgi aprēķini regresijas modeļa parametri α un β, kas būtu jāatrod.
Parametru α un β novērtēšanai tiek izmantota mazāko kvadrātu metode (mazāko kvadrātu metode).




Mēs iegūstam b = -0,35, a = 76,88
Regresijas vienādojums:
y = -0,35 x + 76,88

x y x 2 y 2 x g y(x) (y i -y cp) 2 (y-y(x)) 2 |y - y x |:y
45,1 68,8 2034,01 4733,44 3102,88 61,28 119,12 56,61 0,1094
59 61,2 3481 3745,44 3610,8 56,47 10,98 22,4 0,0773
57,2 59,9 3271,84 3588,01 3426,28 57,09 4,06 7,9 0,0469
61,8 56,7 3819,24 3214,89 3504,06 55,5 1,41 1,44 0,0212
58,8 55 3457,44 3025 3234 56,54 8,33 2,36 0,0279
47,2 54,3 2227,84 2948,49 2562,96 60,55 12,86 39,05 0,1151
55,2 49,3 3047,04 2430,49 2721,36 57,78 73,71 71,94 0,172
384,3 405,2 21338,41 23685,76 22162,34 405,2 230,47 201,71 0,5699

Piezīme: y(x) vērtības tiek atrastas no iegūtā regresijas vienādojuma:
y(45,1) = -0,35*45,1 + 76,88 = 61,28
y(59) = -0,35*59 + 76,88 = 56,47
... ... ...

Tuvināšanas kļūda
Novērtēsim regresijas vienādojuma kvalitāti, izmantojot absolūtās aproksimācijas kļūdu. Vidējā aproksimācijas kļūda- aprēķināto vērtību vidējā novirze no faktiskajām:

Tā kā kļūda ir mazāka par 15%, šo vienādojumu var izmantot kā regresiju.

F-statistika. Fišera kritērijs.










3. Tabulas vērtība noteikts no Fišera sadalījuma tabulām noteiktam nozīmīguma līmenim, ņemot vērā, ka brīvības pakāpju skaits par kopējā summa kvadrāti (lielāka dispersija) ir 1 un atlikušās kvadrātu summas brīvības pakāpju skaits (mazāka dispersija) lineārajā regresijā ir n-2.
4. Ja F-testa faktiskā vērtība ir mazāka par tabulas vērtību, tad viņi saka, ka nav pamata noraidīt nulles hipotēzi.
Pretējā gadījumā nulles hipotēze tiek noraidīta un alternatīvā hipotēze par vienādojuma statistisko nozīmīgumu kopumā tiek pieņemta ar varbūtību (1-α).

< Fkp, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

b) jaudas regresija;
Risinājums tiek veikts, izmantojot Nelineārās regresijas pakalpojumu. Izvēloties, norādiet Jauda y = ax b
c) eksponenciālā regresija;
d) vienādmalu hiperbolas modelis.
Normālo vienādojumu sistēma.

Mūsu datiem vienādojumu sistēmai ir forma
7a + 0,1291b = 405,2
0,1291a + 0,0024b = 7,51
No pirmā vienādojuma mēs izsakām a un aizstājam to ar otro vienādojumu
Mēs iegūstam b = 1054,67, a = 38,44
Regresijas vienādojums:
y = 1054,67 / x + 38,44
Tuvināšanas kļūda.
Novērtēsim regresijas vienādojuma kvalitāti, izmantojot absolūtās aproksimācijas kļūdu.

Tā kā kļūda ir mazāka par 15%, šo vienādojumu var izmantot kā regresiju.

Fišera kritērijs.
Regresijas modeļa nozīmīguma pārbaude tiek veikta, izmantojot Fišera F testu, kura aprēķinātā vērtība tiek atrasta kā pētāmā indikatora sākotnējās novērojumu sērijas dispersijas attiecība pret atlikuma secības dispersijas objektīvu novērtējumu. šim modelim.
Ja aprēķinātā vērtība ar k1=(m) un k2=(n-m-1) brīvības pakāpēm ir lielāka par tabulā norādīto vērtību noteiktā nozīmīguma līmenī, tad modelis tiek uzskatīts par nozīmīgu.

kur m ir faktoru skaits modelī.
Pāru lineārās regresijas statistisko nozīmīgumu novērtē, izmantojot šādu algoritmu:
1. Tiek izvirzīta nulles hipotēze, ka vienādojums kopumā ir statistiski nenozīmīgs: H 0: R 2 =0 nozīmības līmenī α.
2. Pēc tam nosakiet F kritērija faktisko vērtību:

kur m=1 pāru regresijai.
Kritērija ar brīvības pakāpēm k1=1 un k2=5 tabulas vērtība, Fkp = 6.61
Tā kā faktiskā F vērtība< Fkp, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

5. Izmantojot F-testu, tika konstatēts, ka iegūtais pāra regresijas vienādojums kopumā ir statistiski nenozīmīgs un adekvāti neapraksta pētīto ikmēneša pensijas vērtības y un dzīves dārdzības x attiecības fenomenu.

6. Izveidots ekonometriskās daudzkārtējās lineārās regresijas modelis, sasaistot nosacītā uzņēmuma y neto ienākumu summu ar kapitāla apgrozījumu x1 un izmantoto kapitālu x2.

7. Aprēķinot elastības koeficientus, tiek parādīts, ka, mainoties kapitāla apgrozījumam par 1%, uzņēmuma neto ienākumu apjoms mainās par 0,0008%, bet, izlietotajam kapitālam mainoties par 1%, uzņēmuma neto ienākumu apmērs. mainās par 0,56%.

8. Izmantojot t-testu, tika novērtēta regresijas koeficientu statistiskā nozīmība, tika konstatēts, ka skaidrojošais mainīgais x 1 ir statistiski nenozīmīgs un ir izslēdzams no regresijas vienādojuma, savukārt skaidrojošais mainīgais x 2 ir statistiski nenozīmīgs. statistiski nozīmīgi.

9. Izmantojot F-testu, tika konstatēts, ka iegūtais pāra regresijas vienādojums kopumā ir statistiski nozīmīgs, un adekvāti apraksta pētīto fenomenu par saistību starp nosacītas firmas neto ienākumiem y un kapitāla apgrozījumu x 1 un izmantoto kapitālu. x 2.

10. Aprēķināta statistisko datu aproksimācijas vidējā kļūda pēc lineāras daudzkārtējas regresijas vienādojuma, kas sastādīja 29,8%. Tiek parādīts, kura novērojuma dēļ statistikas datu bāzē šīs kļūdas lielums pārsniedz pieļaujamo vērtību.

14. Pāru regresijas modeļa izveidošana, neizmantojot programmu EXCEL.

Izmantojot 3.5. tabulā sniegtos statistikas materiālus, ir nepieciešams:

2. Novērtēt saiknes ciešumu, izmantojot korelācijas un noteikšanas rādītājus.

3.Izmantojot elastības koeficientu, nosaka sakarības pakāpi starp faktora raksturlielumu un rezultēto.

4. Nosakiet vidējo aproksimācijas kļūdu.

5. Novērtējiet modelēšanas statistisko ticamību, izmantojot Fišera F testu.

3.5. tabula. Sākotnējie dati.

Naudas ienākumu daļa, kas vērsta uz uzkrājumu palielināšanai noguldījumos, aizdevumos, sertifikātos un ārvalstu valūtas iegādei, kopējo vidējo naudas ienākumu uz vienu iedzīvotāju, %

Vidējā mēneša uzkrātā darba samaksa, c.u.

Kaļužskaja

Kostromskaja

Orlovskaja

Rjazaņa

Smoļenska

Lai noteiktu pāra lineārās regresijas vienādojuma nezināmos parametrus b 0 , b 1, mēs izmantojam standarta normālo vienādojumu sistēmu, kurai ir forma

(3.7)

Lai atrisinātu šo sistēmu, vispirms ir jānosaka Sx 2 un Sxy vērtības. Šīs vērtības tiek noteiktas no avota datu tabulas, papildinot to ar atbilstošajām kolonnām (3.6. tabula).

3.6. tabula. Ceļā uz regresijas koeficientu aprēķināšanu.

Tad sistēma (3.7) iegūst formu

Izsakot b 0 no pirmā vienādojuma un aizstājot iegūto izteiksmi otrajā vienādojumā, mēs iegūstam:

Veicot reizināšanu pa vienam un atverot iekavas, mēs iegūstam:

Visbeidzot, sapārotajam lineārās regresijas vienādojumam, kas savieno iedzīvotāju naudas ienākumu daļas vērtību, kuras mērķis ir palielināt uzkrājumus y ar vidējo mēneša uzkrāto algu x, ir šāda forma:

Tātad, veidojot pāru lineārās regresijas vienādojumu, mēs nosakām lineārās korelācijas koeficientu atbilstoši atkarībai:

kur ir atbilstošo parametru standarta noviržu vērtības.

Lai aprēķinātu lineārās korelācijas koeficientu no atkarības (3.9), veicam starpaprēķinus.

Aizvietojot atrasto parametru vērtības izteiksmē (3.9), mēs iegūstam

.

Iegūtā lineārās korelācijas koeficienta vērtība norāda uz vājas apgrieztās statistiskās sakarības esamību starp iedzīvotāju skaidrās naudas ienākumu īpatsvaru, kas vērsts uz uzkrājumu palielināšanu y, un vidējās mēneša uzkrātās darba algas apmēru x.

Determinācijas koeficients ir , kas nozīmē, ka tikai 9,6% ir izskaidrojami, regresējot skaidrojošo mainīgo x uz y. Attiecīgi vērtība 1, kas vienāda ar 90,4%, raksturo visu pārējo ekonometriskajā modelī neņemto skaidrojošo mainīgo ietekmes radīto mainīgā y dispersijas daļu.

Elastības koeficients ir

Līdz ar to, mēneša vidējai uzkrātajai darba samaksai mainoties par 1%, par 1% samazinās arī iedzīvotāju skaidrās naudas ienākumu daļa, kas vērsta uz uzkrājumu palielināšanu, un, palielinoties darba samaksai, samazinās arī iedzīvotāju skaidrās naudas ienākumu īpatsvars. iedzīvotāju, kuru mērķis ir palielināt uzkrājumus. Šis secinājums ir pretrunā veselajam saprātam, un to var izskaidrot tikai ar ģenerētā matemātiskā modeļa nepareizību.

Aprēķināsim vidējo aproksimācijas kļūdu.

3.7. tabula. Ceļā uz vidējās aproksimācijas kļūdas aprēķināšanu.

Iegūtā vērtība pārsniedz (12...15)%, kas norāda uz aprēķināto datu vidējās novirzes nozīmīgumu no faktiskajiem datiem, uz kuriem tika uzbūvēts ekonometriskais modelis.

Statistiskās modelēšanas ticamība tiks veikta, pamatojoties uz Fišera F-testu. Fišera kritērija F calc teorētisko vērtību nosaka no koeficienta vērtību un atlikušo dispersiju attiecību, kas aprēķināta vienai brīvības pakāpei pēc formulas

kur n ir novērojumu skaits;

m ir skaidrojošo mainīgo skaits (aplūkojamajam piemēram m m =1).

Kritiskā vērtība F crit tiek noteikta no statistikas tabulām, un nozīmīguma līmenim a = 0,05 ir vienāds ar 10,13. Tā kā F aprēķināts

15. Vairākkārtējas regresijas modeļa izveide, neizmantojot programmu EXCEL.

Izmantojot 3.8. tabulā sniegtos statistikas materiālus, jums ir:

1. Izveidojiet lineāru daudzkārtējas regresijas vienādojumu un izskaidrojiet tā parametru ekonomisko nozīmi.

2. Izmantojot vidējos (vispārējos) elastības koeficientus, sniedziet salīdzinošu novērtējumu par attiecību ciešumu starp faktoriem un iegūto atribūtu.

3. Novērtējiet regresijas koeficientu statistisko nozīmīgumu, izmantojot t-testu, un nulles hipotēzi par vienādojuma nenozīmīgumu, izmantojot F-testu.

4. Novērtējiet vienādojuma kvalitāti, nosakot vidējo aproksimācijas kļūdu.

3.8. tabula. Sākotnējie dati.

Neto ienākumi, miljoni ASV dolāru

Kapitāla apgrozījums miljoni ASV dolāru

Izlietotais kapitāls, milj ASV dolāri

Lai noteiktu daudzkārtējās lineārās regresijas vienādojuma nezināmos parametrus b 0 , b 1 , b 2, mēs izmantojam standarta normālo vienādojumu sistēmu, kurai ir forma

(3.11)

Lai atrisinātu šo sistēmu, vispirms ir jānosaka lielumu Sx 1 2, Sx 2 2, Sx 1 y, Sx 2 y, Sx 1 x 2 vērtības. Šīs vērtības tiek noteiktas no avota datu tabulas, papildinot to ar atbilstošajām kolonnām (3.9. tabula).

3.9. tabula. Ceļā uz regresijas koeficientu aprēķināšanu.

Tad sistēma (3.11) iegūst formu

Lai atrisinātu šo sistēmu, izmantosim Gausa metodi, kas sastāv no secīgas nezināmo izslēgšanas: pirmo sistēmas vienādojumu sadaliet ar 10, pēc tam iegūto vienādojumu reiziniet ar 370,6 un atņemiet to no sistēmas otrā vienādojuma, pēc tam reiziniet iegūto vienādojumu ar 158,20 un atņemiet to no sistēmas trešā vienādojuma. Atkārtojot norādīto algoritmu sistēmas pārveidotajam otrajam un trešajam vienādojumam, iegūstam:

Þ Þ

Þ .

Pēc transformācijas mums ir:

Tad neto ienākumu galīgā atkarība no kapitāla apgrozījuma un izmantotā kapitāla ir formā lineārais vienādojums daudzkārtējai regresijai ir šāda forma:

No iegūtā ekonometriskā vienādojuma var redzēt, ka, palielinoties izmantotajam kapitālam, neto ienākumi palielinās un, gluži pretēji, pieaugot kapitāla apgrozījumam, neto ienākumi samazinās. Turklāt, jo lielāks ir regresijas koeficients, jo lielāka ir skaidrojošā mainīgā ietekme uz atkarīgo mainīgo. Aplūkojamajā piemērā regresijas koeficienta vērtība ir lielāka par koeficienta vērtību, tāpēc izmantotajam kapitālam ir ievērojami lielāka ietekme uz neto ienākumiem nekā kapitāla apgrozījumam. Lai kvantificētu šo secinājumu, mēs noteiksim daļējās elastības koeficientus.

Rezultātu analīze arī parāda, ka izmantotajam kapitālam ir lielāka ietekme uz neto ienākumiem. Tātad, jo īpaši palielinoties izmantotajam kapitālam par 1%, neto ienākumi palielinās par 1,17%. Tajā pašā laikā, pieaugot kapitāla apgrozījumam par 1%, neto ienākumi samazinās par 0,5%.

Fišera kritērija F teorētiskā vērtība aprē.

Kritiskās vērtības F crit vērtību nosaka no statistikas tabulām un nozīmīguma līmenim a = 0,05 ir vienāds ar 4,74. Tā kā F calc > F crit, nulles hipotēze tiek noraidīta un iegūtais regresijas vienādojums tiek pieņemts kā statistiski nozīmīgs.

Regresijas koeficientu un t-kritērija statistiskās nozīmes novērtēšana ir saistīta ar šo koeficientu skaitlisko vērtību salīdzināšanu ar to nejaušo kļūdu lielumu un saskaņā ar sakarību:

Darba formula t-statistikas teorētiskās vērtības aprēķināšanai ir:

, (3.13)

kur pāru korelācijas koeficientus un daudzkārtējās korelācijas koeficientus aprēķina no atkarībām:

Tad t-statistikas teorētiskās (aprēķinātās) vērtības ir attiecīgi vienādas ar:

Tā kā t-statistikas kritiskā vērtība, kas noteikta no statistikas tabulām nozīmības līmenim a = 0,05 vienāds ar t crit = 2,36, absolūtā vērtībā ir lielāka par = - 1,798, tad nulles hipotēze netiek noraidīta un skaidrojošais mainīgais x 1 ir statistiski nenozīmīgs un to var izslēgt no regresijas vienādojuma. Un otrādi, otrajam regresijas koeficientam > t crit (3,3 > 2,36) un skaidrojošajam mainīgajam x 2 ir statistiski nozīmīgs.

Aprēķināsim vidējo aproksimācijas kļūdu.

3.10. tabula. Ceļā uz vidējās aproksimācijas kļūdas aprēķināšanu.

Tad vidējā aproksimācijas kļūda ir

Iegūtā vērtība nepārsniedz pieļaujamo robežu, kas vienāda ar (12…15)%.

16. Mērījumu teorijas attīstības vēsture

TI vispirms attīstījās kā psihofizisko mērījumu teorija. Pēckara publikācijās amerikāņu psihologs S.S. Stīvenss koncentrējās uz mērījumu skalām. 20. gadsimta otrajā pusē. TI piemērošanas joma strauji paplašinās. Viens no 50. gados ASV izdotās “Psiholoģijas zinātņu enciklopēdijas” sējumiem saucās “Psiholoģijas mērījumi”. Šīs publikācijas autori paplašināja TI darbības jomu no psihofizikas līdz psiholoģijai kopumā. Šī krājuma rakstā “Mērījumu teorijas pamati” prezentācija bija abstraktā matemātiskā līmenī, neatsaucoties uz kādu konkrētu pielietojuma jomu. Tajā uzsvars tika likts uz “empīrisko sistēmu homomorfismiem ar attiecībām uz skaitliskām” (šeit nav jāiedziļinās šajos matemātiskajos terminos), un prezentācijas matemātiskā sarežģītība pieauga, salīdzinot ar S.S. Stīvenss.

Vienā no pirmajiem iekšzemes rakstiem par TI (60. gadu beigas) tika konstatēts, ka punkti, ko eksperti piešķir, novērtējot pārbaudes objektus, parasti tiek mērīti pēc kārtas. Darbi, kas parādījās 70. gadu sākumā, izraisīja ievērojamu TI izmantošanas jomas paplašināšanos. Tas ir izmantots pedagoģiskajā kvalitātē (skolēnu zināšanu kvalitātes mērīšanai), sistēmu izpētē un dažādās teorētiskās problēmās. ekspertu vērtējumus, preču kvalitātes rādītāju apkopošanai, socioloģiskajos pētījumos u.c.

Kā divas galvenās TI problēmas, līdztekus skalas veida noteikšanai konkrētu datu mērīšanai, tika izvirzīta datu analīzes algoritmu meklēšana, kuras rezultāts nemainās pie pieļaujamās skalas transformācijas (t.i., ir nemainīgs attiecībā uz). uz šo transformāciju).Ordinālās skalas ģeogrāfijā ir Boforta skalas vēji (“mierīgs”, “viegls vējš”, “mērens vējš” utt.), zemestrīces stipruma skala. Acīmredzot nevar teikt, ka 2 magnitūdu zemestrīce (lampa šūpojās zem griestiem) ir tieši 5 reizes vājāka par 10 magnitūdu zemestrīci (pilnīga visa iznīcināšana uz zemes virsmas).

Medicīnā kārtas skalas ir hipertensijas stadiju skala (pēc Mjasņikova teiktā), sirds mazspējas pakāpes skala (pēc Stražesko-Vasiļenko-Lang), koronārās mazspējas smaguma skala (pēc Fogelsona domām) utt. . Visi šie svari ir veidoti pēc šādas shēmas: nav konstatēta slimība; pirmais slimības posms; otrais posms; trešais posms... Dažkārt tiek izdalītas 1.a, 16. stadijas utt. Katrai stadijai ir unikāls medicīnisks raksturojums. Aprakstot invaliditātes grupas, skaitļi tiek lietoti pretējā secībā: smagākā ir pirmā invaliditātes grupa, tad otrā, vieglākā ir trešā.

Arī māju numuri tiek mērīti pēc kārtas – tie parāda, kādā secībā mājas atrodas gar ielu. Sējumu numuri rakstnieka savāktajos darbos vai lietu numuri uzņēmuma arhīvā parasti tiek saistīti ar to tapšanas hronoloģisko secību.

Novērtējot produktu un pakalpojumu kvalitāti, kārtas skalas ir populāras tā sauktajā kvalitātijā (burtiskais tulkojums - kvalitātes mērīšana). Proti, ražošanas vienība tiek novērtēta kā pārbaudāma vai nederīga. Rūpīgākai analīzei tiek izmantota skala ar trīs gradācijām: ir būtiski defekti - ir tikai nelieli defekti - defektu nav. Dažreiz tiek izmantotas četras gradācijas: ir kritiski defekti (kas padara to neiespējamu) - ir būtiski defekti - ir tikai nelieli defekti - nav defektu. Produktu klasifikācijai ir līdzīga nozīme - premium, pirmā šķira, otrā šķira,...

Vērtējot ietekmi uz vidi, pirmais, vispārīgākais novērtējums parasti ir kārtējais, piemēram: dabiskā vide ir stabila - dabiskā vide ir apspiesta (degradēta). Vides medicīnas mērogs ir līdzīgs: nav izteiktas ietekmes uz cilvēka veselību - tiek atzīmēta negatīva ietekme uz veselību.

Kārtības skala tiek izmantota arī citās jomās. Ekonometrikā tās galvenokārt ir dažādas ekspertu novērtējuma metodes.

Visas mērījumu skalas ir sadalītas divās grupās - kvalitatīvo raksturlielumu skalas un kvantitatīvo raksturlielumu skalas. Kārtas skala un nosaukšanas skala ir galvenās kvalitatīvo atribūtu skalas, tāpēc daudzās specifiskās jomās kvalitatīvās analīzes rezultātus var uzskatīt par mērījumiem uz šīm skalām. Kvantitatīvo raksturlielumu skalas ir intervālu, attiecību, atšķirību, absolūtā skalas. Izmantojot intervālu skalu, tiek mērīts potenciālās enerģijas lielums vai punkta koordinātas uz taisnes. Šajos gadījumos uz skalas nevar atzīmēt ne dabisko izcelsmi, ne dabisko mērvienību. Pētniekam pašam jānosaka sākumpunkts un jāizvēlas mērvienība. Pieņemamas transformācijas intervālu skalā ir lineāri augošas transformācijas, t.i. lineārās funkcijas. Temperatūras skalas pēc Celsija un Fārenheita ir saistītas tieši ar šādu atkarību: °C = 5/9 (°F - 32), kur °C ir temperatūra (grādos) pēc Celsija skalas, un °F ir temperatūra pēc Fārenheita skalas. mērogā.

No kvantitatīvajām skalām zinātnē un praksē visizplatītākās ir attiecību skalas. Viņiem ir dabisks atskaites punkts - nulle, t.i. nav daudzuma, bet nav dabiskās mērvienības. Lielākā daļa fizisko vienību tiek mērītas pēc attiecību skalas: ķermeņa masa, garums, lādiņš, kā arī cenas ekonomikā. Pieņemamie pārveidojumi attiecību skalā ir līdzīgi (mainot tikai skalu). Citiem vārdiem sakot, lineāras pieaugošas pārvērtības bez brīva termiņa, piemēram, cenu konvertēšana no vienas valūtas uz citu pēc fiksēta kursa. Pieņemsim, ka mēs salīdzinām divu investīciju projektu ekonomisko efektivitāti, izmantojot cenas rubļos. Lai pirmais projekts izrādās labāks par otro. Tagad pāriesim uz Ķīnas valūtu – juaņu, izmantojot fiksētu maiņas kursu. Acīmredzot pirmajam projektam atkal vajadzētu būt ienesīgākam par otro. Taču aprēķinu algoritmi automātiski nenodrošina šī nosacījuma izpildi, un ir jāpārbauda, ​​vai tas ir izpildīts. Šādas vidējās vērtības testa rezultāti ir aprakstīti zemāk.

Atšķirību skalai ir dabiska mērvienība, bet nav dabiskā atskaites punkta. Laiku mēra atšķirību skalā, ja gadu (vai dienu - no pusdienlaika līdz pusdienlaikam) ņem par dabisku mērvienību, un intervālu skalā vispārējs gadījums. Pašreizējā zināšanu līmenī nav iespējams norādīt dabisku sākumpunktu. Dažādi autori dažādi aprēķina pasaules radīšanas datumu, kā arī Kristus piedzimšanas brīdi.

Tikai absolūtajā mērogā mērījumu rezultāti ir skaitļi šī vārda parastajā nozīmē, piemēram, cilvēku skaits telpā. Absolūtā mērogā ir atļauta tikai identitātes transformācija.

Atbilstošās zināšanu jomas attīstības procesā var mainīties mēroga veids. Tātad, sākumā temperatūra tika mērīta pēc kārtas (vēsāks - siltāks). Pēc tam - pēc intervāla (Celsija, Fārenheita, Reaumura skalas). Visbeidzot, pēc absolūtās nulles atklāšanas temperatūru var uzskatīt par mērītu pēc attiecību skalas (Kelvina skala). Jāpiebilst, ka dažkārt speciālistu starpā pastāv domstarpības par to, kuras skalas būtu jāizmanto, lai noteiktu reālās izmērītās vērtības. Citiem vārdiem sakot, mērīšanas process ietver arī skalas veida noteikšanu (kopā ar konkrēta skalas veida izvēles pamatojumu). Papildus uzskaitītajiem sešiem galvenajiem svaru veidiem dažreiz tiek izmantoti arī citi svari.

17. Invarianti algoritmi un vidējās vērtības.

Formulēsim galveno prasību datu analīzes algoritmiem TI: secinājumiem, kas izdarīti, pamatojoties uz datiem, kas mērīti uz noteikta veida skalas, nevajadzētu mainīties, kad šo datu mērīšanas skala ir pieļaujama. Citiem vārdiem sakot, secinājumiem ir jābūt nemainīgiem, izmantojot derīgas mēroga transformācijas.

Tādējādi viens no galvenajiem mērīšanas teorijas mērķiem ir apkarot pētnieka subjektivitāti, piešķirot reāliem objektiem skaitliskās vērtības. Tādējādi attālumus var izmērīt aršinos, metros, mikronos, jūdzēs, parsekos un citās mērvienībās. Masa (svars) - pūdos, kilogramos, mārciņās utt. Preču un pakalpojumu cenas var norādīt juaņās, rubļos, tengās, grivnās, latos, kronās, markās, ASV dolāros un citās valūtās (atbilstoši norādītajiem konvertācijas kursiem). Uzsvērsim ļoti svarīgu, kaut arī diezgan acīmredzamu faktu: mērvienību izvēle ir atkarīga no pētnieka, t.i. subjektīvs. Statistikas secinājumi var būt adekvāti realitātei tikai tad, ja tie nav atkarīgi no tā, kādai mērvienībai pētnieks dod priekšroku, ja tie ir nemainīgi attiecībā uz skalas pieļaujamo transformāciju. No daudzajiem ekonometrisko datu analīzes algoritmiem tikai daži atbilst šim nosacījumam. Parādīsim to, salīdzinot vidējās vērtības.

Pieņemsim, ka X 1, X 2,..., X n ir tilpuma n paraugs. Bieži izmanto vidējo aritmētisko. Vidējā aritmētiskā lietojums ir tik izplatīts, ka terminā bieži tiek izlaists otrais vārds un tiek runāts par vidējo algu, vidējiem ienākumiem un citiem vidējiem rādītājiem konkrētiem ekonomikas datiem, ar “vidējo” saprotot vidējo aritmētisko. Šī tradīcija var novest pie kļūdainiem secinājumiem. Parādīsim to, izmantojot hipotētiskā uzņēmuma darbinieku vidējās algas (vidējo ienākumu) aprēķināšanas piemēru. No 100 strādājošajiem tikai 5 ir to lielāka alga, bet pārējiem 95 alga ir ievērojami mazāka par vidējo aritmētisko. Iemesls ir acīmredzams - viena cilvēka - ģenerāldirektora - alga pārsniedz 95 strādnieku - mazkvalificētu un augsti kvalificētu strādnieku, inženieru un biroja darbinieku algu. Situācija atgādina to, kas aprakstīta labi zināmā stāstā par slimnīcu, kurā atrodas 10 pacienti, no kuriem 9 ir 40°C, bet viens jau cietis, guļot morgā ar 0° temperatūru. C. Tikmēr vidējā temperatūra slimnīcā ir 36°C – labāk nevar būt!

Tādējādi vidējo aritmētisko var izmantot tikai diezgan viendabīgām populācijām (bez lielām novirzēm vienā vai otrā virzienā). Kādi vidējie rādītāji jāizmanto, lai aprakstītu algas? Diezgan dabiski ir izmantot mediānu - 50. un 51. darbinieka vidējo aritmētisko, ja viņu algas sakārtoti nedilstošā secībā. Vispirms nāk algas 40 mazkvalificētiem strādniekiem, bet pēc tam - no 41. līdz 70. strādniekam - augsti kvalificētu darbinieku algas. Līdz ar to mediāna krīt tieši uz tiem un ir vienāda ar 200. 50 strādājošajiem alga nepārsniedz 200, bet 50 - vismaz 200, tātad mediāna rāda “centru”, ap kuru lielākā daļa pētāmo vērtību ​ir sagrupēti. Vēl viena vidējā vērtība ir režīms, kas ir visbiežāk sastopamā vērtība. Izskatāmajā gadījumā tās ir mazkvalificētu darbinieku algas, t.i. 100. Tātad, lai aprakstītu algu, mums ir trīs vidējās vērtības - režīms (100 vienības), mediāna (200 vienības) un vidējais aritmētiskais (400 vienības).

Ienākumu un algu sadalījumam, kas novērots reālajā dzīvē, ir spēkā tas pats modelis: režīms ir mazāks par mediānu, un mediāna ir mazāka par vidējo aritmētisko.

Kāpēc ekonomikā tiek izmantoti vidējie rādītāji? Parasti skaitļu kolekcijas aizstāšana ar vienu skaitli, lai salīdzinātu populācijas, izmantojot vidējos rādītājus. Lai, piemēram, Y 1, Y 2,..., Y n ir vienam ekspertīzes objektam “dots” ekspertu vērtējumu kopums (piemēram, viens no uzņēmuma stratēģiskās attīstības variantiem), Z 1 , Z 2,..., Z n -otrais (cita šīs izstrādes versija). Kā šīs populācijas tiek salīdzinātas? Acīmredzot vienkāršākais veids ir pēc vidējām vērtībām.

Kā aprēķināt vidējos rādītājus? Zināms Dažādi vidējās vērtības: vidējais aritmētiskais, mediāna, režīms, ģeometriskais vidējais, harmoniskais vidējais, vidējais kvadrātiskais. Atgādināsim jums to vispārējs jēdziens vidējo vērtību ieviesa 19. gadsimta pirmās puses franču matemātiķis. Akadēmiķis O. Košī. Tas ir šāds: vidējā vērtība ir jebkura funkcija Ф(Х 1, Х 2,..., Х n), lai visām iespējamām argumentu vērtībām šīs funkcijas vērtība nebūtu mazāka par minimālo. no skaitļiem X 1, X 2,... , X n , un ne vairāk kā šo skaitļu maksimums. Visi iepriekš uzskaitītie vidējo vērtību veidi ir Košī vidējie lielumi.

Ar pieņemamu mēroga transformāciju vidējā vērtība acīmredzami mainās. Taču secinājumiem par to, kuram iedzīvotāju skaitam vidējais rādītājs ir lielāks un kuram mazāks, nevajadzētu mainīties (saskaņā ar TI kā galveno prasību pieņemto secinājumu nemainīguma prasību). Formulēsim atbilstošo matemātisko problēmu vidējo vērtību veida meklēšanai, kuru salīdzināšanas rezultāts ir stabils attiecībā uz pieļaujamajām skalas transformācijām.

Pieņemsim, ka Ф(Х 1 Х 2 ,..., Х n) ir Košī vidējais rādītājs. Lai pirmās populācijas vidējais rādītājs būtu mazāks par vidējo otrajai populācijai: tad, saskaņā ar TI, vidējo rādītāju salīdzināšanas rezultāta stabilitātei ir nepieciešams, lai jebkurai pieļaujamai transformācijai g no pieļaujamo transformāciju grupas atbilstošā skala ir taisnība, ka transformēto vērtību vidējā vērtība no pirmās populācijas ir arī mazāka par otrās kopas transformēto vērtību vidējo. Turklāt formulētajam nosacījumam ir jābūt patiesam jebkurām divām kopām Y 1, Y 2,...,Y n un Z 1, Z 2,..., Z n un, atcerieties, jebkurai pieļaujamai transformācijai. Mēs saucam par pieļaujamām vidējām vērtībām, kas atbilst formulētajam nosacījumam (atbilstošā skalā). Pēc TI domām, tikai šādus vidējos var izmantot, analizējot ekspertu atzinumus un citus datus, kas mērīti aplūkojamajā skalā.

Izmantojot matemātiskā teorija 70. gados izstrādātais, izdodas aprakstīt pieņemamo vidējo vērtību veidu pamata skalās. Ir skaidrs, ka datiem, kas mērīti pēc nosaukumu skalas, tikai režīms ir piemērots kā vidējais rādītājs.

18. Vidējās vērtības kārtas skalā

Apskatīsim pēc kārtas skalas mērītu ekspertu atzinumu apstrādi. Sekojošais apgalvojums ir patiess.

Teorēma1 . No visiem Košī vidējiem rādītājiem vienīgie pieņemamie vidējie rādītāji kārtas skalā ir termini variāciju sērija(kārtējā statistika).

1. teorēma ir spēkā ar nosacījumu, ka vidējais Ф(Х 1 Х 2 ,..., Х n) ir nepārtraukta (virs mainīgo kopas) un simetriska funkcija. Pēdējais nozīmē, ka, pārkārtojot argumentus, funkcijas Ф(Х 1 Х 2 ,..., Х n) vērtība nemainās. Šis nosacījums ir diezgan dabisks, jo mēs atrodam vidējo vērtību kopumam (kopai), nevis secībai. Komplekts nemainās atkarībā no tā, kādā secībā mēs uzskaitām tā elementus.

Jo īpaši saskaņā ar 1. teorēmu mediānu var izmantot kā vidējo vērtību datiem, kas mērīti pēc kārtas (ja izlases lielums ir nepāra). Ja tilpums ir vienmērīgs, jāizmanto viens no diviem variāciju sērijas centrālajiem terminiem - kā tos dažreiz sauc, kreisā mediāna vai labā mediāna. Var izmantot arī modi – tā vienmēr ir variāciju sērijas dalībniece. Bet jūs nekad nevarat aprēķināt vidējo aritmētisko, ģeometrisko utt.

Sekojošā teorēma ir patiesa.

2. teorēma. Lai Y 1, Y 2,...,Y m ir neatkarīgi identiski sadalīti gadījuma lielumi ar sadalījuma funkciju F(x), un Z 1, Z 2,..., Zn ir neatkarīgi identiski sadalīti gadījuma lielumi ar funkciju sadalījumiem. H(x), un paraugi Y 1, Y 2,...,Y m un Z 1, Z 2,..., Z n ir neatkarīgi viens no otra un MY X > MZ X. Lai notikuma iespējamībai pie min(m, n) ir tendence uz 1 jebkurai stingri pieaugošai nepārtrauktai funkcijai g, kas apmierina nosacījumu |g i |>X, ir nepieciešams un pietiekami, lai nevienādība F(x) būtu izpildīta visiem x< Н(х), причем существовало число х 0 , для которого F(x 0)

Piezīme. Nosacījums ar augšējo robežu ir tīri intramatemātisks raksturs. Faktiski funkcija g ir patvaļīga pieļaujama transformācija kārtas skalā.

Saskaņā ar 2. teorēmu vidējo aritmētisko var izmantot arī kārtas skalā, ja tiek salīdzināti paraugi no diviem sadalījumiem, kas apmierina teorēmā doto nevienādību. Vienkārši sakot, vienai no sadales funkcijām vienmēr jāatrodas virs otras. Sadales funkcijas nevar krustoties, tām ir atļauts tikai pieskarties viena otrai. Šis nosacījums ir izpildīts, piemēram, ja sadales funkcijas atšķiras tikai nobīdē:

F(x) = Н(x + ∆)

dažiem ∆.

Pēdējais nosacījums ir izpildīts, ja ar vienu un to pašu mērinstrumentu tiek mērītas divas noteikta lieluma vērtības, kurās kļūdu sadalījums nemainās, pārejot no vienas attiecīgā daudzuma vērtības mērīšanas uz citas.

Vidēji pēc Kolmogorova domām

Vairāku iepriekš uzskaitīto vidējo rādītāju vispārinājums ir Kolmogorova vidējais rādītājs. Skaitļiem X 1, X 2,..., X n Kolmogorova vidējo aprēķina, izmantojot formulu

G((F(X l) + F(X 2)+...F(X n))/n),

kur F ir stingri monotona funkcija (t.i., stingri pieaugoša vai stingri samazinoša),

G ir F apgrieztā funkcija.

Starp Kolmogorova vidējiem rādītājiem ir daudz pazīstamu varoņu. Tātad, ja F(x) = x, tad Kolmogorova vidējais ir vidējais aritmētiskais, ja F(x) = lnx, tad ģeometriskais vidējais, ja F(x) = 1/x, tad vidējais harmoniskais, ja F( x) = x 2, tad vidējais kvadrāts utt. Kolmogorova vidējais rādītājs ir īpašs Košī vidējā rādītājs. No otras puses, tādus populārus vidējos rādītājus kā mediānu un režīmu nevar attēlot kā Kolmogorova vidējos. Monogrāfijā ir pierādīti šādi apgalvojumi.

Teorēma3 . Ja ir spēkā noteikti intramatemātiski regularitātes nosacījumi intervālu skalā, tad no visiem Kolmogorova vidējiem ir pieļaujams tikai vidējais aritmētiskais. Tādējādi temperatūras (Celsija) vai attālumu ģeometriskais vai vidējais kvadrāts ir bezjēdzīgs. Kā vidējais ir jāizmanto vidējais aritmētiskais. Varat arī izmantot mediānu vai režīmu.

4. teorēma. Ja ir spēkā noteikti intramatemātiski likumsakarības nosacījumi attiecību skalā, no visiem Kolmogorova vidējiem lielumiem ir pieļaujami tikai jaudas vidējie lielumi ar F(x) = x c un ģeometriskais vidējais.

komentēt. Ģeometriskais vidējais ir jaudas vidējā robeža c > 0.

Vai ir Kolmogorova vidējie rādītāji, kurus nevar izmantot attiecību skalā? Protams, ir. Piemēram, F(x) = e x.

Līdzīgi kā vidējām vērtībām, var pētīt arī citus statistiskos raksturlielumus - izkliedes, savienojuma, attāluma u.c. Nav grūti parādīt, piemēram, ka korelācijas koeficients nemainās ar kādu pieļaujamu transformāciju intervālu bļodā, tāpat kā dispersiju attiecība, dispersija nemainās atšķirību skalā, variācijas koeficients attiecību skala utt.

Iepriekš minētie vidējo vērtību rezultāti tiek plaši izmantoti ne tikai ekonomikā, vadībā, ekspertu vērtējumu teorijā vai socioloģijā, bet arī inženierzinātnēs, piemēram, lai analizētu sensoru agregēšanas metodes domnu automatizētās procesa vadības sistēmās. TI ir liela praktiskā nozīme standartizācijas un kvalitātes vadības problēmās, it īpaši kvalitātijā, kur iegūti interesanti teorētiskie rezultāti. Tā, piemēram, jebkuras izmaiņas atsevišķu produktu kvalitātes rādītāju svara koeficientos noved pie izmaiņām produktu secībā atbilstoši vidējam svērtajam rādītājam (šo teorēmu pierādīja prof. V.V. Podinovskis). Līdz ar to iepriekš minētā īsā informācija par TI un tās metodēm savā ziņā apvieno ekonomiku, socioloģiju un inženierzinātnes un ir adekvāts aparāts tādu sarežģītu problēmu risināšanai, kuras iepriekš nebija pakļautas efektīvai analīzei, turklāt paver ceļu reālistisku modeļu veidošanai un prognožu problēmas risināšanai.

22. Pāru lineārā regresija

Tagad pievērsīsimies sīkākam pāru lineārās regresijas vienkāršākā gadījuma pētījumam. Lineāro regresiju raksturo vienkāršākā funkcionālā sakarība taisnās līnijas vienādojuma veidā, un to raksturo modeļa parametru (vienādojuma koeficientu) pārskatāma interpretācija. Vienādojuma labā puse ļauj iegūt iegūtā (skaidrotā) mainīgā teorētiskās (aprēķinātās) vērtības, pamatojoties uz dotajām regresora (skaidrojošā mainīgā) vērtībām. Šīs vērtības dažreiz sauc arī par prognozētajām (tādā pašā nozīmē), t.i. iegūts no teorētiskajām formulām. Tomēr, izvirzot hipotēzi par atkarības būtību, vienādojuma koeficienti joprojām nav zināmi. Vispārīgi runājot, šo koeficientu aptuveno vērtību iegūšana ir iespējama, izmantojot dažādas metodes.

Bet vissvarīgākā un izplatītākā no tām ir mazāko kvadrātu metode (OLS). Tas ir balstīts (kā jau paskaidrots) uz prasību samazināt iegūto raksturlielumu faktisko vērtību kvadrātu noviržu summu no aprēķinātajām (teorētiskajām). Teorētisko vērtību vietā (lai tās iegūtu) aizvietojiet regresijas vienādojuma labās puses ar noviržu kvadrātu summu un pēc tam atrodiet šīs funkcijas daļējos atvasinājumus (faktisko vērtību noviržu kvadrātu summu). iegūto raksturlielumu no teorētiskajiem). Šie daļējie atvasinājumi tiek ņemti nevis attiecībā uz mainīgajiem lielumiem x un y, bet gan attiecībā uz parametriem a un b. Parciālie atvasinājumi tiek noteikti vienādi ar nulli un pēc vienkāršiem, bet apgrūtinošiem pārveidojumiem tiek iegūta normālvienādojumu sistēma parametru noteikšanai. Koeficients mainīgajam x, t.i. b sauc par regresijas koeficientu, tas parāda vidējās rezultāta izmaiņas ar faktora izmaiņām par vienu vienību. Parametram a var nebūt ekonomiskas interpretācijas, it īpaši, ja šī koeficienta zīme ir negatīva.

Patēriņa funkcijas pētīšanai izmanto pāru lineāro regresiju. Lai aprēķinātu reizinātāju, tiek izmantots patēriņa funkcijas regresijas koeficients. Gandrīz vienmēr regresijas vienādojums tiek papildināts ar savienojuma ciešuma indikatoru. Vienkāršākajam lineārās regresijas gadījumam šis savienojuma tuvuma rādītājs ir lineārais koeficients korelācijas. Bet, tā kā lineārās korelācijas koeficients raksturo attiecību ciešumu starp pazīmēm lineārā formā, lineārās korelācijas koeficienta absolūtās vērtības tuvums nullei vēl nekalpo kā indikators tam, ka starp pazīmēm nav saiknes.

Tieši ar atšķirīgu modeļa specifikācijas izvēli un līdz ar to arī atkarības veidu faktiskās attiecības var izrādīties diezgan tuvu vienotībai. Bet izvēles kvalitāte lineārā funkcija nosaka, izmantojot lineārās korelācijas koeficienta kvadrātu - determinācijas koeficientu. Tas raksturo efektīvā atribūta y dispersijas proporciju, kas izskaidrojama ar regresiju efektīvā atribūta kopējā dispersijā. Vērtība, kas papildina determinācijas koeficientu līdz 1, raksturo dispersijas daļu, ko rada citu modelī neņemtu faktoru ietekme (atlikušā dispersija).

Pāru regresiju attēlo vienādojums, kas attiecas uz diviem mainīgajiem y un x šādā formā:

kur y ir atkarīgais mainīgais (rezultatīvais atribūts), un x ir neatkarīgais mainīgais (skaidrojošais mainīgais vai atribūta faktors). Ir lineārā regresija un nelineārā regresija. Lineāro regresiju apraksta ar vienādojumu šādā formā:

y = a+ bx + .

Savukārt nelineārā regresija var būt nelineāra attiecībā uz analīzē iekļautajiem skaidrojošajiem mainīgajiem, bet lineāra attiecībā uz novērtētajiem parametriem. Vai varbūt regresija ir nelineāra attiecībā uz novērtētajiem parametriem. Regresijas piemēri, kas skaidrojošajos mainīgajos ir nelineāra, bet novērtētajos parametros lineāra, ietver dažādu pakāpju polinomu atkarības (polinomus) un vienādmalu hiperbolu.

Novērtēto parametru nelineārā regresija ir jaudas atkarība no parametra (parametrs atrodas eksponentā), eksponenciāla atkarība, kur parametrs atrodas eksponenta pamatā, un eksponenciālā atkarība, kad visa lineārā atkarība ir pilnībā eksponentā. Ņemiet vērā, ka visos šajos trīs gadījumos ir iekļauta nejaušā sastāvdaļa (nejaušais atlikums)  labā puse vienādojumi faktora formā, nevis summas veidā, t.i. reizināti! Rezultātā iegūtā raksturlieluma aprēķināto vērtību vidējo novirzi no faktiskajām raksturo vidējā tuvinājuma kļūda. To izsaka procentos, un tas nedrīkst pārsniegt 7-8%. Šī vidējā aproksimācijas kļūda ir tikai faktisko un aprēķināto vērtību atšķirību relatīvo lielumu vidējā procentuālā vērtība.

Svarīgs ir vidējais elastības koeficients, kas kalpo kā nozīmīgs raksturlielums daudzām ekonomikas parādībām un procesiem. To aprēķina kā dotās funkcionālās attiecības atvasinājuma vērtības un x vidējās vērtības attiecības reizinājumu ar y vidējo vērtību. Elastības koeficients parāda, par cik procentiem vidēji mainīsies rezultāts y no tā vidējās vērtības, kad faktors x mainīsies par 1% no tā (faktora x) vidējās vērtības.

Dispersijas analīzes problēmas ir cieši saistītas ar pāru regresiju un daudzkārtēju regresiju (ja faktoru ir daudz) un atlikušo dispersiju. Dispersijas analīze pārbauda atkarīgā mainīgā dispersiju. Šajā gadījumā kopējā noviržu kvadrātā summa ir sadalīta divās daļās. Pirmais termins ir regresijas vai izskaidroto (faktoriālu) noviržu summa kvadrātā. Otrais termins ir ar faktoru regresiju neizskaidrojamo noviržu kvadrātu atlikusī summa.

Ar regresiju izskaidroto dispersijas daļu iegūtā raksturlieluma y kopējā dispersijā raksturo determinācijas koeficients (indekss), kas nav nekas cits kā regresijas rezultātā radušos noviržu kvadrātu summas attiecība pret kopējo noviržu kvadrātu summu. (pirmais termiņš visai summai).

Ja modeļa parametrus (nezināmo koeficientus) nosaka ar mazāko kvadrātu metodi, tad pēc būtības tiek atrasti daži nejauši mainīgie (aplēšu iegūšanas procesā). Īpaši svarīgs ir regresijas koeficienta novērtējums, kas ir kāda īpaša nejauša lieluma forma. Šī nejaušā lieluma īpašības ir atkarīgas no atlikušā vārda īpašībām vienādojumā (modelī). Pāra lineārās regresijas modelim skaidrojošo mainīgo x uzskata par nejaušu eksogēnu mainīgo. Tas tikai nozīmē, ka mainīgā x vērtības visos novērojumos var uzskatīt par iepriekš noteiktām un nekādā veidā nav saistītas ar pētāmo atkarību. Tādējādi izskaidrotā mainīgā faktiskā vērtība sastāv no divām sastāvdaļām: negadījuma un nejaušas komponentes (atlikušais termins).

No otras puses, regresijas koeficients, kas noteikts, izmantojot mazāko kvadrātu metodi (OLS), ir vienāds ar koeficientu, kas dala mainīgo x un y kovariāciju ar mainīgā x dispersiju. Tāpēc tajā ir arī nejaušs komponents. Galu galā kovariācija ir atkarīga no mainīgā y vērtībām, kur mainīgā lieluma y vērtības ir atkarīgas no nejaušā atlikuma vārda  vērtībām. Turklāt ir viegli parādīt, ka mainīgo x un y kovariācija ir vienāda ar aprēķinātā regresijas koeficienta beta () un mainīgā x dispersijas reizinājumu, pieskaitot mainīgo x un  kovariāciju. Tādējādi regresijas koeficienta beta aprēķins ir vienāds ar pašu šo nezināmo regresijas koeficientu, kas pievienots koeficientam, kas dala mainīgo x un  kovariāciju ar mainīgā x dispersiju. Tie. regresijas koeficienta b aprēķins, kas iegūts no jebkuras izlases, tiek uzrādīts kā divu terminu summa: nemainīga vērtība, kas vienāda ar koeficienta  (beta) patieso vērtību, un nejauša komponente, kas atkarīga no mainīgo x un  kovariācijas. .

23. Matemātiskie Gausa-Markova nosacījumi un to pielietojums.

Lai regresijas analīze, kuras pamatā ir parastā OLS, iegūtu vislabākos rezultātus, izlases veidam ir jāatbilst četriem Gausa-Markova nosacījumiem.

Izlases termiņa matemātiskā cerība ir vienāda ar nulli, t.i. tas ir objektīvs. Ja regresijas vienādojumā ir iekļauts konstants termins, tad ir dabiski uzskatīt, ka šī prasība ir izpildīta, jo tas ir nemainīgs termins un jāņem vērā jebkura mainīgā y vērtību sistemātiskā tendence, kurai, gluži pretēji, vajadzētu būt nav ietverti regresijas vienādojuma skaidrojošajos mainīgajos.

Nejaušības termina dispersija ir nemainīga visiem novērojumiem.

Vērtību kovariance nejaušie mainīgie, veidojot paraugu, jābūt vienādam ar nulli, t.i. nav sistemātiskas attiecības starp nejaušā vārda vērtībām nevienos divos konkrētos novērojumos. Nejaušajiem dalībniekiem jābūt neatkarīgiem vienam no otra.

Nejaušības termina sadalījuma likumam jābūt neatkarīgam no skaidrojošajiem mainīgajiem.

Turklāt daudzos lietojumos skaidrojošie mainīgie nav stohastiski, t.i. nav nejaušas sastāvdaļas. Jebkura neatkarīga mainīgā vērtība katrā novērojumā ir jāuzskata par eksogēnu, ko pilnībā nosaka ārēji cēloņi, kas nav ņemti vērā regresijas vienādojumā.

Kopā ar norādītajiem Gausa-Markova nosacījumiem tiek arī pieņemts, ka nejaušajam vārdam ir normāls sadalījums. Tas ir spēkā ļoti plašos apstākļos un ir balstīts uz tā saukto centrālās robežas teorēmu (CLT). Šīs teorēmas būtība ir tāda, ka, ja nejaušais mainīgais ir daudzu citu nejaušības lielumu mijiedarbības kopējais rezultāts, no kuriem nevienam nav dominējošas ietekmes uz šī kopējā rezultāta uzvedību, tad tiks aprakstīts iegūtais gadījuma mainīgais. ar aptuveni normālu sadalījumu. Šis tuvums normālais sadalījumsļauj izmantot normālo sadalījumu, lai iegūtu aplēses un ir noteiktā nozīmē tā vispārinājums ir Studenta sadalījums, kas manāmi atšķiras no parastā galvenokārt uz tā sauktajām “astes”, t.i. maziem paraugu izmēriem. Svarīgi ir arī tas, ka, ja nejaušais loceklis ir normāli sadalīts, tad arī regresijas koeficienti būs normāli sadalīti.

Izveidotā regresijas līkne (regresijas vienādojums) ļauj atrisināt tā sauktās punktu prognozes problēmu. Šādos aprēķinos noteikta x vērtība tiek ņemta ārpus pētītā novērošanas intervāla un aizvietota regresijas vienādojuma labajā pusē (ekstrapolācijas procedūra). Jo Regresijas koeficientu aprēķini jau ir zināmi, tad var aprēķināt izskaidrotā mainīgā y vērtību, kas atbilst ņemtajai x vērtībai. Protams, saskaņā ar prognozes (prognozes) nozīmi aprēķini tiek veikti uz priekšu (nākotnes vērtību reģionā).

Taču, tā kā koeficienti tika noteikti ar zināmu kļūdu, tas neinteresē punktu tāme(punkta prognoze) efektīvam raksturlielumam un zināšanas par robežām, kurās ar noteiktu varbūtību atradīsies efektīvā raksturlieluma vērtības, kas atbilst ņemtajai faktora x vērtībai.

Lai to izdarītu, tiek aprēķināta standarta kļūda (standarta novirze). To var iegūt tikko teiktā garā šādi. Brīvā termina a izteiksme no aplēsēm caur vidējām vērtībām tiek aizstāta ar lineārās regresijas vienādojumu. Tad iznāk, ka standartkļūda ir atkarīga no vidējā efektīvā faktora y kļūdas un aditīvi no regresijas koeficienta b kļūdas. Vienkārši šīs standarta kļūdas kvadrāts vienāds ar summu vidējās vērtības y kvadrātā un regresijas koeficienta kļūdas kvadrātā reizinājums ar faktora x vērtības un tā vidējās novirzes kvadrātu. Turklāt pirmais loceklis saskaņā ar statistikas likumiem ir vienāds ar kopējo populācijas dispersijas dalījumu ar izlases lielumu (apjomu).

Nezināmās dispersijas vietā kā aprēķins tiek izmantota izlases dispersija. Attiecīgi regresijas koeficienta kļūdu definē kā koeficientu, dalot izlases dispersiju ar faktora x dispersiju. Varat iegūt standarta kļūdu (standarta novirzi) un citus apsvērumus, kas ir vairāk neatkarīgi no lineārās regresijas modeļa. Lai to izdarītu, tiek izmantots vidējās kļūdas un robežkļūdas jēdziens un attiecības starp tām.

Bet pat pēc standartkļūdas iegūšanas paliek jautājums par robežām, kurās atradīsies prognozētā vērtība. Citiem vārdiem sakot, par mērījumu kļūdas intervālu, dabiskā pieņēmumā daudzos gadījumos, ka šī intervāla vidu nosaka efektīvā faktora y aprēķinātā (vidējā) vērtība. Šeit palīgā nāk centrālā robežu teorēma, kas precīzi norāda, ar kādu varbūtību nezināmais daudzums atrodas šajā robežās. ticamības intervāls.

Būtībā standarta kļūdas formula neatkarīgi no tā, kā un kādā veidā tā iegūta, raksturo kļūdu regresijas taisnes pozīcijā. Standarta kļūda sasniedz minimumu, kad faktora x vērtība sakrīt ar faktora vidējo vērtību.

24. Hipotēžu statistiskā pārbaude un lineārās regresijas nozīmīguma novērtējums, izmantojot Fišera kritēriju.

Pēc lineārās regresijas vienādojuma atrašanas tiek novērtēta gan vienādojuma kopumā, gan tā atsevišķo parametru nozīme. Regresijas vienādojuma nozīmīgumu kopumā var novērtēt, izmantojot dažādus kritērijus. Diezgan izplatīta un efektīva ir Fišera F testa izmantošana. Šajā gadījumā tiek izvirzīta nulles hipotēze, ka regresijas koeficients ir vienāds ar nulli, t.i. b=0, un tāpēc faktoram x nav nekādas ietekmes uz rezultātu y. Pirms tūlītējas F testa aprēķina tiek veikta dispersijas analīze. Centrālo vietu tajā ieņem mainīgā y kopējās kvadrātiskās noviržu summas sadalīšana no vidējās vērtības y divās daļās - “izskaidrotajā” un “neizskaidrotajā”:

Iegūtā raksturlieluma y atsevišķo vērtību kopējo noviržu kvadrātā no vidējās vērtības y rada daudzu faktoru ietekme.

Nosacīti sadalīsim visu iemeslu kopumu divās grupās: pētītais faktors x un citi faktori. Ja faktors rezultātu neietekmē, tad regresijas taisne grafikā ir paralēla OX un y=y asij. Tad visa iegūtā raksturlieluma dispersija ir saistīta ar citu faktoru ietekmi, un kopējā noviržu kvadrātā sakritīs ar atlikumu. Ja citi faktori rezultātu neietekmē, tad y ir funkcionāli saistīts ar x un atlikušā kvadrātu summa ir nulle. Šajā gadījumā ar regresiju izskaidroto noviržu kvadrātā summa ir tāda pati kā kvadrātu kopējā summa. Tā kā ne visi korelācijas lauka punkti atrodas uz regresijas taisnes, to izkliede vienmēr notiek faktora x ietekmes izraisītā veidā, t.i. y regresija uz x, ko izraisa citi cēloņi (neizskaidrojamas izmaiņas). Regresijas līnijas piemērotība prognozēšanai ir atkarīga no tā, cik lielu daļu no kopējās pazīmes y variācijas veido izskaidrotā variācija.

Acīmredzot, ja regresijas izraisīto noviržu kvadrātā summa ir lielāka par atlikušo kvadrātu summu, tad regresijas vienādojums ir statistiski nozīmīgs un faktoram x ir būtiska ietekme uz rezultātu. Tas ir līdzvērtīgs faktam, ka determinācijas koeficients tuvosies vienotībai. Jebkura noviržu kvadrātā summa ir saistīta ar brīvības pakāpju skaitu, t.i. raksturlieluma neatkarīgas variācijas brīvības skaits. Brīvības pakāpju skaits ir saistīts ar populācijas vienību skaitu vai ar no tā noteikto konstantu skaitu. Saistībā ar pētāmo problēmu brīvības pakāpju skaitam ir jāparāda, cik neatkarīgas novirzes no n iespējamām [(y 1 -y), (y 2 -y),...(y n -y)] ir nepieciešamas. lai izveidotu noteiktu kvadrātu summu. Tātad kopējai kvadrātu summai ∑(y-y sr) 2, (n-1) ir nepieciešamas neatkarīgas novirzes, jo n vienību populācijā pēc vidējā līmeņa aprēķināšanas brīvi mainās tikai (n-1) noviržu skaits. Aprēķinot kvadrātu ∑(y-y avg) 2 skaidroto jeb koeficientu summu, tiek izmantotas teorētiskās (aprēķinātās) iegūtās pazīmes y* vērtības, kas atrodamas pa regresijas taisni: y(x)=a+bx.

Tagad atgriezīsimies pie efektīvā faktora kopējās kvadrātiskās noviržu summas paplašināšanas no šīs vērtības vidējās vērtības. Šajā summā ir divas daļas, kas jau definētas iepriekš: ar regresiju izskaidroto noviržu kvadrātu summu un citu summu, ko sauc par noviržu kvadrātu atlikušo summu. Ar šo dekompozīciju ir saistīta dispersijas analīze, kas tieši atbild uz pamatjautājumu: kā novērtēt regresijas vienādojuma nozīmi kopumā un tā atsevišķos parametrus? Tas arī lielā mērā nosaka šī jautājuma nozīmi. Lai novērtētu regresijas vienādojuma nozīmīgumu kopumā, tiek izmantots Fišera kritērijs (F-tests). Saskaņā ar Fišera piedāvāto pieeju tiek izvirzīta nulles hipotēze: regresijas koeficients ir vienāds ar nulli, t.i. vērtībab=0. Tas nozīmē, ka faktors X neietekmē rezultātu Y.

Atcerēsimies, ka gandrīz vienmēr statistiskā pētījuma rezultātā iegūtie punkti neatrodas tieši uz regresijas taisnes. Tie ir izkaisīti, atrodoties vairāk vai mazāk tālu no regresijas līnijas. Šāda izkliede ir saistīta ar citu faktoru ietekmi, kas atšķiras no skaidrojošā faktora X, kas nav ņemti vērā regresijas vienādojumā. Aprēķinot noviržu kvadrātā izskaidroto vai faktoru summu, tiek izmantotas no regresijas līnijas iegūtā raksturlieluma teorētiskās vērtības.

Noteiktai mainīgo Y un X vērtību kopai vidējās vērtības Y aprēķinātā vērtība lineārā regresijā ir tikai viena parametra - regresijas koeficienta - funkcija. Saskaņā ar to faktora noviržu kvadrātu summai ir brīvības pakāpju skaits, kas vienāds ar 1. Un noviržu kvadrātu atlikušās summas brīvības pakāpju skaits lineārajā regresijā ir n-2.

Līdz ar to, dalot katru sākotnējā izplešanās noviržu kvadrātu summu ar tās brīvības pakāpju skaitu, iegūstam vidējās novirzes kvadrātā (dispersija uz vienu brīvības pakāpi). Tālāk, dalot faktora dispersiju ar vienu brīvības pakāpi ar atlikušo dispersiju ar vienu brīvības pakāpi, iegūstam nulles hipotēzes pārbaudes kritēriju, tā saukto F koeficientu jeb tāda paša nosaukuma kritēriju. Proti, ja nulles hipotēze ir patiesa, faktors un atlikušās dispersijas ir vienkārši vienādas viena ar otru.

Lai noraidītu nulles hipotēzi, t.i. pieņemot pretēju hipotēzi, kas izsaka pētāmo attiecību nozīmīguma (esamības) faktu, nevis tikai nejaušu faktoru sakritību, kas simulē attiecības, kuras faktiski neeksistē, ir jāizmanto kritisko vērtību tabulas. norādītās attiecības. Izmantojot tabulas, tiek noteikta Fišera kritērija kritiskā (sliekšņa) vērtība. To sauc arī par teorētisko. Tad viņi pārbauda, ​​salīdzinot to ar atbilstošo empīrisko (faktisko) kritērija vērtību, kas aprēķināta no novērojumu datiem, vai koeficienta faktiskā vērtība pārsniedz tabulās norādīto kritisko vērtību.

Tas tiek darīts sīkāk šādi. Izvēlieties noteiktu nulles hipotēzes esamības varbūtības līmeni un atrodiet no tabulām F kritērija kritisko vērtību, pie kuras joprojām var rasties nejauša dispersiju novirze par 1 brīvības pakāpi, t.i. maksimālā šāda vērtība. Tad aprēķinātā F koeficienta vērtība tiek uzskatīta par ticamu (t.i., izsaka starpību starp faktisko un atlikušo dispersiju), ja šī attiecība ir lielāka par tabulā norādīto. Tad nulles hipotēze tiek noraidīta (nav taisnība, ka nav sakarības pazīmju) un, gluži pretēji, mēs nonākam pie secinājuma, ka saistība ir un tā ir nozīmīga (tā nav nejauša, nozīmīga).

Ja sakarības vērtība izrādās mazāka par tabulā norādīto, tad nulles hipotēzes varbūtība izrādās augstāka par norādīto līmeni (kas tika izvēlēts sākotnēji) un nulles hipotēzi nevar noraidīt bez manāmām briesmām. nepareiza secinājuma iegūšana par attiecību esamību. Attiecīgi regresijas vienādojums tiek uzskatīts par nenozīmīgu.

Pati F kritērija vērtība ir saistīta ar determinācijas koeficientu. Papildus regresijas vienādojuma nozīmīguma novērtēšanai kopumā, tiek novērtēta arī atsevišķu regresijas vienādojuma parametru nozīme. Šajā gadījumā regresijas koeficienta standartkļūdu nosaka, izmantojot empīrisko faktisko standartnovirzi un empīrisko dispersiju uz brīvības pakāpi. Pēc tam Studenta sadalījumu izmanto, lai pārbaudītu regresijas koeficienta nozīmīgumu, lai aprēķinātu tā ticamības intervālus.

Regresijas un korelācijas koeficientu nozīmīguma novērtēšana, izmantojot Stjudenta t-testu, tiek veikta, salīdzinot šo lielumu vērtības un standartkļūdu. Lineārās regresijas parametru kļūdas lielumu un korelācijas koeficientu nosaka pēc šādām formulām:

kur S ir vidējā kvadrātiskā atlikušā parauga novirze,

r xy – korelācijas koeficients.

Attiecīgi regresijas līnijas prognozēto standartkļūdas vērtību nosaka pēc formulas:

Atbilstošās regresijas un korelācijas koeficientu vērtību attiecības pret to standarta kļūdu veido tā saukto t statistiku, un atbilstošās tabulas (kritiskās) vērtības un tās faktiskās vērtības salīdzinājums ļauj pieņemt vai noraidīt nulli. hipotēze. Bet tad, lai aprēķinātu ticamības intervālu, katra rādītāja maksimālā kļūda tiek atrasta kā t statistikas tabulas vērtības reizinājums ar atbilstošā rādītāja vidējo nejaušības kļūdu. Faktiski mēs to pierakstījām nedaudz savādāk tieši iepriekš. Tad tiek iegūtas ticamības intervālu robežas: apakšējā robeža ir, atņemot atbilstošo robežkļūdu no atbilstošajiem koeficientiem (faktiski vidējā), un augšējā robeža ir ar saskaitīšanu (suskaitīšanu).

Lineārajā regresijā ∑(y x -y vid.) 2 =b 2 ∑(x-x avg) 2. To ir viegli pārbaudīt, izmantojot lineārās korelācijas koeficienta formulu: r 2 xy = b 2 * σ 2 x /σ 2 y

kur σ 2 y ir pazīmes y kopējā dispersija;

σ 2 x - raksturlieluma y izkliede faktora x dēļ. Attiecīgi lineārās regresijas radīto noviržu kvadrātā summa būs:

∑(y x -y vid.) 2 =b 2 ∑(x-x vid.) 2 .

Tā kā noteiktam novērojumu apjomam x un y faktora kvadrātu summa lineārajā regresijā ir atkarīga tikai no vienas regresijas koeficienta b konstantes, tad šai kvadrātu summai ir viena brīvības pakāpe. Apskatīsim atribūta y aprēķinātās vērtības satura pusi t.i. y x. Vērtību y x nosaka lineārās regresijas vienādojums: y x ​​= a + bx.

Parametru a var definēt kā a=y-bx. Lineārajā modelī aizstājot parametra a izteiksmi, iegūstam: y x =y-bx+bx avg =y-b(x-x avg).

Noteiktai mainīgo y un x kopai y x aprēķinātā vērtība lineārajā regresijā ir tikai viena parametra - regresijas koeficienta - funkcija. Attiecīgi faktora noviržu kvadrātu summai ir brīvības pakāpju skaits, kas vienāds ar 1.

Pastāv vienādība starp kvadrātu kopējās, koeficienta un atlikušās summas brīvības pakāpju skaitu. Lineārās regresijas kvadrātu atlikušās summas brīvības pakāpju skaits ir (n-2). Brīvības pakāpju skaitu kopējai kvadrātu summai nosaka vieninieku skaits, un, tā kā mēs izmantojam vidējo, kas aprēķināts no izlases datiem, mēs zaudējam vienu brīvības pakāpi, t.i. (n-1). Tātad mums ir divas vienādības: summām un brīvības pakāpju skaitam. Un tas, savukārt, atgriež mūs pie salīdzināmām variācijām atkarībā no brīvības pakāpes, kuru attiecība dod Fišera kritēriju.

25. Regresijas vienādojuma atsevišķo parametru un koeficientu nozīmīguma novērtēšana, izmantojot Studenta testu.

27. Lineārā un nelineārā regresija un metodes to pētīšanai.

Lineārā regresija un tās izpētes un novērtēšanas metodes nebūtu tik svarīgas, ja papildus šim ļoti svarīgajam, bet tomēr visvienkāršajam gadījumam mēs ar to palīdzību neiegūtu instrumentu sarežģītāku nelineāro atkarību analīzei. Nelineārās regresijas var iedalīt divās būtiski atšķirīgās klasēs. Pirmā un vienkāršāka ir nelineāro atkarību klase, kurā ir nelinearitāte attiecībā pret skaidrojošajiem mainīgajiem, bet kas tajos iekļautajos un izvērtēšanai pakļautajos parametros paliek lineāras. Tas ietver dažādu pakāpju polinomus un vienādmalu hiperbolu.

Šādu nelineāru regresiju skaidrojumā iekļautajiem mainīgajiem, vienkārši pārveidojot (aizvietojot) mainīgos lielumus, var viegli reducēt uz parastu lineāro regresiju jauniem mainīgajiem. Tāpēc parametru novērtējums šajā gadījumā tiek veikts vienkārši ar mazākajiem kvadrātiem, jo ​​atkarības parametros ir lineāras. Tādējādi svarīgu lomu ekonomikā spēlē nelineārā atkarība, ko raksturo vienādmalu hiperbola:

Tās parametri ir labi novērtēti ar mazāko kvadrātu metodi, un šī atkarība pati par sevi raksturo izejvielu, degvielas, materiālu specifisko izmaksu saistību ar produkcijas apjomu, preču aprites laiku un visiem šiem faktoriem ar tirdzniecības apjomu. apgrozījums. Piemēram, Filipsa līkne raksturo nelineāro sakarību starp bezdarba līmeni un algu pieauguma procentu.

Pavisam cita situācija ir ar regresiju, kas novērtētajos parametros ir nelineāra, piemēram, attēlota ar jaudas funkciju, kurā pati pakāpe (tās eksponents) ir parametrs vai ir atkarīga no parametra. Tā var būt arī eksponenciāla funkcija, kur pakāpes bāze ir parametrs un eksponenciāla funkcija, kurā atkal indikators satur parametru vai parametru kombināciju. Šī klase savukārt ir sadalīta divās apakšklasēs: viena ietver ārēji nelineāru, bet būtībā iekšēji lineāru. Šajā gadījumā modeli var pārvērst lineārā formā, izmantojot transformācijas. Tomēr, ja modelis ir iekšēji nelineārs, tad to nevar reducēt līdz lineārai funkcijai.

Tādējādi tikai tie modeļi, kas pēc būtības ir nelineāri regresijas analīzē, tiek uzskatīti par patiesi nelineāriem. Visas pārējās, kuras transformāciju ceļā var reducēt līdz lineārajām, par tādām neuzskata, un tieši tās ekonometriskajos pētījumos aplūko visbiežāk. Tajā pašā laikā tas nenozīmē, ka ekonometrikā nav iespējams pētīt būtībā nelineāras atkarības. Ja modelis savos parametros ir iekšēji nelineārs, tad parametru novērtēšanai tiek izmantotas iteratīvas procedūras, kuru panākumi ir atkarīgi no izmantotās iteratīvās metodes pazīmju vienādojuma veida.

Atgriezīsimies pie atkarībām, kas reducētas uz lineārām. Ja tie ir nelineāri gan parametros, gan mainīgajos, piemēram, formā y = a reizināts ar X pakāpju, kura eksponents ir parametrs -  (beta):

Acīmredzot šādas attiecības var viegli pārvērst lineārā vienādojumā ar vienkāršu logaritmu.

Pēc jaunu mainīgo, kas apzīmē logaritmus, ieviešanas tiek iegūts lineārs vienādojums. Regresijas novērtēšanas procedūra sastāv no jaunu mainīgo aprēķināšanas katram novērojumam, izmantojot sākotnējo vērtību logaritmus. Pēc tam tiek novērtēta jauno mainīgo regresijas atkarība. Lai pārietu uz sākotnējiem mainīgajiem, jums jāņem antilogaritms, tas ir, faktiski jāatgriežas pie pašiem pakāpēm, nevis to eksponentiem (galu galā logaritms ir eksponents). Līdzīgi var aplūkot eksponenciālu vai eksponenciālu funkciju gadījumu.

Ievērojami nelineārai regresijai nav iespējams pielietot parasto regresijas novērtēšanas procedūru, jo atbilstošo sakarību nevar pārvērst par lineāru. Vispārējā darbību shēma ir šāda:

1. Tiek pieņemtas dažas ticamas sākotnējās parametru vērtības;

2. Paredzamās Y vērtības tiek aprēķinātas no faktiskajām X vērtībām, izmantojot šīs parametru vērtības;

3. Visiem izlases novērojumiem aprēķina atlikumus un pēc tam atlieku kvadrātu summu;

4. Viena vai vairāku parametru aplēsēs tiek veiktas nelielas izmaiņas;

5. Tiek aprēķinātas jaunas Y prognozētās vērtības, atlikumi un atlikuma kvadrātu summa;

6. Ja atlikumu kvadrātu summa ir mazāka nekā iepriekš, tad jaunie parametru aprēķini ir labāki par iepriekšējiem un jāizmanto kā jauns sākumpunkts;

7. 4., 5. un 6. darbību atkārto vēlreiz, līdz kļūst neiespējami veikt tādas izmaiņas parametru aplēsēs, kas radītu izmaiņas kvadrātu atlikuma summā;

8. Secināts, ka atlikuma kvadrātu summa ir samazināta līdz minimumam un gala parametru aplēses ir mazāko kvadrātu aprēķini.

Starp nelineārajām funkcijām, kuras var samazināt līdz lineāra forma, jaudas funkcija tiek plaši izmantota ekonometrikā. Parametram b tajā ir skaidra interpretācija, jo tas ir elastības koeficients. Modeļos, kuru novērtētie parametri ir nelineāri, bet var tikt reducēti uz lineāru formu, transformētajiem vienādojumiem tiek piemērota mazāko kvadrātu metode. Logaritmu un attiecīgi eksponentu praktiska izmantošana ir iespējama, ja iegūtajai zīmei nav negatīvu vērtību. Pētot sakarības starp funkcijām, izmantojot rezultējošā atribūta logaritmu, ekonometrikā dominē jaudas likumu atkarības (pieprasījuma un piedāvājuma līknes, ražošanas funkcijas, absorbcijas līknes, lai raksturotu sakarību starp produktu darbaspēka intensitāti, ražošanas apjomu, atkarību NKI uz nodarbinātības līmeni, Engela līknes).

28. Apgrieztais modelis un tā izmantošana

Dažkārt tiek izmantots tā sauktais apgrieztais modelis, kas iekšēji ir nelineārs, taču tajā atšķirībā no vienādmalu hiperbolas transformācijai tiek pakļauts nevis skaidrojošais mainīgais, bet gan iegūtais atribūts Y. Tāpēc apgrieztais modelis izrādās būt iekšēji nelineāram, un OLS prasība nav izpildīta iegūtā atribūta Y faktiskajām vērtībām un to apgrieztajām vērtībām. Īpašu uzmanību ir pelnījis nelineārās regresijas korelācijas pētījums. Vispārīgā gadījumā otrās pakāpes parabola, tāpat kā augstākas kārtas polinomi, linearizēta, iegūst daudzkārtējas regresijas vienādojuma formu. Ja, linearizējot, regresijas vienādojums, kas ir nelineārs attiecībā pret izskaidroto mainīgo, izpaužas kā lineāra pāra regresijas vienādojums, tad attiecības ciešuma novērtēšanai var izmantot lineāro korelācijas koeficientu.

Ja regresijas vienādojuma transformācijas lineārā formā ir saistītas ar atkarīgo mainīgo (rezultatīvais raksturlielums), tad lineārās korelācijas koeficients, kas balstīts uz pazīmju transformētajām vērtībām, sniedz tikai aptuvenu attiecības novērtējumu un skaitliski nesakrīt ar korelācijas indekss. Jāpatur prātā, ka, aprēķinot korelācijas indeksu, tiek izmantotas iegūtā raksturlieluma Y noviržu kvadrātu summas, nevis to logaritmi. Korelācijas indeksa nozīmīguma novērtēšana tiek veikta tāpat kā korelācijas koeficienta ticamības (nozīmības) novērtēšana. Pats korelācijas indekss, tāpat kā noteikšanas indekss, tiek izmantots, lai pārbaudītu nelineārās regresijas vienādojuma kopējo nozīmīgumu, izmantojot Fišera F testu.

Ņemiet vērā, ka iespēja konstruēt nelineārus modeļus, gan reducējot tos līdz lineārai formai, gan izmantojot nelineāro regresiju, no vienas puses, palielina regresijas analīzes universālumu. No otras puses, tas ievērojami sarežģī pētnieka uzdevumus. Ja mēs aprobežojamies ar pāru regresijas analīzi, novērojumus Y un X varam attēlot kā izkliedes diagrammu. Bieži vien vairākas dažādas nelineāras funkcijas tuvina novērojumus, ja tās atrodas uz kādas līknes. Taču vairākkārtējas regresijas analīzes gadījumā šādu grafiku nevar izveidot.

Apsverot alternatīvus modeļus ar tādu pašu atkarīgā mainīgā definīciju, atlases procedūra ir salīdzinoši vienkārša. Var novērtēt regresiju, pamatojoties uz visām iespējamām funkcijām, kuras var iedomāties, un izvēlēties funkciju, kas visvairāk izskaidro atkarīgā mainīgā izmaiņas. Ir skaidrs, ka tad, ja lineāra funkcija izskaidro aptuveni 64% no y dispersijas, bet hiperboliska funkcija izskaidro 99,9%, acīmredzami ir jāizvēlas pēdējais. Bet, kad dažādi modeļi Izmantojot dažādas funkcionālās formas, modeļa izvēles problēma kļūst ievērojami sarežģītāka.

29. Box-Cox testa izmantošana.

Vispārīgāk, apsverot alternatīvus modeļus ar tādu pašu atkarīgā mainīgā definīciju, izvēle ir vienkārša. Vissaprātīgāk ir novērtēt regresiju, pamatojoties uz visām ticamajām funkcijām, koncentrējoties uz funkciju, kas visvairāk izskaidro atkarīgā mainīgā izmaiņas. Ja determinācijas koeficients vienā gadījumā mēra ar regresiju izskaidroto dispersijas proporciju, bet otrā - šī atkarīgā mainīgā logaritma dispersijas proporciju, kas izskaidrojama ar regresiju, tad izvēle tiek veikta bez grūtībām. Cita lieta, ja šīs vērtības diviem modeļiem ir ļoti tuvas un izvēles problēma kļūst ievērojami sarežģītāka.

Pēc tam jāpiemēro standarta procedūra Box-Cox testa veidā. Ja jums vienkārši jāsalīdzina modeļi, izmantojot efektīvo koeficientu un tā logaritmu atkarīgā mainīgā varianta veidā, tad tiek izmantota Zarembka testa versija. Tas piedāvā novērošanas skalas Y transformāciju, kas ļauj tieši salīdzināt vidējo kvadrātisko kļūdu (MSE) lineārajos un logaritmiskos modeļos. Attiecīgā procedūra ietver šādas darbības:

    Tiek aprēķināts parauga Y vērtību ģeometriskais vidējais, kas sakrīt ar Y logaritma vidējā aritmētiskā eksponentu;

    Novērojumus Y pārrēķina tā, lai tie tiktu dalīti ar pirmajā solī iegūto vērtību;

    Regresija tiek aprēķināta lineāram modelim, izmantojot mērogotās Y vērtības sākotnējo Y vērtību vietā, un logaritmiskam modelim, izmantojot mērogotu Y vērtību logaritmu. Abu regresiju RMSE vērtības tagad ir salīdzināmas, un tāpēc modelis ar mazāku noviržu kvadrātu summu nodrošina labāku atbilstību novēroto vērtību patiesajām attiecībām;

    Lai pārbaudītu, vai kāds no modeļiem nenodrošina ievērojami labāku atbilstību, var izmantot pusi no novērojumu skaita un pārrēķinātās regresijas standartnovirzes vērtību attiecības logaritmu un pēc tam ņemt šīs vērtības absolūtā vērtība.

30. Faktoru savstarpējās korelācijas un multikolinearitātes jēdzieni.

34. MNC pamati un tā piemērošanas pamatotība.

Tagad pievērsīsimies OLS pamatiem, tā pielietojuma pamatotībai (ieskaitot daudzkārtējas regresijas problēmas) un svarīgākajām aplēšu īpašībām, kas iegūtas, izmantojot OLS. Sāksim ar to, ka kopā ar analītisko atkarību no labās puses regresijas vienādojums Liela nozīme ir arī nejaušajam terminam. Šī nejaušā sastāvdaļa ir nenovērojams lielums. sāms statistiskie testi regresijas parametri un korelācijas rādītāji ir balstīti uz nepārbaudāmiem pieņēmumiem par šīs daudzkārtējās regresijas nejaušās sastāvdaļas sadalījumu. Šie pieņēmumi ir tikai provizoriski. Tikai pēc regresijas vienādojuma sastādīšanas tiek pārbaudīts, vai nejaušo atlieku aplēsēm (gadījuma komponenta empīriskiem analogiem) ir a priori pieņemtas īpašības. Būtībā, kad tiek novērtēti modeļa parametri, tiek aprēķinātas atšķirības starp iegūtā atribūta teorētisko un faktisko vērtību, lai tādējādi novērtētu pašu nejaušo komponentu. Ir svarīgi paturēt prātā, ka šis ir tikai dotā vienādojuma nezināmās atlikuma paraugs.

Regresijas koeficienti, kas iegūti no normālu vienādojumu sistēmas, ir sakarības stipruma izlases aplēses. Ir skaidrs, ka tiem ir praktiska nozīme tikai tad, ja tie ir objektīvi. Atcerēsimies, ka šajā gadījumā atlikuma vidējais lielums ir vienāds ar nulli vai, kas ir vienāds, novērtējuma vidējais ir vienāds ar pašu novērtēto parametru. Tad atlikumi netiks uzkrāti lielā skaitā izlases aplēšu, un pašu atrasto regresijas parametru var uzskatīt par vidējo lielumu lielam skaitam objektīvu novērtējumu.

Turklāt aplēsēm jābūt ar mazāko novirzi, t.i. būt efektīvai, un tad kļūst iespējams pāriet no praktiski neizmantojamām punktu aplēsēm uz intervāla novērtējumu. Visbeidzot, ticamības intervāli ir noderīgi, ja varbūtība iegūt novērtējumu noteiktā attālumā no parametra patiesās (nezināmās) vērtības ir tuvu vienam. Šādus aprēķinus sauc par konsekventiem, un konsekvences īpašību raksturo to precizitātes palielināšanās, palielinoties izlases lielumam.

Tomēr konsekvences nosacījums netiek izpildīts automātiski un būtiski ir atkarīgs no tālāk norādīto divu svarīgu prasību izpildes. Pirmkārt, pašiem atlikumiem jābūt stohastiskiem ar visizteiktāko nejaušību, t.i. visas skaidri funkcionālās atkarības ir jāiekļauj īpaši daudzkārtējas regresijas analītiskajā komponentā, un turklāt atlieku vērtības ir jāsadala neatkarīgi viena no otras dažādiem paraugiem (bez atlikumu autokorelācijas). Otrā, ne mazāk svarīgā prasība ir, lai katras novirzes (atlikuma) dispersija būtu identiska visām X mainīgo vērtībām (homoscedasticity). Tie. homoskedastiskums tiek izteikts ar dispersijas noturību visiem novērojumiem:

Gluži pretēji, heteroskedastiskums ir šādas dispersijas noturības pārkāpums dažādiem novērojumiem. Šajā gadījumā a priori (pirms novērojumiem) varbūtība iegūt ļoti novirzes vērtības ar dažādiem nejaušā termiņa teorētiskajiem sadalījumiem dažādiem novērojumiem paraugā būs salīdzinoši augsta.

Atlikumu autokorelāciju jeb korelācijas esamību starp pašreizējo un iepriekšējo (nākamo) novērojumu atlikumiem nosaka parastā lineārās korelācijas koeficienta vērtība. Ja tas būtiski atšķiras no nulles, tad atlikumi tiek autokorelēti, un tāpēc varbūtības blīvuma funkcija (atlikumu sadalījums) ir atkarīga no novērošanas punkta un no atlikušo vērtību sadalījuma citos novērošanas punktos. Atlikumu autokorelāciju ir ērti noteikt, izmantojot pieejamo statistisko informāciju, ja novērojumi ir sakārtoti pēc faktora X. Atlikumu autokorelācijas neesamība nodrošina regresijas koeficientu aplēšu konsekvenci un efektivitāti.

35. Homoskedastiskums un heteroskedasticitāte, atlieku autokorelācija, vispārinātie mazākie kvadrāti (GLM).

Atlieku dispersiju vienādība visām X mainīgo vērtībām jeb homoskedastiskums ir arī absolūti nepieciešama, lai iegūtu konsekventus regresijas parametru aprēķinus, izmantojot OLS. Homoskedastikas nosacījuma neizpilde noved pie tā sauktās heteroskedastikas. Tas var novest pie neobjektīvām regresijas koeficientu aplēsēm. Heteroskedastiskums galvenokārt ietekmēs regresijas koeficientu aprēķinu efektivitātes samazināšanos. Šajā gadījumā kļūst īpaši grūti izmantot regresijas koeficienta standarta kļūdas formulu, kuras izmantošana paredz vienmērīgu atlikumu izkliedi jebkurām faktora vērtībām. Kas attiecas uz regresijas koeficientu aplēšu neobjektīvumu, tas galvenokārt ir atkarīgs no atlikumu neatkarības un pašu faktoru vērtībām.

Diezgan skaidrs, kaut arī neprecīzs un prasmju neprasošs veids, kā pārbaudīt homoskedasticitāti, ir grafiski izpētīt atlikumu atkarības raksturu no vidējā aprēķinātā (teorētiskā) rezultējošā atribūta vai atbilstošajiem korelācijas laukiem. Analītiskās metodes heteroskedastiskuma izpētei un novērtēšanai ir stingrākas. Ja ir ievērojama heteroskedastiskuma klātbūtne, OLS vietā ieteicams izmantot vispārinātu OLS (GLM).

Papildus prasībām par daudzkārtēju regresiju, kas izriet no OLS izmantošanas, ir jāievēro arī nosacījumi par modelī iekļautajiem mainīgajiem. Tie, pirmkārt, ietver prasības attiecībā uz modeļa faktoru skaitu noteiktam novērojumu apjomam (no 1 līdz 7). Pretējā gadījumā regresijas parametri būs statistiski nenozīmīgi. No atbilstošo skaitlisko metožu pielietošanas efektivitātes viedokļa, ieviešot LSM, ir nepieciešams, lai novērojumu skaits pārsniegtu novērtēto parametru skaitu (vienādojumu sistēmā vienādojumu skaits ir lielāks par meklēto mainīgie).

Nozīmīgākais ekonometrijas sasniegums ir nezināmu parametru novērtēšanas metožu būtiska attīstība un aplūkojamo efektu statiskās nozīmīguma noteikšanas kritēriju pilnveidošana. Šajā sakarā tradicionālās OLS izmantošanas neiespējamība vai nelietderīgums heteroskedastiskuma dēļ, kas izpaužas dažādās pakāpēs, noveda pie vispārināta OLS (GLM) izstrādes. Faktiski tas ietver modeļa pielāgošanu, tā specifikācijas mainīšanu un sākotnējo datu pārveidošanu, lai nodrošinātu objektīvus, efektīvus un konsekventus regresijas koeficientu aprēķinus.

Tiek pieņemts, ka atlieku vidējais lielums ir nulle, bet to izkliede vairs nav nemainīga, bet ir proporcionāla K i vērtībām, kur šīs vērtības ir proporcionalitātes koeficienti, kas dažādām vērtībām atšķiras. koeficients x. Tādējādi tieši šie koeficienti (K i vērtības) raksturo dispersijas neviendabīgumu. Protams, tiek uzskatīts, ka pats dispersijas apjoms, kas ir kopīgs faktors šiem proporcionalitātes koeficientiem, nav zināms.

Sākotnējais modelis pēc šo koeficientu ievadīšanas daudzkārtējās regresijas vienādojumā turpina palikt heteroskedastisks (precīzāk, tās ir modeļa atlikušās vērtības). Lai šie atlikumi (atlikumi) nav autokorelēti. Ieviesīsim jaunus mainīgos, kas iegūti, i-tā novērojuma rezultātā reģistrētos sākotnējos modeļa mainīgos dalot ar proporcionalitātes koeficientu K i kvadrātsakni. Tad mēs iegūstam jaunu vienādojumu pārveidotajos mainīgajos, kuros atlikumi būs homoskedastiski. Jaunie mainīgie paši ir svērtie vecie (sākotnējie) mainīgie.

Tāpēc šādā veidā iegūtā jaunā vienādojuma parametru novērtējums ar homoskedastiskajiem atlikumiem tiks reducēts uz svērto mazāko kvadrātu metodi (būtībā šī ir OLS metode). Lietojot pašu regresijas mainīgo vietā, to novirzes no vidējiem, regresijas koeficientu izteiksmes iegūst vienkāršu un standartizētu (viendabīgu) formu, kas OLS un OLS nedaudz atšķiras ar korekcijas koeficientu 1/K skaitītājā un saucējā. no daļas, kas sniedz regresijas koeficientu.

Jāpatur prātā, ka transformētā (koriģētā) modeļa parametri ir būtiski atkarīgi no tā, kāds jēdziens tiek izmantots par pamatu proporcionalitātes koeficientiem K i. Bieži tiek pieņemts, ka atlikumi ir vienkārši proporcionāli faktoru vērtībām. Modelis iegūst vienkāršāko formu, ja tiek pieņemta hipotēze, ka kļūdas ir proporcionālas pēdējā faktora vērtībām. Tad OLS ļauj palielināt novērojumu svaru ar mazākām transformēto mainīgo vērtībām, nosakot regresijas parametrus, salīdzinot ar standarta OLS darbību ar sākotnējiem avota mainīgajiem. Taču šie jaunie mainīgie lielumi jau saņem citu ekonomisko saturu.

Hipotēzei par atlikumu proporcionalitāti faktora lielumam var būt reāls pamats. Ļaujiet apstrādāt noteiktu nepietiekami viendabīgu datu kopumu, piemēram, vienlaikus iekļaujot lielus un mazus uzņēmumus. Tad lielas faktora tilpuma vērtības var atbilst gan lielai iegūtā raksturlieluma izkliedei, gan lielai atlikušo vērtību izkliedei. Turklāt OLS izmantošana un atbilstošā pāreja uz relatīvajām vērtībām ne tikai samazina faktoru variācijas, bet arī samazina kļūdu dispersiju. Tādējādi vienkāršākais heteroskedastiskuma ņemšanas un korekcijas gadījums regresijas modeļos tiek realizēts, izmantojot OLS.

Iepriekš minētā pieeja OLS ieviešanai svērtā OLS veidā ir diezgan praktiska - tā ir vienkārši ieviesta un tai ir pārredzama ekonomiskā interpretācija. Protams, šī nav visvispārīgākā pieeja, un matemātiskās statistikas kontekstā, kas kalpo par ekonometrijas teorētisko pamatu, mums tiek piedāvāta daudz stingrāka metode, kas ievieš OLS pašā tās būtībā. vispārējs skats. Tajā jums jāzina kļūdas vektora (atlikuma kolonnas) kovariācijas matrica. Un tas parasti ir negodīgi praktiskās situācijās, un var būt neiespējami atrast šo matricu kā tādu. Tāpēc, vispārīgi runājot, ir nepieciešams kaut kā novērtēt nepieciešamo matricu, lai izmantotu šādu novērtējumu attiecīgajās formulās, nevis pašu matricu. Tādējādi aprakstītā OMNC ieviešanas versija ir viena no šādām aplēsēm. To dažreiz sauc par pieejamiem vispārinātajiem mazākajiem kvadrātiem.

Jāņem vērā arī tas, ka, izmantojot OLS, determinācijas koeficients nevar kalpot kā apmierinošs atbilstības kvalitātes mērs. Atgriežoties pie OLS izmantošanas, mēs arī atzīmējam, ka standarta noviržu (standarta kļūdu) izmantošanas metodei White formā (tā sauktās konsekventās standarta kļūdas heteroskedastiskuma klātbūtnē) ir pietiekami vispārīga. Šī metode ir piemērojama, ja kļūdu vektora kovariācijas matrica ir diagonāla. Ja notiek atlikumu (kļūdu) autokorelācija, kad kovariācijas matricā un ārpus galvenās diagonāles ir elementi, kas nav nulle (koeficienti), tad jāizmanto vispārīgāka standarta kļūdu metode Neve West formā. Pastāv ievērojams ierobežojums: elementi, kas nav nulles elementi, papildus galvenajai diagonālei, ir atrodami tikai blakus esošajās diagonālēs, kuru attālums no galvenās diagonāles nav lielāks par noteiktu daudzumu.

No iepriekš minētā ir skaidrs, ka ir jāspēj pārbaudīt heteroskedastiskuma datus. Tālāk sniegtie testi kalpo šim nolūkam. Viņi pārbauda galveno hipotēzi par atlikumu dispersiju vienādību pret alternatīvo hipotēzi (par šo hipotēžu nevienlīdzību). Turklāt heteroskedastiskuma būtībai ir a priori strukturāli ierobežojumi. Goldfelda-Kvanta testā parasti tiek izmantots pieņēmums, ka kļūdas dispersija (atlikuma) ir tieši atkarīga no kāda neatkarīga mainīgā vērtības. Šī testa izmantošanas shēma ir šāda. Pirmkārt, dati tiek sakārtoti dilstošā secībā pēc neatkarīgā mainīgā, par kuru ir aizdomas par heteroskedasticitāti. Šī sakārtotā datu kopa pēc tam novērš vidējos dažus novērojumus, kur vārds "daži" nozīmē aptuveni ceturtdaļu (25%) kopējais skaits visi novērojumi. Pēc tam tiek veiktas divas neatkarīgas regresijas pirmajam no atlikušajiem (pēc likvidēšanas) vidējiem novērojumiem un pēdējiem diviem no šiem atlikušajiem vidējiem novērojumiem. Pēc tam tiek izveidoti divi atbilstošie atlikumi. Visbeidzot, tiek apkopota Fišera F statistika un, ja pētāmā hipotēze ir patiesa, tad F patiešām ir Fišera sadalījums ar atbilstošām brīvības pakāpēm. Tad liela šīs statistikas vērtība nozīmē, ka pārbaudāmā hipotēze ir jānoraida. Bez eliminācijas posma šī testa jauda tiek samazināta.

Breusch-Pagan testu izmanto gadījumos, kad a priori tiek pieņemts, ka novirzes ir atkarīgas no dažiem papildu mainīgajiem. Vispirms tiek veikta parastā (standarta) regresija un iegūts atlikuma vektors. Pēc tam tiek konstruēts dispersijas novērtējums. Tālāk tiek veikta atlikuma vektora kvadrātā, kas dalīts ar empīrisko dispersiju (dispersijas novērtējums), regresija. Tam (regresijai) tiek atrasta izskaidrotā variācijas daļa. Un šai izskaidrotajai variācijas daļai, kas sadalīta uz pusēm, tiek veidota statistika. Ja nulles hipotēze ir patiesa (nav heteroskedastiskuma patiesība), tad šai vērtībai ir sadalījums hei-kvadrāts. Ja tests, gluži pretēji, atklāj heteroskedastiskumu, tad sākotnējais modelis tiek pārveidots, dalot atlikumu vektora komponentus ar atbilstošajiem novēroto neatkarīgo mainīgo vektora komponentiem.

36. Standartnovirzes metode baltā formā.

Var izdarīt šādus secinājumus. OLS izmantošana heteroskedastiskuma klātbūtnē ir saistīta ar svērto kvadrātu noviržu summas samazināšanu. Pieejamās OLS izmantošana ir saistīta ar vajadzību pēc liela skaita novērojumu, kas pārsniedz aprēķināto parametru skaitu. Vislabvēlīgākais OLS izmantošanai ir gadījums, kad kļūda (atlikumi) ir proporcionāla vienam no neatkarīgiem mainīgajiem un iegūtie aprēķini ir konsekventi. Ja tomēr modelī ar heteroskedasticitāti ir nepieciešams izmantot nevis OLS, bet gan standarta OLS, tad, lai iegūtu konsekventus aprēķinus, var izmantot kļūdu aplēses White vai Nevje-West formā.

Analizējot laikrindas, bieži vien ir jāņem vērā novērojumu statistiskā atkarība dažādos laika punktos. Šajā gadījumā pieņēmums par nekorelētām kļūdām nav izpildīts. Apsvērsim vienkāršs modelis, kurā kļūdas veido pirmās kārtas autoregresīvu procesu. Šajā gadījumā kļūdas apmierina vienkāršu atkārtošanās sakarību, kuras labajā pusē viens no terminiem ir neatkarīgu normāli sadalītu nejaušības lielumu secība ar nulles vidējo un nemainīgu dispersiju. Otrais termins ir parametra (autoregresijas koeficienta) un atlikuma vērtību reizinājums iepriekšējā laika brīdī. Kļūdu vērtību (atlikuma) secība pati par sevi veido stacionāru nejaušu procesu. Stacionāru nejaušu procesu raksturo tā raksturlielumu, jo īpaši vidējā un dispersijas, nemainīgums laika gaitā. Šajā gadījumā mūs interesējošo kovariācijas matricu (tās nosacījumus) var viegli uzrakstīt, izmantojot parametra pilnvaras.

Autoregresīvā modeļa novērtējums zināmam parametram tiek veikts, izmantojot OLS. Šajā gadījumā pietiek vienkārši reducēt sākotnējo modeli ar vienkāršu transformāciju uz modeli, kura kļūdas atbilst standarta regresijas modeļa nosacījumiem. Tas ir ļoti reti, bet joprojām pastāv situācija, kad ir zināms autorregresijas parametrs. Tāpēc parasti ir nepieciešams veikt novērtēšanu ar nezināmu autoregresīvu parametru. Šādam novērtējumam ir trīs visbiežāk izmantotās procedūras. Cochrane-Orcutt metode, Hildreth-Lu procedūra un Durbin metode.

Kopumā šādi secinājumi ir patiesi. Laikrindu analīzei nepieciešama parastā OLS korekcija, jo šajā gadījumā kļūdas parasti ir savstarpēji saistītas. Bieži vien šīs kļūdas veido pirmās kārtas stacionāru autoregresīvu procesu. Pirmās kārtas autoregresijas OLS aprēķini ir objektīvi, konsekventi, taču neefektīvi. Ar zināmu autoregresijas koeficientu OLS reducē līdz vienkāršām sākotnējās sistēmas transformācijām (labojumiem) un pēc tam līdz standarta OLS lietošanai. Ja, kā tas biežāk notiek, autoregresīvais koeficients nav zināms, tad OLS ir pieejamas vairākas procedūras, kas sastāv no nezināmā parametra (koeficienta) novērtēšanas, pēc kuras tiek piemērotas tādas pašas transformācijas kā iepriekšējā zināmā gadījumā. parametrs.

37. Breusch-Pagan testa jēdziens, Goldfelda-Kvanta tests

Pārbaudīsim hipotēzi H 0 par individuālo regresijas koeficientu vienādību ar nulli (ja alternatīva nav vienāda ar H 1) pie nozīmīguma līmeņa b = 0,05.

Ja galvenā hipotēze izrādās nepareiza, mēs pieņemam alternatīvo. Lai pārbaudītu šo hipotēzi, tiek izmantots Stjudenta t-tests.

No novērojumu datiem atrastā t-kritērija vērtība (saukta arī par novēroto vai faktisko) tiek salīdzināta ar tabulēto (kritisko) vērtību, kas noteikta no Studentu sadalījuma tabulām (kuras parasti ir norādītas mācību grāmatu un statistikas vai ekonometrijas semināru beigās).

Tabulas vērtību nosaka atkarībā no nozīmīguma līmeņa (b) un brīvības pakāpju skaita, kas lineārās pāra regresijas gadījumā ir vienāds ar (n-2), n ir novērojumu skaits.

Ja t-testa faktiskā vērtība ir lielāka par tabulēto vērtību (modulo), tad galvenā hipotēze tiek noraidīta un tiek uzskatīts, ka ar varbūtību (1-b) parametrs vai statistiskais raksturlielums populācijā būtiski atšķiras no nulles. .

Ja t-testa faktiskā vērtība ir mazāka par tabulas vērtību (modulo), tad nav pamata noraidīt galveno hipotēzi, t.i. parametrs vai statistiskais raksturlielums populācijā būtiski neatšķiras no nulles nozīmīguma līmenī b.

t crit (n-m-1; b/2) = (30; 0,025) = 2,042

Kopš 1.7< 2.042, то статистическая значимость коэффициента регрессии b не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в šajā gadījumā koeficientu b var neņemt vērā.

Kopš 0.56< 2.042, то статистическая значимость коэффициента регрессии a не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом a можно пренебречь.

Regresijas vienādojuma koeficientu ticamības intervāls.

Noteiksim regresijas koeficientu ticamības intervālus, kas ar 95% ticamību būs šādi:

  • (b — t krit. b; b + t krit. b)
  • (0.64 - 2.042 * 0.38; 0.64 + 2.042 * 0.38)
  • (-0.13;1.41)

Tā kā punkts 0 (nulle) atrodas ticamības intervālā, koeficienta b intervāla novērtējums ir statistiski nenozīmīgs.

  • (a - t crit S a ; a + t crit S a)
  • (24.56 - 2.042 * 44.25; 24.56 + 2.042 * 44.25)
  • (-65.79;114.91)

Ar 95% varbūtību var apgalvot, ka šī parametra vērtība atradīsies atrastajā intervālā.

Tā kā punkts 0 (nulle) atrodas ticamības intervālā, koeficienta a intervāla novērtējums ir statistiski nenozīmīgs.

2) F-statistika. Fišera kritērijs.

Determinācijas koeficientu R2 izmanto, lai pārbaudītu lineārās regresijas vienādojuma nozīmīgumu kopumā.

Regresijas modeļa nozīmīguma pārbaude tiek veikta, izmantojot Fišera F testu, kura aprēķinātā vērtība tiek atrasta kā pētāmā indikatora sākotnējās novērojumu sērijas dispersijas attiecība pret atlikuma secības dispersijas objektīvu novērtējumu. šim modelim.

Ja aprēķinātā vērtība ar k 1 =(m) un k 2 =(n-m-1) brīvības pakāpēm ir lielāka par tabulā norādīto vērtību noteiktā nozīmīguma līmenī, tad modelis tiek uzskatīts par nozīmīgu.

kur m ir faktoru skaits modelī.

Pāru lineārās regresijas statistisko nozīmīgumu novērtē, izmantojot šādu algoritmu:

  • 1. Tiek izvirzīta nulles hipotēze, ka vienādojums kopumā ir statistiski nenozīmīgs: H 0: R 2 =0 nozīmīguma līmenī b.
  • 2. Pēc tam nosakiet F kritērija faktisko vērtību:

kur m=1 pāru regresijai.

3. Tabulā iestrādāto vērtību nosaka no Fišera sadalījuma tabulām dotajam nozīmīguma līmenim, ņemot vērā, ka brīvības pakāpju skaits kopējai kvadrātu summai (lielākai dispersijai) ir 1 un brīvības pakāpju skaits atlikumam. kvadrātu summa (mazāka dispersija) lineārajā regresijā ir n-2 .

F tabula ir maksimālā iespējamā nozīme kritērijs nejaušu faktoru ietekmē ar noteiktām brīvības pakāpēm un nozīmīguma līmeni b. Nozīmīguma līmenis b – pareizās hipotēzes noraidīšanas varbūtība, ja tā ir patiesa. Parasti b tiek pieņemts vienāds ar 0,05 vai 0,01.

4. Ja F-testa faktiskā vērtība ir mazāka par tabulas vērtību, tad viņi saka, ka nav pamata noraidīt nulles hipotēzi.

Pretējā gadījumā nulles hipotēze tiek noraidīta un ar varbūtību (1-b) tiek pieņemta alternatīvā hipotēze par vienādojuma statistisko nozīmīgumu kopumā.

Kritērija tabulas vērtība ar brīvības pakāpēm k 1 =1 un k 2 =30, F tabula = 4.17

Tā kā faktiskā F vērtība< F табл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

Sakarību starp Fišera F testu un Stjudenta t statistiku izsaka ar vienādību:

Regresijas vienādojumu kvalitātes rādītāji.

Atlikumu autokorelācijas pārbaude.

Svarīgs priekšnoteikums kvalitatīva regresijas modeļa izveidošanai, izmantojot OLS, ir nejaušo noviržu vērtību neatkarība no noviržu vērtībām visos citos novērojumos. Tas nodrošina, ka starp novirzēm un jo īpaši blakus esošajām novirzēm nav korelācijas.

Autokorelācija (sērijas korelācija) ir definēta kā korelācija starp novērotajiem rādītājiem, kas sakārtoti laikā (laikrindas) vai telpā (krustrindas). Atlikumu (varianču) autokorelācija ir izplatīta regresijas analīzē, izmantojot laikrindu datus, un ļoti reti, izmantojot šķērsgriezuma datus.

Ekonomiskajās problēmās pozitīva autokorelācija ir daudz izplatītāka nekā negatīva autokorelācija. Vairumā gadījumu pozitīvu autokorelāciju izraisa virziens pastāvīga iedarbība daži faktori, kas modelī nav ņemti vērā.

Negatīvā autokorelācija būtībā nozīmē, ka pozitīvai novirzei seko negatīva un otrādi. Šāda situācija var rasties, ja pēc sezonas datiem (ziema-vasara) tiek uzskatīta tāda pati sakarība starp pieprasījumu pēc bezalkoholiskajiem dzērieniem un ienākumiem.

Starp galvenajiem autokorelācijas cēloņiem ir šādi:

  • 1. Specifikācijas kļūdas. Ja modelī netiek ņemts vērā kāds svarīgs skaidrojošais mainīgais, vai nepareiza atkarības formas izvēle parasti izraisa novērojumu punktu sistēmiskas novirzes no regresijas līnijas, kas var izraisīt autokorelāciju.
  • 2. Inerce. Daudzi ekonomiskie rādītāji(inflācija, bezdarbs, NKP u.c.) ir zināms ciklisks raksturs, kas saistīts ar uzņēmējdarbības aktivitātes svārstībām. Tāpēc rādītāju izmaiņas nenotiek acumirklī, bet tai ir zināma inerce.
  • 3. Zirnekļa tīkla efekts. Daudzās ražošanas un citās jomās ekonomiskie rādītāji reaģē uz izmaiņām ekonomiskajos apstākļos ar kavēšanos (laika nobīdi).
  • 4. Datu izlīdzināšana. Bieži vien dati par noteiktu ilgu laika periodu tiek iegūti, aprēķinot vidējos datus to veidojošos intervālos. Tas var novest pie zināmas svārstību izlīdzināšanas, kas notikušas aplūkojamajā periodā, kas savukārt var izraisīt autokorelāciju.

Autokorelācijas sekas ir līdzīgas heteroskedastiskuma sekām: secinājumi no t- un F-statistikas, kas nosaka regresijas koeficienta un determinācijas koeficienta nozīmīgumu, visticamāk, būs nepareizi.



Jaunums vietnē

>

Populārākais