Mājas Profilakse Pāru lineārās korelācijas koeficientu matrica. Pāru korelācijas koeficientu matricas konstruēšana

Pāru lineārās korelācijas koeficientu matrica. Pāru korelācijas koeficientu matricas konstruēšana

Sākotnēji modelī plkst ietver visas galvenās sastāvdaļas (aprēķinātās vērtības ir norādītas iekavās t-kritēriji):

Modeļa kvalitāti raksturo: daudzkārtējs determinācijas koeficients r = 0,517, vidējā relatīvā tuvinājuma kļūda = 10,4%, atlikušā dispersija s 2= 1,79 un F novērojams = 121. Sakarā ar to, ka F obs > F kr = 2,85 pie α = 0,05, v 1 = 6, v 2= 14, regresijas vienādojums ir nozīmīgs un vismaz viens no regresijas koeficientiem - β 1, β 2, β 3, β 4 - nav vienāds ar nulli.

Ja regresijas vienādojuma nozīme (hipotēze H 0:β 1 = β 2 = β 3 = β 4 = 0 tika pārbaudīts pie α = 0,05, tad regresijas koeficientu nozīmīgums, t.i. hipotēzes H0: β j = 0 (j = 1, 2, 3, 4), jātestē ar nozīmīguma līmeni, kas lielāks par 0,05, piemēram, pie α = 0.1. Tad pie α = 0,1, v= 14 magnitūdas t kr = 1,76, un nozīmīgi, kā izriet no vienādojuma (53,41), ir regresijas koeficienti β 1, β 2, β 3.

Ņemot vērā, ka galvenās sastāvdaļas nav savstarpēji saistītas, mēs varam nekavējoties izslēgt no vienādojuma visus nenozīmīgos koeficientus, un vienādojums iegūs formu

(53.42)

Salīdzinot vienādojumus (53.41) un (53.42), redzam, ka, izslēdzot nenozīmīgus galvenos komponentus f 4 Un f 5, neietekmēja vienādojuma koeficientu vērtības b 0 = 9,52, b 1 = 0,93, b 2 = 0,66 un atbilstošs t j (j = 0, 1, 2, 3).

Tas ir saistīts ar galveno komponentu nekorelāciju. Interesanta ir sākotnējo rādītāju (53.22), (53.23) un galveno komponentu (53.41), (53.42) regresijas vienādojumu paralēle.

Vienādojums (53.42) ir nozīmīgs, jo F obs = 194 > F kr = 3,01, atrasts pie α = 0,05, v 1 = 4, v 2= 16. Nozīmīgi ir arī vienādojuma koeficienti, jo t j > t kr . = 1,746, kas atbilst α = 0,01, v= 16 par j= 0, 1, 2, 3. Determinācijas koeficients r= 0,486 norāda, ka 48,6% no variācijas plkst pirmo trīs galveno komponentu ietekmes dēļ.

Vienādojumu (53.42) raksturo vidējā relatīvā tuvinājuma kļūda = 9,99% un atlikušā dispersija s 2 = 1,91.

Galveno komponentu (53.42) regresijas vienādojumam ir nedaudz labākas tuvināšanas īpašības, salīdzinot ar regresijas modeli (53.23), pamatojoties uz sākotnējiem rādītājiem: r= 0,486 > r= 0,469; = 9,99% < (X) = 10,5% un s 2 (f) = 1,91 < s 2 (x) = 1.97. Turklāt vienādojumā (53.42) galvenās sastāvdaļas ir lineārās funkcijas visi sākotnējie rādītāji, savukārt vienādojums (53.23) ietver tikai divus mainīgos ( x 1 Un x 4). Vairākos gadījumos ir jāņem vērā, ka modeli (53.42) ir grūti interpretēt, jo tas ietver trešo galvenā sastāvdaļa f 3, kuru neesam interpretējuši un kuru devums sākotnējo rādītāju kopējā izkliedē ( x 1, ..., x 5) ir tikai 8,6%. Tomēr izņēmums f 3 no vienādojuma (53.42) būtiski pasliktina modeļa tuvinātās īpašības: r= 0,349; = 12,4% un s 2(f) = 2,41. Tad kā ienesīguma regresijas modeli ieteicams izvēlēties vienādojumu (53.23).

Klasteru analīze

IN statistikas pētījumi primāro datu grupēšana ir galvenais risinājuma paņēmiens klasifikācijas problēmas, un līdz ar to pamats visam turpmākajam darbam ar savākto informāciju.

Tradicionāli šī problēma tiek atrisināta šādi. No daudzajām pazīmēm, kas raksturo objektu, tiek atlasīta viena, no pētnieka viedokļa informatīvākā, un dati tiek sagrupēti atbilstoši šīs pazīmes vērtībām. Ja ir nepieciešams veikt klasifikāciju, pamatojoties uz vairākiem kritērijiem, kas sarindoti savā starpā pēc svarīguma pakāpes, tad vispirms tiek veikta klasifikācija pēc pirmā raksturlieluma, pēc tam katra no iegūtajām klasēm tiek sadalīta apakšklasēs atbilstoši otrajam raksturlielumam. utt. Lielākā daļa kombinēto statistisko grupu tiek veidotas līdzīgā veidā.

Gadījumos, kad nav iespējams sakārtot klasifikācijas raksturlielumus, tiek izmantota vienkāršākā daudzdimensiju grupēšanas metode - integrālā rādītāja (indeksa) izveidošana, funkcionāli atkarīga no sākotnējiem raksturlielumiem, kam seko klasifikācija pēc šī rādītāja.

Šīs pieejas attīstība ir klasifikācijas iespēja, kuras pamatā ir vairāki vispārīgi rādītāji (galvenās sastāvdaļas), kas iegūti, izmantojot faktoru vai komponentu analīzes metodes.

Ja ir vairākas pazīmes (sākotnējā vai vispārinātā), klasifikācijas problēmu var atrisināt ar klasteru analīzes metodēm, kas no citām daudzdimensionālajām klasifikācijas metodēm atšķiras ar apmācību paraugu neesamību, t.i. a priori informācija par iedzīvotāju sadalījumu.

Atšķirības starp klasifikācijas problēmas risināšanas shēmām lielā mērā nosaka tas, kas tiek saprasts ar jēdzieniem “līdzība” un “līdzības pakāpe”.

Pēc darba mērķa formulēšanas ir dabiski mēģināt noteikt kvalitātes kritērijus, mērķa funkciju, kuras vērtības ļaus salīdzināt dažādas shēmas klasifikācijas.

Ekonomiskajos pētījumos mērķa funkcija, kā likums, ir jāsamazina daži parametri, kas noteikti objektu kopai (piemēram, aprīkojuma klasifikācijas mērķis var būt grupēšana, kas samazina kopējās laika un naudas izmaksas remontdarbiem).

Gadījumos, kad nav iespējams formalizēt uzdevuma mērķi, klasifikācijas kvalitātes kritērijs var būt atrasto grupu jēgpilnas interpretācijas iespēja.

Apskatīsim šādu problēmu. Ļaujiet komplektu izpētīt P objekti, no kuriem katrs ir raksturots k izmērītās zīmes. Šis kopums ir jāsadala grupās (klasēs), kas noteiktā nozīmē ir viendabīgas. Tajā pašā laikā praktiski nav a priori informācijas par izplatīšanas būtību k- dimensiju vektors X klasēs.

Sadalīšanas rezultātā iegūtās grupas parasti sauc par klasteriem* (taksiem**, attēliem), metodes to atrašanai sauc par klasteru analīzi (attiecīgi skaitliskā taksonomija vai modeļu atpazīšana ar pašmācību).

* Klasteris(angļu val.) - elementu grupa, ko raksturo kāds kopīgs īpašums.

**Tahop(angļu val.) - jebkuras kategorijas sistemātiska grupa.

Jau pašā sākumā ir skaidri jāsaprot, kura no divām klasifikācijas problēmām ir risināma. Ja tiek atrisināta parastā mašīnrakstīšanas problēma, tad novērojumu kopa tiek sadalīta salīdzinoši nelielā skaitā grupēšanas apgabalu (piemēram, intervāls variāciju sērija viendimensionālu novērojumu gadījumā), lai viena šāda apgabala elementi būtu pēc iespējas tuvāk viens otram.

Citas problēmas risinājums ir noteikt novērojumu rezultātu dabisko noslāņošanos skaidri definētās klasteros, kas atrodas noteiktā attālumā viens no otra.

Ja pirmajai tipifikācijas problēmai vienmēr ir risinājums, tad otrajā gadījumā var izrādīties, ka novērojumu kopa neuzrāda dabisku noslāņošanos klasteros, t.i. veido vienu kopu.

Lai gan daudzas klasteru analīzes metodes ir diezgan elementāras, lielākā daļa darbu, kurā tās tika ierosinātas, aizsākās pagājušajā desmitgadē. Tas tiek skaidrots ar efektīvs risinājums klasteru meklēšanas uzdevumi, kas prasa veikt lielu skaitu aritmētisko un loģiskās operācijas, kļuva iespējams tikai līdz ar datortehnoloģiju parādīšanos un attīstību.

Parastā sākotnējo datu attēlošanas forma klasteru analīzes problēmās ir matrica

katra rinda attēlo mērījumu rezultātus k aplūkotās zīmes kādā no apskatāmajiem objektiem. Konkrētās situācijās var interesēt gan objektu grupēšana, gan pazīmju grupēšana. Gadījumos, kad atšķirība starp šiem diviem uzdevumiem nav būtiska, piemēram, aprakstot dažus algoritmus, izmantosim tikai terminu “objekts”, iekļaujot šajā jēdzienā terminu “iezīme”.

Matrica X nav vienīgais veids, kā sniegt datus klasteru analīzes problēmās. Dažreiz sākotnējā informācija tiek sniegta kvadrātveida matricas veidā

elements r ij kas nosaka tuvuma pakāpi i-th iebilst pret j-mu.

Lielākā daļa klasteru analīzes algoritmu pilnībā balstās uz attālumu (vai tuvuma) matricu vai prasa tās atsevišķu elementu aprēķinu, tādēļ, ja dati tiek parādīti formā X, tad pirmais klasteru meklēšanas problēmas risināšanas posms būs attāluma jeb tuvuma aprēķināšanas metodes izvēle starp objektiem vai pazīmēm.

Jautājumu par raksturlielumu tuvuma noteikšanu ir nedaudz vieglāk atrisināt. Parasti pazīmju kopu analīzei ir tādi paši mērķi kā faktoru analīze: savstarpēji saistītu pazīmju grupu identificēšana, kas atspoguļo noteiktu pētāmo objektu aspektu. Tuvuma mēraukla šajā gadījumā ir dažāda statistiskie koeficienti komunikācijas.


Saistītā informācija.


Faktori, kas ir kolineāri...

Un kolineārs.

4. Modelī daudzkārtēja regresija pāru korelācijas koeficientu matricas determinants starp faktoriem , un ir tuvu nullei. Tas nozīmē, ka faktori , un ... faktoru daudzkolinearitāte.

5. Ekonometriskajam modelim lineārais vienādojums tipa daudzkārtējai regresijai, tika izveidota pāru koeficientu matrica lineārā korelācija (y- atkarīgais mainīgais; x (1),x (2), x (3), x (4)– neatkarīgi mainīgie):


Kolineāri (cieši saistīti) neatkarīgi (skaidrojošie) mainīgie navx(2) Un x (3)

1. Dota sākotnējo datu tabula ekonometriskās regresijas modeļa konstruēšanai:

Dummy mainīgie nav

darba pieredze

darba ražīgums

2. Pētot gaļas patēriņa atkarību no patērētāja ienākumu līmeņa un dzimuma, varam ieteikt...

izmantojiet fiktīvu mainīgo – patērētāja dzimumu

sadalīt iedzīvotājus divās daļās: patērētājiem sievietēm un patērētājiem vīriešiem

3. Mēs pētām dzīvokļa cenas atkarību ( plkst) no viņas dzīvojamās zonas ( X) un mājas veids. Modelis ietver fiktīvus mainīgos lielumus, kas atspoguļo aplūkojamo māju veidus: monolīta, paneļu, ķieģeļu. Tika iegūts regresijas vienādojums: ,
Kur ,
Īpaši regresijas vienādojumi ķieģeļiem un monolītiem ir ...

mājas tipa ķieģeļiem

mājas tipam monolīta

4. Analizējot rūpniecības uzņēmumiem trīs reģionos (Mari El Republika, Čuvašijas Republika, Tatarstānas Republika) tika izveidoti trīs daļējas regresijas vienādojumi:

Mari El Republikai;

par Čuvašijas Republiku;

Tatarstānas Republikai.

Norādiet fiktīvo mainīgo veidu un vienādojumu ar fiktīviem mainīgajiem, kas vispārina trīs daļējas regresijas vienādojumus.

5. Ekonometrikā parasti tiek uzskatīts fiktīvais mainīgais...

mainīgais, kam ir vērtības 0 un 1

kvantitatīvi aprakstot kvalitatīvu raksturlielumu

1. Iedzīvotāju vidējo monetāro ienākumu uz vienu iedzīvotāju (RUB, RUB) atkarības regresijas modelim plkst) no reģionālā kopprodukta apjoma (tūkst. rubļu, x 1) un bezdarba līmenis mācību priekšmetā (%, x 2) tiek iegūts vienādojums. Mainīgā lieluma regresijas koeficienta vērtība x 2 norāda, ka, mainoties bezdarba līmenim par 1%, vidējie naudas ienākumi uz vienu iedzīvotāju ir ______ rubļi ar nemainīgu reģionālā kopprodukta vērtību.

mainīsies uz (-1,67)

2. Lineārās daudzkārtējās regresijas vienādojumā: , kur ir pamatlīdzekļu izmaksas (tūkstoši rubļu); – darbinieku skaits (tūkst. cilvēku); y- apjoms rūpnieciskā ražošana(tūkstoš rubļu) parametrs ar mainīgo x 1, vienāds ar 10,8, nozīmē, ka, palielinoties pamatlīdzekļu apjomam par _____, rūpnieciskās ražošanas apjoms _____ ar nemainīgu darbinieku skaitu.


par 1 tūkstoti rubļu. ... pieaugs par 10,8 tūkstošiem rubļu.

3. Zināms, ka atkarīgā mainīgā atlikušās dispersijas daļa tā kopējā dispersijā ir 0,2. Tad determinācijas koeficienta vērtība ir ... 0,8

4. Tika izveidots ekonometriskais modelis peļņas atkarībai no produkcijas vienības pārdošana (rub., plkst) no uzņēmuma apgrozāmā kapitāla summas (tūkst. rubļu, x 1): . Tāpēc vidējais izmērs peļņa no pārdošanas, kas nav atkarīga no uzņēmuma apgrozāmā kapitāla apjoma, ir _____ rubļi. 10.75

5. F-statistika tiek aprēķināta kā ______ dispersijas attiecība pret ________ dispersiju, kas aprēķināta katrai brīvības pakāpei. faktoriāls...atlikušais

1. Ekonometriskās regresijas vienādojuma modelim modeļa kļūdu definē kā ______ starp atkarīgā mainīgā faktisko vērtību un tā aplēsto vērtību. Atšķirība

2. Daudzums tiek saukts... nejauša sastāvdaļa

3. Regresijas vienādojuma ekonometriskajā modelī atkarīgā mainīgā faktiskās vērtības novirze no tā aprēķinātās vērtības raksturo ... modeļa kļūdu.

4. Ir zināms, ka izskaidrotās dispersijas daļa kopējā dispersijā ir 0,2. Tad determinācijas koeficienta vērtība ir ... 0,2

5. Ar metodi mazākie kvadrāti pāru vienādojumu parametri lineārā regresija tiek noteiktas no nosacījuma ______ atlikumiem. samazinot kvadrātu summu

1. Lai noteiktu autokorelāciju atlikumos, izmantojiet...

Durbina-Vatsona statistika

2. Ir zināms, ka pirmās kārtas atlikuma autokorelācijas koeficients vienāds ar –0,3. Ir dotas arī Durbina – Vatsona statistikas kritiskās vērtības noteiktam parametru skaitam ar nezināmu novērojumu skaitu, . Pamatojoties uz šiem raksturlielumiem, mēs varam secināt, ka... atlieku autokorelācijas nav

1. Aprēķināt pāru korelācijas koeficientu matricu; analizēt iegūtā raksturlieluma savienojuma tuvumu un virzienu Y ar katru faktoru X; aplēse statistiskā nozīme korelācijas koeficienti r(Y,X i); izvēlēties informatīvāko faktoru.

2. Konstruēt pāru regresijas modeli ar informatīvāko faktoru; sniegt regresijas koeficienta ekonomisko interpretāciju.

3. Novērtējiet modeļa kvalitāti, izmantojot vidējo relatīvo aproksimācijas kļūdu, determinācijas koeficientu un Fišera F testu (pieņemt nozīmīguma līmeni α=0,05).

4. Ar ticamības varbūtību γ=80%, prognozējiet rādītāja vidējo vērtību Y(faktoru prognozētās vērtības dotas 6. pielikumā). Grafiski parādīt faktiskās un modeļa vērtības Y,prognožu rezultāti.

5. Izmantojot iekļaušanas metodi, uzbūvēt divu faktoru modeļus, saglabājot tajos informatīvāko faktoru; izveidot trīs faktoru modeli ar pilns saraksts faktoriem.

6. Izvēlieties labāko no konstruētajiem vairākiem modeļiem. Sniedziet tā koeficientu ekonomisko interpretāciju.

7. Pārbaudiet vairāku regresijas koeficientu nozīmīgumu, izmantojot t–Studenta ieskaite (akceptēt nozīmības līmeni α=0,05). Vai vairāku modeļu kvalitāte ir uzlabojusies salīdzinājumā ar pārī savienoto modeli?

8. Novērtēt faktoru ietekmi uz rezultātu, izmantojot elastības koeficientus, beta un delta koeficientus.

2. uzdevums. Viendimensiju laikrindas modelēšana

7. pielikumā parādītas laikrindas Y(t) sociāli ekonomiskie rādītāji par Altaja reģions laika posmam no 2000. līdz 2011. gadam. Nepieciešams izpētīt uzdevuma variantam atbilstošā rādītāja dinamiku.

Opcija Indikatora apzīmējums, nosaukums, mērvienība
Y1 Vidējie patēriņa izdevumi uz vienu iedzīvotāju (mēnesī), rub.
Y2 Piesārņojošo vielu emisijas uz atmosfēras gaiss, tūkstoši tonnu
Y3 Vidējās cenas otrreizējā mājokļu tirgū (gada beigās par kvadrātmetru kopējās platības), rubļi
Y4 Maksas pakalpojumu apjoms uz vienu iedzīvotāju, rub
Y5 Vidējais tautsaimniecībā nodarbināto skaits gadā, tūkst. cilvēku
Y6 Pašu vieglo automašīnu skaits uz 1000 iedzīvotājiem (gada beigās), gab
Y7 Vidējie naudas ienākumi uz vienu iedzīvotāju (mēnesī), rub.
Y8 Patēriņa cenu indekss (decembris salīdzinājumā ar iepriekšējā gada decembri), %
Y9 Ieguldījumi pamatlīdzekļos (faktiskajās cenās), miljoni rubļu
Y10 Mazumtirdzniecības apgrozījums uz vienu iedzīvotāju (faktiskajās cenās), rubļi


Darba kārtība

1. Konstruēt lineāru laikrindu modeli, kura parametrus var novērtēt ar mazākajiem kvadrātiem. Izskaidrojiet regresijas koeficienta nozīmi.

2. Novērtēt konstruētā modeļa atbilstību, izmantojot nejaušības, neatkarības un atlikušās komponentes atbilstības īpašības normālā sadalījuma likumam.

3. Novērtējiet modeļa precizitāti, pamatojoties uz aproksimācijas vidējās relatīvās kļūdas izmantošanu.

4. Prognozējiet apskatāmo rādītāju gadam uz priekšu (aprēķiniet prognozes intervālu plkst ticamības varbūtība 70%).

5. Grafiski uzrādīt rādītāja faktiskās vērtības, modelēšanas un prognozēšanas rezultātus.

6. Aprēķināt logaritmisko, polinoma (2. pakāpes polinomu), jaudas, eksponenciālo un hiperbolisko tendenču parametrus. Pamatojoties uz grafisko attēlu un noteikšanas indeksa vērtību, atlasiet visvairāk piemērots izskats tendence.

7. Izmantojot labāko nelineāro modeli, izveidojiet attiecīgā rādītāja punktu prognozi nākamajam gadam. Salīdziniet iegūto rezultātu ar ticamības prognozes intervālu, kas konstruēts, izmantojot lineāro modeli.

PIEMĒRS

Eksekūcijas pārbaudes darbs

1. problēma

Uzņēmums pārdod lietotas automašīnas. Ekonometriskās modelēšanas rādītāju nosaukumi un sākotnējie dati ir parādīti tabulā:

Pārdošanas cena, tūkst.e. ( Y) Jauna auto cena, tūkst.e. ( X1) Kalpošanas laiks, gadi ( X2) Stūre kreisajā pusē - 1, stūre labajā pusē - 0, ( X3)
8,33 13,99 3,8
10,40 19,05 2,4
10,60 17,36 4,5
16,58 25,00 3,5
20,94 25,45 3,0
19,13 31,81 3,5
13,88 22,53 3,0
8,80 16,24 5,0
13,89 16,54 2,0
11,03 19,04 4,5
14,88 22,61 4,6
20,43 27,56 4,0
14,80 22,51 3,3
26,05 31,75 2,3

Nepieciešams:

1. Aprēķināt pāru korelācijas koeficientu matricu; analizēt saiknes ciešumu un virzienu starp iegūto raksturlielumu Y un katru no faktoriem X; novērtēt korelācijas koeficientu r(Y, X i) statistisko nozīmīgumu; izvēlēties informatīvāko faktoru.

Mēs izmantojam Excel (dati / datu analīze / korelācija):

Mēs iegūstam pāru korelācijas koeficientu matricu starp visiem pieejamajiem mainīgajiem:

U X1 X2 X3
U
X1 0,910987
X2 -0,4156 -0,2603
X3 0,190785 0,221927 -0,30308

Analizēsim korelācijas koeficientus starp iegūto raksturlielumu Y un katrs no faktoriem X j:

> 0, tātad starp mainīgajiem Y Un X 1 pastāv tieša korelācija: jo augstāka ir jaunas automašīnas cena, jo augstāka ir pārdošanas cena.

> 0,7 – šī atkarība ir tuvu.

< 0, значит, между переменными Y Un X 2 novērotas

apgrieztā korelācija: automašīnām pārdošanas cena ir zemāka

mobilie tālruņi ar ilgu kalpošanas laiku.

– šī atkarība ir mērena, tuvāk vājai.

> 0, kas nozīmē starp mainīgajiem Y Un X 3 pastāv tieša korelācija: pārdošanas cena ir augstāka automašīnām ar stūri kreisajā pusē.

< 0,4 – эта зависимость слабая.

Lai pārbaudītu atrasto korelācijas koeficientu nozīmīgumu, izmantojam Studenta testu.

Katram korelācijas koeficientam aprēķināsim t-statistika pēc formulas un ievadiet aprēķinu rezultātus atbilstības tabulas papildu kolonnā:

U X1 X2 X3 t-statistika
U
X1 0,910987 7,651524603
X2 -0,4156 -0,2603 1,582847988
X3 0,190785 0,221927 -0,30308 0,673265587

Saskaņā ar Studentu sadalījuma kritisko punktu tabulu nozīmīguma līmenī un mūsu definēto brīvības pakāpju skaitu kritiskā vērtība(1. pielikums vai STUDARASTER funkcija).Y un kalpošanas laiks X 2 ir uzticams.

< , следовательно, коэффициент не является значимым. На основании выборочных данных нет оснований утверждать, что зависимость между ценой реализации Y un stūres rata stāvokli X 3 ir uzticams.

Tādējādi visciešākā un būtiskākā sakarība ir vērojama starp pārdošanas cenu Y un jaunas automašīnas cena X 1 ; faktors X 1 ir visinformatīvākā.

y x (1) x (2) x (3) x (4) x (5)
y 1.00 0.43 0.37 0.40 0.58 0.33
x (1) 0.43 1.00 0.85 0.98 0.11 0.34
x (2) 0.37 0.85 1.00 0.88 0.03 0.46
x (3) 0.40 0.98 0.88 1.00 0.03 0.28
x (4) 0.58 0.11 0.03 0.03 1.00 0.57
x (5) 0.33 0.34 0.46 0.28 0.57 1.00

Pāru korelācijas koeficientu matricas analīze parāda, ka efektīvais rādītājs ir visciešāk saistīts ar rādītāju x(4) - patērētā mēslojuma daudzums uz 1 hektāru ().

Tajā pašā laikā saikne starp atribūtiem-argumentiem ir diezgan cieša. Tādējādi pastāv praktiski funkcionāla sakarība starp riteņtraktoru skaitu ( x(1)) un virsmas apstrādes instrumentu skaitu .

Par multikolinearitātes esamību liecina arī korelācijas koeficienti un . Ņemot vērā ciešo saistību starp rādītājiem x (1) , x(2) un x(3), tikai vienu no tiem var iekļaut ienesīguma regresijas modelī.

Lai parādītu multikolinearitātes negatīvo ietekmi, apsveriet ienesīguma regresijas modeli, iekļaujot visus ievades rādītājus:

F obs = 121.

Vienādojuma koeficientu aplēšu standartnoviržu laboto aplēšu vērtības ir norādītas iekavās .

Regresijas vienādojumā ir parādīti šādi atbilstības parametri: daudzkārtējs determinācijas koeficients; koriģētais atlikušās dispersijas novērtējums, tuvinājuma vidējā relatīvā kļūda un kritērija aprēķinātā vērtība F obs = 121.

Regresijas vienādojums ir nozīmīgs, jo F obs = 121 > F kp = 2,85 atrasts no tabulas F-izdalījumi pie a=0,05; n 1 = 6 un n 2 = 14.

No tā izriet, ka Q¹0, t.i. un vismaz viens no vienādojuma q koeficientiem j (j= 0, 1, 2, ..., 5) nav nulle.

Lai pārbaudītu hipotēzi par individuālo regresijas koeficientu H0 nozīmīgumu: q j =0, kur j=1,2,3,4,5, salīdziniet kritisko vērtību t kp = 2,14, atrasts no tabulas t-sadales nozīmīguma līmenī a=2 J=0,05 un brīvības pakāpju skaits n=14, ar aprēķināto vērtību . No vienādojuma izriet, ka regresijas koeficients ir statistiski nozīmīgs tikai tad, kad x(4) kopš ½ t 4 ½ = 2,90 > t kp = 2,14.



Nav pakļauts ekonomiskai interpretācijai negatīvas pazīmes regresijas koeficienti pie x(1) un x(5) . No koeficientu negatīvajām vērtībām izriet, ka lauksaimniecības piesātinājuma pieaugums ar riteņtraktoriem ( x(1)) un augu veselības produkti ( x(5)) negatīvi ietekmē ražu. Tāpēc iegūtais regresijas vienādojums nav pieņemams.

Lai iegūtu regresijas vienādojumu ar nozīmīgiem koeficientiem, mēs izmantojam soli pa solim algoritms regresijas analīze. Sākotnēji mēs izmantojam soli pa solim algoritmu ar mainīgo lielumu izslēgšanu.

Izslēgsim mainīgo no modeļa x(1) , kas atbilst minimālajai absolūtajai vērtībai ½ t 1 ½ = 0,01. Pārējiem mainīgajiem mēs atkal izveidojam regresijas vienādojumu:

Iegūtais vienādojums ir nozīmīgs, jo F novērotais = 155 > F kp = 2,90, atrasts nozīmības līmenī a = 0,05 un brīvības pakāpju skaitļi n 1 = 5 un n 2 = 15 saskaņā ar tabulu F-izplatīšanu, t.i. vektors q¹0. Tomēr tikai regresijas koeficients pie x(4) . Paredzamās vērtības ½ t j ½ citiem koeficientiem ir mazāks t kr = 2,131, atrasts no tabulas t-sadales pie a=2 J=0,05 un n=15.

Izslēdzot mainīgo no modeļa x(3) , kas atbilst minimālajai vērtībai t 3 = 0,35 un mēs iegūstam regresijas vienādojumu:

(2.9)

Iegūtajā vienādojumā koeficients pie x(5) . Izslēdzot x(5) iegūstam regresijas vienādojumu:

(2.10)

Mēs saņēmām nozīmīgs vienādojums regresijas ar nozīmīgiem un interpretējamiem koeficientiem.

Tomēr iegūtais vienādojums nav vienīgais “labais” un ne “labākais” ienesīguma modelis mūsu piemērā.

Parādīsim to multikolinearitātes nosacījumā efektīvāks ir pakāpenisks algoritms ar mainīgo lielumu iekļaušanu. Pirmais solis ienesīguma modelī y iekļauts mainīgais x(4) , kam ir augstākais korelācijas koeficients ar y, izskaidrots ar mainīgo - r(y,x(4) = 0,58. Otrajā darbībā iekļaujot vienādojumu kopā ar x(4) mainīgie x(1) vai x(3), iegūsim modeļus, kas ekonomisku iemeslu un statistisko raksturlielumu dēļ pārsniedz (2.10):

(2.11)

(2.12)

Jebkura no trim atlikušajiem mainīgajiem iekļaušana vienādojumā pasliktina tā īpašības. Skatiet, piemēram, vienādojumu (2.9).

Tādējādi mums ir trīs “labi” ienesīguma modeļi, no kuriem mums ir jāizvēlas viens ekonomisku un statistisku apsvērumu dēļ.

Autors statistikas kritēriji vispiemērotākais modelis ir (2.11). Tas atbilst minimālajām atlikušās dispersijas vērtībām = 2,26 un vidējai relatīvajai tuvinājuma kļūdai un augstākās vērtības un F obs = 273.

Dažas sliktākais sniegums modelim (2.12) ir atbilstība, un pēc tam modelim (2.10).

Tagad mēs izvēlēsimies labāko no modeļiem (2.11) un (2.12). Šie modeļi atšķiras viens no otra mainīgo lielumu ziņā x(1) un x(3) . Tomēr ienesīguma modeļos mainīgais x(1) (riteņtraktoru skaits uz 100 ha) ir vairāk vēlams nekā mainīgs x(3) (virszemes apstrādes iekārtu skaits uz 100 ha), kas zināmā mērā ir sekundārs (vai atvasināts no x (1)).

Šajā sakarā ekonomisku iemeslu dēļ priekšroka jādod modelim (2.12.). Tādējādi pēc pakāpeniskās regresijas analīzes algoritma ieviešanas ar mainīgo lielumu iekļaušanu un ņemot vērā to, ka vienādojumā ( x (1) , x(2) vai x(3)) izvēlieties galīgo regresijas vienādojumu:

Vienādojums ir nozīmīgs pie a=0,05, jo F obs = 266 > F kp = 3,20, atrasts no tabulas F-sadales pie a= J=0,05; n 1 = 3 un n 2 = 17. Arī visi regresijas koeficienti vienādojumā ½ ir nozīmīgi t j½> t kp(a=2 J=0,05; n=17)=2,11. Regresijas koeficients q 1 jāuzskata par nozīmīgu (q 1 ¹0) ekonomisku iemeslu dēļ, savukārt t 1 = 2,09 tikai nedaudz mazāk t kp = 2,11.

No regresijas vienādojuma izriet, ka traktoru skaita pieaugums uz 100 hektāriem aramzemes (pie fiksētas vērtības) x(4)) rada graudu ražas pieaugumu vidēji par 0,345 c/ha.

Aptuvenais elastības koeficientu e 1 »0,068 un e 2 »0,161 aprēķins parāda, ka, pieaugot rādītājiem x(1) un x(4) par 1%, graudu raža vidēji palielinās attiecīgi par 0,068% un 0,161%.

Vairāki koeficienti noteikšana liecina, ka tikai 46,9% no ražas svārstībām ir izskaidrojami ar modelī iekļautajiem rādītājiem ( x(1) un x(4)), tas ir, augkopības piesātināšana ar traktoriem un mēslošanas līdzekļiem. Pārējās variācijas ir saistītas ar neņemtu faktoru darbību ( x (2) , x (3) , x(5), laika apstākļi utt.). Vidējā aproksimācijas relatīvā kļūda raksturo modeļa adekvātumu, kā arī atlikušās dispersijas vērtību. Interpretējot regresijas vienādojumu, interesantas ir tuvinājuma relatīvo kļūdu vērtības . Atgādināsim, ka - efektīvā rādītāja modeļa vērtība raksturo vidējo ražas vērtību aplūkojamo reģionu kopumam, ar nosacījumu, ka skaidrojošo mainīgo lielumu vērtības. x(1) un x(4) ir fiksēti vienā līmenī, proti x (1) = x i(1) un x (4) = xi(4) . Pēc tam saskaņā ar d vērtībām i Varat salīdzināt reģionus pēc ražas. Jomas, kurām atbilst d vērtības i> 0, raža ir lielāka par vidējo, un d i<0 - ниже среднего.

Mūsu piemērā ražas ziņā augkopība ir visefektīvākā apgabalā, kas atbilst d 7 =28%, kur raža ir par 28% augstāka nekā reģionālais vidējais, un vismazāk efektīva ir apgabalā ar d 20 =-27,3%.


Uzdevumi un vingrinājumi

2.1. No vispārējās populācijas ( y, x (1) , ..., x(p)), kur y ir normāls sadalījuma likums ar nosacīto matemātisko cerību un dispersiju s 2, nejauša izlase n, ļaujiet tam iet ( y i, x i (1) , ..., x i(p)) - rezultāts i novērojums ( i=1, 2, ..., n). Nosakiet: a) vektora mazāko kvadrātu novērtējuma matemātisko cerību q; b) vektora mazāko kvadrātu novērtējuma kovariācijas matrica q; c) novērtējuma matemātiskā cerība.

2.2. Atbilstoši 2.1. uzdevuma nosacījumiem atrodiet regresijas izraisīto noviržu kvadrātu summas matemātisko cerību, t.i. EQ R, Kur

.

2.3. Atbilstoši 2.1. uzdevuma nosacījumiem nosakiet atlikušās variācijas radītās noviržu kvadrātu summas matemātisko cerību attiecībā pret regresijas taisnēm, t.i. EQ ost, kur

2.4. Pierādīt, ka piepildoties hipotēzei H 0: q=0 statistika

ir F sadalījums ar brīvības pakāpēm n 1 =p+1 un n 2 =n-p-1.

2.5. Pierādīt, ka, piepildoties hipotēzei H 0: q j =0, statistikai ir t sadalījums ar brīvības pakāpju skaitu n=n-p-1.

2.6. Pamatojoties uz datiem (2.3. tabula) par lopbarības maizes saraušanās atkarību ( y) par uzglabāšanas ilgumu ( x) atrod nosacītās cerības punktu aplēsi, pieņemot, ka vispārējais regresijas vienādojums ir lineārs.

2.3. tabula.

Nepieciešams: a) atrast atlikušās dispersijas s 2 aplēses, pieņemot, ka vispārējam regresijas vienādojumam ir forma ; b) pārbaudiet pie a=0,05 regresijas vienādojuma nozīmīgumu, t.i. hipotēze H 0: q=0; c) ar ticamību g=0,9 noteikt parametru q 0, q 1 intervāla aplēses; d) ar ticamību g=0,95 nosaka nosacītās matemātiskās cerības intervāla novērtējumu pie X 0 =6; e) pie g=0,95 nosaka prognozes ticamības intervālu punktā X=12.

2.7. Pamatojoties uz datiem par akciju cenu pieauguma tempa dinamiku 5 mēnešos, kas sniegti tabulā. 2.4.

2.4. tabula.

mēneši ( x)
y (%)

un pieņemot, ka vispārējam regresijas vienādojumam ir forma , ir nepieciešams: a) noteikt aplēses gan regresijas vienādojuma parametriem, gan atlikušajai dispersijai s 2 ; b) pārbaudiet pie a=0,01 regresijas koeficienta nozīmīgumu, t.i. hipotēzes H 0: q 1 =0;

c) ar ticamību g=0,95 atrast parametru q 0 un q 1 intervālu aplēses; d) ar ticamību g=0,9 izveido nosacītās matemātiskās cerības intervāla novērtējumu x 0 =4; e) pie g=0,9 nosaka prognozes ticamības intervālu punktā x=5.

2.8. Jaundzīvnieku svara pieauguma dinamikas pētījuma rezultāti doti 2.5.tabulā.

2.5. tabula.

Pieņemot, ka vispārējais regresijas vienādojums ir lineārs, nepieciešams: a) noteikt aplēses gan regresijas vienādojuma parametriem, gan atlikušajai dispersijai s 2 ; b) pārbaudiet pie a=0,05 regresijas vienādojuma nozīmīgumu, t.i. hipotēzes H 0: q=0;

c) ar ticamību g=0,8 atrast parametru q 0 un q 1 intervālu aplēses; d) ar ticamību g=0,98 noteikt un salīdzināt nosacītās matemātiskās cerības intervālu aplēses x 0 = 3 un x 1 =6;

e) pie g=0,98 nosaka prognozes ticamības intervālu punktā x=8.

2.9. Maksa ( y) viens grāmatas eksemplārs atkarībā no tirāžas ( x) (tūkst. eksemplāru) raksturo izdevniecības apkopotie dati (2.6. tabula). Noteikt mazāko kvadrātu aprēķinu un hiperboliskās regresijas vienādojuma parametrus, konstruēt ar ticamību g=0,9 ticamības intervāli parametriem q 0 un q 1, kā arī nosacītā matemātiskā gaida pie x=10.

2.6. tabula.

Nosakiet formas regresijas vienādojuma aplēses un parametrus, pārbaudiet hipotēzi H 0 pie a = 0,05: q 1 = 0 un konstruējiet ticamības intervālus ar ticamību g = 0,9 parametriem q 0 un q 1 un nosacīto matemātisko cerību pie x=20.

2.11. Tabulā 2.8. sniegti dati par šādu makroekonomisko rādītāju pieauguma tempiem (%) n=10 pasaules attīstītās valstis 1992. gadā: NKP - x(1) , rūpnieciskā ražošana - x(2) , cenu indekss - x (3) .

2.8. tabula.

valstis x un regresijas vienādojuma parametri, atlikušās dispersijas novērtējums; b) pārbaudiet pie a=0,05 regresijas koeficienta nozīmīgumu, t.i. H 0: q 1 = 0; c) ar ticamību g=0,9 atrast intervālu aplēses q 0 un q 1; d) pie g = 0,95 atrodiet ticamības intervālu punktā X 0 =x i, Kur i=5; e) salīdzināt regresijas vienādojumu statistiskos raksturlielumus: 1, 2 un 3.

2.12. Atrisiniet 2.11. problēmu, ņemot ( plkst) indekss x(1) , un paskaidrojumam ( X) mainīgais x (3) .

1. Ayvazyan S.A., Mkhitaryan V.S. Lietišķā statistika un ekonometrijas pamati: mācību grāmata. M., VIENOTĪBA, 1998 (2. izdevums, 2001. gads);

2. Ayvazyan S.A., Mkhitaryan V.S. Lietišķā statistika uzdevumos un vingrinājumos: Mācību grāmata. M. VIENOTĪBA - DANA, 2001;

3. Ayvazyan S.A., Enyukov I. S., Meshalkin L.D. Lietišķā statistika. Atkarības izpēte. M., Finanses un statistika, 1985, 487 lpp.;

4. Ayvazyan S.A., Bukhstaber V.M., Enyukov I.S., Meshalkin L.D. Lietišķā statistika. Klasifikācija un izmēru samazināšana. M., Finanses un statistika, 1989, 607 lpp.;

5. Džonstons J. Ekonometriskās metodes, M.: Statistika, 1980, 446 lpp.;

6. Dubrovs A.V., Mhitarjans V.S., Trošins L.I. Daudzfaktoru statistikas metodes. M., Finanses un statistika, 2000;

7. Mhitarjans V.S., Trošins L.I. Atkarību izpēte, izmantojot korelācijas un regresijas metodes. M., MESI, 1995, 120 lpp.;

8. Mhitarjans V.S., Dubrovs A.M., Trošins L.I. Daudzfaktoru statistikas metodes ekonomikā. M., MESI, 1995, 149 lpp.;

9. Dubrovs A.M., Mhitarjans V.S., Trošins L.I. Matemātiskā statistika uzņēmējiem un vadītājiem. M., MESI, 2000, 140 lpp.;

10. Lukašins Ju.I. Regresijas un adaptīvās prognozēšanas metodes: Mācību grāmata, M., MESI, 1997.

11. Lukašins Ju.I. Adaptīvās īstermiņa prognozēšanas metodes. - M., Statistika, 1979.


LIETOJUMI


1.pielikums. Uzdevumu iespējas patstāvīgai datorpētniecībai.

Pāru korelācijas koeficientu matrica ir matrica, kuras elementi ir sapāroti korelācijas koeficienti. Piemēram, trīs mainīgajiem šī matrica izskatās šādi:
- yx 1x 2x 3
y1 r yx1r yx2r yx3
x 1r x1g1 r x1x2r x1x3
x 2r x2gr x2x11 r x2x3
x 3rx3yr x3x1r x3x21

Ievietojiet laukā sapāroto koeficientu matricu.

Piemērs. Saskaņā ar datiem no 154 lauksaimniecības uzņēmumiem Kemerovas apgabalā 2003.gadā, izpētīt graudu ražošanas efektivitāti (13.tabula).

  1. Noteikt lauksaimniecības uzņēmumu graudu rentabilitāti 2003.gadā veidojošos faktorus.
  2. Izveidojiet pāru korelācijas koeficientu matricu. Nosakiet, kuri faktori ir daudzkolineāri.
  3. Izveidojiet regresijas vienādojumu, kas raksturo graudu rentabilitātes atkarību no visiem faktoriem.
  4. Novērtējiet iegūtā regresijas vienādojuma nozīmīgumu. Kādi faktori būtiski ietekmē graudu rentabilitātes veidošanos šajā modelī?
  5. Izvērtēt graudu ražošanas rentabilitāti lauksaimniecības uzņēmumā Nr.3.

Risinājums izmantojot kalkulatoru, iegūstam vairāku regresijas vienādojumu:

1. Regresijas vienādojuma novērtējums.
Noteiksim regresijas koeficientu aplēšu vektoru. Saskaņā ar mazāko kvadrātu metodi vektoru iegūst no izteiksmes:
s = (X T X) -1 X T Y
Matrica X

1 0.43 2.02 0.29
1 0.87 1.29 0.55
1 1.01 1.09 0.7
1 0.63 1.68 0.41
1 0.52 0.3 0.37
1 0.44 1.98 0.3
1 1.52 0.87 1.03
1 2.19 0.8 1.3
1 1.8 0.81 1.17
1 1.57 0.84 1.06
1 0.94 1.16 0.64
1 0.72 1.52 0.44
1 0.73 1.47 0.46
1 0.77 1.41 0.49
1 1.21 0.97 0.88
1 1.25 0.93 0.91
1 1.31 0.91 0.94
1 0.38 2.08 0.27
1 0.41 2.05 0.28
1 0.48 1.9 0.32
1 0.58 1.73 0.38
1 0 0 0

Matrica Y
0.22
0.67
0.79
0.42
0.32
0.24
0.95
1.05
0.99
0.96
0.73
0.52
2.1
0.58
0.87
0.89
0.91
0.14
0.18
0.27
0.37
0

Matrica X T
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
0.43 0.87 1.01 0.63 0.52 0.44 1.52 2.19 1.8 1.57 0.94 0.72 0.73 0.77 1.21 1.25 1.31 0.38 0.41 0.48 0.58 0
2.02 1.29 1.09 1.68 0.3 1.98 0.87 0.8 0.81 0.84 1.16 1.52 1.47 1.41 0.97 0.93 0.91 2.08 2.05 1.9 1.73 0
0.29 0.55 0.7 0.41 0.37 0.3 1.03 1.3 1.17 1.06 0.64 0.44 0.46 0.49 0.88 0.91 0.94 0.27 0.28 0.32 0.38 0

Reizināt matricas, (X T X)
Atrodiet determinantu det(X T X) T = 34,35
Atrodiet apgriezto matricu (X T X) -1
0.6821 0.3795 -0.2934 -1.0118
0.3795 9.4402 -0.133 -14.4949
-0.2934 -0.133 0.1746 0.3204
-1.0118 -14.4949 0.3204 22.7272

Regresijas koeficienta aplēšu vektors ir vienāds ar
s = (X T X) -1 X T Y =
0.1565
0.3375
0.0043
0.2986

Regresijas vienādojums (regresijas vienādojuma novērtējums)
Y = 0,1565 + 0,3375 X 1 + 0,0043 X 2 + 0,2986 X 3

Pāru korelācijas koeficientu matrica

Novērojumu skaits ir n = 22. Neatkarīgo mainīgo skaits modelī ir tieši 3, un regresoru skaits, ņemot vērā vienības vektoru, ir vienāds ar nezināmo koeficientu skaitu. Ņemot vērā zīmi Y, matricas dimensija kļūst vienāda ar 5. Neatkarīgo mainīgo X matricai ir dimensija (22 x 5). Matricu X T X nosaka tiešā reizinot vai ar šādām iepriekš aprēķinātām summām.
Matrica, kas sastāv no Y un X
1 0.22 0.43 2.02 0.29
1 0.67 0.87 1.29 0.55
1 0.79 1.01 1.09 0.7
1 0.42 0.63 1.68 0.41
1 0.32 0.52 0.3 0.37
1 0.24 0.44 1.98 0.3
1 0.95 1.52 0.87 1.03
1 1.05 2.19 0.8 1.3
1 0.99 1.8 0.81 1.17
1 0.96 1.57 0.84 1.06
1 0.73 0.94 1.16 0.64
1 0.52 0.72 1.52 0.44
1 2.1 0.73 1.47 0.46
1 0.58 0.77 1.41 0.49
1 0.87 1.21 0.97 0.88
1 0.89 1.25 0.93 0.91
1 0.91 1.31 0.91 0.94
1 0.14 0.38 2.08 0.27
1 0.18 0.41 2.05 0.28
1 0.27 0.48 1.9 0.32
1 0.37 0.58 1.73 0.38
1 0 0 0 0

Transponētā matrica.
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
0.22 0.67 0.79 0.42 0.32 0.24 0.95 1.05 0.99 0.96 0.73 0.52 2.1 0.58 0.87 0.89 0.91 0.14 0.18 0.27 0.37 0
0.43 0.87 1.01 0.63 0.52 0.44 1.52 2.19 1.8 1.57 0.94 0.72 0.73 0.77 1.21 1.25 1.31 0.38 0.41 0.48 0.58 0
2.02 1.29 1.09 1.68 0.3 1.98 0.87 0.8 0.81 0.84 1.16 1.52 1.47 1.41 0.97 0.93 0.91 2.08 2.05 1.9 1.73 0
0.29 0.55 0.7 0.41 0.37 0.3 1.03 1.3 1.17 1.06 0.64 0.44 0.46 0.49 0.88 0.91 0.94 0.27 0.28 0.32 0.38 0

Matrica A T A.
22 14.17 19.76 27.81 13.19
14.17 13.55 15.91 16.58 10.56
19.76 15.91 23.78 22.45 15.73
27.81 16.58 22.45 42.09 14.96
13.19 10.56 15.73 14.96 10.45

Iegūtajai matricai ir šāda atbilstība:

Atradīsim pāru korelācijas koeficientus.
y un x 1

Vidējās vērtības



Izkliede





Korelācijas koeficients

y un x 2
Vienādojums ir y = ax + b
Vidējās vērtības



Izkliede


Standarta novirze


Korelācijas koeficients

y un x 3
Vienādojums ir y = ax + b
Vidējās vērtības



Izkliede


Standarta novirze


Korelācijas koeficients

Par x 1 un x 2
Vienādojums ir y = ax + b
Vidējās vērtības



Izkliede


Standarta novirze


Korelācijas koeficients

Par x 1 un x 3
Vienādojums ir y = ax + b
Vidējās vērtības



Izkliede


Standarta novirze


Korelācijas koeficients

Par x 2 un x 3
Vienādojums ir y = ax + b
Vidējās vērtības



Izkliede


Standarta novirze


Korelācijas koeficients

Pāru korelācijas koeficientu matrica.
- y x 1 x 2 x 3
y 1 0.62 -0.24 0.61
x 1 0.62 1 -0.39 0.99
x 2 -0.24 -0.39 1 -0.41
x 3 0.61 0.99 -0.41 1

Šīs matricas pirmās rindas analīze ļauj atlasīt faktoru raksturlielumus, kurus var iekļaut daudzkārtējās korelācijas modelī. Faktoru raksturlielumi, kuriem r yxi< 0.5 исключают из модели.
Kolinearitāte ir sakarība starp faktoriem. Par daudzkolinearitātes kritēriju var pieņemt šādas nevienlīdzības:
r(x j y) > r(x k x j) ; r(x k y) > r(x k x j).
Ja kāda no nevienādībām nav izpildīta, tad tiek izslēgts parametrs x k vai x j, kura saistība ar rezultējošo rādītāju Y ir vismazāk cieša.
3. Regresijas vienādojuma parametru analīze.
Pāriesim pie iegūtā regresijas vienādojuma statistiskās analīzes: vienādojuma un tā koeficientu nozīmīguma pārbaude, tuvinājuma absolūto un relatīvo kļūdu izpēte
Lai iegūtu objektīvu dispersijas novērtējumu, mēs veicam šādus aprēķinus:
Neobjektīva kļūda e = Y - X*s ( absolūta kļūda tuvinājums)
-0.18
0.05
0.08
-0.08
-0.12
-0.16
-0.03
-0.24
-0.13
-0.05
0.06
-0.02
1.55
0.01
0.04
0.04
0.03
-0.23
-0.21
-0.15
-0.1
-0.16

s e 2 = (Y - X*s) T (Y - X*s)
Neobjektīvais dispersijas novērtējums ir

Novērtējums standarta novirze vienāds ar

Atradīsim vektora k = a*(X T X) -1 kovariācijas matricas novērtējumu
0.26 0.15 -0.11 -0.39
0.15 3.66 -0.05 -5.61
-0.11 -0.05 0.07 0.12
-0.39 -5.61 0.12 8.8

Modeļa parametru dispersijas nosaka sakarība S 2 i = K ii, t.i. tie ir elementi, kas atrodas uz galvenās diagonāles
Lai paplašinātu regresijas modeļa jēgpilnas analīzes iespējas, tiek izmantoti daļējas elastības koeficienti, kurus nosaka pēc formulas:


Daļējas elastības koeficients E 1< 1. Следовательно, его влияние на результативный признак Y незначительно.

Daļējas elastības koeficients E 2< 1. Следовательно, его влияние на результативный признак Y незначительно.

Daļējas elastības koeficients E 3< 1. Следовательно, его влияние на результативный признак Y незначительно.
Faktoru kopīgās ietekmes ciešumu uz rezultātu novērtē ar daudzkārtējās korelācijas indeksu (no 0 līdz 1)

Saikne starp pazīmi Y un faktoriem X ir mērena
Determinācijas koeficients
R2 = 0,622 = 0,38
tie. 38,0855% gadījumu x izmaiņas izraisa y izmaiņas. Citiem vārdiem sakot, regresijas vienādojuma atlases precizitāte ir vidēja
Korelācijas koeficienta nozīme

Izmantojot Studentu tabulu, mēs atrodam Ttable
T tabula (n-m-1;a) = (18;0,05) = 1,734
Tā kā Tob > Ttabl, mēs noraidām hipotēzi, ka korelācijas koeficients ir vienāds ar 0. Citiem vārdiem sakot, korelācijas koeficients ir statistiski nozīmīgs
Intervāla novērtējums korelācijas koeficientam (uzticamības intervāls)

Korelācijas koeficienta ticamības intervāls
r(0,3882;0,846)
5. Hipotēžu pārbaude par regresijas vienādojuma koeficientiem (pārbaudot daudzkārtējās regresijas vienādojuma parametru nozīmīgumu).
1) t-statistika


Regresijas koeficienta b 0 statistiskā nozīmība nav apstiprināta

Regresijas koeficienta b 1 statistiskā nozīmība nav apstiprināta

Regresijas koeficienta b 2 statistiskā nozīmība nav apstiprināta

Regresijas koeficienta b 3 statistiskā nozīmība nav apstiprināta
Regresijas vienādojuma koeficientu ticamības intervāls
Noteiksim regresijas koeficientu ticamības intervālus, kas ar 95% ticamību būs šādi:
(b i - t i S i ; b i + t i S i)
b 0: (-0,7348;1,0478)
b 1: (-2,9781;3,6531)
b 2: (-0,4466;0,4553)
b 3: (-4,8459;5,4431)

2) F-statistika. Fišera kritērijs


Fkp = 2,93
Kopš F< Fkp, то коэффициент детерминации статистически не значим и уравнение регрессии статистически ненадежно.
6. Heteroskedastiskuma klātbūtnes pārbaude, izmantojot atlikumu grafisko analīzi.
Šajā gadījumā skaidrojošā mainīgā X i vērtības tiek attēlotas pa abscisu asi, un novirzes kvadrāti e i 2 tiek attēloti pa ordinātu asi.

y y(x) e=y-y(x) e 2
0.22 0.4 -0.18 0.03
0.67 0.62 0.05 0
0.79 0.71 0.08 0.01
0.42 0.5 -0.08 0.01
0.32 0.44 -0.12 0.02
0.24 0.4 -0.16 0.03
0.95 0.98 -0.03 0
1.05 1.29 -0.24 0.06
0.99 1.12 -0.13 0.02
0.96 1.01 -0.05 0
0.73 0.67 0.06 0
0.52 0.54 -0.02 0
2.1 0.55 1.55 2.41
0.58 0.57 0.01 0
0.87 0.83 0.04 0
0.89 0.85 0.04 0
0.91 0.88 0.03 0
0.14 0.37 -0.23 0.05
0.18 0.39 -0.21 0.04
0.27 0.42 -0.15 0.02
0.37 0.47 -0.1 0.01
0.16 -0.16 0.02


Jaunums vietnē

>

Populārākais