Mājas Gudrības zobi Pāru lineārās korelācijas koeficientu matrica. Pāru korelācijas koeficientu matricas analīze

Pāru lineārās korelācijas koeficientu matrica. Pāru korelācijas koeficientu matricas analīze

Sākotnēji modelī plkst ietver visas galvenās sastāvdaļas (aprēķinātās vērtības ir norādītas iekavās t-kritēriji):

Modeļa kvalitāti raksturo: daudzkārtējs determinācijas koeficients r = 0,517, vidējā relatīvā tuvinājuma kļūda = 10,4%, atlikušā dispersija s 2= 1,79 un F novērojams = 121. Sakarā ar to, ka F obs > F kr = 2,85 pie α = 0,05, v 1 = 6, v 2= 14, regresijas vienādojums ir nozīmīgs un vismaz viens no regresijas koeficientiem - β 1, β 2, β 3, β 4 - nav vienāds ar nulli.

Ja regresijas vienādojuma nozīme (hipotēze H 0:β 1 = β 2 = β 3 = β 4 = 0 tika pārbaudīts pie α = 0,05, tad regresijas koeficientu nozīmīgums, t.i. hipotēzes H0: β j = 0 (j = 1, 2, 3, 4), jātestē ar nozīmīguma līmeni, kas lielāks par 0,05, piemēram, pie α = 0.1. Tad pie α = 0,1, v= 14 magnitūdas t kr = 1,76, un nozīmīgi, kā izriet no vienādojuma (53,41), ir regresijas koeficienti β 1, β 2, β 3.

Ņemot vērā, ka galvenās sastāvdaļas nav savstarpēji saistītas, mēs varam nekavējoties izslēgt no vienādojuma visus nenozīmīgos koeficientus, un vienādojums iegūs formu

(53.42)

Salīdzinot vienādojumus (53.41) un (53.42), redzam, ka, izslēdzot nenozīmīgus galvenos komponentus f 4 Un f 5, neietekmēja vienādojuma koeficientu vērtības b 0 = 9,52, b 1 = 0,93, b 2 = 0,66 un atbilstošs t j (j = 0, 1, 2, 3).

Tas ir saistīts ar galveno komponentu nekorelāciju. Interesanta ir sākotnējo rādītāju (53.22), (53.23) un galveno komponentu (53.41), (53.42) regresijas vienādojumu paralēle.

Vienādojums (53.42) ir nozīmīgs, jo F obs = 194 > F kr = 3,01, atrasts pie α = 0,05, v 1 = 4, v 2= 16. Nozīmīgi ir arī vienādojuma koeficienti, jo t j > t kr . = 1,746, kas atbilst α = 0,01, v= 16 par j= 0, 1, 2, 3. Determinācijas koeficients r= 0,486 norāda, ka 48,6% no variācijas plkst pirmo trīs galveno komponentu ietekmes dēļ.

Vienādojumu (53.42) raksturo vidējā relatīvā tuvinājuma kļūda = 9,99% un atlikušā dispersija s 2 = 1,91.

Galveno komponentu (53.42) regresijas vienādojumam ir nedaudz labākas tuvināšanas īpašības, salīdzinot ar regresijas modeli (53.23), pamatojoties uz sākotnējiem rādītājiem: r= 0,486 > r= 0,469; = 9,99% < (X) = 10,5% un s 2 (f) = 1,91 < s 2 (x) = 1.97. Turklāt vienādojumā (53.42) galvenās sastāvdaļas ir lineārās funkcijas visi sākotnējie rādītāji, savukārt vienādojums (53.23) ietver tikai divus mainīgos ( x 1 Un x 4). Vairākos gadījumos ir jāņem vērā, ka modeli (53.42) ir grūti interpretēt, jo tas ietver trešo galvenā sastāvdaļa f 3, kuru neesam interpretējuši un kuru devums sākotnējo rādītāju kopējā izkliedē ( x 1, ..., x 5) ir tikai 8,6%. Tomēr izņēmums f 3 no vienādojuma (53.42) būtiski pasliktina modeļa tuvinātās īpašības: r= 0,349; = 12,4% un s 2(f) = 2,41. Tad kā ienesīguma regresijas modeli ieteicams izvēlēties vienādojumu (53.23).

Klasteru analīze

IN statistikas pētījumi primāro datu grupēšana ir galvenais risinājuma paņēmiens klasifikācijas problēmas, un līdz ar to pamats visam turpmākajam darbam ar savākto informāciju.

Tradicionāli šī problēma tiek atrisināta šādi. No daudzajām pazīmēm, kas raksturo objektu, tiek atlasīta viena, no pētnieka viedokļa informatīvākā, un dati tiek sagrupēti atbilstoši šīs pazīmes vērtībām. Ja ir nepieciešams veikt klasifikāciju, pamatojoties uz vairākiem kritērijiem, kas sarindoti savā starpā pēc svarīguma pakāpes, tad vispirms tiek veikta klasifikācija pēc pirmā raksturlieluma, pēc tam katra no iegūtajām klasēm tiek sadalīta apakšklasēs atbilstoši otrajam raksturlielumam. utt. Lielākā daļa kombinēto statistisko grupu tiek veidotas līdzīgā veidā.

Gadījumos, kad nav iespējams sakārtot klasifikācijas raksturlielumus, tiek izmantota vienkāršākā daudzdimensiju grupēšanas metode - integrālā rādītāja (indeksa) izveidošana, funkcionāli atkarīga no sākotnējiem raksturlielumiem, kam seko klasifikācija pēc šī rādītāja.

Šīs pieejas attīstība ir klasifikācijas iespēja, kuras pamatā ir vairāki vispārīgi rādītāji (galvenās sastāvdaļas), kas iegūti, izmantojot faktoru vai komponentu analīzes metodes.

Ja ir vairākas pazīmes (sākotnējā vai vispārinātā), klasifikācijas problēmu var atrisināt ar klasteru analīzes metodēm, kas no citām daudzdimensionālajām klasifikācijas metodēm atšķiras ar apmācību paraugu neesamību, t.i. a priori informācija par iedzīvotāju sadalījumu.

Atšķirības starp klasifikācijas problēmas risināšanas shēmām lielā mērā nosaka tas, kas tiek saprasts ar jēdzieniem “līdzība” un “līdzības pakāpe”.

Pēc darba mērķa formulēšanas ir dabiski mēģināt noteikt kvalitātes kritērijus, mērķa funkciju, kuras vērtības ļaus salīdzināt dažādas shēmas klasifikācijas.

Ekonomiskajos pētījumos mērķa funkcija, kā likums, ir jāsamazina daži parametri, kas noteikti objektu kopai (piemēram, aprīkojuma klasifikācijas mērķis var būt grupēšana, kas samazina kopējās laika un naudas izmaksas remontdarbiem).

Gadījumos, kad nav iespējams formalizēt uzdevuma mērķi, klasifikācijas kvalitātes kritērijs var būt atrasto grupu jēgpilnas interpretācijas iespēja.

Apskatīsim šādu problēmu. Ļaujiet komplektu izpētīt P objekti, no kuriem katrs ir raksturots k izmērītās zīmes. Šis kopums ir jāsadala grupās (klasēs), kas noteiktā nozīmē ir viendabīgas. Tajā pašā laikā praktiski nav a priori informācijas par izplatīšanas būtību k- dimensiju vektors X klasēs.

Sadalīšanas rezultātā iegūtās grupas parasti sauc par klasteriem* (taksiem**, attēliem), metodes to atrašanai sauc par klasteru analīzi (attiecīgi skaitliskā taksonomija vai modeļu atpazīšana ar pašmācību).

* Klasteris(angļu val.) - elementu grupa, ko raksturo kāds kopīgs īpašums.

**Tahop(angļu val.) - jebkuras kategorijas sistemātiska grupa.

Jau pašā sākumā ir skaidri jāsaprot, kura no divām klasifikācijas problēmām ir risināma. Ja tiek atrisināta parastā mašīnrakstīšanas problēma, tad novērojumu kopa tiek sadalīta salīdzinoši nelielā skaitā grupēšanas apgabalu (piemēram, intervāls variāciju sērija viendimensionālu novērojumu gadījumā), lai viena šāda apgabala elementi būtu pēc iespējas tuvāk viens otram.

Citas problēmas risinājums ir noteikt novērojumu rezultātu dabisko noslāņošanos skaidri definētās klasteros, kas atrodas noteiktā attālumā viens no otra.

Ja pirmajai tipifikācijas problēmai vienmēr ir risinājums, tad otrajā gadījumā var izrādīties, ka novērojumu kopa neuzrāda dabisku noslāņošanos klasteros, t.i. veido vienu kopu.

Lai gan daudzas klasteru analīzes metodes ir diezgan elementāras, lielākā daļa darbu, kurā tās tika ierosinātas, aizsākās pagājušajā desmitgadē. Tas tiek skaidrots ar efektīvs risinājums klasteru meklēšanas uzdevumi, kas prasa veikt lielu skaitu aritmētisko un loģiskās operācijas, kļuva iespējams tikai līdz ar datortehnoloģiju parādīšanos un attīstību.

Parastā sākotnējo datu attēlošanas forma klasteru analīzes problēmās ir matrica

katra rinda attēlo mērījumu rezultātus k aplūkotās zīmes kādā no apskatāmajiem objektiem. Konkrētās situācijās var interesēt gan objektu grupēšana, gan pazīmju grupēšana. Gadījumos, kad atšķirība starp šiem diviem uzdevumiem nav būtiska, piemēram, aprakstot dažus algoritmus, izmantosim tikai terminu “objekts”, iekļaujot šajā jēdzienā terminu “iezīme”.

Matrica X nav vienīgais veids, kā sniegt datus klasteru analīzes problēmās. Dažreiz sākotnējā informācija tiek sniegta kvadrātveida matricas veidā

elements r ij kas nosaka tuvuma pakāpi i-th iebilst pret j-mu.

Lielākā daļa klasteru analīzes algoritmu pilnībā balstās uz attālumu (vai tuvuma) matricu vai prasa tās atsevišķu elementu aprēķinu, tādēļ, ja dati tiek parādīti formā X, tad pirmais klasteru meklēšanas problēmas risināšanas posms būs attāluma jeb tuvuma aprēķināšanas metodes izvēle starp objektiem vai pazīmēm.

Jautājumu par raksturlielumu tuvuma noteikšanu ir nedaudz vieglāk atrisināt. Parasti pazīmju kopu analīzei ir tādi paši mērķi kā faktoru analīze: savstarpēji saistītu pazīmju grupu identificēšana, kas atspoguļo noteiktu pētāmo objektu aspektu. Tuvuma mēraukla šajā gadījumā ir dažāda statistiskie koeficienti komunikācijas.


Saistītā informācija.


Lai noteiktu atkarības pakāpi starp vairākiem rādītājiem, tiek izmantoti vairāki korelācijas koeficienti. Pēc tam tie tiek apkopoti atsevišķā tabulā, ko sauc par korelācijas matricu. Šādas matricas rindu un kolonnu nosaukumi ir to parametru nosaukumi, kuru atkarība viena no otras ir noteikta. Rindu un kolonnu krustpunktā atrodas atbilstošie korelācijas koeficienti. Noskaidrosim, kā veikt līdzīgu aprēķinu, izmantojot Excel rīkus.

Sakarības līmeni starp dažādiem rādītājiem ir ierasts noteikt šādi, atkarībā no korelācijas koeficienta:

  • 0 – 0,3 – nav savienojuma;
  • 0,3 – 0,5 – vājš savienojums;
  • 0,5 – 0,7 – vidējais pieslēgums;
  • 0,7 – 0,9 – augsts;
  • 0,9 – 1 – ļoti spēcīgs.

Ja korelācijas koeficients negatīvs, tas nozīmē, ka attiecība starp parametriem ir apgriezta.

Lai programmā Excel izveidotu korelācijas matricu, izmantojiet vienu komplektā iekļauto rīku "Datu analīze". Tā to sauc - "Korelācija". Uzzināsim, kā to var izmantot, lai aprēķinātu vairākus korelācijas rādītājus.

1. darbība: aktivizējiet analīzes pakotni

Uzreiz jāsaka, ka noklusējuma pakotne "Datu analīze" invalīds. Tāpēc, pirms turpināt korelācijas koeficientu tiešās aprēķināšanas procedūru, tā ir jāaktivizē. Diemžēl ne katrs lietotājs zina, kā to izdarīt. Tāpēc mēs pakavēsimies pie šī jautājuma.


Pēc norādītās darbības rīku pakotne "Datu analīze" tiks aktivizēts.

2. posms: koeficienta aprēķināšana

Tagad varat pāriet tieši uz daudzkārtējās korelācijas koeficienta aprēķināšanu. Lai aprēķinātu šo faktoru daudzkārtējās korelācijas koeficientu, izmantosim zemāk esošās tabulas piemēru ar darba ražīguma, kapitāla un darbaspēka attiecības un enerģijas un darbaspēka attiecības rādītājiem dažādos uzņēmumos.


3. posms: iegūtā rezultāta analīze

Tagad izdomāsim, kā saprast rezultātu, ko saņēmām datu apstrādes procesā ar rīku "Korelācija" V Excel programma.

Kā redzams tabulā, kapitāla un darbaspēka attiecības korelācijas koeficients (2. sleja) un enerģijas pieejamība ( 1. aile) ir 0,92, kas atbilst ļoti spēcīgām attiecībām. Starp darba ražīgumu ( 3. aile) un enerģijas pieejamība ( 1. aile) šis rādītājs ir 0,72, kas ir augsta atkarības pakāpe. Korelācijas koeficients starp darba ražīgumu ( 3. aile) un kapitāla un darbaspēka attiecība ( 2. aile) ir vienāds ar 0,88, kas arī atbilst lielai atkarības pakāpei. Tādējādi var teikt, ka saikne starp visiem pētītajiem faktoriem ir diezgan spēcīga.

Kā redzat, iepakojums "Datu analīze" programmā Excel ir ļoti ērts un diezgan viegli lietojams rīks daudzkārtējās korelācijas koeficienta noteikšanai. Ar tās palīdzību jūs varat arī aprēķināt parasto korelāciju starp diviem faktoriem.

Atbilstoši Dienvidu teritorijām federālais apgabals Krievijas Federācija sniedz datus par 2011. gadu

Federālā apgabala teritorijas

Reģionālais kopprodukts, miljardi rubļu, Y

Ieguldījumi pamatlīdzekļos, miljardi rubļu, X1

1. Rep. Adigeja

2. Rep. Dagestāna

3. Rep. Ingušija

4. Kabardas-Balkārijas Republika

5. Rep. Kalmikija

6. Karačajas-Čerkesas Republika

7. Rep. Ziemeļosetija Alānija

8. Krasnodaras apgabals)

9. Stavropoles apgabals

10. Astrahaņas reģions.

11. Volgogradas apgabals.

12. Rostovas apgabals.

  • 1. Aprēķināt pāru korelācijas koeficientu matricu; likme statistiskā nozīme korelācijas koeficienti.
  • 2. Konstruēt korelācijas lauku starp efektīvo raksturlielumu un ar to visciešāk saistīto faktoru.
  • 3. Aprēķiniet lineārās pāru regresijas parametrus katram X faktoram.
  • 4. Novērtējiet katra modeļa kvalitāti, izmantojot determinācijas koeficientu, vidējo aproksimācijas kļūdu un Fišera F testu. Izvēlieties labāko modeli.

būs 80% no tā maksimālās vērtības. Grafiski uzrādīt: faktiskās un modeļa vērtības, prognozes punkti.

  • 6. Izmantojot soli pa solim daudzkārtējo regresiju (izslēgšanas metodi vai iekļaušanas metodi), izveidojiet dzīvokļa cenu veidošanās modeli nozīmīgu faktoru ietekmē. Sniedziet regresijas modeļa koeficientu ekonomisko interpretāciju.
  • 7. Novērtēt uzbūvētā modeļa kvalitāti. Vai modeļa kvalitāte ir uzlabojusies salīdzinājumā ar viena faktora modeli? Novērtēt nozīmīgu faktoru ietekmi uz rezultātu, izmantojot elastības koeficientus, in - un -? koeficienti

Risinot šo problēmu, mēs veiksim aprēķinus un veidosim grafikus un diagrammas, izmantojot Excel datu analīzes iestatījumus.

1. Aprēķiniet pāru korelācijas koeficientu matricu un novērtējiet korelācijas koeficientu statistisko nozīmīgumu.

Dialoglodziņa Korelācija laukā Ievades intervāls ievadiet šūnu diapazonu, kurā ir avota dati. Tā kā esam atlasījuši arī kolonnu virsrakstus, pirmajā rindā atzīmējam izvēles rūtiņu Labels.

Mēs saņēmām šādus rezultātus:

1.1. tabula. Pāru korelācijas koeficientu matrica

Pāru korelācijas koeficientu matricas analīze parāda, ka atkarīgajam mainīgajam Y, t.i., reģionālajam kopproduktam, ir ciešāka saistība ar X1 (ieguldījumi pamatkapitālā). Korelācijas koeficients ir 0,936. Tas nozīmē, ka 93,6% no atkarīgā mainīgā lieluma Y (reģionālais kopprodukts) ir atkarīgi no rādītāja X1 (investīcijas pamatkapitālā).

Korelācijas koeficientu statistisko nozīmīgumu noteiksim, izmantojot Stjudenta t-testu. Mēs salīdzinām tabulas vērtību ar aprēķinātajām vērtībām.

Aprēķināsim tabulas vērtību, izmantojot funkciju STUDISCOVER.

t tabula = 0,129 at ticamības varbūtība vienāds ar 0,9 un brīvības pakāpi (n-2).

Faktors X1 ir statistiski nozīmīgs.

2. Izveidosim korelācijas lauku starp efektīvo atribūtu (reģionālais kopprodukts) un ar to visciešāk saistīto faktoru (ieguldījumi pamatkapitālā)

Lai to izdarītu, mēs izmantosim Excel izkliedes diagrammas rīku.

Rezultātā mēs iegūstam korelācijas lauku reģionālā kopprodukta cenai, miljardiem rubļu. un ieguldījumi pamatlīdzekļos, miljardi rubļu. (1.1. attēls).

1.1.attēls

3. Aprēķināt lineārās pāru regresijas parametrus katram faktoram X

Lai aprēķinātu lineārās pāru regresijas parametrus, mēs izmantosim Regresijas rīku, kas iekļauts datu analīzes iestatījumā.

Dialoglodziņa Regresija laukā Ievades intervāls Y ievadiet tā šūnu diapazona adresi, ko attēlo atkarīgais mainīgais. Laukā

Ievades intervāls X ievadām tā diapazona adresi, kurā ir neatkarīgo mainīgo vērtības. Aprēķināsim faktora X pāru regresijas parametrus.

Par X1 mēs saņēmām šādus 1.2. tabulā sniegtos datus:

1.2. tabula

Regresijas vienādojumam reģionālā kopprodukta cenas atkarībai no ieguldījumiem pamatkapitālā ir šāda forma:

4. Novērtēsim katra modeļa kvalitāti, izmantojot determinācijas koeficientu, vidējo aproksimācijas kļūdu un Fišera F-testu. Noteiksim, kurš modelis ir labākais.

Determinācijas koeficientu, vidējo aproksimācijas kļūdu, ieguvām 3. punktā veikto aprēķinu rezultātā. Iegūtie dati ir parādīti šādās tabulās:

X1 dati:

1.3.a tabula

1.4.b tabula

A) Determinācijas koeficients nosaka, kāda daļa no pazīmes Y variācijas tiek ņemta vērā modelī un ir saistīta ar faktora X ietekmi uz to. Jo lielāka ir determinācijas koeficienta vērtība, jo ciešāka ir sakarība starp īpašības būvē matemātiskais modelis.

Excel attiecas uz R kvadrātu.

Pamatojoties uz šo kritēriju, vispiemērotākais modelis ir reģionālā kopprodukta cenas atkarības no ieguldījumiem pamatkapitālā regresijas vienādojums (X1).

B) Mēs aprēķinām vidējo aproksimācijas kļūdu, izmantojot formulu:

kur skaitītājs ir aprēķināto vērtību novirzes no faktiskajām kvadrātu summa. Tabulās tas atrodas SS kolonnā, rindā Atlikušais.

Vidējo dzīvokļa cenu mēs aprēķinām programmā Excel, izmantojot funkciju AVERAGE. = 24,18182 miljardi rubļu.

Veicot ekonomiskos aprēķinus, modelis tiek uzskatīts par pietiekami precīzu, ja vidējā aproksimācijas kļūda ir mazāka par 5%, modelis tiek uzskatīts par pieņemamu, ja vidējā aproksimācijas kļūda ir mazāka par 15%.

Saskaņā ar šo kritēriju vispiemērotākais ir reģionālā kopprodukta cenas atkarības no ieguldījumiem pamatkapitālā (X1) regresijas vienādojuma matemātiskais modelis.

C) F-tests tiek izmantots, lai pārbaudītu regresijas modeļa nozīmīgumu. Lai to izdarītu, tiek salīdzinātas arī Fišera F testa kritiskās (tabulas) vērtības.

Aprēķinātās vērtības ir norādītas 1.4b tabulā (apzīmētas ar burtu F).

Mēs aprēķināsim Fišera F testa tabulas vērtību programmā Excel, izmantojot funkciju FDIST. Ņemsim varbūtību, kas vienāda ar 0,05. Saņemts: = 4,75

Fišera F testa aprēķinātās vērtības katram faktoram ir salīdzināmas ar tabulas vērtība:

71,02 > = 4,75 modelis ir atbilstošs šim kritērijam.

Analizējot datus pēc visiem trim kritērijiem, varam secināt, ka vislabākais matemātiskais modelis ir izveidots reģionālā kopprodukta faktoram, ko raksturo lineārais vienādojums

5. Izvēlētajam reģionālā kopprodukta cenas atkarības modelim

Rādītāja vidējo vērtību nozīmības līmenī prognozēsim, ja faktora prognozētā vērtība ir 80% no tā maksimālās vērtības. Pasniegsim grafiski: faktiskās un modeļa vērtības, prognožu punkti.

Aprēķināsim X paredzamo vērtību, atbilstoši nosacījumam tā būs 80% no maksimālās vērtības.

Aprēķināsim X max programmā Excel, izmantojot funkciju MAX.

0,8 *52,8 = 42,24

Lai iegūtu atkarīgā mainīgā paredzamos aprēķinus, iegūto neatkarīgā mainīgā vērtību aizstājam lineārajā vienādojumā:

5,07+2,14*42,24 = 304,55 miljardi rubļu.

Nosakīsim prognozes ticamības intervālu, kuram būs šādas robežas:

Lai aprēķinātu ticamības intervāls prognozētajai vērtībai mēs aprēķinām novirzi no regresijas līnijas.

Pārī savienotam regresijas modelim novirzes vērtību aprēķina:

tie. standarta kļūdas vērtība no 1.5a tabulas.

(Tā kā brīvības pakāpju skaits ir vienāds ar vienu, tad saucējs būs vienāds ar n-2). korelācijas pāra regresijas prognoze

Lai aprēķinātu koeficientu, izmantosim Excel funkciju STUDISCOVER, ņemsim varbūtību, kas vienāda ar 0,1, un brīvības pakāpju skaitu 38.

Mēs aprēķinām vērtību ar izmantojot Excel, mēs iegūstam 12294.


Noteiksim intervāla augšējo un apakšējo robežu.

  • 304,55+27,472= 332,022
  • 304,55-27,472= 277,078

Tādējādi prognozētā vērtība = 304,55 tūkstoši dolāru būs starp apakšējo robežu, kas vienāda ar 277,078 tūkstošiem dolāru. Un augšējā robeža, vienāds ar 332,022 miljardiem. Berzēt.

Faktiskās un modeļa vērtības, prognožu punkti grafiski parādīti 1.2.attēlā.


1.2.attēls

6. Izmantojot soli pa solim daudzkārtēju regresiju (eliminācijas metodi), izveidosim reģionālā kopprodukta cenas veidošanās modeli nozīmīgu faktoru ietekmē.

Celtniecībai daudzkārtēja regresija Izmantosim Excel Regresijas funkciju, iekļaujot visus faktorus. Rezultātā iegūstam rezultātu tabulas, no kurām nepieciešams Stjudenta t-tests.

1.8.a tabula

1.8b tabula

1.8c tabula.

Mēs iegūstam šādu modeli:

Tāpēc ka< (4,75 < 71,024), уравнение регрессии следует признать адекватным.

Izvēlēsimies Stjudenta t-testa mazāko absolūto vērtību, tā ir vienāda ar 8,427, salīdzinām ar tabulas vērtību, kuru aprēķinām programmā Excel, ņemsim nozīmīguma līmeni, kas vienāds ar 0,10, brīvības pakāpju skaits n-m-1= 12-4=8: =1,8595

Tā kā 8.427>1.8595 modelis jāuzskata par atbilstošu.

7. Novērtēšanai nozīmīgs faktors iegūto matemātisko modeli, aprēķināt elastības koeficientus un - koeficientus

Elastības koeficients parāda, par cik procentiem mainīsies efektīvais atribūts, ja faktora atribūts mainīsies par 1%.

E X4 = 2,137 * (10,69/24,182) = 0,94%

Tas ir, palielinoties ieguldījumiem pamatkapitālā par 1%, izmaksas vidēji palielinās par 0,94%.

Koeficients parāda, par kādu standartnovirzes daļu mainās atkarīgā mainīgā vidējā vērtība, mainoties neatkarīgajam mainīgajam par vienu standartnovirzi.

2,137* (14.736/33,632) = 0,936.

Standarta novirzes dati tiek ņemti no tabulām, kas iegūtas, izmantojot aprakstošās statistikas rīku.

1.11. tabula Aprakstošā statistika (Y)

1.12. tabula Aprakstošā statistika (X4)

Koeficients nosaka faktora ietekmes daļu visu faktoru kopējā ietekmē:

Lai aprēķinātu pāru korelācijas koeficientus, mēs aprēķinām pāru korelācijas koeficientu matricu programmā Excel, izmantojot korelācijas rīku datu analīzes iestatījumos.

1.14. tabula

(0,93633*0,93626) / 0,87 = 1,00.

Secinājums: No iegūtajiem aprēķiniem varam secināt, ka efektīvajam atribūtam Y (reģionālais kopprodukts) ir liela atkarība no faktora X1 (ieguldījums pamatkapitālā) (par 100%).

Bibliogrāfija

  • 1. Magnuss Y.R., Katiševs P.K., Peresetskis A.A. Ekonometrija. Iesācēju kurss. Apmācība. 2. izd. - M.: Delo, 1998. - lpp. 69-74.
  • 2. Seminārs par ekonometriju: mācību grāmata / I.I. Elisejeva, S.V. Kuriševa, N.M. Gordeenko u.c., 2002. - lpp. 49-105.
  • 3. Dougherty K. Ievads ekonometrikā: Tulk. no angļu valodas - M.: INFRA-M, 1999. - XIV, lpp. 262-285.
  • 4. Ayvyzyan S.A., Mikhtiryan V.S. Lietišķā matemātika un ekonometrijas pamati. -1998., 115.-147.lpp.
  • 5. Krēmers N.Š., Putko B.A. Ekonometrija. -2007. no 175-251.
y x (1) x (2) x (3) x (4) x (5)
y 1.00 0.43 0.37 0.40 0.58 0.33
x (1) 0.43 1.00 0.85 0.98 0.11 0.34
x (2) 0.37 0.85 1.00 0.88 0.03 0.46
x (3) 0.40 0.98 0.88 1.00 0.03 0.28
x (4) 0.58 0.11 0.03 0.03 1.00 0.57
x (5) 0.33 0.34 0.46 0.28 0.57 1.00

Pāru korelācijas koeficientu matricas analīze parāda, ka efektīvais rādītājs ir visciešāk saistīts ar rādītāju x(4) - patērētā mēslojuma daudzums uz 1 hektāru ().

Tajā pašā laikā saikne starp atribūtiem-argumentiem ir diezgan cieša. Tādējādi pastāv praktiski funkcionāla sakarība starp riteņtraktoru skaitu ( x(1)) un virsmas apstrādes instrumentu skaitu .

Par multikolinearitātes esamību liecina arī korelācijas koeficienti un . Ņemot vērā ciešo saistību starp rādītājiem x (1) , x(2) un x(3), in regresijas modelis Tikai viens no tiem var iekļūt ražā.

Lai parādītu multikolinearitātes negatīvo ietekmi, apsveriet ienesīguma regresijas modeli, iekļaujot visus ievades rādītājus:

F obs = 121.

Vienādojuma koeficientu aplēšu standartnoviržu laboto aplēšu vērtības ir norādītas iekavās .

Regresijas vienādojumā ir parādīti šādi atbilstības parametri: daudzkārtējs determinācijas koeficients; koriģētais atlikušās dispersijas novērtējums, tuvinājuma vidējā relatīvā kļūda un kritērija aprēķinātā vērtība F obs = 121.

Regresijas vienādojums ir nozīmīgs, jo F obs = 121 > F kp = 2,85 atrasts no tabulas F-izdalījumi pie a=0,05; n 1 = 6 un n 2 = 14.

No tā izriet, ka Q¹0, t.i. un vismaz viens no vienādojuma q koeficientiem j (j= 0, 1, 2, ..., 5) nav nulle.

Lai pārbaudītu hipotēzi par individuālo regresijas koeficientu H0 nozīmīgumu: q j =0, kur j=1,2,3,4,5, salīdziniet kritiskā vērtība t kp = 2,14, atrasts no tabulas t-sadales nozīmīguma līmenī a=2 J=0,05 un brīvības pakāpju skaits n=14, ar aprēķināto vērtību . No vienādojuma izriet, ka regresijas koeficients ir statistiski nozīmīgs tikai tad, kad x(4) kopš ½ t 4 ½ = 2,90 > t kp =2,14.



Nav pakļauts ekonomiskai interpretācijai negatīvas pazīmes regresijas koeficienti pie x(1) un x(5) . No koeficientu negatīvajām vērtībām izriet, ka lauksaimniecības piesātinājuma pieaugums ar riteņtraktoriem ( x(1)) un augu veselības produkti ( x(5)) negatīvi ietekmē ražu. Tāpēc iegūtais regresijas vienādojums nav pieņemams.

Lai iegūtu regresijas vienādojumu ar nozīmīgiem koeficientiem, mēs izmantojam soli pa solim algoritms regresijas analīze. Sākotnēji mēs izmantojam soli pa solim algoritmu ar mainīgo lielumu izslēgšanu.

Izslēgsim mainīgo no modeļa x(1) , kas atbilst minimālajai absolūtajai vērtībai ½ t 1½ = 0,01. Pārējiem mainīgajiem mēs atkal izveidojam regresijas vienādojumu:

Iegūtais vienādojums ir nozīmīgs, jo F novērotais = 155 > F kp = 2,90, atrasts nozīmības līmenī a = 0,05 un brīvības pakāpju skaitļi n 1 = 5 un n 2 = 15 saskaņā ar tabulu F-izplatīšanu, t.i. vektors q¹0. Tomēr tikai regresijas koeficients pie x(4) . Paredzamās vērtības ½ t j ½ citiem koeficientiem ir mazāks t kr = 2,131, atrasts no tabulas t-sadales pie a=2 J=0,05 un n=15.

Izslēdzot mainīgo no modeļa x(3) , kas atbilst minimālajai vērtībai t 3 = 0,35 un mēs iegūstam regresijas vienādojumu:

(2.9)

Iegūtajā vienādojumā koeficients pie x(5) . Izslēdzot x(5) iegūstam regresijas vienādojumu:

(2.10)

Mēs saņēmām nozīmīgs vienādojums regresijas ar nozīmīgiem un interpretējamiem koeficientiem.

Tomēr iegūtais vienādojums nav vienīgais “labais” un ne “labākais” ienesīguma modelis mūsu piemērā.

Parādīsim to multikolinearitātes nosacījumā efektīvāks ir pakāpenisks algoritms ar mainīgo lielumu iekļaušanu. Pirmais solis ienesīguma modelī y iekļauts mainīgais x(4) , kam ir augstākais korelācijas koeficients ar y, izskaidrots ar mainīgo - r(y,x(4) = 0,58. Otrajā darbībā iekļaujot vienādojumu kopā ar x(4) mainīgie x(1) vai x(3), iegūsim modeļus, kas ekonomisku iemeslu un statistisko raksturlielumu dēļ pārsniedz (2.10):

(2.11)

(2.12)

Jebkura no trim atlikušajiem mainīgajiem iekļaušana vienādojumā pasliktina tā īpašības. Skatiet, piemēram, vienādojumu (2.9).

Tādējādi mums ir trīs “labi” ienesīguma modeļi, no kuriem mums ir jāizvēlas viens ekonomisku un statistisku apsvērumu dēļ.

Pēc statistikas kritērijiem vispiemērotākais ir modelis (2.11). Tas atbilst minimālajām atlikušās dispersijas vērtībām = 2,26 un vidējai relatīvajai tuvinājuma kļūdai un augstākās vērtības un F obs = 273.

Dažas sliktākais sniegums modelim (2.12) ir atbilstība, un pēc tam modelim (2.10).

Tagad mēs izvēlēsimies labāko no modeļiem (2.11) un (2.12). Šie modeļi atšķiras viens no otra mainīgo lielumu ziņā x(1) un x(3) . Tomēr ienesīguma modeļos mainīgais x(1) (riteņtraktoru skaits uz 100 ha) ir vairāk vēlams nekā mainīgs x(3) (virszemes apstrādes iekārtu skaits uz 100 ha), kas zināmā mērā ir sekundārs (vai atvasināts no x (1)).

Šajā sakarā ekonomisku iemeslu dēļ priekšroka jādod modelim (2.12.). Tādējādi pēc pakāpeniskās regresijas analīzes algoritma ieviešanas ar mainīgo lielumu iekļaušanu un ņemot vērā to, ka vienādojumā ( x (1) , x(2) vai x(3)) izvēlieties galīgo regresijas vienādojumu:

Vienādojums ir nozīmīgs pie a=0,05, jo F obs = 266 > F kp = 3,20, atrasts no tabulas F-sadales pie a= J=0,05; n 1 = 3 un n 2 = 17. Arī visi regresijas koeficienti vienādojumā ½ ir nozīmīgi t j½> t kp(a=2 J=0,05; n=17)=2,11. Regresijas koeficients q 1 jāuzskata par nozīmīgu (q 1 ¹0) ekonomisku iemeslu dēļ, savukārt t 1 = 2,09 tikai nedaudz mazāk t kp = 2,11.

No regresijas vienādojuma izriet, ka traktoru skaita pieaugums uz 100 hektāriem aramzemes (pie fiksētas vērtības) x(4)) rada graudu ražas pieaugumu vidēji par 0,345 c/ha.

Aptuvenais elastības koeficientu e 1 »0,068 un e 2 »0,161 aprēķins parāda, ka, pieaugot rādītājiem x(1) un x(4) par 1%, graudu raža vidēji palielinās attiecīgi par 0,068% un 0,161%.

Vairāki koeficienti noteikšana liecina, ka tikai 46,9% no ražas svārstībām ir izskaidrojami ar modelī iekļautajiem rādītājiem ( x(1) un x(4)), tas ir, augkopības piesātināšana ar traktoriem un mēslošanas līdzekļiem. Pārējās variācijas ir saistītas ar neņemtu faktoru darbību ( x (2) , x (3) , x(5), laika apstākļi utt.). Vidējā aproksimācijas relatīvā kļūda raksturo modeļa adekvātumu, kā arī atlikušās dispersijas vērtību. Interpretējot regresijas vienādojumu, interesējošās vērtības ir relatīvās kļūdas tuvinājumi . Atgādināsim, ka - efektīvā rādītāja modeļa vērtība raksturo vidējo ražas vērtību aplūkojamo reģionu kopumam, ar nosacījumu, ka skaidrojošo mainīgo lielumu vērtības. x(1) un x(4) ir fiksēti vienā līmenī, proti x (1) = x i(1) un x (4) = x i(4) . Pēc tam saskaņā ar d vērtībām i Varat salīdzināt reģionus pēc ražas. Jomas, kurām atbilst d vērtības i> 0, raža ir lielāka par vidējo, un d i<0 - ниже среднего.

Mūsu piemērā ražas ziņā augkopība ir visefektīvākā apgabalā, kas atbilst d 7 =28%, kur raža ir par 28% augstāka nekā reģionālais vidējais, un vismazāk efektīva ir apgabalā ar d 20 =-27,3%.


Uzdevumi un vingrinājumi

2.1. No vispārējās populācijas ( y, x (1) , ..., x(p)), kur y ir normāls sadalījuma likums ar nosacīto matemātisko cerību un dispersiju s 2, nejauša izlase n, ļaujiet tam iet ( y i, x i (1) , ..., x i(p)) - rezultāts i novērojums ( i=1, 2, ..., n). Nosakiet: a) vektora mazāko kvadrātu novērtējuma matemātisko cerību q; b) vektora mazāko kvadrātu novērtējuma kovariācijas matrica q; c) novērtējuma matemātiskā cerība.

2.2. Atbilstoši 2.1. uzdevuma nosacījumiem atrodiet regresijas izraisīto noviržu kvadrātu summas matemātisko cerību, t.i. EQ R, Kur

.

2.3. Atbilstoši 2.1. uzdevuma nosacījumiem nosakiet atlikušās variācijas radītās noviržu kvadrātu summas matemātisko cerību attiecībā pret regresijas taisnēm, t.i. EQ ost, kur

2.4. Pierādīt, ka piepildoties hipotēzei H 0: q=0 statistika

ir F sadalījums ar brīvības pakāpēm n 1 =p+1 un n 2 =n-p-1.

2.5. Pierādīt, ka, piepildoties hipotēzei H 0: q j =0, statistikai ir t sadalījums ar brīvības pakāpju skaitu n=n-p-1.

2.6. Pamatojoties uz datiem (2.3. tabula) par lopbarības maizes saraušanās atkarību ( y) par uzglabāšanas ilgumu ( x) atrod nosacītās cerības punktu aplēsi, pieņemot, ka vispārējais regresijas vienādojums ir lineārs.

2.3. tabula.

Nepieciešams: a) atrast atlikušās dispersijas s 2 aplēses, pieņemot, ka vispārējam regresijas vienādojumam ir forma ; b) pārbaudiet pie a=0,05 regresijas vienādojuma nozīmīgumu, t.i. hipotēze H 0: q=0; c) ar ticamību g=0,9 noteikt parametru q 0, q 1 intervāla aplēses; d) ar ticamību g=0,95 nosaka nosacītās matemātiskās cerības intervāla novērtējumu pie X 0 =6; e) pie g=0,95 nosaka prognozes ticamības intervālu punktā X=12.

2.7. Pamatojoties uz datiem par akciju cenu pieauguma tempa dinamiku 5 mēnešos, kas sniegti tabulā. 2.4.

2.4. tabula.

mēneši ( x)
y (%)

un pieņemot, ka vispārējam regresijas vienādojumam ir forma , ir nepieciešams: a) noteikt aplēses gan regresijas vienādojuma parametriem, gan atlikušajai dispersijai s 2 ; b) pārbaudiet pie a=0,01 regresijas koeficienta nozīmīgumu, t.i. hipotēzes H 0: q 1 =0;

c) ar ticamību g=0,95 atrast parametru q 0 un q 1 intervālu aplēses; d) ar ticamību g=0,9 izveido nosacītās matemātiskās cerības intervāla novērtējumu x 0 =4; e) pie g=0,9 nosaka prognozes ticamības intervālu punktā x=5.

2.8. Jaundzīvnieku svara pieauguma dinamikas pētījuma rezultāti doti 2.5.tabulā.

2.5. tabula.

Pieņemot, ka vispārējais regresijas vienādojums ir lineārs, nepieciešams: a) noteikt aplēses gan regresijas vienādojuma parametriem, gan atlikušajai dispersijai s 2 ; b) pārbaudiet pie a=0,05 regresijas vienādojuma nozīmīgumu, t.i. hipotēzes H 0: q=0;

c) ar ticamību g=0,8 atrast parametru q 0 un q 1 intervālu aplēses; d) ar ticamību g=0,98 noteikt un salīdzināt nosacītās matemātiskās cerības intervālu aplēses x 0 = 3 un x 1 =6;

e) pie g=0,98 nosaka prognozes ticamības intervālu punktā x=8.

2.9. Maksa ( y) viens grāmatas eksemplārs atkarībā no tirāžas ( x) (tūkst. eksemplāru) raksturo izdevniecības apkopotie dati (2.6. tabula). Nosakiet mazāko kvadrātu aplēses un parametrus hiperboliskās regresijas vienādojumam ar ticamību g=0,9, konstruējiet ticamības intervālus parametriem q 0 un q 1, kā arī nosacīto cerību pie x=10.

2.6. tabula.

Nosakiet formas regresijas vienādojuma aplēses un parametrus, pārbaudiet hipotēzi H 0 pie a = 0,05: q 1 = 0 un konstruējiet ticamības intervālus ar ticamību g = 0,9 parametriem q 0 un q 1 un nosacīto matemātisko cerību pie x=20.

2.11. Tabulā 2.8. sniegti dati par šādu makroekonomisko rādītāju pieauguma tempiem (%) n=10 pasaules attīstītās valstis 1992. gadā: NKP - x(1) , rūpnieciskā ražošana - x(2) , cenu indekss - x (3) .

2.8. tabula.

valstis x un regresijas vienādojuma parametri, atlikušās dispersijas novērtējums; b) pārbaudiet pie a=0,05 regresijas koeficienta nozīmīgumu, t.i. H 0: q 1 = 0; c) ar ticamību g=0,9 atrast intervālu aplēses q 0 un q 1; d) pie g = 0,95 atrodiet ticamības intervālu punktā X 0 =x i, Kur i=5; e) salīdzināt regresijas vienādojumu statistiskos raksturlielumus: 1, 2 un 3.

2.12. Atrisiniet 2.11. problēmu, ņemot ( plkst) indekss x(1) , un paskaidrojumam ( X) mainīgais x (3) .

1. Ayvazyan S.A., Mkhitaryan V.S. Lietišķā statistika un ekonometrijas pamati: mācību grāmata. M., VIENOTĪBA, 1998 (2. izdevums, 2001. gads);

2. Ayvazyan S.A., Mkhitaryan V.S. Lietišķā statistika uzdevumos un vingrinājumos: Mācību grāmata. M. VIENOTĪBA - DANA, 2001;

3. Ayvazyan S.A., Enyukov I. S., Meshalkin L.D. Lietišķā statistika. Atkarības izpēte. M., Finanses un statistika, 1985, 487 lpp.;

4. Ayvazyan S.A., Bukhstaber V.M., Enyukov I.S., Meshalkin L.D. Lietišķā statistika. Klasifikācija un izmēru samazināšana. M., Finanses un statistika, 1989, 607 lpp.;

5. Džonstons J. Ekonometriskās metodes, M.: Statistika, 1980, 446 lpp.;

6. Dubrovs A.V., Mhitarjans V.S., Trošins L.I. Daudzfaktoru statistikas metodes. M., Finanses un statistika, 2000;

7. Mhitarjans V.S., Trošins L.I. Atkarību izpēte, izmantojot korelācijas un regresijas metodes. M., MESI, 1995, 120 lpp.;

8. Mhitarjans V.S., Dubrovs A.M., Trošins L.I. Daudzfaktoru statistikas metodes ekonomikā. M., MESI, 1995, 149 lpp.;

9. Dubrovs A.M., Mhitarjans V.S., Trošins L.I. Matemātiskā statistika uzņēmējiem un vadītājiem. M., MESI, 2000, 140 lpp.;

10. Lukašins Ju.I. Regresijas un adaptīvās prognozēšanas metodes: Mācību grāmata, M., MESI, 1997.

11. Lukašins Ju.I. Adaptīvās īstermiņa prognozēšanas metodes. - M., Statistika, 1979.


LIETOJUMI


1.pielikums. Uzdevumu iespējas patstāvīgai datorpētniecībai.

Faktori, kas ir kolineāri...

Risinājums:

Abi mainīgie tiek uzskatīti par nepārprotami kolineāriem, t.i. ir lineārās attiecībās savā starpā, ja . Mūsu modelī tikai pāru lineārās regresijas koeficients starp faktoriem un ir lielāks par 0,7. , kas nozīmē, ka faktori ir kolineāri.

4. Daudzkārtējās regresijas modelī pāru korelācijas koeficientu matricas determinants starp faktoriem un ir tuvu nullei. Tas nozīmē, ka faktori un...

daudzkolineārs

neatkarīgs

kvantitatīvi nosakāms

Risinājums:

Lai novērtētu faktoru multikolinearitāti, var izmantot faktoru pāru korelācijas koeficientu matricas determinantu. Ja faktori nav savstarpēji korelēti, tad pāru korelācijas koeficientu matrica starp faktoriem būtu vienība. Tā kā visi nediagonālie elementi būtu vienāds ar nulli.
, jo = = un = = =0.
Ja starp faktoriem pastāv pilnīga lineāra sakarība un visi pāru korelācijas koeficienti ir vienādi ar vienu, tad šādas matricas determinants ir vienāds ar nulli.


Jo tuvāk nullei ir starpfaktoru korelācijas matricas determinants, jo spēcīgāka ir faktoru multikolinearitāte un vairākkārtējas regresijas rezultāti ir neuzticamāki. Un, otrādi, jo tuvāk interfaktoru korelācijas matricas determinants ir vienam, jo ​​mazāka ir faktoru multikolinearitāte.

5. Formas lineāras daudzkārtējas regresijas vienādojuma ekonometriskam modelim pāru lineārās korelācijas koeficientu matrica ( y- atkarīgais mainīgais; x (1),x (2), x (3), x (4)– neatkarīgi mainīgie):


Kolineāri (cieši saistīti) neatkarīgi (skaidrojošie) mainīgie nav

x(2) Un x (3)

x (1) Un x (3)

x (1) Un x (4)

x(2) Un x (4)

Risinājums:

Konstruējot vairākkārtējas regresijas modeli, ir jāizslēdz ciešas lineāras attiecības pastāvēšanas iespēja starp neatkarīgiem (skaidrojošajiem) mainīgajiem, kas noved pie multikolinearitātes problēmas. Šajā gadījumā tiek pārbaudīti lineārās korelācijas koeficienti katram neatkarīgo (skaidrojošo) mainīgo pārim. Šīs vērtības ir atspoguļotas pāru lineārās korelācijas koeficientu matricā. Tiek uzskatīts, ka pāru korelācijas koeficientu klātbūtne starp skaidrojošajiem mainīgajiem, kas absolūtā vērtībā pārsniedz 0,7, atspoguļo ciešu saistību starp šiem mainīgajiem (attiecību tuvums ar mainīgo). yšajā gadījumā netiek ņemts vērā). Šādus neatkarīgus mainīgos sauc par kolineārajiem. Ja skaidrojošo mainīgo pāru korelācijas koeficienta vērtība absolūtā vērtībā nepārsniedz 0,7, tad šādi skaidrojošie mainīgie nav kolineāri. Apskatīsim pāru interfaktoru korelācijas koeficientu vērtības: starp x (1) Un x(2) vērtība ir 0,45; starp x (1) Un x (3)– vienāds ar 0,82; starp x (1) Un x (4)– vienāds ar 0,94; starp x(2) Un x (3)– vienāds ar 0,3; starp x(2) Un x (4)– vienāds ar 0,7; starp x (3) Un x (4)– vienāds ar 0,12. Tādējādi vērtības , , nepārsniedz 0,7. Tāpēc kolineārs nav faktoriem x (1) Un x(2), x(2) Un x (3), x (3) Un x (4). No pēdējiem uzskaitītajiem pāriem atbilžu varianti satur pāri x(2) Un x (3)– šī ir pareizā atbilde. Citiem pāriem: x (1 Un x (3), x (1) Un x (4), x(2) Un x (4)– pāru interfaktoru korelācijas koeficientu vērtības pārsniedz 0,7, un šie faktori ir kolineāri.

3. tēma: fiktīvie mainīgie

1. Dota sākotnējo datu tabula ekonometriskās regresijas modeļa konstruēšanai:

Dummy mainīgie nav

darba pieredze

darba ražīgums

izglītības līmeni

darbinieku kvalifikācijas līmenis

Risinājums:

Konstruējot regresijas modeli, var rasties situācija, kad vienādojumā papildus kvantitatīviem mainīgajiem ir jāiekļauj arī mainīgie, kas atspoguļo kādu atribūtu raksturojumu (dzimums, izglītība, reģions u.c.). Šāda veida kvalitatīvos mainīgos sauc par “fiktīviem” mainīgajiem. Uzdevuma paziņojumā norādītā modeļa konstruēšanai tiek izmantoti fiktīvi mainīgie: darbinieka izglītības līmenis un prasmju līmenis. Citi mainīgie nav fiktīvi, no piedāvātajiem variantiem tie ir darba stāžs un darba ražīgums.

2. Pētot gaļas patēriņa atkarību no patērētāja ienākumu līmeņa un dzimuma, varam ieteikt...

izmantojiet fiktīvu mainīgo – patērētāja dzimumu

sadalīt iedzīvotājus divās daļās: patērētājiem sievietēm un patērētājiem vīriešiem

izmantojiet fiktīvu mainīgo - ienākumu līmeni

izslēgt patērētāja dzimumu, jo šo faktoru nevar izmērīt kvantitatīvi

Risinājums:

Konstruējot regresijas modeli, var rasties situācija, kad vienādojumā papildus kvantitatīviem mainīgajiem ir jāiekļauj arī mainīgie, kas atspoguļo kādu atribūtu raksturojumu (dzimums, izglītība, reģions u.c.). Šāda veida kvalitatīvos mainīgos sauc par “fiktīviem” mainīgajiem. Tie atspoguļo pētāmās statistiskās populācijas neviendabīgumu un tiek izmantoti, lai labāk modelētu atkarības šādos neviendabīgos novērojumu objektos. Modelējot atsevišķas atkarības neviendabīgiem datiem, varat izmantot arī metodi, kas sadala visu neviendabīgo datu kolekciju vairākās atsevišķās kolekcijās, kuru skaits ir vienāds ar fiktīva mainīgā stāvokļu skaitu. Tādējādi pareizās atbilžu iespējas ir: “izmantojiet fiktīvu mainīgo - patērētāja dzimumu” un “sadalīt iedzīvotājus divās daļās: patērētājiem sievietēm un vīriešiem”.

3. Mēs pētām dzīvokļa cenas atkarību ( plkst) no viņas dzīvojamās zonas ( X) un mājas veidu. Modelis ietver fiktīvus mainīgos lielumus, kas atspoguļo aplūkojamo māju veidus: monolīta, paneļu, ķieģeļu. Tika iegūts regresijas vienādojums: ,
Kur ,
Īpaši regresijas vienādojumi ķieģeļiem un monolītiem ir ...

mājas tipa ķieģeļiem

mājas tipam monolīta

mājas tipa ķieģeļiem

mājas tipam monolīta

Risinājums:

Nepieciešams noskaidrot konkrēto regresijas vienādojumu ķieģeļu un monolītajām mājām. Ķieģeļu mājai fiktīvo mainīgo vērtības ir šādas: , . Vienādojumam būs šāda forma: vai mājas tipam: ķieģeļu.
Monolītai mājai fiktīvo mainīgo vērtības ir šādas: , . Vienādojums iegūs formu
vai mājas tipam monolīta.



Jaunums vietnē

>

Populārākais