Mājas Mutes dobums Korelācijas koeficienta ticamība. Tests: Regresijas un korelācijas koeficientu nozīmīguma novērtēšana, izmantojot Stjudenta f-testu

Korelācijas koeficienta ticamība. Tests: Regresijas un korelācijas koeficientu nozīmīguma novērtēšana, izmantojot Stjudenta f-testu

Daži pētnieki, aprēķinājuši korelācijas koeficienta vērtību, pie tā apstājas. Bet no kompetentas eksperimentālās metodoloģijas viedokļa ir jānosaka arī šī koeficienta nozīmīguma līmenis (tas ir, ticamības pakāpe).

Korelācijas koeficienta nozīmīguma līmeni aprēķina, izmantojot kritisko vērtību tabulu. Zemāk ir šīs tabulas fragments, kas ļauj noteikt iegūtā koeficienta nozīmīguma līmeni.

Mēs izvēlamies rindu, kas atbilst izlases lielumam. Mūsu gadījumā n = 10. Šajā rindā mēs atlasām tabulas vērtību, kas ir nedaudz mazāka par empīrisko (vai tieši vienāda ar to, kas ir ārkārtīgi reti). Šis skaitlis treknrakstā ir 0,632. Tas attiecas uz kolonnu ar nozīmīguma līmeni p = 0,05. Tas ir, faktiski empīriskā vērtība ir starp ailes p = 0,05 un p = 0,01, tātad 0,05  p  0,01. Tādējādi mēs noraidām nulles hipotēzi un secinām, ka iegūtais rezultāts (R xy = 0,758) ir nozīmīgs p līmenī< 0,05 (это уровень статистической значимости): R эмп >R cr (lpp< 0,05) H 0 ,  Н 1 ! ст. зн.

Ikdienas valodā to var interpretēt šādi: varam sagaidīt, ka šis savienojuma stiprums izlasē notiks retāk nekā piecos gadījumos no 100, ja šī saistība ir nejaušības sekas.

    1. Regresijas analīze

X(augstums)

Y(svars)

M X = 166,6

M y = 58,3

x = 6 , 54

y = 8 , 34

Regresijas analīze tiek izmantota, lai izpētītu attiecības starp diviem lielumiem, kas izmērīti intervālu skalā. Šāda veida analīze ietver regresijas vienādojuma izveidi, kas ļauj kvantitatīvi aprakstīt viena raksturlieluma atkarību no cita (Pīrsona korelācijas koeficients norāda uz attiecības esamību vai neesamību, bet neapraksta šīs attiecības). Zinot viena rakstura gadījuma vērtību un izmantojot šo vienādojumu, pētnieks ar zināmu varbūtības pakāpi var paredzēt otrā raksturlieluma atbilstošo vērtību. Raksturlielumu lineāro atkarību apraksta ar šāda veida vienādojumu:

y = a +b y * x ,

Kur A - vienādojuma brīvs termins, kas vienāds ar grafika pieaugumu punktā x=0 attiecībā pret abscisu asi, b – regresijas līnijas slīpuma leņķiskais koeficients ir vienāds ar grafika slīpuma leņķa pieskares abscisu asij (ar nosacījumu, ka abu asu vērtību skala ir vienāda).

Zinot pētāmo raksturlielumu vērtības, jūs varat noteikt brīvā termiņa vērtību un regresijas koeficientu, izmantojot šādas formulas:

a =M y b y * M x

Mūsu gadījumā:
;

a = 58,3 – 0,97 * 166,6 = -103,3

Tādējādi formula svara un auguma attiecībai ir šāda: y = 0,969 * x – 103,3

Atbilstošais grafiks ir parādīts zemāk.

Ja nepieciešams aprakstīt saistību starp augumu un svaru ( X no plkst), pēc tam vērtības A Un b kļūst atšķirīgas, un formulas ir attiecīgi jāmaina:

x= a +b x * plkst

a =M x b x * M y

Šajā gadījumā mainās arī grafika izskats.

Regresijas koeficients ir cieši saistīts ar korelācijas koeficientu. Pēdējais ir pazīmju regresijas koeficientu ģeometriskais vidējais:

Korelācijas koeficienta kvadrātu sauc par determinācijas koeficientu. Tās vērtība nosaka mainīgo lielumu savstarpējo ietekmi procentos. Mūsu gadījumā R 2 = 0,76 2 = 0,58 . Tas nozīmē, ka 58% no kopējās Y dispersijas ir izskaidrojami ar mainīgā X ietekmi, atlikušie 42% ir saistīti ar vienādojumā neņemto faktoru ietekmi.

Jāatzīmē, ka patiess rādītājs lineārās attiecības pakāpei starp mainīgajiem ir teorētiskais korelācijas koeficients, kas tiek aprēķināts, pamatojoties uz datiem no visas populācijas (t.i., visiem iespējamās vērtības rādītāji):

Kur - teorētiskais kovariācijas mērs, ko aprēķina kā SV noviržu reizinājumu matemātiskās cerības
Un no viņu matemātiskajām cerībām.

Kā likums, mēs nevaram aprēķināt teorētisko korelācijas koeficientu. Taču no tā, ka izlases koeficients nav vienāds ar nulli
no tā neizriet, ka arī teorētiskais koeficients ir
(t.i., rādītāji var būt lineāri neatkarīgi). Tas. Pamatojoties uz nejaušās izlases datiem, nevar apgalvot, ka starp rādītājiem pastāv saistība.

Izlases korelācijas koeficients ir teorētiskā koeficienta novērtējums, jo to aprēķina tikai daļai mainīgo vērtību.

Vienmēr pastāv korelācijas koeficienta kļūda. Šī kļūda ir neatbilstība starp parauga tilpuma korelācijas koeficientu un korelācijas koeficientu populācijai nosaka pēc formulām:

plkst
; Un
plkst
.

Lineārās korelācijas koeficienta nozīmīguma pārbaude nozīmē pārbaudīt, cik ļoti mēs varam uzticēties izlases datiem.

Šim nolūkam tiek pārbaudīta nulles hipotēze
ka korelācijas koeficienta vērtība vispārējai populācijai ir nulle, t.i. populācijā nav korelācijas. Alternatīva hipotēze ir
.

Lai pārbaudītu šo hipotēzi, mēs aprēķinām - statistika ( -Skolēna t-tests:

.

Kurai ir Studentu sadale ar
brīvības pakāpes 1.

Kritiskā vērtība tiek noteikta no Studentu sadalījuma tabulām
.

Ja aprēķinātā kritērija vērtība
, tad nulles hipotēze tiek noraidīta, tas ir, aprēķinātais korelācijas koeficients ievērojami atšķiras no nulles ar varbūtību
.

Ja
, tad nulles hipotēzi nevar noraidīt. Šajā gadījumā ir iespējams, ka korelācijas koeficienta patiesā vērtība ir nulle, t.i. sakarību starp rādītājiem var uzskatīt par statistiski nenozīmīgu.

1. piemērs. Tabulā parādīti dati par kopējiem ienākumiem par 8 gadiem un galapatēriņa izdevumi .

Izpētīt un izmērīt attiecību ciešumu starp dotajiem rādītājiem.

4. tēma. Pāru lineārā regresija. Mazākā kvadrāta metode

Korelācijas koeficients norāda attiecību ciešuma pakāpi starp diviem raksturlielumiem, taču tas neatbild uz jautājumu, kā viena raksturlieluma izmaiņas par vienu tās dimensijas vienību ietekmē citas pazīmes izmaiņas. Lai atbildētu uz šo jautājumu, tiek izmantotas regresijas analīzes metodes.

Regresijas analīze komplekti formā atkarības starp gadījuma lielumu un mainīgās vērtības
un vērtības
tiek uzskatīti par precīzi norādītiem.

Regresijas vienādojums ir mainīgo lielumu statistiskās attiecības formula.

Ja šī formula ir lineāra, tad mēs runājam par lineārā regresija. Tiek izsaukta divu mainīgo statistiskās attiecības formula pāru regresija(vairāki mainīgie - vairākas).

Atkarības formulas izvēle tiek saukta par specifikācija regresijas vienādojumi. Tiek izsaukta izvēlētās formulas parametru vērtību novērtēšana parametru noteikšana.

Kā novērtēt parametru vērtības un pārbaudīt veikto aplēšu ticamību?

Apskatīsim zīmējumu

    Grafikā (a) attiecības X Un plkst ir tuvu lineārai, taisne 1 šeit ir tuvu novērošanas punktiem un pēdējie no tā novirzās tikai salīdzinoši nelielu nejaušu ietekmju rezultātā.

    Grafiks (b) parāda reālo attiecību starp daudzumiem X Un plkst ir aprakstīta ar nelineāru funkciju 2, un neatkarīgi no tā, kādu taisni mēs zīmēsim (piemēram, 1), punktu novirzes no tās būs negadījuma rakstura.

    Grafikā (c) attiecības starp mainīgajiem X Un plkst trūkst, un jebkuras atkarības formulas parametrizācijas rezultāti būs neveiksmīgi.

Ekonometrisko attiecību analīzes sākumpunkts parasti ir novērtējums lineārā atkarība mainīgie. Jūs vienmēr varat mēģināt novilkt taisni, kas būs “vistuvāk” novērošanas punktiem to kopumā (piemēram, (c) attēlā 1. taisne būs labāka nekā 2. taisne).

Teorētiskais pāru lineārās regresijas vienādojums ir šāda forma:


,

Kur
tiek saukti teorētiskie parametri (teorētiskie koeficienti) regresija; -nejauša novirze(nejauša kļūda).

Kopumā mēs prezentēsim teorētisko modeli kā:

.

Lai noteiktu teorētisko regresijas koeficientu vērtības, ir jāzina visas mainīgo vērtības X Un Y, t.i. visi vispārējā populācija, kas praktiski nav iespējams.

Uzdevums ir šāds: pēc pieejamajiem novērojumu datiem
,
nepieciešams novērtēt parametru vērtības
.

Ļaujiet Aparametru novērtējums
,bparametru novērtējums .

Tad aprēķinātais regresijas vienādojums ir:
,

Kur
atkarīgā mainīgā teorētiskās vērtības y, - novērotās kļūdu vērtības . Šo vienādojumu sauc empīriskās regresijas vienādojums. Mēs to ierakstīsim formā
.

Lineārās regresijas parametru novērtēšanas pamats ir Mazākā kvadrāta metode (MNC) ir lineārās regresijas parametru novērtēšanas metode, kas samazina atkarīgā mainīgā novērojumu kvadrātu noviržu summu no vēlamās lineārās funkcijas.

Funkcija J ir kvadrātiskā funkcija divi parametri a Un b. Jo tas ir nepārtraukts, izliekts un ierobežots zemāk (
), tātad tas sasniedz minimumu. Nepieciešams nosacījums minimuma pastāvēšanai ir tā daļējo atvasinājumu vienādība ar nulli attiecībā uz a Un b:


.

Abus sistēmas vienādojumus dalot ar n, mēs iegūstam:


vai

Pretējā gadījumā jūs varat rakstīt:

Un - to pašu raksturlielumu vērtību standarta novirzes.

Tas. regresijas taisne iet caur punktu ar vidējām vērtībām X Un plkst
, A regresijas koeficients b ir proporcionāls kovariācijas indeksam un koeficientam lineārā korelācija.

Ja bez regresijas Y ieslēgts X tām pašām empīriskajām vērtībām tika atrasts X regresijas vienādojums uz Y (
, Kur
), tad koeficientu reizinājums
:

.

UZ regresijas koeficients  šī ir vērtība, kas parāda, cik dimensijas vienību vērtība mainīsies mainot vērtību uz tās dimensijas vienību. Koeficients tiek noteikts līdzīgi .

Zinātniskajos pētījumos bieži vien ir jāatrod saikne starp iznākuma un faktoru mainīgajiem (ražas raža un nokrišņu daudzums, cilvēka augums un svars homogēnās grupās pēc dzimuma un vecuma, sirdsdarbība un ķermeņa temperatūra utt.).

Otrās ir pazīmes, kas veicina izmaiņas tajās, kas ar tām saistītas (pirmā).

Korelācijas analīzes jēdziens

Ir daudz Pamatojoties uz iepriekš minēto, mēs varam teikt, ka korelācijas analīze ir metode, ko izmanto, lai pārbaudītu hipotēzi par statistiskā nozīme divi vai vairāki mainīgie, ja pētnieks var tos izmērīt, bet nevar mainīt.

Ir arī citas attiecīgā jēdziena definīcijas. Korelācijas analīze ir apstrādes metode, kas ietver mainīgo lielumu korelācijas koeficientu izpēti. Šajā gadījumā tiek salīdzināti korelācijas koeficienti starp vienu vai vairākiem raksturlielumu pāriem, lai noteiktu statistiskās attiecības starp tiem. Korelācijas analīze ir metode, lai pētītu statistisko atkarību starp nejaušiem mainīgajiem ar neobligātu stingras funkcionāla rakstura klātbūtni, kurā viena nejaušā mainīgā dinamika noved pie dinamikas. matemātiskās cerības cits.

Viltus korelācijas jēdziens

Veicot korelācijas analīze jāņem vērā, ka to var veikt saistībā ar jebkuru īpašību kopumu, bieži vien absurdu attiecībā pret otru. Dažreiz viņiem nav cēloņsakarības vienam ar otru.

Šajā gadījumā viņi runā par nepatiesu korelāciju.

Korelācijas analīzes problēmas

Pamatojoties uz augstāk minētajām definīcijām, var formulēt šādus aprakstītās metodes uzdevumus: iegūt informāciju par vienu no meklētajiem mainīgajiem, izmantojot citu; noteikt pētāmo mainīgo attiecību ciešumu.

Korelācijas analīze ietver sakarības noteikšanu starp pētāmajiem raksturlielumiem, tāpēc korelācijas analīzes uzdevumus var papildināt ar sekojošo:

  • faktoru noteikšana, kuriem ir vislielākā ietekme uz iegūto raksturlielumu;
  • iepriekš neizpētītu savienojumu cēloņu noteikšana;
  • korelācijas modeļa konstruēšana ar tā parametru analīzi;
  • komunikācijas parametru nozīmes izpēte un to intervālu novērtējums.

Saistība starp korelācijas analīzi un regresiju

Korelācijas analīzes metode bieži vien neaprobežojas tikai ar pētāmo lielumu attiecības ciešuma noteikšanu. Dažreiz to papildina regresijas vienādojumu apkopošana, kas iegūti, izmantojot tāda paša nosaukuma analīzi, un kas atspoguļo korelācijas atkarību starp iegūto un faktoru (faktoru) raksturlielumu (iezīmēm). Šī metode kopā ar aplūkojamo analīzi veido metodi

Metodes izmantošanas nosacījumi

Efektīvie faktori ir atkarīgi no viena vai vairākiem faktoriem. Korelācijas analīzes metodi var izmantot, ja ir liels novērojumu skaits par efektīvo un faktoru rādītāju (faktoru) vērtību, savukārt pētāmajiem faktoriem jābūt kvantitatīviem un atspoguļotiem konkrētos avotos. Pirmo var noteikt ar parasto likumu - šajā gadījumā korelācijas analīzes rezultāts ir Pīrsona korelācijas koeficienti vai, ja raksturlielumi neatbilst šim likumam, tiek izmantots koeficients. rangu korelācija Spīrmens.

Korelācijas analīzes faktoru izvēles noteikumi

Lietojot šī metode nepieciešams noteikt rezultatīvos rādītājus ietekmējošos faktorus. Tie tiek izvēlēti, ņemot vērā to, ka starp rādītājiem ir jābūt cēloņsakarībām. Daudzfaktoru korelācijas modeļa izveides gadījumā tiek atlasīti tie, kuriem ir būtiska ietekme uz iegūto rādītāju, savukārt korelācijas modelī vēlams neiekļaut savstarpēji atkarīgos faktorus, kuru pāru korelācijas koeficients ir lielāks par 0,85, kā arī tos kuriem saistība ar rezultējamo parametru nav lineāra vai funkcionāla.

Rāda rezultātus

Korelācijas analīzes rezultātus var attēlot teksta un grafiskā formā. Pirmajā gadījumā tie tiek uzrādīti kā korelācijas koeficients, otrajā - izkliedes diagrammas veidā.

Ja starp parametriem nav korelācijas, diagrammas punkti atrodas haotiski, vidējo savienojuma pakāpi raksturo lielāka kārtības pakāpe, un to raksturo vairāk vai mazāk vienmērīgs atzīmēto atzīmju attālums no mediānas. Spēcīgs savienojums mēdz būt taisns, un pie r = 1 punktveida diagramma ir plakana līnija. Reversā korelācija atšķiras grafika virzienā no augšējā kreisā uz apakšējo labo, tiešā korelācija - no apakšējā kreisā uz augšējo labo stūri.

Izkliedes diagrammas 3D attēlojums

Papildus tradicionālajam 2D ​​izkliedes diagrammas displejam tagad tiek izmantots korelācijas analīzes 3D grafiskais attēlojums.

Tiek izmantota arī izkliedes matrica, kas parāda visus pārī savienotos diagrammas vienā attēlā matricas formātā. n mainīgajiem matricā ir n rindas un n kolonnas. Diagramma, kas atrodas i-tās rindas un j-tās kolonnas krustpunktā, ir mainīgo Xi un Xj diagramma. Tādējādi katra rinda un kolonna ir viena dimensija, viena šūna parāda divu dimensiju izkliedes diagrammu.

Savienojuma blīvuma novērtēšana

Korelācijas sakarības ciešumu nosaka korelācijas koeficients (r): stiprs - r = ±0,7 līdz ±1, vidējs - r = ±0,3 līdz ±0,699, vājš - r = 0 līdz ±0,299. Šī klasifikācija nav stingra. Attēlā parādīta nedaudz atšķirīga diagramma.

Korelācijas analīzes metodes izmantošanas piemērs

Apvienotajā Karalistē tika veikts interesants pētījums. Tas ir veltīts saiknei starp smēķēšanu un plaušu vēzi, un tas tika veikts, izmantojot korelācijas analīzi. Šis novērojums ir parādīts zemāk.

Sākotnējie dati korelācijas analīzei

Profesionālā grupa

mirstība

Zemnieki, mežsaimnieki un zvejnieki

Kalnrači un karjeru strādnieki

Gāzes, koksa un ķīmisko vielu ražotāji

Stikla un keramikas ražotāji

Krāšņu, kalumu, lietuvju un velmētavu strādnieki

Elektrības un elektronikas darbinieki

Inženierzinātnes un saistītās profesijas

Kokapstrādes nozares

Ādas apstrādātāji

Tekstilstrādnieki

Darba apģērbu ražotāji

Strādnieki pārtikas, dzērienu un tabakas rūpniecībā

Papīra un drukas ražotāji

Citu preču ražotāji

Būvnieki

Gleznotāji un dekoratori

Stacionāro dzinēju vadītāji, celtņi u.c.

Strādnieki, kas nav iekļauti citur

Transporta un sakaru darbinieki

Noliktavas strādnieki, noliktavas darbinieki, fasētāji un pildīšanas iekārtu strādnieki

Biroja darbinieki

Pārdevēji

Sporta un atpūtas darbinieki

Administratori un vadītāji

Profesionāļi, tehniķi un mākslinieki

Mēs sākam korelācijas analīzi. Labāk ir sākt risinājumu skaidrības labad ar grafiskā metode, kurai mēs konstruēsim izkliedes diagrammu.

Tas parāda tiešu saikni. Tomēr, pamatojoties tikai uz grafisko metodi, ir grūti izdarīt nepārprotamu secinājumu. Tāpēc mēs turpināsim veikt korelācijas analīzi. Tālāk ir sniegts korelācijas koeficienta aprēķināšanas piemērs.

Izmantojot programmatūru (MS Excel tiks aprakstīts zemāk kā piemērs), mēs nosakām korelācijas koeficientu, kas ir 0,716, kas nozīmē spēcīgu saikni starp pētāmajiem parametriem. Noteiksim iegūtās vērtības statistisko ticamību, izmantojot atbilstošo tabulu, kurai no 25 vērtību pāriem jāatņem 2, kā rezultātā iegūstam 23 un izmantojot šo rindu tabulā atrodam r kritisku p = 0,01 (kopš tie ir medicīniski dati, stingrāka atkarība, citos gadījumos pietiek ar p=0,05), kas šai korelācijas analīzei ir 0,51. Piemērā tika parādīts, ka aprēķinātais r ir lielāks par kritisko r, un korelācijas koeficienta vērtība tiek uzskatīta par statistiski ticamu.

Programmatūras izmantošana, veicot korelācijas analīzi

Aprakstīto statistisko datu apstrādes veidu var veikt, izmantojot programmatūra, jo īpaši MS Excel. Korelācija ietver šādu parametru aprēķināšanu, izmantojot funkcijas:

1. Korelācijas koeficientu nosaka, izmantojot funkciju CORREL (masīvs1; masīvs2). Masīvs1,2 - rezultējošo un faktoru mainīgo vērtību intervāla šūna.

Lineārās korelācijas koeficients tiek saukts arī par Pīrsona korelācijas koeficientu, un tāpēc, sākot ar programmu Excel 2007, varat izmantot funkciju ar tiem pašiem masīviem.

Korelācijas analīzes grafiskais attēlojums programmā Excel tiek veikts, izmantojot paneli “Diagrammas” ar atlasi “Scatter Plot”.

Pēc sākotnējo datu norādīšanas iegūstam grafiku.

2. Pāru korelācijas koeficienta nozīmīguma novērtēšana, izmantojot Stjudenta t-testu. Aprēķināto t kritērija vērtību salīdzina ar šī rādītāja tabulēto (kritisko) vērtību no attiecīgā parametra atbilstošās vērtību tabulas, ņemot vērā norādīto nozīmīguma līmeni un brīvības pakāpju skaitu. Šis novērtējums tiek veikts, izmantojot funkciju STUDISCOVER(varbūtība; brīvības_pakāpes).

3. Pāru korelācijas koeficientu matrica. Analīze tiek veikta, izmantojot datu analīzes rīku, kurā ir atlasīta Korelācija. Pāru korelācijas koeficientu statistiskais novērtējums tiek veikts, salīdzinot to absolūto vērtību ar tabulēto (kritisko) vērtību. Kad aprēķinātais pāru korelācijas koeficients pārsniedz kritisko, mēs, ņemot vērā doto varbūtības pakāpi, varam teikt, ka nulles hipotēze par lineārās attiecības nozīmīgumu netiek noraidīta.

Beidzot

Korelācijas analīzes metodes izmantošana zinātniskajos pētījumos ļauj noteikt attiecības starp dažādi faktori un darbības rādītāji. Jāņem vērā, ka augstu korelācijas koeficientu var iegūt no absurda datu pāra vai kopas, un tāpēc šis tips analīze jāveic pietiekami lielam datu masīvam.

Pēc r aprēķinātās vērtības iegūšanas vēlams to salīdzināt ar kritisko r, lai apstiprinātu noteiktas vērtības statistisko ticamību. Korelācijas analīzi var veikt manuāli, izmantojot formulas, vai izmantojot programmatūru, jo īpaši MS Excel. Šeit var izveidot arī izkliedes diagrammu, lai vizuāli attēlotu saistību starp pētītajiem korelācijas analīzes faktoriem un iegūto raksturlielumu.

3. posms. Sakarību atrašana starp datiem

Lineārā korelācija

Parādību saistību izpētes uzdevuma pēdējais posms ir sakarības ciešuma novērtējums, izmantojot korelācijas rādītājus. Šis posms ir ļoti svarīgs, lai noteiktu atkarības starp faktoru un veiktspējas raksturlielumiem, un līdz ar to, lai varētu veikt pētāmās parādības diagnozi un prognozi.

Diagnoze(no grieķu diagnozes atpazīšanas) - objekta vai parādības stāvokļa būtības un īpašību noteikšana, pamatojoties uz tā visaptverošu izpēti.

Prognoze(no grieķu prognosis foresight, prognoze) - jebkura konkrēta prognoze, spriedums par jebkuras parādības stāvokli nākotnē (laika prognoze, vēlēšanu iznākums utt.). Prognoze ir zinātniski pamatota hipotēze par pētāmās sistēmas, objekta vai parādības iespējamo turpmāko stāvokli un šo stāvokli raksturojošiem rādītājiem. Prognozēšana – prognožu izstrāde, spec Zinātniskie pētījumiīpašas perspektīvas jebkuras parādības attīstībai.

Atcerēsimies korelācijas definīciju:

Korelācija– atkarība starp gadījuma lielumiem, kas izteikta ar to, ka vienas vērtības sadalījums ir atkarīgs no citas vērtības vērtības.

Korelācija tiek novērota ne tikai starp kvantitatīviem, bet arī kvalitatīviem raksturlielumiem. Pastāv dažādi veidi un rādītāji saišu ciešuma novērtēšanai. Mēs apstāsimies tikai plkst lineārā pāra korelācijas koeficients , ko izmanto, ja starp nejaušajiem mainīgajiem pastāv lineāra sakarība. Praksē bieži vien ir nepieciešams noteikt nevienlīdzīgu izmēru gadījuma lielumu savienojuma līmeni, tāpēc ir vēlams, lai šim savienojumam būtu kāda veida bezdimensiju raksturlielums. Šāds raksturlielums (savienojuma mērs) ir lineārās korelācijas koeficients r xy, ko nosaka pēc formulas

Kur , .

Apzīmējot un , mēs varam iegūt šādu izteiksmi korelācijas koeficienta aprēķināšanai

.

Ja mēs ieviešam koncepciju normalizēta novirze , kas izsaka korelēto vērtību novirzi no vidējās standartnovirzes daļās:



tad korelācijas koeficienta izteiksme iegūs formu

.

Ja aprēķina korelācijas koeficientu, pamatojoties uz sākotnējās galīgajām vērtībām nejaušie mainīgie no aprēķinu tabulas, tad korelācijas koeficientu var aprēķināt, izmantojot formulu

.

Lineārās korelācijas koeficienta īpašības:

1). Korelācijas koeficients ir bezizmēra lielums.

2). |r| £1 vai .

3). , a, b= const, – korelācijas koeficienta vērtība nemainīsies, ja visas nejaušo lielumu X un Y vērtības reizina (vai dala) ar konstanti.

4). , a, b= const, – korelācijas koeficienta vērtība nemainīsies, ja visas gadījuma lieluma X un Y vērtības tiek palielinātas (vai samazinātas) par konstanti.

5). Pastāv sakarība starp korelācijas koeficientu un regresijas koeficientu:

Korelācijas koeficientu vērtības var interpretēt šādi:

Kvantitatīvie kritēriji komunikācijas tuvuma novērtēšanai:

Prognozes nolūkos vērtības ar |r| > 0,7.

Korelācijas koeficients ļauj secināt, ka pastāv lineāra sakarība starp diviem gadījuma lielumiem, bet nenorāda, kurš no mainīgajiem izraisa izmaiņas citā. Faktiski saikne starp diviem nejaušiem mainīgajiem var pastāvēt bez cēloņsakarības starp pašām vērtībām, jo abu gadījuma lielumu izmaiņas var izraisīt trešā maiņa (ietekme).

Korelācijas koeficients r xy ir simetrisks attiecībā pret aplūkotajiem nejaušajiem mainīgajiem X Un Y. Tas nozīmē, ka korelācijas koeficienta noteikšanai ir pilnīgi vienaldzīgi, kurš no lielumiem ir neatkarīgs un kurš ir atkarīgs.

Korelācijas koeficienta nozīme

Pat priekš neatkarīgie daudzumi korelācijas koeficients var atšķirties no nulles mērījumu rezultātu nejaušas izkliedes vai nelielas nejaušo mainīgo izlases dēļ. Tāpēc ir jāpārbauda korelācijas koeficienta nozīmīgums.

Lineārās korelācijas koeficienta nozīmīgums tiek pārbaudīts, pamatojoties uz Studenta t-tests :

.

Ja t > t kr(P,n-2), tad lineārais koeficients korelācija ir nozīmīga, un tāpēc arī statistiskā sakarība ir nozīmīga X Un Y.

.

Aprēķinu atvieglošanai ir izveidotas korelācijas koeficientu ticamības robežu vērtību tabulas dažādi skaitļi brīvības pakāpes f = n–2 (divu zaru tests) un dažādi nozīmīguma līmeņi a= 0,1; 0,05; 0,01 un 0,001. Korelācija tiek uzskatīta par nozīmīgu, ja aprēķinātais korelācijas koeficients pārsniedz korelācijas koeficienta ticamības robežas vērtību dotajam f Un a.

Lielajiem n Un a= 0,01 korelācijas koeficienta ticamības robežas vērtību var aprēķināt, izmantojot aptuveno formulu

.

Ievads. 2

1. Regresijas un korelācijas koeficientu nozīmīguma novērtēšana, izmantojot Stjudenta f-testu. 3

2. Regresijas un korelācijas koeficientu nozīmīguma aprēķins, izmantojot Stjudenta f-testu. 6

Secinājums. 15

Pēc regresijas vienādojuma konstruēšanas nepieciešams pārbaudīt tā nozīmīgumu: izmantojot īpašus kritērijus, noteikt, vai iegūtā atkarība ir izteikts ar vienādojumu regresija, nejauša, t.i. vai to var izmantot prognozēšanai un faktoru analīzei. Statistikā ir izstrādātas metodes, lai stingri pārbaudītu regresijas koeficientu nozīmīgumu, izmantojot dispersijas analīze un speciālo kritēriju aprēķināšana (piemēram, F kritērijs). Brīvo testu var veikt, aprēķinot vidējo relatīvo lineāro novirzi (e), ko sauc vidējā kļūda tuvinājumi:

Tagad pāriesim pie regresijas koeficientu bj nozīmīguma novērtēšanas un ticamības intervāla konstruēšanas regresijas modeļa Ru parametriem (J=l,2,..., p).

5. bloks - regresijas koeficientu nozīmīguma novērtējums, pamatojoties uz Stjudenta ^-testa vērtību. Aprēķinātās ta vērtības tiek salīdzinātas ar pieļaujamo vērtību

5. bloks - regresijas koeficientu nozīmīguma novērtējums, pamatojoties uz ^-kritērija vērtību. Aprēķinātās t0n vērtības tiek salīdzinātas ar pieļaujamo vērtību 4,/, kas noteikta no t sadalījuma tabulām noteiktai kļūdas varbūtībai (a) un brīvības pakāpju skaitam (/).

Papildus visa modeļa nozīmīguma pārbaudei ir nepieciešams pārbaudīt regresijas koeficientu nozīmīgumu, izmantojot Studenta /-testu. Regresijas koeficienta bg minimālajai vērtībai jāatbilst nosacījumam bifob- ^t, kur bi ir regresijas vienādojuma koeficienta vērtība dabiskā mērogā plkst. i-c faktors zīme; ak. - katra koeficienta vidējā kvadrātiskā kļūda. koeficientu D nesalīdzināmība to nozīmīgumā;

Turpmākā statistiskā analīze attiecas uz regresijas koeficientu nozīmīguma pārbaudi. Lai to izdarītu, mēs atrodam regresijas koeficientu ^-kritērija vērtību. To salīdzināšanas rezultātā tiek noteikts mazākais ^-kritērijs. Koeficients, kura koeficients atbilst mazākajam ^-kritērijam, tiek izslēgts no turpmākās analīzes.

Lai novērtētu regresijas un korelācijas koeficientu statistisko nozīmīgumu, Stjudenta t-tests un ticamības intervāli katrs no rādītājiem. Tiek izvirzīta hipotēze par rādītāju nejaušību, t.i. par to nenozīmīgo atšķirību no nulles. Regresijas un korelācijas koeficientu nozīmīguma novērtēšana, izmantojot Stjudenta f-testu, tiek veikta, salīdzinot to vērtības ar nejaušās kļūdas lielumu:

Lai novērtētu tīro regresijas koeficientu nozīmīgumu, izmantojot Studenta /-testu, ir jāaprēķina vērtība

Darba kvalitāte ir konkrēta darbaspēka īpašība, kas atspoguļo tā sarežģītības pakāpi, intensitāti (intensitāti), apstākļus un nozīmi ekonomikas attīstībā. K.t. mēra ar tarifu sistēmas palīdzību, kas ļauj diferencēt algas atkarībā no kvalifikācijas līmeņa (darba sarežģītības), apstākļiem, darba smaguma pakāpes un tā intensitātes, kā arī no atsevišķu nozaru un ražošanas, reģionu, teritoriju nozīmes valsts attīstībā. valsts ekonomika. K.t. atrod izteiksmi algas darba ņēmējiem, kas attīstās darba tirgū piedāvājuma un pieprasījuma ietekmē darbaspēks(specifiski darba veidi). K.t. - sarežģīta struktūra

Iegūtie projekta individuālo ekonomisko, sociālo un vides seku relatīvās nozīmes punkti tālāk dod pamatu alternatīvo projektu un to iespēju salīdzināšanai, izmantojot Ek projekta “komplekso bezdimensiju sociālās un vides-ekonomiskās efektivitātes kritēriju”, kas aprēķināts. (vidējos nozīmīguma rādītājos), izmantojot formulu

Nozares iekšējais regulējums nodrošina darba samaksas atšķirības konkrētajā nozarē strādājošajiem atkarībā no atsevišķu ražošanas veidu nozīmes attiecīgajā nozarē, no sarežģītības un darba apstākļiem, kā arī no izmantotajiem atalgojuma veidiem.

Rezultātā iegūtais analizējamā uzņēmuma reitinga novērtējums attiecībā pret standarta uzņēmumu, neņemot vērā atsevišķu rādītāju nozīmīgumu, ir salīdzinošs. Salīdzinot vairāku uzņēmumu reitingus augstākais vērtējums ir uzņēmums ar iegūtā salīdzinošā novērtējuma minimālo vērtību.

Izpratne par produkta kvalitāti kā tā lietderības mēraukla ir praktiski svarīgs jautājums par tā mērīšanu. Tās risinājums tiek panākts, pētot atsevišķu īpašību nozīmi konkrētas vajadzības apmierināšanā. Pat viena un tā paša īpašuma nozīme var atšķirties atkarībā no produkta patēriņa apstākļiem. Līdz ar to produkta lietderība iekš dažādi apstākļi tā lietojumi ir dažādi.

Otrais darba posms ir statistikas datu izpēte un rādītāju saistību un mijiedarbības noteikšana, atsevišķu faktoru nozīmīguma un vispārējo rādītāju izmaiņu cēloņu noteikšana.

Visi aplūkotie rādītāji ir apvienoti vienā tādā veidā, ka rezultāts ir visu analizēto uzņēmuma darbības aspektu visaptverošs novērtējums, ņemot vērā tā darbības apstākļus, ņemot vērā atsevišķu rādītāju nozīmīguma pakāpi uzņēmumam. dažādi veidi investori:

Regresijas koeficienti parāda faktoru ietekmes intensitāti uz rezultatīvo rādītāju. Ja tiek veikta faktoru rādītāju provizoriska standartizācija, tad b0 ir vienāds ar efektīvā rādītāja vidējo vērtību kopumā. Koeficienti b, b2 ..... bl parāda, par cik vienībām efektīvā rādītāja līmenis atšķiras no tā vidējās vērtības, ja faktoru rādītāja vērtības par vienu novirzās no vidējā, kas vienāda ar nulli. standarta novirze. Tādējādi regresijas koeficienti raksturo atsevišķu faktoru nozīmīguma pakāpi rezultatīvā rādītāja līmeņa paaugstināšanai. Specifiskās regresijas koeficientu vērtības tiek noteiktas no empīriskiem datiem saskaņā ar metodi mazākie kvadrāti(normālvienādojumu sistēmu risināšanas rezultātā).

2. Regresijas un korelācijas koeficientu nozīmīguma aprēķins, izmantojot Stjudenta f-testu.

Apskatīsim daudzfaktoru attiecību lineāro formu ne tikai par vienkāršāko, bet arī par formu, ko nodrošina datoriem paredzētās lietojumprogrammatūras pakotnes. Ja saikne starp atsevišķu faktoru un iegūto atribūtu nav lineāra, tad vienādojums tiek linearizēts, aizstājot vai transformējot faktora atribūta vērtību.

Vispārējā forma daudzfaktoru regresijas vienādojumam ir šāda forma:


kur k ir faktoru raksturlielumu skaits.

Lai vienkāršotu mazāko kvadrātu vienādojumu sistēmu, kas nepieciešama vienādojuma (8.32) parametru aprēķināšanai, parasti tiek ieviestas visu raksturlielumu atsevišķo vērtību novirzes no šo raksturlielumu vidējām vērtībām.

Iegūstam k mazāko kvadrātu vienādojumu sistēmu:

Atrisinot šo sistēmu, mēs iegūstam nosacīti tīrās regresijas koeficientu vērtības b. Vienādojuma brīvo terminu aprēķina pēc formulas


Termins "nosacīti tīrs regresijas koeficients" nozīmē, ka katra no vērtībām bj mēra iegūtā raksturlieluma kopējo vidējo novirzi no tā vidējās vērtības, ja konkrētais faktors xj novirzās no vidējās vērtības par mērvienību un ar nosacījumu, ka citi regresijas vienādojumā iekļautie faktori, fiksēti vidējās vērtībās, nemainās, nemainās.

Tādējādi, atšķirībā no pāra regresijas koeficienta, nosacītais tīrās regresijas koeficients mēra faktora ietekmi, abstrahējoties no šī faktora variācijas attiecības ar citu faktoru variāciju. Ja regresijas vienādojumā būtu iespējams iekļaut visus faktorus, kas ietekmē iegūtā raksturlieluma izmaiņas, tad bj vērtības. var uzskatīt par faktoru tīrās ietekmes mēriem. Bet tā kā vienādojumā tiešām nav iespējams iekļaut visus faktorus, tad koeficienti bj. nav brīvs no vienādojumā neiekļauto faktoru ietekmes sajaukuma.

Regresijas vienādojumā nav iespējams iekļaut visus faktorus viena no trim iemesliem vai tos visus uzreiz, jo:

1) daži faktori var būt nezināmi mūsdienu zinātne, zināšanas par jebkuru procesu vienmēr ir nepilnīgas;

2) nav informācijas par dažiem zināmiem teorētiskiem faktoriem vai tā ir neuzticama;

3) pētāmās populācijas (izlases) lielums ir ierobežots, kas ļauj regresijas vienādojumā iekļaut ierobežotu faktoru skaitu.

Nosacītie tīrās regresijas koeficienti bj. ir nosaukti skaitļi, kas izteikti dažādās mērvienībās un tāpēc nav salīdzināmi viens ar otru. Lai tos pārvērstu salīdzināmos relatīvajos rādītājos, tiek izmantota tāda pati transformācija, kā iegūt pāru korelācijas koeficientu. Iegūto vērtību sauc standartizēts koeficients regresijas vai?-koeficients.


Koeficients xj nosaka faktora xj variācijas ietekmes mēru uz iegūtā raksturlieluma y variāciju, abstrahējoties no citu regresijas vienādojumā iekļauto faktoru vienlaicīgas variācijas.

Nosacīti tīrās regresijas koeficientus ir lietderīgi izteikt relatīvi salīdzināmu savienojuma rādītāju, elastības koeficientu veidā:

Faktora xj elastības koeficients saka, ka tad, kad dotā faktora vērtība novirzās no tā vidējās vērtības par 1% un abstrahējoties no citu vienādojumā iekļauto faktoru vienlaicīgas novirzes, iegūtais raksturlielums novirzīsies no tā vidējās vērtības par ej procentiem. no y. Biežāk elastības koeficienti tiek interpretēti un piemēroti dinamikas izteiksmē: palielinot koeficientu x par 1% no tā vidējās vērtības, iegūtais raksturlielums palielinās par e. procentu no tā vidējās vērtības.

Apskatīsim daudzfaktoru regresijas vienādojuma aprēķinu un interpretāciju, kā piemēru izmantojot tās pašas 16 saimniecības (8.1. tabula). Iegūtā zīme - līmenis bruto ienākumi un trīs to ietekmējošie faktori ir parādīti tabulā. 8.7.

Atgādināsim vēlreiz, ka, lai iegūtu ticamus un pietiekami precīzus korelācijas rādītājus, ir nepieciešama lielāka populācija.


8.7. tabula

Bruto ienākumu līmenis un tā faktori

Saimniecības numuri

Bruto ienākumi, rub./ra

Darbaspēka izmaksas, cilvēkdienas/ha x1

aramzemes daļa,

Izslaukums uz 1 govi,

8.8. tabula Regresijas vienādojuma rādītāji

Atkarīgais mainīgais: y

Regresijas koeficients

Konstante-240.112905

Std. aprēķinu kļūda = 79,243276


Risinājums tika veikts, izmantojot datoram paredzēto programmu “Microstat”. Šeit ir tabulas no izdrukas: tabula. 8.7 norāda visu raksturlielumu vidējās vērtības un standarta novirzes. Tabula 8.8 satur regresijas koeficientus un to varbūtības novērtējumu:

pirmā kolonna “var” - mainīgie, t.i., faktori; otrajā ailē “regresijas koeficients” - nosacīti tīrie regresijas koeficienti bj; trešā kolonna “std. errr" - vidējās kļūdas regresijas koeficienta aplēsēs; ceturtā kolonna - Stjudenta t-testa vērtības ar 12 variācijas brīvības pakāpēm; piektā kolonna “prob” - nulles hipotēzes varbūtība attiecībā pret regresijas koeficientiem;

sestā kolonna “daļēja r2” - daļējie determinācijas koeficienti. Rādītāju aprēķina saturs un metodika 3.–6. ailē ir sīkāk aplūkoti 8. nodaļā. “Konstante” ir regresijas vienādojuma a brīvais loceklis; "Std. aprēķinu kļūda.” - vidējā kvadrātiskā kļūda, novērtējot efektīvo raksturlielumu, izmantojot regresijas vienādojumu. Tika iegūts vienādojums daudzkārtēja regresija:

y = 2,26x1 - 4,31x2 + 0,166x3 - 240.

Tas nozīmē, ka bruto ienākumu apjoms uz 1 hektāru lauksaimniecības zemes vidēji pieauga par 2,26 rubļiem. ar darbaspēka izmaksu pieaugumu par 1 stundu/ha; samazinājās vidēji par 4,31 rubli. pieaugot aramzemes īpatsvaram lauksaimniecības zemē par 1% un pieaugot par 0,166 rubļiem. ar izslaukuma pieaugumu no govs par 1 kg. Brīvā termiņa negatīvā vērtība ir diezgan dabiska, un, kā jau minēts 8.2. punktā, efektīvā zīme ir tāda, ka bruto ienākumi kļūst par nulli ilgi pirms faktori sasniedz nulles vērtības, kas ražošanā nav iespējams.

Negatīvā koeficienta vērtība x^ ir signāls par būtiskām nepatikšanām pētāmo saimniecību ekonomikā, kur augkopība ir nerentabla un rentabla ir tikai lopkopība. Ar racionālām saimniekošanas metodēm un normālām cenām (līdzsvara vai tuvu tām) visu nozaru produkcijai ienākumiem nevajadzētu samazināties, bet gan palielināties, palielinoties auglīgākajai lauksaimniecības zemes daļai - aramzemei.

Pamatojoties uz datiem no tabulas priekšpēdējām divām rindām. 8.7 un tabula. 8.8 mēs aprēķinām p-koeficientus un elastības koeficientus pēc formulām (8.34) un (8.35).

Gan ienākumu līmeņa svārstības, gan tās iespējamās izmaiņas dinamikā visspēcīgāk ietekmē faktors x3 - govju produktivitāte, bet visvājāk x2 - aramzemes īpatsvars. Tālāk tiks izmantotas P2/ vērtības (8.9. tabula);

8.9. tabula Faktoru salīdzinošā ietekme uz ienākumu līmeni

Faktori xj


Tātad, mēs esam ieguvuši, ka faktora xj α-koeficients attiecas uz šī faktora elastības koeficientu, jo faktora variācijas koeficients attiecas uz iegūtā raksturlieluma variācijas koeficientu. Tā kā, kā redzams no tabulas pēdējās rindas. 8.7, visu faktoru variācijas koeficienti ir mazāki par iegūtā raksturlieluma variācijas koeficientu; visi?-koeficienti ir mazāki par elastības koeficientiem.

Apskatīsim sakarību starp sapāroto un nosacīti tīro regresijas koeficientu, kā piemēru izmantojot koeficientu -с. Pāri lineārais vienādojums savienojumam y ar x ir šāda forma:

y = 3,886x1 – 243,2

Nosacīti tīrais regresijas koeficients pie x1 ir tikai 58% no pārī savienotā. Atlikušie 42% ir saistīti ar to, ka variāciju x1 pavada faktoru x2 x3 variācijas, kas, savukārt, ietekmē iegūto pazīmi. Visu raksturlielumu savienojumi un to pāru regresijas koeficienti ir parādīti savienojumu grafikā (8.2. att.).


Ja saskaita variācijas x1 tiešās un netiešās ietekmes aplēses uz y, t.i., sapāroto regresijas koeficientu reizinājumu pa visiem “ceļiem” (8.2. att.), iegūstam: 2,26 + 12,55 0,166 + (-0,00128) (- 4,31) + (-0,00128) 17,00 0,166 = 4,344.

Šī vērtība ir vēl lielāka pāra koeficients savienojumi x1 ar y. Līdz ar to variācijas x1 netiešā ietekme caur faktoriem, kas nav iekļauti vienādojumā, ir pretēja, kopā dodot:

1 Ayvazyan S.A., Mkhitaryan V.S. Lietišķā statistika un ekonometrijas pamati. Mācību grāmata augstskolām. - M.: VIENOTĪBA, 2008, – 311 lpp.

2 Johnston J. Ekonometriskās metodes. - M.: Statistika, 1980. gads. – 282s.

3 Dougherty K. Ievads ekonometrikā. - M.: INFRA-M, 2004, – 354 lpp.

4 Dreijers N., Smits G., Lietišķais regresijas analīze. - M.: Finanses un statistika, 2006, – 191 lpp.

5 Magnuss Y.R., Kartiševs P.K., Peresetskis A.A. Ekonometrija. Sākotnējais kurss.-M.: Delo, 2006, – 259 lpp.

6 Seminārs par ekonometriju / Red. I.I.Elisejeva - M.: Finanses un statistika, 2004, – 248 lpp.

7 Ekonometrija/Ed. I.I.Elisejeva - M.: Finanses un statistika, 2004, – 541 lpp.

8 Krēmers N., Putko B. Ekonometrija - M.: VIENOTĪBA-DANA, 200, – 281 lpp.


Ayvazyan S.A., Mkhitaryan V.S. Lietišķā statistika un ekonometrijas pamati. Mācību grāmata augstskolām. - M.: VIENOTĪBA, 2008, – lpp. 23.

Krēmers N., Putko B. Ekonometrija.- M.: VIENOTĪBA-DANA, 200, – 64.lpp.

Dreijers N., Smits G., Lietišķā regresijas analīze. - M.: Finanses un statistika, 2006, – 57. lpp.

Seminārs par ekonometriju/Red. I.I.Elisejeva - M.: Finanses un statistika, 2004, – 172.lpp.



Jaunums vietnē

>

Populārākais