Mājas Bērnu zobārstniecība Lineārās korelācijas koeficienta īpašības. Korelācijas koeficienta atrašanas piemērs

Lineārās korelācijas koeficienta īpašības. Korelācijas koeficienta atrašanas piemērs

Lineārās korelācijas koeficients

Perfektāks savienojuma tuvuma pakāpes rādītājs ir lineārais koeficients korelācijas (r).

Aprēķinot šo rādītāju, tiek ņemtas vērā ne tikai pazīmes atsevišķu raksturlielumu vērtību novirzēm no vidējā, bet arī pašu šādu noviržu lielums, t.i. attiecīgi faktoriālajiem un izrietošajiem raksturlielumiem, vērtībām un . Tomēr iegūtās absolūtās vērtības nav iespējams tieši salīdzināt savā starpā, jo pašus raksturlielumus var izteikt dažādās vienībās (kā tas ir parādītajā piemērā), un, ja ir vienas un tās pašas mērvienības, vidējie rādītāji var atšķirties pēc vērtības. Šajā sakarā relatīvās vērtībās izteiktās novirzes var tikt salīdzinātas, t.i. standartnovirzes daļās (tās sauc par normalizētajām novirzēm). Tādējādi faktoru raksturlielumam mums būs vērtību kopa, bet efektīvajam raksturlielumam .

Iegūtās normalizētās novirzes var salīdzināt savā starpā. Lai iegūtu vispārīgu raksturlielumu saistību ciešuma pakāpes raksturlielumu visai populācijai, pamatojoties uz aprēķināto normalizēto noviržu salīdzinājumu, aprēķina normalizēto noviržu vidējo reizinājumu. Šādā veidā iegūtais vidējais būs lineārās korelācijas koeficients r.

(1.2)

vai tāpēc s x Un s g ja šīs rindas ir nemainīgas un tās var izņemt no iekavām, tad lineārās korelācijas koeficienta formula ir šāda:

(1.3)

Lineārās korelācijas koeficienta vērtība var būt no –1 līdz +1. Jo tuvāk korelācijas koeficients absolūtajā vērtībā ir 1, jo ciešāka ir saistība starp raksturlielumiem. Lineārās korelācijas koeficienta zīme norāda attiecības virzienu: tiešā sakarība atbilst plus zīmei, bet apgrieztā attiecība atbilst mīnus zīmei.

Ja palielinoties faktora raksturlieluma vērtībām X, izrietošā zīme plkst ir tendence pieaugt, tad korelācijas koeficienta vērtība būs no 0 līdz 1. Ja, pieaugot vērtībām X izrietošā zīme plkst ir tendence samazināties, korelācijas koeficients var iegūt vērtības diapazonā no 0 līdz –1.

Iegūtā lineārās korelācijas koeficienta vērtība, tāpat kā iepriekš atrastais Fehnera koeficients, norāda iespējamā pieejamība Pastāv diezgan cieša tieša saikne starp reklāmas izmaksām un tūristu skaitu, kuri izmantojuši uzņēmuma pakalpojumus.

Kvadrātveida korelācijas koeficients ( r 2) tiek saukts determinācijas koeficients. Aplūkojamajā piemērā tā vērtība ir 0,6569, kas nozīmē, ka 65,69% no uzņēmuma pakalpojumus izmantojušo klientu skaita svārstībām ir izskaidrojamas ar uzņēmuma pakalpojumu reklamēšanas izmaksu izmaiņām.

Šeit vēlreiz jāatgādina, ka pati korelācijas koeficienta vērtība neliecina par cēloņsakarības esamību starp pētāmajiem raksturlielumiem, bet gan novērtē raksturlielumu izmaiņu savstarpējās konsekvences pakāpi. Pirms cēloņu un seku attiecību noteikšanas tiek veikta parādību kvalitatīvā rakstura analīze. Bet ir vēl viens apstāklis, kas izskaidro secinājumu formulēšanu par iespējamo savienojuma klātbūtni, pamatojoties uz korelācijas koeficienta lielumu.

Tas ir saistīts ar faktu, ka savienojuma tuvuma pakāpes novērtējums, izmantojot korelācijas koeficientu, parasti tiek veikts, pamatojoties uz vairāk vai mazāk ierobežotu informāciju par pētāmo parādību. Rodas jautājums, cik leģitīms ir mūsu secinājums, kas balstīts uz izlases datiem par korelācijas faktisko esamību tajā populācija, no kura tika ņemts paraugs?

KORELĀCIJAS UN REGRESIJAS ANALĪZE IN

EKONOMISKIE APRĒĶINI

Korelācijas un regresijas analīzes pamatjēdzieni

Matemātikā ir divi jēdzieni, kas atspoguļo cēloņu un seku attiecības starp raksturlielumiem: funkcionālā un korelācijas atkarība.

Funkcionālā atkarība tiek saprasta kā tāda attiecība starp lielumiem, kad atkarīgā daudzuma - funkcijas - vērtību pilnībā nosaka atkarīgo mainīgo vērtības.

Korelācijas atkarība rodas, ja katra viena (rezultātā) lieluma vērtība atbilst cita nejaušu vērtību kopai, kas notiek ar noteiktu varbūtību.

Pētot ekonomiskās parādības, mēs runājam nevis ar funkcionālo, bet ar korelācijas atkarību. Izmantojot korelāciju un regresijas analīze var aprēķināt korelācijas koeficienti, kas novērtē attiecību stiprumu starp atsevišķiem rādītājiem, atlasiet

regresijas vienādojums, kas nosaka šī savienojuma formu, un nosaka šī savienojuma pastāvēšanas ticamību.

Ekonomisko procesu korelācijas un regresijas analīzes process sastāv no šādiem posmiem:

Statistikas datu iepriekšēja apstrāde un galveno efektīvo rādītāju ietekmējošo faktoru raksturlielumu izvēle;

Saiknes ciešuma novērtēšana un esošās saiknes formas identificēšana starp rezultējošām un faktora īpašībām;

Pētāmās parādības (daudzfaktoru) modeļa izstrāde un analīze;

Iegūto analīzes rezultātu pielietošana vadības lēmumu pieņemšanā.

Korelācija saskaras ar diviem galvenajiem izaicinājumiem. Pirmais ir noteikt, kā mainās vidējais efektīvais raksturlielums saistībā ar izmaiņām faktorā viens. Šo problēmu var atrisināt komunikācijas vienādojuma atrašana. Otrais uzdevums nosaka kropļojošo faktoru ietekmes pakāpi. Šī problēma tiek atrisināta, pētot savienojuma ciešuma rādītājus. Šādi rādītāji ir korelācijas koeficienti un korelācijas koeficienti.



2. Efektīvas un faktoru pazīmes . Pētot dažu parādības pazīmju ietekmi uz citām, no konkrēto parādību raksturojošo pazīmju ķēdes izšķir divas - faktorzīmes (ietekmē rezultātu) un rezultatīvās. Ir nepieciešams noteikt, kura no īpašībām ir faktoriāla un kura ir produktīva. Pirmkārt, ar to palīdz loģiskā analīze.

Piemērs. Individuālā uzņēmuma rūpnieciskās produkcijas izmaksas ir atkarīgas no daudziem faktoriem, tostarp no ražošanas apjoma šajā uzņēmumā. Ražošanas izmaksas šajā gadījumā darbojas kā efektīvs atribūts, bet ražošanas apjoms - kā faktoriāls.

Vēl viens piemērs. Lai spriestu par lielo uzņēmumu priekšrocībām salīdzinājumā ar mazajiem, varam aplūkot, kā palielinās lielo uzņēmumu darbinieku darba ražīgums, un identificēt darba ražīguma atkarību no uzņēmuma lieluma pieauguma.

3. Komunikācijas vienādojuma jēdziens. Šīs funkcijas vienādojums būs saiknes vienādojums starp rezultējošām un faktoriālajiem raksturlielumiem.

Savienojuma vienādojums tiek atrasts, izmantojot metodi mazākie kvadrāti, kas nosaka, ka empīrisko vērtību kvadrātu noviržu summai no vērtībām, kas iegūtas, pamatojoties uz savienojuma vienādojumu, jābūt minimālai.

Mazāko kvadrātu metodes izmantošana ļauj atrast sakaru vienādojuma parametrus, risinot tā saukto normālo vienādojumu sistēmu, kas katram savienojuma veidam ir atšķirīga.

Lai atzīmētu, ka attiecības starp diviem raksturlielumiem tiek izteiktas ar vidējo vērtību, tiek apzīmētas iegūtā raksturlieluma vērtības, kas atrastas no attiecību vienādojuma Uhh.

Zinot attiecību vienādojumu, jūs varat iepriekš aprēķināt iegūtā raksturlieluma vidējo vērtību, kad vērtība. ir zināma faktoriālā īpašība. Tādējādi savienojuma vienādojums ir novēroto statistisko sakarību vispārināšanas metode, to izpētes metode.

Izmantojot vienu vai otru funkciju kā savienojuma vienādojumu, sakabes izšķir pēc formas: lineāro savienojumu un līknes savienojumu (parabolisko, hiperbolisko utt.).

Apskatīsim savienojuma vienādojumus atkarībām no viena raksturlieluma at dažādas formas savienojumiem (lineāri, līknes paraboliski, hiperboliski) un vairākiem savienojumiem.

4. Lineāra sakarība starp raksturlielumiem. Savienojuma vienādojums kā taisnās līnijas vienādojums Ух==ао+а1х tiek izmantots efektīvā atribūta vienmērīga pieauguma gadījumā ar faktoriālā atribūta pieaugumu. Šāda atkarība būs lineāra (taisnvirziena) atkarība.

Taisnās līnijas vienādojuma ao un a1 parametri tiek atrasti, atrisinot normālo vienādojumu sistēmu, kas iegūta ar mazāko kvadrātu metodi:

Vienādojuma parametru un efektīvā raksturlieluma Vx vidējo vērtību aprēķināšanas piemērs ir šī tabula, kas ir iegūta, grupējot pēc faktoriālā raksturlieluma un aprēķinot vidējās vērtības pēc efektīvā raksturlieluma.

Komunikācijas vienādojumam nepieciešama uzņēmumu grupēšana pēc pamatlīdzekļu vērtības un summu aprēķināšana.

No tabulas atrodam: n==6; =18; =39,0; =71,5

132,0. Mēs veidojam divu vienādojumu sistēmu ar diviem nezināmiem:

Sadalot katru vārdu abos vienādojumos ar aо koeficientiem, iegūstam:

Atņemt pirmo no otrā vienādojuma: 0,97a1=0,83; a1==0,86. Aizvietojot a1 vērtības pirmajā vienādojumā ao+3*0,86 =6,5, mēs atrodam ao=6,5-2,58=+3,92.

Savienojuma vienādojums būs šāds: yx=3,92+0,86x. Aizvietojot atbilstošo x šajā vienādojumā, mēs iegūstam iegūtā raksturlieluma vērtības, kas korelācijas atkarības veidā atspoguļo y vidējo atkarību no x.

Ņemiet vērā, ka pēc vienādojuma aprēķinātās un faktiskās summas ir vienādas viena ar otru. Faktisko un aprēķināto vērtību attēlojums attēlā. 4 parāda, ka savienojuma vienādojums vidēji atspoguļo novēroto atkarību.

5. Paraboliskā atkarība starp zīmēm . Paraboliskā atkarība, kas izteikta ar vienādojumu ar 2. kārtas parabolu yx = ao + a1x + a2x 2, notiek ar paātrinātu efektīvā atribūta palielināšanos vai samazināšanos kombinācijā ar vienmērīgu faktoriālā atribūta pieaugumu.

Parabola vienādojuma parametri aо; a1; a2, aprēķina, atrisinot 3 normālu vienādojumu sistēmu:

Ņemsim par piemēru atkarību. ikmēneša numurs produkti (y) no pamatlīdzekļu vērtības (x). Abi skaitļi ir noapaļoti līdz tuvākajam miljonam rubļu. Nepieciešamo summu aprēķini ir doti tabulā. 5.

Pamatojoties uz tabulas datiem, mēs izveidojam vienādojumu sistēmu:

6. Hiperbolas vienādojums. Atsauksmes norāda uz efektīvā atribūta samazināšanos, palielinoties faktoriālajam atribūtam. Šī ir lineāra sakarība ar negatīvu vērtību a1. Vairākos citos gadījumos atgriezenisko saiti var izteikt ar hiperbolas vienādojumu

Hiperbolas vienādojuma ao un a1 parametri tiek atrasti no normālo vienādojumu sistēmas:

7. Atbilstības tabula. Ar lielu novērojumu apjomu, kad savstarpēji savienoto pāru skaits ir liels, pārī savienotos datus var viegli atrast korelācijas tabulā, kas ir ērtākais veids, kā attēlot ievērojamu skaitu skaitļu pāru.

Korelācijas tabulā viens raksturlielums atrodas tabulas rindās, bet otrs - kolonnās. Skaitlis, kas atrodas šūnā diagrammas un kolonnas krustpunktā, parāda, cik bieži noteiktā rezultējošā raksturlieluma vērtība rodas kombinācijā ar noteiktu faktoriālā raksturlieluma vērtību.

Lai vienkāršotu aprēķinu, 20 uzņēmumos veiksim nelielu skaitu novērojumu par vidējo mēneša izlaidi uz vienu darbinieku (tūkst. rubļu) un ražošanas pamatlīdzekļu izmaksām (miljonos rubļu).

Parastā pārī savienotā tabulā šī informācija ir sakārtota šādi:

Rindu y kopsummas parāda raksturlieluma nу biežumu, ailes x kopsummas parāda raksturlieluma nx biežumu. Cipari korelācijas tabulas šūnās ir frekvences, kas saistītas ar abiem raksturlielumiem un ir apzīmētas ar nxy.

Atbilstības tabula, pat ar virspusēju iepazīšanos, dod vispārēja ideja par taisnu līniju un atsauksmes. Ja frekvences atrodas pa diagonāli uz leju pa labi, tad saikne starp raksturlielumiem ir tieša (ar pieaugošām raksturlieluma vērtībām rindās un kolonnās). Ja frekvences atrodas pa diagonāli uz augšu pa labi, tad savienojums ir apgriezts.

8. Korelācijas sakarība. Ja parādību mēra ar diviem raksturlielumiem, tad izkliedes (galvenokārt dispersijas) mērus var atrast pēc iegūtā raksturlieluma tām pašām faktoriālā raksturlieluma vērtībām.

Piemēram, ir dota divu savstarpēji atkarīgu sēriju korelācijas tabula, kurā vienkāršības labad ir tikai trīs izlietotā mēslojuma daudzuma faktoriālā raksturlieluma vērtības (x) un iegūtais raksturlielums - raža (y) - ievērojami svārstās. 16. tabula

Katrai lauciņu grupai ar atšķirīgu ražu tika izlietots atšķirīgs mēslojuma daudzums. Tātad, kad mēslojums tika izlietots 20 g/raža dažādās platībās, tas bija vienāds: vienā platībā tas bija 0,8 tonnas, divās platībās - 0,9 tonnas, trīs - 1,0 tonnas un vienā - 1,1 t. Noskaidrosim vidējo ražu un ražas dispersija šai parauglaukumu grupai.

Lauku grupai ar izlietoto mēslojuma daudzumu 30,0 g vidējā raža būs:

Aprēķināsim līdzīgus raksturlielumus apgabalu grupai. saņēma 40 tonnas mēslojuma:

No šiem datiem var noteikt arī vidējo ražu visos 20 lauciņos neatkarīgi no izlietotā mēslojuma daudzuma, t.i., kopējo vidējo:

un grupu vidējās ražas mainīguma (dispersijas) mērs ap kopējo vidējo. Šo dispersiju sauc par starpgrupu dispersiju un apzīmē ar b 2

kur yi ir vidējās ražas lauciņu grupām, kas atšķiras pēc izlietotā mēslojuma daudzuma; m1,m2,m3,-grupu skaits. Šī piemēra atšķirība starp grupām ir:

Starpgrupu dispersija parāda dispersiju, kas rodas faktoriālā atribūta dēļ. Šajā piemērā Y = == 0,01&247 ir ražas izkliedes rādītājs, kas izriet no izlietotā mēslojuma daudzuma atšķirības.

Tomēr papildus starpgrupu izkliedei ir iespējams aprēķināt arī dispersiju kā citu faktoru izraisītas izkliedes indikatoru (ja tā saucat visus citus faktorus, izņemot mēslojumu). Šis rādītājs būs vietu grupu izkliedes rādītāju (dispersiju) vidējā (svērtā) vērtība.

Tas praktiski nozīmē, ka ir iespējams iegūt vispārēju izkliedes (dispersijas) mērījumu visiem 20 lauciņiem, ja ir pieejama informācija par vidējiem un novirzēm lauciņu grupām, kas atšķiras pēc izlietotā mēslojuma daudzuma. Tāpēc kopējā ražas atšķirība 20 parauglaukumos būs;

Starpgrupu un vidējo grupu dispersiju aprēķināšanas formulas var saīsināt šādi:

Kopējās dispersijas, iekšējās grupas un starpgrupu dispersijas aprēķins ļauj izdarīt dažus secinājumus par faktoriālā atribūta ietekmes pakāpi uz efektīvā atribūta mainīgumu. Šis ietekmes mērs tiek atrasts, izmantojot korelācijas sakarību:

Tas nozīmē, ka 78% no laukuma ražas mainīguma ir atkarīgi no izlietotā mēslojuma daudzuma mainīguma.

Lineārās korelācijas koeficients

Pētot divu savstarpēji atkarīgu rindu saistību ciešumu, tiek izmantots lineārās korelācijas koeficients, kas parāda, vai un cik spēcīga sakarība starp šīm rindām pastāv. Tam var būt vērtības no –1 līdz +1.

10.Kumulatīvās korelācijas koeficients :

,

Kur r- lineārās korelācijas koeficienti, un apakšindeksi norāda, starp kuriem raksturlielumiem tie tiek aprēķināti.

1) Lineārās korelācijas koeficienta vērtības var būt no –1 līdz +1.

2) Ja , tad saikne starp pazīmēm ir funkcionāla, t.i., efektīvo raksturlielumu ietekmē tikai aplūkojamais faktoriālais raksturlielums un nekas cits, ja r = 0, tad starp raksturlielumiem nav nekādas saistības.

3) Ja r> 0, tad saistība starp pazīmēm ir tieša, ja r< 0, то связь – обратная.

4) Piešķiriet šādus intervālus r:

starp zīmēm praktiski nav nekādas saiknes;

savienojums ir vājš;

savienojums ir mērens;

savienojums ir spēcīgs.

Rīsi. 2. Punktu atrašanās vietas piemēri grafikā un korelācijas koeficienta vērtības

Priekš novērtējot lineārās korelācijas koeficienta nozīmīgumu r izmantot t- Studentu ieskaite. Šajā gadījumā tiek izvirzīta hipotēze, ka korelācijas koeficients ir vienāds ar nulli.

Hipotēžu pārbaude:

1. Aprēķiniet faktiskās vērtības t- kritēriji r:

(šo formulu izmanto nelielam paraugam).

2. Saskaņā ar tabulu t- Tiek noteikts Studentu sadalījums, ņemot vērā pieņemto nozīmīguma līmeni vai un brīvības pakāpju skaitu.

3. Ja , tad tiek noraidīta hipotēze, kas norāda uz korelācijas koeficienta nozīmīgumu.

Korelācijas attiecības nosaka pēc formulām:

η = vai η = ,

kur ir iegūtās pazīmes starpgrupu dispersija, ko izraisa faktoru pazīmes ietekme;

– rezultējošā atribūta kopējā izkliede;

– iegūtās pazīmes vidējās atšķirības grupā.

Korelācijas sakarības aprēķināšanai nepieciešams diezgan liels informācijas apjoms, kas jāuzrāda grupu tabulas veidā vai korelācijas tabulas veidā, t.i. priekšnoteikums ir datu grupēšana pēc atribūta faktora.

Negrupētiem datiem empīrisko korelācijas koeficientu var aprēķināt, izmantojot šādu formulu:

.

kur y – iegūtā raksturlieluma empīriskās (faktiskās) vērtības;

– efektīvā raksturlieluma vidējā vērtība;

– iegūtā raksturlieluma izlīdzinātās vērtības, kas aprēķinātas, izmantojot analītisko vienādojumu.

Korelācijas koeficientu kvadrātā (), un pāru attiecībām sauc par lineāro korelācijas koeficientu kvadrātā () determinācijas koeficients (cēloņsakarība), tas atspoguļo faktoru dispersijas daļu kopējā dispersijā.

Determinācijas koeficients (D) parāda, par cik procentiem iegūtā raksturlieluma vidējās vērtības izmaiņas nosaka šī faktora raksturlieluma ietekme.

Praksē savienojuma tuvuma pakāpes noteikšanai var izmantot citus rādītājus.

Savienojuma tuvuma pakāpes elementārs raksturlielums ir Fehnera koeficients :

,

Kur n a- faktoru raksturlielumu individuālo vērtību noviržu pazīmju sakritību skaits X un izrietošā zīme plkst no to vidējā aritmētiskā (piemēram, “pluss” un “pluss”, “mīnuss” un “mīnuss”, “bez novirzes” un “bez novirzes”);

n b- atšķirību skaits pazīmju atsevišķu vērtību novirzēm no to vidējā aritmētiskā vērtības.

Fehnera koeficientu izmanto, ja sākotnējās informācijas apjoms ir mazs. Tas svārstās no -1 līdz 1.

Lai noteiktu gan kvantitatīvo, gan kvalitatīvo raksturlielumu attiecības ciešumu, ja šo raksturlielumu vērtības var sarindot augošā vai dilstošā secībā, to izmanto Spīrmena ranga korelācijas koeficients :

,

Kur d i- atšķirība starp faktora raksturlieluma un iegūtā raksturlieluma ranga vērtībām;

n– pētāmās sērijas rādītāju (rangu) skaits.

Tas svārstās no -1 līdz 1.

Darba beigas -

Šī tēma pieder sadaļai:

Statistika

Vjatkas Valsts humanitārā universitāte.. m a kunilova o o antonenko..

Ja jums ir nepieciešams papildu materiāls par šo tēmu vai jūs neatradāt to, ko meklējāt, mēs iesakām izmantot meklēšanu mūsu darbu datubāzē:

Ko darīsim ar saņemto materiālu:

Ja šis materiāls jums bija noderīgs, varat to saglabāt savā lapā sociālajos tīklos:

Visas tēmas šajā sadaļā:

Fišera F testa kritiskās vērtības
k1 k2 Nozīmes līmenis

Dažādas ekonomiskās parādības gan mikro, gan makro līmenī nav neatkarīgas, bet ir savstarpēji saistītas (preces cena un pieprasījums pēc tās, ražošanas apjoms un uzņēmuma peļņa utt.).

Šī atkarība var būt stingri funkcionāla (deterministiska) un statistiska.

Atkarību starp un sauc par funkcionālu, ja katra viena raksturlieluma vērtība atbilst cita raksturlieluma vienai vērtībai. (Šādu unikālu attiecību piemērs ir apļa laukuma atkarība no rādiusa.)

Patiesībā biežāk sastopama cita parādību saikne, kad katra vienas pazīmes vērtība var atbilst vairākām citas vērtības vērtībām (piemēram, saikne starp bērnu vecumu un viņu izaugsmi).

Saiknes formu, kurā viens vai vairāki savstarpēji saistīti rādītāji (faktori) ietekmē citu rādītāju (rezultātu) nevis viennozīmīgi, bet ar zināmu varbūtības pakāpi, sauc par statistisko. Jo īpaši, ja, mainoties vienam no lielumiem, mainās otra vidējā vērtība, tad šajā gadījumā statistisko atkarību sauc par korelāciju.

Atkarībā no modelī iekļauto faktoru skaita tiek izšķirta pāru korelācija (attiecība starp diviem mainīgajiem) un daudzkārtējā korelācija (rezultāta atkarība no vairākiem faktoriem).

Korelācijas analīze sastāv no definēšanas virzieni, formas un pakāpes savienojumi (tuvums) starp diviem (vairākiem) nejaušiem raksturlielumiem un.

Virzienā korelācija ir pozitīva (tieša), ja, pieaugot viena mainīgā vērtībām, palielinās cita vērtība, un negatīva (apgriezta), ja, pieaugot viena mainīgā vērtībām, cita vērtība samazinās. .

Formā korelācijas sakarība var būt lineāra (taisna), kad viena raksturlieluma vērtību izmaiņas noved pie vienmērīgām izmaiņām citā (matemātiski aprakstīta ar taisnes vienādojumu), un līknes, ja viena raksturlieluma vērtību maiņa izraisa nevienlīdzīgas izmaiņas citā (matemātiski to raksturo izliektu līniju vienādojumi, piemēram, hiperbolas, parabolas utt.).

Vienkāršākā mainīgo atkarības forma ir lineārā atkarība. Un šādas atkarības klātbūtnes pārbaude, tās rādītāju un parametru novērtēšana ir viena no svarīgākajām ekonometrijas jomām.

Ir īpašas statistikas metodes un attiecīgi rādītāji, kuru vērtības noteiktā veidā norāda uz lineāras attiecības esamību vai neesamību starp mainīgajiem.

Lineārās korelācijas koeficients

Vienkāršākais, aptuvenais korelāciju noteikšanas veids ir grafisks.

Ar nelielu izlases lielumu eksperimentālie dati tiek parādīti divu savstarpēji saistītu vērtību sēriju veidā un. Ja katru pāri attēlo kā punktu plaknē, tad iegūst tā saukto korelācijas lauku (1. att.).

Ja korelācijas lauks ir elipse, kuras ass atrodas no kreisās puses uz labo un no apakšas uz augšu (1.c att.), tad varam pieņemt, ka starp raksturlielumiem pastāv lineāra pozitīva sakarība.

Ja korelācijas lauks tiek paplašināts pa asi no kreisās puses uz labo un no augšas uz leju (1.d att.), tad mēs varam pieņemt lineāra negatīva savienojuma esamību.

Ja novērojumu punkti plaknē atrodas haotiski, tas ir, korelācijas lauks veido apli (1.a att.), tad tas norāda uz saiknes trūkumu starp raksturlielumiem.

1.b attēlā parādīta stingra lineāra funkcionāla sakarība.

Ciešā saikne starp diviem lielumiem tiek saprasta kā konjugācijas pakāpe starp tiem, kas atklājas, mainoties pētāmajiem daudzumiem. Ja katra dotā vērtība atbilst vērtībām, kas ir tuvu viena otrai, tad attiecības tiek uzskatītas par ciešām (spēcīgām); ja vērtības ir plaši izkliedētas, tad attiecības tiek uzskatītas par mazāk ciešām. Ar ciešu korelācijas savienojumu korelācijas lauks ir vairāk vai mazāk saspiesta elipse.

Lineārās attiecības virziena un tuvuma kvantitatīvais kritērijs ir lineārās korelācijas koeficients.

Korelācijas koeficientu, kas noteikts no izlases datiem, sauc par izlases korelācijas koeficientu. To aprēķina pēc formulas:

kur, pazīmju pašreizējās vērtības un; un raksturlielumu vidējās aritmētiskās vērtības; - varianta reizinājumu vidējais aritmētiskais un šo raksturlielumu standartnovirzes; parauga lielums.


Lai aprēķinātu korelācijas koeficientu, pietiek pieņemt pieņēmumu par lineāru sakarību starp nejaušiem raksturlielumiem. Tad aprēķinātais korelācijas koeficients būs šīs lineārās attiecības mērs.

Lineārās korelācijas koeficients ņem vērtības no?1 stingras lineāras negatīvas attiecības gadījumā līdz +1 stingras lineāras attiecības gadījumā pozitīvs savienojums(tie.). Korelācijas koeficienta tuvums 0 norāda uz neesamību lineārs sakarības starp pazīmēm, bet ne par savienojumu neesamību starp tām vispār.

Korelācijas koeficientam var sniegt skaidru grafisku interpretāciju.

Ja, tad starp raksturlielumiem pastāv lineāra veida funkcionālā atkarība, kas nozīmē pilnīgu raksturlielumu korelāciju. Kad taisnei ir pozitīvs slīpums attiecībā pret asi un negatīvs (1.b attēls).

Ja punkti atrodas apgabalā ierobežota līnija, kas atgādina elipsi. Jo tuvāk ir korelācijas koeficients, jo šaurāka ir elipse un jo ciešāk punkti ir koncentrēti taisnes tuvumā. Kad viņi saka, ka ir pozitīva korelācija. Šajā gadījumā vērtībām ir tendence pieaugt, palielinoties (1.c attēls). Kad viņi runā par negatīvu korelāciju; vērtībām ir tendence samazināties līdz ar izaugsmi (1.d attēls).

Ja, tad punkti atrodas apļa norobežotajā apgabalā. Tas nozīmē, ka starp nejaušām pazīmēm nav korelācijas, un šādas pazīmes sauc par nekorelācijām (1.a att.).

Tāpat lineārās korelācijas koeficients var būt tuvs (vienāds) ar nulli, ja starp raksturlielumiem ir sakarība, bet tas ir nelineārs (2. att.).

Novērtējot savienojuma blīvumu, varat izmantot šādu nosacījumu tabulu:

Ņemiet vērā, ka lielumu un ar parauga lineārās korelācijas koeficienta formulas skaitītājs satur to kovariācijas rādītāju:

Šis rādītājs, tāpat kā korelācijas koeficients, raksturo lineārās attiecības pakāpi starp daudzumiem un. Ja tas ir lielāks par nulli, tad attiecība starp lielumiem ir pozitīva; ja tā ir mazāka par nulli, tad attiecība ir negatīva; ja tā ir vienāda ar nulli, lineāras attiecības nav.

Atšķirībā no korelācijas koeficienta, kovariācijas rādītājs ir normalizēts - tam ir dimensija, un tā vērtība ir atkarīga no mērvienībām un. Statistiskajā analīzē kovariācijas rādītāju parasti izmanto kā starpelementu lineārās korelācijas koeficienta aprēķinā. Tas. izlases korelācijas koeficienta aprēķināšanas formula ir šāda:

Korelācijas koeficienta nozīmīguma (uzticamības) novērtējums

Jāņem vērā, ka patiesais mainīgo lielumu lineārās attiecības pakāpes rādītājs ir teorētiskais korelācijas koeficients, kas tiek aprēķināts, pamatojoties uz datiem no visas populācijas (t.i. iespējamās vērtības rādītāji):

kur ir teorētiskais kovariācijas indekss, ko aprēķina kā paredzamā vērtība SV noviržu produkti un to matemātiskās cerības.

Kā likums, mēs nevaram aprēķināt teorētisko korelācijas koeficientu. Taču no tā, ka izlases koeficients nav vienāds ar nulli, neizriet, ka arī teorētiskais koeficients ir (t.i., rādītāji var būt lineāri neatkarīgi). Tas. Pamatojoties uz nejaušās izlases datiem, nevar apgalvot, ka starp rādītājiem pastāv saistība.

Izlases korelācijas koeficients ir teorētiskā koeficienta novērtējums, jo to aprēķina tikai daļai mainīgo vērtību.

Korelācijas koeficientā vienmēr ir kļūda. Šī kļūda - neatbilstība starp izlases lieluma korelācijas koeficientu un korelācijas koeficientu vispārējai populācijai tiek noteikta ar formulām:

plkst; un plkst.

Lineārās korelācijas koeficienta nozīmīguma pārbaude nozīmē pārbaudīt, cik ļoti mēs varam uzticēties izlases datiem.

Šim nolūkam tiek pārbaudīta nulles hipotēze, ka kopas korelācijas koeficienta vērtība ir vienāda ar nulli, t.i. populācijā nav korelācijas. Alternatīva ir hipotēze.

Lai pārbaudītu šo hipotēzi, tiek aprēķināta Studenta statistika (-kritērijs):

Kurai ir Studentu sadalījums ar brīvības pakāpēm. Izmantojot Studentu sadalījuma tabulas, tiek noteikts kritiskā vērtība. Ja kritērija aprēķinātā vērtība, tad nulles hipotēze tiek noraidīta, tas ir, aprēķinātais korelācijas koeficients ar varbūtību būtiski atšķiras no nulles.

Ja, tad nulles hipotēzi nevar noraidīt. Šajā gadījumā ir iespējams, ka korelācijas koeficienta patiesā vērtība ir nulle, t.i. sakarību starp rādītājiem var uzskatīt par statistiski nenozīmīgu.

1. piemērs. Tabulā parādīti dati par kopējiem ienākumiem un galapatēriņa izdevumiem par 8 gadiem.

Izpētīt un izmērīt attiecību ciešumu starp dotajiem rādītājiem.

Korelācijas analīze attiecas uz savienojuma pakāpi starp diviem nejaušie mainīgie X un Y.

Eksperimentālo datu korelācijas analīze diviem nejaušiem mainīgajiem ietver šādas pamata metodes:
1. Izlases korelācijas koeficientu aprēķins.
2. Atbilstības tabulas sastādīšana.
3. Pārbaudiet statistiskā hipotēze savienojuma nozīme.

DEFINĪCIJA. Korelācijas atkarību starp gadījuma lielumiem X un Y sauc par lineāro korelāciju, ja abas regresijas funkcijas f(x) un φ(x) ir lineāras. Šajā gadījumā abas regresijas līnijas ir taisnas; tās sauc par regresijas līnijām.

Pietiekami daudz pilns apraksts lielumu korelācijas atkarības pazīmes, nepietiek tikai ar šīs atkarības formas noteikšanu un gadījumā lineārā atkarība novērtē tā stiprumu pēc regresijas koeficienta vērtības. Piemēram, ir skaidrs, ka vidusskolēnu vecuma Y korelācijas atkarība no viņu mācību gada X parasti ir tuvāka nekā līdzīga augstākās izglītības studentu vecuma atkarība. izglītības iestāde atkarībā no studiju gada, jo viena un tā paša studiju gada studentu vidū universitātē parasti ir lielāka vecuma izkliede nekā vienas klases skolēniem.

Lai novērtētu lineāro korelāciju tuvumu starp X un Y vērtībām, pamatojoties uz izlases novērojumu rezultātiem, tiek ieviests parauga lineārās korelācijas koeficienta jēdziens, kas definēts ar formulu:

kur σ X un σ Y ir X un Y vērtību parauga standartnovirzes, kuras aprēķina, izmantojot formulas:

Jāņem vērā, ka izlases lineārās korelācijas koeficienta r ​​B galvenā nozīme ir tāda, ka tas atspoguļo empīrisku (t.i., iegūts no X un Y vērtību novērojumu rezultātiem) atbilstošā vispārējā lineārās korelācijas koeficienta r ​​aplēsi: r= r B (9)

Ņemot vērā formulas:

mēs redzam, ka izlases vienādojums lineārā regresija Y ar X izskatās šādi:

(10)

Kur. To pašu var teikt par X lineārās regresijas vienādojumiem uz Y:

(11)

Parauga lineārās korelācijas koeficienta pamatīpašības:

1. Divu lielumu, kas nav saistīti ar lineāro korelāciju, korelācijas koeficients ir vienāds ar nulli.
2. Divu lielumu, kas saistīti ar lineāro korelācijas atkarību, korelācijas koeficients ir vienāds ar 1 pieaugošas atkarības gadījumā un -1, ja atkarība samazinās.
3. Divu lielumu korelācijas koeficienta absolūtā vērtība, kas saistīti ar lineāro korelācijas atkarību, apmierina nevienādību 0<|r|<1. При этом коэффициент корреляции положителен, если корреляционная зависимость возрастающая, и отрицателен, если корреляционная зависимость убывающая.
4. Jo tuvāk |r| līdz 1, jo ciešāka ir lineārā korelācija starp Y un X vērtībām.

Pēc savas būtības korelācija var būt tieša vai apgriezta, un pēc stiprības - spēcīga, vidēja, vāja. Turklāt savienojuma var nebūt vai tas var nebūt pilnīgs.

Parametru attiecības stiprums un raksturs

4. piemērs. Tika pētīta saistība starp diviem lielumiem Y un X. Novērojumu rezultāti ir parādīti tabulā 11. tilpuma divdimensiju parauga veidā:

X 68 37 50 53 75 66 52 65 74 65 54
Y 114 149 146 141 114 112 124 105 141 120 124

Nepieciešams:
1) Aprēķināt izlases korelācijas koeficientu;
2) Novērtēt korelācijas būtību un stiprumu;
3) Uzrakstiet lineārās regresijas vienādojumu Y uz X.

Risinājums. Pēc labi zināmām formulām:

Tādējādi saskaņā ar (7) un (8):

Tādējādi jāsecina, ka aplūkotā korelācijas atkarība starp X un Y vērtībām pēc būtības ir apgriezta un pēc stiprības vidēja.

3) Y lineārās regresijas vienādojums uz X:

Piemērs 5. Tika pētīta sakarība starp kvalitāti Y (%) un daudzumu X (gab.). Novērojumu rezultāti ir parādīti korelācijas tabulas veidā:

Y\X 18 22 26 30 n g
70 5 5
75 7 46 1 54
80 29 72 101
85 29 8
90 3 3
n x 12 75 102 11 200

Jāaprēķina parauga lineārās korelācijas koeficients Y atkarībai no X.

Risinājums. Lai vienkāršotu aprēķinus, pāriesim pie jauniem mainīgajiem - nosacījuma opcijām (u i, v i), izmantojot formulas (*) (§3) ar h 1 =4, h 2 =5, x 0 =26, y 0 =80. Ērtības labad mēs pārrakstām šo tabulu jaunā apzīmējumā:

u\v -2 -1 0 1 nv
-2 5 5
-1 7 46 1 54
0 29 72 101
1 29 8
2 3 3
n u 12 75 102 11 200

Mums ir x i =u i un y j =v j:

Tādējādi:

No šejienes,

Secinājums: korelācija starp X un Y vērtībām ir tieša un spēcīga.



Jaunums vietnē

>

Populārākais