Ev Ağız boşluğu Korrelyasiya əmsalları. Çoxlu korrelyasiya əmsalı və təyin əmsalı

Korrelyasiya əmsalları. Çoxlu korrelyasiya əmsalı və təyin əmsalı


  1. Quraşdırılmış modelin keyfiyyətini qiymətləndirin. Tək faktorlu modellə müqayisədə modelin keyfiyyəti yaxşılaşıbmı? Təsir qiymətləndirməsini verin əhəmiyyətli amillər elastiklik əmsallarından, - və -əmsallardan istifadə etməklə nəticə üzrə.
Bu problemin 1.4-cü bəndinə bənzər seçilmiş çoxsaylı modelin (6) keyfiyyətini qiymətləndirmək üçün biz təyinetmə əmsalından istifadə edirik. R- kvadrat, orta nisbi səhv yaxınlaşma və F- Fisher meyarı.

Təyin əmsalı R-kvadrat “Reqressiya”nın nəticələrindən götürüləcək (model (6) üçün “Reqressiya statistikası” cədvəli).

Nəticədə, bir mənzilin qiymətində dəyişiklik (dəyişiklik). Y Bu tənliyə görə 76,77% rayon şəhərinin dəyişməsi ilə izah olunur. X 1 , mənzildə otaqların sayı X 2 və yaşayış sahəsi X 4 .

Orijinal məlumatlardan istifadə edirik Y i və reqressiya aləti tərəfindən tapılan qalıqlar (model (6) üçün “Qalıqların çıxışı” cədvəli). Nisbi səhvləri hesablayaq və orta qiyməti tapaq
.

QALANLARININ GERİ ALINMASI


Müşahidə

Proqnozlaşdırılan Y

Qalıqlar

Rel. səhv

1

45,95089273

-7,95089273

20,92340192

2

86,10296493

-23,90296493

38,42920407

3

94,84442678

30,15557322

24,12445858

4

84,17648426

-23,07648426

37,76838667

5

40,2537216

26,7462784

39,91981851

6

68,70572376

24,29427624

26,12287768

7

143,7464899

-25,7464899

21,81905923

8

106,0907598

25,90924022

19,62821228

9

135,357993

-42,85799303

46,33296544

10

114,4792566

-9,47925665

9,027863476

11

41,48765602

0,512343975

1,219866607

12

103,2329236

21,76707636

17,41366109

13

130,3567798

39,64322022

23,3195413

14

35,41901876

2,580981242

6,7920559

15

155,4129693

-24,91296925

19,0903979

16

84,32108188

0,678918123

0,798727204

17

98,0552279

-0,055227902

0,056355002

18

144,2104618

-16,21046182

12,66442329

19

122,8677535

-37,86775351

44,55029825

20

100,0221225

59,97787748

37,48617343

21

53,27196558

6,728034423

11,21339071

22

35,06605378

5,933946225

14,47303957

23

114,4792566

-24,47925665

27,19917406

24

113,1343153

-30,13431529

36,30640396

25

40,43190991

4,568090093

10,15131132

26

39,34427892

-0,344278918

0,882766457

27

144,4794501

-57,57945009

66,25943623

28

56,4827667

-16,4827667

41,20691675

29

95,38240332

-15,38240332

19,22800415

30

228,6988826

-1,698882564

0,748406416

31

222,8067278

12,19327221

5,188626473

32

38,81483144

1,185168555

2,962921389

33

48,36325811

18,63674189

27,81603267

34

126,6080021

-3,608002113

2,933335051

35

84,85052935

15,14947065

15,14947065

36

116,7991162

-11,79911625

11,23725357

37

84,17648426

-13,87648426

19,73895342

38

113,9412801

-31,94128011

38,95278062

39

215,494184

64,50581599

23,03779142

40

141,7795953

58,22040472

29,11020236

Orta

101,2375

22,51770962

Nisbi səhvlər sütunundan istifadə edərək orta dəyəri tapırıq =22.51% (ORTA funksiyasından istifadə etməklə).

Müqayisə göstərir ki, 22,51%>7%. Nəticədə, modelin dəqiqliyi qənaətbəxş deyil.

İstifadə etməklə F – Fisher meyarı Bütövlükdə modelin əhəmiyyətini yoxlayaq. Bunun üçün biz “Reqressiya” alətindən istifadənin nəticələrini yazacağıq (model (6) üçün “diferensiyanın təhlili” cədvəli) F= 39,6702.

FRIST funksiyasından istifadə edərək dəyəri tapırıq F cr =3.252 əhəmiyyət səviyyəsinə görə α = 5%, və sərbəstlik dərəcələrinin sayı k 1 = 2 , k 2 = 37 .

F> F cr, buna görə də (6) modelin tənliyi əhəmiyyətlidir, onun istifadəsi məqsədəuyğundur, asılı dəyişən Y(6) modelə daxil olan amil dəyişənləri tərəfindən kifayət qədər yaxşı təsvir edilmişdir. X 1 , X 2. Və X 4 .

Əlavə olaraq istifadə t -Tələbə t testi Modelin fərdi əmsallarının əhəmiyyətini yoxlayaq.

t–Reqressiya tənliyinin əmsalları üçün statistik məlumatlar “Reqressiya” alətinin nəticələrində verilmişdir. Seçilmiş model üçün aşağıdakı dəyərlər əldə edilmişdir (6):


Oranlar

Standart səhv

t-statistika

P-Dəyəri

Aşağı 95%

Ən yaxşı 95%

Aşağı 95.0%

Ən yaxşı 95.0%

Y kəsişməsi

-5,643572321

12,07285417

-0,46745966

0,642988

-30,1285

18,84131

-30,1285

18,84131

X4

2,591405557

0,461440597

5,61590284

2.27E-06

1,655561

3,52725

1,655561

3,52725

X1

6,85963077

9,185748512

0,74676884

0,460053

-11,7699

25,48919

-11,7699

25,48919

X2

-1,985156991

7,795346067

-0,25465925

0,800435

-17,7949

13,82454

-17,7949

13,82454

Kritik dəyər t crəhəmiyyət səviyyəsinə görə tapılır α=5% və sərbəstlik dərəcələrinin sayı k=40–2–1=37 . t cr =2.026 (STUDAR funksiyası).

Pulsuz bahislər üçün α =–5.643 statistika müəyyən edilmişdir
, t cr Buna görə də sərbəst əmsal əhəmiyyətli deyil və modeldən xaric edilə bilər.

Reqressiya əmsalı üçün β 1 =6.859 statistika müəyyən edilmişdir
, β 1 əhəmiyyətli deyil, bu və regional şəhər faktoru modeldən çıxarıla bilər.

Reqressiya əmsalı üçün β 2 =-1,985 statistika müəyyən edilmişdir
, t cr, buna görə də reqressiya əmsalı β 2 əhəmiyyətli deyil, bu və mənzildə otaqların sayı amili modeldən xaric edilə bilər.

Reqressiya əmsalı üçün β 4 =2.591 statistika müəyyən edilmişdir
, >t cr, deməli, reqressiya əmsalı β 4 əhəmiyyətlidir, bu və mənzilin yaşayış sahəsi faktoru modeldə saxlanıla bilər.

Model əmsallarının əhəmiyyəti ilə bağlı nəticələr əhəmiyyətlilik səviyyəsində aparılır α=5%. P-dəyəri sütununa baxaraq qeyd edirik ki, sərbəst əmsal α 0,64 = 64% səviyyəsində əhəmiyyətli hesab edilə bilər; reqressiya əmsalı β 1 – 0,46 = 46% səviyyəsində; reqressiya əmsalı β 2 – 0,8 = 80% səviyyəsində; və reqressiya əmsalı β 4 – 2.27E-06= 2.26691790951854E-06 = 0.0000002% səviyyəsində.

Tənliyə yeni amil dəyişənləri əlavə edildikdə təyinetmə əmsalı avtomatik olaraq artır R 2 və azalır orta səhv yaxınlaşma, baxmayaraq ki, bu, həmişə modelin keyfiyyətini yaxşılaşdırmır. Buna görə də, modelin (3) və seçilmiş çoxsaylı modelin (6) keyfiyyətini müqayisə etmək üçün normallaşdırılmış təyin əmsallarından istifadə edirik.

Beləliklə, reqressiya tənliyinə “rayon şəhəri” amilini əlavə edərkən X 1 və "mənzildəki otaqların sayı" amili X 2 modelin keyfiyyəti pisləşdi, bu da amillərin aradan qaldırılmasının lehinə danışır X 1 və X Modeldən 2.

Gəlin əlavə hesablamalar aparaq.

Orta elastiklik əmsalları xətti model halında düsturlarla müəyyən edilir
.

AVERAGE funksiyasından istifadə edərək tapırıq: S Y, yalnız amilin artması ilə X 4 onun biri üçün standart sapma– 0,914 artır S Y

Delta əmsalları düsturlarla müəyyən edilir
.

Excel proqramında “Məlumatların təhlili” paketinin “Korrelyasiya” alətindən istifadə etməklə qoşa korrelyasiya əmsallarını tapaq.


Y

X1

X2

X4

Y

1

X1

-0,01126

1

X2

0,751061

-0,0341

1

X4

0,874012

-0,0798

0,868524

1

Determinasiya əmsalı əvvəllər müəyyən edilib və 0,7677-yə bərabərdir.

Delta əmsallarını hesablayaq:

;

Δ 1-dən bəri 1 X 2 səhv seçilmiş və onları modeldən çıxarmaq lazımdır. Bu o deməkdir ki, nəticədə yaranan xətti üç faktorlu modelin tənliyinə görə nəticədə yaranan əmsalın dəyişməsi Y(mənzil qiymətləri) 104% faktorun təsiri ilə izah olunur X 4 (mənzilin yaşayış sahəsi), 4% faktordan təsirlənir X 2 (otaqların sayı), faktorun təsiri ilə 0,0859% X 1 (rayon şəhəri).

Reqressiya təhlili müəyyən bir parametrin bir və ya bir neçə müstəqil dəyişəndən asılılığını göstərməyə imkan verən statistik tədqiqat üsuludur. Kompüterdən əvvəlki dövrdə onun istifadəsi olduqca çətin idi, xüsusən də söhbət böyük həcmli məlumatlardan gedirdi. Bu gün Excel-də reqressiya qurmağı öyrənərək, bir neçə dəqiqə ərzində mürəkkəb statistik problemləri həll edə bilərsiniz. Aşağıda iqtisadiyyat sahəsindən konkret nümunələr verilmişdir.

Reqressiyanın növləri

Bu anlayışın özü riyaziyyata 1886-cı ildə daxil edilmişdir. Reqressiya baş verir:

  • xətti;
  • parabolik;
  • sakitləşdirici;
  • eksponensial;
  • hiperbolik;
  • nümayişkaranə;
  • loqarifmik.

Misal 1

6 sənaye müəssisəsində işdən çıxan komanda üzvlərinin sayının orta əmək haqqından asılılığının müəyyən edilməsi problemini nəzərdən keçirək.

Tapşırıq. Altı müəssisədə orta aylıq göstəriciləri təhlil etdik əmək haqqı səbəbiylə işdən çıxan işçilərin sayı istəyi ilə. Cədvəl şəklində bizdə:

İşdən çıxan insanların sayı

Maaş

30.000 rubl

35.000 rubl

40.000 rubl

45.000 rubl

50.000 rubl

55.000 rubl

60.000 rubl

6 müəssisədə işdən çıxan işçilərin sayının orta əməkhaqqından asılılığını müəyyən etmək tapşırığı üçün reqressiya modeli Y = a 0 + a 1 x 1 +...+a k x k tənliyi formasına malikdir, burada x i dəyişənlərə təsir edən a i reqressiya əmsalları, k isə amillərin sayıdır.

Bu problem üçün Y işçilərin işdən çıxarılmasının göstəricisidir, təsir edən amil isə X ilə işarə etdiyimiz əmək haqqıdır.

Excel elektron cədvəl prosessorunun imkanlarından istifadə

Excel-də reqressiya təhlilindən əvvəl mövcud cədvəl məlumatlarına daxili funksiyalar tətbiq edilməlidir. Bununla belə, bu məqsədlər üçün çox faydalı "Analiz Paketi" əlavəsindən istifadə etmək daha yaxşıdır. Onu aktivləşdirmək üçün sizə lazımdır:

  • "Fayl" sekmesinden "Seçimlər" bölməsinə keçin;
  • açılan pəncərədə "Əlavələr" sətrini seçin;
  • aşağıda, "İdarəetmə" xəttinin sağında yerləşən "Get" düyməsini basın;
  • "Analiz paketi" adının yanındakı qutuyu işarələyin və "Ok" düyməsini klikləməklə hərəkətlərinizi təsdiqləyin.

Hər şey düzgün aparılırsa, Excel iş vərəqinin yuxarısında yerləşən "Məlumat" sekmesinin sağ tərəfində tələb olunan düymə görünəcək.

Excel-də

İndi ekonometrik hesablamalar aparmaq üçün əlimizdə bütün zəruri virtual alətlər var, biz problemimizi həll etməyə başlaya bilərik. Bunun üçün:

  • "Məlumatların təhlili" düyməsini basın;
  • açılan pəncərədə “Reqressiya” düyməsini sıxın;
  • görünən sekmədə Y (işdən çıxan işçilərin sayı) və X (onların maaşları) üçün dəyərlər diapazonunu daxil edin;
  • "Ok" düyməsini basaraq hərəkətlərimizi təsdiq edirik.

Nəticədə, proqram avtomatik olaraq reqressiya təhlili məlumatları ilə yeni cədvəl dolduracaq. Qeyd! Excel, bu məqsəd üçün üstünlük verdiyiniz yeri əl ilə təyin etməyə imkan verir. Məsələn, bu, Y və X dəyərlərinin yerləşdiyi eyni vərəq və ya hətta bu cür məlumatları saxlamaq üçün xüsusi olaraq hazırlanmış yeni bir iş kitabı ola bilər.

R-kvadrat üçün reqressiya nəticələrinin təhlili

Excel-də, nəzərdən keçirilən nümunədəki məlumatların işlənməsi zamanı əldə edilən məlumatlar formaya malikdir:

İlk növbədə, R-kvadrat dəyərinə diqqət yetirməlisiniz. Determinasiya əmsalını təmsil edir. Bu nümunədə R-kvadrat = 0,755 (75,5%), yəni modelin hesablanmış parametrləri nəzərdən keçirilən parametrlər arasındakı əlaqəni 75,5% izah edir. Təyinetmə əmsalının dəyəri nə qədər yüksək olarsa, seçilmiş model konkret tapşırıq üçün bir o qədər uyğundur. R-kvadrat dəyəri 0,8-dən yuxarı olduqda real vəziyyəti düzgün təsvir etmək hesab olunur. R kvadratı varsa<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

Oranların təhlili

64.1428 rəqəmi, nəzərdən keçirdiyimiz modeldəki bütün xi dəyişənləri sıfıra sıfırlansa, Y-nin dəyərinin nə olacağını göstərir. Başqa sözlə, təhlil edilən parametrin dəyərinə konkret modeldə təsvir olunmayan digər amillərin də təsir etdiyini iddia etmək olar.

B18 xanasında yerləşən növbəti əmsal -0,16285, X dəyişəninin Y-yə təsirinin çəkisini göstərir. Bu o deməkdir ki, nəzərdən keçirilən model daxilində işçilərin orta aylıq əmək haqqı -0,16285 çəkisi ilə işdən çıxanların sayına təsir edir, yəni. onun təsir dərəcəsi tamamilə kiçikdir. "-" işarəsi əmsalın mənfi olduğunu göstərir. Bu, açıq-aydındır, çünki hamı bilir ki, müəssisədə əmək haqqı nə qədər yüksək olarsa, bir o qədər az adam əmək müqaviləsinə xitam vermək və ya işdən çıxmaq arzusunu bildirir.

Çoxsaylı reqressiya

Bu termin formanın bir neçə müstəqil dəyişəni ilə əlaqə tənliyinə istinad edir:

y=f(x 1 +x 2 +…x m) + ε, burada y nəticə xarakteristikasıdır (asılı dəyişən), x 1, x 2,…x m isə faktor xarakteristikasıdır (müstəqil dəyişənlər).

Parametrlərin qiymətləndirilməsi

Çoxlu reqressiya (MR) üçün metoddan istifadə etməklə həyata keçirilir ən kiçik kvadratlar(MNC). Y = a + b 1 x 1 +…+b m x m + ε formalı xətti tənliklər üçün normal tənliklər sistemi qururuq (aşağıya bax)

Metodun prinsipini başa düşmək üçün iki faktorlu bir işi nəzərdən keçirin. Sonra düsturla təsvir olunan bir vəziyyətimiz var

Buradan əldə edirik:

burada σ indeksdə əks olunan müvafiq əlamətin dispersiyasıdır.

OLS standartlaşdırılmış miqyasda MR tənliyinə tətbiq olunur. Bu vəziyyətdə tənliyi alırıq:

t y, t x 1, … t xm standartlaşdırılmış dəyişənlərdir, onların orta dəyərləri 0-a bərabərdir; β i standartlaşdırılmış reqressiya əmsallarıdır, standart kənarlaşma isə 1-dir.

Nəzərə alın ki, bütün β i in bu halda standartlaşdırılmış və mərkəzləşdirilmiş kimi göstərilmişdir, ona görə də onların bir-biri ilə müqayisəsi düzgün və məqbul hesab olunur. Bundan əlavə, ən aşağı βi dəyərlərinə malik olanları ataraq faktorları yoxlamaq adətdir.

Xətti reqressiya tənliyindən istifadə məsələsi

Tutaq ki, son 8 ayda konkret N məhsulunun qiymət dinamikası cədvəlimiz var. Onun bir partiyasını 1850 rubl / t qiymətə satın almağın məqsədəuyğunluğu barədə qərar qəbul etmək lazımdır.

ay nömrəsi

ay adı

məhsulun qiyməti N

ton başına 1750 rubl

Ton üçün 1755 rubl

Ton üçün 1767 rubl

Ton üçün 1760 rubl

Ton üçün 1770 rubl

Ton üçün 1790 rubl

Ton üçün 1810 rubl

Ton üçün 1840 rubl

Excel elektron cədvəl prosessorunda bu problemi həll etmək üçün yuxarıda göstərilən nümunədən məlum olan "Məlumatların Təhlili" alətindən istifadə etməlisiniz. Sonra, "Reqressiya" bölməsini seçin və parametrləri təyin edin. Yadda saxlamaq lazımdır ki, "Giriş intervalı Y" sahəsinə asılı dəyişən üçün (bu halda ilin müəyyən aylarında malların qiymətləri) və "Giriş intervalı X" üçün bir sıra dəyərlər daxil edilməlidir. - müstəqil dəyişən üçün (ay nömrəsi). "Ok" düyməsini basaraq hərəkəti təsdiqləyin. Yeni vərəqdə (əgər göstərilibsə) reqressiya üçün məlumat əldə edirik.

Onlardan istifadə edərək, y=ax+b formalı xətti tənlik qururuq, burada a və b parametrləri ayın nömrəsinin adı olan xəttin əmsalları və əmsalları və “Y-kəsişməsi” ilə vərəqdən sətirlərdir. nəticələr reqressiya təhlili. Beləliklə, 3-cü tapşırıq üçün xətti reqressiya tənliyi (LR) aşağıdakı kimi yazılır:

Məhsulun qiyməti N = 11.714* ay nömrəsi + 1727.54.

və ya cəbri qeydlərdə

y = 11,714 x + 1727,54

Nəticələrin təhlili

Yaranan xətti reqressiya tənliyinin adekvat olub-olmadığını müəyyən etmək üçün çoxlu korrelyasiya (MCC) və təyinetmə əmsallarından, həmçinin Fisher testindən və Student t testindən istifadə olunur. Reqressiya nəticələri ilə Excel cədvəlində onlar müvafiq olaraq çoxlu R, R-kvadrat, F-statistik və t-statistik adlanır.

KMC R müstəqil və asılı dəyişənlər arasında ehtimal əlaqəsinin yaxınlığını qiymətləndirməyə imkan verir. Onun yüksək dəyəri “Ayın sayı” və “1 ton üçün rublla N məhsulunun qiyməti” dəyişənləri arasında kifayət qədər güclü əlaqə olduğunu göstərir. Ancaq bu əlaqənin mahiyyəti naməlum olaraq qalır.

R2 (RI) təyin əmsalının kvadratı ümumi səpilmə nisbətinin ədədi xarakteristikasıdır və eksperimental məlumatların hansı hissəsinin səpələnməsini göstərir, yəni. asılı dəyişənin dəyərləri xətti reqressiya tənliyinə uyğundur. Baxılan problemdə bu dəyər 84,8%-ə bərabərdir, yəni statistik məlumatlar əldə edilən SD tərəfindən yüksək dərəcədə dəqiqliklə təsvir olunur.

F-statistika, həmçinin Fişer testi adlanır, xətti əlaqənin əhəmiyyətini qiymətləndirmək, onun mövcudluğu ilə bağlı fərziyyəni təkzib etmək və ya təsdiqləmək üçün istifadə olunur.

(Tələbə testi) xətti əlaqənin naməlum və ya sərbəst müddəti ilə əmsalın əhəmiyyətini qiymətləndirməyə kömək edir. Əgər t-testinin qiyməti > t cr olarsa, o zaman sərbəst terminin əhəmiyyətsizliyi haqqında fərziyyə xətti tənlik rədd edildi.

Sərbəst termin üçün nəzərdən keçirilən problemdə, Excel alətlərindən istifadə edərək, t = 169.20903 və p = 2.89E-12 olduğu, yəni sərbəst terminin əhəmiyyətsizliyi ilə bağlı düzgün fərziyyənin rədd edilməsi ehtimalımız sıfırdır. . Naməlum üçün əmsal üçün t=5,79405, və p=0,001158. Başqa sözlə, naməlum üçün əmsalın əhəmiyyətsizliyi haqqında düzgün fərziyyənin rədd edilmə ehtimalı 0,12% təşkil edir.

Beləliklə, ortaya çıxan xətti reqressiya tənliyinin adekvat olduğunu iddia etmək olar.

Səhmlər blokunun alınmasının məqsədəuyğunluğu problemi

Excel-də çoxlu reqressiya eyni Məlumat Təhlili alətindən istifadə etməklə həyata keçirilir. Xüsusi bir tətbiq problemini nəzərdən keçirək.

NNN şirkətinin rəhbərliyi MMM SC-də 20% payın alınmasının məqsədəuyğunluğu barədə qərar verməlidir. Paketin dəyəri (SP) 70 milyon ABŞ dollarıdır. NNN mütəxəssisləri oxşar əməliyyatlar haqqında məlumat toplayıblar. Səhmlər blokunun dəyərinin milyonlarla ABŞ dolları ilə ifadə olunan parametrlər üzrə qiymətləndirilməsi qərara alınıb:

  • kreditor borcları (VK);
  • illik dövriyyənin həcmi (VO);
  • debitor borcları (VD);
  • əsas vəsaitlərin dəyəri (COF).

Bundan əlavə, müəssisənin əmək haqqı borcunun (V3 P) minlərlə ABŞ dolları parametrindən istifadə olunur.

Excel elektron cədvəl prosessorundan istifadə edərək həll

Əvvəlcə mənbə məlumat cədvəlini yaratmalısınız. Bu belə görünür:

  • "Məlumatların Təhlili" pəncərəsinə zəng edin;
  • "Reqressiya" bölməsini seçin;
  • "Giriş intervalı Y" xanasına G sütunundan asılı dəyişənlərin dəyər diapazonunu daxil edin;
  • "Giriş intervalı X" pəncərəsinin sağındakı qırmızı ox ilə işarəni vurun və vərəqdəki B, C, D, F sütunlarından bütün dəyərlərin diapazonunu vurğulayın.

"Yeni iş vərəqi" elementini qeyd edin və "Ok" düyməsini basın.

Verilmiş problem üçün reqressiya analizini əldə edin.

Nəticələrin və nəticələrin öyrənilməsi

Excel cədvəlində yuxarıda göstərilən dairəvi məlumatlardan reqressiya tənliyini "toplayırıq":

SP = 0.103*SOF + 0.541*VO - 0.031*VK +0.405*VD +0.691*VZP - 265.844.

Daha tanış olan riyazi formada onu belə yazmaq olar:

y = 0,103*x1 + 0,541*x2 - 0,031*x3 +0,405*x4 +0,691*x5 - 265,844

MMM ASC üçün məlumatlar cədvəldə təqdim olunur:

Onları reqressiya tənliyində əvəz etsək, 64,72 milyon ABŞ dolları rəqəmi alırıq. Bu o deməkdir ki, MMM SC-nin səhmləri almağa dəyməz, çünki onların 70 milyon ABŞ dolları dəyəri kifayət qədər şişirdilmişdir.

Gördüyünüz kimi, Excel cədvəlindən və reqressiya tənliyindən istifadə çox konkret əməliyyatın mümkünlüyü ilə bağlı əsaslandırılmış qərar qəbul etməyə imkan verdi.

İndi reqressiyanın nə olduğunu bilirsiniz. Yuxarıda müzakirə olunan Excel nümunələri ekonometrika sahəsində praktiki problemləri həll etməyə kömək edəcəkdir.

Mürəkkəb hadisələri öyrənərkən ikidən çox təsadüfi faktoru nəzərə almaq lazımdır. Bu amillər arasındakı əlaqənin mahiyyətinin düzgün başa düşülməsi yalnız nəzərdən keçirilən bütün təsadüfi amillərin bir anda araşdırılması ilə əldə edilə bilər. Üç və ya daha çox təsadüfi amilin birgə tədqiqi tədqiqatçıya tədqiq olunan hadisələr arasında səbəb-nəticə asılılıqları haqqında az və ya çox əsaslı fərziyyələr yaratmağa imkan verəcək. Çoxlu əlaqənin sadə forması üç xüsusiyyət arasındakı xətti əlaqədir. Təsadüfi amillər kimi işarələnir X 1 , X 2 və X 3. arasında qoşalaşmış korrelyasiya əmsalları X 1 və X 2 kimi qeyd olunur r 12 arasında müvafiq olaraq X 1 və X 3 - r 12, arasında X 2 və X 3 - r 23. Üç xüsusiyyət arasındakı xətti əlaqənin yaxınlığının ölçüsü kimi, çoxlu korrelyasiya əmsallarından istifadə olunur, işarələnir. R 1-23, R 2-13, R 3 ּ 12 və qismən korrelyasiya əmsalları, işarələnmişdir r 12.3 , r 13.2 , r 23.1 .

Üç amilin çoxsaylı korrelyasiya əmsalı R 1.23 faktorlardan biri (nöqtədən əvvəlki indeks) və digər iki amilin (nöqtədən sonrakı indekslər) birləşməsi arasındakı xətti əlaqənin yaxınlığının göstəricisidir.

R əmsalının dəyərləri həmişə 0-dan 1-ə qədərdir. R birinə yaxınlaşdıqca üç xüsusiyyət arasındakı xətti əlaqənin dərəcəsi artır.

Çoxsaylı korrelyasiya əmsalı arasında, məs. R 2 ּ 13 və iki cüt korrelyasiya əmsalı r 12 və r 23 bir əlaqə var: qoşalaşmış əmsalların hər biri mütləq qiymətdən çox ola bilməz R 2-13.

Çox korrelyasiya əmsallarının hesablanması üçün düsturlar zaman məlum dəyərlər r 12, r 13 və r 23 cüt korrelyasiya əmsalları formaya malikdir:

Kvadrat çoxlu korrelyasiya əmsalı R 2 adlanır əmsal çoxlu təyin. Tədqiq olunan amillərin təsiri altında asılı dəyişənin dəyişmə nisbətini göstərir.

Çoxlu korrelyasiyanın əhəmiyyəti ilə qiymətləndirilir F-meyar:

n – nümunə ölçüsü; k – amillərin sayı. Bizim vəziyyətimizdə k = 3.

populyasiyada çoxlu korrelyasiya əmsalının sıfıra bərabərliyi haqqında sıfır fərziyyə ( h o:r=0) qəbul edilir f f<f t, və əgər rədd edilir
f f ³ f T.

nəzəri dəyər f-meyarlar müəyyən edilir v 1 = k- 1 və v 2 = n - k sərbəstlik dərəcələri və qəbul edilmiş əhəmiyyət səviyyəsi a (Əlavə 1).

Çoxlu korrelyasiya əmsalının hesablanması nümunəsi. Faktorlar arasındakı əlaqəni öyrənərkən cüt korrelyasiya əmsalları əldə edilmişdir ( n =15): r 12 ==0,6; g 13 = 0,3; r 23 = - 0,2.

Xüsusiyyətin asılılığını tapmaq lazımdır X 2 işarədən X 1 və X 3, yəni çoxsaylı korrelyasiya əmsalını hesablayın:

Cədvəl dəyəri F-kriteriyalar n 1 = 2 və n 2 = 15 – 3 = 12 sərbəstlik dərəcəsi ilə a = 0,05 F 0,05 = 3,89 və a = 0,01-də F 0,01 = 6,93.

Beləliklə, işarələr arasındakı əlaqə R 2.13 = 0.74 əhəmiyyətlidir
1% əhəmiyyətlilik səviyyəsi F f > F 0,01 .

Çoxlu təyin əmsalına görə R 2 = (0,74) 2 = 0,55, əlamət dəyişikliyi X 2 tədqiq olunan amillərin təsiri ilə 55% bağlıdır və variasiyanın 45% (1-R 2) bu dəyişənlərin təsiri ilə izah edilə bilməz.

Qismən xətti korrelyasiya

Qismən korrelyasiya əmsalı iki xüsusiyyətin konyuqasiya dərəcəsini ölçən göstəricidir.

Riyazi statistika, xüsusi bir təcrübə keçirmədən, lakin qoşalaşmış korrelyasiya əmsallarından istifadə edərək, üçüncünün sabit dəyəri ilə iki xüsusiyyət arasında korrelyasiya qurmağa imkan verir. r 12 , r 13 , r 23 .

Qismən korrelyasiya əmsalları düsturlardan istifadə etməklə hesablanır:

Nöqtədən əvvəlki rəqəmlər əlaqənin hansı xüsusiyyətlərin tədqiq edildiyini, nöqtədən sonrakı rəqəm isə hansı xüsusiyyətin təsirinin xaric edildiyini (aradan qaldırıldığını) göstərir. Qismən korrelyasiya üçün xəta və əhəmiyyətlilik meyarı cüt korrelyasiya üçün olduğu kimi eyni düsturlardan istifadə etməklə müəyyən edilir:

.

Nəzəri dəyər t-üçün meyar müəyyən edilir v = n– 2 sərbəstlik dərəcəsi və qəbul edilmiş əhəmiyyət səviyyəsi a (Əlavə 1).

Populyasiyada qismən korrelyasiya əmsalının sıfıra bərabər olduğu sıfır fərziyyə ( H o: r= 0) qəbul edilir t f< t t, və əgər rədd edilir
t f ³ t T.

Qismən əmsallar -1 ilə +1 arasında dəyərlər qəbul edə bilər. Şəxsi təyinetmə əmsalları qismən korrelyasiya əmsallarının kvadratı ilə tapılır:

D 12.3 = r 2 12ּ3 ; d 13.2 = r 2 13ּ2 ; d 23ּ1 = r 2 23ּ1.

Fərdi amillərin təsirli əlamətə qismən təsir dərəcəsinin müəyyən edilməsi, eyni zamanda onun bu əlaqəni təhrif edən digər əlamətlərlə əlaqəsini istisna etmək (aradan qaldırmaq) çox vaxt böyük maraq doğurur. Bəzən elə olur ki, ləğv edilmiş xarakteristikanın sabit dəyəri ilə onun digər xüsusiyyətlərin dəyişkənliyinə statistik təsirini müşahidə etmək mümkün olmur. Qismən korrelyasiya əmsalının hesablanması texnikasını başa düşmək üçün bir nümunə nəzərdən keçirin. Üç variant var X, YZ. Nümunə ölçüsü üçün n= 180 qoşalaşmış korrelyasiya əmsalı müəyyən edilir

r xy = 0,799; r xz = 0,57; r yz = 0,507.

Qismən korrelyasiya əmsallarını təyin edək:

Parametr arasında qismən korrelyasiya əmsalı XY Z (r xyּz = 0.720) göstərir ki, ümumi korrelyasiyada bu xüsusiyyətlər arasındakı əlaqənin yalnız kiçik bir hissəsi ( r xy= 0,799) üçüncü xarakteristikanın təsiri ilə bağlıdır ( Z). Parametr arasındakı qismən korrelyasiya əmsalı ilə bağlı oxşar nəticə çıxarılmalıdır X və parametr Z sabit parametr dəyəri ilə Y (r X zּу = 0,318 və r xz= 0,57). qarşı, qismən əmsal parametrlər arasında korrelyasiya YZ sabit parametr dəyəri ilə X r yz ּ x= 0,105 ümumi korrelyasiya əmsalından əhəmiyyətli dərəcədə fərqlənir r y z = 0.507. Buradan aydın olur ki, eyni parametr dəyərinə malik obyektləri seçsəniz X, sonra işarələr arasındakı əlaqə YZ onlar çox zəif olacaq, çünki bu əlaqənin əhəmiyyətli bir hissəsi parametrin dəyişməsi ilə bağlıdır X.

Bəzi hallarda, qismən korrelyasiya əmsalı cütün işarəsi baxımından əks ola bilər.

Məsələn, xüsusiyyətlər arasındakı əlaqəni öyrənərkən X, YZ- qoşalaşmış korrelyasiya əmsalları əldə edilmişdir (ilə n = 100): r xy = 0,6; r X z= 0,9;
r y z = 0,4.

Üçüncü xüsusiyyətin təsirini istisna edən qismən korrelyasiya əmsalları:

Nümunədən aydın olur ki, dəyərlər cüt əmsalı və qismən korrelyasiya əmsalı işarəsi ilə fərqlənir.

Qismən korrelyasiya üsulu ikinci dərəcəli qismən korrelyasiya əmsalını hesablamağa imkan verir. Bu əmsal üçüncü və dördüncü sabit dəyəri ilə birinci və ikinci xüsusiyyətlər arasındakı əlaqəni göstərir. İkinci dərəcəli qismən əmsalın təyini düsturdan istifadə edərək birinci dərəcəli qismən əmsallara əsaslanır:

Harada r 12 . 4 , r 13 ּ4, r 23 ּ4 - cüt korrelyasiya əmsallarından istifadə edərək dəyəri qismən əmsal düsturu ilə təyin olunan qismən əmsallar r 12 , r 13 , r 14 , r 23 , r 24 , r 34 .

7.1. Xətti reqressiya təhliliən kiçik kvadratlar metodundan istifadə edərək müşahidələr toplusuna qrafikin uyğunlaşdırılmasından ibarətdir. Reqressiya təhlili bəziləri arasında funksional əlaqə qurmağa imkan verir təsadüfi dəyişən Y və bəzi təsirlər Y dəyərlər X. Bu asılılığa reqressiya tənliyi deyilir. sadə var ( y=m*x+b) və cəm ( y=m 1 *x 1 +m 2 *x 2 +... + m k *x k +b) xətti və qeyri-xətti tipli reqressiya.
Kəmiyyətlər arasındakı əlaqə dərəcəsini qiymətləndirmək üçün istifadə olunur Pearson R çoxlu korrelyasiya əmsalı 0-dan 1-ə qədər dəyər ala bilən (korrelyasiya nisbəti). R=0, əgər kəmiyyətlər arasında əlaqə yoxdursa, və R=1 kəmiyyətlər arasında funksional əlaqə varsa. Əksər hallarda R 0-dan 1-ə qədər aralıq dəyərləri qəbul edir. Dəyər R 2çağırdı təyin əmsalı.
Reqressiya asılılığının qurulması vəzifəsi əmsalların vektorunu tapmaqdır Məmsalı olan çoxsaylı xətti reqressiya modeli R maksimum dəyəri alır.
Əhəmiyyəti qiymətləndirmək üçün R tətbiq edilir Fisher F testi, formula ilə hesablanır:

Harada n- təcrübələrin sayı; k– model əmsallarının sayı. Əgər F bəzilərini üstələyir kritik dəyər məlumat üçün nk və qəbul etdi güvən ehtimalı, sonra dəyər Rəhəmiyyətli hesab edilir.

7.2. Alət Reqressiya-dan Analiz paketi aşağıdakı məlumatları hesablamağa imkan verir:

· əmsallar xətti funksiya reqressiya– ən kiçik kvadratlar metodu; reqressiya funksiyasının növü mənbə verilənlərin strukturu ilə müəyyən edilir;

· təyin əmsalı və əlaqədar kəmiyyətlər(cədvəl Reqressiya statistikası);

· reqressiyanın əhəmiyyətini yoxlamaq üçün variasiya cədvəli və kriteriya statistikası(cədvəl Variasiya təhlili );

· hər bir reqressiya əmsalı üçün standart kənarlaşma və onun digər statistik xüsusiyyətləri, bu əmsalın əhəmiyyətini yoxlamağa və onun üçün qurmağa imkan verir. etimad intervalları;

· reqressiya funksiyası dəyərləri və qalıqları- dəyişənin ilkin dəyərləri arasındakı fərqlər Y və reqressiya funksiyasının hesablanmış dəyərləri (cədvəl Balansın çıxarılması);

· artan qaydada sıralanmış Y dəyişəninin dəyərlərinə uyğun gələn ehtimallar(cədvəl Ehtimal çıxışı).

7.3. vasitəsilə seçim alətinə zəng edin Data > Data Analizi > Reqressiya.

7.4. Sahədə Giriş intervalı Y asılı dəyişənin Y dəyərlərindən ibarət aralığın ünvanını daxil edin. Aralıq bir sütundan ibarət olmalıdır.
Sahədə Giriş intervalı X X dəyişəninin dəyərlərini ehtiva edən aralığın ünvanını daxil edin. Aralıq bir və ya bir neçə sütundan ibarət olmalıdır, lakin 16 sütundan çox olmamalıdır. Sahələrdə göstərilibsə Giriş intervalı YGiriş intervalı X aralıqlara sütun başlıqları daxildir, sonra seçim qutusunu yoxlamaq lazımdır Teqlər– bu başlıqlar alət tərəfindən yaradılan çıxış cədvəllərində istifadə olunacaq Reqressiya.
Seçim qutusu Daimi - sıfır reqressiya tənliyinin sabiti olduqda təyin edilməlidir b sıfıra bərabər məcbur edilir.
Seçim Etibarlılıq səviyyəsi defolt olaraq istifadə edilən 0,95-dən fərqli inam səviyyəsinə malik reqressiya əmsalları üçün etimad intervallarının qurulması lazım olduqda təyin edilir. Seçim qutusunu yoxladıqdan sonra Etibarlılıq səviyyəsi Yeni etibarlılıq səviyyəsi dəyərinin daxil edildiyi giriş sahəsi əlçatan olur.
Ərazidə Qalıqlar Dörd seçim var: Qalıqlar, Standartlaşdırılmış balanslar, Balans qrafikiSeçim cədvəli. Onlardan ən azı biri quraşdırılıbsa, cədvəl çıxış nəticələrində görünəcək Balansın çıxarılması, reqressiya funksiyasının dəyərlərini və qalıqları göstərəcək - Y dəyişəninin ilkin dəyərləri ilə reqressiya funksiyasının hesablanmış dəyərləri arasındakı fərqlər. Ərazidə Normal ehtimal Bir seçim var – ; onun quraşdırılması çıxış nəticələrində cədvəl yaradır Ehtimal çıxışı və müvafiq qrafikin qurulmasına gətirib çıxarır.


7.5. Şəkilə uyğun olaraq parametrləri təyin edin. Y dəyərinin birinci dəyişən (adı olan xana daxil olmaqla) və X dəyərinin digər iki dəyişən (adları olan xanalar daxil olmaqla) olduğuna əmin olun. klikləyin tamam.

7.6. Cədvəldə Reqressiya statistikası Aşağıdakı məlumatlar verilir.

Cəm R– növbəti sətirdə verilmiş R 2 təyinetmə əmsalının kökü. Bu göstəricinin başqa adı korrelyasiya indeksi və ya çoxlu korrelyasiya əmsalıdır.

R-kvadrat– təyinetmə əmsalı R 2 ; nisbəti kimi hesablanır kvadratların reqressiya cəmi(C12 xanası) üçün kvadratların ümumi cəmi(C14 hüceyrəsi).

Normallaşdırılmış R-kvadrat düsturla hesablanır

burada n Y dəyişəninin dəyərlərinin sayı, k X dəyişəninin giriş intervalındakı sütunların sayıdır.

Standart səhv– qalıq dispersiyanın kökü (hüceyrə D13).

Müşahidələr– Y dəyişəninin qiymətlərinin sayı.

7.7. IN Dispersiya cədvəli sütunda SS kvadratların cəmləri sütunda verilir df– sərbəstlik dərəcələrinin sayı. sütunda Xanım- dispersiya. Xətdə Reqressiya sütunda f Reqressiyanın əhəmiyyətini yoxlamaq üçün kriteriya statistikasının dəyəri hesablanmışdır. Bu dəyər reqressiya dispersiyasının qalıq dispersiyaya nisbəti kimi hesablanır (D12 və D13 xanaları). Sütunda Əhəmiyyəti F kriteriya statistikasının alınan qiymətinin ehtimalı hesablanır. Əgər bu ehtimal, məsələn, 0,05-dən azdırsa (verilmiş əhəmiyyət səviyyəsi), onda reqressiyanın əhəmiyyətsizliyi haqqında fərziyyə (yəni reqressiya funksiyasının bütün əmsallarının sıfıra bərabər olması fərziyyəsi) rədd edilir və reqressiya əhəmiyyətli hesab edilir. Bu nümunədə reqressiya əhəmiyyətli deyil.

7.8. Aşağıdakı cədvəldə, sütunda Oranlar, sətirdə olarkən reqressiya funksiyasının əmsallarının hesablanmış qiymətləri yazılır Y kəsişməsi sərbəst müddətin dəyəri yazılır b. Sütunda Standart səhvƏmsalların standart kənarlaşmaları hesablanmışdır.
Sütunda t-statistikaƏmsal dəyərlərinin onların standart sapmalarına nisbətləri qeyd olunur. Bunlar reqressiya əmsallarının əhəmiyyəti haqqında fərziyyələri yoxlamaq üçün kriteriya statistikasının dəyərləridir.
Sütunda P-Dəyəri kriteriya statistikasının qiymətlərinə uyğun gələn əhəmiyyət səviyyələri hesablanır. Hesablanmış əhəmiyyətlilik səviyyəsi müəyyən edilmiş əhəmiyyətlilik səviyyəsindən azdırsa (məsələn, 0,05). onda əmsalın sıfırdan əhəmiyyətli dərəcədə fərqləndiyi fərziyyəsi qəbul edilir; əks halda əmsalın sıfırdan cüzi dərəcədə fərqləndiyi fərziyyəsi qəbul edilir. Bu nümunədə yalnız əmsal b sıfırdan əhəmiyyətli dərəcədə fərqlənir, qalanları - əhəmiyyətsizdir.
Sütunlarda Aşağı 95%Ən yaxşı 95% 0,95 etimad səviyyəsi ilə etimad intervallarının sərhədləri verilmişdir. Bu sərhədlər düsturlardan istifadə etməklə hesablanır
Aşağı 95% = Əmsal - Standart Xəta * t α;
Yuxarı 95% = Əmsal + Standart Xəta * t α.
Burada t α- sifarişin miqdarı α (n-k-1) sərbəstlik dərəcələri ilə tələbə t paylamaları. Bu halda α = 0,95. Sütunlarda etimad intervallarının sərhədləri eyni şəkildə hesablanır Aşağı 90.0%Ən yaxşı 90.0%.

7.9. Cədvəli nəzərdən keçirin Balansın çıxarılmasıçıxış nəticələrindən. Bu cədvəl yalnız ərazidə ən azı bir seçim təyin edildikdə çıxış nəticələrində görünür Qalıqlar dialoq qutusu Reqressiya.

Sütunda Müşahidə dəyişən dəyərlərinin seriya nömrələri verilir Y.
Sütunda Proqnozlaşdırılan Y y i = f(x i) reqressiya funksiyasının dəyərləri dəyişənin həmin dəyərləri üçün hesablanır. X, uyğun gəlir seriya nömrəsi i sütunda Müşahidə.
Sütunda Qalıqlar fərqləri (qalıqları) ehtiva edir ε i =Y-y i və sütun Standart balanslar– ε i / s ε nisbətləri kimi hesablanan normallaşdırılmış qalıqlar. burada s ε qalıqların standart kənarlaşmasıdır. Düsturdan istifadə etməklə s ε dəyərinin kvadratı hesablanır

qalıqların orta qiyməti haradadır. Dəyər dispersiya cədvəlindən iki dəyərin nisbəti kimi hesablana bilər: kvadrat qalıqların cəmi (C13 xanası) və cərgədən sərbəstlik dərəcələri Ümumi(hüceyrə B14).

7.10. Cədvəl dəyərlərinə görə Balansın çıxarılması iki növ qrafik qurulur: qalıq qrafiklərseçim cədvəlləri(əgər ərazidə müvafiq variantlar qoyulubsa Qalıqlar dialoq qutusu Reqressiya). Onlar hər bir dəyişən komponent üçün qurulur X ayrıca.

Aktiv balans qrafikləri balanslar göstərilir, yəni. orijinal dəyərlər arasındakı fərqlər Y və dəyişən komponentin hər bir dəyəri üçün reqressiya funksiyasından hesablanır X.

Aktiv seçim cədvəlləri hər dəyişən komponent dəyəri üçün həm orijinal Y dəyərlərini, həm də hesablanmış reqressiya funksiyası dəyərlərini göstərir X.

7.11. Çıxış nəticələrinin sonuncu cədvəli cədvəldir Ehtimal çıxışı. Əgər dialoq qutusunda görünür Reqressiya seçim quraşdırılıb Normal ehtimal qrafası.
Sütun dəyərləri Faiz aşağıdakı kimi hesablanır. Addım hesablanır h = (1/n)*100%, birinci dəyərdir h/2, sonuncu bərabərdir 100 saat/2. İkinci dəyərdən başlayaraq, hər bir sonrakı dəyər bir addım əlavə olunduğu əvvəlki dəyərə bərabərdir h.
Sütunda Y dəyişən qiymətlər verilir Y, artan qaydada sıralanır. Bu cədvəldəki məlumatlara əsasən, sözdə cədvəli normal paylanma . Dəyişənlər arasındakı əlaqənin xətti dərəcəsini vizual olaraq qiymətləndirməyə imkan verir XY.


8. D dispersiya təhlili

8.1. Analiz paketiüç növ dispersiya təhlilinə imkan verir. Müəyyən bir alətin seçimi öyrənilən məlumat dəstindəki amillərin sayı və nümunələrin sayı ilə müəyyən edilir.
eyni nümunəyə aid iki və ya daha çox nümunənin vasitələrinin oxşar olduğu fərziyyəsini yoxlamaq üçün istifadə olunur əhali.
Təkrarlarla iki tərəfli ANOVA daha mürəkkəb variantdır birdəyişənli analiz, hər bir məlumat qrupu üçün birdən çox nümunə daxil olmaqla.
Təkrarlanmadan ikitərəfli ANOVA hər qrupa birdən çox nümunə daxil edilməyən ikitərəfli dispersiya təhlilidir. İki və ya daha çox nümunənin vasitələrinin eyni olduğu fərziyyəsini yoxlamaq üçün istifadə olunur (nümunələr eyni populyasiyaya aiddir).

8.2. Birtərəfli ANOVA

8.2.1. Gəlin məlumatları təhlil üçün hazırlayaq. Yeni vərəq yaradın və sütunları ona köçürün A B C D. İlk iki sətri çıxarın. Hazırlanmış məlumatlar həyata keçirmək üçün istifadə edilə bilər Birtərəfli dispersiya təhlili.

8.2.2. vasitəsilə seçim alətinə zəng edin Məlumat > Məlumatların Təhlili > Birtərəfli ANOVA.Şəkilə uyğun olaraq doldurun. klikləyin tamam.

8.2.3. Cədvəli nəzərdən keçirin Nəticələr: Yoxlayın- təkrarların sayı, məbləğ- sətir üzrə göstərici dəyərlərinin cəmi, Dispersiya– göstəricinin qismən dəyişməsi.

8.2.4. Cədvəl Variasiya təhlili: birinci sütun Variasiya mənbəyi dispersiyaların adını ehtiva edir, SS- kvadratdan kənarlaşmaların cəmi, df- sərbəstlik dərəcəsi, Xanım- orta kvadrat, F-testi faktiki F paylanması. P-dəyəri– tənliklə təkrarlanan dispersiyanın qalıqların dispersiyasına bərabər olması ehtimalı. O, faktorlar və nəticə arasındakı əlaqənin əldə edilmiş kəmiyyət təyininin təsadüfi hesab oluna biləcəyi ehtimalını müəyyən edir. F-kritik nəzəri F dəyəridir və sonradan faktiki F ilə müqayisə edilir.

8.2.5. Bərabərliyin sıfır hipotezi riyazi gözləntilər bərabərsizlik olduqda bütün nümunələr qəbul edilir F-testi < F-kritik. bu fərziyyə rədd edilməlidir. Bu vəziyyətdə nümunələrin orta dəyərləri əhəmiyyətli dərəcədə fərqlənir.

Xətti reqressiyanın qurulması, onun parametrlərinin və əhəmiyyətinin qiymətləndirilməsi paketdən istifadə edərkən daha sürətli həyata keçirilə bilər. Excel təhlili(Reqressiya). Əldə edilən nəticələrin təfsirini nəzərdən keçirək ümumi hal (k izahlı dəyişənlər) nümunə 3.6-ya uyğun olaraq.

Cədvəldə reqressiya statistikası aşağıdakı dəyərlər verilir:

Çoxsaylı R – çoxlu korrelyasiya əmsalı;

R- kvadrat– təyinetmə əmsalı R 2 ;

Normallaşdırılmış R - kvadrat- tənzimlənir R 2 sərbəstlik dərəcələrinin sayına uyğunlaşdırılmışdır;

Standart səhv– reqressiya standart xətası S;

Müşahidələr - müşahidələrin sayı n.

Cədvəldə Variasiya təhlili verilir:

1. Sütun df - bərabər sərbəstlik dərəcələrinin sayı

sim üçün Reqressiya df = k;

sim üçün Qalıqdf = nk – 1;

sim üçün Ümumidf = n– 1.

2. Sütun SS - bərabər kvadratlı kənarlaşmaların cəmi

sim üçün Reqressiya ;

sim üçün Qalıq ;

sim üçün Ümumi .

3. Sütun Xanım düsturla müəyyən edilən fərqlər Xanım = SS/df:

sim üçün Reqressiya– faktor dispersiyası;

sim üçün Qalıq- qalıq dispersiya.

4. Sütun F - hesablanmış dəyər F-düsturdan istifadə etməklə hesablanmış meyar

F = Xanım(reqressiya)/ Xanım(qalan).

5. Sütun Əhəmiyyəti F – hesablanana uyğun gələn əhəmiyyət səviyyəsinin dəyəri F-statistika .

Əhəmiyyəti F= FDIST( F- statistika, df(reqressiya), df(qalan)).

Əhəmiyyəti varsa F < стандартного уровня значимости, то R 2 statistik əhəmiyyətlidir.

Oranlar Standart səhv t-statistika P-dəyəri Aşağı 95% Ən yaxşı 95%
Y 65,92 11,74 5,61 0,00080 38,16 93,68
X 0,107 0,014 7,32 0,00016 0,0728 0,142

Bu cədvəl göstərir:

1. Oranlar– əmsal dəyərləri a, b.

2. Standart xəta– reqressiya əmsallarının standart xətaları S a, Sb.



3. t- statistika- hesablanmış dəyərlər t - düsturla hesablanmış meyarlar:

t-statistik = Əmsallar/Standart xəta.

4.R- dəyər (əhəmiyyət t) hesablanana uyğun gələn əhəmiyyət səviyyəsinin qiymətidir t- statistika.

R-dəyər = STUDİDST(t-statistika, df(qalan)).

Əgər R-məna< стандартного уровня значимости, то соответствующий коэффициент статистически значим.

5. Aşağı 95% və Üst 95%- aşağı və yuxarı hədlər Nəzəri xətti reqressiya tənliyinin əmsalları üçün 95% etimad intervalları.

QALANLARININ GERİ ALINMASI
Müşahidə Proqnozlaşdırılan y Qalıqlar e
72,70 -29,70
82,91 -20,91
94,53 -4,53
105,72 5,27
117,56 12,44
129,70 19,29
144,22 20,77
166,49 24,50
268,13 -27,13

Cədvəldə QALANLARININ GERİ ALINMASI Göstərilmiş:

sütunda Müşahidə- müşahidə nömrəsi;

sütunda qabaqcadan söylənildi y – asılı dəyişənin hesablanmış dəyərləri;

sütunda Qalıqlar e - asılı dəyişənin müşahidə edilən və hesablanmış dəyərləri arasındakı fərq.

Misal 3.6.Ərzaq xərclərinə dair məlumatlar (şərti vahidlər) var y və adambaşına düşən gəlir x doqquz ailə qrupu üçün:

x
y

Excel analiz paketinin (Reqressiya) nəticələrindən istifadə edərək, ərzaq xərclərinin adambaşına düşən gəlirdən asılılığını təhlil edəcəyik.

Reqressiya təhlilinin nəticələri adətən aşağıdakı formada yazılır:

burada reqressiya əmsallarının standart xətaları mötərizədə göstərilmişdir.

Reqressiya əmsalları A = 65,92 və b= 0,107. arasında əlaqə istiqaməti yx reqressiya əmsalının işarəsini müəyyən edir b= 0,107, yəni. əlaqə birbaşa və müsbətdir. Əmsal b= 0,107 göstərir ki, adambaşına düşən gəlirin 1 şərti artması ilə. vahidlər qida xərcləri 0,107 şərti vahid artır. vahidlər

Əldə olunan modelin əmsallarının əhəmiyyətini qiymətləndirək. Əmsalların əhəmiyyəti ( a, b) tərəfindən yoxlanılır t-test:

P-dəyəri ( a) = 0,00080 < 0,01 < 0,05

P-dəyəri ( b) = 0,00016 < 0,01 < 0,05,

buna görə də əmsallar ( a, b) 1% səviyyəsində əhəmiyyətlidir və daha çox 5% əhəmiyyətlilik səviyyəsindədir. Beləliklə, reqressiya əmsalları əhəmiyyətlidir və model ilkin məlumatlara adekvatdır.

Reqressiya qiymətləndirməsinin nəticələri təkcə reqressiya əmsallarının əldə edilmiş qiymətləri ilə deyil, həm də onların müəyyən dəsti ilə (etibar intervalı) uyğun gəlir. 95% ehtimalla əmsallar üçün etibarlılıq intervalları (38.16 – 93.68) üçün a və (0,0728 – 0,142) üçün b.

Modelin keyfiyyəti determinasiya əmsalı ilə qiymətləndirilir R 2 .

Böyüklük R 2 = 0,884 o deməkdir ki, adambaşına düşən gəlir faktoru ərzaq xərclərinin dəyişməsinin (səpələnməsinin) 88,4%-ni izah edə bilər.

Əhəmiyyəti R 2 tərəfindən yoxlanılır F- test: əhəmiyyəti F = 0,00016 < 0,01 < 0,05, следовательно, R 2 1% səviyyəsində əhəmiyyətlidir və daha çox 5% əhəmiyyətlilik səviyyəsindədir.

Cütlü xətti reqressiya vəziyyətində korrelyasiya əmsalı kimi müəyyən edilə bilər . Alınan korrelyasiya əmsalının qiyməti ərzaq xərcləri ilə adambaşına düşən gəlir arasında əlaqənin çox yaxın olduğunu göstərir.



Saytda yeni

>

Ən məşhur