Ev Qarşısının alınması Qoşalaşmış xətti korrelyasiya əmsallarının matrisi. Cüt korrelyasiya əmsalları matrisinin qurulması

Qoşalaşmış xətti korrelyasiya əmsallarının matrisi. Cüt korrelyasiya əmsalları matrisinin qurulması

Əvvəlcə modeldə saat bütün əsas komponentləri daxil edin (hesablanmış dəyərlər mötərizədə göstərilmişdir t-meyarlar):

Modelin keyfiyyəti aşağıdakılarla xarakterizə olunur: çoxlu təyin əmsalı r = 0,517, təqribinin orta nisbi xətası = 10,4%, qalıq dispersiya s 2= 1.79 və F müşahidə oluna bilən = 121. Buna görə F obs > F kr =2,85 at α = 0,05, v 1 = 6, v 2= 14, reqressiya tənliyi əhəmiyyətlidir və reqressiya əmsallarından ən azı biri - β 1, β 2, β 3, β 4 - sıfıra bərabər deyil.

Əgər reqressiya tənliyinin əhəmiyyəti (hipoteza H 0:β 1 = β 2 = β 3 = β 4 = 0 α = 0.05-də yoxlanıldı, sonra reqressiya əmsallarının əhəmiyyəti, yəni. hipotezlər H0: β j = 0 (j = 1, 2, 3, 4), 0,05-dən çox əhəmiyyətlilik səviyyəsində sınaqdan keçirilməlidir, məsələn, α-da = 0.1. Sonra α = 0.1-də, v= 14 bal gücündə t cr = 1.76 və (53.41) tənliyindən aşağıdakı kimi əhəmiyyətli olanlar β 1, β 2, β 3 reqressiya əmsallarıdır.

Əsas komponentlərin bir-biri ilə korrelyasiyalı olmadığını nəzərə alsaq, tənlikdən bütün əhəmiyyətsiz əmsalları dərhal silə bilərik və tənlik formasını alacaqdır.

(53.42)

(53.41) və (53.42) tənliklərini müqayisə etdikdə görürük ki, əhəmiyyətsiz əsas komponentlər istisna olmaqla f 4f 5, tənliyin əmsallarının dəyərlərinə təsir etməmişdir b 0 = 9,52, b 1 = 0,93, b 2 = 0,66 və müvafiq t j (j = 0, 1, 2, 3).

Bu, əsas komponentlərin korrelyasiya edilməməsi ilə əlaqədardır. Burada maraqlı olan ilkin göstəricilər (53.22), (53.23) və əsas komponentlər (53.41), (53.42) üçün reqressiya tənliklərinin paralelliyidir.

(53.42) tənliyi ona görə əhəmiyyətlidir F obs = 194 > F cr = 3.01, α = 0.05-də tapıldı, v 1 = 4, v 2= 16. Tənliyin əmsalları da əhəmiyyətlidir, çünki t j > t cr . = 1,746, α = 0,01-ə uyğundur, v= 16 üçün j= 0, 1, 2, 3. Təyin əmsalı r= 0,486 variasiyanın 48,6% olduğunu göstərir saat ilk üç əsas komponentin təsiri ilə əlaqədardır.

(53.42) tənliyi təqribinin orta nisbi xətası = 9,99% və qalıq dispersiya ilə xarakterizə olunur. s 2 = 1,91.

Əsas komponentlər üzrə reqressiya tənliyi (53.42) ilkin göstəricilərə əsaslanan reqressiya modeli (53.23) ilə müqayisədə bir qədər yaxşı yaxınlaşma xüsusiyyətlərinə malikdir: r= 0,486 > r= 0,469; = 9,99% < (X) = 10,5% və s 2 (f) = 1,91 < s 2 (x) = 1.97. Bundan əlavə, (53.42) tənliyində əsas komponentlərdir xətti funksiyalar bütün ilkin göstəricilər, eyni zamanda (53.23) tənliyinə yalnız iki dəyişən ( x 1x 4). Bir sıra hallarda nəzərə almaq lazımdır ki, (53.42) modeli şərh etmək çətindir, çünki o, üçüncü bir modeli ehtiva edir. əsas komponent f 3şərh etmədiyimiz və ilkin göstəricilərin ümumi dağılmasına töhfəsi ( x 1, ..., x 5) cəmi 8,6% təşkil edir. Lakin, istisna f 3(53.42) tənliyindən modelin yaxınlaşma xassələrini əhəmiyyətli dərəcədə pisləşdirir: r= 0,349; = 12,4% və s 2(f) = 2.41. Sonra gəlirin reqressiya modeli kimi (53.23) tənliyini seçmək məqsədəuyğundur.

Klaster təhlili

IN statistik tədqiqat ilkin məlumatların qruplaşdırılması əsas həll üsuludur təsnifat problemləri, və buna görə də toplanmış məlumatlarla bütün sonrakı iş üçün əsasdır.

Ənənəvi olaraq, bu problem aşağıdakı kimi həll olunur. Bir obyekti təsvir edən çoxlu xüsusiyyətlərdən biri seçilir, tədqiqatçı baxımından ən informativdir və məlumatlar bu xüsusiyyətin dəyərlərinə uyğun olaraq qruplaşdırılır. Əhəmiyyət dərəcəsinə görə öz aralarında sıralanan bir neçə meyar əsasında təsnifat aparmaq lazımdırsa, əvvəlcə təsnifat birinci meyara görə aparılır, sonra nəticələnən siniflərin hər biri ikinci meyara uyğun olaraq alt siniflərə bölünür. və s. Əksər kombinasiyalı statistik qruplaşmalar oxşar şəkildə qurulur.

Təsnifat xarakteristikalarını təşkil etmək mümkün olmayan hallarda çoxölçülü qruplaşdırmanın ən sadə üsulundan - funksional olaraq ilkin xüsusiyyətlərdən asılı olan inteqral göstəricinin (indeks) yaradılması, sonra isə bu göstəriciyə görə təsnifatdan istifadə edilir.

Bu yanaşmanın inkişafı faktor və ya komponent təhlili metodlarından istifadə etməklə əldə edilmiş bir neçə ümumi göstəricilərə (əsas komponentlərə) əsaslanan təsnifat variantıdır.

Bir neçə xüsusiyyət varsa (ilkin və ya ümumiləşdirilmiş), təsnifat problemi digər çoxölçülü təsnifat metodlarından təlim nümunələrinin olmaması ilə fərqlənən klaster təhlili üsulları ilə həll edilə bilər, yəni. əhalinin bölgüsü haqqında a priori məlumat.

Təsnifat probleminin həlli sxemləri arasındakı fərqlər əsasən "oxşarlıq" və "oxşarlıq dərəcəsi" anlayışlarının nə demək olduğu ilə müəyyən edilir.

İşin məqsədi tərtib edildikdən sonra dəyərləri müqayisə etməyə imkan verən keyfiyyət meyarlarını, məqsəd funksiyasını müəyyən etməyə çalışmaq təbiidir. müxtəlif sxemlər təsnifatlar.

İqtisadi tədqiqatlarda məqsəd funksiyası, bir qayda olaraq, obyektlər toplusunda müəyyən edilmiş bəzi parametrləri minimuma endirməlidir (məsələn, avadanlığın təsnifatının məqsədi təmir işləri üçün vaxt və pulun ümumi dəyərini minimuma endirən qruplaşma ola bilər).

Tapşırığın məqsədini rəsmiləşdirmək mümkün olmadığı hallarda, təsnifatın keyfiyyət meyarı tapılan qrupların mənalı şərhinin mümkünlüyü ola bilər.

Aşağıdakı problemi nəzərdən keçirək. Qoy dəst öyrənilsin n hər biri xarakterik olan obyektlər kölçülmüş işarələr. Bu məcmusu müəyyən mənada bircins olan qruplara (sinflərə) bölmək tələb olunur. Eyni zamanda, paylanmanın xarakteri haqqında apriori məlumat praktiki olaraq yoxdur k-ölçülü vektor X siniflər daxilində.

Bölmə nəticəsində əldə edilən qruplar adətən klasterlər* (taksa**, şəkillər), onları tapmaq üsulları klaster analizi adlanır (müvafiq olaraq ədədi taksonomiya və ya öz-özünə öyrənmə ilə nümunənin tanınması).

* Klaster(İngilis dili) - bəzi ümumi xassə ilə xarakterizə olunan elementlər qrupu.

**Tahop(İngilis dili) - istənilən kateqoriyadan olan sistemli qrup.

İki təsnifat problemindən hansının həll edilməli olduğunu ən əvvəldən aydın başa düşmək lazımdır. Adi tipləmə problemi həll olunursa, müşahidələr toplusu nisbətən az sayda qruplaşdırma sahələrinə bölünür (məsələn, interval variasiya seriyası birölçülü müşahidələr zamanı) belə bir bölgənin elementlərinin bir-birinə mümkün qədər yaxın olması üçün.

Digər problemin həlli müşahidə nəticələrinin bir-birindən müəyyən məsafədə yerləşən aydın müəyyən edilmiş çoxluqlara təbii təbəqələşməsini müəyyən etməkdir.

Birinci tipləşdirmə probleminin həmişə həlli varsa, ikinci halda müşahidələr toplusunun çoxluqlara təbii təbəqələşməni aşkar etmədiyi ortaya çıxa bilər, yəni. bir klaster əmələ gətirir.

Bir çox klaster təhlili metodları kifayət qədər elementar olsa da, onların təklif olunduğu işlərin əksəriyyəti son onilliyə aiddir. Bu onunla izah olunur ki effektiv həllçoxlu sayda hesab və məntiqi əməliyyatlar, yalnız kompüter texnologiyasının yaranması və inkişafı ilə mümkün olmuşdur.

Klaster analizi problemlərində ilkin məlumatların təqdim edilməsinin adi forması matrisdir

hər bir sətir ölçmə nəticələrini əks etdirir k yoxlanılan obyektlərdən birində nəzərə alınan işarələr. Xüsusi situasiyalarda həm obyektlərin qruplaşdırılması, həm də xüsusiyyətlərin qruplaşdırılması maraq doğura bilər. Bu iki tapşırıq arasındakı fərqin əhəmiyyətli olmadığı hallarda, məsələn, bəzi alqoritmləri təsvir edərkən biz bu konsepsiyada "xüsusiyyət" termini də daxil olmaqla yalnız "obyekt" terminindən istifadə edəcəyik.

Matris X klaster təhlili problemlərində məlumatların təqdim edilməsinin yeganə yolu deyil. Bəzən ilkin məlumat kvadrat matris şəklində verilir

element r ij yaxınlıq dərəcəsini müəyyən edən i-ci obyekt j-mu.

Əksər klaster analizi alqoritmləri tamamilə məsafələr (və ya yaxınlıq) matrisinə əsaslanır və ya onun ayrı-ayrı elementlərinin hesablanmasını tələb edir, buna görə də məlumatlar formada təqdim olunursa X, onda klasterlərin axtarışı probleminin həllinin birinci mərhələsi obyektlər və ya xüsusiyyətlər arasında məsafələrin və ya yaxınlığın hesablanması metodunun seçilməsi olacaqdır.

Xüsusiyyətlər arasındakı yaxınlığın müəyyən edilməsi məsələsini həll etmək bir qədər asandır. Bir qayda olaraq, xüsusiyyətlərin klaster təhlili ilə eyni məqsədlər güdür faktor təhlili: tədqiq olunan obyektlərin müəyyən tərəfini əks etdirən bir-biri ilə əlaqəli əlamətlər qruplarının müəyyən edilməsi. Bu vəziyyətdə yaxınlıq ölçüsü müxtəlifdir statistik əmsallar rabitə.


Əlaqədar məlumat.


Kollinear olan amillər...

Və kollinear.

4. Modeldə çoxlu reqressiya amillər arasında qoşalaşmış korrelyasiya əmsalları matrisinin təyinedicisi , və sıfıra yaxındır. Bu o deməkdir ki, amillər , və ... amillərin multikollinearlığı.

5. Ekonometrik model üçün xətti tənlik tipli çoxsaylı reqressiya, qoşalaşmış əmsallar matrisi qurulmuşdur xətti korrelyasiya (y– asılı dəyişən; x (1),x (2), x (3), x (4)– müstəqil dəyişənlər):


Kollinear (yaxın əlaqəli) müstəqil (izahedici) dəyişənlər deyilx(2)x(3)

1. Ekonometrik reqressiya modelinin qurulması üçün ilkin məlumatların cədvəli verilmişdir:

Saxta dəyişənlər deyil

iş təcrübəsi

əmək məhsuldarlığı

2. Ət istehlakının istehlakçının gəlir səviyyəsindən və cinsindən asılılığını öyrənərkən tövsiyə edə bilərik...

dummy dəyişən istifadə edin - istehlakçı cinsi

əhalini iki yerə bölün: qadın istehlakçılar və kişi istehlakçılar üçün

3. Mənzilin qiymətindən asılılığını öyrənirik ( saat) yaşayış sahəsindən ( X) və evin növü. Modelə baxılan evlərin növlərini əks etdirən dummy dəyişənlər daxildir: monolit, panel, kərpic. Reqressiya tənliyi alındı: ,
Harada ,
Kərpic və monolit üçün xüsusi reqressiya tənlikləri ...

ev tipli kərpic üçün

monolit ev tipi üçün

4. Təhlil edərkən sənaye müəssisələriüç regionda (Mari El Respublikası, Çuvaşiya Respublikası, Tatarıstan Respublikası) üç qismən reqressiya tənliyi qurulmuşdur:

Mari El Respublikası üçün;

Çuvaşiya Respublikası üçün;

Tatarıstan Respublikası üçün.

Üç qismən reqressiya tənliyini ümumiləşdirən dummy dəyişənlərin növünü və dummy dəyişənləri olan tənliyi göstərin.

5. Ekonometriyada dummy dəyişən... hesab olunur.

0 və 1 dəyərlərini qəbul edən dəyişən

keyfiyyət xarakteristikasını kəmiyyətcə təsvir etmək

1. Əhalinin adambaşına düşən orta pul gəlirindən asılılığın reqressiya modeli üçün (RUB, saat) ümumi regional məhsulun həcmindən (min rubl, x 1) və mövzu üzrə işsizlik səviyyəsi (%, x 2) tənliyi alınır. Dəyişən üçün reqressiya əmsalının qiyməti x 2İşsizlik səviyyəsi 1% dəyişdikdə, ümumi regional məhsulun sabit dəyəri ilə adambaşına düşən orta pul gəlirinin ______ rubl olduğunu göstərir.

(-1,67) kimi dəyişəcək

2. Xətti çoxlu reqressiya tənliyində: , əsas vəsaitlərin dəyəri haradadır (min rubl); – işçilərin sayı (min nəfər); y- həcm sənaye istehsalı(min rubl) dəyişən ilə parametr x 1, 10,8-ə bərabərdir, o deməkdir ki, əsas fondların həcminin _____ artması ilə sənaye istehsalının həcmi _____ işçilərin daimi sayı ilə.


1 min rubl üçün. ... 10,8 min rubl artacaq.

3. Məlumdur ki, asılı dəyişənin qalıq dispersiyasının onun ümumi dispersiyasında payı 0,2-dir. Onda təyinetmə əmsalının qiyməti ... 0,8-dir

4. Mənfəətin asılılığı üçün ekonometrik model qurulmuşdur bir məhsul vahidinin satışı (rub., saat) dəyərdən dövriyyə kapitalı müəssisələr (min rubl, x 1): . Beləliklə, orta ölçülü müəssisənin dövriyyə kapitalının həcmindən asılı olmayan satışdan əldə edilən mənfəət _____ rubl təşkil edir. 10.75

5. F-statistika sərbəstlik dərəcəsinə görə hesablanmış ______ dispersiyasının ________ dispersiyaya nisbəti kimi hesablanır. faktorial...qalıq

1. Ekonometrik reqressiya tənliyi modeli üçün model xətası asılı dəyişənin faktiki dəyəri ilə onun təxmin edilən qiyməti arasında ______ kimi müəyyən edilir. Fərq

2. Kəmiyyətə... deyilir. təsadüfi komponent

3. Reqressiya tənliyinin ekonometrik modelində asılı dəyişənin faktiki qiymətinin onun hesablanmış qiymətindən kənara çıxması ... modelin xətasını xarakterizə edir.

4. Məlumdur ki, ümumi dispersiyada izah edilən dispersiya payı 0,2-dir. Onda təyinetmə əmsalının qiyməti ... 0,2-dir

5. Metodla ən kiçik kvadratlar cüt tənlik parametrləri xətti reqressiya _____ qalıqlar şərtindən müəyyən edilir. kvadratların cəmini minimuma endirmək

1. Qalıqlarda avtokorrelyasiyanı aşkar etmək üçün... istifadə edin.

Durbin-Watson statistikası

2. Məlumdur ki, birinci dərəcəli qalıqların avtokorrelyasiya əmsalı-0,3-ə bərabərdir. Həm də naməlum sayda müşahidə ilə verilmiş bir sıra parametrlər üçün Durbin-Watson statistikasının kritik dəyərləri verilmişdir. Bu xüsusiyyətlərə əsaslanaraq belə nəticəyə gələ bilərik ki... qalıqların avtokorrelyasiyası yoxdur.

1. Cüt korrelyasiya əmsallarının matrisini hesablayın; yaranan xarakteristikanın əlaqəsinin yaxınlığını və istiqamətini təhlil edin Y hər bir faktorla X; qiymətləndirmək statistik əhəmiyyəti korrelyasiya əmsalları r(Y,X i); ən informativ faktoru seçin.

2. Ən informativ faktorla qoşalaşmış reqressiya modelini qurun; reqressiya əmsalının iqtisadi şərhini verin.

3. Yaxınlaşdırmanın orta nisbi xətası, təyinetmə əmsalı və Fişerin F testindən istifadə etməklə modelin keyfiyyətini qiymətləndirin (əhəmiyyət səviyyəsi α=0,05-i qəbul edin).

4. γ=80% etibarlılıq ehtimalı ilə göstəricinin orta qiymətini proqnozlaşdırın Y(amillərin proqnoz qiymətləri Əlavə 6-da verilmişdir). Qrafik olaraq faktiki və model dəyərlərini təqdim edin Y, nəticələrin proqnozlaşdırılması.

5. Daxiletmə metodundan istifadə edərək, onlarda ən informativ faktoru saxlayaraq iki faktorlu modellər qurun; ilə üç faktorlu model qurun tam siyahı amillər.

6. Qurulmuş çoxsaylı modellərdən ən yaxşısını seçin. Onun əmsallarının iqtisadi şərhini verin.

7. Çoxlu reqressiya əmsallarının əhəmiyyətini yoxlayın t– Tələbə testi (əhəmiyyət səviyyəsi α=0,05 qəbul edilir). Çoxlu modelin keyfiyyəti qoşalaşmış modellə müqayisədə yaxşılaşıbmı?

8. Elastiklik əmsallarından, beta və delta əmsallarından istifadə etməklə amillərin nəticəyə təsirini qiymətləndirin.

Tapşırıq 2. Birdəyişənli zaman seriyasının modelləşdirilməsi

Əlavə 7 zaman sıralarını göstərir Y(t)üçün sosial-iqtisadi göstəricilər Altay bölgəsi 2000-ci ildən 2011-ci ilə qədər olan dövr üçün tapşırıq variantına uyğun olan göstəricinin dinamikasını öyrənmək tələb olunur.

Seçim Göstəricinin təyinatı, adı, ölçü vahidi
Y1 Adambaşına orta istehlak xərcləri (ayda), rub.
Y2 Çirkləndiricilərin emissiyaları atmosfer havası, min ton
Y3 Təkrar mənzil bazarında orta qiymətlər (ilin sonunda, ümumi sahənin kvadrat metri üçün), rubl
Y4 Həcmi pullu xidmətlər adambaşına, rub
Y5 İqtisadiyyatda işləyənlərin orta illik sayı, min nəfər
Y6 1000 nəfərə düşən şəxsi minik avtomobillərinin sayı (ilin sonuna), ədəd
Y7 Adambaşına düşən orta pul gəliri (ayda), rub.
Y8 İstehlak qiymətləri indeksi (dekabr ayı əvvəlki ilin dekabr ayı ilə müqayisədə), %
Y9 Əsas kapitala investisiyalar (faktiki qiymətlərlə), milyon rubl
Y10 Adambaşına düşən pərakəndə ticarət dövriyyəsi (faktiki qiymətlərlə), rub.


İş sifarişi

1. Parametrləri ən kiçik kvadratlarla qiymətləndirilə bilən xətti zaman seriyası modelini qurun. Reqressiya əmsalının mənasını izah edin.

2. Təsadüfilik, müstəqillik və qalıq komponentin normal paylanma qanununa uyğunluğu xassələrindən istifadə etməklə qurulmuş modelin adekvatlığını qiymətləndirin.

3. Yaxınlaşdırmanın orta nisbi xətasından istifadə əsasında modelin düzgünlüyünü qiymətləndirin.

4. Nəzərə alınan göstəricini bir il öncədən proqnozlaşdırın (proqnoz intervalını güvən ehtimalı 70%).

5. Göstəricinin faktiki qiymətlərini, modelləşdirmə və proqnozlaşdırma nəticələrini qrafik şəkildə təqdim edin.

6. Loqarifmik, çoxhədli (2-ci dərəcə çoxhədli), güc, eksponensial və hiperbolik meyllərin parametrlərini hesablayın. Qrafik təsvirə və təyinetmə indeksinin dəyərinə əsasən, ən çoxunu seçin uyğun görünüş trend.

7. Ən yaxşı qeyri-xətti modeldən istifadə edərək, gələn il üçün sözügedən göstəricinin nöqtəli proqnozunu hazırlayın. Əldə edilmiş nəticəni xətti modeldən istifadə etməklə qurulmuş inamlı proqnoz intervalı ilə müqayisə edin.

NÜMUNƏ

Edamlar sınaq işi

Problem 1

Şirkət işlənmiş avtomobillərin satışı ilə məşğuldur. Ekonometrik modelləşdirmə üçün göstəricilərin adları və ilkin məlumatlar cədvəldə təqdim olunur:

Satış qiyməti, min.e. Y) ( Yeni maşının qiyməti, min.e.) ( X1) Xidmət müddəti, illər ( X2)
8,33 13,99 3,8
10,40 19,05 2,4
10,60 17,36 4,5
16,58 25,00 3,5
20,94 25,45 3,0
19,13 31,81 3,5
13,88 22,53 3,0
8,80 16,24 5,0
13,89 16,54 2,0
11,03 19,04 4,5
14,88 22,61 4,6
20,43 27,56 4,0
14,80 22,51 3,3
26,05 31,75 2,3

Sol sükanı - 1, sağ sükanı - 0, (

1. Cüt korrelyasiya əmsallarının matrisini hesablayın; nəticədə Y xarakteristikası ilə X amillərinin hər biri arasındakı əlaqənin yaxınlığını və istiqamətini təhlil etmək; r(Y, X i) korrelyasiya əmsallarının statistik əhəmiyyətini qiymətləndirir; ən informativ faktoru seçin.

Excel-dən istifadə edirik (Məlumat / Məlumat Təhlili / KORRELASYON):

Bütün mövcud dəyişənlər arasında ikili korrelyasiya əmsallarının matrisini alırıq:

U Yeni maşının qiyməti, min.e. X1 X2
U
X1 0,910987
X2 -0,4156 -0,2603
X3 0,190785 0,221927 -0,30308

Nəticə xarakteristikası arasındakı korrelyasiya əmsallarını təhlil edək Y və amillərin hər biri X j:

> 0, buna görə də dəyişənlər arasında YX 1 birbaşa korrelyasiya var: yeni avtomobilin qiyməti nə qədər yüksəkdirsə, satış qiyməti də bir o qədər yüksəkdir.

> 0.7 – bu asılılıq yaxındır.

< 0, значит, между переменными YX 2 müşahidə

tərs korrelyasiya: avtomobillər üçün satış qiyməti aşağıdır

uzun xidmət müddəti olan mobil telefonlar.

– bu asılılıq mülayimdir, zəifə yaxındır.

> 0, dəyişənlər arasında deməkdir YX 3 birbaşa korrelyasiya var: satış qiyməti sol sükanlı avtomobillər üçün daha yüksəkdir.

< 0,4 – эта зависимость слабая.

Tapılmış korrelyasiya əmsallarının əhəmiyyətini yoxlamaq üçün Tələbə testindən istifadə edirik.

Hər bir korrelyasiya əmsalı üçün hesablayaq t-formula uyğun statistika və hesablama nəticələrini korrelyasiya cədvəlinin əlavə sütununa daxil edin:

U Yeni maşının qiyməti, min.e. X1 X2 t-statistika
U
X1 0,910987 7,651524603
X2 -0,4156 -0,2603 1,582847988
X3 0,190785 0,221927 -0,30308 0,673265587

Əhəmiyyət səviyyəsində Tələbə paylanmasının kritik nöqtələri cədvəlinə görə və müəyyən etdiyimiz sərbəstlik dərəcələrinin sayı kritik dəyər(Əlavə 1 və ya STUDARASTER funksiyası).Y və xidmət müddəti X 2 etibarlıdır.

< , следовательно, коэффициент не является значимым. На основании выборочных данных нет оснований утверждать, что зависимость между ценой реализации Y və sükan mövqeyi X 3 etibarlıdır.

Beləliklə, satış qiyməti arasında ən yaxın və əhəmiyyətli əlaqə müşahidə olunur Y və yeni maşının qiyməti X 1 ; amil X 1 ən məlumatlandırıcıdır.

y x (1) x (2) x (3) x (4) x (5)
y 1.00 0.43 0.37 0.40 0.58 0.33
x (1) 0.43 1.00 0.85 0.98 0.11 0.34
x (2) 0.37 0.85 1.00 0.88 0.03 0.46
x (3) 0.40 0.98 0.88 1.00 0.03 0.28
x (4) 0.58 0.11 0.03 0.03 1.00 0.57
x (5) 0.33 0.34 0.46 0.28 0.57 1.00

Qoşalaşmış korrelyasiya əmsalları matrisinin təhlili göstərir ki, effektiv göstərici göstərici ilə ən sıx bağlıdır. x(4) - 1 hektara sərf olunan gübrə miqdarı ().

Eyni zamanda atributlar-arqumentlər arasında əlaqə kifayət qədər yaxındır. Beləliklə, təkərli traktorların sayı arasında praktiki olaraq funksional əlaqə var ( x(1)) və yerüstü əkin alətlərinin sayı .

Multikollinearlığın mövcudluğu korrelyasiya əmsalları və ilə də göstərilir. Göstəricilər arasında sıx əlaqəni nəzərə alaraq x (1) , x(2) və x(3) , in reqressiya modeli Onlardan yalnız biri məhsuldarlığa daxil ola bilər.

Multikollinearlığın mənfi təsirini nümayiş etdirmək üçün bütün giriş göstəriciləri daxil olmaqla, gəlirin reqressiya modelini nəzərdən keçirin:

F obs = 121.

Tənliyin əmsallarının təxminlərinin standart sapmalarının düzəldilmiş qiymətləndirmələrinin dəyərləri mötərizədə göstərilir .

Aşağıdakı adekvatlıq parametrləri reqressiya tənliyi altında təqdim olunur: çoxlu təyin əmsalı; qalıq dispersiyanın düzəldilmiş qiymətləndirilməsi, yaxınlaşmanın orta nisbi xətası və F obs = 121 meyarının hesablanmış qiyməti.

Reqressiya tənliyi əhəmiyyətlidir, çünki F obs = 121 > F kp = 2,85 cədvəldən tapıldı F-a=0,05-də paylanmalar; n 1 =6 və n 2 =14.

Buradan belə çıxır ki, Q¹0, yəni. və q tənliyinin əmsallarından ən azı biri j (j= 0, 1, 2, ..., 5) sıfır deyil.

H0 fərdi reqressiya əmsallarının əhəmiyyəti haqqında fərziyyəni yoxlamaq üçün: q j =0, burada j=1,2,3,4,5, kritik dəyəri müqayisə edin t kp = 2.14, cədvəldən tapıldı t-əhəmiyyət səviyyəsində paylanmalar a=2 Q=0,05 və sərbəstlik dərəcələrinin sayı n=14, hesablanmış qiymətlə . Tənlikdən belə çıxır ki, reqressiya əmsalı yalnız olduqda statistik əhəmiyyətlidir x(4) ½ ildən t 4 ½=2,90 > t kp =2.14.



İqtisadi şərhə uyğun deyil mənfi əlamətlər reqressiya əmsalları x(1) və x(5) . Əmsalların mənfi qiymətlərindən belə çıxır ki, kənd təsərrüfatının təkərli traktorlarla doyma səviyyəsinin artması ( x(1)) və bitki sağlamlığı məhsulları ( x(5)) məhsuldarlığa mənfi təsir göstərir. Buna görə də yaranan reqressiya tənliyi qəbuledilməzdir.

Əhəmiyyətli əmsalları olan reqressiya tənliyini əldə etmək üçün istifadə edirik addım-addım alqoritm reqressiya təhlili. Əvvəlcə dəyişənlərin aradan qaldırılması ilə addım-addım alqoritmdən istifadə edirik.

Dəyişənləri modeldən xaric edək x(1) , minimuma uyğundur mütləq dəyər dəyəri ½ t 1 ½=0,01. Qalan dəyişənlər üçün yenidən reqressiya tənliyini qururuq:

Nəticədə yaranan tənlik əhəmiyyətlidir, çünki F müşahidə = 155 > F kp = 2,90, a=0,05 əhəmiyyət səviyyəsində tapılmış və cədvələ uyğun olaraq sərbəstlik dərəcələri n 1 =5 və n 2 =15 F-paylanma, yəni. vektor q¹0. Bununla belə, yalnız reqressiya əmsalı x(4) . Təxmini dəyərlər ½ t j ½ digər əmsallar üçün azdır t kr = 2.131, cədvəldən tapıldı t-a=2-də paylanmalar Q=0,05 və n=15.

Dəyişənləri modeldən çıxarmaqla x(3) , minimum dəyərə uyğundur t 3 =0,35 və reqressiya tənliyini alırıq:

(2.9)

Yaranan tənlikdə əmsal at x(5) . İstisna etməklə x(5) reqressiya tənliyini əldə edirik:

(2.10)

aldıq əhəmiyyətli tənlikəhəmiyyətli və şərh edilə bilən əmsalları olan reqressiyalar.

Bununla belə, ortaya çıxan tənlik nümunəmizdəki yeganə “yaxşı” və “ən yaxşı” gəlir modeli deyil.

Gəlin bunu göstərək multikollinearlıq şəraitində dəyişənlərin daxil edilməsi ilə mərhələli alqoritm daha səmərəlidir. Gəlir modelində ilk addım y dəyişən daxildir x(4) ilə ən yüksək korrelyasiya əmsalı olan y, dəyişəni ilə izah olunur - r(y,x(4))=0,58. Ilə birlikdə tənlik də daxil olmaqla ikinci addımda x(4) dəyişənlər x(1) və ya x(3), biz iqtisadi səbəblərə və statistik xüsusiyyətlərə görə (2.10) aşan modelləri əldə edəcəyik:

(2.11)

(2.12)

Tənliyə qalan üç dəyişəndən hər hansı birinin daxil edilməsi onun xassələrini pisləşdirir. Məsələn, (2.9) tənliyinə baxın.

Beləliklə, iqtisadi və statistik səbəblərdən birini seçməli olduğumuz üç "yaxşı" gəlir modelimiz var.

By statistik meyarlarən adekvat model (2.11)-dir. Qalıq dispersiyanın minimum dəyərlərinə = 2.26 və yaxınlaşmanın orta nisbi səhvinə uyğundur və ən yüksək dəyərlər və F obs = 273.

Bəziləri ən pis performans model (2.12) adekvatlığa malikdir, sonra isə model (2.10).

İndi (2.11) və (2.12) modellərdən ən yaxşısını seçəcəyik. Bu modellər dəyişənlərə görə bir-birindən fərqlənir x(1) və x(3) . Bununla belə, gəlir modellərində dəyişən x(1) (100 ha-da təkərli traktorların sayı) dəyişəndən daha üstündür x(3) (100 ha-ya düşən yerüstü şumlama alətlərinin sayı), bu da müəyyən dərəcədə ikinci dərəcəlidir (və ya x (1)).

Bu baxımdan iqtisadi səbəblərdən (2.12) modelinə üstünlük verilməlidir. Beləliklə, dəyişənlərin daxil edilməsi ilə mərhələli reqressiya təhlili alqoritmini həyata keçirdikdən sonra və üç əlaqəli dəyişəndən yalnız birinin tənliyə daxil olması nəzərə alınmaqla ( x (1) , x(2) və ya x(3)) son reqressiya tənliyini seçin:

Tənlik a=0,05-də əhəmiyyətlidir, çünki F obs = 266 > F kp = 3.20, cədvəldən tapıldı F-a=-da paylanmalar Q=0,05; n 1 =3 və n 2 =17. ½ tənliyindəki bütün reqressiya əmsalları da əhəmiyyətlidir t j½> t kp(a=2 Q=0,05; n=17)=2,11. q 1 reqressiya əmsalı iqtisadi səbəblərə görə əhəmiyyətli hesab edilməlidir (q 1 ¹0), halbuki t 1 =2.09 yalnız bir qədər azdır t kp = 2.11.

Reqressiya tənliyindən belə çıxır ki, 100 hektar əkin sahəsinə düşən traktorların sayında bir artım (sabit qiymətlə) x(4)) taxıl məhsuldarlığının orta hesabla 0,345 s/ha artmasına səbəb olur.

E 1 »0,068 və e 2 »0,161 elastiklik əmsallarının təxmini hesablanması göstərir ki, artan göstəricilərlə x(1) və x(4) 1%, taxıl məhsuldarlığı orta hesabla müvafiq olaraq 0,068% və 0,161% artır.

Çoxsaylı əmsal müəyyən edilməsi göstərir ki, gəlirliliyin yalnız 46,9%-i modelə daxil edilmiş göstəricilərlə izah olunur ( x(1) və x(4)), yəni məhsul istehsalının traktor və gübrələrlə doyması. Dəyişikliyin qalan hissəsi hesablanmayan amillərin təsiri ilə bağlıdır ( x (2) , x (3) , x(5), hava şəraiti və s.). Yaxınlaşdırmanın orta nisbi xətası modelin adekvatlığını, eləcə də qalıq dispersiyanın qiymətini xarakterizə edir. Reqressiya tənliyini şərh edərkən, yaxınlaşmanın nisbi səhvlərinin dəyərləri maraq doğurur. . Xatırladaq ki, - effektiv göstəricinin model dəyəri izahedici dəyişənlərin dəyərləri nəzərə alınmaqla nəzərdən keçirilən rayonların cəmi üçün orta gəlir dəyərini xarakterizə edir. x(1) və x(4) eyni səviyyədə sabitlənir, yəni x (1) = x i(1) və x (4) = xi(4) . Sonra, d dəyərlərinə görə i Bölgələri məhsuldarlığa görə müqayisə edə bilərsiniz. d dəyərlərinin uyğun olduğu sahələr i>0, orta gəlirdən yuxarıdır və d i<0 - ниже среднего.

Nümunəmizdə məhsuldarlıq baxımından əkinçilik d-yə uyğun gələn sahədə ən effektivdir 7 =28%, burada məhsuldarlıq regional orta göstəricidən 28% yüksəkdir və ən az effektivlik d olan ərazidədir. 20 =-27,3%.


Tapşırıqlar və məşqlər

2.1. Ümumi əhalidən ( y, x (1) , ..., x(p)), harada yşərti riyazi gözlənti və dispersiya s 2, təsadüfi seçmə ilə normal paylanma qanununa malikdir n, və qoy ( y i, x i (1) , ..., x i(p)) - nəticə i ci müşahidə ( i=1, 2, ..., n). Müəyyən edin: a) vektorun ən kiçik kvadratlarının riyazi gözləntisini q; b) vektorun ən kiçik kvadratlarının kovariasiya matrisi q; c) qiymətləndirmənin riyazi gözləntiləri.

2.2. 2.1-ci məsələnin şərtlərinə uyğun olaraq, reqressiya ilə bağlı kvadratik kənarlaşmaların cəminin riyazi gözləntisini tapın, yəni. EQ R, Harada

.

2.3. 2.1-ci məsələnin şərtlərinə uyğun olaraq reqressiya xətlərinə nisbətən qalıq variasiya nəticəsində yaranan kvadratik sapmaların cəminin riyazi gözləntisini təyin edin, yəni. EQ ost, harada

2.4. Sübut edin ki, H 0 hipotezi yerinə yetirildikdə: q=0 statistika

sərbəstlik dərəcələri n 1 =p+1 və n 2 =n-p-1 olan F paylanmasına malikdir.

2.5. Sübut edin ki, H 0: q j =0 fərziyyəsi yerinə yetirildikdə, statistik n=n-p-1 sərbəstlik dərəcələrinin sayı ilə t-paylanmasına malikdir.

2.6. Yem çörəyinin büzülməsinin asılılığına dair məlumatlara (cədvəl 2.3) əsasən ( y) saxlama müddətindən ( x) ümumi reqressiya tənliyinin xətti olduğu fərziyyəsi altında şərti gözləntinin nöqtəli qiymətini tapın.

Cədvəl 2.3.

Tələb olunur: a) ümumi reqressiya tənliyinin formasına malik olduğu fərziyyəsi ilə s 2 qalıq dispersiyasının təxminlərini tapmaq; b) a=0,05-də reqressiya tənliyinin əhəmiyyətini yoxlayın, yəni. hipotez H 0: q=0; c) etibarlılığı g=0,9 ilə q 0, q 1 parametrlərinin interval qiymətləndirmələrini təyin edin; d) etibarlılığı g=0,95 ilə şərti riyazi gözləntilərin interval qiymətini təyin edin. X 0 =6; e) g=0,95-də nöqtədə proqnozun etimad intervalını təyin edin X=12.

2.7. Cədvəldə verilmiş 5 ay ərzində səhm qiymətlərinin artım tempinin dinamikası ilə bağlı məlumatlar əsasında. 2.4.

Cədvəl 2.4.

aylar ( x)
y (%)

və ümumi reqressiya tənliyinin formasına malik olması fərziyyəsi tələb olunur: a) həm reqressiya tənliyinin parametrlərinin, həm də s 2 qalıq dispersiyasının təxminlərini müəyyən etmək; b) a=0,01-də reqressiya əmsalının əhəmiyyətini yoxlayın, yəni. hipotezlər H 0: q 1 =0;

c) etibarlılığı g=0,95 ilə q 0 və q 1 parametrlərinin interval qiymətlərini tapın; d) etibarlılığı g=0,9 olduqda şərti riyazi gözləntilərin interval qiymətləndirməsini qurun. x 0 =4; e) g=0,9-da nöqtədə proqnozun etimad intervalını təyin edin x=5.

2.8. Cavan heyvanların çəki artımının dinamikasının tədqiqinin nəticələri Cədvəl 2.5-də verilmişdir.

Cədvəl 2.5.

Ümumi reqressiya tənliyinin xətti olduğunu fərz etsək, tələb olunur: a) həm reqressiya tənliyinin parametrlərinin, həm də s 2 qalıq dispersiyasının təxminlərini müəyyən etmək; b) a=0,05-də reqressiya tənliyinin əhəmiyyətini yoxlayın, yəni. hipotezlər H 0: q=0;

c) etibarlılığı g=0,8 ilə q 0 və q 1 parametrlərinin interval qiymətlərini tapın; d) etibarlılığı g=0,98 ilə şərti riyazi gözləntilərin interval qiymətləndirmələrini müəyyən edin və müqayisə edin. x 0 =3 və x 1 =6;

e) g=0,98-də nöqtədə proqnozun etimad intervalını təyin edin x=8.

2.9. Xərc ( y) tirajından asılı olaraq kitabın bir nüsxəsi ( x) (min nüsxə) nəşriyyat tərəfindən toplanmış məlumatlar ilə xarakterizə olunur (Cədvəl 2.6). Hiperbolik reqressiya tənliyinin ən kiçik kvadratlarının təxminlərini və parametrlərini təyin edin, etibarlılığı g=0.9 ilə qurun. etimad intervalları q 0 və q 1 parametrləri üçün, eləcə də at şərti riyazi gözlənti x=10.

Cədvəl 2.6.

Formanın reqressiya tənliyinin qiymətləndirmələrini və parametrlərini təyin edin, H 0 hipotezini a = 0.05: q 1 = 0-da yoxlayın və q 0 və q 1 parametrləri üçün etibarlılığı g = 0.9 olan inam intervallarını və şərti riyazi gözləntiləri qurun. x=20.

2.11. Cədvəldə 2.8 aşağıdakı makroiqtisadi göstəricilərin artım templəri (%) haqqında məlumatları təqdim etmişdir n=1992-ci il üçün dünyanın 10 inkişaf etmiş ölkəsi: ÜDM - x(1) , sənaye istehsalı - x(2) , qiymət indeksi - x (3) .

Cədvəl 2.8.

ölkələr x və reqressiya tənliyinin parametrləri, qalıq dispersiyanın qiymətləndirilməsi; b) a=0,05-də reqressiya əmsalının əhəmiyyətini yoxlayın, yəni. H 0: q 1 =0; c) etibarlılığı g=0,9 ilə q 0 və q 1 interval qiymətləndirmələrini tapın; d) g=0,95-də nöqtə üçün inam intervalını tapın X 0 =x i, Harada i=5; e) reqressiya tənliklərinin statistik xarakteristikalarını müqayisə edin: 1, 2 və 3.

2.12. Problem 2.11-i götürərək həll edin ( saat) göstərici x(1) və izahat üçün ( X) dəyişən x (3) .

1. Ayvazyan S.A., Mxitaryan V.S. Tətbiqi statistika və ekonometrikanın əsasları: Dərslik. M., BİRLİK, 1998 (2-ci nəşr 2001);

2. Ayvazyan S.A., Mxitaryan V.S. Problem və tapşırıqlarda tətbiqi statistika: Dərslik. M. BİRLİK - DANA, 2001;

3. Ayvazyan S.A., Enyukov İ.S., Meşalkin L.D. Tətbiqi statistika. Asılılıq tədqiqatı. M., Maliyyə və Statistika, 1985, 487 s.;

4. Ayvazyan S.A., Bukhstaber V.M., Enyukov İ.S., Meşalkin L.D. Tətbiqi statistika. Təsnifat və ölçülərin kiçilməsi. M., Maliyyə və Statistika, 1989, 607 s.;

5. Conston J. Ekonometrik üsullar, M.: Statistika, 1980, 446 s.;

6. Dubrov A.V., Mxitaryan V.S., Troşin L.İ. Çoxvariantlı statistik üsullar. M., Maliyyə və Statistika, 2000;

7. Mxitaryan V.S., Troşin L.İ. Korrelyasiya və reqressiya metodlarından istifadə etməklə asılılıqların öyrənilməsi. M., MƏSİ, 1995, 120 s.;

8. Mxitaryan V.S., Dubrov A.M., Troşin L.İ. İqtisadiyyatda çoxvariantlı statistik üsullar. M., MƏSİ, 1995, 149 s.;

9. Dubrov A.M., Mxitaryan V.S., Troşin L.İ. İş adamları və menecerlər üçün riyazi statistika. M., MESI, 2000, 140 s.;

10. Lukaşin Yu.İ. Reqressiya və adaptiv proqnozlaşdırma üsulları: Dərslik, M., MESI, 1997.

11. Lukaşin Yu.İ. Qısamüddətli proqnozlaşdırmanın adaptiv üsulları. - M., Statistika, 1979.


TƏTBİQLƏR


Əlavə 1. Müstəqil kompüter tədqiqatı üçün tapşırıqlar üçün seçimlər.

Cüt korrelyasiya əmsallarının matrisi elementləri qoşalaşmış korrelyasiya əmsalları olan matrisdir. Məsələn, üç dəyişən üçün bu matris belə görünür:
- yx 1x 2x 3
y1 r yx1r yx2r yx3
x 1r x1y1 r x1x2r x1x3
x 2r x2yr x2x11 r x2x3
x 3rx3yr x3x1r x3x21

Cütlənmiş əmsalların matrisini sahəyə daxil edin.

Misal. 2003-cü ildə Kemerovo vilayətində 154 kənd təsərrüfatı müəssisəsinin məlumatlarına əsasən, taxıl istehsalının səmərəliliyini öyrənin (cədvəl 13).

  1. 2003-cü ildə kənd təsərrüfatı müəssisələrində taxılın rentabelliyini formalaşdıran amilləri müəyyən edin.
  2. Cütlü korrelyasiya əmsallarının matrisini qurun. Hansı amillərin multikollinear olduğunu müəyyənləşdirin.
  3. Taxılın rentabelliyinin bütün amillərdən asılılığını xarakterizə edən reqressiya tənliyini qurun.
  4. Alınan reqressiya tənliyinin əhəmiyyətini qiymətləndirin. Bu modeldə taxıl rentabelliyinin formalaşmasına hansı amillər əhəmiyyətli dərəcədə təsir göstərir?
  5. 3 saylı kənd təsərrüfatı müəssisəsində taxıl istehsalının rentabelliyini qiymətləndirin.

Həll kalkulyatordan istifadə edərək Çoxlu reqressiya tənliyini əldə edirik:

1. Reqressiya tənliyinin qiymətləndirilməsi.
Reqressiya əmsalı təxminlərinin vektorunu təyin edək. Ən kiçik kvadratlar metoduna görə vektor aşağıdakı ifadədən alınır:
s = (X T X) -1 X T Y
Matris X

1 0.43 2.02 0.29
1 0.87 1.29 0.55
1 1.01 1.09 0.7
1 0.63 1.68 0.41
1 0.52 0.3 0.37
1 0.44 1.98 0.3
1 1.52 0.87 1.03
1 2.19 0.8 1.3
1 1.8 0.81 1.17
1 1.57 0.84 1.06
1 0.94 1.16 0.64
1 0.72 1.52 0.44
1 0.73 1.47 0.46
1 0.77 1.41 0.49
1 1.21 0.97 0.88
1 1.25 0.93 0.91
1 1.31 0.91 0.94
1 0.38 2.08 0.27
1 0.41 2.05 0.28
1 0.48 1.9 0.32
1 0.58 1.73 0.38
1 0 0 0

Matris Y
0.22
0.67
0.79
0.42
0.32
0.24
0.95
1.05
0.99
0.96
0.73
0.52
2.1
0.58
0.87
0.89
0.91
0.14
0.18
0.27
0.37
0

Matris X T
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
0.43 0.87 1.01 0.63 0.52 0.44 1.52 2.19 1.8 1.57 0.94 0.72 0.73 0.77 1.21 1.25 1.31 0.38 0.41 0.48 0.58 0
2.02 1.29 1.09 1.68 0.3 1.98 0.87 0.8 0.81 0.84 1.16 1.52 1.47 1.41 0.97 0.93 0.91 2.08 2.05 1.9 1.73 0
0.29 0.55 0.7 0.41 0.37 0.3 1.03 1.3 1.17 1.06 0.64 0.44 0.46 0.49 0.88 0.91 0.94 0.27 0.28 0.32 0.38 0

Matrisləri çoxalt, (X T X)
det(X T X) T = 34.35 müəyyənedicisini tapın
Tərs matrisi tapın (X T X) -1
0.6821 0.3795 -0.2934 -1.0118
0.3795 9.4402 -0.133 -14.4949
-0.2934 -0.133 0.1746 0.3204
-1.0118 -14.4949 0.3204 22.7272

Reqressiya əmsalı təxminlərinin vektoru bərabərdir
s = (X T X) -1 X T Y =
0.1565
0.3375
0.0043
0.2986

Reqressiya tənliyi (reqressiya tənliyinin qiymətləndirilməsi)
Y = 0,1565 + 0,3375X 1 + 0,0043X 2 + 0,2986X 3

Cüt korrelyasiya əmsallarının matrisi

Müşahidələrin sayı n = 22. Modeldəki müstəqil dəyişənlərin sayı düz 3-dür və vahid vektoru nəzərə alan reqressorların sayı naməlum əmsalların sayına bərabərdir. Y işarəsini nəzərə alaraq, matrisin ölçüsü 5-ə bərabər olur. Müstəqil dəyişənlərin X matrisinin ölçüsü (22 x 5) var. X T X matrisi birbaşa vurma və ya aşağıdakı əvvəlcədən hesablanmış məbləğlərlə müəyyən edilir.
Y və X-dən ibarət matris
1 0.22 0.43 2.02 0.29
1 0.67 0.87 1.29 0.55
1 0.79 1.01 1.09 0.7
1 0.42 0.63 1.68 0.41
1 0.32 0.52 0.3 0.37
1 0.24 0.44 1.98 0.3
1 0.95 1.52 0.87 1.03
1 1.05 2.19 0.8 1.3
1 0.99 1.8 0.81 1.17
1 0.96 1.57 0.84 1.06
1 0.73 0.94 1.16 0.64
1 0.52 0.72 1.52 0.44
1 2.1 0.73 1.47 0.46
1 0.58 0.77 1.41 0.49
1 0.87 1.21 0.97 0.88
1 0.89 1.25 0.93 0.91
1 0.91 1.31 0.91 0.94
1 0.14 0.38 2.08 0.27
1 0.18 0.41 2.05 0.28
1 0.27 0.48 1.9 0.32
1 0.37 0.58 1.73 0.38
1 0 0 0 0

Köçürülən matris.
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
0.22 0.67 0.79 0.42 0.32 0.24 0.95 1.05 0.99 0.96 0.73 0.52 2.1 0.58 0.87 0.89 0.91 0.14 0.18 0.27 0.37 0
0.43 0.87 1.01 0.63 0.52 0.44 1.52 2.19 1.8 1.57 0.94 0.72 0.73 0.77 1.21 1.25 1.31 0.38 0.41 0.48 0.58 0
2.02 1.29 1.09 1.68 0.3 1.98 0.87 0.8 0.81 0.84 1.16 1.52 1.47 1.41 0.97 0.93 0.91 2.08 2.05 1.9 1.73 0
0.29 0.55 0.7 0.41 0.37 0.3 1.03 1.3 1.17 1.06 0.64 0.44 0.46 0.49 0.88 0.91 0.94 0.27 0.28 0.32 0.38 0

Matris A T A.
22 14.17 19.76 27.81 13.19
14.17 13.55 15.91 16.58 10.56
19.76 15.91 23.78 22.45 15.73
27.81 16.58 22.45 42.09 14.96
13.19 10.56 15.73 14.96 10.45

Nəticədə alınan matrisin aşağıdakı uyğunluğu var:

Cütlük korrelyasiya əmsallarını tapaq.
y və x 1 üçün

Orta dəyərlər



Dispersiya





Korrelyasiya əmsalı

y və x 2 üçün
Tənlik y = ax + b-dir
Orta dəyərlər



Dispersiya


Standart sapma


Korrelyasiya əmsalı

y və x 3 üçün
Tənlik y = ax + b-dir
Orta dəyərlər



Dispersiya


Standart sapma


Korrelyasiya əmsalı

x 1 və x 2 üçün
Tənlik y = ax + b-dir
Orta dəyərlər



Dispersiya


Standart sapma


Korrelyasiya əmsalı

x 1 və x 3 üçün
Tənlik y = ax + b-dir
Orta dəyərlər



Dispersiya


Standart sapma


Korrelyasiya əmsalı

x 2 və x 3 üçün
Tənlik y = ax + b-dir
Orta dəyərlər



Dispersiya


Standart sapma


Korrelyasiya əmsalı

Cüt korrelyasiya əmsallarının matrisi.
- y x 1 x 2 x 3
y 1 0.62 -0.24 0.61
x 1 0.62 1 -0.39 0.99
x 2 -0.24 -0.39 1 -0.41
x 3 0.61 0.99 -0.41 1

Bu matrisin birinci cərgəsinin təhlili çoxsaylı korrelyasiya modelinə daxil edilə bilən amil xüsusiyyətlərini seçməyə imkan verir. r yxi olan amil xüsusiyyətləri< 0.5 исключают из модели.
Kollinearlıq amillər arasında əlaqədir. Multikollinearlıq meyarı kimi aşağıdakı bərabərsizliklər qəbul edilə bilər:
r(x j y) > r(x k x j) ; r(x k y) > r(x k x j).
Bərabərsizliklərdən biri yerinə yetirilmirsə, nəticədə Y göstəricisi ilə əlaqəsi ən az yaxın olan x k və ya x j parametri xaric edilir.
3. Reqressiya tənliyinin parametrlərinin təhlili.
Gəlin əldə olunan reqressiya tənliyinin statistik təhlilinə keçək: tənliyin əhəmiyyətinin və onun əmsallarının yoxlanılması, yaxınlaşmanın mütləq və nisbi səhvlərinin öyrənilməsi.
Qeyri-obyektiv fərq qiymətləndirməsi üçün aşağıdakı hesablamaları aparırıq:
Qərəzsiz xəta e = Y - X*s ( mütləq səhv təxmini)
-0.18
0.05
0.08
-0.08
-0.12
-0.16
-0.03
-0.24
-0.13
-0.05
0.06
-0.02
1.55
0.01
0.04
0.04
0.03
-0.23
-0.21
-0.15
-0.1
-0.16

s e 2 = (Y - X*s) T (Y - X*s)
Qərəzsiz dispersiya təxminidir

Dərəcə standart sapma bərabərdir

k = a*(X T X) -1 vektorunun kovariasiya matrisinin qiymətləndirməsini tapaq.
0.26 0.15 -0.11 -0.39
0.15 3.66 -0.05 -5.61
-0.11 -0.05 0.07 0.12
-0.39 -5.61 0.12 8.8

Modelin parametrlərinin dispersiyaları S 2 i = K ii münasibəti ilə müəyyən edilir, yəni. bunlar əsas diaqonalda yerləşən elementlərdir
Reqressiya modelinin mənalı təhlili imkanlarını genişləndirmək üçün düsturla müəyyən edilən qismən elastiklik əmsallarından istifadə olunur:


Qismən elastiklik əmsalı E 1< 1. Следовательно, его влияние на результативный признак Y незначительно.

Qismən elastiklik əmsalı E 2< 1. Следовательно, его влияние на результативный признак Y незначительно.

Qismən elastiklik əmsalı E 3< 1. Следовательно, его влияние на результативный признак Y незначительно.
Faktorların nəticəyə birgə təsirinin yaxınlığı çoxlu korrelyasiya indeksi (0-dan 1-ə qədər) ilə qiymətləndirilir.

Y əlaməti ilə X faktorları arasında əlaqə orta səviyyədədir
Təyin əmsalı
R2 = 0,622 = 0,38
olanlar. 38,0855% hallarda x-dəki dəyişikliklər y-nin dəyişməsinə səbəb olur. Başqa sözlə, reqressiya tənliyinin seçilmə dəqiqliyi orta səviyyədədir
Korrelyasiya əmsalının əhəmiyyəti

Tələbə cədvəlindən istifadə edərək Ttable tapırıq
T cədvəli (n-m-1;a) = (18;0,05) = 1,734
Tob > Ttabl olduğundan korrelyasiya əmsalının 0-a bərabər olması fərziyyəsini rədd edirik. Başqa sözlə, korrelyasiya əmsalı statistik əhəmiyyətlidir
Korrelyasiya əmsalı üçün interval təxmini (etibar intervalı)

Korrelyasiya əmsalı üçün inam intervalı
r(0,3882;0,846)
5. Reqressiya tənliyinin əmsalları ilə bağlı fərziyyələrin yoxlanılması (çoxsaylı reqressiya tənliyinin parametrlərinin əhəmiyyətinin yoxlanması).
1) t-statistika


b 0 reqressiya əmsalının statistik əhəmiyyəti təsdiqlənməyib

b 1 reqressiya əmsalının statistik əhəmiyyəti təsdiqlənməyib

b 2 reqressiya əmsalının statistik əhəmiyyəti təsdiqlənməyib

b 3 reqressiya əmsalının statistik əhəmiyyəti təsdiqlənməyib
Reqressiya tənliyi əmsalları üçün etibarlılıq intervalı
Etibarlılığı 95% olan reqressiya əmsallarının etimad intervallarını aşağıdakı kimi müəyyən edək:
(b i - t i S i ; b i + t i S i)
b 0: (-0,7348;1,0478)
b 1: (-2,9781;3,6531)
b 2: (-0,4466;0,4553)
b 3: (-4,8459;5,4431)

2) F-statistika. Fisher meyarı


Fkp = 2.93
Çünki F< Fkp, то коэффициент детерминации статистически не значим и уравнение регрессии статистически ненадежно.
6. Qalıqların qrafik analizindən istifadə etməklə heteroskedastikliyin mövcudluğunun yoxlanılması.
Bu halda, X i izahlı dəyişənin qiymətləri absis oxu boyunca, e i 2 sapmasının kvadratları isə ordinat oxu boyunca çəkilir.

y y(x) e=y-y(x) e 2
0.22 0.4 -0.18 0.03
0.67 0.62 0.05 0
0.79 0.71 0.08 0.01
0.42 0.5 -0.08 0.01
0.32 0.44 -0.12 0.02
0.24 0.4 -0.16 0.03
0.95 0.98 -0.03 0
1.05 1.29 -0.24 0.06
0.99 1.12 -0.13 0.02
0.96 1.01 -0.05 0
0.73 0.67 0.06 0
0.52 0.54 -0.02 0
2.1 0.55 1.55 2.41
0.58 0.57 0.01 0
0.87 0.83 0.04 0
0.89 0.85 0.04 0
0.91 0.88 0.03 0
0.14 0.37 -0.23 0.05
0.18 0.39 -0.21 0.04
0.27 0.42 -0.15 0.02
0.37 0.47 -0.1 0.01
0.16 -0.16 0.02


Saytda yeni

>

Ən Populyar