Ev Gigiyena Reqressiya tənliyinin parametrlərinin qiymətləndirilməsi. Xətti Reqressiya Parametrlərinin Qiymətləndirilməsi

Reqressiya tənliyinin parametrlərinin qiymətləndirilməsi. Xətti Reqressiya Parametrlərinin Qiymətləndirilməsi

Reqressiya tənliyi həmişə əlaqənin yaxınlığının göstəricisi ilə tamamlanır. istifadə xətti reqressiya belə göstərici xətti korrelyasiya əmsalı r yt. Formulun müxtəlif modifikasiyaları var xətti əmsal korrelyasiya.

Nəzərə almaq lazımdır ki, xətti korrelyasiya əmsalının qiyməti onun xətti formasında nəzərdən keçirilən əlamətlər arasındakı əlaqənin yaxınlığını qiymətləndirir. Buna görə də yaxınlıq mütləq dəyər xətti korrelyasiya əmsalının sıfıra bərabər olması xüsusiyyətlər arasında heç bir əlaqənin olmaması demək deyil.

Seçim keyfiyyətini qiymətləndirmək xətti funksiya determinasiya əmsalı adlanan r yt 2 xətti korrelyasiya əmsalının kvadratı hesablanır. Determinasiya əmsalı effektiv xarakteristikanın ümumi dispersiyasında reqressiya ilə izah edilən t-də effektiv xarakteristikanın dispersiyasının nisbətini xarakterizə edir.

kimi qeyri-xətti reqressiya tənliyi xətti asılılıq, korrelyasiya göstəricisi, yəni R korrelyasiya indeksi ilə tamamlanır.

Daha çox çoxhədli kimi ikinci dərəcəli parabola yüksək sifariş, xəttiləşdirildikdə tənlik formasını alır çoxlu reqressiya. Əgər izah edilənə nisbətən qeyri-xətti olarsa dəyişən tənlik linearizasiya zamanı reqressiya qoşalaşmış reqressiyanın xətti tənliyi formasını alır, sonra əlaqənin yaxınlığını qiymətləndirmək üçün bu halda dəyəri korrelyasiya indeksi ilə üst-üstə düşəcək xətti korrelyasiya əmsalı istifadə edilə bilər.

Tənliyin xətti formaya çevrilməsi asılı dəyişəni əhatə etdikdə vəziyyət fərqlidir. Bu halda, çevrilmiş xüsusiyyət qiymətlərinə əsaslanan xətti korrelyasiya əmsalı əlaqənin yaxınlığının yalnız təxmini qiymətini verir və korrelyasiya indeksi ilə ədədi olaraq üst-üstə düşmür. Bəli, üçün güc funksiyası

loqarifmik xətti tənliyə keçdikdən sonra

lny = lna + milyard

xətti korrelyasiya əmsalı x və y dəyişənlərinin faktiki qiymətləri üçün deyil, onların loqarifmləri, yəni r lnylnx üçün tapıla bilər. Müvafiq olaraq, onun dəyərinin kvadratı kvadrat sapmaların amil cəminin cəminə nisbətini xarakterizə edəcək, lakin y üçün deyil, loqarifmləri üçün:

Eyni zamanda, korrelyasiya indeksini hesablayarkən, onların loqarifmlərindən deyil, y xarakteristikasının kvadratik sapmalarının cəmindən istifadə olunur. Bu məqsədlə ortaya çıxan xarakteristikanın nəzəri dəyərləri, yəni tənliklə hesablanmış dəyərin antiloqarifmi və kvadratların qalıq cəmi kimi müəyyən edilir.

R 2 yx hesablamasının məxrəci y faktiki qiymətlərinin onların orta qiymətindən kvadratik sapmalarının ümumi cəmini, məxrəc isə r 2 lnxlny hesablamada iştirak edir. Baxılan göstəricilərin say və məxrəcləri müvafiq olaraq fərqlənir:

  • - korrelyasiya indeksində və
  • - korrelyasiya əmsalında.

Nəticələrin oxşarlığına və kompüter proqramlarından istifadə etməklə hesablamaların sadəliyinə görə qeyri-xətti funksiyalar üçün əlaqənin yaxınlığını xarakterizə etmək üçün xətti korrelyasiya əmsalı geniş istifadə olunur.

y xarakteristikasının qiymətinin çevrilməsi ilə qeyri-xətti funksiyalarda R və r və ya R və r dəyərlərinin yaxınlığına baxmayaraq, yadda saxlamaq lazımdır ki, xüsusiyyətlərin xətti asılılığı ilə eyni korrelyasiya əmsalı reqressiya, yadda saxlamaq lazımdır ki, xüsusiyyətlərin xətti asılılığı ilə bir və eyni korrelyasiya əmsalı həm reqressiyanı xarakterizə edirsə, həm də y=j(x) funksiyası üçün əyri-xətti asılılığı ilə x reqresiyası üçün bərabər deyildir. =f(y).

Korrelyasiya indeksinin hesablanmasında amil və nisbətindən istifadə edildiyi üçün ümumi miqdar Kvadrat sapmalar, onda determinasiya əmsalı ilə eyni mənaya malikdir. Xüsusi tədqiqatlarda qeyri-xətti əlaqələr üçün qiymət təyinetmə indeksi adlanır.

Korrelyasiya indeksinin əhəmiyyətinin qiymətləndirilməsi korrelyasiya əmsalının etibarlılığının qiymətləndirilməsi ilə eyni şəkildə həyata keçirilir.

Korrelyasiya indeksi Fisher F testindən istifadə edərək ümumi qeyri-xətti reqressiya tənliyinin əhəmiyyətini yoxlamaq üçün istifadə olunur.

m dəyəri kvadratların amil cəmi üçün sərbəstlik dərəcələrinin sayını, (n - m - 1) isə kvadratların qalıq cəmi üçün sərbəstlik dərəcələrinin sayını xarakterizə edir.

Güc funksiyası üçün m = 1 və F-meyarının düsturu xətti asılılıq üçün olduğu kimi eyni formanı alır:

İkinci dərəcəli parabola üçün

y = a 0 + a 1 x + a 2 x 2 +em = 2

F-meyarı da cədvəldə hesablana bilər dispersiya təhlili xətti funksiya üçün göstərildiyi kimi reqressiya nəticələri.

Xətti funksiyadan istifadənin mümkünlüyünü əsaslandırmaq üçün təyinetmə indeksini təyinetmə əmsalı ilə müqayisə etmək olar. Reqressiya xəttinin əyriliyi nə qədər böyükdürsə, təyinetmə əmsalı bir o qədər az olur. Bu göstəricilərin oxşarlığı o deməkdir ki, reqressiya tənliyinin formasını mürəkkəbləşdirməyə ehtiyac yoxdur və xətti funksiyadan istifadə etmək olar.

Təcrübədə determinasiya göstəricisi ilə determinasiya əmsalı arasındakı fərq 0,1-dən çox deyilsə, onda əlaqənin xətti formasının qəbulu əsaslandırılmış hesab olunur.

Əgər t fakt >t cədvəlidirsə, onda nəzərə alınan korrelyasiya göstəriciləri arasındakı fərqlər əhəmiyyətlidir və qeyri-xətti reqressiyanı xətti funksiya tənliyi ilə əvəz etmək mümkün deyil. Təcrübədə, əgər dəyəri t< 2, то различия между R yx и r yx несущественны, и, следовательно, возможно применение линейной регрессии, даже если есть предположения о некоторой нелинейности рассматриваемых соотношений признаков фактора и результата.

Korrelyasiya təhlili.

Qoşalaşmış reqressiya tənliyi.

Qrafik metoddan istifadə etməklə.

Bu üsul öyrənilən iqtisadi göstəricilər arasında əlaqə formasını əyani şəkildə təsvir etmək üçün istifadə olunur. Bunun üçün düzbucaqlı koordinat sistemində qrafik çəkilir, nəticədə Y xarakteristikasının fərdi qiymətləri ordinat oxu boyunca, X amil xarakteristikasının fərdi qiymətləri isə absis oxu boyunca çəkilir.

Nəticə və amil xüsusiyyətlərinin nöqtələrinin çoxluğu deyilir korrelyasiya sahəsi.

Korrelyasiya sahəsinə əsaslanaraq bir fərziyyə irəli sürmək olar (üçün əhali) X və Y-nin bütün mümkün dəyərləri arasındakı əlaqə xəttidir.

Xətti reqressiya tənliyi y = bx + a + ε-dir

Burada ε təsadüfi xətadır (sapma, pozulma).

Təsadüfi bir səhvin olmasının səbəbləri:

1. Əhəmiyyətli izahedici dəyişənlərin reqressiya modelinə daxil edilməməsi;

2. Dəyişənlərin aqreqasiyası. Məsələn, ümumi istehlak funksiyası bir cəhddir ümumi ifadə fərdi xərcləmə qərarlarının məcmusudur. Bu, yalnız müxtəlif parametrlərə malik olan fərdi münasibətlərin təxminisidir.

3. Model strukturunun düzgün təsviri;

4. Yanlış funksional spesifikasiya;

5. Ölçmə xətaları.

Hər bir xüsusi müşahidə i üçün sapmalar ε i təsadüfi olduğundan və onların nümunədəki dəyərləri naməlum olduğundan, onda:

1) x i və y i müşahidələrindən yalnız α və β parametrlərinin təxminləri əldə edilə bilər

2) α və β parametrlərinin təxminləri reqressiya modeli müvafiq olaraq təsadüfi xarakter daşıyan a və b qiymətləridir, çünki təsadüfi nümunəyə uyğundur;

Sonra təxmin edən reqressiya tənliyi (nümunə məlumatlarından qurulmuş) y = bx + a + ε formasına sahib olacaq, burada e i ε i xətalarının müşahidə edilən qiymətləri (təxminləri) və a və b müvafiq olaraq təxminlərdir. tapılmalı olan reqressiya modelinin α və β parametrləri.

α və β parametrlərini qiymətləndirmək üçün ən kiçik kvadratlar üsulundan (ən kiçik kvadratlar üsulu) istifadə olunur. Metod ən kiçik kvadratlar reqressiya tənliyinin parametrlərinin ən yaxşı (ardıcıl, səmərəli və qərəzsiz) qiymətlərini verir.

Ancaq yalnız təsadüfi termin (ε) və müstəqil dəyişən (x) ilə bağlı müəyyən müddəalar yerinə yetirildikdə.

Formal olaraq OLS kriteriyası aşağıdakı kimi yazıla bilər:

S = ∑(y i - y * i) 2 → dəq

Normal tənliklər sistemi.

a n + b∑x = ∑y

a∑x + b∑x 2 = ∑y x

Məlumatlarımız üçün tənliklər sistemi formaya malikdir

15a + 186.4 b = 17.01

186,4 a + 2360,9 b = 208,25

Birinci tənlikdən ifadə edirik A və ikinci tənliyi əvəz edin:

Empirik reqressiya əmsallarını alırıq: b = -0,07024, a = 2,0069

Reqressiya tənliyi (empirik reqressiya tənliyi):

y = -0,07024 x + 2,0069

Empirik reqressiya əmsalları ab yalnız nəzəri əmsalların β i təxminləridir və tənliyin özü yalnız nəzərdən keçirilən dəyişənlərin davranışındakı ümumi tendensiyanı əks etdirir.

Reqressiya parametrlərini hesablamaq üçün hesablama cədvəli quracağıq (Cədvəl 1)

1. Reqressiya tənliyinin parametrləri.

Nümunə deməkdir.

Nümunə fərqləri:

Standart sapma

1.1. Korrelyasiya əmsalı

Kovariasiya.

Əlaqənin yaxınlığının göstəricisini hesablayırıq. Bu göstərici düsturla hesablanan nümunə xətti korrelyasiya əmsalıdır:

Xətti korrelyasiya əmsalı –1-dən +1-ə qədər olan dəyərləri qəbul edir.

Xüsusiyyətlər arasındakı əlaqələr zəif və güclü ola bilər (yaxın). Onların meyarları Chaddock şkalası ilə qiymətləndirilir:

0.1 < r xy < 0.3: слабая;

0.3 < r xy < 0.5: умеренная;

0.5 < r xy < 0.7: заметная;

0.7 < r xy < 0.9: высокая;

0.9 < r xy < 1: весьма высокая;

Bizim nümunəmizdə Y əlaməti ilə X faktoru arasındakı əlaqə yüksək və tərsdir.

Bundan əlavə, xətti cüt korrelyasiya əmsalı b reqressiya əmsalı vasitəsilə müəyyən edilə bilər:

1.2. Reqressiya tənliyi(reqressiya tənliyinin qiymətləndirilməsi).

Xətti reqressiya tənliyi y = -0,0702 x + 2,01-dir

Xətti reqressiya tənliyinin əmsallarına iqtisadi məna vermək olar.

Reqressiya əmsalı b = -0,0702 effektiv göstəricinin orta dəyişməsini (y ölçü vahidlərində) onun ölçü vahidinə x əmsalının dəyərinin artması və ya azalması ilə göstərir. Bu misalda 1 vahid artımla y orta hesabla -0,0702 azalır.

a = 2.01 əmsalı formal olaraq y-nin proqnozlaşdırılan səviyyəsini göstərir, lakin yalnız x = 0 seçmə dəyərlərinə yaxın olduqda.

Ancaq x=0 x-in nümunə dəyərlərindən uzaqdırsa, hərfi şərh səhv nəticələrə səbəb ola bilər və hətta reqressiya xətti müşahidə olunan nümunə dəyərlərini kifayət qədər dəqiq təsvir etsə belə, bunun da olacağına zəmanət yoxdur. sola və ya sağa ekstrapolyasiya edərkən belə ola bilər.

Müvafiq x dəyərlərini reqressiya tənliyinə əvəz etməklə, hər bir müşahidə üçün y(x) performans göstəricisinin uyğunlaşdırılmış (proqnozlaşdırılmış) dəyərlərini təyin edə bilərik.

y və x arasındakı əlaqə reqressiya əmsalının işarəsini müəyyən edir b (əgər > 0 - birbaşa əlaqə, əks halda - tərs). Bizim nümunəmizdə əlaqə tərsdir.

1.3. Elastiklik əmsalı.

Nəticə göstəricisi y və amil xarakteristikasının ölçü vahidlərində fərq olduqda, faktorların nəticə xarakteristikaya təsirini birbaşa qiymətləndirmək üçün reqressiya əmsallarından (b misalında) istifadə etmək məqsədəuyğun deyil.

Bu məqsədlər üçün elastiklik əmsalları və beta əmsalları hesablanır.

Orta elastiklik əmsalı E nəticənin aqreqatda orta hesabla neçə faiz dəyişəcəyini göstərir saat amil dəyişdikdə onun orta qiymətindən x onun orta dəyərinin 1%-i qədər.

Elastiklik əmsalı düsturla tapılır:

Elastiklik əmsalı 1-dən azdır. Deməli, X 1% dəyişərsə, Y 1%-dən az dəyişəcək. Başqa sözlə, X-in Y-yə təsiri əhəmiyyətli deyil.

Beta əmsalı

Beta əmsalı amil xarakteristikasının sabit səviyyədə sabitlənmiş qalan müstəqil dəyişənlərin dəyəri ilə standart sapmasının dəyəri ilə dəyişdikdə, onun standart sapmasının dəyərinin hansı hissəsi ilə nəticələnən xarakteristikanın orta qiymətinin dəyişəcəyini göstərir:

Bunlar. standart sapma S x ilə x artımı Y-nin orta dəyərinin 0,82 standart sapma S y azalmasına səbəb olacaqdır.

1.4. Təxmini xəta.

Mütləq yaxınlaşma xətasından istifadə edərək reqressiya tənliyinin keyfiyyətini qiymətləndirək. Orta yaxınlaşma xətası - hesablanmış dəyərlərin faktiki olanlardan orta sapması:

5%-7% daxilində yaxınlaşma xətası reqressiya tənliyinin orijinal məlumatlara yaxşı uyğunluğunu göstərir.

Səhv 7%-dən az olduğu üçün bu tənlik reqressiya kimi istifadə edilə bilər.

Xətti reqressiya formanın tənliyini tapmağa gəlir

Birinci ifadə verilmiş amil qiymətlərinə imkan verir x amilin faktiki dəyərlərini ona əvəz etməklə nəticələnən xarakteristikanın nəzəri dəyərlərini hesablayın x. Qrafikdə nəzəri dəyərlər reqressiya xəttini təmsil edən düz xətt üzərində yerləşir.

Xətti reqressiyanın qurulması onun parametrlərini qiymətləndirməyə gəlir - Ab. Xətti reqressiya parametrlərinin qiymətləndirilməsinə klassik yanaşma əsaslanır Ən kiçik kvadratlar metodu (LSM).

Minimumu tapmaq üçün hər bir parametr üçün cəmin (4) qismən törəmələrini hesablamaq lazımdır - Ab- və onları sıfıra bərabərləşdirin.

(5)

Gəlin transformasiya edək, əldə edirik normal tənliklər sistemi:

(6)

Bu sistemdə n- nümunə ölçüsü, məbləğlər orijinal məlumatlardan asanlıqla hesablanır. Sistemlə əlaqədar olaraq həll edirik Ab, alırıq:

(7)

. (8)

İfadə (7) başqa formada da yazıla bilər:

(9)

Harada əlamət kovariantlığı, faktor dispersiyası x.

Parametr bçağırdı reqressiya əmsalı. Onun dəyəri faktorun bir vahid dəyişməsi ilə nəticənin orta dəyişməsini göstərir. İqtisadi reqressiya əmsalının aydın şəkildə şərh edilməsi ehtimalı var xətti tənlik reqressiya ekonometrik tədqiqatlarda kifayət qədər yaygındır.

Formal olaraq a- məna y saat x=0.Əgər x sıfır dəyəri yoxdur və ola bilməz, onda sərbəst terminin bu şərhi a mənası yoxdur. Parametr a iqtisadi məzmun daşıya bilməz. İqtisadi şəkildə şərh etmək cəhdləri, xüsusən də, absurdluğa səbəb ola bilər a< 0. Интерпретировать можно лишь знак при параметре a.Əgər a> 0 olarsa, nəticədə nisbi dəyişiklik faktorun dəyişməsindən daha yavaş baş verir. Bu nisbi dəyişiklikləri müqayisə edək:

< при > 0, > 0

Bəzən ortadan kənarlaşmalar üçün xətti cüt reqressiya tənliyi yazılır:

Harada,. Bu zaman sərbəst termin sıfıra bərabərdir ki, bu da (10) ifadəsində əks olunur. Bu fakt həndəsi mülahizələrdən irəli gəlir: eyni düz xətt (3) reqressiya tənliyinə uyğundur, lakin sapmalarda reqressiyanı qiymətləndirərkən koordinatların mənşəyi koordinatları olan nöqtəyə doğru hərəkət edir. Bu halda (8) ifadəsində hər iki cəm sıfıra bərabər olacaqdır ki, bu da sərbəst terminin sıfıra bərabərliyinə səbəb olacaqdır.

Nümunə olaraq bir növ məhsul istehsal edən bir qrup müəssisə üçün maya dəyəri funksiyasını nəzərdən keçirək



Cədvəl 1.

Məhsul çıxışı min ədəd() İstehsal xərcləri, milyon rubl ()
31,1
67,9
141,6
104,7
178,4
104,7
141,6
Cəmi: 22 770,0

Normal tənliklər sistemi belə görünəcək:

Həll edərək, alırıq a= -5.79, b=36.84.

Reqressiya tənliyi belədir:

Dəyərlərin tənliyə əvəz edilməsi X, nəzəri dəyərləri tapaq y(cədvəlin son sütunu).

Böyüklük a heç bir iqtisadi məna daşımır. Əgər dəyişənlər xy orta səviyyələrdən kənarlaşmalar baxımından ifadə edilir, onda qrafikdəki reqressiya xətti koordinatların başlanğıcından keçəcəkdir. Reqressiya əmsalı təxmini dəyişməyəcək:

, Harada , .

Başqa bir nümunə olaraq, formanın istehlak funksiyasını nəzərdən keçirin:

,

burada C istehlakdır, y-gəlir, K,L- seçimlər. Bu xətti reqressiya tənliyi adətən balans tənliyi ilə birlikdə istifadə olunur:

,

Harada I- investisiyanın həcmi; r- qənaət.

Sadəlik üçün fərz edək ki, gəlir istehlaka və investisiyaya xərclənir. Beləliklə, tənliklər sistemi nəzərə alınır:

Balans bərabərliyinin olması reqressiya əmsalının dəyərinə məhdudiyyətlər qoyur, birdən çox ola bilməz, yəni. .

Tutaq ki, istehlak funksiyası:

.

Reqressiya əmsalı istehlaka meylliliyi xarakterizə edir. Hər min rubl gəlirdən orta hesabla istehlaka 650 rubl, 350 rubl xərcləndiyini göstərir. sərmayə qoydu. İnvestisiya ölçüsünün gəlir üzrə reqressiyasını hesablasaq, yəni. , onda reqressiya tənliyi olacaq . Bu tənliyi təyin etmək lazım deyil, çünki o, istehlak funksiyasından alınır. Bu iki tənliyin reqressiya əmsalları bərabərliklə əlaqələndirilir:

Əgər reqressiya əmsalı birdən çox olarsa, o zaman təkcə gəlir deyil, həm də qənaət də istehlaka sərf olunur.



İstehlak funksiyasındakı reqressiya əmsalı çarpanı hesablamaq üçün istifadə olunur:

Budur m≈2.86, buna görə əlavə investisiya 1 min rubl təşkil edir. haqqında uzun müddətli digər şeylər bərabər olmaqla, 2,86 min rubl əlavə gəlir gətirəcəkdir.

Xətti reqressiyada xətti korrelyasiya əmsalı əlaqənin yaxınlığının göstəricisi kimi çıxış edir r:

Onun dəyərləri sərhədlər daxilindədir: . Əgər b> 0, sonra nə vaxt b< 0 . Nümunəyə görə, bu, istehsal xərclərinin məhsulun həcmindən çox sıx asılılığı deməkdir.

Xətti funksiyanın uyğunlaşdırılmasının keyfiyyətini qiymətləndirmək üçün hesablayın təyin əmsalı xətti korrelyasiya əmsalının kvadratı kimi r 2. Yaranan xarakteristikanın dispersiya payını xarakterizə edir y nəticələnən əlamətin ümumi dispersiyasında reqressiya ilə izah olunur:

Dəyər dispersiya payını xarakterizə edir y, modeldə nəzərə alınmayan digər amillərin təsiri nəticəsində yaranır.

Nümunədə. Reqressiya tənliyi dispersiyanın 98,2%-ni izah edir, digər amillər isə 1,8%-ni təşkil edir, bu, qalıq dispersiyadır.

OLS-in ilkin şərtləri (Gauss-Markov şərtləri)

Yuxarıda qeyd edildiyi kimi, arasında əlaqə yx qoşa reqressiyada funksional deyil, korrelyasiya xarakterlidir. Buna görə də parametr təxminləri ab var təsadüfi dəyişənlər, xassələri təsadüfi komponent ε-nin xüsusiyyətlərindən əhəmiyyətli dərəcədə asılıdır. Ən kiçik kvadratlardan istifadə edərək ən yaxşı nəticələri əldə etmək üçün təsadüfi sapma ilə bağlı aşağıdakı ilkin şərtlər (Gauss-Markov şərtləri) yerinə yetirilməlidir:

1 0 . Gözlənilən dəyər təsadüfi sapma bütün müşahidələr üçün sıfırdır: .

20. Təsadüfi kənarlaşmaların dispersiyası sabitdir: .

Bu ilkin şərtin fizibilitesi deyilir homosedastiklik(sapma dispersiyasının sabitliyi). Bu müqəddimənin qeyri-mümkünlüyü deyilir heteroskedastiklik(sapma dispersiyasının qeyri-sabitliyi)

otuz. Təsadüfi sapmalar εiε j bir-birindən müstəqildir:

Bu şərtin fizibilitesi deyilir avtokorrelyasiyanın olmaması.

4 0 . Təsadüfi dispersiya izahedici dəyişənlərdən müstəqil olmalıdır.

Tipik olaraq, verilmiş modeldə izahedici dəyişənlər təsadüfi deyilsə, bu şərt avtomatik olaraq təmin edilir. Bundan əlavə, ekonometrik modellər üçün bu ilkin şərtin mümkünlüyü ilk üçü ilə müqayisədə kritik deyil.

Göstərilən ilkin şərtlər yerinə yetirilirsə, o zaman Qauss teoremi-Markova: OLS-dən istifadə etməklə əldə edilən təxminlər (7) və (8) bütün xətti qərəzsiz qiymətləndirmələr sinfində ən kiçik fərqə malikdir. .

Beləliklə, əgər Gauss-Markov şərtləri yerinə yetirilərsə, təxminlər (7) və (8) yalnız reqressiya əmsallarının qərəzsiz qiymətləndirmələri deyil, həm də ən effektiv, yəni. bu parametrlərin dəyərlərə görə xətti olan hər hansı digər təxminləri ilə müqayisədə ən kiçik dispersiyaya malikdir y i.

Reqressiya analizindən istifadə edən səriştəli tədqiqatçını səriştəsizdən fərqləndirən Gauss-Markov şərtlərinin əhəmiyyətinin dərk edilməsidir. Əgər bu şərtlər yerinə yetirilmirsə, tədqiqatçı bundan xəbərdar olmalıdır. Əgər düzəldici fəaliyyət mümkündürsə, o zaman analitik bunu edə bilməlidir. Vəziyyəti düzəltmək mümkün olmadıqda, tədqiqatçı bunun nəticələrə nə dərəcədə ciddi təsir göstərə biləcəyini qiymətləndirə bilməlidir.

Bir reqressiya tənliyindən istifadə edərək proqnozlaşdırmaq üçün reqressiya əmsallarını və tənliklərini hesablamalısınız. Və burada proqnozun düzgünlüyünə təsir edən başqa bir problem var. Bu, adətən hər kəs deyil ki, yatır mümkün dəyərlər X və Y dəyişənləri, yəni. proqnozlaşdırma problemlərində birgə paylanmanın ümumi kütləsi məlum deyil, yalnız bu ümumi kütlədən nümunə məlumdur. Nəticədə, proqnozlaşdırma zamanı təsadüfi komponentlə yanaşı, başqa bir səhv mənbəyi yaranır - seçmənin ümumi kütləyə tam uyğun gəlməməsi nəticəsində yaranan xətalar və nəticədə reqressiya tənliyinin əmsallarının müəyyən edilməsində səhvlər.

Başqa sözlə, əhalinin sayı məlum olmadığı üçün dəqiq dəyərlərəmsalları və reqressiya tənliklərini təyin etmək mümkün deyil. Bu naməlum əhalidən bir nümunədən istifadə edərək, yalnız həqiqi əmsalların təxminlərini əldə etmək olar.

Belə bir dəyişdirmə nəticəsində proqnozlaşdırma səhvlərinin minimal olması üçün qiymətləndirmə əldə edilmiş qərəzsiz və səmərəli dəyərlərə zəmanət verən bir metoddan istifadə etməklə aparılmalıdır. Metod, eyni populyasiyadan yeni nümunələrlə bir neçə dəfə təkrarlandıqda, şərt və təmin edildikdə qərəzsiz qiymətləndirmələr təmin edir. Metod, eyni populyasiyadan yeni nümunələrlə bir neçə dəfə təkrar edildikdə, a və b əmsallarının minimum dispersiyasını təmin edərsə, effektiv qiymətləndirmələr təmin edir, yəni. şərtləri yerinə yetirilir.

Ehtimal nəzəriyyəsində ən kiçik kvadratlar metodunun tətbiqi ilə nümunə verilənlər əsasında xətti reqressiya tənliyinin əmsallarının səmərəliliyi və qərəzsiz qiymətləndirilməsinin təmin edildiyi teorem sübut edilmişdir.

Ən kiçik kvadratlar metodunun mahiyyəti aşağıdakı kimidir. Hər bir nümunə nöqtəsi üçün formanın tənliyi yazılır . Sonra hesablanmış və faktiki dəyərlər arasında səhv tapılır. Bütün n nöqtələr üçün kvadrat xətaların minimum cəmini təmin edən bu cür dəyərləri tapmaq üçün optimallaşdırma probleminin həlli, yəni. axtarış probleminin həlli , əmsalların qərəzsiz və səmərəli qiymətlərini verir və . Cütlənmiş xətti reqressiya üçün bu həll formasına malikdir:

Qeyd etmək lazımdır ki, bir nümunədən bu şəkildə əldə edilən ümumi əhali üçün reqressiya əmsallarının həqiqi dəyərlərinin qərəzsiz və effektiv qiymətləndirmələri bir dəfə tətbiq edildikdə səhvlərə qarşı heç bir zəmanət vermir. Zəmanət ondan ibarətdir ki, bu əməliyyatın eyni populyasiyadan olan digər nümunələrlə dəfələrlə təkrarlanması nəticəsində hər hansı digər üsulla müqayisədə daha az miqdarda səhvlərə zəmanət verilir və bu xətaların yayılması minimal olacaqdır.

Reqressiya tənliyinin əldə edilmiş əmsalları reqressiya xəttinin mövqeyini müəyyən edir, o, ilkin nümunənin nöqtələri ilə formalaşan buludun əsas oxudur; Hər iki əmsalın çox dəqiq mənası var. Əmsal dəyərini göstərir, lakin bir çox hallarda bunun mənası yoxdur, buna görə də əmsalın verilmiş şərhindən diqqətlə istifadə etmək lazımdır; Mənanın daha universal təfsiri aşağıdakı kimidir. Əgər , onda müstəqil dəyişəndəki nisbi dəyişiklik (faizlə dəyişmə) həmişə asılı dəyişənin nisbi dəyişməsindən az olur.

Əmsal müstəqil dəyişən bir vahid dəyişdikdə asılı dəyişənin neçə vahid dəyişəcəyini göstərir. Əmsal çox vaxt reqressiya əmsalı adlanır və onun -dən daha vacib olduğunu vurğulayır. Xüsusilə, asılı və müstəqil dəyişənlərin qiymətlərinin əvəzinə onların orta qiymətlərindən kənarlaşmalarını götürsək, reqressiya tənliyi formaya çevrilir. . Başqa sözlə, çevrilmiş koordinat sistemində istənilən reqressiya xətti koordinatların başlanğıcından keçir (şək. 13) və əmsalı yoxdur.

Şəkil 13. Transformasiya edilmiş koordinat sistemində reqressiya asılılığının mövqeyi.

Reqressiya tənliyinin parametrləri bizə asılı və müstəqil dəyişənlərin bir-biri ilə necə əlaqəli olduğunu bildirir, lakin əlaqənin yaxınlıq dərəcəsi haqqında bizə heç nə demir, yəni. məlumat buludunun əsas oxunun mövqeyini göstərir, lakin əlaqənin sıxlıq dərəcəsi (buludun nə qədər dar və ya geniş olması) haqqında heç bir şey demir.

Bölgənin əraziləri üçün 200X üçün məlumatlar verilir.

Rayon nömrəsi Bir əmək qabiliyyətli şəxsin gündə adambaşına orta yaşayış minimumu, rub., x Orta gündəlik əmək haqqı, rub., y
1 78 133
2 82 148
3 87 134
4 79 154
5 89 162
6 106 195
7 67 139
8 88 158
9 73 152
10 87 162
11 76 159
12 115 173

Məşq:

1. Korrelyasiya sahəsi qurun və əlaqənin forması haqqında fərziyyə qurun.

2. Xətti reqressiya tənliyinin parametrlərini hesablayın

4. Orta (ümumi) elastiklik əmsalından istifadə edərək amillə nəticə arasındakı əlaqənin gücünün müqayisəli qiymətini verin.

7. Faktorun proqnozlaşdırılan qiyməti onun orta səviyyəsindən 10% artarsa, nəticənin proqnozlaşdırılan qiymətini hesablayın. Əhəmiyyət səviyyəsi üçün proqnozun etimad intervalını müəyyən edin.

Həll:

Gəlin qərar verək bu vəzifə Excel istifadə edərək.

1. Mövcud olan x və y məlumatlarını müqayisə etməklə, məsələn, onları x amilinin artan ardıcıllığı ilə sıralamaqla, adambaşına düşən orta yaşayış minimumunun artımı orta gündəlik yaşayış səviyyəsini artırdıqda, xüsusiyyətlər arasında birbaşa əlaqənin mövcudluğunu müşahidə etmək olar. əmək haqqı. Buna əsaslanaraq, xüsusiyyətlər arasındakı əlaqənin birbaşa olduğunu və düz xətt tənliyi ilə təsvir edilə biləcəyini fərz edə bilərik. Eyni nəticə qrafik analiz əsasında təsdiqlənir.

Korrelyasiya sahəsi yaratmaq üçün Excel PPP-dən istifadə edə bilərsiniz. İlkin məlumatları ardıcıllıqla daxil edin: əvvəlcə x, sonra y.

Məlumatları ehtiva edən xanaların sahəsini seçin.

Sonra seçin: Daxil et / Scatter Plot / Markerlərlə səpŞəkil 1-də göstərildiyi kimi.

Şəkil 1 Korrelyasiya sahəsinin qurulması

Korrelyasiya sahəsinin təhlili, nöqtələr demək olar ki, düz bir xəttdə yerləşdiyi üçün düzxətli asılılığa yaxınlığın mövcudluğunu göstərir.

2. Xətti reqressiya tənliyinin parametrlərini hesablamaq
Daxili statistik funksiyadan istifadə edək LİST.

Bunun üçün:

1) Təhlil edilmiş məlumatları ehtiva edən mövcud faylı açın;
2) Reqressiya statistikasının nəticələrini göstərmək üçün boş xanaların 5x2 sahəsini (5 sətir, 2 sütun) seçin.
3) Aktivləşdirin Funksiya Sihirbazı: əsas menyuda seçin Düsturlar / Daxil Et funksiyası.
4) Pəncərədə Kateqoriya götürürsən Statistik, funksiya pəncərəsində - LİST. düyməni basın tamamŞəkil 2-də göstərildiyi kimi;

Şəkil 2 Funksiya Sihirbazı Dialoq Qutusu

5) Funksiya arqumentlərini doldurun:

üçün tanınan dəyərlər

X-in məlum dəyərləri

Sabit - boolean dəyəri, bu tənlikdə sərbəst terminin mövcudluğunu və ya olmamasını göstərir; əgər Sabit = 1 olarsa, onda sərbəst müddət adi üsulla hesablanır, Sabit = 0 olarsa, sərbəst müddət 0-dır;

Statistika- reqressiya təhlilində əlavə məlumatların göstərilib-göstərilməməsini göstərən məntiqi dəyər. Əgər Statistika = 1 olarsa, onda əlavə informasiya göstərilir, əgər Statistika = 0 olarsa, onda yalnız tənlik parametrlərinin təxminləri göstərilir.

düyməni basın tamam;

Şəkil 3 LINEST Funksiya Arqumentləri Dialoq Qutusu

6) Yekun cədvəlin birinci elementi seçilmiş sahənin yuxarı sol xanasında görünəcək. Bütün cədvəli açmaq üçün düyməni basın , sonra düymələr birləşməsinə keçin ++ .

Əlavə reqressiya statistikası aşağıdakı diaqramda göstərilən ardıcıllıqla çıxarılacaq:

Əmsal dəyəri b Dəyər əmsalı
Standart xəta b Standart səhv a
Standart səhv y
F-statistika
Kvadratların reqressiya cəmi

Şəkil 4 LINEST funksiyasının hesablanmasının nəticəsi

Reqressiya səviyyəsini əldə etdik:

Nəticə veririk: Adambaşına düşən orta yaşayış minimumunun 1 rubl artması ilə. orta gündəlik əmək haqqı orta hesabla 0,92 rubl artır.

52% variasiya deməkdir əmək haqqı(y) x amilinin - adambaşına düşən orta yaşayış səviyyəsinin dəyişməsi, 48%-i isə modelə daxil olmayan digər amillərin təsiri ilə izah olunur.

Hesablanmış təyin əmsalından istifadə edərək korrelyasiya əmsalı hesablana bilər: .

Əlaqə yaxın kimi qiymətləndirilir.

4. Orta (ümumi) elastiklik əmsalından istifadə edərək amilin nəticəyə təsir gücünü müəyyən edirik.

Düz xətt tənliyi üçün düsturdan istifadə edərək orta (ümumi) elastiklik əmsalını təyin edirik:

X dəyərləri olan xanaların sahəsini seçərək, orta dəyərləri tapacağıq Düsturlar / Avtomatik Cəm / Orta, və biz y dəyərləri ilə eyni şeyi edəcəyik.

Şəkil 5 Orta funksiya qiymətlərinin və arqumentin hesablanması

Belə ki, adambaşına düşən yaşayış minimumu onun orta dəyərindən 1% dəyişərsə, orta gündəlik əmək haqqı orta hesabla 0,51% dəyişəcək.

Məlumatların təhlili alətindən istifadə Reqressiya mövcuddur:
- reqressiya statistikasının nəticələri,
- dispersiya təhlilinin nəticələri;
- nəticələr etimad intervalları,
- qalıqlar və reqressiya xəttinə uyğun qrafiklər,
- qalıqlar və normal ehtimal.

Prosedur aşağıdakı kimidir:

1) girişi yoxlayın Analiz paketi. Əsas menyuda seçin: Fayl/Seçimlər/Əlavələr.

2) Açılan siyahıda Nəzarət elementi seçin Excel əlavələri və düyməni basın Get.

3) Pəncərədə Əlavələr qutunu yoxlayın Analiz paketi, və sonra düyməni basın tamam.

Əgər Analiz paketi sahə siyahısında yoxdur Mövcud əlavələr, Düyməyə bas Baxış-icmal axtarış həyata keçirmək üçün.

Təhlil paketinin kompüterinizdə quraşdırılmadığını göstərən bir mesaj alsanız, klikləyin Bəli onu quraşdırmaq üçün.

4) Əsas menyuda seçin: Data / Data Analizi / Analiz Alətləri / Reqressiya, və sonra düyməni basın tamam.

5) Məlumat daxiletmə və çıxış parametrləri dialoq qutusunu doldurun:

Giriş intervalı Y- nəticə atributunun məlumatlarını ehtiva edən diapazon;

Giriş intervalı X- amil xarakteristikası məlumatlarını ehtiva edən diapazon;

Teqlər- birinci sətirdə sütun adlarının olub-olmadığını göstərən bayraq;

Daimi - sıfır- tənlikdə sərbəst terminin olub-olmamasını göstərən bayraq;

Çıxış intervalı- gələcək diapazonun yuxarı sol xanasını göstərmək kifayətdir;

6) Yeni iş vərəqi - yeni vərəq üçün ixtiyari ad təyin edə bilərsiniz.

Sonra düyməni basın tamam.

Şəkil 6 Reqressiya aləti üçün parametrlərin daxil edilməsi üçün dialoq qutusu

Problem məlumatları üçün reqressiya təhlilinin nəticələri Şəkil 7-də təqdim olunur.

Şəkil 7 Reqressiya alətindən istifadənin nəticəsi

5. İstifadəsini qiymətləndirək orta səhv tənliklərin yaxınlaşma keyfiyyəti. Şəkil 8-də təqdim olunan reqressiya analizinin nəticələrindən istifadə edək.

Şəkil 8 “Qalıqların çıxarılması” reqressiya alətindən istifadənin nəticəsi

Şəkil 9-da göstərildiyi kimi yeni cədvəl yaradaq.C sütununda hesablayırıq nisbi səhv düsturdan istifadə edərək təxminlər:

Şəkil 9 Orta yaxınlaşma xətasının hesablanması

Orta yaxınlaşma xətası düsturla hesablanır:

Qurulmuş modelin keyfiyyəti 8 - 10% -dən çox olmadığı üçün yaxşı qiymətləndirilir.

6. Cədvəldən reqressiya statistikası(Şəkil 4) Fişerin F-testinin faktiki dəyərini yazırıq:

Çünki 5% əhəmiyyətlilik səviyyəsində, onda reqressiya tənliyinin əhəmiyyətli olduğu qənaətinə gələ bilərik (əlaqə sübut edilmişdir).

8. Qiymətləndirmə statistik əhəmiyyəti Tələbənin t-statistikasından istifadə edərək və hər bir göstəricinin etibarlılıq intervalını hesablayaraq reqressiya parametrlərini həyata keçirəcəyik.

Göstəricilər ilə sıfır arasında statistik cəhətdən əhəmiyyətsiz bir fərq haqqında H 0 hipotezini irəli sürdük:

.

sərbəstlik dərəcələrinin sayına görə

Şəkil 7 faktiki t-statistik dəyərlərə malikdir:

Korrelyasiya əmsalı üçün t-testi iki yolla hesablamaq olar:

I üsul:

Harada - korrelyasiya əmsalının təsadüfi xətası.

Hesablama üçün məlumatları Şəkil 7-dəki cədvəldən alacağıq.

II üsul:

Həqiqi t-statistik dəyərlər cədvəl dəyərlərindən artıqdır:

Buna görə də H 0 hipotezi rədd edilir, yəni reqressiya parametrləri və korrelyasiya əmsalı təsadüfən sıfırdan fərqlənmir, lakin statistik əhəmiyyətlidir.

a parametri üçün etibarlılıq intervalı kimi müəyyən edilir

a parametri üçün Şəkil 7-də göstərildiyi kimi 95% limitlər aşağıdakılardır:

Reqressiya əmsalı üçün etibarlılıq intervalı kimi müəyyən edilir

Reqressiya əmsalı b üçün Şəkil 7-də göstərildiyi kimi 95% həddi:

Etibar intervallarının yuxarı və aşağı hədlərinin təhlili belə qənaətə gəlir ki, ehtimalla a və b parametrləri müəyyən edilmiş hədlər daxilində olmaqla sıfır dəyərləri qəbul etmir, yəni. statistik cəhətdən əhəmiyyətsiz deyil və sıfırdan əhəmiyyətli dərəcədə fərqlənir.

7. Reqressiya tənliyinin əldə edilmiş qiymətləri ondan proqnozlaşdırma üçün istifadə etməyə imkan verir. Əgər proqnozlaşdırılan yaşayış dəyəri:

Sonra yaşayış minimumunun proqnozlaşdırılan dəyəri belə olacaq:

Düsturdan istifadə edərək proqnoz səhvini hesablayırıq:

Harada

Excel PPP-dən istifadə edərək fərqi də hesablayacağıq. Bunun üçün:

1) Aktivləşdirin Funksiya Sihirbazı: əsas menyuda seçin Düsturlar / Daxil Et funksiyası.

3) Amil xarakteristikasının ədədi məlumatlarını ehtiva edən diapazonu doldurun. klikləyin tamam.

Şəkil 10 Dispersiyaların hesablanması

Variasiya dəyərini aldıq

Sərbəstlik dərəcəsi üzrə qalıq dispersiyanı hesablamaq üçün Şəkil 7-də göstərildiyi kimi dispersiya təhlilinin nəticələrindən istifadə edəcəyik.

0,95 ehtimalı ilə y-nin fərdi dəyərlərini proqnozlaşdırmaq üçün inam intervalları aşağıdakı ifadə ilə müəyyən edilir:

İlk növbədə müşahidələrin kiçik həcminə görə interval kifayət qədər genişdir. Ümumilikdə orta aylıq əməkhaqqı ilə bağlı proqnoz etibarlı olub.

Problemin ifadəsi götürülmüşdür: Ekonometrika üzrə seminar: Proc. müavinət / I.I. Eliseeva, S.V. Kurysheva, N.M. Gordeenko və başqaları; Ed. İ.İ. Eliseeva. - M.: Maliyyə və Statistika, 2003. - 192 s.: ill.



Saytda yeni

>

Ən məşhur