Uy Pulpit Excelda yaqinlashishning o'rtacha nisbiy xatosi. O'rtacha taxminiy xato

Excelda yaqinlashishning o'rtacha nisbiy xatosi. O'rtacha taxminiy xato

Kurs ishi

"Ekonometrika" fanidan

« Keng qamrovli tahlil korxonalar faoliyatining moliyaviy-iqtisodiy ko'rsatkichlarining o'zaro bog'liqligi"

Variant № 12

Bajarildi:

EET-312 guruhi talabasi

Logunov N.Yu.

Tekshirildi:

Dots. Ishxanyan M.V.

Moskva 2015 yil

Muammoning bayonoti

1. Korrelyatsiya matritsasi kompilyatsiyasi. Faktorlarni tanlash

2. Ko'p sonli tenglamani tuzish chiziqli regressiya. Tenglama parametrlarini talqin qilish

3. Aniqlash koeffitsienti, ko'p koeffitsient korrelyatsiyalar

4.Ko'p chiziqli regressiya tenglamasining sifatini baholash

4.1.O'rtacha nisbiy xato yaqinlashishlar

4.2.Tekshirish statistik ahamiyatga ega tenglamalar ko'p regressiya Fisherning F testidan foydalangan holda

4.3.Ko'p regressiya tenglamasi parametrlarining statistik ahamiyatini tekshirish. Intervalli parametrlarni baholash

5. Ilova regressiya modeli

5.1.Nuqtali bashorat

5.2 Qisman elastiklik koeffitsientlari va o'rtacha qisman elastiklik koeffitsientlari

6.Regressiya modeli qoldiqlarini tahlil qilish (Gauss-Markov teoremasining asoslarini tekshirish)

6.1.Reytinglar matematik kutish qoldiqlari

6.2.Qaldiqlardagi avtokorrelyatsiyani tekshirish

7. Gregori Chou mezoni

Muammoning bayonoti

53 ta korxonaning xo‘jalik faoliyatini tavsiflovchi 6 ta ko‘rsatkichning qiymatlari ko‘rsatilgan. Majburiy:

1. Korrelyatsiya matritsasini tuzing. Mustaqil o'zgaruvchilar to'plamini sozlang (2 ta omilni tanlang).

4.2. Fisherning F testidan foydalanib, bir nechta regressiya tenglamasining statistik ahamiyatini bir butun sifatida sinab ko'ring. Xulosa chiqaring

4.3. Ko'p regressiya tenglamasi parametrlarining statistik ahamiyatini tekshiring. Parametrlarning intervalli baholarini tuzing. Xulosa chiqaring.



5. Regressiya modelining qo'llanilishi:

5.1. Tuzilgan tenglamadan foydalanib, nuqta prognozini bering. O'rganilayotgan y parametrning qiymatini toping, agar birinchi omilning qiymati (y ga eng yaqin) uning o'rtacha qiymatining 110% ni tashkil qilsa, ikkinchi omilning qiymati o'rtacha qiymatining 80% ni tashkil qiladi. Natijaning iqtisodiy talqinini bering.

5.2. Qisman elastiklik koeffitsientlarini va o'rtacha qisman elastiklik koeffitsientlarini toping. Natijalarni izohlang. Xulosa chiqaring.

6. Regressiya modelining qoldiqlarini tahlil qiling (Gauss-Markov teoremasi talablarini tekshiring):

6.1. Qoldiqlarning matematik kutilmalari taxminlarini toping.

6.2. Qoldiqlardagi avtokorrelyatsiyani tekshiring. Xulosa chiqaring.

7. Namunani ikkita teng qismga bo'ling. Birinchi va oxirgi kuzatishlarni mustaqil namunalar sifatida ko'rib chiqing, Gregori-Chow mezonidan foydalanib, ularni bitta namunaga birlashtirish imkoniyati haqidagi gipotezani sinab ko'ring.

Korrelyatsiya matritsasini tuzish. Faktorlarni tanlash

Korxona raqami. Y3 X10 X12 X5 X7 X13
13,26 1,45 167,69 0,78 1,37
10,16 1,3 186,1 0,75 1,49
13,72 1,37 220,45 0,68 1,44
12,85 1,65 169,3 0,7 1,42
10,63 1,91 39,53 0,62 1,35
9,12 1,68 40,41 0,76 1,39
25,83 1,94 102,96 0,73 1,16
23,39 1,89 37,02 0,71 1,27
14,68 1,94 45,74 0,69 1,16
10,05 2,06 40,07 0,73 1,25
13,99 1,96 45,44 0,68 1,13
9,68 1,02 41,08 0,74 1,1
10,03 1,85 136,14 0,66 1,15
9,13 0,88 42,39 0,72 1,23
5,37 0,62 37,39 0,68 1,39
9,86 1,09 101,78 0,77 1,38
12,62 1,6 47,55 0,78 1,35
5,02 1,53 32,61 0,78 1,42
21,18 1,4 103,25 0,81 1,37
25,17 2,22 38,95 0,79 1,41
19,4 1,32 81,32 0,77 1,35
1,48 67,26 0,78 1,48
6,57 0,68 59,92 0,72 1,24
14,19 2,3 107,34 0,79 1,40
15,81 1,37 512,6 0,77 1,45
5,23 1,51 53,81 0,8 1,4
7,99 1,43 80,83 0,71 1,28
17,5 1,82 59,42 0,79 1,33
17,16 2,62 36,96 0,76 1,22
14,54 1,75 91,43 0,78 1,28
6,24 1,54 17,16 0,62 1,47
12,08 2,25 27,29 0,75 1,27
9,49 1,07 184,33 0,71 1,51
9,28 1,44 58,42 0,74 1,46
11,42 1,4 59,4 0,65 1,27
10,31 1,31 49,63 0,66 1,43
8,65 1,12 391,27 0,84 1,5
10,94 1,16 258,62 0,74 1,35
9,87 0,88 75,66 0,75 1,41
6,14 1,07 123,68 0,75 1,47
12,93 1,24 37,21 0,79 1,35
9,78 1,49 53,37 0,72 1,4
13,22 2,03 32,87 0,7 1,2
17,29 1,84 45,63 0,66 1,15
7,11 1,22 48,41 0,69 1,09
22,49 1,72 13,58 0,71 1,26
12,14 1,75 63,99 0,73 1,36
15,25 1,46 104,55 0,65 1,15
31,34 1,6 222,11 0,82 1,87
11,56 1,47 25,76 0,8 1,17
30,14 1,38 29,52 0,83 1,61
19,71 1,41 41,99 0,7 1,34
23,56 1,39 78,11 0,74 1,22

1.Korrelyatsiya matritsasini tuzing. Mustaqil o'zgaruvchilar to'plamini sozlang (2 ta omilni tanlang).

Keling, natija belgisini ko'rib chiqaylik Y3 va omil xususiyatlari X10, X12, X5, X7, X13 .

MS Excelda “Ma’lumotlarni tahlil qilish→ Korrelyatsiya” variantidan foydalanib, korrelyatsiya matritsasi tuzamiz:

Y3 X10 X12 X5 X7 X13
Y3 1,0000 0,3653 0,0185 0,2891 0,1736 0,0828
X10 0,3653 1,0000 -0,2198 -0,0166 -0,2061 -0,0627
X12 0,0185 -0,2198 1,0000 0,2392 0,3796 0,6308
X5 0,2891 -0,0166 0,2392 1,0000 0,4147 0,0883
X7 0,1736 -0,2061 0,3796 0,4147 1,0000 0,1939
X13 0,0828 -0,0627 0,6308 0,0883 0,1939 1,0000

Mezonlarga ko'ra ikkita omilni tanlaymiz:

1) Y va X o'rtasidagi aloqa maksimal bo'lishi kerak

2) Xmi o'rtasidagi aloqa minimal bo'lishi kerak

Shunday qilib, keyingi paragraflarda omillar bilan ish olib boriladi X10 , X5.

Ko'p chiziqli regressiya tenglamasini qurish. Tenglama parametrlarini talqin qilish.

2. Ko‘p chiziqli regressiya tenglamasini tuzing. Tenglama parametrlarining talqinini bering.

MS Excelda “Ma’lumotlar tahlili→Regressiya” tahlil paketi yordamida regressiya modelini yaratamiz:

Imkoniyatlar
Y -20,7163
X 10 5,7169
X 5 34,9321

Regressiya tenglamasi quyidagicha ko'rinadi:

ŷ = b 0 + b 10 * x 10 + b 5 * x 5

ŷ = -20,7163-5,7169* x 10 +34,9321* x 5

1) b10 ijobiy;

2) b5 musbat;

Determinatsiya koeffitsienti, ko'p korrelyatsiya koeffitsienti

3. Determinatsiya koeffitsientini, karra korrelyatsiya koeffitsientini toping. Xulosa chiqaring.

MS Excelda “Ma’lumotlar tahlili→Regressiya” tahlil paketi yordamida amalga oshirilgan regressiya tahlilida “Regressiya statistikasi” jadvalini topamiz:

Y3 va X10,X5 o'rtasidagi bir nechta R-aloqa zaif

R-kvadrat - Y xususiyatdagi o'zgarishlarning 22,05% X10 va X5 belgilarining o'zgarishi bilan izohlanadi.

Ko'p chiziqli regressiya tenglamasining sifatini baholash

4. Ko‘p chiziqli regressiya tenglamasining sifatini baholang:

Taxminlashning o'rtacha nisbiy xatosi

4.1. O'rtacha nisbiy yaqinlashish xatosini toping. Xulosa chiqaring.

Har bir kuzatish uchun bashorat qilingan qiymatlarni hisoblaylik yoki MS Excel-dagi “Maʼlumotlar tahlili→Regressiya” tahlil paketi yordamida amalga oshirilgan regressiya tahlilida “Qoldiq chiqish” jadvalidagi “Prognoz qilingan Y” ustunidan foydalanamiz)

Har bir kuzatish uchun nisbiy xatolarni formuladan foydalanib hisoblaymiz:

O'rtacha nisbiy yaqinlashish xatosini formuladan foydalanib hisoblaymiz:

Xulosa: 20% < А < 50%, качество уравнения среднее (удовлетворительное).

Taxminan xato - bu manba ma'lumotlarini yaqinlashtirishning muayyan usullarini qo'llashda eng ko'p yuzaga keladigan muammolardan biridir. Taxminan xatolarning har xil turlari mavjud:

Manba ma'lumotlari xatolari bilan bog'liq xatolar;

Taxminiy model va taxminiy ma'lumotlarning tuzilishi o'rtasidagi nomuvofiqlik bilan bog'liq xatolar.

Excelda murakkab matematikadan foydalanadigan ma'lumotlarni qayta ishlash va yaqinlashish uchun yaxshi ishlab chiqilgan Lineer funksiyasi mavjud. Bu haqda tasavvurga ega bo'lish uchun (F1 orqali) qisqartmalar va yozuvdagi ba'zi o'zgarishlar bilan taqdim etilgan ushbu ishlanmaning tavsif qismiga murojaat qilaylik.

Usul yordamida ketma-ketlik statistikasini hisoblaydi eng kichik kvadratlar mavjud ma'lumotlarga eng mos keladigan to'g'ri chiziqni hisoblash uchun. Funksiya olingan qatorni tavsiflovchi massivni qaytaradi. Qiymatlar massivi qaytarilganligi sababli, funktsiya massiv formulasi sifatida ko'rsatilishi kerak.

To'g'ri chiziq uchun tenglama:

y=a+b1*x1+b2*x2+...bn*xn

Sintaksis:

LINEST(y;x;const;statistics)

y massivi - ma'lum qiymatlar y.

X massivi - x ning ma'lum qiymatlari. X massivida bir yoki bir nechta o'zgaruvchilar to'plami bo'lishi mumkin.

Const mantiqiy qiymat, bu a qo'g'irchoq atamasi 0 bo'lishi kerakmi yoki yo'qligini aniqlaydi.

Agar const argumenti TRUE, 1 yoki o'tkazib yuborilmagan bo'lsa, a odatdagidek baholanadi. Agar const argumenti FALSE yoki 0 bo'lsa, a 0 ga o'rnatiladi.

Statistika mantiqiy qiymat bo'lib, qo'shimcha regressiya statistikasini qaytarish kerakligini ko'rsatadi. Agar statistik argument TRUE yoki 1 bo'lsa, LINEST qo'shimchasini qaytaradi regressiya statistikasi. Agar statistik ma'lumotlar FALSE, 0 yoki o'tkazib yuborilgan bo'lsa, LINEST faqat koeffitsientlar va kesishmani qaytaradi.

Qo'shimcha regressiya statistikasi:

se1,se2,...,sen - b1,b2,...,bn koeffitsientlari uchun standart xato qiymatlari.

dengiz - a doimiysi uchun standart xato qiymati (dengiz = #N/A, agar const FALSE bo'lsa).

r2 - determinizm koeffitsienti. y ning haqiqiy qiymatlari va chiziq tenglamasidan olingan qiymatlar solishtiriladi; Taqqoslash natijalariga ko'ra, determinizm koeffitsienti hisoblab chiqiladi, 0 dan 1 gacha normallashtiriladi. Agar u 1 ga teng bo'lsa, u holda model bilan to'liq korrelyatsiya mavjud, ya'ni. y ning haqiqiy va taxminiy qiymatlari o'rtasida farq yo'q. Aksincha, aniqlash koeffitsienti 0 bo'lsa, regressiya tenglamasi y ning qiymatlarini bashorat qilishda muvaffaqiyatsiz bo'ladi. R2 qanday hisoblanganligi haqida ma'lumot olish uchun ushbu bo'lim oxiridagi "Eslatmalar" ga qarang.

sey - y ni baholash uchun standart xato.

F-statistik yoki F-kuzatilgan qiymat. F-statistika bog'liq va mustaqil o'zgaruvchilar o'rtasidagi kuzatilgan bog'liqlik tasodifiy yoki yo'qligini aniqlash uchun ishlatiladi.

df - erkinlik darajalari. Erkinlik darajalari statistik jadvalda F-kritik qiymatlarni topish uchun foydalidir. Modelning ishonch darajasini aniqlash uchun siz jadvaldagi qiymatlarni LINEST funksiyasi tomonidan qaytarilgan F-statistika bilan solishtirasiz.

ssreg - kvadratlarning regressiya yig'indisi.

ssresid - kvadratlarning qoldiq yig'indisi.

Quyidagi rasmda qo'shimcha regressiya statistikasini qaytarish tartibi ko'rsatilgan.

Eslatmalar

Funktsiyadan tanlangan ma'lumotni INDEX funktsiyasi orqali olish mumkin, masalan:

Y-kesish (erkin muddat):

INDEX(LINEST(y,x),2)

LINEST funksiyasi bilan hisoblangan to'g'ri chiziq yordamida yaqinlashishning aniqligi ma'lumotlarning tarqalish darajasiga bog'liq. Ma'lumotlar to'g'ri chiziqqa qanchalik yaqin bo'lsa, LINEST funksiyasi tomonidan ishlatiladigan model shunchalik aniqroq bo'ladi. LINEST funksiyasi maʼlumotlarga eng mos kelishini aniqlash uchun eng kichik kvadratlardan foydalanadi.

Regressiya tahlilini o'tkazish orqali, Microsoft Excel har bir nuqta uchun bashorat qilingan y qiymati va haqiqiy y qiymati o'rtasidagi farq kvadratini hisoblab chiqadi. Bu kvadratik farqlarning yig'indisi kvadratlarning qoldiq yig'indisi deb ataladi. Keyin Microsoft Excel haqiqiy y qiymatlari va o'rtacha y qiymati o'rtasidagi farqlarning kvadratlari yig'indisini hisoblab chiqadi, bu kvadratlarning umumiy yig'indisi (kvadratlarning regressiya yig'indisi + kvadratlarning qoldiq yig'indisi) deb ataladi. Kvadratlarning umumiy yig'indisiga nisbatan kvadratlarning qoldiq yig'indisi qanchalik kichik bo'lsa, determinatsiya koeffitsienti shunchalik katta bo'ladi, r2, bu regressiya tenglamasi o'zgaruvchilar orasidagi munosabatlarni qanchalik yaxshi tushuntirayotganini o'lchaydi.

E'tibor bering, regressiya tenglamasi tomonidan bashorat qilingan y qiymatlari, agar ular tenglamani aniqlash uchun ishlatilgan y qiymatlari oralig'idan tashqariga chiqsa, to'g'ri bo'lmasligi mumkin.

1-misol Nishab va Y-kesishma

LINEST((1;9;5;7);(0;4;2;3)) teng (2;1), qiyalik = 2 va y-kesish = 1 ga teng.

F va R2 statistikasidan foydalanish

Yuqori r2 qiymatiga ega bo'lgan natija tasodif tufayli yoki yo'qligini aniqlash uchun F statistikasidan foydalanishingiz mumkin. Agar F-kuzatilgan F-kritikdan katta bo'lsa, u holda o'zgaruvchilar o'rtasida bog'liqlik mavjud. F-kritikni matematik statistika bo'yicha har qanday ma'lumotnomadagi F-kritik qiymatlar jadvalidan olish mumkin. Bir tomonlama test yordamida ushbu qiymatni topish uchun Alfa qiymatini (Alfa qiymati kuchli munosabatlar mavjudligi haqida noto'g'ri xulosa chiqarish ehtimolini ko'rsatish uchun ishlatiladi) 0,05 ga teng va erkinlik darajalari soni uchun ( odatda v1 va v2 bilan belgilanadi), keling, v1 = k = 4 va v2 = n - (k + 1) = 11 - (4 + 1) = 6 ni qo'yaylik, bu erda k - o'zgaruvchilar soni va n - ma'lumotlar nuqtalari soni . Malumot jadvalidan F-kritik 4,53 ga teng. Kuzatilgan F-qiymati 459,753674 (bu qiymat biz tashlab ketgan misolda olingan), bu qiymatdan sezilarli darajada kattaroqdir. F-kritik qiymat 4.53. Shu sababli, olingan regressiya tenglamasi istalgan natijani bashorat qilish uchun foydalidir.

O'rtacha taxminiy xato- hisoblangan qiymatlarning haqiqiylardan o'rtacha og'ishi:

Bu erda y x - tenglamadan hisoblangan qiymat.

15% gacha bo'lgan o'rtacha taxminiy xato yaxshi jihozlangan tenglama modelini ko'rsatadi.

199X yil uchun Ural viloyatining ettita hududi uchun ikkita xususiyatning qiymati ma'lum.

Majburiy:
1. y ning x ga bog’liqligini xarakterlash uchun quyidagi funksiyalarning parametrlarini hisoblang:
a) chiziqli;
b) quvvat;
c) ko'rgazmali;
d) teng qirrali giperbola (shuningdek, ushbu modelni qanday qilib oldindan chiziqli qilish kerakligini aniqlab olishingiz kerak).
2. Har bir modelni orqali baholang o'rtacha yaqinlashish xatosi Cf va Fisherning F-testi.

Yechimni yordamida amalga oshiramiz onlayn kalkulyator Chiziqli regressiya tenglamasi.
a) chiziqli regressiya tenglamasi;
Grafik usuldan foydalanish.
Bu usul o'rganilayotgan iqtisodiy ko'rsatkichlar orasidagi bog'lanish shaklini vizual tasvirlash uchun qo'llaniladi. Buning uchun to'rtburchaklar koordinatalar tizimida grafik chiziladi, natijada Y xarakteristikasining individual qiymatlari ordinatalar o'qi bo'ylab, X omil xarakteristikasining individual qiymatlari abscissa o'qi bo'ylab chiziladi.
Natijaviy va omil xarakteristikalari nuqtalari to'plami deyiladi korrelyatsiya maydoni.


Korrelyatsiya maydoniga asoslanib, gipoteza ilgari surilishi mumkin (uchun aholi) X va Y ning barcha mumkin bo'lgan qiymatlari o'rtasidagi munosabatlar chiziqli ekanligini.
Chiziqli regressiya tenglamasi y = bx + a + e
Bu erda e - tasodifiy xato (og'ish, buzilish).
Tasodifiy xatoning mavjudligi sabablari:
1. Regressiya modeliga muhim tushuntiruvchi o‘zgaruvchilar kiritilmaganligi;
2. O‘zgaruvchilarning yig‘indisi. Misol uchun, umumiy iste'mol funktsiyasi urinishdir umumiy ifoda individual xarajatlar qarorlari yig'indisi. Bu faqat turli xil parametrlarga ega bo'lgan individual munosabatlarning taxminiy ko'rinishi.
3. Model tuzilmasining noto'g'ri tavsifi;
4. Noto'g'ri funktsional spetsifikatsiya;
5. O'lchov xatolari.
Har bir aniq kuzatish i uchun e i og'ishlar tasodifiy va ularning namunadagi qiymatlari noma'lum bo'lganligi sababli:
1) x i va y i kuzatuvlaridan faqat a va b parametrlarning baholarini olish mumkin
2) Regressiya modelining a va b parametrlarining baholari mos ravishda a va b qiymatlari bo'lib, ular tabiatan tasodifiydir, chunki tasodifiy namunaga mos keladi;
Keyin taxminiy regressiya tenglamasi (namunaviy ma'lumotlardan tuzilgan) y = bx + a + e ko'rinishiga ega bo'ladi, bu erda e i - e i xatolarining kuzatilgan qiymatlari (baxmalari) va a va b mos ravishda topilishi kerak bo'lgan regressiya modelining a va b parametrlari.
Parametrlarni baholash uchun a va b - eng kichik kvadratlar usuli (eng kichik kvadratlar usuli) qo'llaniladi.




Biz b = -0,35, a = 76,88 ni olamiz
Regressiya tenglamasi:
y = -0,35 x + 76,88

x y x 2 y 2 x y y(x) (y i -y cp) 2 (y-y(x)) 2 |y - y x |:y
45,1 68,8 2034,01 4733,44 3102,88 61,28 119,12 56,61 0,1094
59 61,2 3481 3745,44 3610,8 56,47 10,98 22,4 0,0773
57,2 59,9 3271,84 3588,01 3426,28 57,09 4,06 7,9 0,0469
61,8 56,7 3819,24 3214,89 3504,06 55,5 1,41 1,44 0,0212
58,8 55 3457,44 3025 3234 56,54 8,33 2,36 0,0279
47,2 54,3 2227,84 2948,49 2562,96 60,55 12,86 39,05 0,1151
55,2 49,3 3047,04 2430,49 2721,36 57,78 73,71 71,94 0,172
384,3 405,2 21338,41 23685,76 22162,34 405,2 230,47 201,71 0,5699

Eslatma: y(x) ning qiymatlari olingan regressiya tenglamasidan topiladi:
y(45,1) = -0,35*45,1 + 76,88 = 61,28
y(59) = -0,35*59 + 76,88 = 56,47
... ... ...

Taxminan xato
Absolyut yaqinlashish xatosidan foydalanib, regressiya tenglamasining sifatini baholaylik. O'rtacha taxminiy xato- hisoblangan qiymatlarning haqiqiylardan o'rtacha og'ishi:

Xato 15% dan kam bo'lganligi sababli, bu tenglama regressiya sifatida ishlatilishi mumkin.

F-statistika. Fisher mezoni.










3. Jadval qiymati uchun erkinlik darajalari sonini hisobga olgan holda, ma'lum bir ahamiyat darajasi uchun Fisher taqsimot jadvallaridan aniqlanadi. Umumiy hisob kvadratlar (kattaroq dispersiya) 1 ga teng va chiziqli regressiyada kvadratlarning qoldiq yig'indisi (kichik dispersiya) erkinlik darajalari soni n-2 ga teng.
4. Agar F-testining haqiqiy qiymati jadval qiymatidan kam bo'lsa, unda ular nol gipotezani rad etish uchun hech qanday sabab yo'qligini aytishadi.
Aks holda, nol gipoteza rad etiladi va (1-a) ehtimollik bilan tenglamaning umumiy statistik ahamiyati haqidagi muqobil gipoteza qabul qilinadi.

< Fkp, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

b) kuch regressiyasi;
Yechim chiziqli bo'lmagan regressiya xizmati yordamida amalga oshiriladi. Tanlashda Power y = ax b ni belgilang
v) eksponensial regressiya;
d) teng yonli giperbolaning modeli.
Oddiy tenglamalar tizimi.

Bizning ma'lumotlarimiz uchun tenglamalar tizimi shaklga ega
7a + 0,1291b = 405,2
0,1291a + 0,0024b = 7,51
Birinchi tenglamadan a ifodalaymiz va uni ikkinchi tenglamaga almashtiramiz
Biz b = 1054,67, a = 38,44 ni olamiz
Regressiya tenglamasi:
y = 1054,67 / x + 38,44
Taxminan xato.
Absolyut yaqinlashish xatosidan foydalanib, regressiya tenglamasining sifatini baholaylik.

Xato 15% dan kam bo'lganligi sababli, bu tenglama regressiya sifatida ishlatilishi mumkin.

Fisher mezoni.
Regressiya modelining ahamiyatini tekshirish Fisherning F testi yordamida amalga oshiriladi, uning hisoblangan qiymati o'rganilayotgan indikatorning dastlabki kuzatuvlar seriyasining dispersiyasi va qoldiq ketma-ketligi dispersiyasining xolis bahosi nisbati sifatida topiladi. ushbu model uchun.
Agar k1=(m) va k2=(n-m-1) erkinlik darajalari bilan hisoblangan qiymat berilgan ahamiyatlilik darajasida jadvalli qiymatdan katta bo’lsa, model muhim hisoblanadi.

bu erda m - modeldagi omillar soni.
Juftlangan chiziqli regressiyaning statistik ahamiyati quyidagi algoritm yordamida baholanadi:
1. Tenglama yaxlit statistik jihatdan ahamiyatsiz degan nol gipoteza ilgari suriladi: H 0: R 2 =0 a ahamiyatlilik darajasida.
2. Keyin F-mezonining haqiqiy qiymatini aniqlang:

bu yerda juft regressiya uchun m=1.
Erkinlik darajalari k1=1 va k2=5 bo'lgan mezonning jadval qiymati, Fkp = 6,61
F ning haqiqiy qiymatidan beri< Fkp, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

5. F-testidan foydalanib, natijada olingan juftlashtirilgan regressiya tenglamasi umuman statistik jihatdan ahamiyatsiz ekanligi va oylik pensiya qiymati y va yashash qiymati x o'rtasidagi bog'liqlikning o'rganilgan hodisasini etarli darajada tavsiflamasligi aniqlandi.

6. Shartli firma y sof daromadi miqdorini kapital aylanmasi x1 va foydalanilgan kapital x2 bilan bog‘lovchi ekonometrik ko‘p chiziqli regressiya modeli yaratildi.

7. Egiluvchanlik koeffitsientlarini hisoblash orqali kapital aylanmasi 1% ga oʻzgarganda korxona sof daromadi miqdori 0,0008% ga, foydalanilgan kapital 1% ga oʻzgarganda esa korxona sof daromadi miqdori koʻrsatilgan. 0,56% ga o'zgaradi.

8. T-testdan foydalanib, regressiya koeffitsientlarining statistik ahamiyati baholandi, x 1 tushuntirish o'zgaruvchisi statistik jihatdan ahamiyatsiz bo'lib, regressiya tenglamasidan chiqarib tashlanishi mumkin, shu bilan birga tushuntirish o'zgaruvchisi x 2. statistik ahamiyatga ega.

9. F-testidan foydalanib, natijada olingan juftlashgan regressiya tenglamasi umuman statistik ahamiyatga ega ekanligi va shartli firmaning sof daromadi y va kapital aylanmasi x 1 va foydalanilgan kapital o'rtasidagi bog'liqlikning o'rganilgan hodisasini etarli darajada tavsiflashi aniqlandi. x 2.

10. Statistik ma'lumotlarni chiziqli ko'p regressiya tenglamasi bilan yaqinlashtirishning o'rtacha xatosi hisoblab chiqildi, bu 29,8% ni tashkil etdi. Statistik ma'lumotlar bazasidagi qaysi kuzatuv tufayli ushbu xatoning kattaligi ruxsat etilgan qiymatdan oshib ketganligi ko'rsatilgan.

14. EXCEL dan foydalanmasdan juftlashgan regressiya modelini qurish.

3.5-jadvalda keltirilgan statistik ma'lumotlardan foydalangan holda quyidagilar zarur:

2. Korrelyatsiya va aniqlash ko'rsatkichlari yordamida bog'lanishning yaqinligini baholang.

3.Elastiklik koeffitsientidan foydalanib, omil xarakteristikasi bilan natijaviy bog'lanish darajasini aniqlang.

4. O'rtacha yaqinlashish xatosini aniqlang.

5.Fisherning F testi yordamida modellashtirishning statistik ishonchliligini baholang.

3.5-jadval. Dastlabki ma'lumotlar.

Aholi jon boshiga oʻrtacha pul daromadlarining umumiy miqdorida depozitlar, kreditlar, sertifikatlar va chet el valyutasini sotib olishga qaratilgan jamgʻarmalarni koʻpaytirishga yoʻnaltirilgan pul daromadlarining ulushi, %

O'rtacha oylik hisoblangan ish haqi, c.u.

Kaluzhskaya

Kostromskaya

Orlovskaya

Ryazan

Smolenskaya

Juftlangan chiziqli regressiya tenglamasining noma'lum parametrlarini aniqlash uchun b 0 , b 1 shaklga ega bo'lgan normal tenglamalarning standart tizimidan foydalanamiz.

(3.7)

Ushbu tizimni hal qilish uchun birinchi navbatda Sx 2 va Sxy qiymatlarini aniqlash kerak. Ushbu qiymatlar manba ma'lumotlar jadvalidan aniqlanadi, uni tegishli ustunlar bilan to'ldiradi (3.6-jadval).

3.6-jadval. Regressiya koeffitsientlarini hisoblash tomon.

Keyin sistema (3.7) shaklni oladi

Birinchi tenglamadan b 0 ni ifodalab, olingan ifodani ikkinchi tenglamaga almashtirsak:

Hujjatlarni ko'paytirish va qavslarni ochish orqali biz quyidagilarni olamiz:

Nihoyat, jamg'armalarni y oshirishga qaratilgan aholining pul daromadlari ulushi qiymatini o'rtacha oylik hisoblangan ish haqi x bilan bog'laydigan juft chiziqli regressiya tenglamasi quyidagi shaklga ega:

Shunday qilib, juft chiziqli regressiya tenglamasi tuzilgach, bog'liqlikka ko'ra chiziqli korrelyatsiya koeffitsientini aniqlaymiz:

mos keladigan parametrlarning standart og'ishlarining qiymatlari qaerda.

Bog'liqlikdan (3.9) chiziqli korrelyatsiya koeffitsientini hisoblash uchun biz oraliq hisob-kitoblarni bajaramiz.

Topilgan parametrlarning qiymatlarini (3.9) ifodaga almashtirib, olamiz

.

Chiziqli korrelyatsiya koeffitsientining olingan qiymati aholining jamg'armalarni ko'paytirishga qaratilgan pul daromadlari ulushi y va o'rtacha oylik hisoblangan ish haqi miqdori o'rtasida zaif teskari statistik bog'liqlik mavjudligini ko'rsatadi.

Determinatsiya koeffitsienti , ya'ni faqat 9,6% tushuntirish o'zgaruvchisi x ni y bo'yicha regressiya bilan izohlanadi. Shunga ko'ra, 90,4% ga teng bo'lgan 1 qiymati ekonometrik modelda hisobga olinmagan boshqa barcha tushuntirish o'zgaruvchilari ta'siridan kelib chiqqan y o'zgaruvchining dispersiya ulushini tavsiflaydi.

Elastiklik koeffitsienti

Binobarin, o'rtacha oylik hisoblangan ish haqi 1 foizga o'zgarganda aholining jamg'armalarni ko'paytirishga qaratilgan pul daromadlari ulushi ham 1 foizga kamayadi va ish haqining oshishi bilan aholining pul daromadlari ulushi kamayadi. jamg'armalarni ko'paytirishga qaratilgan aholi. Bu xulosa sog'lom fikrga ziddir va uni faqat yaratilgan matematik modelning noto'g'riligi bilan izohlash mumkin.

Keling, o'rtacha taxminiy xatoni hisoblaylik.

3.7-jadval. O'rtacha yaqinlashish xatosini hisoblash tomon.

Olingan qiymat (12...15)% dan oshadi, bu esa ekonometrik model qurilgan haqiqiy ma'lumotlardan hisoblangan ma'lumotlarning o'rtacha chetlanishining ahamiyatini ko'rsatadi.

Statistik modellashtirishning ishonchliligi Fisherning F-testi asosida amalga oshiriladi. F calc Fisher mezonining nazariy qiymati formula bo'yicha bir erkinlik darajasi uchun hisoblangan omil va qoldiq dispersiyalarning qiymatlari nisbati asosida aniqlanadi.

bu yerda n - kuzatishlar soni;

m - izohli o'zgaruvchilar soni (ko'rib chiqilayotgan misol uchun m m =1).

Kritik F kritik qiymati statistik jadvallardan aniqlanadi va ahamiyatlilik darajasi uchun a = 0,05 10,13 ga teng. F hisoblangandan beri

15. EXCEL dan foydalanmasdan ko'p regressiya modelini qurish.

3.8-jadvalda keltirilgan statistik materiallardan foydalanib, siz:

1. Chiziqli ko‘p regressiya tenglamasini tuzing va uning parametrlarining iqtisodiy ma’nosini tushuntiring.

2. O'rtacha (umumiy) elastiklik koeffitsientlaridan foydalangan holda omillar va hosil bo'lgan belgi o'rtasidagi bog'liqlikning yaqinligiga qiyosiy baho bering.

3. t-test yordamida regressiya koeffitsientlarining statistik ahamiyatini va F-testi yordamida tenglamaning ahamiyatsizligi haqidagi nol gipotezasini baholang.

4. Taxminan o'rtacha xatolikni aniqlash orqali tenglamaning sifatini baholang.

3.8-jadval. Dastlabki ma'lumotlar.

Sof daromad, million AQSh dollari

Kapital aylanmasi million AQSH dollari

Ishlatilgan kapital, mln AQSH dollari

Ko'p chiziqli regressiya tenglamasining noma'lum b 0, b 1, b 2 parametrlarini aniqlash uchun biz shaklga ega bo'lgan normal tenglamalarning standart tizimidan foydalanamiz.

(3.11)

Ushbu tizimni hal qilish uchun birinchi navbatda Sx 1 2, Sx 2 2, Sx 1 y, Sx 2 y, Sx 1 x 2 qiymatlarini aniqlash kerak. Ushbu qiymatlar manba ma'lumotlar jadvalidan aniqlanadi, uni tegishli ustunlar bilan to'ldiradi (3.9-jadval).

3.9-jadval. Regressiya koeffitsientlarini hisoblash tomon.

Keyin sistema (3.11) shaklni oladi

Ushbu tizimni yechish uchun biz noma'lumlarni ketma-ket yo'q qilishdan iborat bo'lgan Gauss usulidan foydalanamiz: tizimning birinchi tenglamasini 10 ga bo'ling, so'ngra hosil bo'lgan tenglamani 370,6 ga ko'paytiring va uni tizimning ikkinchi tenglamasidan ayirib, keyin ko'paytiramiz. 158,20 ga tenglama hosil qiling va uni tizimning uchinchi tenglamasidan ayiring. Tizimning o'zgartirilgan ikkinchi va uchinchi tenglamalari uchun belgilangan algoritmni takrorlab, biz quyidagilarni olamiz:

Þ Þ

Þ .

Transformatsiyadan so'ng bizda:

Keyin sof daromadning kapital aylanmasi va foydalanilgan kapitalga yakuniy bog'liqligi shaklda bo'ladi chiziqli tenglama ko'p regressiya quyidagi shaklga ega:

Hosil bo‘lgan ekonometrik tenglamadan ko‘rinib turibdiki, foydalanilgan kapitalning ko‘payishi bilan sof daromad ortadi va aksincha, kapital aylanmasining oshishi bilan sof daromad kamayadi. Bundan tashqari, regressiya koeffitsienti qanchalik katta bo'lsa, tushuntiruvchi o'zgaruvchining bog'liq o'zgaruvchiga ta'siri shunchalik katta bo'ladi. Ko'rib chiqilayotgan misolda regressiya koeffitsientining qiymati koeffitsient qiymatidan kattaroqdir, shuning uchun foydalanilgan kapital kapital aylanmasiga qaraganda sof daromadga sezilarli darajada ko'proq ta'sir qiladi. Ushbu xulosani miqdoriy jihatdan baholash uchun biz qisman elastiklik koeffitsientlarini aniqlaymiz.

Natijalar tahlili shuni ko'rsatadiki, foydalanilgan kapital sof daromadga ko'proq ta'sir qiladi. Shunday qilib, xususan, foydalanilgan kapitalning 1% ga o'sishi bilan sof daromad 1,17% ga oshadi. Shu bilan birga, kapital aylanmasining 1% ga o'sishi bilan sof daromad 0,5% ga kamayadi.

Fisher mezonining nazariy qiymati F hisoblab chiqilgan

Kritik F kritik qiymatining qiymati statistik jadvallardan aniqlanadi va a = 0,05 ahamiyatlilik darajasi uchun 4,74 ga teng. F calc > F krit bo'lgani uchun nol gipoteza rad etiladi va natijada olingan regressiya tenglamasi statistik ahamiyatga ega deb qabul qilinadi.

Regressiya koeffitsientlari va t-mezonining statistik ahamiyatini baholash ushbu koeffitsientlarning raqamli qiymatini ularning tasodifiy xatolarining kattaligi bilan taqqoslash va o'zaro bog'liqlik bo'yicha amalga oshiriladi:

T-statistikaning nazariy qiymatini hisoblashning ishchi formulasi:

, (3.13)

Bunda juft korrelyatsiya koeffitsientlari va ko'p korrelyatsiya koeffitsientlari bog'liqliklardan hisoblanadi:

Keyin t-statistikaning nazariy (hisoblangan) qiymatlari mos ravishda:

A = 0,05 t krit = 2,36 ga teng ahamiyatlilik darajasi uchun statistik jadvallardan aniqlangan t-statistikaning kritik qiymati mutlaq qiymatda = - 1,798 dan katta bo'lganligi sababli, nol gipoteza rad etilmaydi va tushuntirish o'zgaruvchisi x 1 ga teng. statistik jihatdan ahamiyatsiz va uni regressiya tenglamasidan chiqarib tashlash mumkin. Aksincha, ikkinchi regressiya koeffitsienti uchun > t krit (3,3 > 2,36) va tushuntirish o'zgaruvchisi x 2 statistik ahamiyatga ega.

Keling, o'rtacha taxminiy xatoni hisoblaylik.

3.10-jadval. O'rtacha yaqinlashish xatosini hisoblash tomon.

Keyin o'rtacha yaqinlashish xatosi

Olingan qiymat (12…15)% ga teng ruxsat etilgan chegaradan oshmaydi.

16. O'lchov nazariyasining rivojlanish tarixi

TI birinchi marta psixofizik o'lchovlar nazariyasi sifatida ishlab chiqilgan. Urushdan keyingi nashrlarda amerikalik psixolog S.S. Stivens o'lchov shkalalariga e'tibor qaratdi. 20-asrning ikkinchi yarmida. TIni qo'llash doirasi tez sur'atlar bilan kengayib bormoqda. 50-yillarda AQShda nashr etilgan "Psixologiya fanlari entsiklopediyasi"ning jildlaridan biri "Psixologik o'lchovlar" deb nomlangan. Ushbu nashr mualliflari TIning ko'lamini psixofizikadan umuman psixologiyagacha kengaytirdilar. Ushbu to'plamdagi "O'lchovlar nazariyasi asoslari" maqolasida taqdimot mavhum matematik darajada bo'lib, hech qanday maxsus qo'llash sohasiga havolasiz edi. Unda asosiy e'tibor "empirik tizimlarning sonlarga bo'lgan munosabatlari bilan gomomorfizmlari" ga qaratildi (bu matematik atamalarga bu erda kirishning hojati yo'q) va taqdimotning matematik murakkabligi S.S. Stivens.

TI bo'yicha birinchi mahalliy maqolalardan birida (60-yillarning oxiri) ekspertiza ob'ektlarini baholashda ekspertlar tomonidan berilgan ballar, qoida tariqasida, tartibli shkala bo'yicha o'lchanishi aniqlangan. 70-yillarning boshlarida paydo bo'lgan ishlar TIdan foydalanish ko'lamining sezilarli darajada kengayishiga olib keldi. U pedagogik kvalimetriya (talabalarning bilim sifatini o'lchash), tizimli tadqiqotlar va turli nazariy masalalarda qo'llaniladi. ekspert baholashlari, mahsulot sifati ko'rsatkichlarini umumlashtirish uchun, sotsiologik tadqiqotlarda va boshqalar.

TIning ikkita asosiy muammosi sifatida, aniq ma'lumotlarni o'lchash uchun shkala turini belgilash bilan bir qatorda, ma'lumotlarni tahlil qilish algoritmlarini qidirish ilgari surildi, uning natijasi shkalaning ruxsat etilgan o'zgarishi bilan o'zgarmaydi (ya'ni, o'zgarmasdir). geografiyadagi tartibli shkalalar - Bofort shkalasi shamollari ("sokin", "engil shamol", "mo''tadil shamol" va boshqalar), zilzila kuchi shkalasi. Shubhasiz, 2 magnitudali zilzila (shift ostida chayqalgan chiroq) 10 balli zilziladan (er yuzidagi hamma narsani to'liq yo'q qilish) roppa-rosa 5 baravar kuchsizroq deb aytish mumkin emas.

Tibbiyotda ordinal shkalalar gipertenziya bosqichlari shkalasi (Myasnikov bo'yicha), yurak etishmovchiligi darajalari shkalasi (Strajesko-Vasilenko-Lang bo'yicha), koronar etishmovchilikning og'irlik shkalasi (Fogelson bo'yicha) va boshqalar. . Bu barcha tarozilar quyidagi sxema bo'yicha qurilgan: kasallik aniqlanmagan; kasallikning birinchi bosqichi; ikkinchi bosqich; uchinchi bosqich... Ba'zan 1a, 16 va hokazo bosqichlar ajralib turadi, har bir bosqich o'ziga xos tibbiy xususiyatga ega. Nogironlik guruhlarini tavsiflashda raqamlar teskari tartibda qo'llaniladi: eng og'ir - birinchi nogironlik guruhi, keyin ikkinchi, eng engil - uchinchi.

Uy raqamlari ham tartibli shkala bo'yicha o'lchanadi - ular uylar ko'cha bo'ylab qanday tartibda joylashganligini ko'rsatadi. Yozuvchining to‘plangan asarlaridagi jild raqamlari yoki korxona arxividagi ish raqamlari odatda ularni yaratishning xronologik tartibi bilan bog‘lanadi.

Mahsulotlar va xizmatlar sifatini baholashda tartibli shkalalar kvalimetriya (so'zma-so'z tarjima - sifat o'lchovi) deb ataladigan usulda mashhurdir. Ya'ni, ishlab chiqarish birligi o'tish mumkin yoki yaroqsiz deb baholanadi. Aniqroq tahlil qilish uchun uchta darajali shkala qo'llaniladi: sezilarli nuqsonlar mavjud - faqat kichik nuqsonlar mavjud - hech qanday nuqsonlar yo'q. Ba'zan to'rtta gradatsiya qo'llaniladi: tanqidiy nuqsonlar mavjud (foydalanishni imkonsiz qiladi) - sezilarli nuqsonlar mavjud - faqat kichik nuqsonlar mavjud - nuqsonlar yo'q. Mahsulotlarni tasniflash o'xshash ma'noga ega - premium, birinchi nav, ikkinchi nav,...

Atrof-muhitga ta'sirni baholashda birinchi, eng umumiy baholash odatda tartibli bo'ladi, masalan: tabiiy muhit barqaror - tabiiy muhit ezilgan (buzilgan). Ekologik-tibbiy miqyos o'xshash: inson salomatligiga aniq ta'sir ko'rsatilmaydi - salomatlikka salbiy ta'sir ko'rsatiladi.

Tartib shkalasi boshqa sohalarda ham qo'llaniladi. Ekonometriyada bular, birinchi navbatda, ekspert baholashning turli usullari.

Barcha o'lchov shkalalari ikki guruhga bo'linadi - sifat ko'rsatkichlari shkalasi va miqdoriy belgilar shkalasi. Tartib shkalasi va nomlash shkalasi sifat atributlarining asosiy shkalasi hisoblanadi, shuning uchun ko'pgina aniq sohalarda sifatli tahlil natijalarini ushbu masshtablar bo'yicha o'lchovlar deb hisoblash mumkin. Miqdoriy xarakteristikalar masshtablari intervallar, nisbatlar, farqlar, mutlaq shkalalardir. Intervalli shkaladan foydalanib, potentsial energiyaning kattaligi yoki to'g'ri chiziqdagi nuqtaning koordinatasi o'lchanadi. Bunday hollarda shkalada na tabiiy kelib chiqishi, na tabiiy o'lchov birligi belgilanishi mumkin emas. Tadqiqotchi boshlang'ich nuqtani belgilashi va o'lchov birligini o'zi tanlashi kerak. Intervalli shkalada qabul qilinadigan o'zgarishlar chiziqli ortib boruvchi transformatsiyalardir, ya'ni. chiziqli funksiyalar. Tselsiy va Farengeyt harorat shkalalari aynan shu bog'liqlik bilan bog'langan: °C = 5/9 (°F - 32), bu erda °C - Tselsiy shkalasi bo'yicha harorat (graduslarda) va °F - Farengeytdagi harorat. masshtab.

Miqdoriy masshtablardan fan va amaliyotda eng keng tarqalgani nisbat shkalasidir. Ularning tabiiy mos yozuvlar nuqtasi bor - nol, ya'ni. miqdorning yo'qligi, lekin tabiiy o'lchov birligi yo'q. Ko'pgina jismoniy birliklar nisbatlar shkalasida o'lchanadi: tana massasi, uzunlik, zaryad, shuningdek, iqtisodiyotdagi narxlar. Nisbatlar shkalasida qabul qilinadigan o'zgarishlar o'xshash (faqat o'lchovni o'zgartirish). Boshqacha qilib aytganda, erkin muddatsiz chiziqli o'sish transformatsiyalari, masalan, narxlarni belgilangan kurs bo'yicha bir valyutadan boshqasiga konvertatsiya qilish. Aytaylik, ikkita investitsiya loyihasining iqtisodiy samaradorligini rubldagi narxlardan foydalangan holda taqqoslaylik. Birinchi loyiha ikkinchisidan yaxshiroq bo'lsin. Endi qat’iy konvertatsiya kursidan foydalangan holda Xitoy valyutasi – yuanga o‘tamiz. Shubhasiz, birinchi loyiha yana ikkinchisidan ko'ra foydaliroq bo'lishi kerak. Biroq, hisoblash algoritmlari bu shartning bajarilishini avtomatik ravishda ta'minlamaydi va uning bajarilishini tekshirish kerak. O'rtacha qiymatlar uchun bunday test natijalari quyida tavsiflanadi.

Farq shkalasi tabiiy o'lchov birligiga ega, ammo tabiiy mos yozuvlar nuqtasi yo'q. Vaqt farqlar shkalasi bo'yicha o'lchanadi, agar yil (yoki kun - tushdan kunduzgacha) tabiiy o'lchov birligi sifatida qabul qilinsa va intervallar shkalasida. umumiy holat. Hozirgi bilim darajasida tabiiy boshlang'ich nuqtasini ko'rsatish mumkin emas. Turli mualliflar dunyoning yaratilish sanasini, shuningdek, Masihning tug'ilgan kunini turli yo'llar bilan hisoblashadi.

Faqat mutlaq o'lchov uchun o'lchov natijalari so'zning odatiy ma'nosidagi raqamlar, masalan, xonadagi odamlar soni. Mutlaq shkala uchun faqat identifikatsiyani o'zgartirishga ruxsat beriladi.

Tegishli bilim sohasini rivojlantirish jarayonida masshtab turi o'zgarishi mumkin. Shunday qilib, dastlab harorat tartibli shkala bo'yicha o'lchandi (sovuqroq - iliqroq). Keyin - interval bo'yicha (Tselsiy, Farengeyt, Reaumur shkalasi). Nihoyat, mutlaq nol kashf etilgandan so'ng, haroratni nisbatlar shkalasi (Kelvin shkalasi) bo'yicha o'lchangan deb hisoblash mumkin. Shuni ta'kidlash kerakki, ba'zida mutaxassislar o'rtasida o'lchangan haqiqiy qiymatlarni hisobga olish uchun qaysi tarozilardan foydalanish kerakligi haqida kelishmovchiliklar mavjud. Boshqacha qilib aytadigan bo'lsak, o'lchov jarayoni shkala turini aniqlashni ham o'z ichiga oladi (shkalaning ma'lum bir turini tanlashning mantiqiy asoslari bilan birga). Ro'yxatga olingan oltita asosiy tarozi turiga qo'shimcha ravishda, ba'zan boshqa tarozilar ham qo'llaniladi.

17. Invariant algoritmlar va o'rtacha qiymatlar.

TIda ma'lumotlarni tahlil qilish algoritmlariga qo'yiladigan asosiy talabni shakllantiramiz: ma'lum turdagi shkala bo'yicha o'lchangan ma'lumotlar asosida tuzilgan xulosalar, bu ma'lumotlarning o'lchov shkalasi ruxsat etilganda o'zgarmasligi kerak. Boshqacha qilib aytadigan bo'lsak, tegishli o'lchov o'zgarishlarida xulosalar o'zgarmas bo'lishi kerak.

Shunday qilib, o'lchov nazariyasining asosiy maqsadlaridan biri haqiqiy ob'ektlarga raqamli qiymatlarni belgilashda tadqiqotchining sub'ektivligiga qarshi kurashishdir. Shunday qilib, masofalarni arshin, metr, mikron, mil, parsek va boshqa o'lchov birliklarida o'lchash mumkin. Massa (og'irlik) - pud, kilogramm, funt va boshqalarda. Tovar va xizmatlar narxlari yuan, rubl, tenge, grivna, lat, kroon, marka, AQSh dollari va boshqa valyutalarda (belgilangan konvertatsiya stavkalari asosida) ko'rsatilishi mumkin. Juda muhim, garchi juda aniq bo'lsa-da, haqiqatni ta'kidlaymiz: o'lchov birliklarini tanlash tadqiqotchiga bog'liq, ya'ni. sub'ektiv. Statistik xulosalar tadqiqotchi qaysi o'lchov birligini afzal ko'rishiga bog'liq bo'lmasa, shkalaning ruxsat etilgan o'zgarishiga nisbatan o'zgarmas bo'lgandagina haqiqatga adekvat bo'lishi mumkin. Ekonometrik ma'lumotlarni tahlil qilish uchun ko'plab algoritmlardan faqat bir nechtasi bu shartni qondiradi. Buni o'rtacha qiymatlarni solishtirish orqali ko'rsatamiz.

X 1, X 2,.., X n n hajmli namuna bo‘lsin. Ko'pincha o'rtacha arifmetik ishlatiladi. O'rtacha arifmetikdan foydalanish shunchalik keng tarqalganki, bu atamadagi ikkinchi so'z ko'pincha o'tkazib yuboriladi va odamlar aniq iqtisodiy ma'lumotlar uchun o'rtacha ish haqi, o'rtacha daromad va boshqa o'rtacha ko'rsatkichlar haqida gapirishadi, ya'ni "o'rtacha" arifmetik o'rtacha. Bu an'ana noto'g'ri xulosalarga olib kelishi mumkin. Buni gipotetik korxona xodimlarining o'rtacha ish haqini (o'rtacha daromadini) hisoblash misolida ko'rsatamiz. 100 nafar ishchidan faqat 5 nafarining maoshi undan oshib ketadi, qolgan 95 nafarining maoshi esa oʻrtacha arifmetikdan sezilarli darajada past. Sababi ayon – bir kishi – bosh direktorning maoshi 95 nafar ishchi – past malakali va yuqori malakali ishchilar, muhandislar va idora xodimlarining maoshidan oshib ketadi. Vaziyat o'likxonada 0° haroratda yotgan 10 nafar bemor bo'lgan, ulardan 9 nafarining harorati 40°C bo'lgan, biri esa allaqachon azoblangan kasalxona haqidagi taniqli hikoyada tasvirlangan holatni eslatadi. C. Ayni paytda, shifoxonadagi o'rtacha harorat 36 ° C - bundan yaxshiroq bo'lishi mumkin emas!

Shunday qilib, o'rtacha arifmetik faqat juda bir xil populyatsiyalar uchun ishlatilishi mumkin (bir yo'nalishda yoki boshqasida katta chegaralarsiz). Ish haqini tavsiflash uchun qanday o'rtacha ko'rsatkichlardan foydalanish kerak? Median - 50 va 51-chi xodimlarning o'rtacha arifmetik qiymatidan foydalanish tabiiydir, agar ularning ish haqi kamaymaydigan tartibda joylashtirilgan. Avvaliga 40 nafar past malakali ishchilarning maoshlari, keyin esa - 41-dan 70-chigacha - yuqori malakali ishchilarning maoshlari keladi. Binobarin, mediana maxsus ularga to'g'ri keladi va 200 ga teng. 50 ishchi uchun ish haqi 200 dan oshmaydi va 50 - kamida 200, shuning uchun mediana o'rganilayotgan qiymatlarning asosiy qismi atrofida joylashgan "markazni" ko'rsatadi. guruhlangan. Boshqa o'rtacha qiymat - bu rejim, eng tez-tez uchraydigan qiymat. Ko'rib chiqilayotgan holatda, bu past malakali ishchilarning ish haqi, ya'ni. 100. Shunday qilib, ish haqini tavsiflash uchun biz uchta o'rtacha qiymatga egamiz - rejim (100 birlik), median (200 birlik) va o'rtacha arifmetik (400 birlik).

Haqiqiy hayotda kuzatilgan daromadlar va ish haqi taqsimoti uchun xuddi shunday sxema to'g'ri bo'ladi: rejim medianadan kichik, mediana esa arifmetik o'rtacha qiymatdan kichik.

Nima uchun iqtisodiyotda o'rtacha ko'rsatkichlar qo'llaniladi? Odatda o'rtacha ko'rsatkichlar yordamida populyatsiyalarni solishtirish uchun raqamlar to'plamini bitta raqam bilan almashtirish. Masalan, Y 1, Y 2,..., Y n bir ekspertiza ob'ektiga (masalan, kompaniyaning strategik rivojlanishi variantlaridan biri) "berilgan" ekspert baholashlari to'plami bo'lsin, Z 1 , Z 2,..., Z n -ikkinchi (bu rivojlanishning yana bir versiyasi). Bu populyatsiyalar qanday taqqoslanadi? Shubhasiz, eng oson yo'li o'rtacha qiymatlardir.

O'rtacha ko'rsatkichlarni qanday hisoblash mumkin? Ma'lum har xil turlari o'rtacha qiymatlar: o'rtacha arifmetik, median, mod, geometrik o'rtacha, garmonik o'rtacha, kvadratik o'rtacha. Shuni eslatib o'tamiz umumiy tushuncha o'rtacha qiymat 19-asrning birinchi yarmidagi frantsuz matematigi tomonidan kiritilgan. Akademik O. Koshi. Bu quyidagicha: o'rtacha qiymat har qanday F(X 1, X 2,..., X n) funktsiya bo'lib, argumentlarning barcha mumkin bo'lgan qiymatlari uchun bu funktsiyaning qiymati minimal qiymatdan kam bo'lmasligi kerak. X 1, X 2,... , X n raqamlari va bu raqamlarning maksimalidan oshmasligi kerak. Yuqorida sanab o'tilgan barcha turdagi o'rtacha Koshi o'rtacha hisoblanadi.

Qabul qilinadigan shkala o'zgarishi bilan o'rtacha qiymat aniq o'zgaradi. Ammo qaysi aholi uchun o'rtacha ko'rsatkich katta va qaysi biri uchun kamroq ekanligi haqidagi xulosalar o'zgarmasligi kerak (TIda asosiy talab sifatida qabul qilingan xulosalarning o'zgarmasligi talabiga muvofiq). Taqqoslash natijasi ruxsat etilgan o'lchov o'zgarishlariga nisbatan barqaror bo'lgan o'rtacha qiymatlar turini qidirishning tegishli matematik muammosini tuzamiz.

F(X 1 X 2 ,..., X n) Koshi o‘rtachasi bo‘lsin. Birinchi populyatsiya uchun o'rtacha ikkinchi populyatsiya uchun o'rtacha ko'rsatkichdan past bo'lsin: u holda TIga ko'ra, o'rtacha ko'rsatkichlarni taqqoslash natijasining barqarorligi uchun har qanday ruxsat etilgan transformatsiya uchun g ning ruxsat etilgan o'zgarishlar guruhidan olinishi kerak. mos keladigan shkala, birinchi populyatsiyadan o'zgartirilgan qiymatlarning o'rtacha qiymati ikkinchi to'plam uchun o'zgartirilgan qiymatlarning o'rtacha qiymatidan ham past ekanligi haqiqatdir. Bundan tashqari, tuzilgan shart Y 1, Y 2,..., Y n va Z 1, Z 2,..., Z n har qanday ikkita to'plam va esda tuting, har qanday ruxsat etilgan o'zgartirish uchun to'g'ri bo'lishi kerak. Belgilangan shartni qondiradigan o'rtacha qiymatlarni ruxsat etilgan (tegishli shkalada) deb ataymiz. TIga ko'ra, ekspert xulosalari va ko'rib chiqilayotgan shkala bo'yicha o'lchangan boshqa ma'lumotlarni tahlil qilishda faqat shunday o'rtacha qiymatlardan foydalanish mumkin.

Foydalanish orqali matematik nazariya, 1970-yillarda ishlab chiqilgan bo'lib, asosiy shkalalar bo'yicha qabul qilinadigan o'rtacha ko'rsatkichlar turini tavsiflashga muvaffaq bo'ladi. Nomlar shkalasida o'lchanadigan ma'lumotlar uchun faqat rejim o'rtacha sifatida mos kelishi aniq.

18. Tartib shkala bo'yicha o'rtacha qiymatlar

Keling, tartibli shkala bo'yicha o'lchangan ekspert xulosalarini qayta ishlashni ko'rib chiqaylik. Quyidagi bayonot haqiqatdir.

Teorema1 . Koshi bo‘yicha barcha o‘rtacha ko‘rsatkichlar ichidan tartibli shkalada qabul qilinadigan yagona o‘rtacha atamalar hisoblanadi variatsion qator(tartibdagi statistika).

1-teorema o‘rtacha F(X 1 X 2 ,..., X n) uzluksiz (o‘zgaruvchilar to‘plami ustidagi) va simmetrik funksiya bo‘lishi sharti bilan o‘rinlidir. Ikkinchisi argumentlar qayta joylanganda F(X 1 X 2 ,..., X n) funksiyaning qiymati o‘zgarmasligini bildiradi. Bu holat mutlaqo tabiiydir, chunki biz ketma-ketlik uchun emas, balki umumiylik (to'plam) uchun o'rtacha qiymatni topamiz. To'plam biz uning elementlarini sanab o'tish tartibiga qarab o'zgarmaydi.

1-teoremaga ko'ra, xususan, mediana tartibli shkala bo'yicha o'lchangan ma'lumotlar uchun o'rtacha sifatida ishlatilishi mumkin (agar namuna hajmi toq bo'lsa). Ovoz teng bo'lsa, variatsiya seriyasining ikkita markaziy a'zosidan birini ishlatish kerak - ular ba'zan shunday deyiladi, chap mediana yoki o'ng mediana. Modadan ham foydalanish mumkin - u har doim variatsiya seriyasining a'zosi. Ammo siz hech qachon o'rtacha arifmetik, geometrik o'rtacha va hokazolarni hisoblay olmaysiz.

Quyidagi teorema to'g'ri.

Teorema 2. Y 1, Y 2,...,Y m taqsimot funksiyasi F(x) bo‘lgan mustaqil bir xil taqsimlangan tasodifiy miqdorlar, Z 1, Z 2,..., Zn esa funksiya taqsimotlari bilan bir xil taqsimlangan mustaqil tasodifiy miqdorlar bo‘lsin. H(x) va Y 1, Y 2,...,Y m va Z 1, Z 2,..., Z n namunalari bir-biridan mustaqil va MY X > MZ X. |g i |>X shartni qanoatlantiruvchi har qanday qat’iy ortib boruvchi uzluksiz g funksiya uchun min(m, n) da hodisa ehtimoli 1 ga moyil bo‘lishi uchun F(x) tengsizlik hamma uchun qanoatlantirilishi zarur va yetarli. x< Н(х), причем существовало число х 0 , для которого F(x 0)

Eslatma. Yuqori chegaraga ega shart sof intramatematik xarakterga ega. Haqiqatdan ham, g funktsiya tartibli masshtabda ixtiyoriy ruxsat etilgan transformatsiyadir.

2-teoremaga ko'ra, teoremada berilgan tengsizlikni qanoatlantiradigan ikkita taqsimotdan olingan namunalar solishtirilsa, o'rtacha arifmetik qiymatdan tartibli masshtabda ham foydalanish mumkin. Oddiy qilib aytganda, tarqatish funktsiyalaridan biri har doim boshqasidan yuqori bo'lishi kerak. Tarqatish funktsiyalari kesishishi mumkin emas, ular faqat bir-biriga tegishi mumkin. Bu shart bajariladi, masalan, agar taqsimlash funktsiyalari faqat siljishda farq qilsa:

F(x) = N(x + ∆)

ba'zilari uchun ∆.

Agar ma'lum miqdorning ikkita qiymati bir xil o'lchov vositasi yordamida o'lchansa, oxirgi shart qondiriladi, bunda ko'rib chiqilayotgan miqdorning bir qiymatini o'lchashdan boshqasini o'lchashga o'tishda xatolarning taqsimlanishi o'zgarmaydi.

Kolmogorovga ko'ra o'rtacha

Yuqorida sanab o'tilgan bir nechta o'rtacha ko'rsatkichlarning umumlashtirilishi Kolmogorov o'rtachasidir. X 1, X 2,..., X n raqamlari uchun o'rtacha Kolmogorov formulasi yordamida hisoblanadi.

G((F(X l) + F(X 2)+...F(X n))/n),

bu erda F qat'iy monotonik funktsiya (ya'ni qat'iy ortib borayotgan yoki qat'iy kamayuvchi),

G - F ning teskari funktsiyasi.

Kolmogorovning o'rtacha ko'rsatkichlari orasida ko'plab taniqli belgilar mavjud. Demak, agar F(x) = x bo'lsa, Kolmogorov o'rtacha arifmetik o'rtacha, F(x) = lnx bo'lsa, geometrik o'rtacha, F(x) = 1/x bo'lsa, garmonik o'rtacha, agar F( x) = x 2, keyin o'rtacha kvadrat va boshqalar. Kolmogorov o'rtacha ko'rsatkichi Koshi o'rtachasining alohida holatidir. Boshqa tomondan, median va rejim kabi mashhur o'rtacha ko'rsatkichlarni Kolmogorov o'rtachalari sifatida ifodalash mumkin emas. Monografiyada quyidagi fikrlar isbotlangan.

Teorema3 . Agar intervalli shkalada muntazamlikning ma'lum bir intramatematik shartlari mavjud bo'lsa, Kolmogorovning barcha vositalaridan faqat o'rtacha arifmetik qiymatga ruxsat beriladi. Shunday qilib, haroratning (Selsiy bo'yicha) yoki masofalarning geometrik o'rtacha yoki ildiz o'rtacha kvadrati ma'nosizdir. Arifmetik o'rtacha o'rtacha sifatida ishlatilishi kerak. Median yoki rejimdan ham foydalanishingiz mumkin.

Teorema 4. Agar nisbatlar shkalasidagi qonuniylikning ma'lum intramatematik shartlari o'rinli bo'lsa, Kolmogorovning barcha o'rtacha ko'rsatkichlari ichida faqat F (x) = x c va geometrik o'rtacha kuchga ega bo'lgan o'rtacha quvvatlarga ruxsat beriladi.

Izoh. Geometrik o'rtacha quvvat vositalarining c > 0 uchun chegarasi.

Nisbatlar shkalasida ishlatib bo'lmaydigan Kolmogorov o'rtachalari bormi? Albatta bor. Masalan, F(x) = e x.

O'rtacha qiymatlarga o'xshash boshqa statistik xususiyatlarni o'rganish mumkin - tarqalish, ulanish, masofa va boshqalar. Masalan, korrelyatsiya koeffitsienti oraliqlar kosasida hech qanday ruxsat etilgan transformatsiya bilan o'zgarmasligini ko'rsatish qiyin emas, xuddi dispersiya nisbati kabi, dispersiya farqlar shkalasida, o'zgaruvchanlik koeffitsientida o'zgarmaydi. nisbatlar shkalasi va boshqalar.

O'rtacha qiymatlar bo'yicha yuqoridagi natijalar nafaqat iqtisod, menejment, ekspert baholash nazariyasi yoki sotsiologiyada, balki muhandislikda, masalan, yuqori o'choqlarning avtomatlashtirilgan jarayonlarini boshqarish tizimlarida sensorlarni yig'ish usullarini tahlil qilishda keng qo'llaniladi. TI standartlashtirish va sifatni boshqarish muammolarida, xususan, qiziqarli nazariy natijalar olingan kvalimetriyada katta amaliy ahamiyatga ega. Demak, masalan, mahsulot sifatining alohida ko'rsatkichlarining vazn koeffitsientlarining har qanday o'zgarishi mahsulotlarni o'rtacha vaznli ko'rsatkich bo'yicha tartiblashning o'zgarishiga olib keladi (bu teorema prof. V.V. Podinovskiy tomonidan isbotlangan). Binobarin, TI va uning usullari haqida yuqoridagi qisqacha ma'lumotlar ma'lum ma'noda iqtisod, sotsiologiya va muhandislik fanlarini o'zida mujassam etgan bo'lib, ilgari samarali tahlil qilish imkoni bo'lmagan murakkab muammolarni hal qilish uchun adekvat apparatdir. real modellarni yaratish va prognoz muammosini hal qilish uchun yo'l ochiladi.

22. Juftlangan chiziqli regressiya

Keling, juft chiziqli regressiyaning eng oddiy holatini batafsilroq o'rganishga murojaat qilaylik. Chiziqli regressiya toʻgʻri chiziqli tenglama koʻrinishidagi eng oddiy funksional munosabat bilan tavsiflanadi va model parametrlarini (tenglama koeffitsientlarini) shaffof izohlash bilan tavsiflanadi. Tenglamaning o'ng tomoni bizga regressorning (tushuntiruvchi o'zgaruvchining) berilgan qiymatlari asosida olingan (tushuntirilgan) o'zgaruvchining nazariy (hisoblangan) qiymatlarini olish imkonini beradi. Bu qiymatlar ba'zan bashorat qilingan (xuddi shu ma'noda) deb ham ataladi, ya'ni. nazariy formulalardan olingan. Biroq, bog'liqlikning tabiati haqida gipotezani ilgari surganda, tenglamaning koeffitsientlari hali ham noma'lum bo'lib qolmoqda. Umuman olganda, ushbu koeffitsientlarning taxminiy qiymatlarini turli usullar yordamida olish mumkin.

Lekin ulardan eng muhimi va keng tarqalgani eng kichik kvadratlar usulidir (OLS). U (yuqorida tushuntirilganidek) olingan xarakteristikaning haqiqiy qiymatlarining kvadratik og'ishlar yig'indisini hisoblangan (nazariy)lardan minimallashtirish talabiga asoslanadi. Nazariy qiymatlar o'rniga (ularni olish uchun) regressiya tenglamasining o'ng tomonlarini kvadrat og'ishlar yig'indisiga almashtiring va keyin ushbu funktsiyaning qisman hosilalarini toping (haqiqiy qiymatlarning kvadrat og'ishlari yig'indisi) nazariy xususiyatlardan kelib chiqadigan xarakteristikalar). Bu qisman hosilalar x va y o'zgaruvchilarga nisbatan emas, balki a va b parametrlariga nisbatan olinadi. Qisman hosilalar nolga tenglashtiriladi va oddiy, ammo mashaqqatli o'zgarishlardan so'ng parametrlarni aniqlash uchun normal tenglamalar tizimi olinadi. X o'zgaruvchisi uchun koeffitsient, ya'ni. b regressiya koeffitsienti deb ataladi, u omilning bir birlikka o'zgarishi bilan natijaning o'rtacha o'zgarishini ko'rsatadi. Parametr a iqtisodiy talqinga ega bo'lmasligi mumkin, ayniqsa bu koeffitsientning belgisi salbiy bo'lsa.

Iste'mol funktsiyasini o'rganish uchun juft chiziqli regressiya qo'llaniladi. Ko'paytirgichni hisoblash uchun iste'mol funktsiyasidagi regressiya koeffitsienti qo'llaniladi. Deyarli har doim regressiya tenglamasi ulanishning yaqinligi ko'rsatkichi bilan to'ldiriladi. Chiziqli regressiyaning eng oddiy holati uchun ulanishning yaqinligining bu ko'rsatkichi chiziqli koeffitsient korrelyatsiyalar. Ammo chiziqli korrelyatsiya koeffitsienti chiziqli shakldagi xususiyatlar orasidagi bog'lanishning yaqinligini tavsiflaganligi sababli, chiziqli korrelyatsiya koeffitsientining mutlaq qiymatining nolga yaqinligi hali xususiyatlar o'rtasidagi bog'liqlik yo'qligining ko'rsatkichi bo'lib xizmat qilmaydi.

Model spetsifikatsiyasining boshqacha tanlovi va shuning uchun qaramlik turi bilan haqiqiy munosabatlar birlikka juda yaqin bo'lishi mumkin. Ammo tanlov sifati chiziqli funksiya chiziqli korrelyatsiya koeffitsienti kvadrati yordamida aniqlanadi - aniqlash koeffitsienti. U samarali atributning umumiy dispersiyasidagi regressiya bilan izohlanadigan y samarali atribut dispersiyasining nisbatini tavsiflaydi. Determinatsiya koeffitsientini 1 ga to'ldiruvchi qiymat modelda hisobga olinmagan boshqa omillar ta'siridan kelib chiqadigan dispersiya ulushini tavsiflaydi (qoldiq dispersiya).

Juftlangan regressiya quyidagi ko‘rinishdagi ikkita y va x o‘zgaruvchilarga tegishli tenglama bilan ifodalanadi:

Bu erda y - bog'liq o'zgaruvchi (natijaviy atribut), x - mustaqil o'zgaruvchi (tushuntiruvchi o'zgaruvchi yoki atribut-omil). Chiziqli regressiya va chiziqli bo'lmagan regressiya mavjud. Chiziqli regressiya quyidagi tenglama bilan tavsiflanadi:

y = a+ bx + .

Nochiziqli regressiya, o'z navbatida, tahlilga kiritilgan izohli o'zgaruvchilarga nisbatan chiziqli bo'lishi mumkin, lekin taxmin qilingan parametrlarga nisbatan chiziqli bo'lishi mumkin. Yoki regressiya baholanayotgan parametrlar bo'yicha chiziqli bo'lmasligi mumkin. Tushuntiruvchi o'zgaruvchilarda chiziqli bo'lmagan, lekin taxminiy parametrlarda chiziqli bo'lgan regressiya misollariga turli darajadagi polinom bog'liqliklari (polinomiyalar) va teng tomonli giperbola kiradi.

Hisoblangan parametrlar uchun chiziqli bo'lmagan regressiya - bu parametrga nisbatan quvvatga bog'liqlik (parametr ko'rsatkichda), ko'rsatkichli bog'liqlik, bunda parametr ko'rsatkichning bazasida va eksponensial bog'liqlik, agar butun chiziqli bog'liqlik to'liq bo'lsa. ko'rsatkichda. E'tibor bering, ushbu uchta holatda ham tasodifiy komponent (tasodifiy qoldiq)  kiritilgan o'ng tomoni tenglamalar yig'indisi ko'rinishida emas, balki omil ko'rinishida, ya'ni. multiplikativ tarzda! Olingan xarakteristikaning hisoblangan qiymatlarining haqiqiylardan o'rtacha og'ishi o'rtacha yaqinlashish xatosi bilan tavsiflanadi. U foiz sifatida ifodalanadi va 7-8% dan oshmasligi kerak. Ushbu o'rtacha taxminiy xato haqiqiy va hisoblangan qiymatlar orasidagi farqlarning nisbiy kattaliklarining o'rtacha foizli qiymatidir.

Ko'pgina iqtisodiy hodisa va jarayonlarning muhim xarakteristikasi bo'lib xizmat qiluvchi o'rtacha elastiklik koeffitsienti muhim ahamiyatga ega. U berilgan funksional munosabatning hosilasi qiymati va x ning oʻrtacha qiymatining y ning oʻrtacha qiymatiga nisbati koʻpaytmasi sifatida hisoblanadi. Elastiklik koeffitsienti x omil o'zining (x omil) o'rtacha qiymatidan 1% ga o'zgarganda natija y o'rtacha qiymatidan o'rtacha necha foizga o'zgarishini ko'rsatadi.

Dispersiyani tahlil qilish muammolari juft regressiya va ko'p regressiya (ko'p omillar mavjud bo'lganda) va qoldiq dispersiya bilan chambarchas bog'liq. Dispersiyani tahlil qilish qaram o‘zgaruvchining dispersiyasini tekshiradi. Bunday holda, kvadrat og'ishlarning umumiy yig'indisi ikki qismga bo'linadi. Birinchi atama regressiya yoki tushuntirilgan (faktorial) tufayli kvadrat og'ishlar yig'indisidir. Ikkinchi muddat - omil regressiyasi bilan izohlanmagan kvadrat og'ishlarning qoldiq yig'indisi.

Regressiya bilan izohlanadigan dispersiyaning natijaviy y xarakteristikasining umumiy dispersiyasidagi ulushi determinatsiya koeffitsienti (indeks) bilan tavsiflanadi, bu regressiya tufayli kvadratik og'ishlar yig'indisining kvadratik og'ishlarning umumiy yig'indisiga nisbatidan boshqa narsa emas. (birinchi muddat butun summaga).

Model parametrlari (noma'lumlar koeffitsientlari) eng kichik kvadratlar usuli yordamida aniqlanganda, mohiyatan ba'zi tasodifiy o'zgaruvchilar topiladi (baholarni olish jarayonida). Tasodifiy o'zgaruvchining maxsus shakli bo'lgan regressiya koeffitsientini baholash alohida ahamiyatga ega. Ushbu tasodifiy miqdorning xossalari tenglamadagi (modeldagi) qoldiq a'zoning xususiyatlariga bog'liq. Juftlangan chiziqli regressiya modeli uchun tushuntirish o'zgaruvchisi x ni tasodifiy bo'lmagan ekzogen o'zgaruvchi sifatida ko'rib chiqing. Bu shuni anglatadiki, barcha kuzatuvlardagi x o'zgaruvchisining qiymatlari oldindan aniqlangan deb hisoblanishi mumkin va hech qanday tarzda o'rganilayotgan bog'liqlik bilan bog'liq emas. Shunday qilib, tushuntirilgan o'zgaruvchining haqiqiy qiymati ikkita komponentdan iborat: tasodifiy bo'lmagan va tasodifiy komponent (qoldiq atama).

Boshqa tomondan, eng kichik kvadratlar usuli (OLS) yordamida aniqlangan regressiya koeffitsienti x va y o'zgaruvchilarning kovariatsiyasini x o'zgaruvchining dispersiyasiga bo'lish qismiga teng. Shuning uchun u tasodifiy komponentni ham o'z ichiga oladi. Axir, kovariatsiya y o'zgaruvchining qiymatlariga bog'liq, bu erda y o'zgaruvchining qiymatlari tasodifiy qoldiq  ning qiymatlariga bog'liq. Bundan tashqari, x va y o'zgaruvchilarning kovariatsiyasi hisoblangan regressiya koeffitsienti beta () va x o'zgaruvchisi dispersiyasi, shuningdek, x va  o'zgaruvchilar kovariatsiyasi ko'paytmasiga teng ekanligini ko'rsatish oson. Shunday qilib, beta regressiya koeffitsientining bahosi bu noma'lum regressiya koeffitsientining o'ziga teng bo'lib, x va  o'zgaruvchilarning kovariatsiyasini x o'zgaruvchining dispersiyasiga bo'lish qismiga qo'shiladi. Bular. har qanday tanlamadan olingan b regressiya koeffitsientining bahosi ikki hadning yig'indisi sifatida taqdim etiladi: koeffitsient  (beta) ning haqiqiy qiymatiga teng doimiy qiymat va x va  o'zgaruvchilarning kovariatsiyasiga qarab tasodifiy komponent. .

23. Matematik Gauss-Markov shartlari va ularning qo'llanilishi.

Oddiy OLS asosidagi regressiya tahlili eng yaxshi natijalarga erishish uchun tasodifiy atama to'rtta Gauss-Markov shartlarini qondirishi kerak.

Tasodifiy atamaning matematik kutilishi nolga teng, ya'ni. xolisdir. Agar regressiya tenglamasi doimiy muddatni o'z ichiga olgan bo'lsa, unda bu talabni bajarilgan deb hisoblash tabiiydir, chunki bu doimiy atama bo'lib, y o'zgaruvchisi qiymatlaridagi har qanday tizimli tendentsiyani hisobga olishi kerak, bu esa, aksincha, regressiya tenglamasining izohli o'zgaruvchilari tarkibida bo'lmasligi mumkin.

Tasodifiy atamaning dispersiyasi barcha kuzatishlar uchun doimiydir.

Qiymatlarning kovariatsiyasi tasodifiy o'zgaruvchilar, namunani shakllantirish nolga teng bo'lishi kerak, ya'ni. har qanday ikkita aniq kuzatishda tasodifiy atama qiymatlari o'rtasida tizimli bog'liqlik yo'q. Tasodifiy a'zolar bir-biridan mustaqil bo'lishi kerak.

Tasodifiy atamaning taqsimot qonuni tushuntiruvchi o'zgaruvchilardan mustaqil bo'lishi kerak.

Bundan tashqari, ko'pgina ilovalarda tushuntirish o'zgaruvchilari stokastik emas, ya'ni. tasodifiy komponentga ega emas. Har bir kuzatishdagi har qanday mustaqil o'zgaruvchining qiymati regressiya tenglamasida hisobga olinmagan tashqi sabablar bilan to'liq aniqlangan ekzogen deb hisoblanishi kerak.

Belgilangan Gauss-Markov shartlari bilan birgalikda tasodifiy atama normal taqsimotga ega ekanligi ham taxmin qilinadi. U juda keng sharoitlarda amal qiladi va markaziy chegara teoremasi (CLT) deb ataladigan narsaga asoslanadi. Ushbu teoremaning mohiyati shundaki, agar tasodifiy o'zgaruvchi ko'p sonli boshqa tasodifiy o'zgaruvchilarning o'zaro ta'sirining umumiy natijasi bo'lsa, ularning hech biri ushbu umumiy natijaning xatti-harakatiga ustun ta'sir ko'rsatmasa, natijada tasodifiy o'zgaruvchi tasvirlanadi. taxminan normal taqsimot bilan. Bu yaqinlik normal taqsimot taxminlarni olish uchun normal taqsimotdan foydalanish imkonini beradi va hisoblanadi ma'lum ma'noda uning umumlashtirilishi Talabalar taqsimoti bo'lib, u odatdagidan sezilarli darajada farq qiladi, asosan "dumlar" deb ataladi, ya'ni. kichik namuna o'lchamlari uchun. Bundan tashqari, agar tasodifiy atama normal taqsimlangan bo'lsa, regressiya koeffitsientlari ham normal taqsimlanadi.

Belgilangan regressiya egri chizig'i (regressiya tenglamasi) nuqta prognozi deb ataladigan muammoni hal qilishga imkon beradi. Bunday hisob-kitoblarda x ning o'rganilayotgan kuzatish oralig'idan tashqaridagi ma'lum bir qiymati olinadi va regressiya tenglamasining o'ng tomoniga almashtiriladi (ekstrapolyatsiya protsedurasi). Chunki Regressiya koeffitsientlari uchun taxminlar allaqachon ma'lum, keyin x ning olingan qiymatiga mos keladigan tushuntirilgan y o'zgaruvchining qiymatini hisoblash mumkin. Tabiiyki, bashorat (prognoz) ma'nosiga muvofiq hisob-kitoblar oldinga (kelajakdagi qiymatlar mintaqasiga) amalga oshiriladi.

Biroq, koeffitsientlar ma'lum bir xato bilan aniqlanganligi sababli, bu qiziq emas ball bahosi(nuqta prognozi) samarali xarakteristikani va ma'lum bir ehtimollik bilan, x omilining qabul qilingan qiymatiga mos keladigan samarali xarakteristikaning qiymatlari yotadigan chegaralarni bilish.

Buning uchun standart xato (standart og'ish) hisoblanadi. Buni quyida aytilganlarning ruhida olish mumkin. O'rtacha qiymatlar orqali baholardan erkin a terminining ifodasi chiziqli regressiya tenglamasiga almashtiriladi. Keyin ma'lum bo'ladiki, standart xato o'rtacha samarali omil y xatosiga va qo'shimcha ravishda regressiya koeffitsienti b xatosiga bog'liq. Ushbu standart xatoning oddiy kvadrati summasiga teng o'rtacha qiymatning kvadrat xatosi y va regressiya koeffitsientining kvadrat xatosi x omil qiymatining kvadrat og'ishi va uning o'rtacha ko'paytmasi. Bundan tashqari, birinchi atama, statistika qonunlariga ko'ra, umumiy populyatsiyaning dispersiyasini tanlamaning kattaligiga (hajmiga) bo'lish koeffitsientiga teng.

Noma'lum dispersiya o'rniga, tanlama dispersiyasi taxmin sifatida ishlatiladi. Shunga ko'ra, regressiya koeffitsientining xatosi tanlama dispersiyasini x omilning dispersiyasiga bo'lish koeffitsienti sifatida aniqlanadi. Siz standart xatoni (standart og'ish) va chiziqli regressiya modelidan ko'proq mustaqil bo'lgan boshqa fikrlarni olishingiz mumkin. Buning uchun o'rtacha xato va chegaraviy xato tushunchasi va ular orasidagi bog'liqlik qo'llaniladi.

Ammo standart xatoni olgandan keyin ham, taxmin qilingan qiymat chegaralari haqida savol qoladi. Boshqacha qilib aytganda, o'lchov xatosi oralig'i haqida, tabiiy taxminda ko'p hollarda bu intervalning o'rtasi samarali omil y ning hisoblangan (o'rtacha) qiymati bilan beriladi. Bu erda markaziy chegara teoremasi yordamga keladi, bu noma'lum miqdorning bu ichida qanday ehtimollik bilan ekanligini aniq ko'rsatadi. ishonch oralig'i.

Asosan, standart xato formulasi, qanday va qanday shaklda olinganidan qat'i nazar, regressiya chizig'i pozitsiyasidagi xatoni tavsiflaydi. X faktorning qiymati omilning o'rtacha qiymatiga to'g'ri kelganda standart xato minimal darajaga etadi.

24. Gipotezalarni statistik tekshirish va Fisher mezoni yordamida chiziqli regressiyaning ahamiyatini baholash.

Chiziqli regressiya tenglamasi topilgach, butun tenglamaning ham, uning alohida parametrlarining ham ahamiyati baholanadi. Bir butun sifatida regressiya tenglamasining ahamiyatini baholash turli mezonlar yordamida amalga oshirilishi mumkin. Fisherning F testidan foydalanish juda keng tarqalgan va samarali. Bunday holda, regressiya koeffitsienti nolga teng bo'lgan nol gipoteza ilgari suriladi, ya'ni. b=0 va shuning uchun x omil y natijaga ta'sir qilmaydi. F-testini darhol hisoblashdan oldin dispersiya tahlili o'tkaziladi. Unda markaziy o'rinni y o'zgaruvchisining kvadratik og'ishlarining umumiy yig'indisining o'rtacha y qiymatidan ikki qismga - "tushuntirilgan" va "tushuntirilmagan" ga bo'linishi egallaydi:

Olingan y xarakteristikasining individual qiymatlarining o'rtacha y qiymatidan kvadrat og'ishlarining umumiy yig'indisi ko'plab omillar ta'siridan kelib chiqadi.

Keling, barcha sabablar to'plamini shartli ravishda ikki guruhga ajratamiz: o'rganilgan x omil va boshqa omillar. Agar omil natijaga ta'sir qilmasa, u holda grafikdagi regressiya chizig'i OX va y=y o'qiga parallel bo'ladi. Keyin olingan xarakteristikaning barcha dispersiyasi boshqa omillar ta'siridan kelib chiqadi va kvadratik og'ishlarning umumiy yig'indisi qoldiq bilan mos keladi. Agar boshqa omillar natijaga ta'sir qilmasa, u holda y funktsional jihatdan x bilan bog'liq va kvadratlarning qoldiq yig'indisi nolga teng. Bunday holda, regressiya bilan izohlangan kvadrat og'ishlar yig'indisi kvadratlarning umumiy yig'indisi bilan bir xil bo'ladi. Korrelyatsiya maydonining barcha nuqtalari regressiya chizig'ida yotmaganligi sababli, ularning tarqalishi har doim x omil ta'siridan kelib chiqqan holda sodir bo'ladi, ya'ni. y ning x bo'yicha regressiyasi va boshqa sabablar tufayli yuzaga kelgan (tushunmagan o'zgarish). Regressiya chizig'ining bashorat qilish uchun mosligi y belgisidagi umumiy o'zgarishlarning qancha qismi tushuntirilgan o'zgarish hisobiga bog'liqligiga bog'liq.

Shubhasiz, agar regressiya tufayli kvadratik og'ishlar yig'indisi kvadratlarning qoldiq yig'indisidan katta bo'lsa, u holda regressiya tenglamasi statistik ahamiyatga ega va x omili natijaga sezilarli ta'sir qiladi. Bu determinatsiya koeffitsienti birlikka yaqinlashishiga tengdir. Kvadrat og'ishlarning har qanday yig'indisi erkinlik darajalari soniga bog'liq, ya'ni. xarakteristikaning mustaqil o'zgarishi erkinligi soni. Erkinlik darajalari soni aholi birliklari soni yoki undan aniqlangan doimiylar soni bilan bog'liq. O'rganilayotgan muammoga nisbatan erkinlik darajalari soni n ta mumkin bo'lgan [(y 1 -y), (y 2 -y),...(y n -y)] dan qancha mustaqil og'ishlar kerakligini ko'rsatishi kerak. kvadratlarning berilgan yig‘indisini hosil qilish. Shunday qilib, ∑(y-y sr) 2 kvadratlarning umumiy yig'indisi uchun (n-1) mustaqil og'ishlar talab qilinadi, chunki n birlikdan iborat populyatsiyada o'rtacha darajani hisoblagandan so'ng, faqat (n-1) og'ishlar soni erkin o'zgaradi. ∑(y-y avg) 2 kvadratlarning izohlangan yoki omilli yig'indisini hisoblashda regressiya chizig'i bo'ylab topilgan y* natijaviy xarakteristikasining nazariy (hisoblangan) qiymatlari qo'llaniladi: y(x)=a+bx.

Keling, ushbu qiymatning o'rtacha qiymatidan samarali omilning kvadrat og'ishlarining umumiy yig'indisini kengaytirishga qaytaylik. Bu yig'indi yuqorida aniqlangan ikkita qismdan iborat: regressiya bilan izohlangan kvadrat og'ishlar yig'indisi va kvadrat og'ishlarning qoldiq yig'indisi deb ataladigan boshqa summa. Ushbu parchalanish bilan bog'liq bo'lgan dispersiya tahlili to'g'ridan-to'g'ri asosiy savolga javob beradi: umuman regressiya tenglamasining ahamiyatini va uning individual parametrlarini qanday baholash mumkin? Shuningdek, bu savolning ma'nosini ko'p jihatdan aniqlaydi. Bir butun sifatida regressiya tenglamasining ahamiyatini baholash uchun Fisher mezoni (F-test) qo'llaniladi. Fisher tomonidan taklif qilingan yondashuvga ko'ra, nol gipoteza ilgari suriladi: regressiya koeffitsienti nolga teng, ya'ni. qiymatb=0. Bu shuni anglatadiki, X omil Y natijasiga ta'sir qilmaydi.

Esda tutingki, deyarli har doim statistik tadqiqot natijasida olingan ballar regressiya chizig'ida aniq yotmaydi. Ular tarqoq bo'lib, regressiya chizig'idan ozmi-ko'pmi uzoqda. Bunday dispersiya regressiya tenglamasida e'tiborga olinmagan tushuntirish omili X dan farqli boshqa omillar ta'siridan kelib chiqadi. Kvadrat og'ishlarning izohlangan yoki omilli yig'indisini hisoblashda regressiya chizig'idan topilgan natijaviy xarakteristikaning nazariy qiymatlari qo'llaniladi.

Y va X o'zgaruvchilarning berilgan qiymatlari to'plami uchun Y o'rtacha qiymatining hisoblangan qiymati chiziqli regressiyada faqat bitta parametr - regressiya koeffitsientining funktsiyasidir. Shunga ko'ra, kvadrat og'ishlarning omil yig'indisi 1 ga teng erkinlik darajalariga ega. Chiziqli regressiyada kvadrat og'ishlarning qoldiq yig'indisining erkinlik darajalari soni esa n-2 ga teng.

Shunday qilib, dastlabki kengayishdagi kvadratik og'ishlarning har bir yig'indisini uning erkinlik darajalari soniga bo'lib, biz o'rtacha kvadratik og'ishlarni (bir erkinlik darajasi uchun dispersiya) olamiz. Keyinchalik, omil dispersiyasini bir erkinlik darajasiga qoldiq dispersiyani bir erkinlik darajasiga bo'linib, biz nol gipotezani, F nisbati yoki bir xil nomdagi mezonni sinab ko'rish mezonini olamiz. Ya'ni, agar nol gipoteza to'g'ri bo'lsa, omil va qoldiq dispersiya oddiygina bir-biriga teng.

Nol gipotezani rad qilish uchun, ya'ni. O'rganilayotgan munosabatlarning ahamiyati (mavjudligi) faktini ifodalovchi qarama-qarshi gipotezani qabul qilish, shunchaki mavjud bo'lmagan munosabatlarni taqlid qiluvchi omillarning tasodifiy tasodifini emas, balki kritik qiymatlar jadvallaridan foydalanish kerak. belgilangan munosabat. Jadvallardan foydalanib, Fisher mezonining kritik (eshik) qiymati aniqlanadi. U nazariy deb ham ataladi. Keyin ular kuzatuv ma'lumotlari bo'yicha hisoblangan mezonning tegishli empirik (haqiqiy) qiymati bilan taqqoslab, nisbatning haqiqiy qiymati jadvallardagi kritik qiymatdan oshib ketishini tekshiradilar.

Bu shunday batafsilroq amalga oshiriladi. Nol gipoteza mavjudligi ehtimolining ma'lum darajasini tanlang va jadvallardan F-mezonining kritik qiymatini toping, bunda 1 erkinlik darajasi bo'yicha dispersiyalarning tasodifiy divergentsiyasi hali ham sodir bo'lishi mumkin, ya'ni. maksimal bunday qiymat. Keyin F-nisbatining hisoblangan qiymati ishonchli hisoblanadi (ya'ni, haqiqiy va qoldiq dispersiya o'rtasidagi farqni ifodalash), agar bu nisbat jadvaldagidan katta bo'lsa. Keyin nol gipoteza rad etiladi (bog'lanish belgilari yo'qligi to'g'ri emas) va aksincha, biz bog'lanish mavjud va muhim degan xulosaga kelamiz (u tasodifiy emas, muhim).

Agar munosabatlarning qiymati jadvaldagidan kichik bo'lsa, unda nol gipoteza ehtimoli belgilangan darajadan (dastlab tanlangan) yuqori bo'lib chiqadi va nol gipotezani sezilarli xavfsiz rad etib bo'lmaydi. munosabatlarning mavjudligi haqida noto'g'ri xulosa olish. Shunga ko'ra, regressiya tenglamasi ahamiyatsiz hisoblanadi.

F-mezonining o'zi qiymati determinatsiya koeffitsienti bilan bog'liq. Bir butun sifatida regressiya tenglamasining ahamiyatini baholashdan tashqari, regressiya tenglamasining alohida parametrlarining ahamiyati ham baholanadi. Bunday holda, regressiya koeffitsientining standart xatosi empirik haqiqiy standart og'ish va erkinlik darajasiga empirik dispersiya yordamida aniqlanadi. Keyin Talaba taqsimoti uning ishonch oraliqlarini hisoblash uchun regressiya koeffitsientining ahamiyatini tekshirish uchun ishlatiladi.

Regressiya va korrelyatsiya koeffitsientlarining ahamiyatini Student t-testi yordamida baholash ushbu miqdorlarning qiymatlarini va standart xatoni solishtirish orqali amalga oshiriladi. Chiziqli regressiya parametrlari va korrelyatsiya koeffitsienti xatosining kattaligi quyidagi formulalar bilan aniqlanadi:

bu erda S - o'rtacha kvadrat qoldiq namuna og'ishi,

r xy – korrelyatsiya koeffitsienti.

Shunga ko'ra, regressiya chizig'i tomonidan bashorat qilingan standart xatoning qiymati quyidagi formula bilan beriladi:

Regressiya va korrelyatsiya koeffitsientlari qiymatlarining ularning standart xatosiga mos keladigan nisbati t-statistika deb ataladi va tegishli jadval (kritik) qiymat va uning haqiqiy qiymatini taqqoslash nolni qabul qilish yoki rad etishga imkon beradi. gipoteza. Ammo keyin, ishonch oralig'ini hisoblash uchun, har bir ko'rsatkich bo'yicha maksimal xato t statistikasining jadvallangan qiymatining mos keladigan ko'rsatkichning o'rtacha tasodifiy xatosiga ko'paytmasi sifatida topiladi. Aslida, biz buni yuqorida biroz boshqacha yozdik. Keyin ishonch oraliqlarining chegaralari olinadi: pastki chegara tegishli koeffitsientlardan (aslida o'rtacha) mos keladigan marjinal xatoni ayirish yo'li bilan, yuqori chegara esa qo'shish (qo'shish).

Chiziqli regressiyada ∑(y x -y avg) 2 =b 2 ∑(x-x avg) 2. Buni chiziqli korrelyatsiya koeffitsienti formulasiga murojaat qilish orqali tekshirish oson: r 2 xy = b 2 *s 2 x /s 2 y

bu yerda s 2 y - y belgining umumiy dispersiyasi;

s 2 x - x faktor tufayli y xarakteristikaning dispersiyasi. Shunga ko'ra, chiziqli regressiya tufayli kvadrat og'ishlar yig'indisi bo'ladi:

∑(y x -y o'rtacha) 2 =b 2 ∑(x-x o'rtacha) 2 .

X va y dagi kuzatuvlarning ma'lum hajmi uchun chiziqli regressiyada kvadratlarning omillari yig'indisi regressiya koeffitsienti b ning faqat bitta doimiysiga bog'liq bo'lganligi sababli, bu kvadratlar yig'indisi bir erkinlik darajasiga ega. Keling, y atributining hisoblangan qiymatining mazmun tomonini ko'rib chiqaylik. y x. y x qiymati chiziqli regressiya tenglamasi bilan aniqlanadi: y x ​​= a + bx.

a parametri a=y-bx sifatida belgilanishi mumkin. a parametrining ifodasini chiziqli modelga almashtirib, biz quyidagilarga erishamiz: y x ​​=y-bx+bx avg =y-b(x-x avg).

Berilgan y va x o'zgaruvchilar to'plami uchun y x ning hisoblangan qiymati chiziqli regressiyada faqat bitta parametr - regressiya koeffitsientining funktsiyasidir. Shunga ko'ra, kvadrat og'ishlarning omil yig'indisi 1 ga teng bo'lgan erkinlik darajalariga ega.

Kvadratlarning umumiy, omil va qoldiq yig'indilarining erkinlik darajalari soni o'rtasida tenglik mavjud. Chiziqli regressiyada kvadratlarning qoldiq yig'indisining erkinlik darajalari soni (n-2) ga teng. Kvadratchalarning umumiy yig'indisi uchun erkinlik darajalari soni birlar soni bilan belgilanadi va biz namunaviy ma'lumotlardan hisoblangan o'rtacha qiymatdan foydalanganimiz uchun biz bir erkinlik darajasini yo'qotamiz, ya'ni. (n-1). Shunday qilib, bizda ikkita tenglik bor: yig'indilar va erkinlik darajalari soni uchun. Va bu, o'z navbatida, bizni erkinlik darajasi bo'yicha taqqoslanadigan farqlarga qaytaradi, ularning nisbati Fisher mezonini beradi.

25. Regressiya tenglamasining individual parametrlari va koeffitsientlarining ahamiyatini Student testi yordamida baholash.

27. Chiziqli va chiziqli bo'lmagan regressiya va ularni o'rganish usullari.

Chiziqli regressiya va uni tadqiq qilish va baholash usullari, agar bu juda muhim, ammo eng oddiy holatga qo'shimcha ravishda, biz ularning yordami bilan yanada murakkab chiziqli bo'lmagan bog'liqliklarni tahlil qilish vositasini olmagan bo'lsak, unchalik muhim bo'lmaydi. Chiziqli bo'lmagan regressiyalarni ikki xil sinfga bo'lish mumkin. Birinchi va sodda - bu nochiziqli bog'liqliklar sinfi bo'lib, unda tushuntirish o'zgaruvchilarga nisbatan nochiziqlilik mavjud, ammo ular tarkibiga kiritilgan va baholanishi kerak bo'lgan parametrlarda chiziqli bo'lib qoladi. Bunga polinomlar kiradi turli darajalar va teng yonli giperbola.

O'zgaruvchilarni oddiygina o'zgartirish (almashtirish) orqali tushuntirishga kiritilgan o'zgaruvchilar uchun bunday chiziqli bo'lmagan regressiyani osongina yangi o'zgaruvchilar uchun oddiy chiziqli regressiyaga kamaytirish mumkin. Shuning uchun, bu holda parametrlarni baholash oddiygina eng kichik kvadratlar usuli bilan amalga oshiriladi, chunki bog'liqliklar parametrlarda chiziqli bo'ladi. Shunday qilib, teng tomonli giperbola bilan tavsiflangan chiziqli bo'lmagan bog'liqlik iqtisodiyotda muhim rol o'ynaydi:

Uning parametrlari eng kichik kvadratlar usuli yordamida yaxshi baholanadi va bu bog'liqlikning o'zi xom ashyo, yoqilg'i, materiallarning o'ziga xos xarajatlari ishlab chiqarish hajmi, tovarlarning aylanish vaqti va bu barcha omillarning savdo hajmi bilan bog'liqligini tavsiflaydi. aylanmasi. Masalan, Fillips egri chizig'i ishsizlik darajasi va ish haqining o'sish foizi o'rtasidagi nochiziqli munosabatni tavsiflaydi.

Baholanayotgan parametrlarda chiziqli bo'lmagan, masalan, darajaning o'zi (uning ko'rsatkichi) parametr bo'lgan yoki parametrga bog'liq bo'lgan quvvat funktsiyasi bilan ifodalangan regressiya bilan vaziyat butunlay boshqacha. Bu, shuningdek, darajaning asosi parametr bo'lgan eksponensial funktsiya va ko'rsatkichli funktsiya bo'lishi mumkin, bunda yana ko'rsatkich parametr yoki parametrlar birikmasini o'z ichiga oladi. Bu sinf, o'z navbatida, ikkita kichik sinfga bo'linadi: biriga tashqi chiziqli bo'lmagan, lekin mohiyatan ichki chiziqli kiradi. Bunday holda siz transformatsiyalar yordamida modelni chiziqli shaklga keltirishingiz mumkin. Biroq, agar model ichki chiziqli bo'lmagan bo'lsa, uni chiziqli funktsiyaga qisqartirish mumkin emas.

Shunday qilib, faqat regressiya tahlilida o'ziga xos chiziqli bo'lmagan modellar haqiqatdan ham chiziqli bo'lmagan hisoblanadi. Transformatsiyalar orqali chiziqli holatga keltirilishi mumkin bo'lgan boshqa barcha narsalar bunday deb hisoblanmaydi va ular ekonometrik tadqiqotlarda eng ko'p ko'rib chiqiladi. Shu bilan birga, bu ekonometrikada mohiyatan chiziqli bo'lmagan bog'liqliklarni o'rganish mumkin emas degani emas. Agar model o'z parametrlarida ichki chiziqli bo'lmasa, u holda parametrlarni baholash uchun iterativ protseduralar qo'llaniladi, ularning muvaffaqiyati ishlatiladigan iterativ usulning xususiyatlari uchun tenglama turiga bog'liq.

Keling, chiziqli bo'lgan bog'liqliklarga qaytaylik. Agar ular parametrlarda ham, o'zgaruvchilarda ham chiziqli bo'lmasa, masalan, y = a ko'rinishidagi X kuchiga ko'paytiriladi, uning ko'rsatkichi parametr -  (beta):

Shubhasiz, bunday munosabatni oddiy logarifm yordamida osongina chiziqli tenglamaga aylantirish mumkin.

Logarifmlarni bildiruvchi yangi o'zgaruvchilar kiritilgach, chiziqli tenglama olinadi. Keyin regressiyani baholash protsedurasi dastlabki qiymatlarning logarifmlarini olish orqali har bir kuzatish uchun yangi o'zgaruvchilarni hisoblashdan iborat. Keyin yangi o'zgaruvchilarning regressiyaga bog'liqligi baholanadi. Asl o'zgaruvchilarga o'tish uchun siz antilogarifmni olishingiz kerak, ya'ni ularning ko'rsatkichlari o'rniga kuchlarning o'ziga qaytishingiz kerak (oxir-oqibat, logarifm ko'rsatkichdir). Ko'rsatkichli yoki ko'rsatkichli funktsiyalar holatini xuddi shunday ko'rib chiqish mumkin.

Aniq chiziqli bo'lmagan regressiya uchun odatiy regressiyani baholash protsedurasini qo'llash mumkin emas, chunki tegishli munosabatni chiziqliga aylantirib bo'lmaydi. Harakatlarning umumiy sxemasi quyidagicha:

1. Ba'zi ishonchli boshlang'ich parametr qiymatlari qabul qilinadi;

2. Bashorat qilingan Y qiymatlari ushbu parametr qiymatlari yordamida haqiqiy X qiymatlaridan hisoblanadi;

3. Namunadagi barcha kuzatishlar uchun qoldiqlar, keyin esa qoldiqlar kvadratlari yig‘indisi hisoblanadi;

4. Bir yoki bir nechta parametr baholariga kichik o'zgarishlar kiritiladi;

5. Y ning yangi prognoz qilingan qiymatlari, qoldiqlar va qoldiq kvadratlari yig'indisi hisoblanadi;

6. Agar qoldiqlarning kvadratlari yig'indisi oldingidan kamroq bo'lsa, unda yangi parametr baholari avvalgilaridan yaxshiroq va yangi boshlang'ich nuqta sifatida ishlatilishi kerak;

7. Kvadratchalar qoldiqlari yig‘indisining o‘zgarishiga olib keladigan parametr baholariga bunday o‘zgartirishlar kiritish imkoni bo‘lmaguncha 4, 5 va 6-bosqichlar yana takrorlanadi;

8. Kvadrat qoldiqlar yig'indisi minimallashtiriladi va yakuniy parametr baholari eng kichik kvadratlar baholari hisoblanadi, degan xulosaga keldi.

ga qisqartirilishi mumkin bo'lgan chiziqli bo'lmagan funktsiyalar orasida chiziqli shakl, quvvat funksiyasi ekonometrikada keng qo'llaniladi. Undagi b parametr egiluvchanlik koeffitsienti bo'lgan aniq talqinga ega. Hisoblangan parametrlarda chiziqli bo'lmagan, lekin chiziqli shaklga keltirilishi mumkin bo'lgan modellarda aylantirilgan tenglamalarga eng kichik kvadratlar usuli qo'llaniladi. Logarifmlardan va shunga mos ravishda ko'rsatkichlardan amaliy foydalanish, natijada olingan belgi manfiy qiymatlarga ega bo'lmaganda mumkin. Natija atributining logarifmasi yordamida funktsiyalar o'rtasidagi munosabatlarni o'rganishda ekonometrikada kuch qonuniga bog'liqlik ustunlik qiladi (talab va taklif egri chiziqlari, ishlab chiqarish funktsiyalari, mahsulotlarning mehnat zichligi, ishlab chiqarish ko'lami, bog'liqlik o'rtasidagi bog'liqlikni tavsiflovchi yutilish egri chiziqlari). bandlik darajasi bo'yicha YaMM ning Engel egri chiziqlari).

28. Teskari model va undan foydalanish

Ba'zan ichki chiziqli bo'lmagan teskari modeldan foydalaniladi, lekin unda teng tomonli giperboladan farqli o'laroq, tushuntirish o'zgaruvchisi emas, balki Y atributi transformatsiyaga duchor bo'ladi. Shuning uchun teskari model ichki chiziqli bo'lmagan va OLS talabi hosil bo'lgan Y atributining haqiqiy qiymatlari va ularning teskari qiymatlari uchun qoniqtirilmaydi. Nochiziqli regressiya uchun korrelyatsiyani o'rganish alohida e'tiborga loyiqdir. Umumiy holda, ikkinchi darajali parabola, yuqori tartibli ko'phadlar kabi, chiziqlilashtirilganda, ko'p regressiya tenglamasi shaklini oladi. Agar chiziqlilashtirilganda, tushuntirilgan o'zgaruvchiga nisbatan chiziqli bo'lmagan regressiya tenglamasi chiziqli juftlashgan regressiya tenglamasi shaklini oladigan bo'lsa, u holda munosabatlarning yaqinligini baholash uchun chiziqli korrelyatsiya koeffitsientidan foydalanish mumkin.

Agar regressiya tenglamasining chiziqli ko'rinishga o'zgarishi bog'liq bo'lgan o'zgaruvchiga (natijaviy xarakteristikaga) bog'liq bo'lsa, u holda xarakteristikaning o'zgartirilgan qiymatlariga asoslangan chiziqli korrelyatsiya koeffitsienti faqat bog'liqlikning taxminiy bahosini beradi va son bilan mos kelmaydi. korrelyatsiya indeksi. Shuni yodda tutish kerakki, korrelyatsiya indeksini hisoblashda ularning logarifmlari emas, balki hosil bo'lgan Y xarakteristikasining kvadratik og'ishlarining yig'indilari qo'llaniladi. Korrelyatsiya indeksining ahamiyatini baholash korrelyatsiya koeffitsientining ishonchliligini (ahamiyatini) baholash bilan bir xil tarzda amalga oshiriladi. Korrelyatsiya indeksining o'zi, aniqlash indeksi kabi, Fisher F testi yordamida chiziqli bo'lmagan regressiya tenglamasining umumiy ahamiyatini tekshirish uchun ishlatiladi.

E'tibor bering, nochiziqli modellarni chiziqli ko'rinishga keltirish va chiziqli bo'lmagan regressiyani qo'llash orqali qurish imkoniyati, bir tomondan, regressiya tahlilining universalligini oshiradi. Boshqa tomondan, bu tadqiqotchining vazifalarini sezilarli darajada murakkablashtiradi. Agar biz juftlashgan regressiya tahlili bilan cheklansak, Y va X kuzatuvlarini tarqalish grafigi sifatida chizishimiz mumkin. Ko'pincha bir nechta turli xil chiziqli bo'lmagan funktsiyalar, agar ular biron bir egri chiziqda joylashgan bo'lsa, kuzatishlarni taxmin qiladi. Ammo ko'p regressiya tahlilida bunday grafik tuzib bo'lmaydi.

Bog'liq o'zgaruvchining bir xil ta'rifiga ega bo'lgan muqobil modellarni ko'rib chiqishda tanlash tartibi nisbatan sodda. Tasavvur qilish mumkin bo'lgan barcha mumkin bo'lgan funktsiyalar asosida regressiyani taxmin qilish va qaram o'zgaruvchining o'zgarishini eng yaxshi tushuntiruvchi funktsiyani tanlash mumkin. Chiziqli funktsiya y dagi dispersiyaning taxminan 64% ni, giperbolik funksiya esa 99,9% ni tushuntirsa, ikkinchisini tanlash kerakligi aniq. Lekin qachon turli modellar turli funktsional shakllardan foydalaning, modelni tanlash muammosi sezilarli darajada murakkablashadi.

29. Box-Cox testidan foydalanish.

Umuman olganda, qaram o'zgaruvchining bir xil ta'rifiga ega bo'lgan muqobil modellarni ko'rib chiqishda tanlov oddiy. Bog'liq o'zgaruvchining o'zgarishini eng ko'p tushuntiradigan funktsiyaga e'tibor qaratib, barcha mumkin bo'lgan funktsiyalar asosida regressiyani baholash eng oqilona. Agar determinatsiya koeffitsienti bir holatda regressiya bilan izohlangan dispersiya ulushini o'lchasa, ikkinchisida esa bu bog'liq o'zgaruvchining logarifmasidagi dispersiya nisbati regressiya bilan izohlansa, u holda tanlov qiyinchiliksiz amalga oshiriladi. Ikki model uchun bu qiymatlar juda yaqin bo'lganda va tanlov muammosi sezilarli darajada murakkablashganda, bu boshqa masala.

Keyinchalik Box-Cox testi ko'rinishidagi standart protsedura qo'llanilishi kerak. Agar siz modellarni faqat qaram o'zgaruvchining varianti ko'rinishida samarali omil va uning logarifmi yordamida taqqoslashingiz kerak bo'lsa, u holda Zarembka testining versiyasi qo'llaniladi. U kuzatuv shkalasi Y transformatsiyasini taklif qiladi, bu chiziqli va logarifmik modellarda o'rtacha kvadrat xato (MSE) ni to'g'ridan-to'g'ri taqqoslash imkonini beradi. Tegishli protsedura quyidagi bosqichlarni o'z ichiga oladi:

    Namunadagi Y qiymatlarining geometrik o'rtacha qiymati hisoblanadi, bu Y logarifmining o'rtacha arifmetik ko'rsatkichi bilan mos keladi;

    Y kuzatuvlari birinchi bosqichda olingan qiymatga bo'linadigan tarzda qayta hisoblab chiqiladi;

    Regressiya chiziqli model uchun asl Y qiymatlari o'rniga o'lchovli Y qiymatlari va logarifmik model uchun Y qiymatlarining logarifmidan foydalangan holda ikki regressiya uchun RMSE qiymatlari taqqoslanishi mumkin va shuning uchun kvadrat og'ishlarning kichik yig'indisiga ega model kuzatilgan qiymatlarning haqiqiy munosabatlariga yaxshiroq mos keladi;

    Modellardan biri sezilarli darajada yaxshi mos kelmasligini tekshirish uchun qayta hisoblangan regressiyalardagi RMSE qiymatlari nisbati logarifmiga ko'paytirilgan kuzatuvlar sonining yarmiga ko'paytmasidan foydalanish mumkin. mutlaq qiymat bu qiymat.

30. Omillarning o'zaro bog'liqligi va multikollinearligi tushunchalari.

34. MNC asoslari va uni qo'llash asosliligi.

Keling, OLS asoslariga, uni qo'llashning haqiqiyligiga (shu jumladan, bir nechta regressiya muammolari) va OLS yordamida olingan baholarning eng muhim xususiyatlariga to'xtalib o'tamiz. Keling, o'ng tomonda analitik qaramlik bilan birga, haqiqatdan boshlaylik regressiya tenglamasi Tasodifiy atama ham muhim rol o'ynaydi. Bu tasodifiy komponent kuzatilmaydigan miqdordir. Sami statistik testlar regressiya parametrlari va korrelyatsiya o'lchovlari ko'p regressiyaning ushbu tasodifiy komponentining taqsimlanishi haqidagi tekshirib bo'lmaydigan taxminlarga asoslanadi. Bu taxminlar faqat dastlabki hisoblanadi. Faqat regressiya tenglamasini tuzgandan keyingina tasodifiy qoldiqlarning baholari (tasodifiy komponentning empirik analoglari) apriori qabul qilingan xususiyatlarga ega ekanligi tekshiriladi. Aslida, model parametrlari taxmin qilinganda, tasodifiy komponentning o'zini shunday baholash uchun olingan atributning nazariy va haqiqiy qiymatlari o'rtasidagi farqlar hisoblanadi. Shuni yodda tutish kerakki, bu faqat berilgan tenglamaning noma'lum qoldig'ining namunaviy amalga oshirilishidir.

Oddiy tenglamalar tizimidan olingan regressiya koeffitsientlari bog'lanish kuchining namunaviy bahosidir. Ular xolis bo'lgandagina amaliy ahamiyatga ega bo'lishi aniq. Eslatib o'tamiz, bu holda qoldiqlarning o'rtacha qiymati nolga teng yoki bir xil bo'lgan bahoning o'rtacha qiymati taxmin qilingan parametrning o'ziga teng bo'ladi. Shunda qoldiqlar ko'p sonli tanlanma baholarda to'planmaydi va topilgan regressiya parametrining o'zini ko'p sonli xolis baholarning o'rtacha ko'rsatkichi deb hisoblash mumkin.

Bundan tashqari, hisob-kitoblar eng kichik farqga ega bo'lishi kerak, ya'ni. samarali bo'ladi va shundan so'ng amalda yaroqsiz nuqtalarni baholashdan intervalli baholashga o'tish mumkin bo'ladi. Nihoyat, ishonch intervallari parametrning haqiqiy (noma'lum) qiymatidan ma'lum masofada baho olish ehtimoli birga yaqin bo'lganda foydalidir. Bunday baholar izchil deb ataladi va izchillik xususiyati ularning aniqligining ortib borishi bilan tavsiflanadi.

Biroq, izchillik sharti avtomatik ravishda qondirilmaydi va sezilarli darajada quyidagi ikkita muhim talabning bajarilishiga bog'liq. Birinchidan, qoldiqlarning o'zlari eng aniq tasodifiylik bilan stokastik bo'lishi kerak, ya'ni. barcha aniq funktsional bog'liqliklar ko'p regressiyaning analitik komponentiga maxsus kiritilishi kerak va bundan tashqari, qoldiqlarning qiymatlari turli namunalar uchun bir-biridan mustaqil ravishda taqsimlanishi kerak (qoldiqlarning avtokorrelyatsiyasi yo'q). Ikkinchidan, kam bo'lmagan muhim talab - har bir og'ishning (qoldiqning) dispersiyasi X o'zgaruvchilarning barcha qiymatlari uchun bir xil bo'lishi (homosedastiklik). Bular. homosedastiklik barcha kuzatishlar uchun dispersiyaning doimiyligi bilan ifodalanadi:

Aksincha, heteroskedastiklik turli kuzatishlar uchun dispersiyaning bunday doimiyligining buzilishidir. Bunday holda, tanlovdagi turli kuzatishlar uchun tasodifiy atamaning turli nazariy taqsimotlari bilan yuqori deviant qiymatlarni olishning apriori (kuzatishlar oldidan) ehtimoli nisbatan yuqori bo'ladi.

Qoldiqlarning avtokorrelyatsiyasi yoki joriy va oldingi (keyingi) kuzatishlar qoldiqlari o'rtasidagi korrelyatsiyaning mavjudligi odatiy chiziqli korrelyatsiya koeffitsientining qiymati bilan belgilanadi. Agar u noldan sezilarli darajada farq qiladigan bo'lsa, unda qoldiqlar avtokorrelyatsiya qilinadi va shuning uchun ehtimollik zichligi funktsiyasi (qoldiqlarni taqsimlash) kuzatish nuqtasiga va boshqa kuzatish nuqtalarida qoldiq qiymatlarning taqsimlanishiga bog'liq. Mavjud statistik ma'lumotlardan foydalangan holda qoldiqlarning avtokorrelyatsiyasini aniqlash X omil bo'yicha kuzatishlar tartibi mavjud bo'lsa, qulaydir. Qoldiqlarning avtokorrelyatsiyasining yo'qligi regressiya koeffitsientlarini baholashning izchilligi va samaradorligini ta'minlaydi.

35. Gomoskedastiklik va geteroskedastizm, qoldiqlarning avtokorrelyatsiyasi, umumlashtirilgan eng kichik kvadratlar usuli (GLM).

X o'zgaruvchilarning barcha qiymatlari uchun qoldiqlarning dispersiyalarining bir xilligi yoki homosedastiklik OLS yordamida regressiya parametrlarining izchil baholarini olish uchun mutlaqo zarurdir. Gomoskedastiklik shartini qondirmaslik heteroskedastiklik deb ataladigan holatga olib keladi. Bu regressiya koeffitsientlarining noxolis baholanishiga olib kelishi mumkin. Geteroskedastlik, asosan, regressiya koeffitsientini baholash samaradorligining pasayishiga ta'sir qiladi. Bunday holda, regressiya koeffitsientining standart xatosi formulasidan foydalanish ayniqsa qiyin bo'ladi, undan foydalanish omilning har qanday qiymatlari uchun qoldiqlarning bir xil tarqalishini nazarda tutadi. Regressiya koeffitsientlarini baholashning xolisligiga kelsak, bu birinchi navbatda qoldiqlarning mustaqilligiga va omillarning o'z qiymatlariga bog'liq.

Gomoskedastlikni sinashning juda aniq, ammo qat'iy bo'lmagan va mahorat talab qiladigan usuli bu qoldiqlarning o'rtacha hisoblangan (nazariy) natijaviy atributga yoki tegishli korrelyatsiya maydonlariga bog'liqlik xususiyatini grafik tarzda o'rganishdir. Geteroskedastizmni o'rganish va baholashning analitik usullari yanada qat'iydir. Agar heteroskedastika sezilarli darajada mavjud bo'lsa, OLS o'rniga umumlashtirilgan OLS (GLM) dan foydalanish tavsiya etiladi.

OLSdan foydalanishdan kelib chiqadigan ko'p regressiya talablaridan tashqari, modelga kiritilgan o'zgaruvchilar bo'yicha shartlarga ham rioya qilish kerak. Bular, birinchi navbatda, kuzatuvlarning ma'lum hajmi uchun model omillar soniga oid talablarni o'z ichiga oladi (1 dan 7 gacha). Aks holda, regressiya parametrlari statistik jihatdan ahamiyatsiz bo'ladi. LSMni amalga oshirishda tegishli raqamli usullarni qo'llash samaradorligi nuqtai nazaridan, kuzatuvlar soni hisoblangan parametrlar sonidan oshib ketishi kerak (tenglamalar tizimida tenglamalar soni izlanganlar sonidan kattaroqdir) o'zgaruvchilar).

Ekonometrikaning eng muhim yutug'i noma'lum parametrlarni baholash usullarini sezilarli darajada rivojlantirish va ko'rib chiqilayotgan ta'sirlarning statik ahamiyatini aniqlash mezonlarini takomillashtirishdir. Shu munosabat bilan, u yoki bu darajada namoyon bo'lgan heteroskedastika tufayli an'anaviy OLSdan foydalanishning mumkin emasligi yoki maqsadga muvofiq emasligi umumlashtirilgan OLS (GLM) rivojlanishiga olib keldi. Aslida, bu regressiya koeffitsientlarini xolis, samarali va izchil baholashni ta'minlash uchun modelni sozlash, uning spetsifikatsiyasini o'zgartirish va dastlabki ma'lumotlarni o'zgartirishni o'z ichiga oladi.

Qoldiqlarning o'rtacha qiymati nolga teng deb taxmin qilinadi, ammo ularning dispersiyasi endi doimiy emas, balki K i qiymatlariga proportsionaldir, bu erda bu qiymatlar turli qiymatlar uchun har xil bo'lgan proportsionallik koeffitsientlaridir. omil x. Shunday qilib, dispersiyaning heterojenligini tavsiflovchi bu koeffitsientlar (K i qiymatlari). Tabiiyki, bu proportsionallik koeffitsientlari uchun umumiy omil bo'lgan dispersiya miqdorining o'zi noma'lum deb taxmin qilinadi.

Asl model, ushbu koeffitsientlarni ko'p regressiya tenglamasiga kiritgandan so'ng, heteroskedastik bo'lib qolishda davom etadi (aniqrog'i, bu modelning qoldiq qiymatlari). Bu qoldiqlar (qoldiqlar) avtokorrelyatsiya qilinmasin. i-kuzatish natijasida qayd etilgan boshlang'ich model o'zgaruvchilarni K i proportsionallik koeffitsientlarining kvadrat ildiziga bo'lish natijasida olingan yangi o'zgaruvchilarni kiritamiz. Keyin biz o'zgartirilgan o'zgaruvchilarda yangi tenglamani olamiz, bunda qoldiqlar homosedastik bo'ladi. Yangi o'zgaruvchilarning o'zlari tortilgan eski (asl) o'zgaruvchilardir.

Shu sababli, gomoskedastik qoldiqlar bilan shu tarzda olingan yangi tenglamaning parametrlarini baholash vaznli eng kichik kvadratlar usuliga tushiriladi (mohiyatan, bu OLS usuli). Regressiya o'zgaruvchilari o'rniga foydalanilganda, ularning o'rtacha qiymatlardan chetga chiqishi, regressiya koeffitsientlari uchun ifodalar oddiy va standartlashtirilgan (bir xil) shaklni oladi, bu OLS va OLS uchun hisoblagichdagi 1/K tuzatish koeffitsienti bilan bir oz farq qiladi. regressiya koeffitsientini beruvchi kasrning maxraji.

Shuni yodda tutish kerakki, o'zgartirilgan (sozlangan) modelning parametrlari K i proportsionallik koeffitsientlari uchun asos sifatida qaysi kontseptsiyadan foydalanilganiga sezilarli darajada bog'liq. Ko'pincha qoldiqlar faktor qiymatlari bilan proportsionaldir deb taxmin qilinadi. Xatolar tartibdagi oxirgi omil qiymatlariga mutanosib ekanligi haqidagi gipoteza qabul qilinganda model eng oddiy shaklni oladi. Keyin OLS standart OLS ning dastlabki manba o'zgaruvchilari bilan ishlashiga nisbatan regressiya parametrlarini aniqlashda o'zgartirilgan o'zgaruvchilarning kichikroq qiymatlari bilan kuzatuvlar og'irligini oshirishga imkon beradi. Ammo bu yangi o'zgaruvchilar allaqachon boshqa iqtisodiy tarkibga ega.

Qoldiqlarning omil hajmiga mutanosibligi haqidagi gipoteza haqiqiy asosga ega bo'lishi mumkin. Bir vaqtning o'zida katta va kichik korxonalarni o'z ichiga olgan ma'lum bir hil bo'lmagan ma'lumotlar to'plamini qayta ishlashga ruxsat bering. Keyin omilning katta hajmli qiymatlari hosil bo'lgan xarakteristikaning katta dispersiyasiga ham, qoldiq qiymatlarning katta dispersiyasiga ham mos kelishi mumkin. Bundan tashqari, OLS dan foydalanish va tegishli nisbiy qiymatlarga o'tish nafaqat omillar o'zgarishini kamaytiradi, balki xatolarning farqini ham kamaytiradi. Shunday qilib, regressiya modellarida heteroskedastiklikni hisobga olish va tuzatishning eng oddiy holati OLS yordamida amalga oshiriladi.

OLSni vaznli OLS shaklida amalga oshirishning yuqoridagi yondashuvi juda amaliy - u oddiygina amalga oshiriladi va shaffof iqtisodiy talqinga ega. Albatta, bu eng umumiy yondashuv emas va ekonometrikaning nazariy asosi bo'lib xizmat qiluvchi matematik statistika kontekstida bizga OLS ni o'z darajasida amalga oshiradigan ancha qat'iyroq usul taklif etiladi. umumiy ko'rinish. Unda siz xato vektorining (qoldiq ustun) kovariatsiya matritsasi haqida bilishingiz kerak. Va bu odatda amaliy vaziyatlarda adolatsizdir va bu matritsani shunday topish mumkin emas. Shuning uchun, umuman olganda, bunday bahoni matritsaning o'rniga mos keladigan formulalarda qo'llash uchun kerakli matritsani qandaydir tarzda baholash kerak. Shunday qilib, OMNCni amalga oshirishning tavsiflangan versiyasi ana shunday baholardan birini ifodalaydi. Ba'zan u umumiylashtirilgan eng kichik kvadratlar deb ataladi.

Shuni ham hisobga olish kerakki, aniqlash koeffitsienti OLS dan foydalanganda moslik sifatining qoniqarli o'lchovi bo'lib xizmat qila olmaydi. OLSdan foydalanishga qaytsak, shuningdek, Oq shakldagi standart og'ishlardan (standart xatolar) foydalanish usuli (heteroskedastiklik mavjudligida izchil standart xatolar deb ataladi) etarli umumiylikka ega ekanligini ta'kidlaymiz. Ushbu usul xato vektorining kovariatsiya matritsasi diagonal bo'lishi sharti bilan qo'llaniladi. Agar qoldiqlarning (xatolarning) avtokorrelyatsiyasi mavjud bo'lsa, kovariatsiya matritsasida va asosiy diagonaldan tashqarida nolga teng bo'lmagan elementlar (koeffitsientlar) mavjud bo'lganda, Neve West shaklida yanada umumiy standart xato usuli qo'llanilishi kerak. Muhim cheklov mavjud: nolga teng bo'lmagan elementlar, asosiy diagonaldan tashqari, faqat qo'shni diagonallarda joylashgan bo'lib, ular asosiy diagonaldan ma'lum miqdordan ko'p bo'lmagan masofada joylashgan.

Yuqoridagilardan ko'rinib turibdiki, ma'lumotlarni heteroskedastiklik uchun tekshirish imkoniyatiga ega bo'lish kerak. Quyidagi testlar shu maqsadga xizmat qiladi. Ular qoldiqlar dispersiyalarining tengligi haqidagi asosiy gipotezani muqobil gipotezaga (bu gipotezalarning tengsizligi haqida) qarshi tekshiradilar. Bundan tashqari, heteroskedastlik tabiatida aprior strukturaviy cheklovlar mavjud. Goldfeld-Quandt testi odatda xato dispersiyasi (qoldiq) ba'zi mustaqil o'zgaruvchining qiymatiga bevosita bog'liq degan taxmindan foydalanadi. Ushbu testdan foydalanish sxemasi quyidagicha. Birinchidan, ma'lumotlar mustaqil o'zgaruvchining kamayish tartibida tartibga solinadi, ular uchun heteroskedastlik gumon qilinadi. Ushbu tartiblangan ma'lumotlar to'plami o'rtacha bir nechta kuzatuvlarni yo'q qiladi, bu erda "oz" so'zi taxminan chorakni (25%) anglatadi. umumiy soni barcha kuzatuvlar. Keyinchalik, qolgan (barqaror qilingandan keyin) o'rtacha kuzatuvlarning birinchisi va qolgan o'rtacha kuzatuvlarning oxirgi ikkitasi bo'yicha ikkita mustaqil regressiya amalga oshiriladi. Shundan so'ng, ikkita mos keladigan qoldiq quriladi. Nihoyat, Fisher F statistikasi tuziladi va agar o'rganilayotgan gipoteza to'g'ri bo'lsa, F haqiqatan ham tegishli erkinlik darajasiga ega Fisher taqsimotidir. Keyin bu statistikaning katta qiymati tekshirilayotgan gipotezani rad etish kerakligini anglatadi. Yo'q qilish bosqichi bo'lmasa, ushbu testning kuchi kamayadi.

Breusch-Pagan testi apriori farqlar ba'zi qo'shimcha o'zgaruvchilarga bog'liq deb taxmin qilingan hollarda qo'llaniladi. Birinchidan, oddiy (standart) regressiya bajariladi va qoldiqlar vektori olinadi. Keyin dispersiyaning taxmini tuziladi. Keyinchalik, qoldiqlarning kvadrat vektorining empirik dispersiyaga bo'lingan regressiyasi (variantni baholash) amalga oshiriladi. Buning uchun (regressiya) o'zgaruvchanlikning tushuntirilgan qismi topiladi. Va buning uchun o'zgaruvchanlikning tushuntirilgan qismi, yarmiga bo'lingan holda, statistika tuziladi. Agar nol gipoteza to'g'ri bo'lsa (heteroskedastiklik to'g'ri emas), u holda bu qiymat taqsimotga ega he-kvadrat. Agar, aksincha, test geteroskedastiklikni aniqlasa, u holda qoldiqlar vektorining komponentlarini kuzatilgan mustaqil o'zgaruvchilar vektorining mos keladigan komponentlariga bo'lish yo'li bilan asl model o'zgartiriladi.

36. Oq shakldagi standart og'ish usuli.

Quyidagi xulosalar chiqarish mumkin. Geteroskedastizm mavjud bo'lganda OLS dan foydalanish og'irlikdagi kvadratik og'ishlar yig'indisini minimallashtirishga to'g'ri keladi. Mavjud OLS dan foydalanish hisoblangan parametrlar sonidan oshib ketadigan ko'p sonli kuzatuvlarga ega bo'lish zarurati bilan bog'liq. OLS dan foydalanish uchun eng qulay holat xato (qoldiqlar) mustaqil o‘zgaruvchilardan biriga proportsional bo‘lgan va natijada olingan baholar izchil bo‘lgan holdir. Agar, shunga qaramay, heteroskedastisiteli modelda OLS emas, balki standart OLS dan foydalanish kerak bo'lsa, unda izchil baholarni olish uchun White yoki Nevier-West ko'rinishidagi xatolarni baholashdan foydalanish mumkin.

Vaqt seriyalarini tahlil qilishda ko'pincha vaqtning turli nuqtalarida kuzatuvlarning statistik bog'liqligini hisobga olish kerak. Bunday holda, o'zaro bog'liq bo'lmagan xatolarning taxmini qondirilmaydi. Keling, ko'rib chiqaylik oddiy model, bunda xatolar birinchi tartibli avtoregressiv jarayonni tashkil qiladi. Bunday holda, xatolar oddiy takrorlanish munosabatini qanoatlantiradi, uning o'ng tomonida atamalardan biri nolga teng o'rtacha va doimiy dispersiyaga ega bo'lgan mustaqil normal taqsimlangan tasodifiy o'zgaruvchilar ketma-ketligidir. Ikkinchi muddat parametr (avtoregressiya koeffitsienti) va oldingi vaqtdagi qoldiq qiymatlarining mahsulotidir. Xato qiymatlari (qoldiqlar) ketma-ketligining o'zi statsionar tasodifiy jarayonni hosil qiladi. Statsionar tasodifiy jarayon vaqt o'tishi bilan o'ziga xos xususiyatlarning doimiyligi, xususan, o'rtacha va dispersiya bilan tavsiflanadi. Bunday holda, bizni qiziqtirgan kovariatsiya matritsasi (uning shartlari) parametr vakolatlari yordamida osongina yozilishi mumkin.

Ma'lum parametr uchun avtoregressiv modelni baholash OLS yordamida amalga oshiriladi. Bunday holda, xatolari standart regressiya modeli shartlarini qondiradigan modelga oddiy o'zgartirish orqali dastlabki modelni oddiygina qisqartirish kifoya. Bu juda kam uchraydi, lekin hali ham avtoregressiya parametri ma'lum bo'lgan vaziyat mavjud. Shuning uchun, odatda, noma'lum avtoregressiv parametr bilan baholashni amalga oshirish kerak. Bunday baholash uchun uchta eng ko'p ishlatiladigan protseduralar mavjud. Cochrane-Orcutt usuli, Hildret-Lu protsedurasi va Durbin usuli.

Umuman olganda, quyidagi xulosalar to'g'ri. Vaqt seriyasini tahlil qilish an'anaviy OLSni tuzatishni talab qiladi, chunki bu holatda xatolar odatda o'zaro bog'liqdir. Ko'pincha bu xatolar birinchi darajali statsionar avtoregressiv jarayonni tashkil qiladi. Birinchi darajali avtoregressiya uchun OLS baholovchilari xolis, izchil, ammo samarasiz. Ma'lum bo'lgan avtoregressiya koeffitsienti bilan OLS dastlabki tizimning oddiy o'zgarishlariga (tuzatishlariga) va keyin standart OLSni qo'llashga kamayadi. Agar ko'pincha avtoregressiv koeffitsient noma'lum bo'lsa, OLS uchun bir nechta protseduralar mavjud bo'lib, ular noma'lum parametrni (koeffitsientni) baholashdan iborat bo'lib, shundan so'ng ma'lum bo'lgan oldingi holatda bo'lgani kabi bir xil o'zgarishlar qo'llaniladi. parametr.

37. Breusch-Pagan testi tushunchasi, Goldfeldt-Quandt testi

Ayrim regressiya koeffitsientlarining nolga tengligi haqidagi H 0 gipotezasini (agar muqobil H 1 ga teng bo'lmasa) ahamiyatlilik darajasi b = 0,05 da tekshirib ko'raylik.

Agar asosiy gipoteza noto'g'ri bo'lib chiqsa, biz muqobilni qabul qilamiz. Bu gipotezani tekshirish uchun Student t-testidan foydalaniladi.

Kuzatish ma'lumotlaridan topilgan t-kriteriyasi qiymati (shuningdek, kuzatilgan yoki haqiqiy deb ataladi) Talabalar taqsimlash jadvallaridan (odatda statistika yoki ekonometriya bo'yicha darsliklar va seminarlarning oxirida berilgan) aniqlangan jadvallangan (kritik) qiymat bilan taqqoslanadi.

Jadval qiymati muhimlik darajasiga (b) va chiziqli juftlik regressiyasida (n-2) teng bo'lgan erkinlik darajalari soniga qarab aniqlanadi, n - kuzatishlar soni.

Agar t-testning haqiqiy qiymati jadvaldagi qiymatdan (modul) katta bo'lsa, u holda asosiy gipoteza rad etiladi va (1-b) ehtimollik bilan populyatsiyadagi parametr yoki statistik xarakteristika noldan sezilarli darajada farq qiladi deb hisoblanadi. .

Agar t-testning haqiqiy qiymati jadval qiymatidan (modul) kamroq bo'lsa, unda asosiy gipotezani rad qilish uchun hech qanday sabab yo'q, ya'ni. populyatsiyadagi parametr yoki statistik xarakteristika muhimlik darajasida noldan sezilarli farq qilmaydi.

t krit (n-m-1;b/2) = (30;0,025) = 2,042

1.7 dan boshlab< 2.042, то статистическая значимость коэффициента регрессии b не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в Ushbu holatda b koeffitsientini e'tiborsiz qoldirish mumkin.

0,56 dan beri< 2.042, то статистическая значимость коэффициента регрессии a не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом a можно пренебречь.

Regressiya tenglamasi koeffitsientlari uchun ishonch oralig'i.

95% ishonchliligi bilan quyidagi regressiya koeffitsientlarining ishonch oraliqlarini aniqlaymiz:

  • (b - t krit S b ; b + t krit S b)
  • (0.64 - 2.042 * 0.38; 0.64 + 2.042 * 0.38)
  • (-0.13;1.41)

0 nuqta (nol) ishonch oralig'ida joylashganligi sababli, b koeffitsientining intervalli bahosi statistik jihatdan ahamiyatsiz.

  • (a - t krit S a ; a + t krit S a)
  • (24.56 - 2.042 * 44.25; 24.56 + 2.042 * 44.25)
  • (-65.79;114.91)

95% ehtimollik bilan bu parametrning qiymati topilgan intervalda yotadi, deb aytish mumkin.

0 nuqta (nol) ishonch oralig'ida joylashganligi sababli, a koeffitsientining intervalli bahosi statistik jihatdan ahamiyatsiz.

2) F-statistika. Fisher mezoni.

Determinatsiya koeffitsienti R2 butun chiziqli regressiya tenglamasining ahamiyatini tekshirish uchun ishlatiladi.

Regressiya modelining ahamiyatini tekshirish Fisherning F testi yordamida amalga oshiriladi, uning hisoblangan qiymati o'rganilayotgan indikatorning dastlabki kuzatuvlar seriyasining dispersiyasi va qoldiq ketma-ketligi dispersiyasining xolis bahosi nisbati sifatida topiladi. ushbu model uchun.

Agar k 1 =(m) va k 2 =(n-m-1) erkinlik darajalari bilan hisoblangan qiymat berilgan ahamiyatlilik darajasida jadvalli qiymatdan katta bo’lsa, model muhim hisoblanadi.

bu erda m - modeldagi omillar soni.

Juftlangan chiziqli regressiyaning statistik ahamiyati quyidagi algoritm yordamida baholanadi:

  • 1. Tenglama umuman statistik jihatdan ahamiyatsiz ekanligi haqida nol gipoteza ilgari suriladi: H 0: R 2 = 0 ahamiyatlilik darajasi b.
  • 2. Keyin F-mezonining haqiqiy qiymatini aniqlang:

bu yerda juft regressiya uchun m=1.

3. Jadvaldagi qiymat Fisher taqsimoti jadvallaridan berilgan ahamiyatlilik darajasi bo‘yicha aniqlanadi, bunda kvadratlarning umumiy yig‘indisi (kattaroq dispersiya) uchun erkinlik darajalari soni 1 ga, qoldiq uchun esa erkinlik darajalari soni hisobga olinadi. chiziqli regressiyada kvadratlar yig'indisi (kichik dispersiya) n-2 ga teng.

F jadvali maksimal mumkin bo'lgan ma'no berilgan erkinlik darajasi va ahamiyatlilik darajasi bilan tasodifiy omillar ta'sirida mezon b. Muhimlik darajasi b - to'g'ri bo'lgan farazni rad etish ehtimoli. Odatda b 0,05 yoki 0,01 ga teng qabul qilinadi.

4. Agar F-testining haqiqiy qiymati jadval qiymatidan kam bo'lsa, unda ular nol gipotezani rad etish uchun hech qanday sabab yo'qligini aytishadi.

Aks holda, nol gipoteza rad etiladi va (1-b) ehtimollik bilan tenglamaning umumiy statistik ahamiyati haqidagi muqobil gipoteza qabul qilinadi.

Erkinlik darajalari k 1 =1 va k 2 =30 bo'lgan mezonning jadval qiymati, F jadvali = 4.17

F ning haqiqiy qiymatidan beri< F табл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

Fisher F-testi va Student t-statistikasi o'rtasidagi bog'liqlik tenglik bilan ifodalanadi:

Regressiya tenglamasining sifat ko'rsatkichlari.

Qoldiqlarning avtokorrelyatsiyasini tekshirish.

OLS yordamida sifatli regressiya modelini yaratishning muhim sharti bu tasodifiy og'ishlar qiymatlarining boshqa barcha kuzatishlardagi og'ishlar qiymatlaridan mustaqilligi. Bu har qanday og'ishlar va, xususan, qo'shni og'ishlar o'rtasida hech qanday bog'liqlik yo'qligini ta'minlaydi.

Avtokorrelyatsiya (ketma-ket korrelyatsiya) vaqt (vaqt qatori) yoki fazoda (oʻzaro qator) tartiblangan kuzatilgan koʻrsatkichlar oʻrtasidagi korrelyatsiya sifatida aniqlanadi. Vaqt seriyalari ma'lumotlaridan foydalanganda regressiya tahlilida qoldiqlarning avtokorrelyatsiyasi (diferanslar) keng tarqalgan va kesma ma'lumotlardan foydalanganda juda kam uchraydi.

Iqtisodiy muammolarda ijobiy avtokorrelyatsiya salbiy avtokorrelyatsiyaga qaraganda ancha keng tarqalgan. Ko'pgina hollarda, ijobiy avtokorrelyatsiya yo'nalish bilan bog'liq doimiy ta'sir qilish modelda hisobga olinmagan ba'zi omillar.

Salbiy avtokorrelyatsiya, asosan, ijobiy og'ishdan keyin salbiy va aksincha. Mavsumiy ma'lumotlarga (qish-yoz) ko'ra, alkogolsiz ichimliklarga bo'lgan talab va daromad o'rtasidagi bir xil bog'liqlik hisobga olinsa, bu holat yuzaga kelishi mumkin.

Avtokorrelyatsiyani keltirib chiqaradigan asosiy sabablar qatoriga quyidagilar kiradi:

  • 1. Spetsifikatsiyadagi xatolar. Modeldagi biron bir muhim tushuntirish o'zgaruvchisini hisobga olmaslik yoki bog'liqlik shaklini noto'g'ri tanlash odatda kuzatuv nuqtalarining regressiya chizig'idan tizimli og'ishlariga olib keladi, bu esa avtokorrelyatsiyaga olib kelishi mumkin.
  • 2. Inertsiya. Ko'pchilik iqtisodiy ko'rsatkichlar(inflyatsiya, ishsizlik, yalpi ichki mahsulot va boshqalar) tadbirkorlik faoliyatining to'lqinlanishi bilan bog'liq bo'lgan ma'lum bir tsiklik xususiyatga ega. Shuning uchun ko'rsatkichlarning o'zgarishi bir zumda sodir bo'lmaydi, lekin ma'lum bir inertsiyaga ega.
  • 3. O‘rgimchak to‘ri effekti. Ko'pgina ishlab chiqarish va boshqa sohalarda iqtisodiy ko'rsatkichlar iqtisodiy sharoitlarning o'zgarishiga kechikish (vaqtning kechikishi) bilan javob beradi.
  • 4. Ma'lumotlarni tekislash. Ko'pincha, ma'lum bir uzoq vaqt uchun ma'lumotlar uning tarkibiy oraliqlari bo'yicha ma'lumotlarni o'rtacha hisoblash yo'li bilan olinadi. Bu ko'rib chiqilayotgan davrda mavjud bo'lgan tebranishlarning ma'lum bir tekislanishiga olib kelishi mumkin, bu esa o'z navbatida avtokorrelyatsiyani keltirib chiqarishi mumkin.

Avtokorrelyatsiyaning oqibatlari heteroskedastiklik oqibatlariga o'xshaydi: regressiya koeffitsienti va aniqlanish koeffitsientining ahamiyatini aniqlaydigan t- va F-statistik ma'lumotlardan olingan xulosalar noto'g'ri bo'lishi mumkin.



Saytda yangi

>

Eng mashhur