Uy Gigiena Excelda o'rtacha taxminiy xatoni qanday topish mumkin. Fisherning F testi yordamida regressiyani modellashtirish natijalarining statistik ishonchliligini baholash

Excelda o'rtacha taxminiy xatoni qanday topish mumkin. Fisherning F testi yordamida regressiyani modellashtirish natijalarining statistik ishonchliligini baholash

Ayrim regressiya koeffitsientlarining nolga tengligi haqidagi H 0 gipotezasini (agar muqobil H 1 ga teng bo'lmasa) ahamiyatlilik darajasi b = 0,05 da tekshirib ko'raylik.

Agar asosiy gipoteza noto'g'ri bo'lib chiqsa, biz muqobilni qabul qilamiz. Bu gipotezani tekshirish uchun Student t-testidan foydalaniladi.

Kuzatish ma'lumotlaridan topilgan t-kriteriyasi qiymati (shuningdek, kuzatilgan yoki haqiqiy deb ataladi) Talabalar taqsimlash jadvallaridan (odatda statistika yoki ekonometriya bo'yicha darsliklar va seminarlarning oxirida berilgan) aniqlangan jadvallangan (kritik) qiymat bilan taqqoslanadi.

Jadval qiymati muhimlik darajasi (b) va erkinlik darajalari soniga qarab aniqlanadi, bu chiziqli juftlik regressiyasida (n-2) ga teng, n - kuzatishlar soni.

Agar t-testning haqiqiy qiymati jadval qiymatidan (modul) katta bo'lsa, u holda asosiy gipoteza rad etiladi va (1-b) ehtimollik bilan parametr yoki statistik xarakteristikada ko'rib chiqiladi. aholi noldan sezilarli farq qiladi.

Agar t-testning haqiqiy qiymati jadval qiymatidan (modul) kamroq bo'lsa, unda asosiy gipotezani rad qilish uchun hech qanday sabab yo'q, ya'ni. populyatsiyadagi parametr yoki statistik xarakteristika muhimlik darajasida noldan sezilarli farq qilmaydi.

t krit (n-m-1;b/2) = (30;0,025) = 2,042

1.7 dan boshlab< 2.042, то статистическая значимость коэффициента регрессии b не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в Ushbu holatda b koeffitsientini e'tiborsiz qoldirish mumkin.

0,56 dan beri< 2.042, то статистическая значимость коэффициента регрессии a не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом a можно пренебречь.

Regressiya tenglamasi koeffitsientlari uchun ishonch oralig'i.

95% ishonchliligi bilan quyidagi regressiya koeffitsientlarining ishonch oraliqlarini aniqlaymiz:

  • (b - t krit S b ; b + t krit S b)
  • (0.64 - 2.042 * 0.38; 0.64 + 2.042 * 0.38)
  • (-0.13;1.41)

Chunki 0 (nol) nuqta ichkarida joylashgan ishonch oralig'i, keyin b koeffitsientining intervalli bahosi statistik jihatdan ahamiyatsiz.

  • (a - t krit S a ; a + t krit S a)
  • (24.56 - 2.042 * 44.25; 24.56 + 2.042 * 44.25)
  • (-65.79;114.91)

95% ehtimollik bilan ushbu parametrning qiymati topilgan intervalda yotadi, deb aytish mumkin.

0 nuqta (nol) ishonch oralig'ida joylashganligi sababli, a koeffitsientining intervalli bahosi statistik jihatdan ahamiyatsiz.

2) F-statistika. Fisher mezoni.

R2 aniqlash koeffitsienti tenglamaning ahamiyatini tekshirish uchun ishlatiladi chiziqli regressiya umuman.

Regressiya modelining ahamiyatini tekshirish Fisherning F testi yordamida amalga oshiriladi, uning hisoblangan qiymati o'rganilayotgan indikatorning dastlabki kuzatuvlar seriyasining dispersiyasi va qoldiq ketma-ketligi dispersiyasining xolis bahosi nisbati sifatida topiladi. ushbu model uchun.

Agar k 1 =(m) va k 2 =(n-m-1) erkinlik darajalari bilan hisoblangan qiymat berilgan ahamiyatlilik darajasida jadvalli qiymatdan katta bo’lsa, model muhim hisoblanadi.

bu erda m - modeldagi omillar soni.

Juftlangan chiziqli regressiyaning statistik ahamiyati quyidagi algoritm yordamida baholanadi:

  • 1. Tenglama yaxlit statistik jihatdan ahamiyatsiz degan nol gipoteza ilgari suriladi: H 0: R 2 =0 ahamiyatlilik darajasi b.
  • 2. Keyin F-mezonining haqiqiy qiymatini aniqlang:

bu yerda juft regressiya uchun m=1.

3. Jadvalga kiritilgan qiymat Fisher taqsimot jadvallaridan berilgan muhimlik darajasi bo‘yicha aniqlanadi, bunda kvadratlarning umumiy yig‘indisi (kattaroq dispersiya) uchun erkinlik darajalari soni 1 ga va qoldiq uchun erkinlik darajalari soni hisobga olinadi. chiziqli regressiyada kvadratlar yig'indisi (kichik dispersiya) n-2 ga teng.

F jadvali - berilgan erkinlik va ahamiyatlilik darajasida tasodifiy omillar ta'sirida mezonning mumkin bo'lgan maksimal qiymati b. Muhimlik darajasi b - to'g'ri bo'lgan farazni rad etish ehtimoli. Odatda b 0,05 yoki 0,01 ga teng qabul qilinadi.

4. Agar F-testining haqiqiy qiymati jadval qiymatidan kam bo'lsa, unda ular nol gipotezani rad etish uchun hech qanday sabab yo'qligini aytishadi.

Aks holda, nol gipoteza rad etiladi va (1-b) ehtimollik bilan tenglamaning umumiy statistik ahamiyati haqidagi muqobil gipoteza qabul qilinadi.

Erkinlik darajalari k 1 =1 va k 2 =30 bo'lgan mezonning jadval qiymati, F jadvali = 4.17

F ning haqiqiy qiymatidan beri< F табл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

Fisher F-testi va Student t-statistikasi o'rtasidagi bog'liqlik tenglik bilan ifodalanadi:

Regressiya tenglamasining sifat ko'rsatkichlari.

Qoldiqlarning avtokorrelyatsiyasini tekshirish.

OLS yordamida sifatli regressiya modelini yaratishning muhim sharti bu tasodifiy og'ishlar qiymatlarining boshqa barcha kuzatishlardagi og'ishlar qiymatlaridan mustaqilligi. Bu har qanday og'ishlar va, xususan, qo'shni og'ishlar o'rtasida hech qanday bog'liqlik yo'qligini ta'minlaydi.

Avtokorrelyatsiya (ketma-ket korrelyatsiya) vaqt (vaqt qatori) yoki fazoda (oʻzaro qator) tartiblangan kuzatilgan koʻrsatkichlar oʻrtasidagi korrelyatsiya sifatida aniqlanadi. Vaqt seriyalari ma'lumotlaridan foydalanganda regressiya tahlilida qoldiqlarning avtokorrelyatsiyasi (diferanslar) keng tarqalgan va kesma ma'lumotlardan foydalanganda juda kam uchraydi.

Iqtisodiy muammolarda ijobiy avtokorrelyatsiya salbiy avtokorrelyatsiyaga qaraganda ancha keng tarqalgan. Ko'pgina hollarda, ijobiy avtokorrelyatsiya yo'nalish bilan bog'liq doimiy ta'sir qilish modelda hisobga olinmagan ba'zi omillar.

Salbiy avtokorrelyatsiya, asosan, ijobiy og'ishdan keyin salbiy va aksincha. Mavsumiy ma'lumotlarga (qish-yoz) ko'ra, alkogolsiz ichimliklarga bo'lgan talab va daromad o'rtasidagi bir xil bog'liqlik hisobga olinsa, bu holat yuzaga kelishi mumkin.

Avtokorrelyatsiyani keltirib chiqaradigan asosiy sabablar qatoriga quyidagilar kiradi:

  • 1. Spetsifikatsiyadagi xatolar. Modeldagi biron bir muhim tushuntirish o'zgaruvchisini hisobga olmaslik yoki qaramlik shaklini noto'g'ri tanlash, odatda, kuzatuv nuqtalarining regressiya chizig'idan tizimli og'ishlariga olib keladi, bu esa avtokorrelyatsiyaga olib kelishi mumkin.
  • 2. Inertsiya. Ko'pchilik iqtisodiy ko'rsatkichlar(inflyatsiya, ishsizlik, yalpi ichki mahsulot va boshqalar) tadbirkorlik faoliyatining to'lqinlanishi bilan bog'liq bo'lgan ma'lum bir tsiklik xususiyatga ega. Shuning uchun ko'rsatkichlarning o'zgarishi bir zumda sodir bo'lmaydi, lekin ma'lum bir inertsiyaga ega.
  • 3. O‘rgimchak to‘ri effekti. Ko'pgina ishlab chiqarish va boshqa sohalarda iqtisodiy ko'rsatkichlar iqtisodiy sharoitlarning o'zgarishiga kechikish (vaqtning kechikishi) bilan javob beradi.
  • 4. Ma'lumotlarni tekislash. Ko'pincha, ma'lum bir uzoq vaqt uchun ma'lumotlar uning tarkibiy oraliqlari bo'yicha ma'lumotlarni o'rtacha hisoblash yo'li bilan olinadi. Bu ko'rib chiqilayotgan davr ichida sodir bo'lgan tebranishlarning ma'lum bir tekislanishiga olib kelishi mumkin, bu esa o'z navbatida avtokorrelyatsiyani keltirib chiqarishi mumkin.

Avtokorrelyatsiyaning oqibatlari heteroskedastiklik oqibatlariga o'xshaydi: regressiya koeffitsienti va determinatsiya koeffitsientining ahamiyatini aniqlaydigan t- va F-statistik ma'lumotlardan olingan xulosalar noto'g'ri bo'lishi mumkin.

5. F-testidan foydalanib, natijada olingan juftlashgan regressiya tenglamasi umuman statistik jihatdan ahamiyatsiz ekanligi va oylik pensiya qiymati y va yashash qiymati x o'rtasidagi bog'liqlikning o'rganilgan hodisasini etarli darajada tavsiflamasligi aniqlandi.

6. Shartli firma y sof daromadi miqdorini kapital aylanmasi x1 va foydalanilgan kapital x2 bilan bog‘lovchi ekonometrik ko‘p chiziqli regressiya modeli yaratildi.

7. Egiluvchanlik koeffitsientlarini hisoblash orqali kapital aylanmasi 1% ga oʻzgarganda korxona sof daromadi miqdori 0,0008% ga, foydalanilgan kapital 1% ga oʻzgarganda esa korxona sof daromadi miqdori koʻrsatilgan. 0,56% ga o'zgaradi.

8. T-testdan foydalanib, regressiya koeffitsientlarining statistik ahamiyati baholandi, x 1 tushuntirish o'zgaruvchisi statistik jihatdan ahamiyatsiz bo'lib, regressiya tenglamasidan chiqarib tashlanishi mumkin, shu bilan birga tushuntirish o'zgaruvchisi x 2. statistik ahamiyatga ega.

9. F-testidan foydalanib, natijada olingan juftlashgan regressiya tenglamasi umuman statistik ahamiyatga ega ekanligi va shartli firmaning sof daromadi y va kapital aylanmasi x 1 va foydalanilgan kapital o'rtasidagi bog'liqlikning o'rganilgan hodisasini etarli darajada tavsiflashi aniqlandi. x 2.

10. Statistik ma’lumotlarni chiziqli tenglama bilan yaqinlashtirishning o‘rtacha xatosi hisoblangan. ko'p regressiya ni tashkil etdi, bu esa 29,8% ni tashkil etdi. Statistik ma'lumotlar bazasida qaysi kuzatuv tufayli ushbu xatoning kattaligi ruxsat etilgan qiymatdan oshib ketganligi ko'rsatilgan.

14. EXCEL dasturidan foydalanmasdan juftlashgan regressiya modelini qurish.

Foydalanish statistik material 3.5-jadvalda keltirilgan zarur:

2. Korrelyatsiya va aniqlash ko'rsatkichlari yordamida bog'lanishning yaqinligini baholang.

3.Elastiklik koeffitsientidan foydalanib, omil xarakteristikasi bilan natijaviy bog'lanish darajasini aniqlang.

4. Aniqlash o'rtacha xato yaqinlashishlar.

5.Fisherning F testi yordamida modellashtirishning statistik ishonchliligini baholang.

3.5-jadval. Dastlabki ma'lumotlar.

Aholi jon boshiga oʻrtacha pul daromadlarining umumiy miqdorida depozitlar, kreditlar, sertifikatlar va chet el valyutasini sotib olishga qaratilgan jamgʻarmalarni koʻpaytirishga yoʻnaltirilgan pul daromadlarining ulushi, %

O'rtacha oylik hisoblangan ish haqi, c.u.

Kaluzhskaya

Kostromskaya

Orlovskaya

Ryazan

Smolenskaya

Juftlangan chiziqli regressiya tenglamasining noma'lum parametrlarini b 0 , b 1 aniqlash uchun biz shaklga ega bo'lgan normal tenglamalarning standart tizimidan foydalanamiz.

(3.7)

Ushbu tizimni hal qilish uchun birinchi navbatda Sx 2 va Sxy qiymatlarini aniqlash kerak. Ushbu qiymatlar manba ma'lumotlar jadvalidan aniqlanadi, uni tegishli ustunlar bilan to'ldiradi (3.6-jadval).

3.6-jadval. Regressiya koeffitsientlarini hisoblash tomon.

Keyin sistema (3.7) shaklni oladi

Birinchi tenglamadan b 0 ni ifodalab, olingan ifodani ikkinchi tenglamaga almashtirsak:

Hujjatlarni ko'paytirish va qavslarni ochish orqali biz quyidagilarni olamiz:

Nihoyat, jamg'armalarni y oshirishga qaratilgan aholining pul daromadlari ulushi qiymatini o'rtacha oylik hisoblangan ish haqi x bilan bog'laydigan juft chiziqli regressiya tenglamasi quyidagi shaklga ega:

Shunday qilib, juft chiziqli regressiya tenglamasi tuzilgach, bog'liqlikka ko'ra chiziqli korrelyatsiya koeffitsientini aniqlaymiz:

mos keladigan parametrlarning standart og'ishlarining qiymatlari qaerda.

Bog'liqlikdan (3.9) chiziqli korrelyatsiya koeffitsientini hisoblash uchun biz oraliq hisob-kitoblarni bajaramiz.

Topilgan parametrlarning qiymatlarini (3.9) ifodaga almashtirib, olamiz

.

Chiziqli korrelyatsiya koeffitsientining olingan qiymati aholining jamg'armalarni ko'paytirishga qaratilgan pul daromadlari ulushi y va o'rtacha oylik hisoblangan ish haqi miqdori o'rtasida zaif teskari statistik bog'liqlik mavjudligini ko'rsatadi.

Determinatsiya koeffitsienti , ya'ni faqat 9,6% tushuntirish o'zgaruvchisi x ni y bo'yicha regressiya bilan izohlanadi. Shunga ko'ra, 90,4% ga teng bo'lgan 1 qiymati ekonometrik modelda hisobga olinmagan boshqa barcha tushuntirish o'zgaruvchilari ta'siridan kelib chiqqan y o'zgaruvchining dispersiya ulushini tavsiflaydi.

Elastiklik koeffitsienti

Binobarin, o'rtacha oylik hisoblangan ish haqi 1 foizga o'zgarganda aholining jamg'armalarni ko'paytirishga qaratilgan pul daromadlari ulushi ham 1 foizga kamayadi va ish haqining oshishi bilan aholining pul daromadlari ulushi kamayadi. jamg'armalarni ko'paytirishga qaratilgan aholi. Bu xulosa sog'lom fikrga ziddir va uni faqat yaratilgan matematik modelning noto'g'riligi bilan izohlash mumkin.

Keling, o'rtacha taxminiy xatoni hisoblaylik.

3.7-jadval. O'rtacha yaqinlashish xatosini hisoblash tomon.

Olingan qiymat (12...15)% dan oshadi, bu esa ekonometrik model qurilgan haqiqiy ma'lumotlardan hisoblangan ma'lumotlarning o'rtacha chetlanishining ahamiyatini ko'rsatadi.

Statistik modellashtirishning ishonchliligi Fisherning F-testi asosida amalga oshiriladi. F calc Fisher mezonining nazariy qiymati formula bo'yicha bir erkinlik darajasi uchun hisoblangan omil va qoldiq dispersiyalarning qiymatlari nisbati asosida aniqlanadi.

bu yerda n - kuzatishlar soni;

m - izohli o'zgaruvchilar soni (ko'rib chiqilayotgan misol uchun m m =1).

Kritik F kritik qiymati statistik jadvallardan aniqlanadi va ahamiyatlilik darajasi uchun a = 0,05 10,13 ga teng. F hisoblangandan beri

15. EXCEL dan foydalanmasdan ko'p regressiya modelini qurish.

3.8-jadvalda keltirilgan statistik materiallardan foydalanib, siz:

1. Qurilish chiziqli tenglama ko'p regressiya, uning parametrlarining iqtisodiy ma'nosini tushuntiring.

2. O'rtacha (umumiy) elastiklik koeffitsientlari yordamida omillar va hosil bo'lgan atribut o'rtasidagi bog'liqlikning yaqinligiga qiyosiy baho bering.

3. Baho statistik ahamiyatga ega t-testidan foydalangan holda regressiya koeffitsientlari va F-testi yordamida tenglamaning ahamiyatsizligining nol gipotezasi.

4. Taxminan o'rtacha xatolikni aniqlash orqali tenglamaning sifatini baholang.

3.8-jadval. Dastlabki ma'lumotlar.

Sof daromad, million AQSh dollari

Kapital aylanmasi million AQSH dollari

Ishlatilgan kapital, mln AQSH dollari

Ko'p chiziqli regressiya tenglamasining noma'lum b 0, b 1, b 2 parametrlarini aniqlash uchun biz shaklga ega bo'lgan normal tenglamalarning standart tizimidan foydalanamiz.

(3.11)

Ushbu tizimni hal qilish uchun birinchi navbatda Sx 1 2, Sx 2 2, Sx 1 y, Sx 2 y, Sx 1 x 2 qiymatlarini aniqlash kerak. Ushbu qiymatlar manba ma'lumotlar jadvalidan aniqlanadi, uni tegishli ustunlar bilan to'ldiradi (3.9-jadval).

3.9-jadval. Regressiya koeffitsientlarini hisoblash tomon.

Keyin sistema (3.11) shaklni oladi

Ushbu tizimni yechish uchun biz noma'lumlarni ketma-ket yo'q qilishdan iborat bo'lgan Gauss usulidan foydalanamiz: tizimning birinchi tenglamasini 10 ga bo'ling, so'ngra hosil bo'lgan tenglamani 370,6 ga ko'paytiring va uni tizimning ikkinchi tenglamasidan ayirib, keyin ko'paytiramiz. hosil bo'lgan tenglama 158,20 ga teng va uni tizimning uchinchi tenglamasidan ayiring. Tizimning o'zgartirilgan ikkinchi va uchinchi tenglamalari uchun belgilangan algoritmni takrorlab, biz quyidagilarni olamiz:

Þ Þ

Þ .

Transformatsiyadan so'ng bizda:

Keyin sof daromadning kapital aylanmasi va kapitalga yakuniy bog'liqligi chiziqli ko'p regressiya tenglamasi shaklida qo'llaniladi:

Hosil bo‘lgan ekonometrik tenglamadan ko‘rinib turibdiki, foydalanilgan kapitalning ko‘payishi bilan sof daromad ortadi va aksincha, kapital aylanmasining oshishi bilan sof daromad kamayadi. Bundan tashqari, regressiya koeffitsienti qanchalik katta bo'lsa, tushuntiruvchi o'zgaruvchining bog'liq o'zgaruvchiga ta'siri shunchalik katta bo'ladi. Ko'rib chiqilayotgan misolda regressiya koeffitsientining qiymati koeffitsient qiymatidan kattaroqdir, shuning uchun foydalanilgan kapital kapital aylanmasiga qaraganda sof daromadga sezilarli darajada ko'proq ta'sir qiladi. Ushbu xulosani miqdoriy jihatdan baholash uchun biz qisman elastiklik koeffitsientlarini aniqlaymiz.

Natijalar tahlili shuni ko'rsatadiki, foydalanilgan kapital sof daromadga ko'proq ta'sir qiladi. Xususan, foydalanilgan kapitalning 1% ga oshishi bilan sof daromad 1,17% ga oshadi. Shu bilan birga, kapital aylanmasining 1% ga oshishi bilan sof daromad 0,5% ga kamayadi.

Fisher mezonining nazariy qiymati F hisob.

Kritik F kritik qiymatining qiymati statistik jadvallardan aniqlanadi va a = 0,05 ahamiyatlilik darajasi uchun 4,74 ga teng. F calc > F krit bo'lgani uchun nol gipoteza rad etiladi va natijada olingan regressiya tenglamasi statistik ahamiyatga ega deb qabul qilinadi.

Regressiya koeffitsientlari va t-mezonining statistik ahamiyatini baholash ushbu koeffitsientlarning raqamli qiymatini ularning tasodifiy xatolarining kattaligi bilan taqqoslash va o'zaro bog'liqlik bo'yicha amalga oshiriladi:

t-statistikaning nazariy qiymatini hisoblashning ishchi formulasi:

, (3.13)

bunda juft korrelyatsiya koeffitsientlari va ko'p korrelyatsiya koeffitsientlari bog'liqliklardan hisoblanadi:

Keyin t-statistikaning nazariy (hisoblangan) qiymatlari mos ravishda:

Chunki kritik qiymat a=0,05 ahamiyatlilik darajasi uchun statistik jadvallardan aniqlangan t-statistik ma'lumotlar t krit =2,36 mutlaq qiymatda = - 1,798 dan katta bo'lsa, u holda nol gipoteza rad etilmaydi va x 1 tushuntirish o'zgaruvchisi statistik jihatdan ahamiyatsiz va uni chiqarib tashlash mumkin. regressiya tenglamalaridan. Aksincha, ikkinchi regressiya koeffitsienti uchun > t krit (3,3 > 2,36) va tushuntirish o'zgaruvchisi x 2 statistik ahamiyatga ega.

Keling, o'rtacha taxminiy xatoni hisoblaylik.

3.10-jadval. O'rtacha yaqinlashish xatosini hisoblash tomon.

Keyin o'rtacha yaqinlashish xatosi

Olingan qiymat (12…15)% ga teng ruxsat etilgan chegaradan oshmaydi.

16. O'lchov nazariyasining rivojlanish tarixi

TI birinchi marta psixofizik o'lchovlar nazariyasi sifatida ishlab chiqilgan. Urushdan keyingi nashrlarda amerikalik psixolog S.S. Stivens o'lchov shkalalariga e'tibor qaratdi. 20-asrning ikkinchi yarmida. TIni qo'llash doirasi tez sur'atlar bilan kengayib bormoqda. 50-yillarda AQShda nashr etilgan "Psixologiya fanlari entsiklopediyasi"ning jildlaridan biri "Psixologik o'lchovlar" deb nomlangan. Ushbu nashr mualliflari TIning ko'lamini psixofizikadan umuman psixologiyagacha kengaytirdilar. Ushbu to'plamdagi "O'lchovlar nazariyasi asoslari" maqolasida taqdimot mavhum matematik darajada bo'lib, hech qanday maxsus qo'llash sohasiga havolasiz edi. Unda asosiy e'tibor "empirik tizimlarning sonlarga bo'lgan munosabatlari bilan gomomorfizmlari" ga qaratildi (bu matematik atamalarga bu erda kirishning hojati yo'q) va taqdimotning matematik murakkabligi S.S. Stivens.

TI bo'yicha birinchi mahalliy maqolalardan birida (60-yillarning oxiri) ekspertiza ob'ektlarini baholashda ekspertlar tomonidan berilgan ballar, qoida tariqasida, tartibli shkala bo'yicha o'lchanishi aniqlangan. 70-yillarning boshlarida paydo bo'lgan ishlar TIdan foydalanish ko'lamining sezilarli darajada kengayishiga olib keldi. U pedagogik kvalimetriya (talabalarning bilim sifatini o'lchash), tizimli tadqiqotlar va turli nazariy masalalarda qo'llaniladi. ekspert baholashlari, mahsulot sifati ko'rsatkichlarini umumlashtirish uchun, sotsiologik tadqiqotlarda va boshqalar.

TIning ikkita asosiy muammosi sifatida, aniq ma'lumotlarni o'lchash uchun shkala turini belgilash bilan bir qatorda, ma'lumotlarni tahlil qilish algoritmlarini qidirish ilgari surildi, uning natijasi shkalaning ruxsat etilgan o'zgarishi bilan o'zgarmaydi (ya'ni, o'zgarmasdir). geografiyadagi tartibli shkalalar - Bofort shkalasi shamollari ("sokin", "engil shamol", "mo''tadil shamol" va boshqalar), zilzila kuchi shkalasi. Shubhasiz, 2 magnitudali zilzila (shift ostida chayqalgan chiroq) 10 balli zilziladan (er yuzidagi hamma narsani to'liq yo'q qilish) roppa-rosa 5 baravar kuchsizroq deb aytish mumkin emas.

Tibbiyotda ordinal shkalalar gipertenziya bosqichlari shkalasi (Myasnikov bo'yicha), yurak etishmovchiligi darajalari shkalasi (Strajesko-Vasilenko-Lang bo'yicha), koronar etishmovchilikning og'irlik shkalasi (Fogelson bo'yicha) va boshqalar. . Bu barcha tarozilar quyidagi sxema bo'yicha qurilgan: kasallik aniqlanmagan; kasallikning birinchi bosqichi; ikkinchi bosqich; uchinchi bosqich... Ba'zan 1a, 16 va hokazo bosqichlar ajralib turadi, har bir bosqich o'ziga xos tibbiy xususiyatga ega. Nogironlik guruhlarini tavsiflashda raqamlar teskari tartibda qo'llaniladi: eng og'ir - birinchi nogironlik guruhi, keyin ikkinchi, eng engil - uchinchi.

Uy raqamlari ham tartibli shkala bo'yicha o'lchanadi - ular uylar ko'cha bo'ylab qanday tartibda joylashganligini ko'rsatadi. Yozuvchining to‘plangan asarlaridagi jild raqamlari yoki korxona arxividagi ish raqamlari odatda ularni yaratishning xronologik tartibi bilan bog‘lanadi.

Mahsulotlar va xizmatlar sifatini baholashda tartibli shkalalar kvalimetriya (so'zma-so'z tarjima - sifat o'lchovi) deb ataladigan usulda mashhurdir. Ya'ni, ishlab chiqarish birligi o'tish mumkin yoki yaroqsiz deb baholanadi. Aniqroq tahlil qilish uchun uchta darajali shkala qo'llaniladi: sezilarli nuqsonlar mavjud - faqat kichik nuqsonlar mavjud - hech qanday nuqsonlar yo'q. Ba'zan to'rtta gradatsiya qo'llaniladi: tanqidiy nuqsonlar mavjud (foydalanishni imkonsiz qiladi) - sezilarli nuqsonlar mavjud - faqat kichik nuqsonlar mavjud - nuqsonlar yo'q. Mahsulotlarni tasniflash o'xshash ma'noga ega - premium, birinchi nav, ikkinchi nav,...

Atrof-muhitga ta'sirni baholashda birinchi, eng umumiy baholash odatda tartibli bo'ladi, masalan: tabiiy muhit barqaror - tabiiy muhit ezilgan (buzilgan). Ekologik-tibbiy miqyos o'xshash: inson salomatligiga aniq ta'sir ko'rsatilmaydi - salomatlikka salbiy ta'sir ko'rsatiladi.

Tartib shkalasi boshqa sohalarda ham qo'llaniladi. Ekonometriyada bular, birinchi navbatda, ekspert baholashning turli usullari.

Barcha o'lchov shkalalari ikki guruhga bo'linadi - sifat ko'rsatkichlari shkalasi va miqdoriy belgilar shkalasi. Tartib shkalasi va nomlash shkalasi sifat atributlarining asosiy shkalasi hisoblanadi, shuning uchun ko'pgina aniq sohalarda sifatli tahlil natijalarini ushbu masshtablar bo'yicha o'lchovlar deb hisoblash mumkin. Miqdoriy xarakteristikalar masshtablari intervallar, nisbatlar, farqlar, mutlaq shkalalardir. Intervalli shkaladan foydalanib, potentsial energiyaning kattaligi yoki to'g'ri chiziqdagi nuqtaning koordinatasi o'lchanadi. Bunday hollarda shkalada na tabiiy kelib chiqishi, na tabiiy o'lchov birligi belgilanishi mumkin emas. Tadqiqotchi boshlang'ich nuqtani belgilashi va o'lchov birligini o'zi tanlashi kerak. Intervalli shkalada qabul qilinadigan o'zgarishlar chiziqli ortib boruvchi transformatsiyalardir, ya'ni. chiziqli funksiyalar. Tselsiy va Farengeyt harorat shkalalari aynan shu bog'liqlik bilan bog'langan: °C = 5/9 (°F - 32), bu erda °C - Tselsiy shkalasi bo'yicha harorat (graduslarda) va °F - Farengeytdagi harorat. masshtab.

Miqdoriy masshtablardan fan va amaliyotda eng keng tarqalgani nisbat shkalasidir. Ularning tabiiy mos yozuvlar nuqtasi bor - nol, ya'ni. miqdorning yo'qligi, lekin tabiiy o'lchov birligi yo'q. Ko'pgina jismoniy birliklar nisbatlar shkalasida o'lchanadi: tana massasi, uzunlik, zaryad, shuningdek, iqtisodiyotdagi narxlar. Nisbatlar shkalasida qabul qilinadigan o'zgarishlar o'xshash (faqat o'lchovni o'zgartirish). Boshqacha qilib aytganda, erkin muddatsiz chiziqli o'sish transformatsiyalari, masalan, narxlarni belgilangan kurs bo'yicha bir valyutadan boshqasiga konvertatsiya qilish. Aytaylik, ikkita investitsiya loyihasining iqtisodiy samaradorligini rubldagi narxlardan foydalangan holda taqqoslaylik. Birinchi loyiha ikkinchisidan yaxshiroq bo'lsin. Endi qat’iy konvertatsiya kursidan foydalangan holda Xitoy valyutasi – yuanga o‘tamiz. Shubhasiz, birinchi loyiha yana ikkinchisidan ko'ra foydaliroq bo'lishi kerak. Biroq, hisoblash algoritmlari bu shartning bajarilishini avtomatik ravishda ta'minlamaydi va uning bajarilishini tekshirish kerak. O'rtacha qiymatlar uchun bunday test natijalari quyida tavsiflanadi.

Farq shkalasi tabiiy o'lchov birligiga ega, ammo tabiiy mos yozuvlar nuqtasi yo'q. Vaqt farqlar shkalasi bo'yicha o'lchanadi, agar yil (yoki kun - tushdan kunduzgacha) tabiiy o'lchov birligi sifatida qabul qilinsa va intervallar shkalasida. umumiy holat. Hozirgi bilim darajasida tabiiy boshlang'ich nuqtasini ko'rsatish mumkin emas. Turli mualliflar dunyoning yaratilish sanasini, shuningdek, Masihning tug'ilgan kunini turli yo'llar bilan hisoblashadi.

Faqat mutlaq o'lchov uchun o'lchov natijalari so'zning odatiy ma'nosidagi raqamlar, masalan, xonadagi odamlar soni. Mutlaq shkala uchun faqat identifikatsiyani o'zgartirishga ruxsat beriladi.

Tegishli bilim sohasini rivojlantirish jarayonida masshtab turi o'zgarishi mumkin. Shunday qilib, dastlab harorat tartibli shkala bo'yicha o'lchandi (sovuqroq - iliqroq). Keyin - interval bo'yicha (Tselsiy, Farengeyt, Reaumur shkalasi). Nihoyat, mutlaq nol kashf etilgandan so'ng, haroratni nisbatlar shkalasi (Kelvin shkalasi) bo'yicha o'lchangan deb hisoblash mumkin. Shuni ta'kidlash kerakki, ba'zida mutaxassislar o'rtasida o'lchangan haqiqiy qiymatlarni hisobga olish uchun qaysi tarozilardan foydalanish kerakligi haqida kelishmovchiliklar mavjud. Boshqacha qilib aytadigan bo'lsak, o'lchov jarayoni shkala turini aniqlashni ham o'z ichiga oladi (shkalaning ma'lum bir turini tanlashning mantiqiy asoslari bilan birga). Ro'yxatga olingan oltita asosiy tarozi turiga qo'shimcha ravishda, ba'zan boshqa tarozilar ham qo'llaniladi.

17. Invariant algoritmlar va o'rtacha qiymatlar.

Keling, TIda ma'lumotlarni tahlil qilish algoritmlariga qo'yiladigan asosiy talabni shakllantiramiz: ma'lum bir turdagi shkala bo'yicha o'lchangan ma'lumotlar asosida tuzilgan xulosalar ushbu ma'lumotlarning o'lchov shkalasi ruxsat etilganda o'zgarmasligi kerak. Boshqacha qilib aytadigan bo'lsak, tegishli o'lchov o'zgarishlarida xulosalar o'zgarmas bo'lishi kerak.

Shunday qilib, o'lchov nazariyasining asosiy maqsadlaridan biri haqiqiy ob'ektlarga raqamli qiymatlarni belgilashda tadqiqotchining sub'ektivligiga qarshi kurashishdir. Shunday qilib, masofalarni arshin, metr, mikron, mil, parsek va boshqa o'lchov birliklarida o'lchash mumkin. Massa (og'irlik) - pud, kilogramm, funt va boshqalarda. Tovar va xizmatlar narxlari yuan, rubl, tenge, grivna, lat, kroon, marka, AQSh dollari va boshqa valyutalarda (belgilangan konvertatsiya stavkalari asosida) ko'rsatilishi mumkin. Juda muhim, garchi juda aniq bo'lsa-da, bir haqiqatni ta'kidlaymiz: o'lchov birliklarini tanlash tadqiqotchiga bog'liq, ya'ni. sub'ektiv. Statistik xulosalar tadqiqotchi qaysi o'lchov birligini afzal ko'rishiga bog'liq bo'lmasa, shkalaning ruxsat etilgan o'zgarishiga nisbatan o'zgarmas bo'lgandagina haqiqatga adekvat bo'lishi mumkin. Ekonometrik ma'lumotlarni tahlil qilish uchun ko'plab algoritmlardan faqat bir nechtasi bu shartni qondiradi. Buni o'rtacha qiymatlarni solishtirish orqali ko'rsatamiz.

X 1, X 2,.., X n n hajmli namuna bo‘lsin. Ko'pincha o'rtacha arifmetik ishlatiladi. O'rtacha arifmetikdan foydalanish shunchalik keng tarqalganki, bu atamadagi ikkinchi so'z ko'pincha o'tkazib yuboriladi va odamlar aniq iqtisodiy ma'lumotlar uchun o'rtacha ish haqi, o'rtacha daromad va boshqa o'rtacha ko'rsatkichlar haqida gapirishadi, ya'ni "o'rtacha" arifmetik o'rtacha. Bu an'ana noto'g'ri xulosalarga olib kelishi mumkin. Buni gipotetik korxona xodimlarining o'rtacha ish haqini (o'rtacha daromadini) hisoblash misolida ko'rsatamiz. 100 nafar ishchidan atigi 5 nafarining maoshi undan oshib ketadi, qolgan 95 nafarining maoshi esa oʻrtacha arifmetik koʻrsatkichdan sezilarli darajada kam. Sababi ayon – bir kishi – bosh direktorning maoshi 95 nafar ishchi – past malakali va yuqori malakali ishchilar, muhandislar va idora xodimlarining maoshidan oshib ketadi. Vaziyat o'likxonada 0° haroratda yotgan 10 nafar bemor bo'lgan, ulardan 9 nafarining harorati 40°C bo'lgan, biri esa allaqachon azoblangan kasalxona haqidagi taniqli hikoyada tasvirlangan holatni eslatadi. C. Ayni paytda, shifoxonadagi o'rtacha harorat 36 ° C - bundan yaxshiroq bo'lishi mumkin emas!

Shunday qilib, o'rtacha arifmetik faqat juda bir xil populyatsiyalar uchun ishlatilishi mumkin (bir yo'nalishda yoki boshqasida katta chegaralarsiz). Ish haqini tavsiflash uchun qanday o'rtacha ko'rsatkichlardan foydalanish kerak? Median - 50 va 51-chi xodimlarning o'rtacha arifmetik qiymatidan foydalanish tabiiydir, agar ularning ish haqi kamaymaydigan tartibda joylashtirilgan. Avvaliga 40 nafar past malakali ishchilarning maoshi, keyin esa 41-dan 70-chi ishchigacha - yuqori malakali ishchilarning maoshlari keladi. Binobarin, mediana maxsus ularga to'g'ri keladi va 200 ga teng. 50 ishchi uchun ish haqi 200 dan oshmaydi va 50 - kamida 200, shuning uchun mediana o'rganilayotgan qiymatlarning asosiy qismi atrofida joylashgan "markazni" ko'rsatadi. guruhlangan. Yana bir o'rtacha qiymat - bu rejim, eng tez-tez uchraydigan qiymat. Ko'rib chiqilayotgan holatda, bu past malakali ishchilarning ish haqi, ya'ni. 100. Shunday qilib, ish haqini tavsiflash uchun biz uchta o'rtacha qiymatga egamiz - rejim (100 birlik), median (200 birlik) va o'rtacha arifmetik (400 birlik).

Haqiqiy hayotda kuzatilgan daromadlar va ish haqi taqsimoti uchun xuddi shunday sxema to'g'ri bo'ladi: rejim medianadan kichik, mediana esa arifmetik o'rtacha qiymatdan kichik.

Nima uchun iqtisodiyotda o'rtacha ko'rsatkichlar qo'llaniladi? Odatda o'rtacha ko'rsatkichlar yordamida populyatsiyalarni solishtirish uchun raqamlar to'plamini bitta raqam bilan almashtirish. Masalan, Y 1, Y 2,..., Y n bir ekspertiza ob'ektiga (masalan, kompaniyaning strategik rivojlanishi variantlaridan biri) "berilgan" ekspert baholashlari to'plami bo'lsin, Z 1 , Z 2,..., Z n -ikkinchi (bu rivojlanishning yana bir versiyasi). Bu populyatsiyalar qanday taqqoslanadi? Shubhasiz, eng oson yo'li o'rtacha qiymatlardir.

O'rtacha ko'rsatkichlarni qanday hisoblash mumkin? Ma'lum har xil turlari o'rtacha qiymatlar: o'rtacha arifmetik, median, mod, geometrik o'rtacha, garmonik o'rtacha, kvadratik o'rtacha. Keling, buni eslaylik umumiy tushuncha o'rtacha qiymat 19-asrning birinchi yarmidagi frantsuz matematigi tomonidan kiritilgan. Akademik O. Koshi. U quyidagicha bo'ladi: o'rtacha qiymat har qanday F(X 1, X 2,..., X n) funksiya bo'lib, hamma uchun mumkin bo'lgan qiymatlar argumentlar bo'lsa, bu funktsiyaning qiymati X 1, X 2,..., X n raqamlarining minimalidan kam emas va bu raqamlarning maksimalidan ko'p emas. Yuqorida sanab o'tilgan barcha turdagi o'rtacha Koshi o'rtacha hisoblanadi.

Qabul qilinadigan shkala o'zgarishi bilan o'rtacha qiymat aniq o'zgaradi. Ammo qaysi aholi uchun o'rtacha ko'rsatkich katta va qaysi biri uchun kamroq ekanligi haqidagi xulosalar o'zgarmasligi kerak (TIda asosiy talab sifatida qabul qilingan xulosalarning o'zgarmasligi talabiga muvofiq). Taqqoslash natijasi ruxsat etilgan o'lchov o'zgarishlariga nisbatan barqaror bo'lgan o'rtacha qiymatlar turini qidirishning tegishli matematik muammosini tuzamiz.

F(X 1 X 2 ,..., X n) Koshi o‘rtachasi bo‘lsin. Birinchi populyatsiya uchun o'rtacha ikkinchi populyatsiya uchun o'rtacha ko'rsatkichdan past bo'lsin: u holda TIga ko'ra, o'rtacha ko'rsatkichlarni taqqoslash natijasining barqarorligi uchun har qanday ruxsat etilgan transformatsiya uchun g ning ruxsat etilgan o'zgarishlar guruhidan olinishi kerak. mos keladigan shkala, birinchi populyatsiyadan o'zgartirilgan qiymatlarning o'rtacha qiymati ikkinchi to'plam uchun o'zgartirilgan qiymatlarning o'rtacha qiymatidan ham past ekanligi haqiqatdir. Bundan tashqari, tuzilgan shart Y 1, Y 2,..., Y n va Z 1, Z 2,..., Z n har qanday ikkita to'plam va esda tuting, har qanday ruxsat etilgan o'zgartirish uchun to'g'ri bo'lishi kerak. Belgilangan shartni qondiradigan o'rtacha qiymatlarni ruxsat etilgan (tegishli shkalada) deb ataymiz. TIga ko'ra, ekspert xulosalari va ko'rib chiqilayotgan shkala bo'yicha o'lchangan boshqa ma'lumotlarni tahlil qilishda faqat shunday o'rtacha ko'rsatkichlardan foydalanish mumkin.

Yordamida matematik nazariya, 1970-yillarda ishlab chiqilgan bo'lib, asosiy shkalalar bo'yicha qabul qilinadigan o'rtacha ko'rsatkichlar turini tavsiflashga muvaffaq bo'ladi. Nomlar shkalasida o'lchanadigan ma'lumotlar uchun o'rtacha sifatida faqat rejim mos kelishi aniq.

18. Tartib shkala bo'yicha o'rtacha qiymatlar

Keling, tartibli shkala bo'yicha o'lchangan ekspert xulosalarini qayta ishlashni ko'rib chiqaylik. Quyidagi bayonot haqiqatdir.

Teorema1 . Koshi bo‘yicha barcha o‘rtacha ko‘rsatkichlar ichidan tartibli shkalada qabul qilinadigan yagona o‘rtacha atamalar hisoblanadi variatsion qator(tartibdagi statistika).

1-teorema o‘rtacha F(X 1 X 2 ,..., X n) uzluksiz (o‘zgaruvchilar to‘plami ustidagi) va simmetrik funksiya bo‘lishi sharti bilan o‘rinlidir. Ikkinchisi argumentlar qayta joylanganda F(X 1 X 2 ,..., X n) funksiyaning qiymati o‘zgarmasligini bildiradi. Bu holat mutlaqo tabiiydir, chunki biz ketma-ketlik uchun emas, balki umumiylik (to'plam) uchun o'rtacha qiymatni topamiz. To'plam biz uning elementlarini sanab o'tish tartibiga qarab o'zgarmaydi.

1-teoremaga ko'ra, xususan, mediana tartibli shkala bo'yicha o'lchangan ma'lumotlar uchun o'rtacha sifatida ishlatilishi mumkin (agar namuna hajmi toq bo'lsa). Ovoz teng bo'lsa, variatsiya seriyasining ikkita markaziy a'zosidan birini ishlatish kerak - ular ba'zan shunday deyiladi, chap mediana yoki o'ng mediana. Modadan ham foydalanish mumkin - u har doim variatsiya seriyasining a'zosi. Ammo siz hech qachon o'rtacha arifmetik, geometrik o'rtacha va hokazolarni hisoblay olmaysiz.

Quyidagi teorema to'g'ri.

Teorema 2. Y 1, Y 2,...,Y m taqsimot funksiyasi F(x) bo‘lgan mustaqil bir xil taqsimlangan tasodifiy miqdorlar, Z 1, Z 2,..., Zn esa funksiya taqsimotlari bilan bir xil taqsimlangan mustaqil tasodifiy miqdorlar bo‘lsin. H(x) va Y 1, Y 2,...,Y m va Z 1, Z 2,..., Z n namunalari bir-biridan mustaqil va MY X > MZ X. |g i |>X shartni qanoatlantiruvchi har qanday qat’iy ortib boruvchi uzluksiz g funksiya uchun min(m, n) da hodisa ehtimoli 1 ga moyil bo‘lishi uchun F(x) tengsizlik hamma uchun qanoatlantirilishi zarur va yetarli. x< Н(х), причем существовало число х 0 , для которого F(x 0)

Eslatma. Yuqori chegaraga ega shart sof intramatematik xarakterga ega. Aslida, g funksiya tartibli masshtabda ixtiyoriy ruxsat etilgan transformatsiyadir.

2-teoremaga ko'ra, teoremada berilgan tengsizlikni qanoatlantiradigan ikkita taqsimotdan olingan namunalar solishtirilsa, o'rtacha arifmetik qiymatdan tartibli masshtabda ham foydalanish mumkin. Oddiy qilib aytganda, tarqatish funktsiyalaridan biri har doim boshqasidan yuqori bo'lishi kerak. Tarqatish funktsiyalari kesishishi mumkin emas, ular faqat bir-biriga tegishi mumkin. Bu shart bajariladi, masalan, agar taqsimlash funktsiyalari faqat siljishda farq qilsa:

F(x) = N(x + ∆)

ba'zilari uchun ∆.

Agar ma'lum miqdorning ikkita qiymati bir xil o'lchov vositasi yordamida o'lchansa, oxirgi shart qondiriladi, bunda ko'rib chiqilayotgan miqdorning bir qiymatini o'lchashdan boshqasini o'lchashga o'tishda xatolarning taqsimlanishi o'zgarmaydi.

Kolmogorovga ko'ra o'rtacha

Yuqorida sanab o'tilgan bir nechta o'rtacha ko'rsatkichlarning umumlashtirilishi Kolmogorov o'rtachasidir. X 1, X 2,..., X n raqamlari uchun o'rtacha Kolmogorov formulasi yordamida hisoblanadi.

G((F(X l) + F(X 2)+...F(X n))/n),

bu erda F qat'iy monotonik funktsiya (ya'ni qat'iy ortib borayotgan yoki qat'iy kamayuvchi),

G - F ning teskari funktsiyasi.

Kolmogorovning o'rtacha ko'rsatkichlari orasida ko'plab taniqli belgilar mavjud. Demak, agar F(x) = x bo'lsa, Kolmogorov o'rtacha arifmetik o'rtacha, F(x) = lnx bo'lsa, geometrik o'rtacha, F(x) = 1/x bo'lsa, garmonik o'rtacha, agar F( x) = x 2, keyin o'rtacha kvadrat va boshqalar. Kolmogorov o'rtacha ko'rsatkichi Koshi o'rtachasining alohida holatidir. Boshqa tomondan, median va rejim kabi mashhur o'rtacha ko'rsatkichlarni Kolmogorov o'rtachalari sifatida ifodalash mumkin emas. Monografiyada quyidagi fikrlar isbotlangan.

Teorema3 . Agar intervalli shkalada muntazamlikning ma'lum bir intramatematik shartlari mavjud bo'lsa, Kolmogorovning barcha vositalaridan faqat o'rtacha arifmetik qiymatga ruxsat beriladi. Shunday qilib, haroratning (Selsiy bo'yicha) yoki masofalarning geometrik o'rtacha yoki ildiz o'rtacha kvadrati ma'nosizdir. O'rtacha arifmetik qiymatdan foydalanish kerak. Median yoki rejimdan ham foydalanishingiz mumkin.

Teorema 4. Agar nisbatlar shkalasidagi qonuniylikning ma'lum intramatematik shartlari o'rinli bo'lsa, Kolmogorovning barcha o'rtacha ko'rsatkichlari ichida faqat F (x) = x c va geometrik o'rtacha kuchga ega bo'lgan o'rtacha quvvatlarga ruxsat beriladi.

Izoh. Geometrik o'rtacha quvvat vositalarining c > 0 uchun chegarasi.

Nisbatlar shkalasida ishlatib bo'lmaydigan Kolmogorov o'rtachalari bormi? Albatta bor. Masalan, F(x) = e x.

O'rtacha qiymatlarga o'xshash boshqa statistik xususiyatlarni o'rganish mumkin - tarqalish, ulanish, masofa va boshqalar. Masalan, korrelyatsiya koeffitsienti oraliqlar kosasida hech qanday ruxsat etilgan transformatsiya bilan o'zgarmasligini ko'rsatish qiyin emas, xuddi dispersiya nisbati kabi, dispersiya farqlar shkalasida, o'zgaruvchanlik koeffitsientida o'zgarmaydi. nisbatlar shkalasi va boshqalar.

O'rtacha qiymatlar bo'yicha yuqoridagi natijalar nafaqat iqtisod, menejment, ekspert baholash nazariyasi yoki sotsiologiyada, balki muhandislikda, masalan, yuqori o'choqlarning avtomatlashtirilgan jarayonlarini boshqarish tizimlarida sensorlarni yig'ish usullarini tahlil qilishda keng qo'llaniladi. TI standartlashtirish va sifatni boshqarish muammolarida, xususan, qiziqarli nazariy natijalar olingan kvalimetriyada katta amaliy ahamiyatga ega. Demak, masalan, mahsulot sifatining alohida ko'rsatkichlarining vazn koeffitsientlarining har qanday o'zgarishi mahsulotlarni o'rtacha vaznli ko'rsatkich bo'yicha tartiblashning o'zgarishiga olib keladi (bu teorema prof. V.V. Podinovskiy tomonidan isbotlangan). Binobarin, TI va uning usullari haqida yuqorida keltirilgan qisqacha ma'lumotlar ma'lum ma'noda iqtisod, sotsiologiya va muhandislik fanlarini o'zida mujassam etgan bo'lib, ilgari samarali tahlil qilish imkoni bo'lmagan murakkab muammolarni hal qilish uchun adekvat apparatdir. real modellarni yaratish va prognoz muammosini hal qilish uchun yo'l ochiladi.

22. Juftlangan chiziqli regressiya

Keling, juft chiziqli regressiyaning eng oddiy holatini batafsilroq o'rganishga murojaat qilaylik. Chiziqli regressiya toʻgʻri chiziqli tenglama koʻrinishidagi eng oddiy funksional munosabat bilan tavsiflanadi va model parametrlarini (tenglama koeffitsientlarini) shaffof izohlash bilan tavsiflanadi. Tenglamaning o'ng tomoni bizga regressorning (tushuntiruvchi o'zgaruvchining) berilgan qiymatlari asosida olingan (tushuntirilgan) o'zgaruvchining nazariy (hisoblangan) qiymatlarini olish imkonini beradi. Bu qiymatlar ba'zan bashorat qilingan (xuddi shu ma'noda) deb ham ataladi, ya'ni. nazariy formulalardan olingan. Biroq, qaramlikning tabiati haqida gipotezani ilgari surganda, tenglamaning koeffitsientlari hali ham noma'lum bo'lib qolmoqda. Umuman olganda, ushbu koeffitsientlarning taxminiy qiymatlarini turli usullar yordamida olish mumkin.

Lekin ulardan eng muhimi va keng tarqalgani usuldir eng kichik kvadratlar(MNC). U (yuqorida tushuntirilganidek) olingan xarakteristikaning haqiqiy qiymatlarining kvadratik og'ishlar yig'indisini hisoblangan (nazariy)lardan minimallashtirish talabiga asoslanadi. Nazariy qiymatlar o'rniga (ularni olish uchun) regressiya tenglamasining o'ng tomonlarini kvadrat og'ishlar yig'indisiga almashtiring va keyin ushbu funktsiyaning qisman hosilalarini toping (haqiqiy qiymatlarning kvadrat og'ishlari yig'indisi) nazariy xususiyatlardan kelib chiqadigan xarakteristikalar). Bu qisman hosilalar x va y o'zgaruvchilarga nisbatan emas, balki a va b parametrlariga nisbatan olinadi. Qisman hosilalar nolga tenglashtiriladi va oddiy, ammo mashaqqatli o'zgarishlardan so'ng parametrlarni aniqlash uchun normal tenglamalar tizimi olinadi. X o'zgaruvchisi uchun koeffitsient, ya'ni. b regressiya koeffitsienti deb ataladi, u omilning bir birlikka o'zgarishi bilan natijaning o'rtacha o'zgarishini ko'rsatadi. Parametr a iqtisodiy talqinga ega bo'lmasligi mumkin, ayniqsa bu koeffitsientning belgisi salbiy bo'lsa.

Iste'mol funktsiyasini o'rganish uchun juft chiziqli regressiya qo'llaniladi. Ko'paytirgichni hisoblash uchun iste'mol funktsiyasidagi regressiya koeffitsienti qo'llaniladi. Deyarli har doim regressiya tenglamasi ulanishning yaqinligi ko'rsatkichi bilan to'ldiriladi. Chiziqli regressiyaning eng oddiy holati uchun ulanishning yaqinligining bu ko'rsatkichi chiziqli koeffitsient korrelyatsiyalar. Ammo chiziqli korrelyatsiya koeffitsienti chiziqli shakldagi xususiyatlar orasidagi bog'lanishning yaqinligini tavsiflaganligi sababli, chiziqli korrelyatsiya koeffitsientining mutlaq qiymatining nolga yaqinligi hali xususiyatlar o'rtasidagi bog'liqlik yo'qligining ko'rsatkichi bo'lib xizmat qilmaydi.

Model spetsifikatsiyasining boshqacha tanlovi va shuning uchun qaramlik turi bilan haqiqiy munosabatlar birlikka juda yaqin bo'lishi mumkin. Ammo tanlov sifati chiziqli funksiya chiziqli korrelyatsiya koeffitsienti kvadrati yordamida aniqlanadi - aniqlash koeffitsienti. U samarali atributning umumiy dispersiyasidagi regressiya bilan izohlanadigan y samarali atribut dispersiyasining nisbatini tavsiflaydi. Determinatsiya koeffitsientini 1 ga to'ldiruvchi qiymat modelda hisobga olinmagan boshqa omillar ta'siridan kelib chiqadigan dispersiya ulushini tavsiflaydi (qoldiq dispersiya).

Juftlangan regressiya quyidagi ko'rinishdagi ikkita y va x o'zgaruvchilarga tegishli tenglama bilan ifodalanadi:

bu erda y - bog'liq o'zgaruvchi (natijaviy atribut), x - mustaqil o'zgaruvchi (tushuntiruvchi o'zgaruvchi yoki atribut-omil). Chiziqli regressiya va chiziqli bo'lmagan regressiya mavjud. Chiziqli regressiya quyidagi tenglama bilan tavsiflanadi:

y = a+ bx + .

Nochiziqli regressiya, o'z navbatida, tahlilga kiritilgan izohli o'zgaruvchilarga nisbatan chiziqli bo'lishi mumkin, lekin taxmin qilingan parametrlarga nisbatan chiziqli bo'lishi mumkin. Yoki regressiya baholanayotgan parametrlar bo'yicha chiziqli bo'lmasligi mumkin. Tushuntiruvchi o'zgaruvchilarda chiziqli bo'lmagan, lekin taxminiy parametrlarda chiziqli bo'lgan regressiya misollariga turli darajadagi polinom bog'liqliklari (polinomiyalar) va teng tomonli giperbola kiradi.

Hisoblangan parametrlar uchun chiziqli bo'lmagan regressiya - bu parametrga nisbatan quvvatga bog'liqlik (parametr ko'rsatkichda), ko'rsatkichli bog'liqlik, bunda parametr ko'rsatkichning bazasida va eksponensial bog'liqlik, agar butun chiziqli bog'liqlik to'liq bo'lsa. ko'rsatkichda. E'tibor bering, ushbu uchta holatda ham tasodifiy komponent (tasodifiy qoldiq)  kiritilgan o'ng tomon tenglamalar yig'indisi ko'rinishida emas, balki omil ko'rinishida, ya'ni. multiplikativ tarzda! Olingan xarakteristikaning hisoblangan qiymatlarining haqiqiylardan o'rtacha og'ishi o'rtacha yaqinlashish xatosi bilan tavsiflanadi. U foiz sifatida ifodalanadi va 7-8% dan oshmasligi kerak. Bu taxminiy o'rtacha xatolik shunchaki foiz sifatida ifodalangan haqiqiy va hisoblangan qiymatlar o'rtasidagi farqlarning nisbiy kattaliklarining o'rtacha ko'rsatkichidir.

Ko'pgina iqtisodiy hodisa va jarayonlarning muhim xarakteristikasi bo'lib xizmat qiluvchi o'rtacha elastiklik koeffitsienti muhim ahamiyatga ega. U berilgan funksional munosabatning hosilasi qiymati va x ning oʻrtacha qiymatining y ning oʻrtacha qiymatiga nisbati koʻpaytmasi sifatida hisoblanadi. Elastiklik koeffitsienti x omil o'zining (x omil) o'rtacha qiymatidan 1% ga o'zgarganda natija y o'rtacha qiymatidan o'rtacha necha foizga o'zgarishini ko'rsatadi.

Dispersiyani tahlil qilish muammolari juft regressiya va ko'p regressiya (ko'p omillar mavjud bo'lganda) va qoldiq dispersiya bilan chambarchas bog'liq. Dispersiyani tahlil qilish qaram o‘zgaruvchining dispersiyasini tekshiradi. Bunday holda, kvadrat og'ishlarning umumiy yig'indisi ikki qismga bo'linadi. Birinchi atama regressiya yoki izohlangan (faktorial) tufayli kvadrat og'ishlar yig'indisidir. Ikkinchi muddat - omil regressiyasi bilan izohlanmagan kvadrat og'ishlarning qoldiq yig'indisi.

Regressiya bilan izohlanadigan dispersiyaning natijaviy y xarakteristikasining umumiy dispersiyasidagi ulushi determinatsiya koeffitsienti (indeks) bilan tavsiflanadi, bu regressiya tufayli kvadratik og'ishlar yig'indisining kvadratik og'ishlarning umumiy yig'indisiga nisbatidan boshqa narsa emas. (birinchi muddat butun summaga).

Model parametrlari (noma'lumlar koeffitsientlari) eng kichik kvadratlar usuli yordamida aniqlanganda, mohiyatan ba'zi tasodifiy o'zgaruvchilar topiladi (baholarni olish jarayonida). Tasodifiy o'zgaruvchining maxsus shakli bo'lgan regressiya koeffitsientini baholash alohida ahamiyatga ega. Ushbu tasodifiy miqdorning xossalari tenglamadagi (modeldagi) qoldiq a'zoning xususiyatlariga bog'liq. Juftlangan chiziqli regressiya modeli uchun tushuntirish o'zgaruvchisi x ni tasodifiy bo'lmagan ekzogen o'zgaruvchi sifatida ko'rib chiqing. Bu shuni anglatadiki, barcha kuzatuvlardagi x o'zgaruvchisining qiymatlari oldindan aniqlangan deb hisoblanishi mumkin va hech qanday tarzda o'rganilayotgan bog'liqlik bilan bog'liq emas. Shunday qilib, tushuntirilgan o'zgaruvchining haqiqiy qiymati ikkita komponentdan iborat: tasodifiy bo'lmagan va tasodifiy komponent (qoldiq atama).

Boshqa tomondan, eng kichik kvadratlar usuli (OLS) yordamida aniqlangan regressiya koeffitsienti x va y o'zgaruvchilarning kovariatsiyasini x o'zgaruvchining dispersiyasiga bo'lish qismiga teng. Shuning uchun u tasodifiy komponentni ham o'z ichiga oladi. Axir, kovariatsiya y o'zgaruvchining qiymatlariga bog'liq, bu erda y o'zgaruvchining qiymatlari tasodifiy qoldiq  ning qiymatlariga bog'liq. Bundan tashqari, x va y o'zgaruvchilarning kovariatsiyasi hisoblangan regressiya koeffitsienti beta () va x o'zgaruvchisi dispersiyasi, shuningdek, x va  o'zgaruvchilar kovariatsiyasi ko'paytmasiga teng ekanligini ko'rsatish oson. Shunday qilib, beta regressiya koeffitsientining bahosi bu noma'lum regressiya koeffitsientining o'ziga teng bo'lib, x va  o'zgaruvchilarning kovariatsiyasini x o'zgaruvchining dispersiyasiga bo'lish qismiga qo'shiladi. Bular. har qanday tanlamadan olingan b regressiya koeffitsientining bahosi ikki hadning yig'indisi sifatida taqdim etiladi: koeffitsient  (beta) ning haqiqiy qiymatiga teng doimiy qiymat va x va  o'zgaruvchilarning kovariatsiyasiga qarab tasodifiy komponent. .

23. Gauss-Markov matematik shartlari va ularning qo‘llanilishi.

Oddiy OLS asosidagi regressiya tahlili eng yaxshi natijalarga erishish uchun tasodifiy atama to'rtta Gauss-Markov shartlarini qondirishi kerak.

Tasodifiy atamaning matematik kutilishi nolga teng, ya'ni. xolisdir. Agar regressiya tenglamasi doimiy muddatni o'z ichiga olgan bo'lsa, unda bu talabni bajarilgan deb hisoblash tabiiydir, chunki bu doimiy atama bo'lib, y o'zgaruvchisi qiymatlaridagi har qanday tizimli tendentsiyani hisobga olishi kerak, bu esa, aksincha, regressiya tenglamasining izohli o'zgaruvchilarida bo'lmasligi mumkin.

Tasodifiy atamaning dispersiyasi barcha kuzatishlar uchun doimiydir.

Qiymatlarning kovariatsiyasi tasodifiy o'zgaruvchilar, namunani shakllantirish nolga teng bo'lishi kerak, ya'ni. har qanday ikkita aniq kuzatishda tasodifiy atama qiymatlari o'rtasida tizimli bog'liqlik yo'q. Tasodifiy a'zolar bir-biridan mustaqil bo'lishi kerak.

Tasodifiy atamaning taqsimot qonuni tushuntiruvchi o'zgaruvchilardan mustaqil bo'lishi kerak.

Bundan tashqari, ko'pgina ilovalarda tushuntirish o'zgaruvchilari stokastik emas, ya'ni. tasodifiy komponentga ega emas. Har bir kuzatishdagi har qanday mustaqil o'zgaruvchining qiymati regressiya tenglamasida hisobga olinmagan tashqi sabablar bilan to'liq aniqlangan ekzogen deb hisoblanishi kerak.

Belgilangan Gauss-Markov shartlari bilan birgalikda tasodifiy atama normal taqsimotga ega ekanligi ham taxmin qilinadi. U juda keng sharoitlarda amal qiladi va markaziy chegara teoremasi (CLT) deb ataladigan narsaga asoslanadi. Ushbu teoremaning mohiyati shundaki, agar tasodifiy o'zgaruvchi ko'p sonli boshqa tasodifiy o'zgaruvchilarning o'zaro ta'sirining umumiy natijasi bo'lsa, ularning hech biri ushbu umumiy natijaning xatti-harakatiga ustun ta'sir ko'rsatmasa, natijada tasodifiy o'zgaruvchi tasvirlanadi. taxminan normal taqsimot bilan. Bu yaqinlik normal taqsimot taxminlarni olish uchun normal taqsimotdan foydalanish imkonini beradi va hisoblanadi ma'lum ma'noda uning umumlashtirilishi Talaba taqsimoti bo'lib, u odatdagidan sezilarli darajada farq qiladi, asosan "dumlar" deb ataladigan, ya'ni. kichik namuna o'lchamlari uchun. Bundan tashqari, agar tasodifiy atama normal taqsimlangan bo'lsa, regressiya koeffitsientlari ham normal taqsimlanadi.

O'rnatilgan regressiya egri chizig'i (regressiya tenglamasi) nuqta prognozi deb ataladigan muammoni hal qilishga imkon beradi. Bunday hisob-kitoblarda x ning ma'lum bir qiymati o'rganilgan kuzatish oralig'idan tashqarida olinadi va regressiya tenglamasining o'ng tomoniga almashtiriladi (ekstrapolyatsiya protsedurasi). Chunki Regressiya koeffitsientlari uchun taxminlar allaqachon ma'lum, keyin x ning olingan qiymatiga mos keladigan tushuntirilgan y o'zgaruvchining qiymatini hisoblash mumkin. Tabiiyki, bashorat (prognoz) ma'nosiga muvofiq hisob-kitoblar oldinga (kelajakdagi qiymatlar maydoniga) amalga oshiriladi.

Biroq, koeffitsientlar ma'lum bir xato bilan aniqlanganligi sababli, bu qiziq emas ball bahosi(nuqta prognozi) samarali xarakteristikani va ma'lum bir ehtimollik bilan, x omilining qabul qilingan qiymatiga mos keladigan samarali xarakteristikaning qiymatlari yotadigan chegaralarni bilish.

Buning uchun standart xato (standart og'ish) hisoblanadi. Buni hozirgina aytilganlarning ruhida quyidagicha olish mumkin. O'rtacha qiymatlar orqali baholardan bo'sh a terminining ifodasi chiziqli regressiya tenglamasiga almashtiriladi. Keyin ma'lum bo'ladiki, standart xato o'rtacha samarali omil y xatosiga va qo'shimcha ravishda regressiya koeffitsienti b xatosiga bog'liq. Ushbu standart xatoning oddiy kvadrati summasiga teng o'rtacha qiymatning kvadrat xatosi y va regressiya koeffitsientining kvadrat xatosi x omil qiymatining kvadrat og'ishi va uning o'rtacha ko'paytmasi. Bundan tashqari, birinchi atama, statistika qonunlariga ko'ra, umumiy populyatsiyaning dispersiyasini tanlamaning kattaligiga (hajmiga) bo'lish koeffitsientiga teng.

Noma'lum dispersiya o'rniga, tanlama dispersiyasi taxmin sifatida ishlatiladi. Shunga ko'ra, regressiya koeffitsientining xatosi tanlama dispersiyasini x omilining dispersiyasiga bo'lish koeffitsienti sifatida aniqlanadi. Siz standart xato (standart og'ish) va chiziqli regressiya modelidan ko'proq mustaqil bo'lgan boshqa fikrlarni olishingiz mumkin. Buning uchun o'rtacha xato va chegaraviy xato tushunchasi va ular orasidagi bog'liqlik qo'llaniladi.

Ammo standart xatoni olgandan keyin ham, taxmin qilingan qiymat chegaralari haqida savol qoladi. Boshqacha qilib aytganda, o'lchov xatosi oralig'i haqida, tabiiy taxminda ko'p hollarda bu intervalning o'rtasi samarali omil y ning hisoblangan (o'rtacha) qiymati bilan beriladi. Bu erda markaziy chegara teoremasi yordamga keladi, bu noma'lum miqdor ushbu ishonch oralig'ida qanday ehtimollik bilan ekanligini aniq ko'rsatadi.

Asosan, standart xato formulasi, qanday va qanday shaklda olinganidan qat'i nazar, regressiya chizig'i pozitsiyasidagi xatoni tavsiflaydi. X faktorning qiymati omilning o'rtacha qiymatiga to'g'ri kelganda standart xato minimal darajaga etadi.

24. Gipotezalarni statistik tekshirish va Fisher mezoni yordamida chiziqli regressiyaning ahamiyatini baholash.

Chiziqli regressiya tenglamasi topilgach, butun tenglamaning ham, uning alohida parametrlarining ham ahamiyati baholanadi. Bir butun sifatida regressiya tenglamasining ahamiyatini baholash turli mezonlar yordamida amalga oshirilishi mumkin. Fisherning F testidan foydalanish juda keng tarqalgan va samarali. Bunday holda, regressiya koeffitsienti nolga teng bo'lgan nol gipoteza ilgari suriladi, ya'ni. b=0 va shuning uchun x omil y natijaga ta'sir qilmaydi. F-testini darhol hisoblashdan oldin dispersiya tahlili o'tkaziladi. Unda markaziy o'rinni y o'zgaruvchisining kvadratik og'ishlarining umumiy yig'indisining o'rtacha y qiymatidan ikki qismga - "tushuntirilgan" va "tushuntirilmagan" ga bo'linishi egallaydi:

Olingan y xarakteristikasining individual qiymatlarining o'rtacha y qiymatidan kvadrat og'ishlarining umumiy yig'indisi ko'plab omillar ta'siridan kelib chiqadi.

Keling, barcha sabablar to'plamini shartli ravishda ikki guruhga ajratamiz: o'rganilgan x omil va boshqa omillar. Agar omil natijaga ta'sir qilmasa, u holda grafikdagi regressiya chizig'i OX va y=y o'qiga parallel bo'ladi. Keyin olingan xarakteristikaning barcha dispersiyasi boshqa omillar ta'siridan kelib chiqadi va kvadrat og'ishlarning umumiy yig'indisi qoldiq bilan mos keladi. Agar boshqa omillar natijaga ta'sir qilmasa, u holda y funktsional jihatdan x bilan bog'liq va kvadratlarning qoldiq yig'indisi nolga teng. Bunday holda, regressiya bilan izohlangan kvadrat og'ishlar yig'indisi bilan mos keladi Umumiy hisob kvadratlar. Korrelyatsiya maydonining barcha nuqtalari regressiya chizig'ida yotmaganligi sababli, ularning tarqalishi har doim x omil ta'siridan kelib chiqqan holda sodir bo'ladi, ya'ni. y ning x bo'yicha regressiyasi va boshqa sabablar tufayli yuzaga kelgan (tushunmagan o'zgarish). Regressiya chizig'ining bashorat qilish uchun mosligi y belgisidagi umumiy o'zgarishlarning qancha qismi tushuntirilgan o'zgarish hisobiga bog'liqligiga bog'liq.

Shubhasiz, agar regressiya tufayli kvadratik og'ishlar yig'indisi kvadratlarning qoldiq yig'indisidan katta bo'lsa, u holda regressiya tenglamasi statistik ahamiyatga ega va x omili natijaga sezilarli ta'sir qiladi. Bu determinatsiya koeffitsienti birlikka yaqinlashishiga tengdir. Kvadrat og'ishlarning har qanday yig'indisi erkinlik darajalari soniga bog'liq, ya'ni. xarakteristikaning mustaqil o'zgarishi erkinligi soni. Erkinlik darajalari soni aholi birliklari soni yoki undan aniqlangan doimiylar soni bilan bog'liq. O'rganilayotgan muammoga nisbatan erkinlik darajalari soni n ta mumkin bo'lgan [(y 1 -y), (y 2 -y),...(y n -y)] dan qancha mustaqil og'ishlar kerakligini ko'rsatishi kerak. kvadratlarning berilgan yig‘indisini hosil qilish. Shunday qilib, ∑(y-y sr) 2 kvadratlarning umumiy yig'indisi uchun (n-1) mustaqil og'ishlar talab qilinadi, chunki n birlikdan iborat populyatsiyada, o'rtacha darajani hisoblagandan so'ng, faqat (n-1) og'ishlar soni erkin o'zgaradi. ∑(y-y avg) 2 kvadratlarning izohlangan yoki omilli yig'indisini hisoblashda regressiya chizig'i bo'ylab topilgan y* natijaviy xarakteristikasining nazariy (hisoblangan) qiymatlari qo'llaniladi: y(x)=a+bx.

Keling, ushbu qiymatning o'rtacha qiymatidan samarali omilning kvadrat og'ishlarining umumiy yig'indisini kengaytirishga qaytaylik. Bu yig'indi yuqorida aniqlangan ikkita qismdan iborat: regressiya bilan izohlangan kvadrat og'ishlar yig'indisi va kvadrat og'ishlarning qoldiq yig'indisi deb ataladigan boshqa summa. Ushbu parchalanish bilan bog'liq bo'lgan dispersiya tahlili to'g'ridan-to'g'ri asosiy savolga javob beradi: umuman regressiya tenglamasining ahamiyatini va uning individual parametrlarini qanday baholash mumkin? Shuningdek, bu savolning ma'nosini ko'p jihatdan aniqlaydi. Bir butun sifatida regressiya tenglamasining ahamiyatini baholash uchun Fisher mezoni (F-test) qo'llaniladi. Fisher tomonidan taklif qilingan yondashuvga ko'ra, nol gipoteza ilgari suriladi: regressiya koeffitsienti nolga teng, ya'ni. qiymatb=0. Bu shuni anglatadiki, X omil Y natijasiga ta'sir qilmaydi.

Esda tutingki, deyarli har doim statistik tadqiqot natijasida olingan ballar regressiya chizig'ida aniq yotmaydi. Ular tarqoq bo'lib, regressiya chizig'idan ozmi-ko'pmi uzoqda. Bunday dispersiya regressiya tenglamasida e'tiborga olinmagan tushuntirish omili X dan farqli boshqa omillar ta'siridan kelib chiqadi. Kvadrat og'ishlarning izohlangan yoki omilli yig'indisini hisoblashda regressiya chizig'idan topilgan natijaviy xarakteristikaning nazariy qiymatlari qo'llaniladi.

Y va X o'zgaruvchilarning berilgan qiymatlari to'plami uchun Y o'rtacha qiymatining hisoblangan qiymati chiziqli regressiyada faqat bitta parametr - regressiya koeffitsientining funktsiyasidir. Shunga ko'ra, kvadrat og'ishlarning omil yig'indisi 1 ga teng erkinlik darajalariga ega. Chiziqli regressiyada kvadrat og'ishlarning qoldiq yig'indisining erkinlik darajalari soni esa n-2 ga teng.

Shunday qilib, dastlabki kengayishdagi kvadratik og'ishlarning har bir yig'indisini uning erkinlik darajalari soniga bo'lib, biz o'rtacha kvadratik og'ishlarni (bir erkinlik darajasi uchun dispersiya) olamiz. Keyinchalik, omil dispersiyasini bir erkinlik darajasiga qoldiq dispersiyani bir erkinlik darajasiga bo'linib, biz nol gipotezani, F nisbati yoki bir xil nomdagi mezonni sinab ko'rish mezonini olamiz. Ya'ni, agar nol gipoteza to'g'ri bo'lsa, omil va qoldiq dispersiya oddiygina bir-biriga teng.

Nol gipotezani rad qilish uchun, ya'ni. O'rganilayotgan munosabatlarning ahamiyati (mavjudligi) faktini ifodalovchi qarama-qarshi gipotezani qabul qilish, shunchaki mavjud bo'lmagan munosabatlarni taqlid qiluvchi omillarning tasodifiy tasodifini emas, balki kritik qiymatlar jadvallaridan foydalanish kerak. belgilangan munosabat. Jadvallardan foydalanib, Fisher mezonining kritik (eshik) qiymati aniqlanadi. U nazariy deb ham ataladi. Keyin ular kuzatuv ma'lumotlari bo'yicha hisoblangan mezonning tegishli empirik (haqiqiy) qiymati bilan taqqoslab, nisbatning haqiqiy qiymati jadvallardagi kritik qiymatdan oshib ketishini tekshiradilar.

Bu shunday batafsilroq amalga oshiriladi. Nol gipoteza mavjudligi ehtimolining ma'lum darajasini tanlang va jadvallardan F-mezonining kritik qiymatini toping, bunda 1 erkinlik darajasi bo'yicha dispersiyalarning tasodifiy divergentsiyasi hali ham sodir bo'lishi mumkin, ya'ni. maksimal bunday qiymat. Keyin F-nisbatining hisoblangan qiymati ishonchli hisoblanadi (ya'ni, haqiqiy va qoldiq dispersiya o'rtasidagi farqni ifodalash), agar bu nisbat jadvaldagidan katta bo'lsa. Keyin nol gipoteza rad etiladi (bog'lanish belgilari yo'qligi to'g'ri emas) va aksincha, biz bog'lanish bor va u muhim degan xulosaga kelamiz (u tasodifiy emas, muhim).

Agar munosabatlarning qiymati jadvaldagidan kichik bo'lsa, unda nol gipoteza ehtimoli belgilangan darajadan (dastlab tanlangan) yuqori bo'lib chiqadi va nol gipotezani sezilarli xavfsiz rad etib bo'lmaydi. munosabatlarning mavjudligi haqida noto'g'ri xulosa olish. Shunga ko'ra, regressiya tenglamasi ahamiyatsiz hisoblanadi.

F-mezonining o'zi qiymati determinatsiya koeffitsienti bilan bog'liq. Bir butun sifatida regressiya tenglamasining ahamiyatini baholashdan tashqari, regressiya tenglamasining alohida parametrlarining ahamiyati ham baholanadi. Bunday holda, regressiya koeffitsientining standart xatosi empirik haqiqiy standart og'ish va erkinlik darajasi bo'yicha empirik dispersiya yordamida aniqlanadi. Keyin Talaba taqsimoti ishonchlilik intervallarini hisoblash uchun regressiya koeffitsientining ahamiyatini tekshirish uchun ishlatiladi.

Regressiya va korrelyatsiya koeffitsientlarining ahamiyatini Student t-testi yordamida baholash ushbu miqdorlarning qiymatlarini va standart xatoni solishtirish orqali amalga oshiriladi. Chiziqli regressiya parametrlari va korrelyatsiya koeffitsienti xatosining kattaligi quyidagi formulalar bilan aniqlanadi:

bu erda S - o'rtacha kvadrat qoldiq namuna og'ishi,

r xy – korrelyatsiya koeffitsienti.

Shunga ko'ra, regressiya chizig'i tomonidan bashorat qilingan standart xatoning qiymati quyidagi formula bilan beriladi:

Regressiya va korrelyatsiya koeffitsientlari qiymatlarining ularning standart xatosiga mos keladigan nisbati t-statistika deb ataladi va tegishli jadval (kritik) qiymat va uning haqiqiy qiymatini taqqoslash nolni qabul qilish yoki rad etishga imkon beradi. gipoteza. Ammo keyin, ishonch oralig'ini hisoblash uchun har bir ko'rsatkich uchun maksimal xato t statistikasining jadval qiymatining mos keladigan ko'rsatkichning o'rtacha tasodifiy xatosiga ko'paytmasi sifatida topiladi. Aslida, biz buni yuqorida biroz boshqacha yozgan edik. Keyin ishonch oraliqlarining chegaralari olinadi: pastki chegara tegishli koeffitsientlardan (aslida o'rtacha) mos keladigan marjinal xatoni ayirish yo'li bilan, yuqori chegara esa qo'shish (qo'shish).

Chiziqli regressiyada ∑(y x -y avg) 2 =b 2 ∑(x-x avg) 2. Buni chiziqli korrelyatsiya koeffitsienti formulasiga murojaat qilish orqali tekshirish oson: r 2 xy = b 2 *s 2 x /s 2 y

bu yerda s 2 y - y belgining umumiy dispersiyasi;

s 2 x - y xarakteristikaning x omil tufayli dispersiyasi. Shunga ko'ra, chiziqli regressiya tufayli kvadrat og'ishlar yig'indisi bo'ladi:

∑(y x -y o'rtacha) 2 =b 2 ∑(x-x o'rtacha) 2 .

X va y dagi kuzatuvlarning ma'lum hajmi uchun chiziqli regressiyada kvadratlarning omillari yig'indisi regressiya koeffitsienti b ning faqat bitta doimiysiga bog'liq bo'lganligi sababli, kvadratlarning yig'indisi bir erkinlik darajasiga ega. Keling, y atributining hisoblangan qiymatining mazmun tomonini ko'rib chiqaylik. y x. Y x qiymati chiziqli regressiya tenglamasi bilan aniqlanadi: y x ​​= a + bx.

a parametri a=y-bx sifatida belgilanishi mumkin. a parametrining ifodasini chiziqli modelga almashtirib, biz quyidagilarga erishamiz: y x ​​=y-bx+bx avg =y-b(x-x avg).

Berilgan y va x o'zgaruvchilar to'plami uchun y x ning hisoblangan qiymati chiziqli regressiyada faqat bitta parametr - regressiya koeffitsientining funktsiyasidir. Shunga ko'ra, kvadrat og'ishlarning omil yig'indisi 1 ga teng bo'lgan erkinlik darajalariga ega.

Kvadratlarning umumiy, omil va qoldiq yig'indilarining erkinlik darajalari soni o'rtasida tenglik mavjud. Chiziqli regressiyada kvadratlarning qoldiq yig'indisining erkinlik darajalari soni (n-2) ga teng. Kvadratchalarning umumiy yig'indisi uchun erkinlik darajalari soni birlar soni bilan belgilanadi va biz namunaviy ma'lumotlardan hisoblangan o'rtacha qiymatdan foydalanganimiz uchun biz bir erkinlik darajasini yo'qotamiz, ya'ni. (n-1). Shunday qilib, bizda ikkita tenglik bor: yig'indilar va erkinlik darajalari soni uchun. Va bu, o'z navbatida, bizni erkinlik darajasi bo'yicha taqqoslanadigan farqlarga qaytaradi, ularning nisbati Fisher mezonini beradi.

25. Talaba testi yordamida regressiya tenglamasining individual parametrlari va koeffitsientlarining ahamiyatini baholash.

27. Chiziqli va chiziqli bo'lmagan regressiya va ularni o'rganish usullari.

Chiziqli regressiya va uni tadqiq qilish va baholash usullari, agar bu juda muhim, ammo eng oddiy holatga qo'shimcha ravishda, biz ularning yordami bilan yanada murakkab chiziqli bo'lmagan bog'liqliklarni tahlil qilish vositasini olmagan bo'lsak, unchalik muhim bo'lmaydi. Chiziqli bo'lmagan regressiyalarni ikki xil sinfga bo'lish mumkin. Birinchi va sodda - bu nochiziqli bog'liqliklar sinfi bo'lib, unda tushuntirish o'zgaruvchilarga nisbatan nochiziqlilik mavjud, ammo ular tarkibiga kiritilgan va baholanishi kerak bo'lgan parametrlarda chiziqli bo'lib qoladi. Bunga polinomlar kiradi turli darajalar va teng yonli giperbola.

O'zgaruvchilarni oddiygina o'zgartirish (almashtirish) orqali tushuntirishga kiritilgan o'zgaruvchilar uchun bunday chiziqli bo'lmagan regressiyani osongina yangi o'zgaruvchilar uchun oddiy chiziqli regressiyaga kamaytirish mumkin. Shuning uchun, bu holda parametrlarni baholash oddiygina eng kichik kvadratlar usuli bilan amalga oshiriladi, chunki bog'liqliklar parametrlarda chiziqli bo'ladi. Shunday qilib, teng tomonli giperbola bilan tavsiflangan chiziqli bo'lmagan bog'liqlik iqtisodiyotda muhim rol o'ynaydi:

Uning parametrlari eng kichik kvadratlar usuli yordamida yaxshi baholanadi va bu bog'liqlikning o'zi xom ashyo, yoqilg'i, materiallarning o'ziga xos xarajatlari ishlab chiqarish hajmi, tovarlarning aylanish vaqti va bu barcha omillarning savdo hajmi bilan bog'liqligini tavsiflaydi. aylanmasi. Masalan, Fillips egri chizig'i ishsizlik darajasi va ish haqining o'sish foizi o'rtasidagi nochiziqli munosabatni tavsiflaydi.

Baholanayotgan parametrlarda chiziqli bo'lmagan, masalan, darajaning o'zi (uning ko'rsatkichi) parametr bo'lgan yoki parametrga bog'liq bo'lgan quvvat funktsiyasi bilan ifodalangan regressiya bilan vaziyat butunlay boshqacha. Bu ko'rsatkichli funktsiya bo'lishi ham mumkin, bunda daraja asosi parametr va eksponensial funktsiya bo'lib, unda yana indikator parametr yoki parametrlar birikmasini o'z ichiga oladi. Bu sinf, o'z navbatida, ikkita kichik sinfga bo'linadi: biriga tashqi chiziqli bo'lmagan, lekin mohiyatan ichki chiziqli kiradi. Bunday holda siz transformatsiyalar yordamida modelni chiziqli shaklga keltirishingiz mumkin. Biroq, agar model ichki chiziqli bo'lmagan bo'lsa, uni chiziqli funktsiyaga qisqartirish mumkin emas.

Shunday qilib, faqat regressiya tahlilida o'ziga xos chiziqli bo'lmagan modellar haqiqatdan ham chiziqli bo'lmagan hisoblanadi. Transformatsiyalar orqali chiziqli holatga keltirilishi mumkin bo'lgan boshqa barcha narsalar bunday deb hisoblanmaydi va ular ekonometrik tadqiqotlarda eng ko'p ko'rib chiqiladi. Shu bilan birga, bu ekonometrikada mohiyatan chiziqli bo'lmagan bog'liqliklarni o'rganish mumkin emas degani emas. Agar model o'z parametrlarida ichki chiziqli bo'lmasa, u holda parametrlarni baholash uchun iterativ protseduralar qo'llaniladi, ularning muvaffaqiyati ishlatiladigan iterativ usulning xususiyatlari uchun tenglama turiga bog'liq.

Keling, chiziqli bo'lgan bog'liqliklarga qaytaylik. Agar ular parametrlarda ham, o'zgaruvchilarda ham chiziqli bo'lmasa, masalan, y = a ko'rinishidagi X kuchiga ko'paytiriladi, uning ko'rsatkichi parametr -  (beta):

Shubhasiz, bunday munosabatni oddiy logarifm yordamida osongina chiziqli tenglamaga aylantirish mumkin.

Logarifmlarni bildiruvchi yangi o'zgaruvchilar kiritilgach, chiziqli tenglama olinadi. Keyin regressiyani baholash tartibi dastlabki qiymatlarning logarifmlarini olish orqali har bir kuzatish uchun yangi o'zgaruvchilarni hisoblashdan iborat. Keyin yangi o'zgaruvchilarning regressiyaga bog'liqligi baholanadi. Asl o'zgaruvchilarga o'tish uchun siz antilogarifmni olishingiz kerak, ya'ni ularning ko'rsatkichlari o'rniga kuchlarning o'ziga qaytishingiz kerak (oxir-oqibat, logarifm ko'rsatkichdir). Ko'rsatkichli yoki ko'rsatkichli funktsiyalar holatini xuddi shunday ko'rib chiqish mumkin.

Muhim chiziqli bo'lmagan regressiya uchun odatiy regressiyani baholash protsedurasini qo'llash mumkin emas, chunki tegishli munosabatni chiziqliga aylantirib bo'lmaydi. Harakatlarning umumiy sxemasi quyidagicha:

1. Ba'zi ishonchli boshlang'ich parametr qiymatlari qabul qilinadi;

2. Bashorat qilingan Y qiymatlari ushbu parametr qiymatlari yordamida haqiqiy X qiymatlaridan hisoblanadi;

3. Namunadagi barcha kuzatishlar uchun qoldiqlar, keyin esa qoldiqlar kvadratlari yig‘indisi hisoblanadi;

4. Bir yoki bir nechta parametr baholariga kichik o'zgarishlar kiritiladi;

5. Y ning yangi prognoz qilingan qiymatlari, qoldiqlar va qoldiq kvadratlari yig'indisi hisoblanadi;

6. Agar qoldiqlarning kvadratlari yig'indisi oldingidan kamroq bo'lsa, unda yangi parametr baholari avvalgilaridan yaxshiroq va yangi boshlang'ich nuqta sifatida ishlatilishi kerak;

7. Kvadratchalar qoldiqlari yig‘indisining o‘zgarishiga olib keladigan parametr baholariga bunday o‘zgartirishlar kiritish imkoni bo‘lmaguncha 4, 5 va 6-bosqichlar yana takrorlanadi;

8. Kvadrat qoldiqlar yig'indisi minimallashtiriladi va yakuniy parametr baholari eng kichik kvadratlar baholari hisoblanadi, degan xulosaga keldi.

ga qisqartirilishi mumkin bo'lgan chiziqli bo'lmagan funktsiyalar orasida chiziqli shakl, quvvat funksiyasi ekonometrikada keng qo'llaniladi. Undagi b parametr egiluvchanlik koeffitsienti bo'lgan aniq talqinga ega. Hisoblangan parametrlarda chiziqli bo'lmagan, lekin chiziqli shaklga keltirilishi mumkin bo'lgan modellarda aylantirilgan tenglamalarga eng kichik kvadratlar usuli qo'llaniladi. Logarifmlardan va shunga mos ravishda ko'rsatkichlardan amaliy foydalanish, natijada olingan belgi manfiy qiymatlarga ega bo'lmaganda mumkin. Natija atributining logarifmasi yordamida funktsiyalar o'rtasidagi munosabatlarni o'rganishda ekonometrikada kuch qonuniga bog'liqlik ustunlik qiladi (talab va taklif egri chiziqlari, ishlab chiqarish funktsiyalari, mahsulotlarning mehnat zichligi, ishlab chiqarish ko'lami, bog'liqlik o'rtasidagi bog'liqlikni tavsiflovchi yutilish egri chiziqlari). bandlik darajasi bo'yicha YaMM ning Engel egri chiziqlari).

28. Teskari model va undan foydalanish

Ba'zan ichki chiziqli bo'lmagan teskari modeldan foydalaniladi, lekin unda teng tomonli giperboladan farqli o'laroq, tushuntirish o'zgaruvchisi emas, balki Y atributi transformatsiyaga duchor bo'ladi. Shuning uchun teskari model ichki chiziqli bo'lmagan va OLS talabi hosil bo'lgan Y atributining haqiqiy qiymatlari va ularning teskari qiymatlari uchun qoniqtirilmaydi. Nochiziqli regressiya uchun korrelyatsiyani o'rganish alohida e'tiborga loyiqdir. Umumiy holda, ikkinchi darajali parabola, yuqori tartibli ko'phadlar kabi, chiziqlilashtirilganda, ko'p regressiya tenglamasi shaklini oladi. Agar chiziqlilashtirilganda, tushuntirilgan o'zgaruvchiga nisbatan chiziqli bo'lmagan regressiya tenglamasi chiziqli juftlashgan regressiya tenglamasi shaklini oladigan bo'lsa, u holda munosabatlarning yaqinligini baholash uchun chiziqli korrelyatsiya koeffitsientidan foydalanish mumkin.

Agar regressiya tenglamasining chiziqli ko'rinishga o'zgarishi bog'liq bo'lgan o'zgaruvchiga (natijaviy xarakteristikaga) bog'liq bo'lsa, u holda xarakteristikaning o'zgartirilgan qiymatlariga asoslangan chiziqli korrelyatsiya koeffitsienti faqat bog'liqlikning taxminiy bahosini beradi va son bilan mos kelmaydi. korrelyatsiya indeksi. Shuni yodda tutish kerakki, korrelyatsiya indeksini hisoblashda ularning logarifmlari emas, balki natijada Y xarakteristikasining kvadratik og'ishlarining yig'indisi qo'llaniladi. Korrelyatsiya indeksining ahamiyatini baholash korrelyatsiya koeffitsientining ishonchliligini (ahamiyatini) baholash bilan bir xil tarzda amalga oshiriladi. Korrelyatsiya indeksining o'zi, aniqlash indeksi kabi, Fisher F testi yordamida chiziqli bo'lmagan regressiya tenglamasining umumiy ahamiyatini tekshirish uchun ishlatiladi.

E'tibor bering, nochiziqli modellarni chiziqli ko'rinishga keltirish va chiziqli bo'lmagan regressiyani qo'llash orqali qurish imkoniyati, bir tomondan, regressiya tahlilining universalligini oshiradi. Boshqa tomondan, bu tadqiqotchining vazifalarini sezilarli darajada murakkablashtiradi. Agar biz juftlashgan regressiya tahlili bilan cheklansak, Y va X kuzatuvlarini tarqalish grafigi sifatida chizishimiz mumkin. Ko'pincha bir nechta turli xil chiziqli bo'lmagan funktsiyalar, agar ular qandaydir egri chiziqda joylashgan bo'lsa, kuzatuvlarga yaqinlashadi. Ammo ko'p regressiya tahlilida bunday grafik tuzib bo'lmaydi.

Bog'liq o'zgaruvchining bir xil ta'rifiga ega bo'lgan muqobil modellarni ko'rib chiqishda tanlash tartibi nisbatan sodda. Tasavvur qilish mumkin bo'lgan barcha mumkin bo'lgan funktsiyalarga asoslanib, regressiyani taxmin qilish va qaram o'zgaruvchining o'zgarishini eng ko'p tushuntiradigan funktsiyani tanlash mumkin. Chiziqli funktsiya y dagi dispersiyaning taxminan 64% ni, giperbolik funksiya esa 99,9% ni tushuntirsa, ikkinchisini tanlash kerakligi aniq. Lekin qachon turli modellar turli funktsional shakllardan foydalaning, modelni tanlash muammosi sezilarli darajada murakkablashadi.

29. Box-Cox testidan foydalanish.

Umuman olganda, qaram o'zgaruvchining bir xil ta'rifiga ega bo'lgan muqobil modellarni ko'rib chiqishda tanlov oddiy. Bog'liq o'zgaruvchining o'zgarishini eng ko'p tushuntiradigan funktsiyaga e'tibor qaratib, barcha mumkin bo'lgan funktsiyalar asosida regressiyani baholash eng oqilona. Agar determinatsiya koeffitsienti bir holatda regressiya bilan izohlangan dispersiya ulushini o'lchasa, ikkinchisida esa bu bog'liq o'zgaruvchining logarifmasidagi dispersiya nisbati regressiya bilan izohlansa, u holda tanlov qiyinchiliksiz amalga oshiriladi. Ikki model uchun bu qiymatlar juda yaqin bo'lganda va tanlov muammosi sezilarli darajada murakkablashganda, bu boshqa masala.

Keyinchalik Box-Cox testi ko'rinishidagi standart protsedura qo'llanilishi kerak. Agar siz modellarni faqat qaram o'zgaruvchining varianti ko'rinishida samarali omil va uning logarifmi yordamida taqqoslashingiz kerak bo'lsa, u holda Zarembka testining versiyasi qo'llaniladi. U kuzatuv shkalasi Y transformatsiyasini taklif qiladi, bu chiziqli va logarifmik modellarda o'rtacha kvadrat xato (MSE) ni to'g'ridan-to'g'ri taqqoslash imkonini beradi. Tegishli protsedura quyidagi bosqichlarni o'z ichiga oladi:

    Namunadagi Y qiymatlarining geometrik o'rtacha qiymati hisoblanadi, bu Y logarifmining o'rtacha arifmetik ko'rsatkichi bilan mos keladi;

    Y kuzatuvlari birinchi bosqichda olingan qiymatga bo'linadigan tarzda qayta hisoblab chiqiladi;

    Regressiya chiziqli model uchun asl Y qiymatlari o'rniga o'lchovli Y qiymatlari va logarifmik model uchun Y qiymatlarining logarifmidan foydalangan holda ikki regressiya uchun RMSE qiymatlari taqqoslanishi mumkin va shuning uchun kvadrat og'ishlarning kichik yig'indisiga ega model kuzatilgan qiymatlarning haqiqiy munosabatlariga yaxshiroq mos keladi;

    Modellardan biri sezilarli darajada yaxshi mos kelmasligini tekshirish uchun qayta hisoblangan regressiyalarda RMSE qiymatlari nisbati logarifmining yarmini kuzatishlar sonining ko'paytmasidan foydalanish mumkin va keyin olinadi. mutlaq qiymat bu qiymat.

30. Omillarning o'zaro bog'liqligi va multikollinearligi tushunchalari.

34. MNC asoslari va uni qo'llash asosliligi.

Keling, OLS asoslariga, uni qo'llashning haqiqiyligiga (shu jumladan, bir nechta regressiya muammolari) va OLS yordamida olingan baholarning eng muhim xususiyatlariga to'xtalib o'tamiz. Regressiya tenglamasining o'ng tomonidagi analitik bog'liqlik bilan bir qatorda tasodifiy atama ham muhim rol o'ynashidan boshlaylik. Bu tasodifiy komponent kuzatilmaydigan miqdordir. Sami statistik testlar regressiya parametrlari va korrelyatsiya o'lchovlari ko'p regressiyaning ushbu tasodifiy komponentining taqsimlanishi haqidagi tekshirib bo'lmaydigan taxminlarga asoslanadi. Bu taxminlar faqat dastlabki hisoblanadi. Faqat regressiya tenglamasini tuzgandan keyingina tasodifiy qoldiqlarning baholari (tasodifiy komponentning empirik analoglari) apriori qabul qilingan xususiyatlarga ega ekanligi tekshiriladi. Aslida, model parametrlari taxmin qilinganda, tasodifiy komponentning o'zini shunday baholash uchun olingan atributning nazariy va haqiqiy qiymatlari o'rtasidagi farqlar hisoblanadi. Shuni yodda tutish kerakki, bu faqat berilgan tenglamaning noma'lum qoldig'ining namunaviy amalga oshirilishidir.

Oddiy tenglamalar tizimidan olingan regressiya koeffitsientlari bog'lanish kuchining namunaviy bahosidir. Ular xolis bo'lgandagina amaliy ahamiyatga ega bo'lishi aniq. Eslatib o'tamiz, bu holda qoldiqlarning o'rtacha qiymati nolga teng yoki bir xil bo'lgan bahoning o'rtacha qiymati taxmin qilingan parametrning o'ziga teng bo'ladi. Shunda qoldiqlar ko'p sonli tanlanma baholarda to'planmaydi va topilgan regressiya parametrining o'zini ko'p sonli xolis baholarning o'rtacha ko'rsatkichi deb hisoblash mumkin.

Bundan tashqari, hisob-kitoblar eng kichik farqga ega bo'lishi kerak, ya'ni. samarali bo'ladi va shundan so'ng amalda yaroqsiz nuqtalarni baholashdan intervalli baholashga o'tish mumkin bo'ladi. Nihoyat, ishonch oraliqlari parametrning haqiqiy (noma'lum) qiymatidan ma'lum masofada baho olish ehtimoli birga yaqin bo'lganda foydalidir. Bunday hisob-kitoblar izchil deb ataladi va izchillik xususiyati ularning aniqligining ortib borishi bilan tavsiflanadi.

Biroq, izchillik sharti avtomatik ravishda qondirilmaydi va sezilarli darajada quyidagi ikkita muhim talabning bajarilishiga bog'liq. Birinchidan, qoldiqlarning o'zlari eng aniq tasodifiylik bilan stokastik bo'lishi kerak, ya'ni. barcha aniq funktsional bog'liqliklar ko'p regressiyaning analitik komponentiga maxsus kiritilishi kerak va bundan tashqari, qoldiqlarning qiymatlari turli namunalar uchun bir-biridan mustaqil ravishda taqsimlanishi kerak (qoldiqlarning avtokorrelyatsiyasi yo'q). Ikkinchidan, kam bo'lmagan muhim talab - har bir og'ishning (qoldiqning) dispersiyasi X o'zgaruvchilarning barcha qiymatlari uchun bir xil bo'lishi (homosedastiklik). Bular. homosedastiklik barcha kuzatishlar uchun dispersiyaning doimiyligi bilan ifodalanadi:

Aksincha, heteroskedastiklik turli kuzatishlar uchun dispersiyaning bunday doimiyligining buzilishidir. Bunday holda, tanlovdagi turli kuzatishlar uchun tasodifiy atamaning turli nazariy taqsimotlari bilan yuqori deviant qiymatlarni olishning apriori (kuzatishlar oldidan) ehtimoli nisbatan yuqori bo'ladi.

Qoldiqlarning avtokorrelyatsiyasi yoki joriy va oldingi (keyingi) kuzatishlar qoldiqlari o'rtasidagi korrelyatsiyaning mavjudligi odatiy chiziqli korrelyatsiya koeffitsientining qiymati bilan belgilanadi. Agar u noldan sezilarli darajada farq qiladigan bo'lsa, unda qoldiqlar avtokorrelyatsiya qilinadi va shuning uchun ehtimollik zichligi funktsiyasi (qoldiqlarni taqsimlash) kuzatish nuqtasiga va boshqa kuzatish nuqtalarida qoldiq qiymatlarning taqsimlanishiga bog'liq. Mavjud statistik ma'lumotlardan foydalangan holda qoldiqlarning avtokorrelyatsiyasini aniqlash X omil bo'yicha kuzatishlar tartibi mavjud bo'lsa, qulaydir. Qoldiqlarning avtokorrelyatsiyasining yo'qligi regressiya koeffitsientlarini baholashning izchilligi va samaradorligini ta'minlaydi.

35. Gomoskedastiklik va geteroskedastizm, qoldiqlarning avtokorrelyatsiyasi, umumlashtirilgan eng kichik kvadratlar (GLM).

X o'zgaruvchilarning barcha qiymatlari uchun qoldiqlarning dispersiyalarining bir xilligi yoki homosedastiklik OLS yordamida regressiya parametrlarining izchil baholarini olish uchun mutlaqo zarurdir. Gomoskedastiklik shartini qondirmaslik heteroskedastiklik deb ataladigan holatga olib keladi. Bu regressiya koeffitsientlarining noxolis baholanishiga olib kelishi mumkin. Geteroskedastlik, asosan, regressiya koeffitsientini baholash samaradorligining pasayishiga ta'sir qiladi. Bunday holda, regressiya koeffitsientining standart xatosi formulasidan foydalanish ayniqsa qiyin bo'ladi, undan foydalanish omilning har qanday qiymatlari uchun qoldiqlarning bir xil tarqalishini nazarda tutadi. Regressiya koeffitsientlarini baholashning xolisligiga kelsak, bu birinchi navbatda qoldiqlarning mustaqilligiga va omillarning o'z qiymatlariga bog'liq.

Gomoskedastlikni sinashning juda aniq, ammo qat'iy bo'lmagan va mahorat talab qiladigan usuli bu qoldiqlarning o'rtacha hisoblangan (nazariy) natijaviy atributga yoki tegishli korrelyatsiya maydonlariga bog'liqlik xususiyatini grafik tarzda o'rganishdir. Geteroskedastizmni o'rganish va baholashning analitik usullari yanada qat'iydir. Agar heteroskedastika sezilarli darajada mavjud bo'lsa, OLS o'rniga umumlashtirilgan OLS (GLM) dan foydalanish tavsiya etiladi.

OLSdan foydalanishdan kelib chiqadigan ko'p regressiya talablaridan tashqari, modelga kiritilgan o'zgaruvchilar bo'yicha shartlarga ham rioya qilish kerak. Bular, birinchi navbatda, kuzatuvlarning ma'lum hajmi uchun model omillar soniga oid talablarni o'z ichiga oladi (1 dan 7 gacha). Aks holda, regressiya parametrlari statistik jihatdan ahamiyatsiz bo'ladi. LSMni amalga oshirishda tegishli raqamli usullarni qo'llash samaradorligi nuqtai nazaridan, kuzatuvlar soni hisoblangan parametrlar sonidan oshib ketishi kerak (tenglamalar tizimida tenglamalar soni izlanganlar sonidan kattaroqdir) o'zgaruvchilar).

Ekonometrikaning eng muhim yutug'i noma'lum parametrlarni baholash usullarini sezilarli darajada rivojlantirish va ko'rib chiqilayotgan ta'sirlarning statik ahamiyatini aniqlash mezonlarini takomillashtirishdir. Shu munosabat bilan, turli darajada namoyon bo'lgan heteroskedastika tufayli an'anaviy OLSdan foydalanishning mumkin emasligi yoki maqsadga muvofiq emasligi umumlashtirilgan OLS (GLM) rivojlanishiga olib keldi. Aslida, bu regressiya koeffitsientlarini xolis, samarali va izchil baholashni ta'minlash uchun modelni sozlash, uning spetsifikatsiyasini o'zgartirish va dastlabki ma'lumotlarni o'zgartirishni o'z ichiga oladi.

Qoldiqlarning o'rtacha qiymati nolga teng deb taxmin qilinadi, ammo ularning dispersiyasi endi doimiy emas, balki K i qiymatlari bilan mutanosibdir, bu erda bu qiymatlar turli qiymatlar uchun har xil bo'lgan proportsionallik koeffitsientlaridir. omil x. Shunday qilib, dispersiyaning heterojenligini tavsiflovchi bu koeffitsientlar (K i qiymatlari). Tabiiyki, bu mutanosiblik koeffitsientlari uchun umumiy omil bo'lgan dispersiya miqdorining o'zi noma'lum deb hisoblanadi.

Asl model, ushbu koeffitsientlarni ko'p regressiya tenglamasiga kiritgandan so'ng, geteroskdastik bo'lib qolishda davom etadi (aniqrog'i, bu modelning qoldiq qiymatlari). Bu qoldiqlar (qoldiqlar) avtokorrelyatsiya qilinmasin. i-kuzatish natijasida qayd etilgan boshlang'ich model o'zgaruvchilarni K i proportsionallik koeffitsientlarining kvadrat ildiziga bo'lish natijasida olingan yangi o'zgaruvchilarni kiritamiz. Keyin biz o'zgartirilgan o'zgaruvchilarda yangi tenglamani olamiz, bunda qoldiqlar homosedastik bo'ladi. Yangi o'zgaruvchilarning o'zlari tortilgan eski (asl) o'zgaruvchilardir.

Shuning uchun, gomoskedastik qoldiqlar bilan shu tarzda olingan yangi tenglamaning parametrlarini baholash vaznli eng kichik kvadratlar usuliga tushiriladi (mohiyatan, bu OLS usuli). Regressiya o'zgaruvchilari o'rniga ishlatilganda, ularning o'rtacha qiymatlardan chetlanishi, regressiya koeffitsientlari uchun ifodalar oddiy va standartlashtirilgan (bir xil) shaklga ega bo'lib, OLS va OLS uchun hisoblagich va maxrajdagi 1/K tuzatish koeffitsienti bilan bir oz farq qiladi. regressiya koeffitsientini beruvchi kasrning.

Shuni yodda tutish kerakki, o'zgartirilgan (sozlangan) modelning parametrlari K i proportsionallik koeffitsientlari uchun asos sifatida qaysi kontseptsiyadan foydalanilganiga sezilarli darajada bog'liq. Ko'pincha qoldiqlar faktor qiymatlari bilan proportsionaldir deb taxmin qilinadi. Xatolar tartibdagi oxirgi omil qiymatlariga mutanosib ekanligi haqidagi gipoteza qabul qilinganda model eng oddiy shaklni oladi. Keyin OLS standart OLS ning dastlabki manba o'zgaruvchilari bilan ishlashiga nisbatan regressiya parametrlarini aniqlashda o'zgartirilgan o'zgaruvchilarning kichikroq qiymatlari bilan kuzatuvlar og'irligini oshirishga imkon beradi. Ammo bu yangi o'zgaruvchilar allaqachon boshqa iqtisodiy tarkibga ega.

Qoldiqlarning omil hajmiga mutanosibligi haqidagi gipoteza haqiqiy asosga ega bo'lishi mumkin. Bir vaqtning o'zida, masalan, bir vaqtning o'zida yirik va kichik korxonalarni o'z ichiga olgan ma'lum bir hil bo'lmagan ma'lumotlar to'plamini qayta ishlashga ruxsat bering. Keyin omilning katta hajmli qiymatlari hosil bo'lgan xarakteristikaning katta dispersiyasiga ham, qoldiq qiymatlarning katta dispersiyasiga ham mos kelishi mumkin. Bundan tashqari, OLS dan foydalanish va tegishli nisbiy qiymatlarga o'tish nafaqat omillar o'zgarishini kamaytiradi, balki xatolarning farqini ham kamaytiradi. Shunday qilib, regressiya modellarida heteroskedastiklikni hisobga olish va tuzatishning eng oddiy holati OLS yordamida amalga oshiriladi.

OLSni vaznli OLS shaklida amalga oshirishning yuqoridagi yondashuvi juda amaliy - u oddiygina amalga oshiriladi va shaffof iqtisodiy talqinga ega. Albatta, bu eng umumiy yondashuv emas va ekonometrikaning nazariy asosi bo'lib xizmat qiluvchi matematik statistika kontekstida bizga OLS ni o'z darajasida amalga oshiradigan ancha qat'iyroq usul taklif etiladi. umumiy ko'rinish. Unda siz xato vektorining (qoldiq ustun) kovariatsiya matritsasi bilan tanishishingiz kerak. Va bu odatda amaliy vaziyatlarda adolatsizdir va bu matritsani shunday topish mumkin emas. Shuning uchun, umuman olganda, bunday bahoni matritsaning o'rniga mos keladigan formulalarda qo'llash uchun kerakli matritsani qandaydir tarzda baholash kerak. Shunday qilib, OMNCni amalga oshirishning tavsiflangan versiyasi ana shunday baholardan birini ifodalaydi. Ba'zan u umumiylashtirilgan eng kichik kvadratlar deb ataladi.

Shuni ham hisobga olish kerakki, aniqlash koeffitsienti OLS dan foydalanganda moslik sifatining qoniqarli o'lchovi bo'lib xizmat qila olmaydi. OLSdan foydalanishga qaytsak, shuningdek, Oq shakldagi standart og'ishlardan (standart xatolar) foydalanish usuli (heteroskedastiklik mavjudligida izchil standart xatolar deb ataladi) etarli umumiylikka ega ekanligini ta'kidlaymiz. Bu usul xato vektorining kovariatsiya matritsasi diagonal bo'lishi sharti bilan qo'llaniladi. Agar qoldiqlarning (xatolarning) avtokorrelyatsiyasi mavjud bo'lsa, kovariatsiya matritsasida va asosiy diagonaldan tashqarida nolga teng bo'lmagan elementlar (koeffitsientlar) mavjud bo'lganda, Neve West shaklida yanada umumiy standart xato usuli qo'llanilishi kerak. Muhim cheklov mavjud: nolga teng bo'lmagan elementlar, asosiy diagonaldan tashqari, faqat qo'shni diagonallarda joylashgan bo'lib, ular asosiy diagonaldan ma'lum miqdordan ko'p bo'lmagan masofada joylashgan.

Yuqoridagilardan ko'rinib turibdiki, ma'lumotlarni heteroskedastlik uchun tekshirish imkoniyatiga ega bo'lish kerak. Quyidagi testlar shu maqsadga xizmat qiladi. Ular qoldiqlar dispersiyalarining tengligi haqidagi asosiy gipotezani muqobil gipotezaga (bu gipotezalarning tengsizligi haqida) qarshi tekshiradilar. Bundan tashqari, heteroskedastlik tabiatida aprior strukturaviy cheklovlar mavjud. Goldfeld-Quandt testi odatda xato dispersiyasi (qoldiq) ba'zi mustaqil o'zgaruvchining qiymatiga bevosita bog'liq degan taxmindan foydalanadi. Ushbu testdan foydalanish sxemasi quyidagicha. Birinchidan, ma'lumotlar mustaqil o'zgaruvchining kamayish tartibida tartibga solinadi, ular uchun heteroskedastlik gumon qilinadi. Ushbu tartiblangan ma'lumotlar to'plami o'rtacha bir nechta kuzatuvlarni yo'q qiladi, bu erda "oz" so'zi taxminan chorakni (25%) anglatadi. umumiy soni barcha kuzatuvlar. Keyinchalik, qolgan (barqaror qilingandan keyin) o'rtacha kuzatuvlarning birinchisi va qolgan o'rtacha kuzatuvlarning oxirgi ikkitasi bo'yicha ikkita mustaqil regressiya amalga oshiriladi. Shundan so'ng, ikkita mos keladigan qoldiq quriladi. Nihoyat, Fisher F statistikasi tuziladi va agar o'rganilayotgan gipoteza to'g'ri bo'lsa, F haqiqatan ham tegishli erkinlik darajasiga ega Fisher taqsimotidir. Keyin bu statistikaning katta qiymati tekshirilayotgan gipotezani rad etish kerakligini anglatadi. Yo'q qilish bosqichi bo'lmasa, ushbu testning kuchi kamayadi.

Breusch-Pagan testi apriori farqlar ba'zi qo'shimcha o'zgaruvchilarga bog'liq deb taxmin qilingan hollarda qo'llaniladi. Birinchidan, oddiy (standart) regressiya bajariladi va qoldiqlar vektori olinadi. Keyin dispersiyaning taxmini tuziladi. Keyinchalik, qoldiqlarning kvadrat vektorining empirik dispersiyaga bo'lingan regressiyasi (variantni baholash) amalga oshiriladi. Buning uchun (regressiya) o'zgaruvchanlikning tushuntirilgan qismi topiladi. Va buning uchun o'zgaruvchanlikning tushuntirilgan qismi yarmiga bo'lingan holda statistika tuziladi. Agar nol gipoteza to'g'ri bo'lsa (heteroskedastiklik to'g'ri emas), u holda bu qiymat taqsimotga ega he-kvadrat. Agar, aksincha, test geteroskedastiklikni aniqlasa, u holda qoldiqlar vektorining komponentlarini kuzatilgan mustaqil o'zgaruvchilar vektorining mos keladigan komponentlariga bo'lish yo'li bilan asl model o'zgartiriladi.

36. Oq shakldagi standart og'ish usuli.

Quyidagi xulosalar chiqarish mumkin. Geteroskedastizm mavjud bo'lganda OLS dan foydalanish og'irlikdagi kvadratik og'ishlar yig'indisini minimallashtirishga to'g'ri keladi. Mavjud OLS dan foydalanish hisoblangan parametrlar sonidan oshib ketadigan ko'p sonli kuzatuvlarga ega bo'lish zarurati bilan bog'liq. OLS dan foydalanish uchun eng qulay holat xato (qoldiqlar) mustaqil o‘zgaruvchilardan biriga proportsional bo‘lgan va natijada olingan baholar izchil bo‘lgan holdir. Agar, shunga qaramay, heteroskedastisiteli modelda OLS emas, balki standart OLS dan foydalanish kerak bo'lsa, unda izchil baholarni olish uchun Oq yoki Nevje-G'arbiy shakldagi xatolarni baholashdan foydalanish mumkin.

Vaqt seriyalarini tahlil qilishda ko'pincha vaqtning turli nuqtalarida kuzatuvlarning statistik bog'liqligini hisobga olish kerak. Bunday holda, o'zaro bog'liq bo'lmagan xatolarning taxmini qondirilmaydi. Keling, ko'rib chiqaylik oddiy model, bunda xatolar birinchi tartibli avtoregressiv jarayonni tashkil qiladi. Bunday holda, xatolar oddiy takrorlanish munosabatini qanoatlantiradi, uning o'ng tomonida atamalardan biri nolga teng o'rtacha va doimiy dispersiyaga ega bo'lgan mustaqil normal taqsimlangan tasodifiy o'zgaruvchilar ketma-ketligidir. Ikkinchi muddat parametr (avtoregressiya koeffitsienti) va oldingi vaqtdagi qoldiq qiymatlarining mahsulotidir. Xato qiymatlari (qoldiqlar) ketma-ketligining o'zi statsionar tasodifiy jarayonni hosil qiladi. Statsionar tasodifiy jarayon vaqt o'tishi bilan xarakteristikasining doimiyligi, xususan, o'rtacha va dispersiya bilan tavsiflanadi. Bunday holda, bizni qiziqtirgan kovariatsiya matritsasi (uning shartlari) parametr vakolatlari yordamida osongina yozilishi mumkin.

Ma'lum parametr uchun avtoregressiv modelni baholash OLS yordamida amalga oshiriladi. Bunday holda, xatolari standart regressiya modeli shartlarini qondiradigan modelga oddiy o'zgartirish orqali dastlabki modelni oddiygina qisqartirish kifoya. Bu juda kam uchraydi, lekin hali ham avtoregressiya parametri ma'lum bo'lgan vaziyat mavjud. Shuning uchun, odatda, noma'lum avtoregressiv parametr bilan baholashni amalga oshirish kerak. Bunday baholash uchun uchta eng ko'p ishlatiladigan protseduralar mavjud. Cochrane-Orcutt usuli, Hildret-Lu protsedurasi va Durbin usuli.

Umuman olganda, quyidagi xulosalar to'g'ri. Vaqt seriyasini tahlil qilish an'anaviy OLSni tuzatishni talab qiladi, chunki bu holatda xatolar odatda o'zaro bog'liqdir. Ko'pincha bu xatolar birinchi darajali statsionar avtoregressiv jarayonni tashkil qiladi. Birinchi darajali avtoregressiya uchun OLS baholovchilari xolis, izchil, ammo samarasiz. Ma'lum bo'lgan avtoregressiya koeffitsienti bilan OLS dastlabki tizimning oddiy o'zgarishlariga (tuzatishlariga) va keyin standart OLSni qo'llashga kamayadi. Agar ko'pincha avtoregressiv koeffitsient noma'lum bo'lsa, OLS uchun bir nechta protseduralar mavjud bo'lib, ular noma'lum parametrni (koeffitsientni) baholashdan iborat bo'lib, shundan so'ng ma'lum bo'lgan oldingi holatda bo'lgani kabi bir xil o'zgarishlar qo'llaniladi. parametr.

37. Breusch-Pagan testi tushunchasi, Goldfeldt-Quandt testi

Taxminan xato - bu manba ma'lumotlarini yaqinlashtirishning muayyan usullarini qo'llashda eng ko'p yuzaga keladigan muammolardan biridir. Taxminan xatolarning har xil turlari mavjud:

Manba ma'lumotlari xatolari bilan bog'liq xatolar;

Taxminiy model va taxminiy ma'lumotlarning tuzilishi o'rtasidagi nomuvofiqlik bilan bog'liq xatolar.

Excelda murakkab matematikadan foydalanadigan ma'lumotlarni qayta ishlash va yaqinlashtirish uchun yaxshi ishlab chiqilgan Lineer funksiyasi mavjud. Bu haqda tasavvurga ega bo'lish uchun (F1 orqali) qisqartmalar va yozuvdagi ba'zi o'zgarishlar bilan taqdim etilgan ushbu ishlanmaning tavsif qismiga murojaat qilaylik.

Mavjud ma'lumotlarga eng mos keladigan to'g'ri chiziqni hisoblash uchun eng kichik kvadratlar yordamida ketma-ket statistikani hisoblaydi. Funksiya olingan qatorni tavsiflovchi massivni qaytaradi. Qiymatlar massivi qaytarilganligi sababli, funktsiya massiv formulasi sifatida ko'rsatilishi kerak.

To'g'ri chiziq uchun tenglama:

y=a+b1*x1+b2*x2+...bn*xn

Sintaksis:

LINEST(y;x;const;statistics)

y massivi - ma'lum qiymatlar y.

X massivi - x ning ma'lum qiymatlari. X massivida bir yoki bir nechta o'zgaruvchilar to'plami bo'lishi mumkin.

Const - bu mantiqiy qiymat, bu a qo'g'irchoq atamasi 0 bo'lishi kerakmi yoki yo'qligini aniqlaydi.

Agar const argumenti TRUE, 1 yoki o'tkazib yuborilmagan bo'lsa, a odatdagidek baholanadi. Agar const argumenti FALSE yoki 0 bo'lsa, a 0 ga o'rnatiladi.

Statistika mantiqiy qiymat bo'lib, qo'shimcha regressiya statistikasini qaytarish kerakligini ko'rsatadi. Agar statistik argument TRUE yoki 1 bo'lsa, LINEST qo'shimcha regressiya statistikasini qaytaradi. Agar statistik ma'lumotlar FALSE, 0 yoki o'tkazib yuborilgan bo'lsa, LINEST faqat koeffitsientlar va kesishmani qaytaradi.

Qo'shimcha regressiya statistikasi:

se1,se2,...,sen - b1,b2,...,bn koeffitsientlari uchun standart xato qiymatlari.

dengiz - a doimiysi uchun standart xato qiymati (dengiz = #N/A, agar const FALSE bo'lsa).

r2 - determinizm koeffitsienti. y ning haqiqiy qiymatlari va chiziq tenglamasidan olingan qiymatlar solishtiriladi; Taqqoslash natijalariga ko'ra, determinizm koeffitsienti hisoblab chiqiladi, 0 dan 1 gacha normallashtiriladi. Agar u 1 ga teng bo'lsa, u holda model bilan to'liq korrelyatsiya mavjud, ya'ni. y ning haqiqiy va taxminiy qiymatlari o'rtasida farq yo'q. Aksincha, aniqlash koeffitsienti 0 bo'lsa, regressiya tenglamasi y ning qiymatlarini bashorat qilishda muvaffaqiyatsiz bo'ladi. R2 qanday hisoblanganligi haqida ma'lumot olish uchun ushbu bo'lim oxiridagi "Eslatmalar" ga qarang.

sey - y ni baholashda standart xato.

F-statistik yoki F-kuzatilgan qiymat. F-statistika bog'liq va mustaqil o'zgaruvchilar o'rtasidagi kuzatilgan bog'liqlik tasodifiy yoki yo'qligini aniqlash uchun ishlatiladi.

df - erkinlik darajalari. Erkinlik darajalari statistik jadvalda F-kritik qiymatlarni topish uchun foydalidir. Modelning ishonchlilik darajasini aniqlash uchun siz jadvaldagi qiymatlarni LINEST funksiyasi tomonidan qaytarilgan F-statistika bilan solishtirasiz.

ssreg - kvadratlarning regressiya yig'indisi.

ssresid - kvadratlarning qoldiq yig'indisi.

Quyidagi rasmda qo'shimcha regressiya statistikasini qaytarish tartibi ko'rsatilgan.

Eslatmalar

Funktsiyadan tanlangan ma'lumotni INDEX funktsiyasi orqali olish mumkin, masalan:

Y-kesish (erkin muddat):

INDEX(LINEST(y,x),2)

LINEST funksiyasi bilan hisoblangan to'g'ri chiziq yordamida yaqinlashishning aniqligi ma'lumotlarning tarqalish darajasiga bog'liq. Ma'lumotlar to'g'ri chiziqqa qanchalik yaqin bo'lsa, LINEST funksiyasi tomonidan qo'llaniladigan model shunchalik aniqroq bo'ladi. LINEST funksiyasi maʼlumotlarga eng mos kelishini aniqlash uchun eng kichik kvadratlardan foydalanadi.

Regressiya tahlilini o'tkazish orqali, Microsoft Excel har bir nuqta uchun bashorat qilingan y qiymati va haqiqiy y qiymati o'rtasidagi farq kvadratini hisoblab chiqadi. Bu kvadratik farqlarning yig'indisi kvadratlarning qoldiq yig'indisi deb ataladi. Keyin Microsoft Excel haqiqiy y qiymatlari va o'rtacha y qiymati o'rtasidagi farqlarning kvadratlari yig'indisini hisoblab chiqadi, bu kvadratlarning umumiy yig'indisi (kvadratlarning regressiya yig'indisi + kvadratlarning qoldiq yig'indisi) deb ataladi. Kvadratlarning umumiy yig'indisiga nisbatan kvadratlarning qoldiq yig'indisi qanchalik kichik bo'lsa, r2 aniqlash koeffitsienti shunchalik katta bo'ladi, bu regressiya tenglamasi o'zgaruvchilar orasidagi munosabatlarni qanchalik yaxshi tushuntirayotganini o'lchaydi.

E'tibor bering, regressiya tenglamasi tomonidan bashorat qilingan y qiymatlari, agar ular tenglamani aniqlash uchun ishlatilgan y qiymatlari oralig'idan tashqariga chiqsa, to'g'ri bo'lmasligi mumkin.

1-misol Nishab va Y-kesishma

LINEST((1;9;5;7);(0;4;2;3)) teng (2;1), qiyalik = 2 va y-kesish = 1 ga teng.

F va R2 statistikasidan foydalanish

Yuqori r2 qiymatiga ega bo'lgan natija tasodif tufayli yoki yo'qligini aniqlash uchun F statistikasidan foydalanishingiz mumkin. Agar F-kuzatilgan F-kritikdan katta bo'lsa, u holda o'zgaruvchilar o'rtasida bog'liqlik mavjud. F-kritikni har qanday ma'lumotnomadagi F-kritik qiymatlar jadvalidan olish mumkin matematik statistika. Bir tomonlama test yordamida ushbu qiymatni topish uchun Alfa qiymatini (Alfa qiymati kuchli munosabatlar mavjudligi haqida noto'g'ri xulosa chiqarish ehtimolini ko'rsatish uchun ishlatiladi) 0,05 ga teng va erkinlik darajalari soni uchun ( odatda v1 va v2 bilan belgilanadi), keling, v1 = k = 4 va v2 = n - (k + 1) = 11 - (4 + 1) = 6 ni qo'yaylik, bu erda k - o'zgaruvchilar soni va n - ma'lumotlar nuqtalari soni . Malumot jadvalidan F-kritik 4,53 ga teng. Kuzatilgan F-qiymati 459,753674 (bu qiymat biz tashlab ketgan misolda olingan), bu F-kritik qiymati 4,53 dan sezilarli darajada kattaroqdir. Shuning uchun, natijada regressiya tenglamasi kerakli natijani bashorat qilish uchun foydalidir.

Tuzilgan ekonometrik sifatni umumiy baholash uchun determinatsiya koeffitsienti, korrelyatsiya indeksi, o'rtacha nisbiy xato yaqinlashtirish, shuningdek, yordamida regressiya tenglamasining ahamiyatini tekshiradi F-Fisher mezoni. Ro'yxatda keltirilgan xususiyatlar juda universal bo'lib, ular chiziqli va chiziqli bo'lmagan modellar, shuningdek, ikki yoki undan ortiq omil o'zgaruvchilari bo'lgan modellar uchun ishlatilishi mumkin. Barcha sanab o'tilgan sifat ko'rsatkichlarini hisoblashda bir qator qoldiqlar hal qiluvchi rol o'ynaydi i, bu o'rganilayotgan xarakteristikaning haqiqiy (kuzatishlardan olingan) qiymatlaridan ayirish yo'li bilan hisoblanadi. y i model tenglamasi yordamida hisoblangan qiymatlar y ri.

Aniqlash koeffitsienti

modelda o'rganilayotgan belgi o'zgarishining qaysi nisbati hisobga olinganligini ko'rsatadi. Boshqacha qilib aytadigan bo'lsak, determinatsiya koeffitsienti o'rganilayotgan o'zgaruvchining o'zgarishining qaysi qismini faktor o'zgaruvchilari va o'rganilayotgan xarakteristikani bog'laydigan tanlangan turdagi funktsiyadan foydalangan holda modelga kiritilgan omil o'zgaruvchilaridagi o'zgarishlar asosida hisoblash mumkinligini ko'rsatadi. model tenglamasi.

Aniqlash koeffitsienti R 2 0 dan 1 gacha qiymatlarni qabul qilishi mumkin. Determinatsiya koeffitsienti qanchalik yaqin bo'lsa R 2 biriga, the yaxshiroq sifat modellar.

Korrelyatsiya indeksi Determinatsiya koeffitsientini bilib, osongina hisoblash mumkin:

Korrelyatsiya indeksi R modelda hisobga olingan omillar va o‘rganilayotgan o‘zgaruvchi o‘rtasidagi modelni qurishda tanlangan bog‘lanish turining yaqinligini tavsiflaydi. Chiziqli juftlik regressiyasida uning mutlaq qiymati juft korrelyatsiya koeffitsienti bilan mos keladi r(x, y), biz ilgari ko'rib chiqdik va o'rtasidagi chiziqli munosabatlarning yaqinligini tavsiflaydi x Va y. Korrelyatsiya indeksining qiymatlari, shubhasiz, 0 dan 1 gacha bo'lgan oraliqda joylashgan. Qiymat qanchalik yaqin bo'lsa R birlikka, tanlangan turdagi funksiya omil o'zgaruvchilari va o'rganilayotgan xarakteristikani qanchalik yaqin bog'lasa, model sifati shunchalik yaxshi bo'ladi.

(2.11)

foiz sifatida ifodalanadi va modelning aniqligini tavsiflaydi. Amaliy muammolarni hal qilishda modelning maqbul aniqligi aniq vaziyatni hisobga olgan holda iqtisodiy maqsadga muvofiqligini hisobga olgan holda aniqlanishi mumkin. Keng qo'llaniladigan mezon, agar o'rtacha nisbiy xatolik 15% dan kam bo'lsa, aniqlik qoniqarli deb hisoblanadi. Agar E rel.o'rtacha. 5% dan kam bo'lsa, unda model yuqori aniqlikka ega deb aytiladi. Tahlil va prognozlash uchun qoniqarsiz aniqlikka ega modellardan foydalanish tavsiya etilmaydi, ya'ni qachon E rel.o'rtacha. 15% dan ortiq.

Fisherning F testi regressiya tenglamasining ahamiyatini baholash uchun foydalaniladi. F-mezonining hisoblangan qiymati quyidagi munosabatdan aniqlanadi:

. (2.12)

Kritik qiymat F-mezonlar ma'lum bir ahamiyatlilik darajasidagi a va erkinlik darajasidagi jadvallardan aniqlanadi (siz Excelda FRIST funksiyasidan foydalanishingiz mumkin). Bu erda, avvalgidek, m- modelda hisobga olingan omillar soni; n- kuzatishlar soni. Agar hisoblangan qiymat kritik qiymatdan katta bo'lsa, model tenglamasi muhim hisoblanadi. Hisoblangan qiymat qanchalik baland bo'lsa F-mezon bo'lsa, modelning sifati shunchalik yaxshi bo'ladi.

Biz tuzgan chiziqli modelning sifat xususiyatlarini aniqlaylik 1-misol. 2-jadvaldagi ma'lumotlardan foydalanamiz. Aniqlash koeffitsienti:

Shu sababli, chiziqli model doirasida savdo hajmining 90,1% o'zgarishi havo haroratining o'zgarishi bilan izohlanadi.

Korrelyatsiya indeksi

.

Juftlangan chiziqli modeldagi korrelyatsiya indeksining qiymati, biz ko'rib turganimizdek, haqiqatan ham tegishli o'zgaruvchilar (sotish hajmi va harorat) o'rtasidagi korrelyatsiya koeffitsientiga mutlaq qiymatda tengdir. Olingan qiymat birlikka juda yaqin bo'lganligi sababli, o'rganilayotgan o'zgaruvchi (sotish hajmi) va omil o'zgaruvchisi (harorat) o'rtasida yaqin chiziqli bog'liqlik mavjud degan xulosaga kelishimiz mumkin.

Fisherning F testi

Kritik qiymat F cr a = 0,1 da; n 1 =1; n 2 =7-1-1=5 4,06 ga teng. Hisoblangan qiymat F-mezon jadvaldagidan kattaroq, shuning uchun model tenglamasi muhim.

Taxminan o'rtacha nisbiy xato

Tuzilgan chiziqli juftlashtirilgan regressiya modeli qoniqarsiz aniqlikka ega (>15%) va tahlil va prognozlash uchun foydalanish tavsiya etilmaydi.

Natijada, aksariyat statistik xarakteristikalar ular uchun mezonlarga javob berishiga qaramay, chiziqli juftlik regressiya modeli havo haroratiga qarab savdo hajmini bashorat qilish uchun mos emas. Kuzatish ma'lumotlariga ko'ra bu o'zgaruvchilar o'rtasidagi munosabatlarning chiziqli bo'lmagan tabiati 1-rasmda juda aniq ko'rinadi. Tahlil buni tasdiqladi.


MS Excel elektron jadval protsessorining “Ma’lumotlarni tahlil qilish” plaginining “Regressiya” asbobi yordamida empirik regressiya koeffitsientlarini b 0 , b 1 aniqlaymiz.

Koeffitsientlarni aniqlash algoritmi quyidagicha.

1. MS Excel elektron jadval protsessoriga dastlabki ma’lumotlarni kiriting.

2. Ma'lumotlarni tahlil qilish plaginini chaqiring (2-rasm).

3. Regression tahlil vositasini tanlang (3-rasm).

4. Regressiya oynasining mos o'rinlarini to'ldiring (4-rasm).

5. Regressiya oynasida OK tugmasini bosing va muammoni hal qilish protokolini oling (5-rasm)


3-rasm – Regressiya vositasini tanlash




4-rasm – Regressiya oynasi

5-rasm – Muammoni hal qilish protokoli

5-rasmdan empirik regressiya koeffitsientlari mos ravishda teng ekanligini ko'rish mumkin

b 0 = 223,

b1 = 0,0088.

Keyin oylik pensiya y qiymatini yashash minimumi qiymati bilan bog'laydigan juft chiziqli regressiya tenglamasi shaklga ega bo'ladi.

.(3.2)

Keyinchalik, vazifaga muvofiq, yashash qiymati x qiymati va oylik pensiya y qiymati o'rtasidagi statistik munosabatlarning yaqinligini baholash kerak. Ushbu baho korrelyatsiya koeffitsienti yordamida amalga oshirilishi mumkin. 5-rasmdagi ushbu koeffitsientning qiymati ko'p R sifatida belgilanadi va shunga mos ravishda 0,038 ga teng. Nazariy jihatdan bu koeffitsientning qiymati -1 dan +1 gacha bo'lganligi sababli, yashash qiymati x qiymati va oylik pensiya y qiymati o'rtasidagi statistik bog'liqlik muhim emas degan xulosaga kelishimiz mumkin.

5-rasmda keltirilgan "R - kvadrat" parametri korrelyatsiya koeffitsientining kvadrati bo'lib, uni aniqlash koeffitsienti deb ataladi. Ushbu koeffitsientning qiymati regressiya bilan izohlangan y bog'liq o'zgaruvchining dispersiya ulushini tavsiflaydi (tushuntiruvchi o'zgaruvchi x). Shunga ko'ra, 1- qiymat ekonometrik modelda hisobga olinmagan boshqa barcha izohlovchi o'zgaruvchilar ta'siridan kelib chiqqan y o'zgaruvchidagi dispersiya ulushini tavsiflaydi. 5-rasmdan ko'rinib turibdiki, hosil bo'lgan ekonometrik modelda hisobga olinmagan barcha izohli o'zgaruvchilarning ulushi taxminan 1 - 0,00145 = 0,998 yoki 99,8% ni tashkil qiladi.



Keyingi bosqichda topshiriqga muvofiq, egiluvchanlik koeffitsientidan foydalanib, tushuntirish o'zgaruvchisi x va bog'liq o'zgaruvchi y o'rtasidagi bog'liqlik darajasini aniqlash kerak. Juftlangan chiziqli regressiya modeli uchun elastiklik koeffitsienti quyidagicha aniqlanadi:

Shuning uchun, agar yashash qiymati 1% ga o'zgargan bo'lsa, oylik pensiya 0,000758% ga o'zgaradi.

. (3.4)

Buning uchun biz 1-jadvalning asl nusxasini ikkita ustun bilan to'ldiramiz, unda biz qaramlik (3.2) va farq qiymati yordamida hisoblangan qiymatlarni aniqlaymiz.

3.2-jadval. O'rtacha yaqinlashish xatosini hisoblash.

Keyin o'rtacha yaqinlashish xatosi

.

Amaliyotdan ma'lumki, o'rtacha yaqinlashish xatosining qiymati (12...15)% dan oshmasligi kerak.

Oxirgi bosqichda biz Fisherning F testi yordamida modellashtirishning statistik ishonchliligini baholaymiz. Buning uchun natijada olingan regressiya tenglamasining statistik ahamiyatsizligi haqida H 0 nol gipotezasini shartga muvofiq tekshiramiz:

agar ma'lum bir ahamiyatlilik darajasida a = 0,05 bo'lsa, F-mezonning nazariy (hisoblangan) qiymati uning F kritik qiymatidan (jadvalda) katta bo'lsa, unda nol gipoteza rad etiladi va natijada olingan regressiya tenglamasi muhim deb qabul qilinadi.

5-rasmdan F calc = 0,0058 ekanligi kelib chiqadi. F-kriteriyasining kritik qiymati FASTER statistik funksiyasi yordamida aniqlanadi (6-rasm). Funktsiyaning kirish parametrlari muhimlik darajasi (ehtimollik) va erkinlik darajalari soni 1 va 2. Juftlashgan regressiya modeli uchun erkinlik darajalari soni mos ravishda 1 (bitta izohlovchi o'zgaruvchi) va n-2 = 6 ga teng. -2=4.



6-rasm – FASTER statistik funksiya oynasi

6-rasmdan F-testining kritik qiymati 7,71 ekanligini ko'rish mumkin.

F hisoblangandan beri< F крит, то нулевая гипотеза не отвергается и полученное регрессионное уравнение статистически незначимо.

13. EXCEL yordamida ko'p regressiya modelini qurish.

Topshiriq variantiga muvofiq, statistik materiallardan foydalanish kerak.

1. Chiziqli ko‘p regressiya tenglamasini tuzing va uning parametrlarining iqtisodiy ma’nosini tushuntiring.

2. O'rtacha (umumiy) elastiklik koeffitsientlari yordamida omillar va hosil bo'lgan atribut o'rtasidagi bog'liqlikning yaqinligiga qiyosiy baho bering.

3. Regressiya koeffitsientlarining statistik ahamiyatini Student t-testi va F-testi yordamida tenglamaning ahamiyati haqidagi nol gipotezasi yordamida baholang.

4. Taxminan o'rtacha xatolikni aniqlash orqali tenglamaning sifatini baholang.

Juftlangan regressiya modelini qurish uchun dastlabki ma’lumotlar 3.3-jadvalda keltirilgan.

3.3-jadval. Dastlabki ma'lumotlar.

Sof daromad, million AQSh dollari Kapital aylanmasi, ml. AQSh dollari, x 1 Ishlatilgan kapital, ml. AQSh dollari x 2
6,6 6,9 83,6
2,7 93,6 25,4
1,6 10,0 6,4
2,4 31,5 12,5
3,3 36,7 14,3
1,8 13,8 6,5
2,4 64,8 22,7
1,6 30,4 15,8
1,4 12,1 9,3
0,9 31,3 18,9

Regressiya tenglamasini tuzish texnologiyasi 3.1-bandda tavsiflangan algoritmga o'xshaydi. Regressiya tenglamasini tuzish protokoli 7-rasmda keltirilgan.

NATIJALARNING XULOSASI
Regressiya statistikasi
Koʻplik R 0,901759207
R-kvadrat 0,813169667
Normallashtirilgan R-kvadrat 0,759789572
Standart xato 0,789962026
Kuzatishlar
Dispersiyani tahlil qilish
df XONIM F
Regressiya 9,50635999 15,23357468
Qolgan 0,624040003
Jami
Imkoniyatlar t-statistika
Y - chorraha 1,113140304 2,270238114
O'zgaruvchi X 1 -0,000592199 -0,061275574
O'zgaruvchi X 2 0,063902851 5,496523193

Rasm 7. Natijalarning chiqishi.



Saytda yangi

>

Eng mashhur