Uy Og'iz bo'shlig'i Korrelyatsiya koeffitsientlarining ahamiyatini qanday tekshirish mumkin. Test: Student f-testi yordamida regressiya va korrelyatsiya koeffitsientlarining ahamiyatini baholash

Korrelyatsiya koeffitsientlarining ahamiyatini qanday tekshirish mumkin. Test: Student f-testi yordamida regressiya va korrelyatsiya koeffitsientlarining ahamiyatini baholash

Mashq qilish. Viloyat hududlari uchun ma'lumotlar 199X uchun berilgan;
Mintaqa raqami Bir mehnatga layoqatli kishi uchun jon boshiga o'rtacha kunlik yashash minimumi, rub., X O'rtacha kunlik ish haqi, rub., da
1 78 133
2 82 148
3 87 134
4 79 154
5 89 162
6 106 195
7 67 139
8 88 158
9 73 152
10 87 162
11 76 159
12 115 173
Majburiy:
1. X dan y chiziqli juftlik regressiya tenglamasini tuzing.
2. Hisoblang chiziqli koeffitsient juft korrelyatsiya va o'rtacha yaqinlashish xatosi.
3. Regressiya va korrelyatsiya parametrlarining statistik ahamiyatini baholang.
4. Bashoratni bajaring ish haqi y aholi jon boshiga yashash minimumi x ning bashorat qilingan qiymati bilan, bu o'rtacha darajaning 107% ni tashkil etadi.
5. Prognoz xatosini va uning ishonch oralig'ini hisoblash orqali bashoratning to'g'riligini baholang.

Yechim kalkulyator yordamida toping.
Foydalanish grafik usuli .
Bu usul o'rganilayotganlar o'rtasidagi aloqa shaklini tasavvur qilish uchun ishlatiladi iqtisodiy ko'rsatkichlar. Buning uchun to'rtburchaklar koordinatalar tizimida grafik chiziladi, natijada Y atributining individual qiymatlari ordinatalar o'qi bo'ylab, X omil atributining individual qiymatlari abscissa o'qi bo'ylab chiziladi.
Effektiv va omil belgilarining nuqtalari to'plami deyiladi korrelyatsiya maydoni.
Korrelyatsiya maydoniga asoslanib, (umumiy aholi uchun) X va Y ning barcha mumkin bo'lgan qiymatlari o'rtasidagi munosabatlar chiziqli ekanligini taxmin qilish mumkin.
Chiziqli regressiya tenglamasi y = bx + a + e
Bu erda e - tasodifiy xato (og'ish, tebranish).
Tasodifiy xatoning mavjudligi sabablari:
1. Regressiya modeliga muhim izohli o'zgaruvchilarni kiritmaslik;
2. O‘zgaruvchilarning yig‘indisi. Masalan, jami iste'mol funktsiyasi - bu shaxslarning shaxsiy xarajatlar qarorlari yig'indisini umumiy ifodalashga urinish. Bu faqat turli xil parametrlarga ega bo'lgan individual munosabatlarning taxminiy ko'rinishi.
3. Model tuzilmasining noto'g'ri tavsifi;
4. Noto'g'ri funktsional spetsifikatsiya;
5. O'lchov xatolari.
Har bir aniq kuzatish i uchun e i og'ishlar tasodifiy va ularning namunadagi qiymatlari noma'lum bo'lganligi sababli:
1) x i va y i kuzatuvlariga ko'ra, faqat a va b parametrlarining taxminlarini olish mumkin
2) Regressiya modelining a va b parametrlarining baholari mos ravishda tabiatda tasodifiy bo'lgan a va b qiymatlaridir, chunki tasodifiy namunaga mos keladi;
Keyin taxmin qilingan regressiya tenglamasi (namunaviy ma'lumotlardan tuzilgan) y = bx + a + e ga o'xshaydi, bu erda e i - mos ravishda e i va va b xatolarining kuzatilgan qiymatlari (baxmalari) topilishi kerak bo'lgan regressiya modelining a va b parametrlari.
a va b parametrlarini baholash uchun - LSM (eng kichik kvadratlar) dan foydalaning.
Oddiy tenglamalar tizimi.
Bizning ma'lumotlarimiz uchun tenglamalar tizimi shaklga ega
Birinchi tenglamadan a-ni ifodalang va uni ikkinchi tenglamaga almashtiring
Biz b = 0,92, a = 76,98 ni olamiz
Regressiya tenglamasi:
y = 0,92 x + 76,98

1. Regressiya tenglamasining parametrlari.
Namuna vositalari.



Namuna farqlari:


standart og'ish


Korrelyatsiya koeffitsienti
Biz aloqaning yaqinligi ko'rsatkichini hisoblaymiz. Bunday ko'rsatkich selektiv chiziqli korrelyatsiya koeffitsienti bo'lib, u quyidagi formula bo'yicha hisoblanadi:

Chiziqli korrelyatsiya koeffitsienti -1 dan +1 gacha bo'lgan qiymatlarni oladi.
Xususiyatlar o'rtasidagi munosabatlar zaif yoki kuchli (yaqin) bo'lishi mumkin. Ularning mezonlari Chaddock shkalasi bo'yicha baholanadi:
0.1 < r xy < 0.3: слабая;
0.3 < r xy < 0.5: умеренная;
0.5 < r xy < 0.7: заметная;
0.7 < r xy < 0.9: высокая;
0.9 < r xy < 1: весьма высокая;
Bizning misolimizda o'rtacha kunlik ish haqi va aholi jon boshiga o'rtacha yashash darajasi o'rtasidagi bog'liqlik yuqori va to'g'ridan-to'g'ri.
1.2. Regressiya tenglamasi(regressiya tenglamasini baholash).

Chiziqli regressiya tenglamasi y = 0,92 x + 76,98
Tenglama koeffitsientlari chiziqli regressiya iqtisodiy ma'noga ega bo'lishi mumkin.
Koeffitsient b = 0,92 samarali indikatorning o'rtacha o'zgarishini (y birliklarida) uning o'lchov birligi uchun x omil qiymatining oshishi yoki kamayishi bilan ko'rsatadi. Ushbu misolda, 1 rub o'sishi bilan. jon boshiga kunlik yashash minimumi, o'rtacha kunlik ish haqi o'rtacha 0,92 ga oshadi.
a = 76,98 koeffitsienti rasmiy ravishda o'rtacha kunlik ish haqining bashorat qilingan darajasini ko'rsatadi, lekin faqat x=0 namunaviy qiymatlarga yaqin bo'lsa.
X ning mos keladigan qiymatlarini regressiya tenglamasiga almashtirish orqali har bir kuzatish uchun y(x) samarali indikatorining moslashtirilgan (bashorat qilingan) qiymatlarini aniqlash mumkin.
O'rtacha kunlik ish haqi va jon boshiga o'rtacha kunlik yashash darajasi o'rtasidagi bog'liqlik regressiya koeffitsienti b belgisini belgilaydi (agar > 0 - to'g'ridan-to'g'ri bog'liqlik, aks holda - teskari). Bizning misolimizda aloqa to'g'ridan-to'g'ri.
elastiklik koeffitsienti.
Effektiv atributga omillarning ta'sirini to'g'ridan-to'g'ri baholash uchun regressiya koeffitsientlaridan (b misolida) foydalanish maqsadga muvofiq emas, agar samarali ko'rsatkich y va omil atributi x o'lchov birliklarida farq mavjud bo'lsa.
Ushbu maqsadlar uchun elastiklik koeffitsientlari va beta koeffitsientlari hisoblanadi. Elastiklik koeffitsienti quyidagi formula bo'yicha topiladi:


U omil atributi x 1% ga o'zgarganda samarali atribut y o'rtacha necha foizga o'zgarishini ko'rsatadi. U omillarning tebranish darajasini hisobga olmaydi.
Elastiklik koeffitsienti 1 dan kam. Demak, agar aholi jon boshiga oʻrtacha kunlik yashash minimumi 1% ga oʻzgarsa, oʻrtacha kunlik ish haqi 1% dan kam oʻzgaradi. Boshqacha qilib aytganda, aholi jon boshiga yashash minimumi X ning o'rtacha kunlik ish haqiga Y ta'siri sezilarli emas.
Beta koeffitsienti uning o'rtacha qiymatining qaysi qismi bilan ko'rsatadi standart og'ish omil atributi o'zining standart og'ish qiymatiga doimiy darajada belgilangan qolgan mustaqil o'zgaruvchilar qiymati bilan o'zgarganda, natijada olingan atributning qiymati o'rtacha o'zgaradi:

Bular. ushbu ko'rsatkichning standart og'ish qiymatiga x ning oshishi o'rtacha kunlik ish haqining Y ning ushbu ko'rsatkichning 0,721 standart og'ishiga oshishiga olib keladi.
1.4. Taxminan xato.
Absolyut yaqinlashish xatosi yordamida regressiya tenglamasining sifatini baholaylik.


Xato 15% dan kam bo'lganligi sababli, bu tenglama regressiya sifatida ishlatilishi mumkin.
Aniqlash koeffitsienti.
(Ko'p) korrelyatsiya koeffitsientining kvadrati determinatsiya koeffitsienti deb ataladi, bu omil atributining o'zgarishi bilan izohlangan natijaviy atributning o'zgarishining nisbatini ko'rsatadi.
Ko'pincha, determinatsiya koeffitsientini talqin qilgan holda, u foiz sifatida ifodalanadi.
R2 = 0,722 = 0,5199
bular. 51,99% hollarda aholi jon boshiga yashash minimumi x o'zgarishi o'rtacha kunlik ish haqi y o'zgarishiga olib keladi. Boshqacha qilib aytganda, regressiya tenglamasini tanlashning aniqligi o'rtacha. Y o'rtacha kunlik ish haqining o'zgarishining qolgan 48,01% modelda hisobga olinmagan omillarga bog'liq.

x y x2 y2 x o y y(x) (y i -y cp) 2 (y-y(x)) 2 (x i -x cp) 2 |y - y x |:y
78 133 6084 17689 10374 148,77 517,56 248,7 57,51 0,1186
82 148 6724 21904 12136 152,45 60,06 19,82 12,84 0,0301
87 134 7569 17956 11658 157,05 473,06 531,48 2,01 0,172
79 154 6241 23716 12166 149,69 3,06 18,57 43,34 0,028
89 162 7921 26244 14418 158,89 39,06 9,64 11,67 0,0192
106 195 11236 38025 20670 174,54 1540,56 418,52 416,84 0,1049
67 139 4489 19321 9313 138,65 280,56 0,1258 345,34 0,0026
88 158 7744 24964 13904 157,97 5,06 0,0007 5,84 0,0002
73 152 5329 23104 11096 144,17 14,06 61,34 158,34 0,0515
87 162 7569 26244 14094 157,05 39,06 24,46 2,01 0,0305
76 159 5776 25281 12084 146,93 10,56 145,7 91,84 0,0759
115 173 13225 29929 19895 182,83 297,56 96,55 865,34 0,0568
1027 1869 89907 294377 161808 1869 3280,25 1574,92 2012,92 0,6902

2. Regressiya tenglamasining parametrlarini baholash.
2.1. Korrelyatsiya koeffitsientining ahamiyati.

Muhimlik darajasi a=0,05 va erkinlik darajasi k=10 bo'lgan Student jadvaliga ko'ra biz t kritikni topamiz:
t krit = (10;0,05) = 1,812
bu erda m = 1 - tushuntirish o'zgaruvchilar soni.
Agar t obs > t kritik bo'lsa, u holda korrelyatsiya koeffitsientining olingan qiymati muhim deb tan olinadi (korrelyatsiya koeffitsienti nolga teng degan nol gipoteza rad etiladi).
t obl > t krit ekan, korrelyatsiya koeffitsienti 0 ga teng degan gipotezani rad qilamiz. Boshqacha qilib aytganda, korrelyatsiya koeffitsienti statistik ahamiyatga ega.
Juftlangan chiziqli regressiyada t 2 r = t 2 b va keyin regressiya va korrelyatsiya koeffitsientlarining ahamiyati haqidagi gipotezalarni tekshirish muhimlik haqidagi gipotezani tekshirishga teng. chiziqli tenglama regressiya.

2.3. Regressiya koeffitsientlari baholarini aniqlashning to'g'riligini tahlil qilish.
Buzilishlar dispersiyasining xolis bahosi quyidagi qiymat hisoblanadi:


S 2 y = 157.4922 - tushuntirilmagan dispersiya (regressiya chizig'i atrofida bog'liq o'zgaruvchining tarqalishi o'lchovi).

12.5496 - baholashning standart xatosi (regressiyaning standart xatosi).
Sa- standart og'ish tasodifiy o'zgaruvchi a.


S b - tasodifiy miqdorning standart og'ishi b.


2.4. Bog'liq o'zgaruvchi uchun ishonch oraliqlari.
Tuzilgan modelga asoslangan iqtisodiy prognozlash o'zgaruvchilarning oldindan mavjud bo'lgan munosabatlari etakchi davr uchun ham saqlanib qolishini nazarda tutadi.
Natija atributining qaram o'zgaruvchisini bashorat qilish uchun modelga kiritilgan barcha omillarning bashoratli qiymatlarini bilish kerak.
Omillarning bashoratli qiymatlari modelga almashtiriladi va o'rganilayotgan ko'rsatkichning nuqta bashoratli baholari olinadi.
(a + bx p ± e)
Qayerda

95% jamlanadigan interval chegaralarini hisoblang mumkin bo'lgan qiymatlar Cheksiz miqdordagi kuzatishlar uchun Y va X p = 94

(76,98 + 0,92*94 ± 7,8288)
(155.67;171.33)
95% ehtimollik bilan cheksiz ko'p kuzatuvlar bilan Y qiymati topilgan intervallar chegarasidan tashqariga chiqmasligini kafolatlash mumkin.
2.5. Chiziqli regressiya tenglamasining koeffitsientlari bo'yicha gipotezalarni tekshirish.
1) t-statistika. Talaba mezoni.
Ayrim regressiya koeffitsientlarining nolga tengligi haqidagi H 0 gipotezasini (muqobil H 1 teng bo'lmagan holda) a=0,05 ahamiyatlilik darajasida tekshirib ko'raylik.
t krit = (10;0,05) = 1,812


3,2906 > 1,812 bo'lganligi sababli, regressiya koeffitsienti b ning statistik ahamiyati tasdiqlanadi (biz bu koeffitsient nolga teng degan gipotezani rad qilamiz).


3,1793 > 1,812 dan boshlab a regressiya koeffitsientining statistik ahamiyati tasdiqlanadi (biz bu koeffitsient nolga teng degan gipotezani rad qilamiz).
Regressiya tenglamasining koeffitsientlari uchun ishonch oralig'i.
Keling, aniqlaymiz ishonch oraliqlari 95% ishonchliligi bilan regressiya koeffitsientlari quyidagicha bo'ladi:
(b - t krit S b; b + t krit S b)
(0.9204 - 1.812 0.2797; 0.9204 + 1.812 0.2797)
(0.4136;1.4273)

(a - tlang=SV>a)
(76.9765 - 1.812 24.2116; 76.9765 + 1.812 24.2116)
(33.1051;120.8478)
95% ehtimollik bilan, ushbu parametrning qiymati topilgan intervalda yotadi, deb bahslashish mumkin.
2) F-statistika. Fisher mezoni.
Regressiya modelining ahamiyati Fisher F-testi yordamida tekshiriladi, uning hisoblangan qiymati o'rganilayotgan ko'rsatkichning kuzatuvlarining dastlabki qatorlari dispersiyasining nisbati va qoldiq ketma-ketligi dispersiyasining xolis bahosi sifatida topiladi. bu model.
Agar k1=(m) va k2=(n-m-1) erkinlik darajalari bilan hisoblangan qiymat berilgan ahamiyatlilik darajasida jadval qiymatidan katta bo’lsa, model muhim hisoblanadi.

bu yerda m – modeldagi omillar soni.
Baho statistik ahamiyatga ega juft chiziqli regressiya quyidagi algoritmga muvofiq amalga oshiriladi:
1. Tenglama yaxlit statistik jihatdan ahamiyatsiz degan nol gipoteza ilgari suriladi: H 0: R 2 =0 a ahamiyatlilik darajasida.
2. Keyin F-mezonining haqiqiy qiymatini aniqlang:


bu yerda juft regressiya uchun m=1.
3. Jadval qiymati uchun erkinlik darajalari sonini hisobga olgan holda, ma'lum bir muhimlik darajasi uchun Fisher taqsimot jadvallaridan aniqlanadi. Umumiy hisob kvadratchalar (kattaroq dispersiya) 1 ga teng va chiziqli regressiyada kvadratlarning qoldiq yig'indisi (pastki dispersiya) erkinlik darajalari soni n-2 ga teng.
4. Agar F-mezonining haqiqiy qiymati jadval qiymatidan kichik bo'lsa, unda ular nol gipotezani rad etishga hech qanday sabab yo'qligini aytishadi.
Aks holda, nol gipoteza rad etiladi va butun tenglamaning statistik ahamiyati haqidagi muqobil gipoteza (1-a) ehtimollik bilan qabul qilinadi.
Erkinlik darajalari k1=1 va k2=10 bo'lgan mezonning jadval qiymati, Fkp = 4,96
F > Fkp ning haqiqiy qiymati bo'lgani uchun aniqlash koeffitsienti statistik ahamiyatga ega (Regressiya tenglamasining topilgan bahosi statistik jihatdan ishonchli).

Bosqich 3. Ma’lumotlar orasidagi bog‘lanishni topish

Chiziqli korrelyatsiya

Hodisalar o'rtasidagi munosabatlarni o'rganish vazifasining oxirgi bosqichi ko'rsatkichlar bo'yicha munosabatlarning yaqinligini baholashdir. korrelyatsiya. Bu bosqich omil va natijaviy belgilar o'rtasidagi bog'liqlikni aniqlash, demak, o'rganilayotgan hodisaga tashxis qo'yish va bashorat qilish imkoniyati uchun juda muhimdir.

Diagnostika(yunon tilidan. tashxisni tan olish) - ob'ekt yoki hodisani har tomonlama o'rganish asosida uning mohiyati va holatining xususiyatlarini aniqlash.

Prognoz(yunoncha. prognoz bashorat, bashorat qilish) — hodisaning kelajakdagi holati (ob-havo prognozi, saylov natijalari va boshqalar) haqidagi har qanday aniq bashorat, hukm. Prognoz - bu o'rganilayotgan tizim, ob'ekt yoki hodisaning kelajakdagi ehtimoliy holati va ushbu holatni tavsiflovchi ko'rsatkichlar haqidagi ilmiy asoslangan gipoteza. Prognozlash - prognozni ishlab chiqish, maxsus Ilmiy tadqiqot hodisaning rivojlanishining o'ziga xos istiqbollari.

Korrelyatsiya ta'rifini eslang:

Korrelyatsiya- tasodifiy o'zgaruvchilar orasidagi bog'liqlik, bir o'zgaruvchining taqsimlanishi boshqa o'zgaruvchining qiymatiga bog'liqligi bilan ifodalanadi.

Korrelyatsiya nafaqat miqdoriy, balki sifat belgilari o'rtasida ham kuzatiladi. Mavjud turli yo'llar bilan va aloqalarning yaqinligini baholash ko'rsatkichlari. Biz faqat diqqatimizni qaratamiz chiziqli juft korrelyatsiya koeffitsienti , bu tasodifiy o'zgaruvchilar o'rtasida chiziqli munosabatlar mavjud bo'lganda qo'llaniladi. Amalda, ko'pincha teng bo'lmagan o'lchamdagi tasodifiy o'zgaruvchilar orasidagi bog'lanish darajasini aniqlash kerak bo'ladi, shuning uchun bu bog'liqlikning qandaydir o'lchovsiz xarakteristikasiga ega bo'lish maqsadga muvofiqdir. Bunday xarakteristika (bog'lanish o'lchovi) chiziqli korrelyatsiya koeffitsienti hisoblanadi rxy, bu formula bilan aniqlanadi

Qayerda , .

va ni belgilab, korrelyatsiya koeffitsientini hisoblash uchun quyidagi ifodani olishingiz mumkin

.

Agar biz kontseptsiyani kiritsak normallashtirilgan og'ish , bu korrelyatsiya qilingan qiymatlarning o'rtacha qiymatdan standart og'ishning kasrlarida og'ishini ifodalaydi:



u holda korrelyatsiya koeffitsientining ifodasi shaklni oladi

.

Agar korrelyatsiya koeffitsienti hisoblash jadvalidagi dastlabki tasodifiy o'zgaruvchilarning yakuniy qiymatlari asosida hisoblansa, u holda korrelyatsiya koeffitsienti formula bo'yicha hisoblanishi mumkin.

.

Chiziqli korrelyatsiya koeffitsientining xossalari:

1). Korrelyatsiya koeffitsienti o'lchovsiz kattalikdir.

2). |r| £ 1 yoki.

3). , a,b= const, - X va Y tasodifiy o'zgaruvchilarning barcha qiymatlari doimiyga ko'paytirilsa (yoki bo'linsa) korrelyatsiya koeffitsientining qiymati o'zgarmaydi.

4). , a,b= const, - X va Y tasodifiy o'zgaruvchilarning barcha qiymatlari doimiy qiymatga oshirilsa (yoki kamaytirilsa) korrelyatsiya koeffitsienti qiymati o'zgarmaydi.

5). Korrelyatsiya koeffitsienti va regressiya koeffitsienti o'rtasida bog'liqlik mavjud:

Korrelyatsiya koeffitsientlarining qiymatlarini quyidagicha talqin qilish mumkin:

Muloqotning yaqinligini baholashning miqdoriy mezonlari:

Prognostik maqsadlarda |r| bilan miqdorlar > 0,7.

Korrelyatsiya koeffitsienti mavjud degan xulosaga kelishimizga imkon beradi chiziqli bog'liqlik ikkita tasodifiy o'zgaruvchi o'rtasida, lekin o'zgaruvchilardan qaysi biri ikkinchisida o'zgarishga olib kelishini ko'rsatmaydi. Aslida, ikkita tasodifiy o'zgaruvchi o'rtasidagi bog'liqlik o'zgaruvchilarning o'zlari o'rtasida sababiy bog'liqliksiz mavjud bo'lishi mumkin, chunki ikkala tasodifiy o'zgaruvchining o'zgarishi uchinchining o'zgarishi (ta'siri) tufayli yuzaga kelishi mumkin.

Korrelyatsiya koeffitsienti rxy ko'rib chiqilayotgan tasodifiy o'zgaruvchilarga nisbatan simmetrikdir X Va Y. Demak, korrelyatsiya koeffitsientini aniqlash uchun kattaliklarning qaysi biri mustaqil, qaysi biri bog'liq ekanligi mutlaqo befarq bo'ladi.

Korrelyatsiya koeffitsientining ahamiyati

Hatto uchun mustaqil miqdorlar o'lchov natijalarining tasodifiy tarqalishi yoki tasodifiy o'zgaruvchilarning kichik namunasi tufayli korrelyatsiya koeffitsienti nolga teng bo'lmasligi mumkin. Shuning uchun korrelyatsiya koeffitsientining ahamiyatini tekshirish kerak.

Chiziqli korrelyatsiya koeffitsientining ahamiyati asosida tekshiriladi Talabaning t-testi :

.

Agar t > t cr(P, n-2), u holda chiziqli korrelyatsiya koeffitsienti muhim va shuning uchun statistik bog'liqlik ham muhimdir X Va Y.

.

Hisoblash qulayligi uchun korrelyatsiya koeffitsientlarining ishonch chegaralari qiymatlari jadvallari. boshqa raqam erkinlik darajalari f = n–2 (ikki dumli test) va turli darajadagi ahamiyatlilik a= 0,1; 0,05; 0,01 va 0,001. Agar hisoblangan korrelyatsiya koeffitsienti berilgan uchun korrelyatsiya koeffitsientining ishonch chegarasi qiymatidan oshsa, korrelyatsiya ahamiyatli deb hisoblanadi. f Va a.

Katta uchun n Va a= 0,01 korrelyatsiya koeffitsientining ishonch chegarasining qiymati taxminiy formula yordamida hisoblanishi mumkin

.

Bir necha bor ta'kidlanganidek, o'rganilayotgan o'zgaruvchilar o'rtasida korrelyatsiya mavjudligi yoki yo'qligi to'g'risida statistik xulosaga kelish uchun tanlanma korrelyatsiya koeffitsientining ahamiyatini tekshirish kerak. Statistik xususiyatlarning ishonchliligi, shu jumladan korrelyatsiya koeffitsienti tanlama hajmiga bog'liq bo'lganligi sababli, korrelyatsiya koeffitsienti qiymati butunlay tanlamadagi tasodifiy tebranishlar bilan bog'liq bo'lgan vaziyat yuzaga kelishi mumkin. hisoblangan. O'zgaruvchilar o'rtasidagi sezilarli munosabat bilan korrelyatsiya koeffitsienti noldan sezilarli darajada farq qilishi kerak. Agar o'rganilayotgan o'zgaruvchilar o'rtasida korrelyatsiya bo'lmasa, u holda umumiy populyatsiyaning korrelyatsiya koeffitsienti nolga teng. Amaliy tadqiqotlarda, qoida tariqasida, ular tanlab kuzatishlarga asoslanadi. Har qanday statistik xarakteristikalar singari, namunaviy korrelyatsiya koeffitsienti ham tasodifiy o'zgaruvchi, ya'ni uning qiymatlari tasodifiy bir xil nomdagi umumiy populyatsiya parametri atrofida tarqaladi (korrelyatsiya koeffitsientining haqiqiy qiymati). O'zgaruvchilar o'rtasida korrelyatsiya bo'lmasa, ularning umumiy populyatsiyadagi korrelyatsiya koeffitsienti nolga teng. Ammo tarqalishning tasodifiy tabiati tufayli, ushbu populyatsiyadan olingan namunalar bo'yicha hisoblangan ba'zi korrelyatsiya koeffitsientlari noldan farq qiladigan vaziyatlar tubdan mumkin.

Kuzatilgan farqlarni tanlamadagi tasodifiy tebranishlar bilan bog'lash mumkinmi yoki ular o'zgaruvchilar o'rtasidagi munosabatlarni shakllantirish shartlarining sezilarli o'zgarishini aks ettiradimi? Agar namunaviy korrelyatsiya koeffitsientining qiymatlari tarqalish zonasiga tushsa,

indikatorning tasodifiy tabiati tufayli, bu munosabatlarning yo'qligining isboti emas. Bu holatda eng ko'p aytish mumkin bo'lgan narsa, kuzatuv ma'lumotlari o'zgaruvchilar o'rtasidagi munosabatlarning yo'qligini inkor etmaydi. Ammo agar tanlama korrelyatsiya koeffitsientining qiymati ko'rsatilgan tarqalish zonasidan tashqarida bo'lsa, u noldan sezilarli darajada farq qiladi degan xulosaga keladi va biz o'zgaruvchilar orasida statistik qiymatga ega deb taxmin qilishimiz mumkin. muhim aloqa. Turli statistik ma'lumotlarni taqsimlashga asoslangan ushbu muammoni hal qilish uchun foydalaniladigan mezon muhimlik mezoni deb ataladi.

Muhimlikni tekshirish jarayoni B nol gipotezasini shakllantirishdan boshlanadi umumiy ko'rinish bu tanlov parametri va populyatsiya parametri o'rtasida sezilarli farqlar yo'qligidadir. Muqobil gipoteza shundaki, bu parametrlar o'rtasida sezilarli farqlar mavjud. Masalan, umumiy populyatsiyada korrelyatsiyani tekshirishda nol gipoteza haqiqiy korrelyatsiya koeffitsienti nolga teng bo'ladi.Agar test natijasida nol gipoteza qabul qilinishi mumkin emasligi aniqlansa, u holda tanlanma korrelyatsiya koeffitsienti bo'ladi. noldan sezilarli darajada farq qiladi (nol gipoteza rad etiladi va muqobil qabul qilinadi Boshqacha qilib aytganda, umumiy populyatsiyadagi korrelyatsiyasiz tasodifiy o'zgaruvchilarning taxmini asossiz deb tan olinishi kerak. Va aksincha, agar nol gipoteza asosida qabul qilingan bo'lsa. ahamiyatlilik mezoni, ya'ni tasodifiy tarqalishning ruxsat etilgan zonasida joylashgan bo'lsa, umumiy populyatsiyada korrelyatsiya qilinmagan o'zgaruvchilarning taxminini shubhali deb hisoblash uchun hech qanday sabab yo'q.

Muhimlik testida tadqiqotchi a ahamiyatlilik darajasini belgilaydi, bu esa juda kamdan-kam hollarda xato xulosalar chiqarishga amaliy ishonch beradi. Muhimlik darajasi nol gipoteza haqiqatda haqiqat bo'lgan paytda rad etilishi ehtimolini ifodalaydi. Bu ehtimolni imkon qadar kichik tanlash mantiqiy ekanligi aniq.

Populyatsiya parametrining xolis bahosi bo'lgan namunaviy xarakteristikaning taqsimlanishi ma'lum bo'lsin. Tanlangan ahamiyatlilik darajasi a ushbu taqsimotning egri ostidagi soyali joylarga mos keladi (24-rasmga qarang). Tarqatish egri chizig'i ostidagi soyasiz maydon ehtimollikni aniqlaydi.Soyali maydonlar ostidagi abtsissadagi segmentlarning chegaralari kritik qiymatlar deb ataladi va segmentlarning o'zi kritik mintaqani yoki gipotezani rad etish mintaqasini tashkil qiladi.

Gipotezani tekshirish protsedurasida kuzatishlar natijalari bo'yicha hisoblangan namunaviy xarakteristika tegishli kritik qiymat bilan taqqoslanadi. Bunday holda, bir tomonlama va ikki tomonlama tanqidiy hududlarni farqlash kerak. Kritik mintaqani ko'rsatish shakli muammoni shakllantirishga bog'liq statistik o'rganish. Namuna parametri va populyatsiya parametrini solishtirganda ikki tomonlama tanqidiy mintaqa zarur bo'ladi.

ular orasidagi nomuvofiqlikning mutlaq qiymatini baholash talab etiladi, ya'ni o'rganilayotgan qiymatlar orasidagi ijobiy va salbiy farqlar qiziqish uyg'otadi. Bitta qiymat boshqasidan o'rtacha kattaroq yoki kamroq ekanligiga ishonch hosil qilish kerak bo'lganda, bir tomonlama tanqidiy mintaqa (o'ng yoki chap qo'l) ishlatiladi. Ko'rinib turibdiki, bir xil tanqidiy qiymat uchun bir tomonlama kritik mintaqadan foydalanishda ahamiyat darajasi ikki tomonlama foydalanishga qaraganda kamroq.

Guruch. 24. Nol gipotezani tekshirish

Agar namunaviy xarakteristikaning taqsimlanishi simmetrik bo'lsa, u holda ikki tomonlama tanqidiy mintaqaning ahamiyatlilik darajasi a, bir tomonlama tanqidiy mintaqa esa y ga teng (24-rasmga qarang). Biz muammoning umumiy formulasi bilan cheklanamiz. Tekshiruvning nazariy asoslanishi bilan batafsilroq statistik farazlar da topish mumkin maxsus adabiyot. Quyida biz faqat muhimlik mezonlarini ko'rsatamiz turli protseduralar ularning qurilishida to'xtamasdan.

Juftlik korrelyatsiya koeffitsientining ahamiyatini tekshirish orqali o'rganilayotgan hodisalar o'rtasida korrelyatsiya mavjudligi yoki yo'qligi aniqlanadi. Agar bog'lanish bo'lmasa, populyatsiyaning korrelyatsiya koeffitsienti nolga teng.Tekshirish jarayoni nol va muqobil gipotezalarni shakllantirishdan boshlanadi:

Namuna korrelyatsiya koeffitsienti orasidagi farq ahamiyatsiz,

Ularning orasidagi farq sezilarli va shuning uchun o'zgaruvchilar o'rtasida ular sezilarli munosabatga ega. Muqobil gipotezadan kelib chiqadiki, ikki tomonlama tanqidiy mintaqadan foydalanish kerak.

8.1-bo'limda ma'lum taxminlarga ko'ra, tanlanma korrelyatsiya koeffitsienti Talabaning erkinlik darajalari bilan taqsimlanishiga bo'ysunadigan tasodifiy o'zgaruvchi bilan bog'liqligi allaqachon aytib o'tilgan. Namuna natijalari bo'yicha hisoblangan statistik ma'lumotlar

berilgan muhimlik darajasi a va erkinlik darajalari uchun Student taqsimot jadvalidan aniqlangan kritik qiymat bilan solishtiriladi. Sinovni qo'llash qoidasi quyidagicha: agar u holda a ahamiyatlilik darajasidagi nol gipoteza rad etilsa, ya'ni o'zgaruvchilar o'rtasidagi munosabatlar muhim; agar u holda a ahamiyatlilik darajasidagi nol gipoteza qabul qilinadi. Qiymatning dan og'ishi tasodifiy o'zgarish bilan bog'liq bo'lishi mumkin. Ushbu namunalar ko'rib chiqilayotgan gipotezani juda mumkin va ishonchli deb tavsiflaydi, ya'ni aloqaning yo'qligi haqidagi gipoteza e'tiroz bildirmaydi.

Agar statistik ma'lumotlar o'rniga, agar biz talaba taqsimotining kvantillari orqali aniqlanishi mumkin bo'lgan korrelyatsiya koeffitsientining kritik qiymatlaridan foydalansak, gipotezani tekshirish tartibi ancha soddalashtirilgan bo'ladi.

Kritik qiymatlarning batafsil jadvallari mavjud bo'lib, ulardan ko'chirma ushbu kitobning Ilovasida keltirilgan (6-jadvalga qarang). Bu holatda gipotezani sinab ko'rish qoidasi quyidagicha: agar u holda biz o'zgaruvchilar o'rtasidagi bog'liqlik muhim ekanligini ta'kidlashimiz mumkin. Agar shunday bo'lsa, biz kuzatishlar natijalarini aloqaning yo'qligi haqidagi gipotezaga mos keladigan deb hisoblaymiz.

4.1-bo'limda keltirilgan ma'lumotlarga ko'ra, mehnat unumdorligining ishlarni mexanizatsiyalash darajasidan mustaqilligi haqidagi gipotezani sinab ko'raylik. Ilgari, (8.38) tomonidan biz olishimiz hisoblangan

Talabalar uchun taqsimot jadvaliga ko'ra biz ushbu statistikaning kritik qiymatini topamiz: Biz nol gipotezani rad etganimiz sababli, faqat 5% hollarda xatoga yo'l qo'yamiz.

Agar biz mos keladigan jadvalda topilgan korrelyatsiya koeffitsientining kritik qiymati bilan solishtirsak, xuddi shunday natijaga erishamiz

erkinlik darajalari bilan taqsimotga ega. Bundan tashqari, muhimlikni tekshirish tartibi avvalgisiga o'xshash - mezon yordamida amalga oshiriladi.

Misol

Hodisalarni iqtisodiy tahlil qilish asosida biz umumiy aholida mehnat unumdorligi va ishlarni mexanizatsiyalash darajasi o'rtasida mustahkam bog'liqlik borligini taxmin qilamiz. Keling, masalan, . Bu holatda muqobil sifatida biz gipotezani ilgari sura olamiz, chunki namuna korrelyatsiya koeffitsienti Shunday qilib, biz bir tomonlama kritik mintaqadan foydalanishimiz kerak. (8.40) dan shunday xulosa kelib chiqadi

Olingan qiymat kritik qiymat bilan taqqoslanadi

Qisman korrelyatsiya koeffitsientlarining ahamiyati xuddi shunday tarzda tekshiriladi. Faqat erkinlik darajalari soni o'zgaradi, bu esa tushuntirish o'zgaruvchilari soniga teng bo'ladi. Formula bo'yicha hisoblangan statistik qiymat

a ahamiyatlilik darajasida taqsimot jadvalidan topilgan a kritik qiymat va erkinlik darajalari soni bilan solishtiriladi Qisman korrelyatsiya koeffitsientining ahamiyati haqidagi gipotezani qabul qilish yoki rad etish yuqorida bayon qilingan qoidaga muvofiq amalga oshiriladi. Muhimlikni tekshirish (8.39) ga muvofiq korrelyatsiya koeffitsientining kritik qiymatlari, shuningdek -Fisher transformatsiyasi (8.40) yordamida ham amalga oshirilishi mumkin.

Misol

Keling, tekshiramiz statistik ishonchlilik 4.5-bo'limda hisoblangan qisman korrelyatsiya koeffitsientlari, ahamiyatlilik darajasida Quyida qisman korrelyatsiya koeffitsientlari bilan bir qatorda statistik ma'lumotlarning tegishli hisoblangan va kritik qiymatlari berilgan.

Koeffitsientlarning ahamiyati haqidagi gipoteza qabul qilinganda, ishchilarning o'rtacha yoshi (va muvofiqlikning o'rtacha foizi) ta'sirini hisobga olmaganda, ishlarni mexanizatsiyalash darajasi mehnat unumdorligiga sezilarli ta'sir qiladi degan xulosaga kelamiz. me'yorlar bilan). Boshqa koeffitsientlarning noldan farqi

Qisman korrelyatsiya namunadagi tasodifiy tebranishlar bilan bog'liq bo'lishi mumkin va shuning uchun biz ulardan tegishli o'zgaruvchilarning qisman ta'siri haqida aniq bir narsa deya olmaymiz.

Ko'p korrelyatsiya koeffitsientining ahamiyati koeffitsientning ahamiyatini tekshirish protsedurasi natijasi bilan baholanadi. ko'p aniqlik. Buni keyingi bobda batafsilroq muhokama qilamiz.

Ko'pincha savol qiziqtiradi: ikkita korrelyatsiya koeffitsienti bir-biridan sezilarli darajada farq qiladimi? Ushbu gipotezani sinab ko'rishda bir hil populyatsiyalarning bir xil xususiyatlari hisobga olinadi; ma'lumotlar natijalardir mustaqil testlar; bir xil turdagi korrelyatsiya koeffitsientlari qo'llaniladi, ya'ni bir xil sonli o'zgaruvchilarni hisobga olmaganda yoki juft korrelyatsiya koeffitsientlari yoki qisman korrelyatsiya koeffitsientlari.

Korrelyatsiya koeffitsientlari hisoblangan ikkita namunaning hajmlari har xil bo'lishi mumkin. Nol gipoteza: ya'ni ko'rib chiqilayotgan ikki populyatsiyaning korrelyatsiya koeffitsientlari tengdir. Muqobil gipoteza: Muqobil gipoteza ikki tomonlama tanqidiy mintaqadan foydalanish kerakligini anglatadi. Boshqacha qilib aytganda, farq noldan sezilarli darajada farq qiladimi yoki yo'qligini tekshirishingiz kerak.Keling, taxminan normal taqsimotga ega bo'lgan statistik ma'lumotlardan foydalanamiz:

bu yerda - natijalari - korrelyatsiya koeffitsientlarining transformatsiyalari - tanlanma kattaliklari. Sinov qoidasi: agar u holda gipoteza rad etilsa; agar gipoteza qabul qilingan bo'lsa.

Agar qabul qilinsa, qiymat

(8.6) yordamida qayta hisoblashdan keyin korrelyatsiya koeffitsientining umumiy bahosi bo'lib xizmat qiladi Keyinchalik, gipotezani statistika yordamida tekshirish mumkin.

normal taqsimotga ega.

Misol

Mamlakatning turli hududlarida joylashgan bir xil sanoat korxonalarida mehnat unumdorligi va ishlarni mexanizatsiyalash darajasi o'rtasidagi bog'liqlikning qattiqligi har xil yoki yo'qligini aniqlash talab etilsin. Ikki viloyatda joylashgan korxonalarni solishtiramiz. Ulardan biri uchun korrelyatsiya koeffitsienti tanlanma hajmidan hisoblansin (4.1-bo'limga qarang). Hajmi namunasidan hisoblangan Boshqa tuman uchun

Ikkala korrelyatsiya koeffitsientini -qiymatlarga aylantirgandan so'ng, X statistik qiymatini (8.42) yordamida hisoblaymiz:

At statistik ma'lumotlarning tanqidiy qiymati Shunday qilib, gipoteza qabul qilinadi, ya'ni mavjud namunalar asosida korrelyatsiya koeffitsientlari o'rtasida sezilarli farqni aniqlay olmaymiz. Bunday holda, ikkala korrelyatsiya koeffitsienti ham muhimdir.

(8.43) va (8.6) dan foydalanib, biz ikkita mintaqa uchun korrelyatsiya koeffitsientining umumiy bahosini olamiz:

Nihoyat, statistik ma'lumotlar yordamida korrelyatsiya koeffitsientining umumiy bahosi noldan sezilarli darajada farq qiladimi yoki yo'qmi gipotezani tekshiramiz (8.44):

Qachondan beri biz aholining umumiy sonida mehnat unumdorligi va ishlarni mexanizatsiyalash darajasi o'rtasida sezilarli bog'liqlik borligini aytishimiz mumkin.

X mezonidan turli usullarda foydalanish mumkin. Shunday qilib, tumanlar o'rniga turli tarmoqlarni ko'rib chiqish mumkin, masalan, ikki xil tarmoqqa tegishli korxonalarning iqtisodiy ko'rsatkichlari o'rtasidagi o'rganilayotgan bog'lanishlar mustahkamligidagi farqlar muhim yoki muhim emasligini aniqlash kerak bo'lganda.

Ikkita hajm namunasi asosida mehnat unumdorligi va ikkita sanoatga (ikki umumiy populyatsiyaga) tegishli korxonalarda ishlarni mexanizatsiyalash darajasi o'rtasidagi bog'liqlikning yaqinligini tavsiflovchi korrelyatsiya koeffitsientlari hisoblansin. (8.42) ga binoan biz olamiz

Chunki biz nol gipotezani rad etamiz. Binobarin, turli tarmoqlarga mansub korxonalarda mehnat unumdorligi va ishlarni mexanizatsiyalash darajasi o'rtasidagi bog'liqlikning yaqinligida sezilarli farqlar mavjudligini ta'kidlash mumkin. Biz ushbu misolni 8.7-bo'limda davom ettiramiz, u erda ikkita populyatsiya uchun tuzilgan regressiya chiziqlarini taqqoslaymiz.

Yuqoridagi misollarni tahlil qilib, biz taqqoslangan korrelyatsiya koeffitsientlari o'rtasidagi faqat mutlaq farqni hisobga olishiga amin bo'ldik.

(namuna o'lchamlari ikkala holatda ham bir xil) bu farqning ahamiyatini tekshirmasdan noto'g'ri xulosalar chiqarishga olib keladi. Bu korrelyatsiya koeffitsientlarini solishtirishda statistik mezonlardan foydalanish zarurligini tasdiqlaydi.

Ikki korrelyatsiya koeffitsientini solishtirish tartibini umumlashtirish mumkin Ko'proq yuqoridagi shartlarga muvofiq koeffitsientlar. y o'zgaruvchilar orasidagi korrelyatsiya koeffitsientlarining tengligi haqidagi gipoteza quyidagicha ifodalanadi: dan hajm namunalaridan hisoblangan korrelyatsiya koeffitsientlari asosida tekshiriladi. populyatsiyalar. korrelyatsiya koeffitsientlari -qiymatlarga qayta hisoblab chiqiladi: yildan beri umumiy holat noma'lum bo'lsa, biz uning bahosini (8.43) ning umumlashtirilishi bo'lgan formula bo'yicha topamiz.

KURS ISHI

Mavzu: Korrelyatsiya tahlili

Kirish

1. Korrelyatsiya tahlili

1.1 Korrelyatsiya tushunchasi

1.2 Umumiy tasnif korrelyatsiyalar

1.3 Korrelyatsiya maydonlari va ularni qurish maqsadi

1.4 Bosqichlar korrelyatsiya tahlili

1.5 Korrelyatsiya koeffitsientlari

1.6 Normallashtirilgan Bravais-Pirson korrelyatsiya koeffitsienti

1.7 koeffitsienti daraja korrelyatsiyasi Spearman

1.8 Korrelyatsiya koeffitsientlarining asosiy xossalari

1.9 Korrelyatsiya koeffitsientlarining ahamiyatini tekshirish

1.10 Tanqidiy qadriyatlar juft korrelyatsiya koeffitsienti

2. Ko'p o'lchovli tajribani rejalashtirish

2.1 Muammoning holati

2.2 Rejaning markazini (asosiy daraja) va omillarning o'zgaruvchanlik darajasini aniqlash

2.3 Rejalashtirish matritsasini qurish

2.4 Dispersiyaning bir xilligini va turli seriyalardagi o'lchovlarning teng aniqligini tekshirish

2.5 Regressiya tenglamasining koeffitsientlari

2.6 Qayta ishlab chiqarish dispersiyasi

2.7 Regressiya tenglamasi koeffitsientlarining ahamiyatini tekshirish

2.8 Regressiya tenglamasining adekvatligini tekshirish

Xulosa

Adabiyotlar ro'yxati

KIRISH

Eksperimentni rejalashtirish - bu eksperimental tadqiqotlarni oqilona tashkil etish usullarini o'rganadigan matematik va statistik intizom - dan optimal tanlov o'rganilayotgan omillar va natijalarni tahlil qilish usullariga uning maqsadiga muvofiq eksperimentning haqiqiy rejasini belgilash. Eksperimentni rejalashtirishning boshlanishi ingliz statisti R. Fisherning (1935) ishlari bilan qo'yilgan bo'lib, u ratsional eksperimentni rejalashtirish o'lchov natijalarini optimal qayta ishlashdan ko'ra, taxminlarning aniqligida hech qanday muhim foyda keltirmasligini ta'kidlagan. 20-asrning 60-yillarida bor edi zamonaviy nazariya eksperimentni rejalashtirish. Uning usullari funksiyalarni yaqinlashtirish nazariyasi va matematik dasturlash bilan chambarchas bog'liq. Keng toifadagi modellar uchun optimal rejalar tuziladi va ularning xususiyatlari o'rganiladi.

Tajribani rejalashtirish - belgilangan talablarga javob beradigan eksperiment rejasini tanlash, eksperiment strategiyasini ishlab chiqishga qaratilgan harakatlar majmui (aprior ma'lumot olishdan boshlab, ishlaydigan matematik model yoki ta'rifni olishgacha). optimal sharoitlar). Bu o'rganilayotgan hodisaning mexanizmini to'liq bilmaslik sharoitida amalga oshiriladigan eksperimentning maqsadli nazorati.

O'lchovlar, keyingi ma'lumotlarni qayta ishlash, shuningdek, natijalarni matematik model shaklida rasmiylashtirish jarayonida xatolar yuzaga keladi va dastlabki ma'lumotlarda mavjud bo'lgan ma'lumotlarning bir qismi yo'qoladi. Eksperimentni rejalashtirish usullaridan foydalanish matematik modelning xatosini aniqlash va uning etarliligini baholash imkonini beradi. Agar modelning aniqligi etarli bo'lmasa, eksperimentni rejalashtirish usullaridan foydalanish modernizatsiya qilish imkonini beradi. matematik model oldingi ma'lumotlarni yo'qotmasdan va minimal xarajat bilan qo'shimcha tajribalar bilan.

Eksperimentni rejalashtirishning maqsadi eksperimentlarni o'tkazish uchun shunday shartlar va qoidalarni topishdan iborat bo'lib, unda eng kam mehnat sarfi bilan ob'ekt to'g'risida ishonchli va ishonchli ma'lumotlarni olish, shuningdek, ushbu ma'lumotlarni miqdoriy ko'rsatkichlar bilan ixcham va qulay shaklda taqdim etish mumkin. aniqligini baholash.

Tadqiqotning turli bosqichlarida qo'llaniladigan asosiy rejalashtirish usullari orasida quyidagilar qo'llaniladi:

skrining eksperimentini rejalashtirish, uning asosiy ma'nosi batafsil o'rganilishi kerak bo'lgan omillar yig'indisidan muhim omillar guruhini tanlash;

Tajribani rejalashtirish dispersiya tahlili, ya'ni. ob'ektlarning sifat omillari bilan rejalarini tuzish;

olish imkonini beradi regressiya tajriba rejalashtirish regressiya modellari(polinom va boshqalar);

Asosiy vazifa o'rganilayotgan ob'ektni eksperimental optimallashtirish bo'lgan ekstremal eksperimentni rejalashtirish;

Dinamik jarayonlarni o'rganishda rejalashtirish va boshqalar.

Fanni o‘rganishdan maqsad: rejalashtirish nazariyasi metodlari va zamonaviy axborot texnologiyalaridan foydalangan holda talabalarni mutaxassislik bo‘yicha ishlab chiqarish-texnik faoliyatga tayyorlash.

Fanning maqsadlari: o'rganish zamonaviy usullar ilmiy va ishlab chiqarish tajribalarini rejalashtirish, tashkil etish va optimallashtirish, tajribalar o‘tkazish va natijalarni qayta ishlash.

1. KORRELATSION TAHLILI

1.1 Korrelyatsiya tushunchasi

Tadqiqotchi ko'pincha o'rganilgan namunalarning bir yoki bir nechtasida ikki yoki undan ortiq o'zgaruvchilar bir-biri bilan qanday bog'liqligi bilan qiziqadi. Misol uchun, balandlik insonning vazniga ta'sir qilishi mumkinmi yoki bosim mahsulot sifatiga ta'sir qilishi mumkinmi?

O'zgaruvchilar o'rtasidagi bunday munosabat korrelyatsiya yoki korrelyatsiya deb ataladi. Korrelyatsiya - bu bir xususiyatning o'zgaruvchanligi ikkinchisining o'zgaruvchanligiga mos kelishini aks ettiruvchi ikki xususiyatning izchil o'zgarishi.

Ma'lumki, masalan, odamlarning bo'yi va vazni o'rtasida o'rtacha ijobiy bog'liqlik mavjud va bo'yi qanchalik katta bo'lsa, odamning vazni shunchalik katta bo'ladi. Biroq, bu qoidaga istisnolar mavjud bo'lganda past odamlar bor ortiqcha vazn, va aksincha, asteniklar, yuqori o'sish bilan, engil vaznga ega. Bunday istisnolarning sababi shundaki, har bir biologik, fiziologik yoki psixologik alomat ko'pgina omillarning ta'siri bilan belgilanadi: ekologik, genetik, ijtimoiy, ekologik va boshqalar.

Korrelyatsiyalar - ehtimollik o'zgarishlari bo'lib, ular faqat reprezentativ namunalarda matematik statistika usullari bilan o'rganilishi mumkin. Ikkala atama - korrelyatsiya va korrelyatsiya bog'liqligi - ko'pincha bir-birining o'rnida ishlatiladi. Bog'liqlik ta'sir, bog'lanish - yuzlab sabablar bilan izohlanishi mumkin bo'lgan har qanday muvofiqlashtirilgan o'zgarishlarni anglatadi. Korrelyatsiyalarni sabab-oqibat munosabatlarining dalili deb hisoblash mumkin emas, ular faqat bitta xususiyatdagi o'zgarishlar, qoida tariqasida, boshqasida ma'lum o'zgarishlar bilan birga bo'lishini ko'rsatadi.

Korrelyatsiyaga bog'liqlik - Bir xususiyatning qiymatlari paydo bo'lish ehtimoliga olib keladigan o'zgarishlar turli qiymatlar boshqa belgi.

Korrelyatsiya tahlilining vazifasi o'zgaruvchan xususiyatlar o'rtasidagi munosabatlarning yo'nalishini (ijobiy yoki salbiy) va shaklini (chiziqli, chiziqli bo'lmagan) aniqlash, uning zichligini o'lchash va nihoyat, olingan korrelyatsiya koeffitsientlarining ahamiyatlilik darajasini tekshirishdan iborat. .

Korrelyatsiyalar shakli, yo'nalishi va darajasi (kuch) bo'yicha farqlanadi. .

Korrelyatsiya shakli to'g'ri chiziqli yoki egri chiziqli bo'lishi mumkin. Masalan, simulyatordagi mashg'ulotlar soni va nazorat mashg'ulotidagi to'g'ri hal qilingan masalalar soni o'rtasidagi bog'liqlik to'g'ridan-to'g'ri bo'lishi mumkin. Egri chiziqli, masalan, motivatsiya darajasi va topshiriqning samaradorligi o'rtasidagi bog'liqlik bo'lishi mumkin (1-rasm). Motivatsiyaning ortishi bilan birinchi navbatda vazifaning samaradorligi oshadi, keyin motivatsiyaning optimal darajasiga erishiladi, bu vazifaning maksimal samaradorligiga mos keladi; motivatsiyaning yanada oshishi samaradorlikning pasayishi bilan birga keladi.

1-rasm - Muammoni hal qilish samaradorligi va motivatsion tendentsiyaning kuchi o'rtasidagi bog'liqlik

Yo'nalish bo'yicha korrelyatsiya ijobiy ("to'g'ridan-to'g'ri") va salbiy ("teskari") bo'lishi mumkin. Ijobiy to'g'ri chiziqli korrelyatsiya bilan bir atributning yuqori qiymatlari ikkinchisining yuqori qiymatlariga mos keladi va bir atributning past qiymatlari mos keladi. past qiymatlar boshqasi (2-rasm). Salbiy korrelyatsiya bilan nisbatlar teskari bo'ladi (3-rasm). Ijobiy korrelyatsiya bilan korrelyatsiya koeffitsienti mavjud ijobiy belgi, salbiy korrelyatsiya bilan - salbiy belgi.

Shakl 2 - To'g'ridan-to'g'ri korrelyatsiya

3-rasm - Teskari korrelyatsiya


4-rasm - korrelyatsiya yo'q

Korrelyatsiya darajasi, mustahkamligi yoki qattiqligi korrelyatsiya koeffitsientining qiymati bilan belgilanadi. Ulanishning mustahkamligi uning yo'nalishiga bog'liq emas va korrelyatsiya koeffitsientining mutlaq qiymati bilan belgilanadi.

1.2 Korrelyatsiyalarning umumiy tasnifi

Korrelyatsiya koeffitsientiga qarab quyidagi korrelyatsiyalar ajratiladi:

Korrelyatsiya koeffitsienti r>0,70 bilan kuchli yoki yaqin;

O'rtacha (0,50 da).

O'rtacha (0,30 da)

Zaif (0,20 da).

Juda zaif (r.da<0,19).

1.3 Korrelyatsiya maydonlari va ularni qurish maqsadi

Korrelyatsiya eksperimental ma'lumotlar asosida o'rganiladi, ular ikkita xususiyatning o'lchangan qiymatlari (x i, y i) hisoblanadi. Agar eksperimental ma'lumotlar kam bo'lsa, u holda ikki o'lchovli empirik taqsimot x i va y i qiymatlarining qo'sh qatori sifatida ifodalanadi. Bunday holda, xususiyatlar o'rtasidagi bog'liqlik turli yo'llar bilan tavsiflanishi mumkin. Argument va funktsiya o'rtasidagi muvofiqlik jadval, formula, grafik va boshqalar orqali berilishi mumkin.

Korrelyatsiya tahlili, boshqa statistik usullar singari, o'rganilayotgan xususiyatlarning ma'lum bir umumiy populyatsiyadagi xatti-harakatlarini tavsiflovchi ehtimollik modellaridan foydalanishga asoslanadi, ulardan x i va y i eksperimental qiymatlari olinadi. Qiymatlari metrik o'lchov birliklarida (metr, soniya, kilogramm va boshqalar) aniq o'lchanadigan miqdoriy xususiyatlar o'rtasidagi bog'liqlik o'rganilganda, ikki o'lchovli normal taqsimlangan umumiy populyatsiya modeli juda tez-tez uchraydi. qabul qilingan. Bunday model x i va y i o‘zgaruvchilari orasidagi bog‘lanishni to‘g‘ri burchakli koordinatalar sistemasidagi nuqtalar joylashuvi sifatida grafik tarzda ko‘rsatadi. Ushbu grafik bog'liqlik scatterplot yoki korrelyatsiya maydoni deb ham ataladi.
Ikki o'lchovli normal taqsimotning ushbu modeli (korrelyatsiya maydoni) korrelyatsiya koeffitsientining vizual grafik talqinini berishga imkon beradi, chunki agregatda taqsimot beshta parametrga bog'liq: m x, m y - o'rtacha qiymatlar (matematik taxminlar); s x ,s y - X va Y tasodifiy miqdorlarning standart og'ishlari va p - korrelyatsiya koeffitsienti, X va Y tasodifiy o'zgaruvchilar o'rtasidagi bog'liqlikning o'lchovidir.
Agar p \u003d 0 bo'lsa, u holda ikki o'lchovli normal populyatsiyadan olingan x i , y i qiymatlari aylana bilan chegaralangan maydon ichida x, y koordinatalarida grafikda joylashgan (5-rasm, a). Bu holda X va Y tasodifiy o'zgaruvchilar o'rtasida korrelyatsiya bo'lmaydi va ular korrelyatsiyasiz deb ataladi. Ikki o'lchovli normal taqsimot uchun korrelyatsiyasizlik bir vaqtning o'zida X va Y tasodifiy o'zgaruvchilarning mustaqilligini anglatadi.

Ilmiy tadqiqotlarda ko'pincha natijaviy va omil o'zgaruvchilari (ekin hosili va yog'ingarchilik miqdori, jins va yosh bo'yicha bir hil guruhlardagi odamning bo'yi va vazni, yurak urish tezligi va tana harorati) o'rtasidagi bog'liqlikni topish kerak bo'ladi. , va boshqalar.).

Ikkinchisi, ular bilan bog'liq bo'lganlarning o'zgarishiga hissa qo'shadigan belgilar (birinchi).

Korrelyatsiya tahlili tushunchasi

To'plam mavjud Yuqoridagilarga asoslanib, shuni aytishimiz mumkinki, korrelyatsiya tahlili ikki yoki undan ortiq o'zgaruvchilarning statistik ahamiyatliligi haqidagi farazni tekshirish uchun ishlatiladigan usul, agar tadqiqotchi ularni o'lchay olsa, lekin ularni o'zgartirmasa.

Ko'rib chiqilayotgan kontseptsiyaning boshqa ta'riflari mavjud. Korrelyatsiya tahlili - o'zgaruvchilar orasidagi korrelyatsiya koeffitsientlarini tekshiradigan ishlov berish usuli. Bunday holda, bir juft yoki bir nechta juft xususiyatlar o'rtasidagi korrelyatsiya koeffitsientlari ular orasidagi statistik munosabatlarni o'rnatish uchun taqqoslanadi. Korrelyatsiya tahlili - qat'iy funktsional xususiyatga ega bo'lgan tasodifiy o'zgaruvchilar orasidagi statistik bog'liqlikni o'rganish usuli bo'lib, unda bitta tasodifiy o'zgaruvchining dinamikasi boshqasining matematik kutish dinamikasiga olib keladi.

Soxta korrelyatsiya tushunchasi

Korrelyatsiya tahlilini o'tkazishda uni har qanday xususiyatlar to'plamiga nisbatan amalga oshirish mumkinligini hisobga olish kerak, ko'pincha bir-biriga nisbatan absurd. Ba'zan ular bir-biri bilan sababiy bog'lanishga ega emas.

Bunday holda, kimdir soxta korrelyatsiya haqida gapiradi.

Korrelyatsiya tahlili muammolari

Yuqoridagi ta'riflarga asoslanib, tavsiflangan usulning quyidagi vazifalarini shakllantirishimiz mumkin: boshqasidan foydalanib, kerakli o'zgaruvchilardan biri haqida ma'lumot olish; o'rganilayotgan o'zgaruvchilar o'rtasidagi munosabatlarning yaqinligini aniqlash.

Korrelyatsiya tahlili o'rganilayotgan xususiyatlar o'rtasidagi bog'liqlikni aniqlashni o'z ichiga oladi va shuning uchun korrelyatsiya tahlilining vazifalari quyidagilar bilan to'ldirilishi mumkin:

  • natijaviy belgiga eng katta ta'sir ko'rsatadigan omillarni aniqlash;
  • munosabatlarning ilgari o'rganilmagan sabablarini aniqlash;
  • uning parametrik tahlili bilan korrelyatsiya modelini qurish;
  • aloqa parametrlarining ahamiyatini o'rganish va ularning intervalini baholash.

Korrelyatsiya tahlilining regressiya bilan aloqasi

Korrelyatsion tahlil usuli ko'pincha o'rganilayotgan kattaliklar orasidagi bog'lanishning yaqinligini topish bilan cheklanmaydi. Ba'zan u xuddi shu nomdagi tahlil yordamida olinadigan va natijaviy va omilli (faktorial) xususiyat (lar) o'rtasidagi bog'liqlikning tavsifi bo'lgan regressiya tenglamalarini tuzish bilan to'ldiriladi. Ushbu usul ko'rib chiqilayotgan tahlil bilan birgalikda usulni tashkil qiladi

Usuldan foydalanish shartlari

Natija omillari bir yoki bir nechta omillarga bog'liq. Korrelyatsion tahlil usuli, agar samarali va omil ko'rsatkichlari (omillari) qiymati bo'yicha kuzatishlar ko'p bo'lsa, qo'llanilishi mumkin, bunda o'rganilayotgan omillar miqdoriy bo'lishi va aniq manbalarda aks ettirilishi kerak. Birinchisini normal qonun bilan aniqlash mumkin - bu holda Pearson korrelyatsiya koeffitsientlari korrelyatsiya tahlilining natijasidir yoki agar belgilar ushbu qonunga bo'ysunmasa, Spearman darajali korrelyatsiya koeffitsienti qo'llaniladi.

Korrelyatsion tahlil omillarini tanlash qoidalari

Ushbu usulni qo'llashda samaradorlik ko'rsatkichlariga ta'sir qiluvchi omillarni aniqlash kerak. Ular ko'rsatkichlar o'rtasida sababiy bog'liqlik mavjudligini hisobga olgan holda tanlanadi. Ko'p faktorli korrelyatsiya modeli yaratilganda, natijada paydo bo'lgan ko'rsatkichga sezilarli ta'sir ko'rsatadiganlar tanlanadi, shu bilan birga korrelyatsiya modeliga juftlik korrelyatsiya koeffitsienti 0,85 dan yuqori bo'lgan o'zaro bog'liq omillarni kiritmaslik afzalroqdir. natijaviy parametr bilan bog'liqlik bilvosita yoki funktsionaldir.

Natijalar ekrani

Korrelyatsiya tahlili natijalari matn va grafik shakllarda taqdim etilishi mumkin. Birinchi holda, ular korrelyatsiya koeffitsienti sifatida, ikkinchisida, tarqalish sxemasi sifatida taqdim etiladi.

Agar parametrlar o'rtasida korrelyatsiya bo'lmasa, diagrammadagi nuqtalar tasodifiy joylashgan bo'lsa, ulanishning o'rtacha darajasi ko'proq tartib bilan tavsiflanadi va belgilangan belgilarning medianadan ko'proq yoki kamroq bir xil masofada joylashganligi bilan tavsiflanadi. Kuchli bog'lanish to'g'ri chiziqqa intiladi va r=1 da tarqalish chizig'i tekis chiziqdir. Teskari korrelyatsiya grafikning yuqori chapdan pastki o'ngga, to'g'ridan-to'g'ri - pastki chapdan yuqori o'ng burchakka yo'nalishi bilan tavsiflanadi.

Tarqalish sxemasining 3D tasviri (tarqalish)

An'anaviy 2D scatterplot taqdimotiga qo'shimcha ravishda, hozirda korrelyatsiya tahlilining 3D grafik tasviri qo'llaniladi.

Scatterplot matritsasi ham qo'llaniladi, u barcha juftlashtirilgan chizmalarni matritsa formatida bitta rasmda ko'rsatadi. n ta o'zgaruvchi uchun matritsa n ta satr va n ta ustundan iborat. I-qator va j-ustunning kesishmasida joylashgan diagramma Xj bilan solishtirganda Xi o'zgaruvchilarning grafigi hisoblanadi. Shunday qilib, har bir satr va ustun bitta o'lchovdir, bitta katak ikki o'lchovning tarqalishini ko'rsatadi.

Aloqa zichligini baholash

Korrelyatsiyaning zichligi korrelyatsiya koeffitsienti (r) bilan aniqlanadi: kuchli - r = ± 0,7 dan ± 1 gacha, o'rtacha - r = ± 0,3 dan ± 0,699 gacha, zaif - r = 0 dan ± 0,299 gacha. Ushbu tasnif qat'iy emas. Rasmda biroz boshqacha sxema ko'rsatilgan.

Korrelyatsiyani tahlil qilish usulini qo'llashga misol

Buyuk Britaniyada qiziqarli tadqiqot o'tkazildi. U chekishning o'pka saratoni bilan bog'liqligiga bag'ishlangan va korrelyatsiya tahlili bilan o'tkazildi. Ushbu kuzatuv quyida keltirilgan.

Korrelyatsiya tahlili uchun dastlabki ma'lumotlar

Professional guruh

o'lim

Fermerlar, o'rmonchilar va baliqchilar

Konchilar va karer ishchilari

Gaz, koks va kimyoviy moddalar ishlab chiqaruvchilari

Shisha va keramika ishlab chiqaruvchilari

Pechlar, temirchilik, quyish va prokat zavodlarida ishchilar

Elektr va elektronika xodimlari

Muhandislik va tegishli kasblar

Yog'ochga ishlov berish ishlab chiqarish

Ko'nchilar

To'qimachilik ishchilari

Ish kiyimlarini ishlab chiqaruvchilar

Oziq-ovqat, ichimliklar va tamaki sanoati xodimlari

Qog'oz va matbaa ishlab chiqaruvchilari

Boshqa mahsulotlarni ishlab chiqaruvchilar

Quruvchilar

Rassomlar va dekorativlar

Statsionar dvigatellar, kranlar va boshqalarning haydovchilari.

Boshqa joylarga kiritilmagan ishchilar

Transport va aloqa xodimlari

Ombor ishchilari, omborchilar, qadoqlovchilar va to'ldirish mashinalari ishchilari

ofis xodimlari

Sotuvchilar

Sport va dam olish xizmati xodimlari

Administratorlar va menejerlar

Professionallar, texniklar va rassomlar

Biz korrelyatsiya tahlilini boshlaymiz. Aniqlik uchun yechimni grafik usuldan boshlash yaxshidir, buning uchun biz tarqalish (tarqalish) diagrammasini quramiz.

U to'g'ridan-to'g'ri aloqani ko'rsatadi. Biroq, faqat grafik usul asosida aniq xulosa chiqarish qiyin. Shuning uchun biz korrelyatsiya tahlilini davom ettiramiz. Korrelyatsiya koeffitsientini hisoblash misoli quyida ko'rsatilgan.

Dasturiy ta'minot vositalaridan foydalangan holda (MS Excel misolida, u quyida tavsiflanadi) biz korrelyatsiya koeffitsientini aniqlaymiz, bu 0,716 ga teng, bu o'rganilayotgan parametrlar o'rtasidagi mustahkam aloqani anglatadi. Olingan qiymatning statistik ahamiyatini mos keladigan jadval bo'yicha aniqlaymiz, buning uchun 25 juft qiymatdan 2 ni ayirishimiz kerak, natijada biz 23 ni olamiz va jadvaldagi ushbu chiziq uchun p = 0,01 uchun r kritikni topamiz. (chunki bu tibbiy ma'lumotlar, yanada qat'iy bog'liqlik, boshqa hollarda p = 0,05 etarli), bu korrelyatsiya tahlili uchun 0,51 ni tashkil qiladi. Misol shuni ko'rsatdiki, hisoblangan r kritik r dan kattaroqdir, korrelyatsiya koeffitsienti qiymati statistik jihatdan ahamiyatli hisoblanadi.

Korrelyatsiya tahlilida dasturiy ta'minotdan foydalanish

Statistik ma'lumotlarni qayta ishlashning tavsiflangan turi dasturiy ta'minot, xususan, MS Excel dasturi yordamida amalga oshirilishi mumkin. Korrelyatsiya funksiyalar yordamida quyidagi parametrlarni hisoblashni o'z ichiga oladi:

1. Korrelyatsiya koeffitsienti CORREL funksiyasi yordamida aniqlanadi (massiv1; massiv2). Massiv1,2 - natijaviy va omil o'zgaruvchilari qiymatlari diapazonining katakchasi.

Chiziqli korrelyatsiya koeffitsienti Pearson korrelyatsiya koeffitsienti deb ham ataladi va shuning uchun Excel 2007 dan boshlab siz funksiyadan bir xil massivlar bilan foydalanishingiz mumkin.

Excelda korrelyatsiya tahlilining grafik ko'rinishi "Scatter Plot" tanlovi bilan "Charts" paneli yordamida amalga oshiriladi.

Dastlabki ma'lumotlarni ko'rsatgandan so'ng, biz grafikni olamiz.

2. Juftlik korrelyatsiya koeffitsientining ahamiyatini Student t-testi yordamida baholash. t-mezonining hisoblangan qiymati ushbu ko'rsatkichning jadval (kritik) qiymati bilan ko'rib chiqilayotgan parametr qiymatlarining tegishli jadvalidan, berilgan ahamiyat darajasi va erkinlik darajalari sonini hisobga olgan holda taqqoslanadi. Ushbu baholash STUDIV (ehtimollik; erkinlik_darajalari) funksiyasi yordamida amalga oshiriladi.

3. Juftlik korrelyatsiya koeffitsientlari matritsasi. Tahlil "Ma'lumotlarni tahlil qilish" asbobi yordamida amalga oshiriladi, unda "Korrelyatsiya" tanlangan. Juftlik korrelyatsiya koeffitsientlarini statistik baholash uning mutlaq qiymatini jadval (kritik) qiymat bilan solishtirish orqali amalga oshiriladi. Hisoblangan juft korrelyatsiya koeffitsienti kritik qiymatdan oshib ketganda, berilgan ehtimollik darajasini hisobga olgan holda, chiziqli munosabatlarning ahamiyati haqidagi nol gipoteza rad etilmaydi, deb aytishimiz mumkin.

Nihoyat

Ilmiy tadqiqotlarda korrelyatsion tahlil usulidan foydalanish turli omillar va samaradorlik ko'rsatkichlari o'rtasidagi bog'liqlikni aniqlash imkonini beradi. Shu bilan birga, shuni hisobga olish kerakki, yuqori korrelyatsiya koeffitsienti absurd juftlik yoki ma'lumotlar to'plamidan ham olinishi mumkin va shuning uchun bunday tahlil turi etarlicha katta ma'lumotlar massivida amalga oshirilishi kerak.

r ning hisoblangan qiymatini olgandan so'ng, ma'lum bir qiymatning statistik ahamiyatini tasdiqlash uchun uni r kritik bilan solishtirish maqsadga muvofiqdir. Korrelyatsiya tahlili formulalar yordamida qo'lda yoki dasturiy vositalar, xususan MS Excel yordamida amalga oshirilishi mumkin. Bu erda korrelyatsiya tahlilining o'rganilayotgan omillari va natijaviy xususiyat o'rtasidagi bog'liqlikni vizual tasvirlash maqsadida tarqoq (tarqalish) diagrammasini ham qurish mumkin.



Saytda yangi

>

Eng mashhur