Uy Og'izdan hid Ko'p korrelyatsiya koeffitsienti va ko'p determinatsiya koeffitsienti. Ko'p chiziqli korrelyatsiya

Ko'p korrelyatsiya koeffitsienti va ko'p determinatsiya koeffitsienti. Ko'p chiziqli korrelyatsiya

Keling, avvalo, biz aniqlagan savollarning har biriga javob topishga harakat qilaylik, chunki bizning sabab modelimiz faqat o'z ichiga oladi. ikkita mustaqil o'zgaruvchi.

Ko'p korrelyatsiya R va aniqlanish koeffitsienti R2

Barcha mustaqil o'zgaruvchilarning qaram o'zgaruvchi bilan umumiy munosabatini baholash uchun foydalaning ko'p koeffitsient R korrelyatsiyasi. Ko'p korrelyatsiya koeffitsienti o'rtasidagi farq R ikki o'zgaruvchan korrelyatsiya koeffitsientidan G Bu faqat ijobiy bo'lishi mumkin. Ikki mustaqil o'zgaruvchi uchun uni quyidagicha baholash mumkin:

Ko'p korrelyatsiya koeffitsientini (9.1) tenglamani tashkil etuvchi qisman regressiya koeffitsientlarini baholash orqali ham aniqlash mumkin. Ikki o'zgaruvchi uchun bu tenglama aniq quyidagi shaklni oladi:

(9.2)

Agar bizning mustaqil o'zgaruvchilarimiz standart birliklarga aylantirilsa normal taqsimot, yoki Z-tarqatish, (9.2) tenglama quyidagi ko'rinishga ega bo'lishi aniq:

(9.3)

(9.3) tenglamada b koeffitsienti regressiya koeffitsientining standartlashtirilgan qiymatini bildiradi. IN.

Standartlashtirilgan regressiya koeffitsientlarini quyidagi formulalar yordamida hisoblash mumkin:

Endi ko'p korrelyatsiya koeffitsientini hisoblash formulasi quyidagicha ko'rinadi:

Korrelyatsiya koeffitsientini baholashning yana bir usuli R ikki o'zgaruvchan korrelyatsiya koeffitsientini hisoblash r qaram o'zgaruvchi Y qiymatlari va tenglama asosida hisoblangan tegishli qiymatlar o'rtasida chiziqli regressiya(9.2). Boshqacha aytganda, qiymat R quyidagicha baholash mumkin:

Ushbu koeffitsient bilan bir qatorda, oddiy regressiya holatida bo'lgani kabi, qiymatni ham taxmin qilishimiz mumkin R 2, bu ham odatda sifatida belgilanadi aniqlash koeffitsienti. Xuddi ikki o'zgaruvchi o'rtasidagi munosabatni baholash vaziyatida bo'lgani kabi, determinatsiya koeffitsienti R 2 bog'liq o'zgaruvchining dispersiyasining necha foizini ko'rsatadi Y , ya'ni. , barcha mustaqil o'zgaruvchilarning tarqalishi bilan bog'liq bo'lib chiqadi -. Boshqacha qilib aytganda, aniqlash koeffitsientini quyidagicha baholash mumkin:

Shuningdek, biz mustaqil o'zgaruvchilarning birortasi bilan bog'liq bo'lmagan qaram o'zgaruvchidagi qoldiq dispersiya foizini ham taxmin qilishimiz mumkin 1 - R 2. Kvadrat ildiz bu qiymatdan, ya'ni. miqdori, xuddi ikki o'zgaruvchan korrelyatsiya holatidagi kabi, deyiladi begonalashtirish koeffitsienti.

Korrelyatsiya qismi

Determinatsiya koeffitsienti R 2-rasmda bog'liq o'zgaruvchidagi dispersiyaning necha foizi sabab modeliga kiritilgan barcha mustaqil o'zgaruvchilardagi dispersiyaga bog'liq bo'lishi mumkinligi ko'rsatilgan. Bu koeffitsient qanchalik katta bo'lsa, biz ilgari surayotgan sabab modeli shunchalik ahamiyatli bo'ladi. Agar bu koeffitsient unchalik katta bo'lmasa, u holda biz o'rganayotgan o'zgaruvchilarning bog'liq o'zgaruvchining umumiy dispersiyasiga qo'shgan hissasi ham ahamiyatsiz bo'lib chiqadi. Amalda esa ko'pincha faqat barcha o'zgaruvchilarning umumiy hissasini emas, balki biz ko'rib chiqayotgan har bir mustaqil o'zgaruvchining individual hissasini ham baholash kerak bo'ladi. Bunday hissa sifatida belgilanishi mumkin korrelyatsiya qismi.

Ma'lumki, ikki o'zgaruvchan korrelyatsiya holatida, mustaqil o'zgaruvchining dispersiyasi bilan bog'liq bo'lgan qaram o'zgaruvchining dispersiya foizini quyidagicha belgilash mumkin. r 2. Biroq, bir nechta mustaqil o'zgaruvchilarning ta'sirini o'rganish holatida bu dispersiyaning bir qismi bir vaqtning o'zida biz nazorat sifatida foydalanadigan mustaqil o'zgaruvchining dispersiyasiga bog'liq. Ushbu munosabatlar rasmda aniq ko'rsatilgan. 9.1.

Guruch. 9.1. Bog'liqning dispersiyalari nisbati (Y ) va ikkita mustaqil (X 1VaX 2) ichida o'zgaruvchilar korrelyatsiya tahlili ikkita mustaqil o'zgaruvchi bilan

Shaklda ko'rsatilganidek. 9.1, barcha farqlar Y , bizning ikkita mustaqil o'zgaruvchimiz bilan bog'langan, etiketli uchta qismdan iborat a, b Va Bilan. Qismlar A Va b farqlar Y ikkita mustaqil o'zgaruvchining dispersiyalariga alohida tegishli - X 1 va X 2. Shu bilan birga, c qismining dispersiyasi bir vaqtning o'zida bog'liq Y o'zgaruvchining dispersiyasini ham, bizning ikki o'zgaruvchimizning dispersiyasini ham bog'laydi. X. Shuning uchun, o'zgaruvchining munosabatini baholash uchun X 1 o'zgaruvchi bilan Y, bu o'zgaruvchining ta'siridan kelib chiqmaydi X Har bir o'zgaruvchiga 2 Y , miqdoridan zarur R" 2 kvadrat korrelyatsiya qiymatini olib tashlang Y Bilan X 2:

(9.6)

Shunga o'xshab, biz Y bilan korrelyatsiya qismini taxmin qilishimiz mumkin X 2, bu uning o'zaro bog'liqligi bilan bog'liq emas X 1.

(9.7)

Kattalik sr (9.6) va (9.7) tenglamalarda biz qidirayotganimiz korrelyatsiya qismi.

Qismning korrelyatsiyasini odatiy ikki o'zgaruvchan korrelyatsiya nuqtai nazaridan ham aniqlash mumkin:

Boshqacha qilib aytganda, qismli korrelyatsiya yarim qisman korrelyatsiya deb ataladi. Bu nom korrelyatsiyani hisoblashda ikkinchi mustaqil o'zgaruvchining ta'siri birinchi mustaqil o'zgaruvchining qiymatlariga nisbatan yo'q qilinishini, lekin qaram o'zgaruvchiga nisbatan yo'q qilinmasligini anglatadi. Effekt X 1 qiymatlar yordamida sozlangan X 2, shuning uchun korrelyatsiya koeffitsienti o'rtasida hisoblanmaydi Y Va X 1 va orasida Y va , va qiymatlar qiymatlar asosida hisoblanadi X 2 oddiy chiziqli regressiya bobida muhokama qilinganidek (7.4.2-kichik bo'limga qarang). Shunday qilib, quyidagi munosabat haqiqiy bo'lib chiqadi:

Mustaqil o‘zgaruvchining o‘ziga ham, bog‘liq o‘zgaruvchiga ham boshqa mustaqil o‘zgaruvchilarning ta’siri bo‘lmaganda bitta mustaqil o‘zgaruvchining bog‘liq o‘zgaruvchi bilan korrelyatsiyasini baholash uchun regressiya tahlilida qisman korrelyatsiya tushunchasi qo‘llaniladi.

Qisman korrelyatsiyalar

Shaxsiy, yoki qisman, korrelyatsiya Matematik statistikada ma'lum bir mustaqil o'zgaruvchining dispersiyasi bilan bog'liq bo'lgan qaram o'zgaruvchining dispersiyasining ushbu bog'liq o'zgaruvchining butun dispersiyasiga nisbati orqali aniqlanadi, uning boshqa qismi bilan bog'liq bo'lgan qismini hisobga olmaganda. mustaqil o'zgaruvchilar. Rasmiy ravishda, ikkita mustaqil o'zgaruvchi uchun buni quyidagicha ifodalash mumkin:

Qisman korrelyatsiya o'zini o'zi qadrlaydi pr Ikki o'zgaruvchan korrelyatsiya qiymatlari asosida topish mumkin:

Shunday qilib, qisman korrelyatsiyani ham bog'liq, ham mustaqil o'zgaruvchining sozlangan qiymatlari o'rtasidagi oddiy ikki o'zgaruvchan korrelyatsiya sifatida aniqlash mumkin. Tuzatishning o'zi nazorat o'zgaruvchisi sifatida ishlaydigan mustaqil o'zgaruvchining qiymatlariga muvofiq amalga oshiriladi. Boshqacha qilib aytganda, qaram o'zgaruvchi o'rtasidagi qisman korrelyatsiya Y va mustaqil o'zgaruvchi X i qiymatlari va qiymatlari o'rtasidagi odatiy korrelyatsiya sifatida aniqlanishi mumkin, bu qiymatlar bilan va ikkinchi mustaqil o'zgaruvchining qiymatlari asosida bashorat qilinadi. X 2.

Ko'p korrelyatsiya koeffitsienti natijaviy ko'rsatkich (qaram o'zgaruvchi) o'rtasidagi statistik munosabatlarning yaqinlik darajasining o'lchovi sifatida ishlatiladi. y va tushuntirish (mustaqil) o'zgaruvchilar to'plami yoki boshqacha aytganda, natijaga omillarning birgalikdagi ta'sirining yaqinligini baholaydi.

Ko'p korrelyatsiya koeffitsientini bir qator formulalar 5 yordamida hisoblash mumkin, jumladan:

    juft korrelyatsiya koeffitsientlari matritsasi yordamida

, (3.18)

qayerda  r- juft korrelyatsiya koeffitsientlari matritsasining determinanti y,
,

r 11 - interfaktor korrelyatsiya matritsasining determinanti
;

. (3.19)

Ikkita mustaqil o'zgaruvchi mavjud bo'lgan model uchun (3.18) formula soddalashtirilgan

. (3.20)

Ko'p korrelyatsiya koeffitsientining kvadrati aniqlash koeffitsienti R 2. Juft regressiyada bo'lgani kabi, R 2 regressiya modelining sifatini ko'rsatadi va natijada olingan xarakteristikaning umumiy o'zgarishi ulushini aks ettiradi. y regressiya funksiyasining o‘zgarishi bilan izohlanadi f(x) (2.4-bandga qarang). Bundan tashqari, aniqlash koeffitsientini formuladan foydalanib topish mumkin

. (3.21)

Biroq, foydalanish R 2 holatda ko'p regressiya mutlaqo to'g'ri emas, chunki modelga regressorlarni qo'shganda aniqlanish koeffitsienti ortadi. Buning sababi, qo'shimcha o'zgaruvchilar kiritilganda qoldiq dispersiya kamayadi. Va agar omillar soni kuzatishlar soniga yaqinlashsa, u holda qoldiq dispersiya nolga teng bo'ladi va ko'p korrelyatsiya koeffitsienti va shuning uchun determinatsiya koeffitsienti bittaga yaqinlashadi, garchi aslida omillar va natija o'rtasidagi bog'liqlik. va regressiya tenglamasining tushuntirish kuchi ancha past bo'lishi mumkin.

Olingan xususiyatning o'zgarishi bir nechta omillarning o'zgarishi bilan qanchalik to'g'ri tushuntirilishini adekvat baholash uchun ular foydalanadilar. tuzatilgan aniqlash koeffitsienti

(3.22)

Tuzatilgan aniqlash koeffitsienti har doim kamroq bo'ladi R 2. Bundan tashqari, farqli o'laroq R 2, har doim ijobiy,
salbiy qiymat ham qabul qilishi mumkin.

Misol (1-misolning davomi). (3.20) formula bo'yicha ko'p korrelyatsiya koeffitsientini hisoblaymiz:

Ko'p korrelyatsiya koeffitsientining qiymati 0,8601 ga teng bo'lib, tashish narxi va yukning og'irligi va uni tashish masofasi o'rtasidagi kuchli bog'liqlikdan dalolat beradi.

Determinatsiya koeffitsienti quyidagilarga teng: R 2 =0,7399.

Tuzatilgan aniqlash koeffitsienti (3.22) formula bo'yicha hisoblanadi:

=0,7092.

E'tibor bering, tuzatilgan aniqlash koeffitsientining qiymati determinatsiya koeffitsientining qiymatidan farq qiladi.

Shunday qilib, qaram o'zgaruvchining o'zgarishining 70,9% (transport narxi) mustaqil o'zgaruvchilarning o'zgarishi (yuk og'irligi va tashish masofasi) bilan izohlanadi. Bog'liq o'zgaruvchining qolgan 29,1% o'zgarishi modelda hisobga olinmagan omillar bilan izohlanadi.

Tuzatilgan aniqlash koeffitsientining qiymati juda katta, shuning uchun biz modelda transport xarajatlarini belgilovchi eng muhim omillarni hisobga oldik. 

Uch o'zgaruvchining ko'p korrelyatsiya koeffitsienti xarakteristikalardan biri (chiziqdan oldingi indeks harfi) va boshqa ikkita xarakteristikaning kombinatsiyasi (tiredan keyingi indeks harfi) o'rtasidagi chiziqli munosabatlarning yaqinligining ko'rsatkichidir:

; (12.7)

(12.8)

Bu formulalar qachon bir nechta korrelyatsiya koeffitsientlarini hisoblashni osonlashtiradi ma'lum qiymatlar juft korrelyatsiya koeffitsientlari r xy, r xz va r yz.

Koeffitsient R salbiy emas va har doim 0 dan 1 gacha bo'ladi. Siz yaqinlashganda R Biriga, uchta xususiyat o'rtasidagi chiziqli bog'lanish darajasi ortadi. Ko'p korrelyatsiya koeffitsienti o'rtasida, masalan. R y-xz, va ikkita juft korrelyatsiya koeffitsienti r yx Va r yz quyidagi munosabatlar mavjud: juftlashgan koeffitsientlarning har biri mutlaq qiymatdan oshmasligi kerak R y-xz.

Kvadratlangan ko'p korrelyatsiya koeffitsienti R 2 ko'p determinatsiya koeffitsienti deb ataladi. U o'rganilayotgan omillar ta'sirida qaram o'zgaruvchining o'zgarishi nisbatini ko'rsatadi.

Ko'p korrelyatsiyaning ahamiyati tomonidan baholanadi
F- mezon:

, (12.9)

n- namuna hajmi,

k- belgilar soni; bizning holatimizda k = 3.

Nazariy qiymat F– mezonlar arizalar jadvalidan olinadi n 1 = k-1 va n 2 = n–k erkinlik darajalari va qabul qilingan ahamiyat darajasi. Populyatsiyadagi ko'p korrelyatsiya koeffitsienti nolga teng degan nol gipoteza ( H0: R= 0) qabul qilinadi, agar F haqiqat.< F табл . va agar rad etiladi F haqiqat. ≥ F jadvali.

Ishning oxiri -

Ushbu mavzu bo'limga tegishli:

Matematik statistika

Ta'lim muassasasi.. Gomel Davlat universiteti.. Frensis Skaryna Yu M Juchenko nomi bilan atalgan..

Agar sizga ushbu mavzu bo'yicha qo'shimcha material kerak bo'lsa yoki siz qidirayotgan narsangizni topa olmagan bo'lsangiz, bizning ishlar ma'lumotlar bazasida qidiruvdan foydalanishni tavsiya etamiz:

Qabul qilingan material bilan nima qilamiz:

Agar ushbu material siz uchun foydali bo'lsa, uni ijtimoiy tarmoqlardagi sahifangizga saqlashingiz mumkin:

Ushbu bo'limdagi barcha mavzular:

Qo'llanma
1-31 01 01 "Biologiya" mutaxassisligi bo'yicha tahsil olayotgan universitet talabalari uchun Gomel 2010 yil

Matematik statistikaning predmeti va usuli
Matematik statistikaning predmeti biologiya, iqtisodiyot, texnologiya va boshqa sohalardagi ommaviy hodisalarning xususiyatlarini o'rganadi. Bu hodisalar odatda xilma-xilligi (variatsiyasi) tufayli murakkab ko'rinishda taqdim etiladi.

Tasodifiy hodisa tushunchasi
Statistik induksiya yoki statistik xulosa, asosiysi sifatida komponent ommaviy hodisalarni o'rganish usullari, o'ziga xosdir o'ziga xos xususiyatlar. Statistik xulosalar raqamlar bilan tuziladi

Tasodifiy hodisa ehtimoli
Tasodifiy hodisaning har qanday etarlicha katta sinovlar seriyasi uchun hodisaning chastotasi ushbu xususiyatdan bir oz farq qiladigan xususiyatga ega bo'lgan raqamli xarakteristikasi deyiladi.

Ehtimollarni hisoblash
Ko'pincha ehtimolliklarni bir vaqtning o'zida qo'shish va ko'paytirish kerak. Masalan, bir vaqtning o'zida 2 ta zarni otishda 5 ball olish ehtimolini aniqlash kerak. Kerakli miqdor, ehtimol

Tasodifiy o'zgaruvchi haqida tushuncha
Ehtimollik tushunchasiga ta'rif berib, uning asosiy xossalarini aniqlab bo'lgach, ehtimollar nazariyasining eng muhim tushunchalaridan biri - tasodifiy o'zgaruvchi tushunchasini ko'rib chiqishga o'tamiz. Natijada, deb faraz qilaylik

Diskret tasodifiy o'zgaruvchilar
Tasodifiy o'zgaruvchi, agar uning mumkin bo'lgan qiymatlari to'plami chekli yoki hech bo'lmaganda sanash mumkin bo'lsa, diskret hisoblanadi. Aytaylik, X tasodifiy o'zgaruvchisi x1 qiymatlarini olishi mumkin

Uzluksiz tasodifiy o'zgaruvchilar
Oldingi bo'limda muhokama qilingan diskret tasodifiy o'zgaruvchilardan farqli o'laroq, aholi soni mumkin bo'lgan qiymatlar uzluksiz tasodifiy miqdor nafaqat chekli, balki bo'lishi ham mumkin emas

Kutish va farq
Ko'pincha tasodifiy o'zgaruvchining taqsimlanishini ushbu taqsimotning eng muhim xususiyatlarini ifodalovchi bir yoki ikkita raqamli ko'rsatkichlar yordamida tavsiflash zarurati tug'iladi. Bundaylarga

Lahzalar
Tasodifiy miqdorni taqsimlash momentlari deb ataladigan momentlar matematik statistikada katta ahamiyatga ega. Matematik kutishda tasodifiy o'zgaruvchining katta qiymatlari etarli darajada hisobga olinmaydi.

Binom taqsimoti va ehtimollikni o'lchash
Ushbu mavzuda biz diskret tasodifiy miqdorlarni taqsimlashning asosiy turlarini ko'rib chiqamiz. Faraz qilaylik, bitta sinov paytida qandaydir tasodifiy A hodisasining yuzaga kelish ehtimoli teng bo'lsin.

To'rtburchaklar (bir xil) taqsimot
To'rtburchaklar (bir xil) taqsimot - eng oddiy turi uzluksiz taqsimotlar. Agar X tasodifiy o'zgaruvchisi (a, b) oraliqda istalgan haqiqiy qiymatni qabul qila olsa, bu erda a va b haqiqiydir

Oddiy taqsimot
Oddiy taqsimot matematik statistikada asosiy rol o'ynaydi. Bu zarracha tasodifiy emas: ob'ektiv haqiqatda turli xil belgilar juda tez-tez uchraydi.

Lognormal taqsimot
Y tasodifiy o'zgaruvchisi m va s parametrlari bilan lognormal taqsimotga ega bo'ladi, agar X = lnY tasodifiy o'zgaruvchisi bir xil m va & parametrlari bilan normal taqsimotga ega bo'lsa.

O'rtacha qiymatlar
Barcha guruh xususiyatlaridan atributning o'rtacha qiymati bilan o'lchanadigan o'rtacha daraja eng katta nazariy va amaliy ahamiyatga ega. Xususiyatning o'rtacha qiymati juda chuqur tushunchadir,

O'rtachalarning umumiy xossalari
O'rtacha qiymatlardan to'g'ri foydalanish uchun ushbu ko'rsatkichlarning xususiyatlarini bilish kerak: o'rtacha joylashuv, mavhumlik va umumiy harakatning birligi. Raqamli qiymatiga ko'ra

Arifmetik o'rtacha
O'rtacha qiymatlarning umumiy xususiyatlariga ega bo'lgan o'rtacha arifmetik o'ziga xos xususiyatlarga ega bo'lib, ularni quyidagi formulalar bilan ifodalash mumkin:

O'rtacha daraja (parametrik bo'lmagan o'rtacha)
O'rtacha daraja miqdoriy o'lchash usullari hali topilmagan xususiyatlar uchun aniqlanadi. Bunday belgilarning namoyon bo'lish darajasiga ko'ra, ob'ektlarni tartiblash mumkin, ya'ni.

O'rtacha o'lchangan arifmetik
Odatda, o'rtacha arifmetik qiymatni hisoblash uchun atributning barcha qiymatlari qo'shiladi va natijada olingan summa variantlar soniga bo'linadi. Bunday holda, yig'indiga kiritilgan har bir qiymat uni to'liq oshiradi

O'rtacha kvadrat
O'rtacha ildiz kvadrati quyidagi formula bo'yicha hisoblanadi: , (6.5) U yig'indining kvadrat ildiziga teng.

Median
Median - bu butun guruhni ikkita teng qismga bo'ladigan xarakteristikaning qiymati: bir qismi medianadan kichik xarakterli qiymatga ega, ikkinchisi esa kattaroq qiymatga ega. Misol uchun, agar sizda bo'lsa

Geometrik o'rtacha
N ma'lumotlarga ega bo'lgan guruh uchun geometrik o'rtachani olish uchun siz barcha variantlarni ko'paytirishingiz va olingan mahsulotdan chiqarishingiz kerak. n-chi ildiz darajalar:

Harmonik o'rtacha
Harmonik o'rtacha formula yordamida hisoblanadi. (6.14) Beshta variant uchun: 1, 4, 5, 5 chorshanba

Erkinlik darajalari soni
Erkinlik darajalari soni guruhdagi erkin xilma-xillik elementlari soniga teng. Bu xilma-xillik cheklovlarisiz barcha mavjud o'quv elementlari soniga teng. Masalan, tadqiqot uchun

O'zgaruvchanlik koeffitsienti
Standart og'ish- o'rtacha arifmetik bilan bir xil o'lchov birliklarida ifodalangan nomli miqdor. Shuning uchun, taqqoslash uchun turli belgilar dan turli birliklarda ifodalangan

Cheklovlar va qamrov
Turli xillik darajasini tez va taxminiy baholash uchun ko'pincha eng oddiy ko'rsatkichlar qo'llaniladi: lim = (min ¸ max) - chegaralar, ya'ni eng kichik va eng yuqori qiymat belgisi, p =

Normallashtirilgan og'ish
Odatda, belgining rivojlanish darajasi uni o'lchash yo'li bilan aniqlanadi va ma'lum bir nomli raqam bilan ifodalanadi: 3 kg vazn, 15 sm uzunlik, ari qanotida 20 ilgak, sutda 4% yog', 15 kg. kesish

Umumiy guruhning o'rtacha va sigmasi
Ba'zan bir nechta taqsimotlardan tashkil topgan umumiy taqsimot uchun o'rtacha va sigmani aniqlash kerak bo'ladi. Bunday holda, taqsimotlarning o'zi emas, balki faqat ularning o'rtacha va sigmalari ma'lum.

Tarqatish egri chizig'ining qiyshiqligi (qiyshiqligi) va tikligi (kurtozis).
Katta namunalar uchun (n > 100) yana ikkita statistika hisoblanadi. Egri chiziqning qiyshiqligi assimetriya deb ataladi:

Variatsiya seriyasi
O'rganilayotgan guruhlar sonining ko'payishi bilan kichik guruhlarda uning tasodifiy namoyon bo'lishi bilan yashiringan xilma-xillik naqshlari tobora ko'proq namoyon bo'lmoqda.

Gistogramma va o'zgaruvchanlik egri chizig'i
Gistogramma bu variatsion qator, diagramma shaklida taqdim etilgan bo'lib, unda turli chastota qiymatlari barlarning turli balandliklari bilan ifodalanadi. Ma'lumotlarni taqsimlash gistogrammasi betda ko'rsatilgan

Tarqatishlardagi farqlarning ishonchliligi
Statistik gipoteza - bu kuzatilgan ma'lumotlar namunasi asosidagi ehtimollik taqsimoti haqidagi o'ziga xos faraz. Imtihon statistik gipoteza qabul qilish jarayonidir

Egrilik va kurtozlik mezoni
O'simliklar, hayvonlar va mikroorganizmlarning ayrim xususiyatlari, ob'ektlarni guruhlarga birlashtirganda, odatdagidan sezilarli darajada farq qiladigan taqsimotlarni beradi. Har qanday hollarda

Populyatsiya va namuna
Muayyan toifadagi shaxslarning butun majmuasi umumiy populyatsiya deb ataladi. Ovoz balandligi aholi tadqiqot maqsadlari bilan belgilanadi. Agar biron bir yovvoyi tur o'rganilayotgan bo'lsa

Vakillik
Tanlangan ob'ektlar guruhini to'g'ridan-to'g'ri o'rganish, birinchi navbatda, namunaning o'ziga xos materiali va xususiyatlarini ta'minlaydi. Barcha namunaviy ma'lumotlar va umumiy ko'rsatkichlar tegishli

Reprezentativlik xatolari va boshqa tadqiqot xatolari
Namuna ko'rsatkichlari yordamida umumiy parametrlarni baholash o'ziga xos xususiyatlarga ega. Bir qism hech qachon butunni to'liq tavsiflay olmaydi, shuning uchun umumiy aholining xususiyatlari

Ishonch chegaralari
Umumiy parametrlarning mumkin bo'lgan qiymatlarini topish uchun namunaviy ko'rsatkichlardan foydalanish uchun vakillik xatolarining hajmini aniqlash kerak. Bu jarayon o deb ataladi

Umumiy baholash tartibi
Umumiy parametrni baholash uchun zarur bo'lgan uchta miqdor - namuna ko'rsatkichi (), ishonchlilik mezoni

O'rtacha arifmetik qiymatni baholash
O'rtacha qiymatni baholash o'rganilayotgan ob'ektlar toifasi uchun umumiy o'rtacha qiymatni belgilashga qaratilgan. Buning uchun talab qilinadigan reprezentativlik xatosi quyidagi formula bilan aniqlanadi:

O'rtacha farqni baholash
Ba'zi tadqiqotlar asosiy ma'lumotlar sifatida ikkita o'lchov farqini oladi. Bu namunadagi har bir shaxs ikki holatda yoki bir holatda o'rganilganda bo'lishi mumkin turli yoshda, yoki p

O'rtacha farqni ishonchsiz va ishonchli baholash
Umumiy parametrning aniq bahosini olish mumkin bo'lmagan (yoki u noldan katta yoki nolga teng yoki nolga teng) namunaviy tadqiqotlar natijalari ishonchsiz deb ataladi.

Umumiy vositalar orasidagi farqni baholash
Biologik tadqiqotlarda ikki miqdor orasidagi farq alohida ahamiyatga ega. Farqi bo'yicha taqqoslash turli xil populyatsiyalar, irqlar, zotlar, navlar, chiziqlar, oilalar, eksperimental va nazorat guruhlari o'rtasida amalga oshiriladi (gr usuli).

Ishonchlilik mezoni farqi
Bundan tashqari katta ahamiyatga ega, tadqiqotchilar ishonchli farqlarni olishlari uchun muhim bo'lgan, natijaning ishonchli yoki real ekanligini aniqlashga imkon beradigan usullarni o'zlashtirishga ehtiyoj bor.

Sifatli xususiyatlarni o'rganishda reprezentativlik
Sifatli xususiyatlar odatda namoyon bo'lish darajalariga ega bo'lolmaydi: ular har bir shaxsda mavjud yoki mavjud emas, masalan, jins, so'rov, ba'zi xususiyatlarning mavjudligi yoki yo'qligi, deformatsiya.

Aktsiyalar farqining ishonchliligi
Namuna nisbatlaridagi farqning ishonchliligi o'rtacha farq bilan bir xil tarzda aniqlanadi: (10.34)

Korrelyatsiya koeffitsienti
Ko'pgina tadqiqotlar ularning o'zaro bog'liqligida bir nechta xususiyatlarni o'rganishni talab qiladi. Agar siz ikkita xususiyatga nisbatan bunday tadqiqot o'tkazsangiz, bitta xususiyatning o'zgaruvchanligi yo'qligini sezasiz

Korrelyatsiya koeffitsienti xatosi
Har qanday tanlama qiymati singari, korrelyatsiya koeffitsienti ham katta namunalar uchun formuladan foydalangan holda hisoblangan o'zining reprezentativ xatosiga ega:

Namuna korrelyatsiya koeffitsientining ishonchliligi
Tanlangan korrelyatsiya koeffitsienti mezoni quyidagi formula bilan aniqlanadi: (11.9) bunda:

Korrelyatsiya koeffitsientining ishonch chegaralari
Korrelyatsiya koeffitsientining umumiy qiymatining ishonch chegaralari umumiy tarzda formula bo'yicha:

Ikki korrelyatsiya koeffitsienti orasidagi farqning ishonchliligi
Korrelyatsiya koeffitsientlaridagi farqning ishonchliligi odatdagi formula bo'yicha vositalar farqining ishonchliligi bilan bir xil tarzda aniqlanadi.

To'g'ri regressiya tenglamasi
To'g'ri chiziqli korrelyatsiya shundan farq qiladiki, bu bog'lanish shakli bilan birinchi xarakterdagi bir xil o'zgarishlarning har biri to'liq aniq va boshqa belgining o'rtacha o'zgarishiga mos keladi.

Chiziqli regressiya tenglama elementlaridagi xatolar
Oddiy chiziqli regressiya tenglamasida: y = a + bx, reprezentativlikning uchta xatosi paydo bo'ladi. 1 Regressiya koeffitsienti xatosi:

Qisman korrelyatsiya koeffitsienti
Qisman koeffitsient korrelyatsiya - bu ikki xususiyatning konjugatsiya darajasini uchinchisining doimiy qiymati bilan o'lchaydigan ko'rsatkich. Matematik statistika korrelyatsiyani o'rnatishga imkon beradi

Chiziqli ko'p regressiya tenglamasi
Uch o'zgaruvchi o'rtasidagi chiziqli munosabat uchun matematik tenglama ko'plik deyiladi chiziqli tenglama regressiya tekisliklari. U quyidagi umumiy shaklga ega:

Korrelyatsiya munosabati
Agar o'rganilayotgan hodisalar o'rtasidagi bog'liqlik grafikdan aniqlash oson bo'lgan chiziqli munosabatlardan sezilarli darajada chetga chiqsa, u holda korrelyatsiya koeffitsienti bog'lanish o'lchovi sifatida mos kelmaydi. U yo'qligini ko'rsatishi mumkin

Korrelyatsiya munosabatining xossalari
Korrelyatsiya nisbati har qanday shakldagi korrelyatsiya darajasini o'lchaydi. Bundan tashqari, korrelyatsiya munosabati statistik jihatdan katta qiziqish uyg'otadigan bir qator boshqa xususiyatlarga ega

Korrelyatsiya munosabatining reprezentativligi xatosi
Korrelyatsiya munosabatining reprezentativligi xatosining aniq formulasi hali ishlab chiqilmagan. Odatda darsliklarda berilgan formulaning kamchiliklari bor, ularni har doim ham e'tibordan chetda qoldirib bo'lmaydi. Bu formula o'rgatmaydi

Korrelyatsiya chiziqlilik mezoni
Egri chiziqli bog'liqlikning to'g'ri chiziqliga yaqinlashish darajasini aniqlash uchun quyidagi formula bo'yicha hisoblangan F mezoni qo'llaniladi:

Dispersiya kompleksi
Dispersion kompleks - bu o'rganishga jalb qilingan ma'lumotlar va har bir gradatsiya (qisman o'rtacha) va butun kompleks (umumiy o'rtacha) uchun ma'lumotlarning o'rtacha qiymati bilan gradatsiyalar to'plami.

Statistik ta'sirlar
Statistik ta'sir - tadqiqotda tashkil etilgan omil (uning gradatsiyalari) xilma-xilligining natijaviy atributining xilma-xilligida aks etishi. Neo omil ta'sirini baholash

Faktor ta'siri
Faktoriy ta'sir - o'rganilayotgan omillarning oddiy yoki qo'shma statistik ta'siri. Bir omilli komplekslarda bitta omilning oddiy ta'siri ma'lum bir tashkiliy jihatdan o'rganiladi

Bir faktorli dispersiya kompleksi
Dispersiyani tahlil qilish oʻrtacha kvadratlar nisbatining taqsimlanish qonunini kashf etgan ingliz olimi R. A. Fisher tomonidan ishlab chiqilgan va qishloq xoʻjaligi va biologik tadqiqotlar amaliyotiga kiritilgan.

Ko'p omilli dispersiya kompleksi
Haqida aniq fikr matematik model Dispersiyani tahlil qilish zaruriy hisoblash operatsiyalarini tushunishga yordam beradi, ayniqsa ko'p o'lchovli tajribalar ma'lumotlarini qayta ishlashda.

Transformatsiyalar
To'g'ri foydalanish Eksperimental materialni qayta ishlash uchun dispersiyani tahlil qilish variantlar (namunalar) bo'yicha dispersiyalarning bir xilligini, normal yoki normal taqsimotga yaqinligini nazarda tutadi.

Ta'sir kuchining ko'rsatkichlari
Ularning natijalariga ko'ra ta'sir kuchini aniqlash biologiya, qishloq xo'jaligi va tibbiyotda eng ko'p tanlash uchun talab qilinadi. samarali vositalar ta'sirlar, fizik va kimyoviy vositalarning dozalari uchun - st.

Ta'sir kuchining asosiy ko'rsatkichining reprezentativligi xatosi
Ta'sir kuchining asosiy ko'rsatkichi uchun aniq xato formulasi hali topilmagan. Bir omilli komplekslarda reprezentativlik xatosi faqat bitta omil ko'rsatkichi uchun aniqlanganda

Ta'sir ko'rsatkichlarining chegaraviy qiymatlari
Ta'sir kuchining asosiy ko'rsatkichi shartlarning umumiy yig'indisidan bir atama ulushiga teng. Bundan tashqari, bu ko'rsatkich kvadratga teng korrelyatsiya munosabati. Ushbu ikki sababga ko'ra, quvvat ko'rsatkichi

Ta'sirlarning ishonchliligi
Olingan ta'sir kuchining asosiy ko'rsatkichi namunaviy o'rganish, birinchi navbatda, o'rganilayotgan ob'ektlar guruhida haqiqatda o'zini namoyon qilgan ta'sir darajasini tavsiflaydi.

Diskriminant tahlili
Diskriminant tahlil ko'p o'lchovli statistik tahlil usullaridan biridir. Diskriminant tahlilining maqsadi - turli xil xususiyatlarni (xususiyatlar, juftliklar) o'lchash asosida

Muammoning bayoni, yechim usullari, cheklovlari
Faraz qilaylik, m xususiyatga ega n ta ob'ekt bor. O'lchovlar natijasida har bir ob'ekt vektor x1 ... xm, m >1 bilan tavsiflanadi. Muammo shundaki

Taxminlar va cheklovlar
Diskriminant tahlili, agar bir qator taxminlar bajarilsa, "ishlaydi". Kuzatiladigan miqdorlar - ob'ektning o'lchanadigan xususiyatlari - normal taqsimotga ega degan taxmin. Bu

Diskriminantlarni tahlil qilish algoritmi
Diskriminatsiya muammolarini hal qilish (diskriminant tahlil) butun tanlov maydonini (ko'rib chiqilayotgan barcha ko'p o'lchovli tasodifiy o'zgaruvchilarni amalga oshirish to'plami) ma'lum bir raqamga bo'lishdan iborat.

Klaster tahlili
Klaster tahlili birlashtiradi turli protseduralar, tasniflash uchun ishlatiladi. Ushbu protseduralarni qo'llash natijasida ob'ektlarning dastlabki to'plami klasterlarga yoki guruhlarga bo'linadi

Klaster tahlil usullari
Amalda, odatda, aglomerativ klasterlash usullari amalga oshiriladi. Odatda, tasniflash boshlanishidan oldin ma'lumotlar standartlashtiriladi (o'rtacha olinadi va kvadrat ildizga bo'linadi.

Klaster tahlil algoritmi
Klaster tahlili - bu ko'p o'lchovli kuzatishlar yoki ob'ektlar orasidagi masofa tushunchasini aniqlash va keyin ulardan guruhlarni aniqlashga asoslangan ob'ektlarni tasniflash usullari to'plami.

7.1. Chiziqli regressiya tahlili usuli yordamida kuzatishlar majmuasi uchun grafik tanlashdan iborat eng kichik kvadratlar. Regressiya tahlili ba'zilar o'rtasida funktsional munosabatlarni o'rnatishga imkon beradi tasodifiy o'zgaruvchi Y va ba'zi ta'sirlar Y qiymatlar X. Bu bog'liqlik regressiya tenglamasi deb ataladi. oddiy ( y=m*x+b) va ko'plik ( y=m 1 *x 1 +m 2 *x 2 +... + m k *x k +b) chiziqli va chiziqli bo'lmagan turdagi regressiya.
Miqdorlar orasidagi bog'lanish darajasini baholash uchun u ishlatiladi Pearson R ko'p korrelyatsiya koeffitsienti(korrelyatsiya nisbati), u 0 dan 1 gacha qiymatlarni qabul qilishi mumkin. R Agar miqdorlar o'rtasida bog'liqlik bo'lmasa =0, ​​va R Miqdorlar o'rtasida funksional bog'liqlik mavjud bo'lsa =1. Ko'pgina hollarda, R 0 dan 1 gacha oraliq qiymatlarni oladi. Qiymat R 2 chaqirdi aniqlash koeffitsienti.
Regressiyaga bog'liqlikni qurish vazifasi koeffitsientlar vektorini topishdan iborat M ko'p chiziqli regressiya modeli, unda koeffitsient R maksimal qiymatni oladi.
Muhimligini baholash uchun R amal qiladi Fisherning F testi, formula bo'yicha hisoblanadi:

Qayerda n- tajribalar soni; k– model koeffitsientlari soni. Agar F ma'lumotlar uchun ba'zi bir kritik qiymatdan oshib ketadi n Va k va qabul qilindi ishonch ehtimoli, keyin qiymat R muhim hisoblanadi.

7.2. Asbob Regressiya dan Tahlil to'plami quyidagi ma'lumotlarni hisoblash imkonini beradi:

· imkoniyatlar chiziqli funksiya regressiya– eng kichik kvadratlar usuli; regressiya funktsiyasining turi manba ma'lumotlarining tuzilishi bilan belgilanadi;

· determinatsiya koeffitsienti va tegishli miqdorlar(jadval Regressiya statistikasi);

· regressiyaning ahamiyatini tekshirish uchun dispersiya jadvali va mezon statistikasi(jadval Dispersiyani tahlil qilish);

· har bir regressiya koeffitsienti uchun standart og'ish va uning boshqa statistik xarakteristikalari, bu koeffitsientning ahamiyatini tekshirish va unga ishonch oraliqlarini qurish imkonini beradi;

· regressiya funktsiyasi qiymatlari va qoldiqlari- o'zgaruvchining boshlang'ich qiymatlari o'rtasidagi farqlar Y va regressiya funktsiyasining hisoblangan qiymatlari (jadval Balansni yechib olish);

· Y o'zgaruvchining qiymatlariga mos keladigan ehtimolliklar o'sish tartibida tartiblangan(jadval Chiqish ehtimoli).

7.3. orqali tanlash vositasiga qo'ng'iroq qiling Ma'lumotlar > Ma'lumotlarni tahlil qilish > Regressiya.

7.4. Dalada Kirish oralig'i Y qaram o'zgaruvchining qiymatlarini o'z ichiga olgan diapazon manzilini kiriting Y. diapazon bitta ustundan iborat bo'lishi kerak.
Dalada Kirish oralig'i X X o'zgaruvchisi qiymatlarini o'z ichiga olgan diapazon manzilini kiriting. Diapazon bir yoki bir nechta ustundan iborat bo'lishi kerak, lekin 16 ta ustundan oshmasligi kerak. Maydonlarda ko'rsatilgan bo'lsa Kirish oralig'i Y Va Kirish oralig'i X diapazonlar ustun sarlavhalarini o'z ichiga oladi, keyin parametr qutisini belgilashingiz kerak Teglar- bu sarlavhalar asbob tomonidan yaratilgan chiqish jadvallarida qo'llaniladi Regressiya.
Variantni belgilash katagi Doimiy - nol Agar regressiya tenglamasi doimiyga ega bo'lsa, o'rnatilishi kerak b nolga teng majburlanadi.
Variant Ishonchlilik darajasi sukut bo'yicha qo'llaniladigan 0,95 dan boshqa ishonch darajasiga ega regressiya koeffitsientlari uchun ishonch oraliqlarini qurish zarur bo'lganda o'rnatiladi. Variantlar katagiga belgi qo'ygandan so'ng Ishonchlilik darajasi Yangi ishonch darajasi qiymati kiritilgan kirish maydoni mavjud bo'ladi.
Hududda Qolganlar To'rtta variant mavjud: Qolganlar, Standartlashtirilgan balanslar, Balans jadvali Va Tanlov taqvimi. Agar ulardan kamida bittasi o'rnatilgan bo'lsa, jadval chiqish natijalarida paydo bo'ladi Balansni yechib olish, bu regressiya funktsiyasining qiymatlari va qoldiqlarni ko'rsatadi - Y o'zgaruvchisining boshlang'ich qiymatlari va regressiya funktsiyasining hisoblangan qiymatlari o'rtasidagi farqlar. Hududda Oddiy ehtimollik Bitta variant bor - ; uning o'rnatilishi chiqish natijalarida jadval hosil qiladi Chiqish ehtimoli va tegishli grafikni qurishga olib keladi.


7.5. Rasmga muvofiq parametrlarni o'rnating. Y qiymati birinchi o'zgaruvchi (nomli katakni o'z ichiga olgan holda) va X qiymati boshqa ikkita o'zgaruvchi (nomlari bo'lgan katakchalar bilan birga) ekanligiga ishonch hosil qiling. bosing KELISHDIKMI.

7.6. Jadvalda Regressiya statistikasi Quyidagi ma'lumotlar taqdim etiladi.

Koʻplik R– keyingi qatorda berilgan R 2 aniqlash koeffitsientining ildizi. Ushbu ko'rsatkichning boshqa nomi korrelyatsiya indeksi yoki ko'p korrelyatsiya koeffitsientidir.

R-kvadrat– aniqlash koeffitsienti R 2 ; nisbat sifatida hisoblanadi kvadratlarning regressiya yig'indisi(C12 katak) ga kvadratlarning umumiy yig'indisi(C14 hujayra).

Normallashtirilgan R-kvadrat formula bo'yicha hisoblanadi

Bu erda n - Y o'zgaruvchisining qiymatlari soni, k - X o'zgaruvchisining kirish oralig'idagi ustunlar soni.

Standart xato– qoldiq dispersiyaning ildizi (D13 katakcha).

Kuzatishlar- Y o'zgaruvchisi qiymatlari soni.

7.7. IN Dispersiya jadvali ustunda SS ustunda kvadratlarning yig'indisi berilgan df- erkinlik darajalari soni. ustunda XONIM- dispersiya. Mos ravishda Regressiya ustunda f Mezon statistikasining qiymati regressiyaning ahamiyatini tekshirish uchun hisoblab chiqilgan. Bu qiymat regressiya dispersiyasining qoldiq dispersiyaga nisbati sifatida hisoblanadi (D12 va D13 katakchalar). Ustun ichida Ahamiyati F mezon statistikasining olingan qiymatining ehtimolligi hisoblanadi. Agar bu ehtimollik, masalan, 0,05 dan (ma'lum ahamiyatga egalik darajasi) kichik bo'lsa, u holda regressiyaning ahamiyatsizligi haqidagi gipoteza (ya'ni, regressiya funktsiyasining barcha koeffitsientlari nolga teng degan gipoteza) rad etiladi va regressiya: ahamiyatli deb hisoblanadi. Ushbu misolda regressiya ahamiyatli emas.

7.8. Quyidagi jadvalda, ustunda Imkoniyatlar, regressiya funktsiyasi koeffitsientlarining hisoblangan qiymatlari qatorda yoziladi Y - chorraha erkin muddatning qiymati yoziladi b. Ustun ichida Standart xato Koeffitsientlarning standart og'ishlari hisoblab chiqilgan.
Ustun ichida t-statistika Koeffitsient qiymatlarining ularning standart og'ishlariga nisbati qayd etiladi. Bular regressiya koeffitsientlarining ahamiyati haqidagi gipotezalarni sinab ko'rish uchun mezon statistikasi qiymatlari.
Ustun ichida P-qiymati mezon statistikasi qiymatlariga mos keladigan ahamiyatlilik darajalari hisoblanadi. Hisoblangan ahamiyatlilik darajasi belgilangan muhimlik darajasidan past bo'lsa (masalan, 0,05). keyin koeffitsient noldan sezilarli darajada farq qiladi degan gipoteza qabul qilinadi; aks holda, koeffitsient noldan arzimas farq qiladi degan gipoteza qabul qilinadi. Ushbu misolda faqat koeffitsient b noldan sezilarli darajada farq qiladi, qolganlari - ahamiyatsiz.
Ustunlarda Pastki 95% Va Yuqori 95% 0,95 ishonch darajasiga ega ishonch oraliqlarining chegaralari berilgan. Ushbu chegaralar formulalar yordamida hisoblanadi
Pastki 95% = Koeffitsient - Standart xato * t a;
Yuqori 95% = Koeffitsient + Standart xato * t a.
Bu yerga t a- buyurtma miqdori α (n-k-1) erkinlik darajasi bilan talaba t taqsimoti. IN Ushbu holatda α = 0,95. Ustunlardagi ishonch oraliqlarining chegaralari xuddi shu tarzda hisoblanadi Pastki 90,0% Va Yuqori 90,0%.

7.9. Jadvalni ko'rib chiqing Balansni yechib olish chiqish natijalaridan. Ushbu jadval hududda kamida bitta variant o'rnatilgan bo'lsa, chiqish natijalarida paydo bo'ladi Qolganlar dialog oynasi Regressiya.

Ustun ichida Kuzatuv o'zgaruvchan qiymatlarning seriya raqamlari berilgan Y.
Ustun ichida Bashorat qilingan Y y i = f(x i) regressiya funksiyasining qiymatlari o‘zgaruvchining o‘sha qiymatlari uchun hisoblanadi. X ga mos keladi tartib raqam i ustunda Kuzatuv.
Ustun ichida Qolganlar farqlarni (qoldiqlarni) o'z ichiga oladi e i =Y-y i va ustun Standart balanslar– e i / s e nisbatlar sifatida hisoblangan normalangan qoldiqlar. bu erda s e - qoldiqlarning standart og'ishi. s e qiymatining kvadrati formula yordamida hisoblanadi

qoldiqlarning o'rtacha qiymati qayerda. Qiymat dispersiya jadvalidagi ikkita qiymatning nisbati sifatida hisoblanishi mumkin: kvadrat qoldiqlar yig'indisi (C13 hujayra) va qatordan erkinlik darajalari Jami(B14 hujayra).

7.10. Jadval qiymatlari bo'yicha Balansni yechib olish Ikki turdagi grafikalar quriladi: qoldiq jadvallari Va tanlov jadvallari(agar hududda tegishli variantlar o'rnatilgan bo'lsa Qolganlar dialog oynasi Regressiya). Ular har bir o'zgaruvchan komponent uchun qurilgan X alohida.

Yoniq balans jadvallari balanslar ko'rsatiladi, ya'ni. asl qiymatlar orasidagi farq Y va o'zgaruvchan komponentning har bir qiymati uchun regressiya funktsiyasidan hisoblangan X.

Yoniq tanlov jadvallari har bir o'zgaruvchan komponent qiymati uchun asl Y qiymatlarini va hisoblangan regressiya funktsiyasi qiymatlarini ko'rsatadi X.

7.11. Chiqish natijalarining oxirgi jadvali jadvaldir Chiqish ehtimoli. U dialog oynasida paydo bo'ladi Regressiya opsiyasi o'rnatilgan Oddiy ehtimollik grafigi.
Ustun qiymatlari Foiz quyidagicha hisoblanadi. Qadam hisoblab chiqiladi h = (1/n)*100%, birinchi qiymat h/2, ikkinchisi teng 100 soat/2. Ikkinchi qiymatdan boshlab, har bir keyingi qiymat avvalgisiga teng bo'lib, unga qadam qo'shiladi h.
Ustun ichida Y o'zgaruvchan qiymatlar berilgan Y, ortib borish tartibida tartiblangan. Ushbu jadvaldagi ma'lumotlarga asoslanib, shunday deb ataladi normal taqsimot grafigi. Bu o'zgaruvchilar orasidagi munosabatlarning chiziqlilik darajasini vizual baholash imkonini beradi X Va Y.


8. D dispersiya tahlili

8.1. Tahlil to'plami uch xil dispersiyani tahlil qilish imkonini beradi. Muayyan asbobni tanlash omillar soni va o'rganilayotgan ma'lumotlar to'plamidagi namunalar soni bilan belgilanadi.
bir xil populyatsiyaga mansub ikki yoki undan ortiq namunalarning o'rtachalari o'xshash degan gipotezani tekshirish uchun foydalaniladi.
Takrorlashlar bilan ikki tomonlama ANOVA murakkabroq variant hisoblanadi bir o'zgaruvchan tahlil, shu jumladan, har bir ma'lumotlar guruhi uchun bir nechta namunalar.
Ikki tomonlama ANOVA takrorlashsiz har bir guruhga bir nechta namunani o'z ichiga olmaydi dispersiyaning ikki tomonlama tahlili. Ikki yoki undan ortiq namunalarning vositalari bir xil (namunalar bir xil populyatsiyaga tegishli) degan gipotezani tekshirish uchun ishlatiladi.

8.2. Bir tomonlama ANOVA

8.2.1. Keling, ma'lumotlarni tahlil qilish uchun tayyorlaylik. Yangi varaq yarating va unga ustunlarni ko'chiring A B C D. Birinchi ikkita qatorni olib tashlang. Tayyorlangan ma'lumotlar o'tkazish uchun ishlatilishi mumkin Dispersiyani bir tomonlama tahlil qilish.

8.2.2. orqali tanlash vositasiga qo'ng'iroq qiling Ma'lumotlar > Ma'lumotlarni tahlil qilish > Bir tomonlama ANOVA. Rasmga muvofiq to'ldiring. bosing KELISHDIKMI.

8.2.3. Jadvalni ko'rib chiqing Natijalar: Tekshirish- takrorlashlar soni; so'm- qatorlar bo'yicha ko'rsatkich qiymatlari yig'indisi, Dispersiya– indikatorning qisman dispersiyasi.

8.2.4. Jadval Dispersiyani tahlil qilish: birinchi ustun O'zgaruvchanlik manbai dispersiyalarning nomini o'z ichiga oladi, SS- kvadrat og'ishlar yig'indisi, df- erkinlik darajasi; XONIM- o'rtacha kvadrat, F-testi haqiqiy F taqsimoti. P-qiymati- tenglama tomonidan qayta ishlab chiqarilgan dispersiyaning qoldiqlarning dispersiyasiga teng bo'lish ehtimoli. Olingan omillar va natija o'rtasidagi bog'liqlikni miqdoriy aniqlash tasodifiy deb hisoblanishi ehtimolini belgilaydi. F-tanqidiy nazariy F qiymati bo'lib, keyinchalik u haqiqiy F bilan taqqoslanadi.

8.2.5. Tenglikning nol gipotezasi matematik taxminlar tengsizlik bo'lsa, barcha namunalar qabul qilinadi F-testi < F-tanqidiy. bu gipotezani rad qilish kerak. Bunday holda, namunalarning o'rtacha qiymatlari sezilarli darajada farq qiladi.

IN regressiya statistikasi ko'p korrelyatsiya koeffitsienti ko'rsatilgan (ko‘plik R) va qat'iyat (R-kvadrat) Y va omil xarakteristikalari qatori o'rtasida (korrelyatsiya tahlilida ilgari olingan qiymatlarga to'g'ri keladi)

Jadvalning o'rta qismi (O'zgaruvchanlik tahlili) regressiya tenglamasining ahamiyatini tekshirish uchun zarur.

Jadvalning pastki qismi - aniq

yakuniy baholar bi umumiy regressiya koeffitsientlari bi, ularning ahamiyatini va intervalli baholashni sinab ko'rish.

b koeffitsientlari vektorini baholash (ustun Imkoniyatlar):

Keyin regressiya tenglamasining taxmini quyidagi ko'rinishga ega bo'ladi:

Regressiya tenglamasining ahamiyatini va natijada olingan regressiya koeffitsientlarini tekshirish kerak.

Regressiya tenglamasining ahamiyatini b=0,05 darajasida tekshiramiz, ya'ni. gipoteza H0: v1=v2=v3=…=vk=0. Buning uchun F-statistikaning kuzatilgan qiymati hisoblanadi:

Excel buni natijalarda ko'rsatadi dispersiyani tahlil qilish:

QR=527,4296; Qost=1109.8673 =>

Ustun ichida F qiymati ko'rsatilgan Fkuzatilishi mumkin.

F-tarqatish jadvallaridan yoki o'rnatilgan statistik funktsiyadan foydalanish FKASHF ET muhimlik darajasi b=0,05 va n1=k=4 maxraji va n2=n-k-1=45 maxrajining erkinlik darajalari soni uchun F-statistikaning kritik qiymatini ga teng deb topamiz.

Fcr = 2,578739184

F-statistikaning kuzatilgan qiymati uning kritik qiymatidan 8,1957 > 2,7587 dan oshib ketganligi sababli, koeffitsientlar vektorining tengligi haqidagi gipoteza 0,05 xatolik ehtimoli bilan rad etiladi. Binobarin, b=(b1,b2,b3,b4)T vektorining kamida bitta elementi noldan sezilarli farq qiladi.

Keling, regressiya tenglamasining individual koeffitsientlarining ahamiyatini tekshirib ko'raylik, ya'ni. gipoteza .

Regressiya koeffitsientlarining ahamiyatini tekshirish muhimlik darajasi uchun t-statistik ma'lumotlar asosida amalga oshiriladi.

T-statistikaning kuzatilgan qiymatlari ustundagi natijalar jadvalida ko'rsatilgan t-statistika.

Koeffitsientlar (bi)

t-statistika (tob)

Y - chorraha

X5 o'zgaruvchisi

X7 o'zgaruvchisi

X10 o'zgaruvchisi

X15 o'zgaruvchisi

Ularni muhimlik darajasi b=0,05 va erkinlik darajalari soni n=n – k - 1 uchun topilgan tcr kritik qiymati bilan solishtirish kerak.

Buning uchun biz o'rnatilgan Excel statistik funksiyasidan foydalanamiz STUDISPOBR, taklif qilingan menyuga kirib, ehtimollik b = 0,05 va erkinlik darajalari soni n = n–k-1 = 50-4-1 = 45. (Siz tcr qiymatlarini matematik statistika jadvallaridan topishingiz mumkin.

Biz tcr = 2.014103359 ni olamiz.

Kuzatilgan qiymat uchun t-statistika mutlaq qiymatda kritikdan kichik 2,0141>|-0,0872|, 2,0141>|0,2630|, 2,0141>|0,7300|, 2,0141>|-1,6629 |.

Binobarin, bu koeffitsientlar nolga teng degan gipoteza 0,05 xatolik ehtimoli bilan rad etilmaydi, ya'ni. mos keladigan koeffitsientlar ahamiyatsiz.

Kuzatilgan t-statistik qiymat uchun kattaroqdir kritik qiymat modul |3.7658|>2.0141, shuning uchun H0 gipotezasi rad etiladi, ya'ni. - muhim

Regressiya koeffitsientlarining ahamiyati natijaviy jadvalning quyidagi ustunlari bilan ham tekshiriladi:

Ustun p-ma'nosi 5% chegara darajasida model parametrlarining ahamiyatini ko'rsatadi, ya'ni. agar p≤0,05 bo'lsa, unda mos keladigan koeffitsient muhim hisoblanadi, agar p>0,05 bo'lsa, unda ahamiyatsiz.

Va oxirgi ustunlar - past 95% Va yuqori 95% Va pastki 98% Va yuqori 98% - bu r = 0,95 (har doim chiqarilgan) va r = 0,98 (tegishli qo'shimcha ishonchlilik o'rnatilganda chiqariladi) uchun belgilangan ishonchlilik darajalari bilan regressiya koeffitsientlarining intervalli baholari.

Agar pastki va yuqori chegaralar bir xil belgiga ega (nol kiritilmagan ishonch oralig'i), keyin tegishli regressiya koeffitsienti muhim hisoblanadi, aks holda - ahamiyatsiz

Jadvaldan ko'rinib turibdiki, b3 koeffitsienti uchun p-qiymati p=0,0005<0,05 и доверительные интервалы не включают ноль, т.е. по всем проверочным критериям этот коэффициент является значимым.

Ahamiyatsiz regressorlarni chiqarib tashlash bilan bosqichma-bosqich regressiya tahlili algoritmiga ko'ra, keyingi bosqichda ahamiyatsiz regressiya koeffitsientiga ega bo'lgan o'zgaruvchini ko'rib chiqishdan chiqarib tashlash kerak.

Agar regressiyani baholashda bir nechta ahamiyatsiz koeffitsientlar aniqlansa, regressiya tenglamasidan birinchi bo'lib t-statistika () mutlaq qiymatda minimal bo'lgan regressor chiqarib tashlanadi. Ushbu printsipga ko'ra, keyingi bosqichda ahamiyatsiz regressiya koeffitsienti b2 bo'lgan X5 o'zgaruvchisini chiqarib tashlash kerak.

REGRESSION TAHLILINI II BOSQICHI.

Model X7, X10, X15 faktor xususiyatlarini o'z ichiga oladi va X5 bundan mustasno.

NATIJALARNING XULOSASI

Regressiya statistikasi

Koʻplik R

R-kvadrat

Normallashtirilgan R-kvadrat

Standart xato

Kuzatishlar

Dispersiyani tahlil qilish

(erkinlik darajalari soni n)

(kvadrat og'ishlar yig'indisi Q)

(o'rtacha kvadrat MS = SS/n)

(Fobs = MSR/MSost)

Ahamiyati F

Regressiya

Imkoniyatlar

Standart xato

t-statistika

P-qiymati

Yuqori 95% (bimax)

Pastroq 98% (bimin)

Y - chorraha

X7 o'zgaruvchisi

X10 o'zgaruvchisi

X15 o'zgaruvchisi



Saytda yangi

>

Eng mashhur