Гэр Бохь Регрессийн шинжилгээний загварт ямар шаардлага тавигддаг вэ. Математик статистикийн аргууд

Регрессийн шинжилгээний загварт ямар шаардлага тавигддаг вэ. Математик статистикийн аргууд

ҮР ДҮНГИЙН ДҮГНЭЛТ

Хүснэгт 8.3a. Регрессийн статистик
Регрессийн статистик
Олон тооны Р 0,998364
R-дөрвөлжин 0,99673
Нормчилсан R квадрат 0,996321
Стандарт алдаа 0,42405
Ажиглалт 10

Эхлээд авч үзье дээд хэсэг 8.3а хүснэгтэд үзүүлсэн тооцоолол - регрессийн статистик.

Тодорхой байдлын хэмжүүр гэж нэрлэгддэг R-квадрат утга нь үүссэн регрессийн шугамын чанарыг тодорхойлдог. Энэ чанар нь эх өгөгдөл болон регрессийн загвар (тооцоолсон өгөгдөл) хоорондын уялдаа холбоогоор илэрхийлэгддэг. Тодорхой байдлын хэмжүүр нь үргэлж интервал дотор байдаг.

Ихэнх тохиолдолд R квадрат утга нь эдгээр утгуудын хооронд унадаг бөгөөд үүнийг туйлын утга гэж нэрлэдэг, i.e. тэг ба нэг хооронд.

Хэрэв R-квадрат утга нэгтэй ойролцоо байвал уг загвар нь холбогдох хувьсагчдын бараг бүх хувьсагчийг тайлбарладаг гэсэн үг юм. Үүний эсрэгээр, R-квадрат утга нь тэгтэй ойролцоо байвал бүтээсэн загварын чанар муу байна гэсэн үг.

Бидний жишээн дээр тодорхой байдлын хэмжүүр нь 0.99673 бөгөөд энэ нь регрессийн шугам нь анхны өгөгдөлтэй маш сайн тохирч байгааг харуулж байна.

Олон тооны Р- олон корреляцийн коэффициент R - бие даасан хувьсагч (X) ба хамааралтай хувьсагчийн (Y) хамаарлын зэргийг илэрхийлнэ.

Олон R нь тэнцүү квадрат язгууртодорхойлох коэффициентээс энэ хэмжигдэхүүн нь тэгээс нэг хүртэлх утгыг авна.

Энгийн шугаман регрессийн шинжилгээнд олон R нь Пирсон корреляцийн коэффициенттэй тэнцүү байна. Үнэн хэрэгтээ манай тохиолдолд олон тооны R нь өмнөх жишээний (0.998364) Pearson корреляцийн коэффициенттэй тэнцүү байна.

Хүснэгт 8.3б. Регрессийн коэффициентүүд
Магадлал Стандарт алдаа t-статистик
Y уулзвар 2,694545455 0,33176878 8,121757129
Хувьсагч X 1 2,305454545 0,04668634 49,38177965
* Тооцооллын тайрсан хувилбарыг өгсөн болно

Одоо хүснэгт 8.3b-д үзүүлсэн тооцооллын дунд хэсгийг авч үзье. Энд регрессийн коэффициент b (2.305454545) ба ордны тэнхлэгийн дагуух шилжилтийг өгөгдсөн, өөрөөр хэлбэл. тогтмол a (2.694545455).

Тооцоолол дээр үндэслэн бид регрессийн тэгшитгэлийг дараах байдлаар бичиж болно.

Ү= x*2.305454545+2.694545455

Хувьсагчдын хоорондын харилцааны чиглэлийг шинж тэмдгүүд (сөрөг эсвэл эерэг) дээр үндэслэн тодорхойлно. регрессийн коэффициентууд(коэффицент b).

Хэрэв тэмдэг байвал регрессийн коэффициент- эерэг бол хамааралтай хувьсагч ба бие даасан хувьсагчийн хоорондын хамаарал эерэг байх болно. Манай тохиолдолд регрессийн коэффициентийн тэмдэг эерэг байгаа тул хамаарал нь мөн эерэг байна.

Хэрэв тэмдэг байвал регрессийн коэффициент- сөрөг, хамааралтай хувьсагч ба бие даасан хувьсагчийн хоорондын хамаарал сөрөг (урвуу).

Хүснэгт 8.3в. Үлдэгдэл гаргалгааны үр дүнг үзүүлэв. Эдгээр үр дүнг тайланд харуулахын тулд та "Регресс" хэрэгслийг ажиллуулахдаа "Үлдэгдэл" нүдийг идэвхжүүлэх ёстой.

Үлдсэнийг нь эргүүлэн татах

Хүснэгт 8.3c. Үлдэгдэл
Ажиглалт Таамагласан Y Үлдэгдэл Стандарт үлдэгдэл
1 9,610909091 -0,610909091 -1,528044662
2 7,305454545 -0,305454545 -0,764022331
3 11,91636364 0,083636364 0,209196591
4 14,22181818 0,778181818 1,946437843
5 16,52727273 0,472727273 1,182415512
6 18,83272727 0,167272727 0,418393181
7 21,13818182 -0,138181818 -0,34562915
8 23,44363636 -0,043636364 -0,109146047
9 25,74909091 -0,149090909 -0,372915662
10 28,05454545 -0,254545455 -0,636685276

Тайлангийн энэ хэсгийг ашиглан бид регрессийн байгуулсан шугамаас цэг бүрийн хазайлтыг харж болно. Хамгийн том үнэмлэхүй утга

Регрессийн шинжилгээний зорилго нь хамааралтай хувьсагч ба нэг (хос регрессийн шинжилгээ) ба түүнээс дээш (олон) бие даасан хувьсагчийн хоорондын хамаарлыг хэмжихэд оршино. Бие даасан хувьсагчдыг хүчин зүйл, тайлбарлагч, тодорхойлогч, регресс, таамаглагч хувьсагч гэж нэрлэдэг.

Хамаарах хувьсагчийг тодорхойлогдсон, тайлбарласан эсвэл "хариу" хувьсагч гэж нэрлэдэг. Эмпирик судалгаанд регрессийн шинжилгээг маш өргөнөөр ашиглаж байгаа нь зөвхөн таамаглалыг шалгахад тохиромжтой хэрэглүүр болсонтой холбоотой биш юм. Регресс, ялангуяа олон регресс нь юм үр дүнтэй аргазагварчлал ба таамаглал.

Регрессийн шинжилгээтэй ажиллах зарчмуудыг илүү энгийн буюу хос аргаар тайлбарлаж эхэлцгээе.

Хосолсон регрессийн шинжилгээ

Регрессийн шинжилгээг ашиглах эхний алхамууд нь корреляцийн коэффициентийг тооцоолоход бидний хийсэн алхамтай бараг ижил байх болно. Үр дүнтэй байх гурван үндсэн нөхцөл корреляцийн шинжилгээПирсоны аргын дагуу - хувьсагчийн хэвийн тархалт, хувьсагчдын интервалын хэмжилт, хувьсагчдын хоорондох шугаман хамаарал - олон регрессийн хувьд мөн хамааралтай. Үүний дагуу эхний шатанд тархалтын графикийг байгуулж, хувьсагчдын статистик болон тайлбарласан шинжилгээг хийж, регрессийн шугамыг тооцоолно. Корреляцийн шинжилгээний хүрээнд регрессийн шугамыг уг аргыг ашиглан байгуулдаг хамгийн бага квадратууд.

Өгөгдлийн шинжилгээний хоёр аргын ялгааг илүү тодорхой харуулахын тулд "SPS дэмжлэг" болон "хөдөөгийн хүн амын эзлэх хувь" хувьсагчаар аль хэдийн хэлэлцсэн жишээнд хандъя. Эх сурвалжийн өгөгдөл нь ижил байна. Тархалтын графикуудын ялгаа нь регрессийн шинжилгээнд хамааралтай хувьсагчийг зурах нь зөв байх болно - манай тохиолдолд Y тэнхлэгт "SPS дэмжлэг" байх боловч корреляцийн шинжилгээнд энэ нь хамаагүй. Хажуу утгыг цэвэрлэсний дараа тархалтын график дараах байдалтай байна.

Регрессийн шинжилгээний үндсэн санаа нь байх явдал юм ерөнхий чиг хандлагаХувьсагчдын хувьд - регрессийн шугам хэлбэрээр - бие даасан хувьсагчийн утгыг харгалзан та хамааралтай хувьсагчийн утгыг урьдчилан таамаглах боломжтой.

Ердийн математикийг төсөөлөөд үз дээ шугаман функц. Евклидийн орон зай дахь аливаа шулуун шугамыг дараах томъёогоор тодорхойлж болно.

энд a нь ордны тэнхлэгийн дагуух шилжилтийг тодорхойлсон тогтмол; b нь шугамын налуу өнцгийг тодорхойлох коэффициент юм.

Налуу ба тогтмолыг мэдсэнээр та дурын x-ийн хувьд y-ийн утгыг тооцоолж (урьдчилан таамаглах) боломжтой.

Энэ хамгийн энгийн функц y-ийн утгыг яг таг урьдчилан таамаглахгүй, харин тодорхой хэмжээнд байх болно гэсэн анхааруулга бүхий регрессийн шинжилгээний загварын үндэс суурийг тавьсан. итгэлийн интервал, өөрөөр хэлбэл ойролцоогоор.

Тогтмол нь регрессийн шугам ба у тэнхлэгийн огтлолцох цэг юм (F- огтлолцол, статистикийн багцад ихэвчлэн "хэсэглэгч" гэж тэмдэглэдэг). Бидний жишээн дээр "Зөв хүчний холбоо"-д санал өгөхдөө дугуйрсан утга нь 10.55 болно. Өнцгийн коэффициент b нь ойролцоогоор -0.1 байх болно (корреляцийн шинжилгээнд тэмдэглэгээ нь холболтын төрлийг харуулж байна - шууд эсвэл урвуу). Тиймээс үүссэн загвар нь SP C = -0.1 x Sel хэлбэртэй болно. бид. + 10.55.

ATP = -0.10 x 47 + 10.55 = 5.63.

Анхны болон урьдчилан таамагласан утгуудын хоорондох ялгааг үлдэгдэл гэж нэрлэдэг (боломжийн хүснэгтэд дүн шинжилгээ хийхдээ статистикийн үндэс болсон энэ нэр томъёог бид аль хэдийн олж мэдсэн). Тиймээс, "Адыгей Бүгд Найрамдах Улс" -ын хувьд үлдэгдэл нь 3.92 - 5.63 = -1.71 байна. Үлдэгдэл модульчлагдсан утга их байх тусам таамагласан утга нь амжилтгүй болно.

Бид бүх тохиолдлын хувьд таамагласан утга ба үлдэгдлийг тооцдог.
Болж байна Суусан. бид. THX

(эх)

THX

(урьдчилан таамагласан)

Үлдэгдэл
Адыгей Бүгд Найрамдах Улс 47 3,92 5,63 -1,71 -
Алтайн бүгд найрамдах улс 76 5,4 2,59 2,81
Бүгд Найрамдах Башкортостан Улс 36 6,04 6,78 -0,74
Бүгд Найрамдах Буриад Улс 41 8,36 6,25 2,11
Бүгд Найрамдах Дагестан Улс 59 1,22 4,37 -3,15
Бүгд Найрамдах Ингушет Улс 59 0,38 4,37 3,99
гэх мэт.

Анхны болон урьдчилан таамагласан утгуудын харьцааны дүн шинжилгээ нь үүссэн загварын чанар, түүний урьдчилан таамаглах чадварыг үнэлэхэд тусалдаг. Регрессийн статистикийн гол үзүүлэлтүүдийн нэг бол олон корреляцийн коэффициент R - хамааралтай хувьсагчийн анхны болон таамагласан утгуудын хоорондын хамаарлын коэффициент юм. Хосолсон регрессийн шинжилгээнд энэ нь хамааралтай ба бие даасан хувьсагчдын хоорондох ердийн Пирсон корреляцийн коэффициенттэй тэнцүү, манай тохиолдолд 0.63 байна. Олон R-ийг утга учиртай тайлбарлахын тулд үүнийг детерминацын коэффициент болгон хувиргах шаардлагатай. Үүнийг корреляцийн шинжилгээтэй ижил аргаар хийдэг - квадратаар. Детерминацийн коэффициент R-squared (R 2) нь хамааралгүй хувьсагч(ууд)-аар тайлбарлагдах хамааралтай хувьсагчийн хувьсах хувийг харуулдаг.

Манай тохиолдолд R 2 = 0.39 (0.63 2); Энэ нь "хөдөөгийн хүн амын эзлэх хувь" хувьсагч "SPS дэмжлэг" хувьсагчийн хэлбэлзлийн ойролцоогоор 40%-ийг тайлбарлаж байна гэсэн үг. Тодорхойлох коэффициент их байх тусам загварын чанар өндөр болно.

Загварын чанарын өөр нэг үзүүлэлт бол тооцооллын стандарт алдаа юм. Энэ нь регрессийн шугамын эргэн тойронд цэгүүд хэр өргөн "тарагдсан" хэмжүүр юм. Интервалын хувьсагчдын тархалтын хэмжүүр нь стандарт хэлбэлзэл. Үүний дагуу тооцооллын стандарт алдаа нь үлдэгдэл хуваарилалтын стандарт хазайлт юм. Түүний үнэ цэнэ өндөр байх тусам тархалт ихсэх ба загвар нь муу болно. Манай тохиолдолд стандарт алдаа нь 2.18 байна. Энэ хэмжээгээр манай загвар "SPS дэмжлэг" хувьсагчийн утгыг таамаглахдаа "дунджаар алдаа гаргах" болно.

Регрессийн статистикт мөн дисперсийн шинжилгээ орно. Үүний тусламжтайгаар бид дараахь зүйлийг олж мэдэв: 1) хамааралтай хувьсагчийн өөрчлөлтийн (тархалтын) ямар хувь нь бие даасан хувьсагчаар тайлбарлагдаж байгааг; 2) үлдэгдэл (тайлагдаагүй хэсэг) хамааралтай хувьсагчийн дисперсийн хэдэн хувийг эзэлдэг; 3) энэ хоёр хэмжигдэхүүний харьцаа хэд вэ (/"-харьцаа).Таралтын статистик нь ялангуяа чухал ач холбогдолтой дээж судалгаа- энэ нь бие даасан болон хамааралтай хувьсагчдын хооронд хамаарал хэр байгааг харуулж байна хүн ам. Гэсэн хэдий ч, тэр ч байтугай тасралтгүй судалгаа (бидний жишээ шиг), үр дүнг судлах дисперсийн шинжилгээашиггүй. Энэ тохиолдолд тэд тодорхойлсон статистикийн хэв маяг нь санамсаргүй нөхцөл байдлын давхцлаас үүдэлтэй эсэх, судалж буй популяци байрладаг нөхцөл байдлын хувьд хэр хэвийн байгааг шалгадаг. Энэ нь зарим томоохон хүн амын хувьд олж авсан үр дүнгийн үнэн биш, харин түүний тогтмол байдал, санамсаргүй нөлөөллөөс ангид байх зэрэг нь тогтоогдсон байдаг.

Манай тохиолдолд ANOVA статистик нь дараах байдалтай байна.

SS df MS Ф утга учир
Регресс. 258,77 1,00 258,77 54,29 0.000000001
Үлдэгдэл 395,59 83,00 Л,11
Нийт 654,36

54.29-ийн F-харьцаа нь 0.0000000001 түвшинд чухал ач холбогдолтой. Үүний дагуу бид тэг таамаглалыг (бидний нээсэн харилцаа тохиолдлын улмаас үүссэн) итгэлтэйгээр үгүйсгэж чадна.

t шалгуур нь ижил төстэй функцийг гүйцэтгэдэг боловч регрессийн коэффициентүүдтэй (өнцгийн ба F огтлолцол) хамааралтай. / шалгуурыг ашиглан бид ерөнхий популяцид регрессийн коэффициентүүд тэгтэй тэнцүү гэсэн таамаглалыг туршиж үздэг. Манай тохиолдолд бид тэг таамаглалыг дахин итгэлтэйгээр үгүйсгэж чадна.

Олон регрессийн шинжилгээ

Загвар олон регрессхосолсон регрессийн загвартай бараг адилхан; Ганц ялгаа нь шугаман функцэд хэд хэдэн бие даасан хувьсагчийг дараалан оруулсан явдал юм.

Y = b1X1 + b2X2 + …+ bpXp + a.

Хэрэв хоёроос олон бие даасан хувьсагч байгаа бол бид тэдгээрийн хамаарлын талаар харааны санааг олж авах боломжгүй бөгөөд үүнтэй холбогдуулан олон тооны регресс нь хос регрессээс бага "харагдах" юм. Хоёр бие даасан хувьсагчтай бол өгөгдлийг 3D тархалтын график дээр харуулах нь ашигтай байж болно. Мэргэжлийн статистикийн програм хангамжийн багцад (жишээлбэл, Statistica) гурван хэмжээст диаграмыг эргүүлэх сонголт байдаг бөгөөд энэ нь өгөгдлийн бүтцийг нүдээр харуулах боломжийг олгодог.

Хос регрессийн эсрэг олон регресстэй ажиллахдаа шинжилгээний алгоритмыг тодорхойлох шаардлагатай. Стандарт алгоритм нь эцсийн регрессийн загварт байгаа бүх таамаглагчдыг багтаасан болно. Алхам алхмаар алгоритмБие даасан хувьсагчдыг тайлбарлах "жин" дээр үндэслэн дараалан оруулах (хасах) орно. Олон бие даасан хувьсагчтай үед шаталсан арга нь сайн; энэ нь илэн далангүй сул таамаглагчдын загварыг "цэвэрлэж", илүү нягт, товч болгодог.

Олон тооны регрессийн зөв байдлын нэмэлт нөхцөл (интервал, хэвийн байдал, шугаман байдлын хамт) нь олон шугаман байдал байхгүй - бие даасан хувьсагчдын хооронд хүчтэй хамаарал байх явдал юм.

Олон тооны регрессийн статистикийн тайлбар нь хос регрессийн тохиолдолд авч үзсэн бүх элементүүдийг агуулдаг. Үүнээс гадна олон регрессийн шинжилгээний статистикийн бусад чухал бүрэлдэхүүн хэсгүүд байдаг.

Бид Оросын бүс нутаг дахь сонгуулийн үйл ажиллагааны түвшний ялгааг тайлбарласан таамаглалыг турших жишээн дээр олон тооны регресс бүхий ажлыг харуулах болно. Тусгай эмпирик судалгаагаар сонгогчдын ирцийн түвшинд дараахь зүйлс нөлөөлдөг болохыг харуулж байна.

Үндэсний хүчин зүйл (хувьсагч "Оросын хүн ам"; ОХУ-ын бүрдүүлэгч байгууллагууд дахь Оросын хүн амын эзлэх хувь хэлбэрээр үйл ажиллагаа явуулдаг). Оросын хүн амын эзлэх хувь нэмэгдэх нь сонгогчдын ирц буурахад хүргэдэг гэж үздэг;

Хотжилтын хүчин зүйл (хувьсагч" хотын хүн ам"; ОХУ-ын бүрдүүлэгч байгууллагуудад хотын хүн амын эзлэх хувь гэж тооцогдоно, бид корреляцийн шинжилгээний хүрээнд энэ хүчин зүйлтэй аль хэдийн ажиллаж байсан). Хотын хүн амын эзлэх хувь нэмэгдэх нь сонгогчдын ирц буурахад хүргэдэг гэж үздэг.

Хамаарах хувьсагч - "сонгуулийн үйл ажиллагааны эрч хүч" ("идэвхтэй") нь 1995-2003 оны холбооны сонгуулийн бүс нутгуудын дундаж ирцийн өгөгдлөөр тодорхойлогддог. Хоёр бие даасан, нэг хамааралтай хувьсагчийн анхны мэдээллийн хүснэгт дараах байдалтай байна.

Болж байна Хувьсагч
Хөрөнгө. Гор. бид. Орос. бид.
Адыгей Бүгд Найрамдах Улс 64,92 53 68
Алтайн бүгд найрамдах улс 68,60 24 60
Бүгд Найрамдах Буриад Улс 60,75 59 70
Бүгд Найрамдах Дагестан Улс 79,92 41 9
Бүгд Найрамдах Ингушет Улс 75,05 41 23
Бүгд Найрамдах Халимаг Улс 68,52 39 37
Карачай-Черкес бүгд найрамдах улс 66,68 44 42
Бүгд Найрамдах Карелия Улс 61,70 73 73
Коми Бүгд Найрамдах Улс 59,60 74 57
Бүгд Найрамдах Мари Эл 65,19 62 47

гэх мэт. (Утааг цэвэрлэсний дараа 88 тохиолдлоос 83 тохиолдол үлдсэн)

Загварын чанарыг тодорхойлсон статистик:

1. Олон тооны R = 0.62; L квадрат = 0.38. Улмаар үндэсний хүчин зүйл болон хотжилтын хүчин зүйл нийлээд “сонгуулийн үйл ажиллагаа” хувьсагчийн хэлбэлзлийн 38 орчим хувийг тайлбарлаж байна.

2. Дундаж алдаа 3.38 байна. Баригдсан загвар нь сонгуулийн ирцийн түвшинг урьдчилан таамаглахад яг ийм "дунджаар буруу" байна.

3. Тайлбартай болон тайлбарлагдаагүй хэлбэлзлийн /l-харьцаа 0.000000003 түвшинд 25.2 байна. Тодорхойлсон харилцааны санамсаргүй байдлын талаархи тэг таамаглалыг үгүйсгэдэг.

4. “Хотын хүн ам” болон “Оросын хүн ам” хувьсагчдын тогтмол ба регрессийн коэффициентийн шалгуур үзүүлэлт нь 0.0000001 түвшинд чухал ач холбогдолтой; 0.00005 ба 0.007 тус тус байна. Коэффициент нь санамсаргүй гэсэн тэг таамаглалыг үгүйсгэв.

Хамаарах хувьсагчийн анхны болон таамагласан утгуудын хоорондын хамаарлыг шинжлэхэд хэрэгтэй нэмэлт статистикууд бол Махаланобисын зай ба Күүкийн зай юм. Эхнийх нь тухайн хэргийн өвөрмөц байдлын хэмжүүр юм (бүх бие даасан хувьсагчийн утгуудын хослол хэр их байгааг харуулдаг. Энэ тохиолдолдбүх бие даасан хувьсагчийн дунджаас нэгэн зэрэг хазайсан). Хоёр дахь нь тухайн хэргийн нөлөөллийн хэмжүүр юм. Өөр өөр ажиглалтууд нь регрессийн шугамын налуу дээр өөр өөр нөлөө үзүүлдэг бөгөөд энэ үзүүлэлт дээр тэдгээрийг харьцуулахын тулд Күүкийн зайг ашиглаж болно. Энэ нь хэт давсан үзүүлэлтүүдийг цэвэрлэхэд тустай байж болно (хэт их нөлөө бүхий тохиолдол гэж үзэж болно).

Бидний жишээн дээр өвөрмөц, нөлөө бүхий тохиолдлуудад Дагестан орно.

Болж байна Жинхэнэ

үнэт зүйлс

Предска

үнэт зүйлс

Үлдэгдэл Зай

Махаланобис

Зай
Адыгей 64,92 66,33 -1,40 0,69 0,00
Алтайн бүгд найрамдах улс 68,60 69.91 -1,31 6,80 0,01
Бүгд Найрамдах Буриад Улс 60,75 65,56 -4,81 0,23 0,01
Бүгд Найрамдах Дагестан Улс 79,92 71,01 8,91 10,57 0,44
Бүгд Найрамдах Ингушет Улс 75,05 70,21 4,84 6,73 0,08
Бүгд Найрамдах Халимаг Улс 68,52 69,59 -1,07 4,20 0,00

Регрессийн загвар нь өөрөө дараах параметрүүдтэй: Y- огтлолцол (тогтмол) = 75.99; b (хэвтээ) = -0.1; Коммерсант (Оросын нас.) = -0.06. Эцсийн томъёо.

Шалтгаан хамаарлын шинж чанар

Шалтгаан-үр дагаврын харилцаа- энэ нь үзэгдэл ба үйл явцын хоорондох холбоо бөгөөд тэдгээрийн аль нэг нь - шалтгаан нь өөрчлөгдсөн нь нөгөө нь - үр нөлөөг өөрчлөхөд хүргэдэг.

Харилцааг судлах ач холбогдлын дагуу тэмдгүүдийг хоёр төрөлд хуваадаг.

Бусад холбогдох шинж чанаруудын өөрчлөлтийг үүсгэдэг шинж тэмдгүүдийг нэрлэдэг хүчин зүйл (эсвэл хүчин зүйл).

Хүчин зүйлийн шинж тэмдгүүдийн нөлөөн дор өөрчлөгддөг шинж тэмдгүүд байдаг үр дүнтэй.

Харилцааны дараах хэлбэрүүдийг ялгадаг: функциональ ба стохастик. Функциональхүчин зүйлийн шинж чанарын тодорхой утга нь үр дүнгийн шинж чанарын нэг бөгөөд зөвхөн нэг утгатай тохирч байх харилцаа юм. Функциональ холболт нь ажиглалтын бүх тохиолдлуудад болон судалж буй хүн амын тодорхой нэгж бүрт илэрдэг.

Функциональ хамаарлыг дараах тэгшитгэлээр илэрхийлж болно.
y би =f(x i),хаана: y i - үр дүнгийн тэмдэг; f(x i) - үр дүн ба хүчин зүйлийн шинж чанаруудын хоорондын холболтын мэдэгдэж буй функц; x i - хүчин зүйлийн тэмдэг.
Бодит байдал дээр функциональ холболт байдаггүй. Эдгээр нь зөвхөн хийсвэр зүйл бөгөөд үзэгдлийг шинжлэхэд тустай, гэхдээ бодит байдлыг хялбаршуулдаг.

Стохастик (статистик эсвэл санамсаргүй)холболттархалтын хуулийг өөрчлөх замаар тэдгээрийн аль нэг нь өөр хэмжигдэхүүн эсвэл бусад хэмжигдэхүүн өөрчлөгдөхөд хариу үйлдэл үзүүлэх хэмжигдэхүүнүүдийн хоорондын хамаарлыг илэрхийлдэг. Өөрөөр хэлбэл, энэ холболтоор өөр өөр утгатайнэг хувьсагч нь нөгөө хувьсагчийн өөр өөр тархалттай тохирч байна. Энэ нь хамааралтай хувьсагч нь хараат бус хувьсагчдаас гадна хэд хэдэн тооцоогүй эсвэл хяналтгүй санамсаргүй хүчин зүйлсийн нөлөөнд автсанаас гадна хувьсагчийн хэмжилтийн зарим зайлшгүй алдаатай холбоотой юм. Хамаарах хувьсагчийн утгууд нь санамсаргүй тархалтад өртдөг тул тэдгээрийг хангалттай нарийвчлалтайгаар урьдчилан таамаглах боломжгүй, гэхдээ зөвхөн тодорхой магадлалаар зааж болно.

Y ба X-ийн хоорондох стохастик хамаарлын тодорхой бус байдлаас шалтгаалан, ялангуяа x-ээс дунджаар авсан хамаарлын схемийг сонирхож байна, i.e. дундаж утгын өөрчлөлтийн загвар - нөхцөлт математикийн хүлээлт Mx(Y) (х-ээс хамаарч X хувьсагч х утгыг авах тохиолдолд олсон санамсаргүй хэмжигдэхүүн Y-ийн математик хүлээлт).

Стохастик харилцааны онцгой тохиолдол бол корреляцийн холбоо юм. Корреляци(лат. хамаарал- хамаарал, хамаарал). Нэр томъёоны шууд тодорхойлолт хамаарал - стохастик, магадлалтай, боломжтой холболт хоёр (хос) эсвэл хэд хэдэн (олон) хооронд санамсаргүй хэмжигдэхүүн.

Хоёр хувьсагчийн хоорондох корреляцийн хамаарлыг эдгээр хувьсагчдын хоорондын статистик хамаарал гэж нэрлэдэг бөгөөд үүнд нэг хувьсагчийн утга тус бүр нь тодорхой дундаж утгатай тохирч байна. нөхцөлт математикийн хүлээлт өөр байна. Корреляцийн хамаарал нь хүчин зүйлийн шинж чанарын утгын өөрчлөлт (x 1 x 2 ..., x n) нь үүссэн шинж чанарын дундаж утгыг өөрчлөхөд хүргэдэг стохастик хамаарлын онцгой тохиолдол юм.



Дараах төрлийн хамаарлыг ялгах нь заншилтай байдаг.

1. Хос хамаарал – хоёр шинж чанар (үр дүн ба хүчин зүйл эсвэл хоёр хүчин зүйл) хоорондын холбоо.

2. Хэсэгчилсэн хамаарал - судалгаанд хамрагдсан бусад хүчин зүйлийн шинж чанаруудын тогтмол утга бүхий үр дүнгийн болон нэг хүчин зүйлийн шинж чанаруудын хоорондын хамаарал.

3. Олон корреляци - судалгаанд хамрагдсан үр дүнгийн болон хоёр ба түүнээс дээш хүчин зүйлийн шинж чанаруудын хамаарал.

Регрессийн шинжилгээний зорилго

Шалтгаан-үр дагаврын холбоог илэрхийлэх аналитик хэлбэр нь регрессийн загварууд юм. Регрессийн шинжилгээний шинжлэх ухааны үндэслэлтэй байдал, түгээмэл байдал нь түүнийг судалж буй үзэгдлийг загварчлах математикийн гол хэрэгслүүдийн нэг болгодог. Энэ аргыг туршилтын өгөгдлийг жигд болгох, харьцуулсан нөлөөллийн тоон тооцоог гаргахад ашигладаг янз бүрийн хүчин зүйлүүдүр дүнгийн хувьсагч руу.

Регрессийн шинжилгээбайнаНэг утгын өөрчлөлт (хамаарах хувьсагч эсвэл үр дүнгийн шинж чанар) нь нэг буюу хэд хэдэн хүчин зүйлийн нөлөөллөөс үүдэлтэй харилцааны аналитик илэрхийллийг тодорхойлоход бие даасан хэмжигдэхүүнүүд(хүчин зүйл эсвэл урьдчилан таамаглагчид), мөн хамааралтай утгад нөлөөлдөг бусад бүх хүчин зүйлийн багцыг тогтмол ба дундаж утгууд гэж авна.

Регрессийн шинжилгээний зорилго:

Үр дүнгийн шинж чанарын нөхцөлт дундаж утгын y-ийн хүчин зүйлийн хүчин зүйлсээс (x 1, x 2, ..., x n) функциональ хамаарлын үнэлгээ;

Бие даасан хувьсагчийг ашиглан хамааралтай хувьсагчийн утгыг таамаглах.

Хараат хувьсагчийн хувьсагчид бие даасан хувьсагчийн оруулах хувь нэмрийг тодорхойлох.

Регрессийн шинжилгээгээр хувьсагчдын хооронд хамаарал байгаа эсэхийг тодорхойлох боломжгүй, учир нь ийм хамаарал байгаа нь шинжилгээг хэрэглэх урьдчилсан нөхцөл болдог.

Регрессийн шинжилгээнд үр дүнгийн (U) болон хүчин зүйлийн шинж чанар x 1, x 2 ..., x n хооронд шалтгаан-үр дагаврын хамаарал байгаа гэж урьдчилан таамаглаж байна.

Чиг үүрэг , opИндикаторын параметрүүдээс хамаарах хамаарлыг регрессийн тэгшитгэл (функц) гэж нэрлэдэг. 1 . Регрессийн тэгшитгэл нь бие даасан хувьсагчдын тодорхой утгыг харгалзан хамааралтай хувьсагчийн хүлээгдэж буй утгыг харуулдаг.
Загварт багтсан хүчин зүйлсийн тооноос хамаарна Xзагваруудыг нэг хүчин зүйл (хос регрессийн загвар) ба олон хүчин зүйл (олон регрессийн загвар) гэж хуваадаг. Функцийн төрлөөс хамааран загваруудыг шугаман болон шугаман бус гэж хуваадаг.

Хосолсон регрессийн загвар

Тооцоогүй санамсаргүй хүчин зүйл, шалтгааны нөлөөгөөр бие даасан ажиглалт у нь регрессийн f(x) функцээс их бага хэмжээгээр хазайна. Энэ тохиолдолд хоёр хувьсагчийн хоорондын хамаарлын тэгшитгэлийг (хосолсон регрессийн загвар) дараах байдлаар илэрхийлж болно.

Y=f(X) + ɛ,

Энд ɛ нь регрессийн функцээс хазайлтыг тодорхойлдог санамсаргүй хэмжигдэхүүн юм. Энэ хувьсагчийг эвдрэл эсвэл эвдрэл (үлдэгдэл эсвэл алдаа) гэж нэрлэдэг. Тиймээс регрессийн загварт хамааралтай хувьсагч Юзарим функц байдаг f(X)санамсаргүй эвдрэл хүртэл ɛ.

Сонгодог шугаман хос регрессийн загварыг (CLMPR) авч үзье. Тэр харагдаж байна

y i =β 0 +β 1 x i +ɛ i (i=1,2, …, n),(1)

Хаана y i– тайлбарласан (үр дүнд бий болох, хамааралтай, эндоген хувьсагч); x i– тайлбарлагч (урьдчилан таамаглагч, хүчин зүйл, экзоген) хувьсагч; β 0, β 1- тоон коэффициент; ɛi– санамсаргүй (стохастик) бүрэлдэхүүн хэсэг буюу алдаа.

KLMPR-ийн үндсэн нөхцөл (урьдчилсан нөхцөл, таамаглал):

1) x i– тодорхойлогч (санамсаргүй бус) хэмжигдэхүүн бөгөөд x i утгуудын дунд бүгд ижил биш гэж үздэг.

2) Хүлээгдэж буй үнэ цэнэ(дундаж үнэ цэнэ) эвдрэл ɛiтэгтэй тэнцүү:

М[ɛ i ]=0 (i=1,2, …, n).

3) i-ийн аль ч утгын хувьд эвдрэлийн тархалт тогтмол байна (гомоскедастик нөхцөл):

D[ɛ i ]=σ 2 (i=1,2, …, n).

4) Төрөл бүрийн ажиглалтын зөрчил нь харилцан хамааралгүй:

cov[ɛ i , ɛ j ]=M[ɛ i , ɛ j ]=0 i≠j,

Энд cov[ɛ i , ɛ j ] нь ковариацын коэффициент (корреляцийн момент) юм.

5) Эвдрэлүүд нь тэг дундаж ба дисперс σ 2 бүхий хэвийн тархсан санамсаргүй хэмжигдэхүүнүүд юм:

ɛ i ≈ N(0, σ 2).

Регрессийн тэгшитгэлийг гаргахын тулд эхний дөрвөн байр хангалттай. Тав дахь урьдчилсан нөхцөлийг биелүүлэх шаардлага нь регрессийн тэгшитгэл болон түүний параметрүүдийн нарийвчлалыг үнэлэхэд зайлшгүй шаардлагатай.

Сэтгэгдэл:Шугаман харилцаанд анхаарлаа хандуулж байгаа нь хувьсагчийн хязгаарлагдмал хэлбэлзэлтэй, ихэнх тохиолдолд шугаман бус хэлбэрийг тооцоолол хийхдээ (логарифм эсвэл хувьсагчийн орлуулалтаар) шугаман хэлбэрт шилжүүлдэгтэй холбон тайлбарладаг.

Уламжлалт аргахамгийн бага квадратууд (LS)

Түүврээс авсан загварын үнэлгээ нь тэгшитгэл юм

ŷ i = a 0 + a 1 x i(i=1,2, …, n), (2)

Энд ŷ i - регрессийн тэгшитгэлээс олж авсан хамааралтай хувьсагчийн онолын (ойролцоогоор) утгууд; a 0 , a 1 - регрессийн тэгшитгэлийн коэффициентүүд (параметрүүд) (β 0, β 1 коэффициентүүдийн түүврийн тооцоо).

Хамгийн бага квадратуудын дагуу үл мэдэгдэх a 0, a 1 параметрүүдийг сонгосон бөгөөд ингэснээр эмпирик утгуудаас ŷ i утгын квадрат хазайлтын нийлбэр y i (квадратуудын үлдэгдэл нийлбэр) хамгийн бага байна:

Q e =∑e i 2 = ∑(y i – ŷ i) 2 = ∑(yi – (a 0 + a 1 x i)) 2 → мин, (3)

Энд e i = y i - ŷ i – эвдрэлийн ɛ i буюу регрессийн үлдэгдэлийн түүврийн тооцоо.

Асуудал нь Q e функцийг авах 0 ба 1 параметрийн утгыг олоход ирдэг. хамгийн бага утга. Q e = Q e (a 0 , a 1) функц нь 0 ба 1 гэсэн хоёр хувьсагчийн "хамгийн сайн" (хамгийн бага квадратын аргын утгаараа) утгыг олж тогтоох хүртэл функц болохыг анхаарна уу, a x i. , y i нь туршилтаар олдсон тогтмол тоонууд юм.

Шаардлагатай нөхцөлХоёр хувьсагчийн энэ функцийн хэсэгчилсэн деривативуудыг тэгтэй тэнцүүлэх замаар экстремум (3) олно. Үүний үр дүнд бид хоёр системийг олж авдаг шугаман тэгшитгэл, үүнийг хэвийн тэгшитгэлийн систем гэж нэрлэдэг:

(4)

Коэффициент a 1 нь х хэмжигдэхүүний нэг нэгжээр өөрчлөгдөхөд у хувьсагч дунджаар хэдэн нэгж өөрчлөгдөхийг, өөрөөр хэлбэл х-ийн хэлбэлзлийн нэгжид y-ийн хэлбэлзлийг харуулдаг түүврийн регрессийн коэффициент юм. Гарын үсэг зурах a 1энэ өөрчлөлтийн чиглэлийг заана. Коэффицент a 0 – (2)-ын дагуу шилжилт утгатай тэнцүү байнаŷ i нь x=0 бөгөөд утга учиртай тайлбаргүй байж болно. Ийм учраас хамааралтай хувьсагчийг заримдаа хариу гэж нэрлэдэг.

Регрессийн коэффициентийн тооцооллын статистик шинж чанарууд:

Коэффициент нь a 0, a 1-ийг шударга бус гэж тооцдог;

Түүврийн хэмжээ n нэмэгдэх тусам тооцооллын хэлбэлзэл 0 , 1 буурч (тооцооллын нарийвчлал нэмэгддэг);

Налуугийн үнэлгээний зөрүү a 1 өсөх тусам буурч байгаа тул дундаж утгын эргэн тойронд тархалт их байхын тулд x i-г сонгох нь зүйтэй;

x¯ > 0-ийн хувьд (энэ нь хамгийн их сонирхол татдаг) 0 ба 1-ийн хооронд сөрөг статистик хамаарал байдаг (1-ийн өсөлт нь 0-ийн бууралтад хүргэдэг).

Регрессийн шинжилгээний гол онцлог: түүний тусламжтайгаар судалж буй хувьсагчдын хоорондын хамаарал ямар хэлбэр, шинж чанартай болох талаар тодорхой мэдээлэл авах боломжтой.

Регрессийн шинжилгээний үе шатуудын дараалал

Регрессийн шинжилгээний үе шатуудыг товчхон авч үзье.

    Асуудлын томъёолол. Энэ үе шатанд судалж буй үзэгдлүүдийн хамаарлын талаархи урьдчилсан таамаглалууд үүсдэг.

    Хараат болон бие даасан (тайлбарлах) хувьсагчийн тодорхойлолт.

    Статистикийн мэдээлэл цуглуулах. Регрессийн загварт багтсан хувьсагч бүрийн хувьд өгөгдөл цуглуулах ёстой.

    Холболтын хэлбэрийн талаархи таамаглалыг боловсруулах (энгийн эсвэл олон, шугаман эсвэл шугаман бус).

    Тодорхойлолт регрессийн функцууд (регрессийн тэгшитгэлийн параметрүүдийн тоон утгыг тооцоолоход оршино)

    Регрессийн шинжилгээний үнэн зөвийг үнэлэх.

    Хүлээн авсан үр дүнгийн тайлбар. Регрессийн шинжилгээний үр дүнг урьдчилсан таамаглалтай харьцуулсан болно. Хүлээн авсан үр дүнгийн үнэн зөв, найдвартай байдлыг үнэлдэг.

    Урьдчилан таамаглах үл мэдэгдэх утгуудхамааралтай хувьсагч.

Регрессийн шинжилгээг ашиглан урьдчилан таамаглах, ангилах асуудлыг шийдвэрлэх боломжтой. Урьдчилан таамагласан утгыг тайлбарлагч хувьсагчдын утгыг регрессийн тэгшитгэлд орлуулах замаар тооцоолно. Ангиллын асуудлыг ингэж шийддэг: регрессийн шугам нь бүхэл бүтэн объектыг хоёр ангилалд хуваадаг бөгөөд функцийн утга нь тэгээс их байгаа хэсэг нь нэг ангилалд, тэгээс бага хэсэг нь хамаарна. өөр ангилалд багтдаг.

Регрессийн шинжилгээний асуудлууд

Регрессийн шинжилгээний үндсэн ажлуудыг авч үзье: хамаарлын хэлбэрийг тогтоох, тодорхойлох регрессийн функцууд, хамааралтай хувьсагчийн үл мэдэгдэх утгыг тооцоолох.

Хараат байдлын хэлбэрийг бий болгох.

Хувьсагчдын хоорондын хамаарлын шинж чанар, хэлбэр нь дараахь төрлийн регрессийг үүсгэж болно.

    эерэг шугаман регресс(функцын жигд өсөлтөөр илэрхийлэгддэг);

    эерэг жигд нэмэгдэж буй регресс;

    эерэг жигд нэмэгдэж буй регресс;

    сөрөг шугаман регресс (функцын жигд бууралтаар илэрхийлэгддэг);

    сөрөг жигд түргэвчилсэн бууралтын регресс;

    сөрөг жигд буурах регресс.

Гэсэн хэдий ч тайлбарласан сортууд нь ихэвчлэн байдаггүй цэвэр хэлбэр, гэхдээ бие биетэйгээ хослуулан. Энэ тохиолдолд бид регрессийн хосолсон хэлбэрүүдийн талаар ярьдаг.

Регрессийн функцийн тодорхойлолт.

Хоёрдахь ажил нь бусад хүчин зүйлүүд нь тэнцүү байх ба хамааралтай хувьсагчдад санамсаргүй элементүүдийн нөлөөллийг хассан тохиолдолд хамааралтай хувьсагчдад үзүүлэх нөлөөллийг тодорхойлох явдал юм. Регрессийн функцнэг төрлийн математик тэгшитгэл хэлбэрээр тодорхойлогддог.

Хамаарах хувьсагчийн үл мэдэгдэх утгыг тооцоолох.

Энэ асуудлын шийдэл нь дараахь төрлийн аль нэг асуудлыг шийдэхэд хүргэдэг.

    Анхны өгөгдлийн авч үзсэн интервал дахь хамааралтай хувьсагчийн утгыг тооцоолох, жишээлбэл. дутуу утгууд; энэ тохиолдолд интерполяцийн асуудал шийдэгдэнэ.

    Хамаарах хувьсагчийн ирээдүйн утгыг тооцоолох, жишээлбэл. эх өгөгдлийн заасан интервалаас гадуур утгыг олох; энэ тохиолдолд экстраполяцийн асуудал шийдэгдэнэ.

Энэ хоёр асуудлыг бие даасан хувьсагчдын утгын олсон параметрийн тооцоог регрессийн тэгшитгэлд орлуулах замаар шийддэг. Тэгшитгэлийг шийдсэний үр дүн нь зорилтот (хамааралтай) хувьсагчийн утгын тооцоо юм.

Регрессийн шинжилгээнд тулгуурласан зарим таамаглалыг авч үзье.

Шугаман байдлын таамаглал, i.e. авч үзэж буй хувьсагчдын хоорондын хамаарлыг шугаман гэж үзнэ. Тиймээс, энэ жишээн дээр бид тараах графикийг зурж, тодорхой шугаман хамаарлыг харж чадсан. Хэрэв хувьсагчдын тархалтын диаграм дээр шугаман хамаарал илт байхгүй байгааг олж харвал, өөрөөр хэлбэл. Хэрэв шугаман бус хамаарал байгаа бол шугаман бус шинжилгээний аргыг хэрэглэнэ.

Хэвийн таамаглал үлдэгдэл. Урьдчилан таамагласан болон ажиглагдсан утгуудын хоорондын ялгаа хэвийн байна гэж үздэг. Тархалтын мөн чанарыг нүдээр тодорхойлохын тулд та гистограммыг ашиглаж болно үлдэгдэл.

Регрессийн шинжилгээг ашиглахдаа түүний гол хязгаарлалтыг анхаарч үзэх хэрэгтэй. Энэ нь регрессийн шинжилгээ нь эдгээр хамаарлын суурь холболтыг бус зөвхөн хамаарлыг илрүүлэх боломжийг олгодогт оршино.

Регрессийн шинжилгээ нь хэд хэдэн мэдэгдэж буй утгууд дээр үндэслэн хувьсагчийн тооцоолсон утгыг тооцоолох замаар хувьсагчдын хоорондын хамаарлын хүчийг тооцоолох боломжийг олгодог.

Регрессийн тэгшитгэл.

Регрессийн тэгшитгэл нь дараах байдалтай байна: Y=a+b*X

Энэ тэгшитгэлийг ашиглан Y хувьсагчийг a тогтмол ба шулууны (эсвэл налуу) b-ийн налууг X хувьсагчийн утгаар үржүүлсэнээр илэрхийлнэ. a тогтмолыг мөн огтлолцох гишүүн гэж нэрлэдэг ба налууг регрессийн коэффициент буюу B-коэффицент.

Ихэнх тохиолдолд (үргэлж биш бол) регрессийн шугамтай харьцуулахад ажиглалтын тодорхой тархалт байдаг.

Үлдэгдэл нь регрессийн шугамаас (урьдчилан таамагласан утга) нэг цэгийн (ажиглалтын) хазайлт юм.

MS Excel дээр регрессийн шинжилгээний асуудлыг шийдэхийн тулд цэснээс сонгоно уу Үйлчилгээ"Шинжилгээний багц"болон Регрессийн шинжилгээний хэрэгсэл. Бид X ба Y оролтын интервалуудыг тохируулна. Оролтын интервал Y нь хамааралтай дүн шинжилгээ хийсэн өгөгдлийн хүрээ бөгөөд энэ нь нэг багана агуулсан байх ёстой. Оролтын интервал X нь дүн шинжилгээ хийх шаардлагатай бие даасан өгөгдлийн хүрээ юм. Оролтын мужуудын тоо 16-аас хэтрэхгүй байх ёстой.

Гаралтын муж дахь процедурын гаралт дээр бид өгөгдсөн тайланг авдаг хүснэгт 8.3a-8.3v.

ҮР ДҮНГИЙН ДҮГНЭЛТ

Хүснэгт 8.3a. Регрессийн статистик

Регрессийн статистик

Олон тооны Р

R-дөрвөлжин

Нормчилсан R квадрат

Стандарт алдаа

Ажиглалт

Эхлээд танилцуулсан тооцооллын дээд хэсгийг харцгаая хүснэгт 8.3a, - регрессийн статистик.

Хэмжээ R-дөрвөлжин, мөн тодорхой байдлын хэмжүүр гэж нэрлэдэг нь үр дүнд бий болсон регрессийн шугамын чанарыг тодорхойлдог. Энэ чанар нь эх өгөгдөл болон регрессийн загвар (тооцоолсон өгөгдөл) хоорондын уялдаа холбоогоор илэрхийлэгддэг. Тодорхой байдлын хэмжүүр нь үргэлж интервал дотор байдаг.

Ихэнх тохиолдолд үнэ цэнэ R-дөрвөлжинэдгээр утгуудын хооронд байна, хэт гэж нэрлэдэг, i.e. тэг ба нэг хооронд.

Хэрэв үнэ цэнэ R-дөрвөлжиннэгдмэл байдалд ойрхон байгаа нь энэ нь бүтээгдсэн загвар нь харгалзах хувьсагчдын бараг бүх хэлбэлзлийг тайлбарладаг гэсэн үг юм. Үүний эсрэгээр, утга учир R-дөрвөлжин, тэгтэй ойролцоо байгаа нь баригдсан загварын чанар муутай гэсэн үг.

Бидний жишээн дээр тодорхой байдлын хэмжүүр нь 0.99673 бөгөөд энэ нь регрессийн шугам нь анхны өгөгдөлтэй маш сайн тохирч байгааг харуулж байна.

олон тооны Р - олон корреляцийн коэффициент R - бие даасан хувьсагч (X) ба хамааралтай хувьсагчийн (Y) хамаарлын зэргийг илэрхийлнэ.

Олон тооны Рнь тодорхойлох коэффициентийн квадрат язгууртай тэнцүү бөгөөд энэ хэмжигдэхүүн нь тэгээс нэг хүртэлх утгыг авна.

Энгийн шугаман регрессийн шинжилгээнд олон тооны РПирсон корреляцийн коэффициенттэй тэнцүү байна. Үнэхээр, олон тооны Рманай тохиолдолд өмнөх жишээний (0.998364) Пирсон корреляцийн коэффициенттэй тэнцүү байна.

Хүснэгт 8.3б. Регрессийн коэффициентүүд

Магадлал

Стандарт алдаа

t-статистик

Y уулзвар

Хувьсагч X 1

* Тооцооллын тайрсан хувилбарыг өгсөн болно

Одоо танилцуулсан тооцооллын дунд хэсгийг авч үзье хүснэгт 8.3б. Энд регрессийн коэффициент b (2.305454545) ба ордны тэнхлэгийн дагуух шилжилтийг өгөгдсөн, өөрөөр хэлбэл. тогтмол a (2.694545455).

Тооцоолол дээр үндэслэн бид регрессийн тэгшитгэлийг дараах байдлаар бичиж болно.

Ү= x*2.305454545+2.694545455

Хувьсагчдын хоорондын хамаарлын чиглэлийг регрессийн коэффициентүүдийн (б коэффициент) тэмдэг (сөрөг эсвэл эерэг) дээр үндэслэн тодорхойлно.

Хэрэв регрессийн коэффициентийн тэмдэг эерэг байвал хамааралтай хувьсагч ба бие даасан хувьсагчийн хоорондын хамаарал эерэг байна. Манай тохиолдолд регрессийн коэффициентийн тэмдэг эерэг байгаа тул хамаарал нь мөн эерэг байна.

Хэрэв регрессийн коэффициентийн тэмдэг сөрөг байвал хамааралтай хувьсагч ба бие даасан хувьсагчийн хоорондын хамаарал сөрөг (урвуу) байна.

IN хүснэгт 8.3c. гаралтын үр дүнг танилцуулж байна үлдэгдэл. Эдгээр үр дүнг тайланд харуулахын тулд та "Регресс" хэрэгслийг ажиллуулахдаа "Үлдэгдэл" нүдийг идэвхжүүлэх ёстой.

Үлдсэнийг нь эргүүлэн татах

Хүснэгт 8.3c. Үлдэгдэл

Ажиглалт

Таамагласан Y

Үлдэгдэл

Стандарт үлдэгдэл

Тайлангийн энэ хэсгийг ашиглан бид регрессийн байгуулсан шугамаас цэг бүрийн хазайлтыг харж болно. Хамгийн том үнэмлэхүй утга үлдэгдэлманай тохиолдолд - 0.778, хамгийн бага нь - 0.043. Эдгээр өгөгдлийг илүү сайн тайлбарлахын тулд бид анхны өгөгдлийн график болон бүтээгдсэн регрессийн шугамыг ашиглана будаа. 8.3. Таны харж байгаагаар регрессийн шугам нь анхны өгөгдлийн утгуудад маш нарийн "тохирсон" байна.

Харж буй жишээ нь маш энгийн бөгөөд шугаман регрессийн шугамыг чанарын хувьд байгуулах нь үргэлж боломжгүй байдаг гэдгийг анхаарах хэрэгтэй.

Цагаан будаа. 8.3.Эх сурвалж өгөгдөл ба регрессийн шугам

Бие даасан хувьсагчийн мэдэгдэж буй утгууд дээр үндэслэн хамааралтай хувьсагчийн үл мэдэгдэх ирээдүйн утгыг тооцоолох асуудал анхааралдаа аваагүй хэвээр байна, жишээлбэл. урьдчилан таамаглах асуудал.

Регрессийн тэгшитгэлтэй бол урьдчилан таамаглах асуудлыг x-ийн мэдэгдэж буй утга бүхий Y= x*2.305454545+2.694545455 тэгшитгэлийг шийдвэрлэх хүртэл бууруулна. Хамаарах хувьсагч Y-ийг зургаан алхмын өмнө таамагласан үр дүнг үзүүлэв Хүснэгт 8.4.

Хүснэгт 8.4. Y хувьсагчийн урьдчилсан мэдээний үр дүн

Y (урьдчилан таамагласан)

Тиймээс Microsoft Excel дээр регрессийн шинжилгээг ашигласны үр дүнд бид:

    регрессийн тэгшитгэлийг бий болгох;

    хувьсагчдын хоорондын харилцааны хэлбэр, харилцааны чиглэлийг тогтоосон - функцийн жигд өсөлтөөр илэрхийлэгддэг эерэг шугаман регресс;

    хувьсагчдын хоорондын харилцааны чиглэлийг тогтоосон;

    үүссэн регрессийн шугамын чанарыг үнэлсэн;

    анхны багцын өгөгдлөөс тооцоолсон өгөгдлийн хазайлтыг харах боломжтой болсон;

    хамааралтай хувьсагчийн ирээдүйн утгыг урьдчилан таамагласан.

Хэрэв регрессийн функцТодорхойлсон, тайлбарласан, үндэслэлтэй, регрессийн шинжилгээний нарийвчлалын үнэлгээ нь шаардлагад нийцэж байгаа, бүтээсэн загвар, таамагласан утгууд нь хангалттай найдвартай гэж үзэж болно.

Ийм аргаар олж авсан таамагласан утгууд нь хүлээгдэж буй дундаж утгууд юм.

Энэ ажилд бид үндсэн шинж чанаруудыг авч үзсэн тайлбарлах статистикгэх мэт ойлголтууд байдаг дундаж утга,дундаж,дээд тал нь,хамгийн багаболон өгөгдлийн өөрчлөлтийн бусад шинж чанарууд.

Үзэл баримтлалын талаар мөн товч ярилцлаа ялгаруулалт. Харгалзан үзсэн шинж чанарууд нь хайгуулын өгөгдлийн шинжилгээ гэж нэрлэгддэг зүйлтэй холбоотой бөгөөд түүний дүгнэлт нь нийт хүн амд хамаарахгүй, зөвхөн мэдээллийн түүвэрт хамаарна. Хайгуулын мэдээллийн шинжилгээг анхан шатны дүгнэлт гаргах, хүн амын талаархи таамаглалыг бий болгоход ашигладаг.

Корреляци ба регрессийн шинжилгээний үндэс, тэдгээрийн даалгавар, практикт ашиглах боломжуудын талаар мөн ярилцав.

Регрессийн шинжилгээний аргыг үнэ цэнийн харилцааг бий болгох, уялдуулах зорилгоор тодорхой параметрийн цувралд хамаарах бүтээгдэхүүний техник, эдийн засгийн үзүүлэлтүүдийг тодорхойлоход ашигладаг. Энэ аргыг үндсэн хэрэглээний шинж чанарыг тусгасан нэг буюу хэд хэдэн техник, эдийн засгийн үзүүлэлтүүдээр тодорхойлогддог бүтээгдэхүүний түвшин, үнийн харьцаанд дүн шинжилгээ хийх, зөвтгөхөд ашигладаг. Регрессийн шинжилгээ нь бүтээгдэхүүний техникийн болон эдийн засгийн үзүүлэлтүүдээс үнийн хамаарлыг тодорхойлсон эмпирик томъёог олох боломжийг олгодог.

P=f(X1X2,...,Xn),

Энд P нь бүтээгдэхүүний нэгж үнийн утга, руб.; (X1, X2, ... Xn) - бүтээгдэхүүний техник, эдийн засгийн үзүүлэлтүүд.

Ашигласан норматив-параметрийн аргуудын хамгийн дэвшилтэт арга болох регрессийн шинжилгээний арга нь орчин үеийн хэрэглээнд суурилсан тооцоолол хийхэд үр дүнтэй байдаг. мэдээллийн технологиболон системүүд. Түүний хэрэглээ нь дараах үндсэн алхмуудыг агуулна.

  • бүтээгдэхүүний параметрийн бүлгийн ангиллыг тодорхойлох;
  • бүтээгдэхүүний үнэд хамгийн их нөлөөлдөг параметрүүдийг сонгох;
  • параметрүүд өөрчлөгдөх үед үнийн өөрчлөлтийн хоорондын холболтын хэлбэрийг сонгох, зөвтгөх;
  • хэвийн тэгшитгэлийн системийг байгуулах, регрессийн коэффициентийг тооцоолох.

Үндсэн мэргэшлийн бүлэгҮнэ нь тэнцүүлэх бүтээгдэхүүн нь параметрийн цуврал бөгөөд тэдгээрийн хэрэглээ, ашиглалтын нөхцөл, шаардлага зэргээс хамааран бүтээгдэхүүнийг янз бүрийн загварт бүлэглэж болно. Параметрийн цуваа үүсгэх үед автомат ангиллын аргыг ашиглаж болно. Бүтээгдэхүүний нэг төрлийн бүлгийг тодорхойлох боломжтой болгох. Техникийн болон эдийн засгийн үзүүлэлтүүдийг сонгохдоо дараахь үндсэн шаардлагуудыг үндэслэнэ.

  • сонгосон параметрүүд нь стандартад бүртгэгдсэн параметрүүдийг багтаасан ба техникийн нөхцөл; техникийн үзүүлэлтүүдээс гадна (хүч, даац, хурд гэх мэт) бүтээгдэхүүний цуваа, нарийн төвөгтэй байдлын коэффициент, нэгдмэл байдлын үзүүлэлтүүдийг ашигладаг;
  • Сонгосон параметрүүдийн багц нь цувралд багтсан бүтээгдэхүүний загвар, технологи, ашиглалтын шинж чанарыг хангалттай бүрэн тодорхойлж, үнийн хувьд нэлээд нягт хамааралтай байх ёстой;
  • параметрүүд нь харилцан хамааралтай байх ёсгүй.

Үнэд ихээхэн нөлөөлдөг техник, эдийн засгийн үзүүлэлтүүдийг сонгохын тулд хос корреляцийн коэффициентийн матрицыг тооцоолно. Параметрүүдийн хоорондын хамаарлын коэффициентийн хэмжээнээс хамааран тэдгээрийн холболтын ойр байдлыг дүгнэж болно. Үүний зэрэгцээ тэгтэй ойролцоо хамаарал нь параметрийн үнэд өчүүхэн нөлөө үзүүлж байгааг харуулж байна. Техникийн болон эдийн засгийн үзүүлэлтүүдийн эцсийн сонголтыг алхам алхмаар регрессийн шинжилгээний явцад гүйцэтгэдэг. компьютерийн тоног төхөөрөмжболон холбогдох стандарт хөтөлбөрүүд.

Үнийн практикт дараахь багц функцийг ашигладаг.

шугаман

P = ao + alXl + ... + antXn,

шугаман хүч

P = ao + a1X1 + ... + anXn + (an+1Xn) (an+1Xn) +... + (an+nXn2) (an+nXn2)

урвуу логарифм

P = a0 + a1: X1 + ... + an: Xn-д,

хүч

P = a0 (X1^a1) (X2^a2) .. (Xn^an)

заалт

P = e^(a1+a1X1+...+anXn)

гипербол

P = ao + a1:X1 + a2:X2 + ... + ap:Xn,

энд P бол үнийн тэгшитгэл; X1 X2,..., Xn - цувралын бүтээгдэхүүний техник, эдийн засгийн үзүүлэлтүүдийн утга; a0, a1 ..., а - регрессийн тэгшитгэлийн тооцоолсон коэффициентүүд.

Үнэ, техникийн болон эдийн засгийн үзүүлэлтүүдийн хоорондын хамаарлын хэлбэрээс хамааран үнийн практик ажилд бусад регрессийн тэгшитгэлийг ашиглаж болно. Үнэ болон техникийн болон эдийн засгийн олон параметрүүдийн хоорондын холболтын функцын төрлийг компьютерийн боловсруулалтын явцад урьдчилан тохируулах эсвэл автоматаар сонгох боломжтой. Үнэ болон олон тооны параметрүүдийн хоорондын хамаарлын ойролцоо байдлыг үнэ цэнээр үнэлдэг олон коэффициентхамаарал. Нэгтэй ойрхон байгаа нь ойр дотно харилцаатай байгааг илтгэнэ. Регрессийн тэгшитгэлийг ашиглан өгөгдсөн параметрийн цувралын бүтээгдэхүүний үнийн тэнцвэржүүлсэн (тооцоолсон) утгыг олж авна. Тэнцвэржүүлэх үр дүнг үнэлэхийн тулд тооцоолсон үнийн утгын бодит хэмжээнээс хазайх харьцангуй утгыг тооцоолно.

Tsr = Rf - Rr: R x 100

Энд Рф, Рр - бодит ба тооцоолсон үнэ.

CR-ийн утга нь 8-10% -иас хэтрэхгүй байх ёстой. Тооцоолсон утгууд нь бодит хэмжээнээс ихээхэн хазайсан тохиолдолд дараахь зүйлийг судлах шаардлагатай.

  • параметрийн хувьд цувралын бусад бүтээгдэхүүнээс эрс ялгаатай бүтээгдэхүүнийг агуулж болох тул параметрийн цуваа үүсэх зөв байдал. Тэдгээрийг хасах ёстой;
  • техникийн болон эдийн засгийн үзүүлэлтүүдийг зөв сонгох. Үнэтэй бага хамааралтай параметрүүдийн багц боломжтой. Энэ тохиолдолд параметрүүдийг үргэлжлүүлэн хайх, сонгох шаардлагатай.

Регрессийн шинжилгээ хийх журам, аргачлал, тэгшитгэлийн үл мэдэгдэх параметрүүдийг олох, олж авсан үр дүнгийн эдийн засгийн үнэлгээг математик статистикийн шаардлагын дагуу гүйцэтгэдэг.



Сайт дээр шинэ

>

Хамгийн алдартай