Гэр Пульпит Excel-д ойртсон дундаж харьцангуй алдаа. Ойролцоогоор дундаж алдаа

Excel-д ойртсон дундаж харьцангуй алдаа. Ойролцоогоор дундаж алдаа

Курсын ажил

"Эконометрик" чиглэлээр

« Аж ахуйн нэгжүүдийн санхүү, эдийн засгийн үр дүнгийн үзүүлэлтүүдийн хоорондын хамаарлын цогц шинжилгээ"

Сонголт №12

Дууссан:

EET-312 бүлгийн оюутан

Логунов Н.Ю.

Шалгасан:

Асс. Ишханян М.В.

Москва 2015 он

Асуудлын томъёолол

1. Корреляцийн матрицын эмхэтгэл. Хүчин зүйлийн сонголт

2. Олон тооны тэгшитгэл байгуулах шугаман регресс. Тэгшитгэлийн параметрүүдийн тайлбар

3. Тодорхойлох коэффициент, олон коэффициентхамаарал

4.Олон шугаман регрессийн тэгшитгэлийн чанарыг үнэлэх

4.1.Дундаж харьцангуй алдааойролцоо тооцоолол

4.2.Шалгах статистикийн ач холбогдолтэгшитгэл олон регрессФишерийн F тестийг ашиглан ерөнхийдөө

4.3.Олон регрессийн тэгшитгэлийн параметрүүдийн статистик ач холбогдлыг шалгах. Интервалын параметрийн тооцоо

5. Хэрэглээ регрессийн загвар

5.1.Цэгийн урьдчилсан мэдээ

5.2.Хэсэгчилсэн уян хатан байдлын коэффициент ба хэсэгчилсэн уян хатан байдлын дундаж коэффициент

6. Регрессийн загварын үлдэгдлийн шинжилгээ (Гаусс-Марковын теоремын байр суурийг шалгах)

6.1.Үнэлгээ математикийн хүлээлтүлдэгдэл

6.2.Үлдэгдэл дэх автокорреляцийг шалгах

7. Грегори Чоугийн шалгуур

Асуудлын томъёолол

53 аж ахуйн нэгжийн эдийн засгийн үйл ажиллагааг тодорхойлсон 6 үзүүлэлтийн утгыг тодорхойлсон. Шаардлагатай:

1. Корреляцийн матриц үүсгэ. Бие даасан хувьсагчийн багцыг тохируулах (2 хүчин зүйлийг сонгох).

4.2. Фишерийн F тестийг ашиглан олон тооны регрессийн тэгшитгэлийн статистик ач холбогдлыг бүхэлд нь шалгана уу. Дүгнэлт гаргах

4.3. Олон регрессийн тэгшитгэлийн параметрүүдийн статистик ач холбогдлыг шалгана уу. Параметрүүдийн интервалын тооцоог бүтээх. Дүгнэлт хийх.



5. Регрессийн загварын хэрэглээ:

5.1. Үүсгэсэн тэгшитгэлийг ашиглан цэгийн таамаглалыг өгнө үү. Судлагдсан y параметрийн утгыг ол, хэрэв эхний хүчин зүйлийн утга (y-тэй хамгийн нягт холбоотой) дундаж утгын 110% бол хоёр дахь хүчин зүйлийн утга нь дундаж утгын 80% байна. Үр дүнгийн эдийн засгийн тайлбарыг өгнө үү.

5.2. Хэсэгчилсэн уян хатан байдлын коэффициент ба дундаж уян хатан байдлын коэффициентийг ол. Үр дүнг тайлбарлах. Дүгнэлт хийх.

6. Регрессийн загварын үлдэгдэлд дүн шинжилгээ хийнэ үү (Гаусс-Марковын теоремын шаардлагыг шалгана уу):

6.1. Үлдэгдэлийн математик хүлээлтийн тооцоог ол.

6.2. Үлдэгдэл дэх автокорреляцийг шалгана уу. Дүгнэлт гаргах.

7. Дээжийг хоёр тэнцүү хэсэгт хуваа. Эхний болон сүүлчийн ажиглалтыг бие даасан түүвэр гэж үзээд Грегори-Чоугийн шалгуурыг ашиглан нэг түүвэрт нэгтгэх боломжийн талаархи таамаглалыг шалгана уу.

Корреляцийн матрицыг зурах. Хүчин зүйлийн сонголт

Аж ахуйн нэгжийн дугаар. Y3 X10 X12 X5 X7 X13
13,26 1,45 167,69 0,78 1,37
10,16 1,3 186,1 0,75 1,49
13,72 1,37 220,45 0,68 1,44
12,85 1,65 169,3 0,7 1,42
10,63 1,91 39,53 0,62 1,35
9,12 1,68 40,41 0,76 1,39
25,83 1,94 102,96 0,73 1,16
23,39 1,89 37,02 0,71 1,27
14,68 1,94 45,74 0,69 1,16
10,05 2,06 40,07 0,73 1,25
13,99 1,96 45,44 0,68 1,13
9,68 1,02 41,08 0,74 1,1
10,03 1,85 136,14 0,66 1,15
9,13 0,88 42,39 0,72 1,23
5,37 0,62 37,39 0,68 1,39
9,86 1,09 101,78 0,77 1,38
12,62 1,6 47,55 0,78 1,35
5,02 1,53 32,61 0,78 1,42
21,18 1,4 103,25 0,81 1,37
25,17 2,22 38,95 0,79 1,41
19,4 1,32 81,32 0,77 1,35
1,48 67,26 0,78 1,48
6,57 0,68 59,92 0,72 1,24
14,19 2,3 107,34 0,79 1,40
15,81 1,37 512,6 0,77 1,45
5,23 1,51 53,81 0,8 1,4
7,99 1,43 80,83 0,71 1,28
17,5 1,82 59,42 0,79 1,33
17,16 2,62 36,96 0,76 1,22
14,54 1,75 91,43 0,78 1,28
6,24 1,54 17,16 0,62 1,47
12,08 2,25 27,29 0,75 1,27
9,49 1,07 184,33 0,71 1,51
9,28 1,44 58,42 0,74 1,46
11,42 1,4 59,4 0,65 1,27
10,31 1,31 49,63 0,66 1,43
8,65 1,12 391,27 0,84 1,5
10,94 1,16 258,62 0,74 1,35
9,87 0,88 75,66 0,75 1,41
6,14 1,07 123,68 0,75 1,47
12,93 1,24 37,21 0,79 1,35
9,78 1,49 53,37 0,72 1,4
13,22 2,03 32,87 0,7 1,2
17,29 1,84 45,63 0,66 1,15
7,11 1,22 48,41 0,69 1,09
22,49 1,72 13,58 0,71 1,26
12,14 1,75 63,99 0,73 1,36
15,25 1,46 104,55 0,65 1,15
31,34 1,6 222,11 0,82 1,87
11,56 1,47 25,76 0,8 1,17
30,14 1,38 29,52 0,83 1,61
19,71 1,41 41,99 0,7 1,34
23,56 1,39 78,11 0,74 1,22

1. Корреляцийн матриц үүсгэ. Бие даасан хувьсагчийн багцыг тохируулах (2 хүчин зүйлийг сонгох).

Үр дүнгийн тэмдгийг авч үзье Y3 болон хүчин зүйлийн шинж чанарууд X10, X12, X5, X7, X13 .

MS Excel програмын "Өгөгдлийн шинжилгээ→ Корреляци" гэсэн сонголтыг ашиглан корреляцийн матрицыг үүсгэцгээе.

Y3 X10 X12 X5 X7 X13
Y3 1,0000 0,3653 0,0185 0,2891 0,1736 0,0828
X10 0,3653 1,0000 -0,2198 -0,0166 -0,2061 -0,0627
X12 0,0185 -0,2198 1,0000 0,2392 0,3796 0,6308
X5 0,2891 -0,0166 0,2392 1,0000 0,4147 0,0883
X7 0,1736 -0,2061 0,3796 0,4147 1,0000 0,1939
X13 0,0828 -0,0627 0,6308 0,0883 0,1939 1,0000

Бид шалгуурын дагуу 2 хүчин зүйлийг сонгодог.

1) Y ба X хоорондын холболт хамгийн их байх ёстой

2) Xmi хоорондын холболт хамгийн бага байх ёстой

Тиймээс, дараагийн догол мөрөнд хүчин зүйлүүдтэй ажиллах болно X10 , X5.

Олон шугаман регрессийн тэгшитгэл байгуулах. Тэгшитгэлийн параметрүүдийн тайлбар.

2. Олон шугаман регрессийн тэгшитгэлийг байгуул. Тэгшитгэлийн параметрүүдийн тайлбарыг өгнө үү.

MS Excel програмын "Өгөгдлийн шинжилгээ→ Регресс" шинжилгээний багцыг ашиглан регрессийн загварыг бүтээцгээе.

Магадлал
Ю -20,7163
X 10 5,7169
X 5 34,9321

Регрессийн тэгшитгэл нь дараах байдлаар харагдах болно.

ŷ = b 0 + b 10 * x 10 + b 5 * x 5

ŷ = -20.7163-5.7169* x 10 +34.9321* x 5

1) b10 эерэг;

2) b5 эерэг;

Детерминацын коэффициент, олон корреляцийн коэффициент

3. Детерминацын коэффициент, олон корреляцийн коэффициентийг ол. Дүгнэлт хийх.

MS Excel-ийн "Өгөгдлийн шинжилгээ → Регресс" шинжилгээний багцыг ашиглан хийсэн регрессийн шинжилгээнд бид "Регрессийн статистик" хүснэгтийг олно.

Y3 ба X10,X5 хоорондын олон R холболт сул байна

R-квадрат - Y шинж чанарын өөрчлөлтийн 22.05% нь X10 ба X5 шинж чанаруудын өөрчлөлтөөр тайлбарлагдана.

Олон шугаман регрессийн тэгшитгэлийн чанарыг үнэлэх

4. Олон шугаман регрессийн тэгшитгэлийн чанарыг үнэл.

Ойролцоо харьцангуй дундаж алдаа

4.1. Харьцангуй ойртсон дундаж алдааг ол. Дүгнэлт хийх.

Ажиглалт бүрийн таамагласан утгыг тооцоолж үзье эсвэл MS Excel програмын "Өгөгдлийн шинжилгээ→ Регресс" шинжилгээний багцыг ашиглан хийсэн регрессийн шинжилгээнд "Үлдсэн гаралт" хүснэгтийн "Таамагласан Y" баганыг ашиглана уу)

Ажиглалт бүрийн харьцангуй алдааг томъёогоор тооцоолъё.

Харьцангуй ойртсон дундаж алдааг томъёогоор тооцоолъё.

Дүгнэлт: 20% < А < 50%, качество уравнения среднее (удовлетворительное).

Ойролцоох алдаа нь эх сурвалжийн өгөгдлийг ойртуулах тодорхой аргуудыг хэрэглэхэд хамгийн их тохиолддог асуудлуудын нэг юм. Ойролцоогоор янз бүрийн төрлийн алдаа байдаг:

Эх сурвалжийн өгөгдлийн алдаатай холбоотой алдаа;

Ойролцоо загвар болон ойролцоолсон өгөгдлийн бүтэц хоорондын зөрүүтэй холбоотой алдаа.

Excel нь нарийн математик ашигладаг өгөгдөл боловсруулах, ойртуулахад зориулсан сайн хөгжсөн Шугаман функцтэй. Энэ тухай ойлголттой болохын тулд товчилсон үг, тэмдэглэгээний зарим өөрчлөлтийн хамт танилцуулж буй энэхүү хөгжлийн тодорхой хэсгийг (F1-ээр дамжуулан) авч үзье.

Аргыг ашиглан цувралын статистикийг тооцоолно хамгийн бага квадратуудбайгаа өгөгдөлд хамгийн сайн тохирох шулуун шугамыг тооцоолох. Уг функц нь үүссэн мөрийг дүрсэлсэн массивыг буцаана. Массив утгыг буцаадаг тул функцийг массивын томьёо болгон зааж өгөх ёстой.

Шулуун шугамын тэгшитгэл нь:

y=a+b1*x1+b2*x2+...bn*xn

Синтакс:

LINEST(y;x;const;статистик)

Массив y - мэдэгдэж байгаа үнэ цэнэ y.

Массив x - мэдэгдэж буй х утгууд. X массив нь нэг буюу хэд хэдэн хувьсагчийг агуулж болно.

Const нь логикийн утга, энэ нь дамми a нь 0-тэй тэнцүү байх шаардлагатай эсэхийг тодорхойлдог.

Хэрэв const аргумент нь ҮНЭН, 1 эсвэл орхигдуулсан бол a-г ердийнхөөрөө үнэлнэ. Хэрэв const аргумент нь ХУДАЛ эсвэл 0 байвал a-г 0 болгож тохируулна.

Статистик нь нэмэлт регрессийн статистикийг буцаах эсэхийг заадаг Булийн утга юм. Хэрэв статистик нь ҮНЭН эсвэл 1 байвал LINEST нэмэлтийг буцаана регрессийн статистик. Хэрэв статистик нь ХУДАЛ, 0 эсвэл орхигдуулсан бол LINEST нь зөвхөн коэффициент болон огтлолцлыг буцаана.

Нэмэлт регрессийн статистик:

se1,se2,...,sen - b1,b2,...,bn коэффициентүүдийн стандарт алдааны утгууд.

далай - a тогтмолын стандарт алдааны утга (хэрэв const ХУДАЛ бол далай = #Үгүй).

r2 нь детерминизмын коэффициент юм. y-ийн бодит утга ба шугамын тэгшитгэлээс олж авсан утгыг харьцуулсан; Харьцуулалтын үр дүнд үндэслэн детерминизмын коэффициентийг тооцоолж, 0-ээс 1 хүртэл нормчилно. Хэрэв энэ нь 1-тэй тэнцүү бол загвартай бүрэн хамаарал байна, өөрөөр хэлбэл. y-ийн бодит ба тооцоолсон утгуудын хооронд ялгаа байхгүй. Эсрэг тохиолдолд детерминацийн коэффициент 0 байвал регрессийн тэгшитгэл нь у-ийн утгыг таамаглахад амжилтгүй болно. R2-ийг хэрхэн тооцдог тухай мэдээллийг энэ хэсгийн төгсгөлд байгаа "Тэмдэглэл"-ээс үзнэ үү.

sey нь y-г тооцоолох стандарт алдаа юм.

F-статистик, эсвэл F-ажиглагдсан утга. F-статистик нь хамааралтай болон бие даасан хувьсагчдын хооронд ажиглагдсан хамаарал нь тохиолдлоос үүдэлтэй эсэхийг тодорхойлоход хэрэглэгддэг.

df - эрх чөлөөний зэрэг. Эрх чөлөөний зэрэг нь статистикийн хүснэгтээс F-эгзэгтэй утгыг олоход тустай. Загварын итгэлийн түвшинг тодорхойлохын тулд та хүснэгт дэх утгыг LINEST функцээр буцаасан F-статистиктай харьцуулна уу.

ssreg нь квадратуудын регрессийн нийлбэр юм.

ssresid нь квадратуудын үлдэгдэл нийлбэр юм.

Доорх зурагт нэмэлт регрессийн статистикийг буцаах дарааллыг харуулав.

Тэмдэглэл

Функцээс сонгосон мэдээллийг INDEX функцээр дамжуулан авч болно, жишээлбэл:

Y тасалдал (чөлөөт хугацаа):

INDEX(LINEST(y,x),2)

LINEST функцээр тооцоолсон шулуун шугамыг ашиглан ойртсон тооцооллын нарийвчлал нь өгөгдлийн тархалтын зэргээс хамаарна. Өгөгдөл шулуун шугамд ойртох тусам LINEST функцын загвар нь илүү нарийвчлалтай болно. LINEST функц нь өгөгдөлд хамгийн сайн тохирохыг тодорхойлохын тулд хамгийн бага квадратуудыг ашигладаг.

Регрессийн шинжилгээ хийснээр, Microsoft Excelцэг бүрт таамагласан y утга ба бодит у утгын зөрүүний квадратыг тооцоолно. Эдгээр квадрат зөрүүний нийлбэрийг квадратуудын үлдэгдэл нийлбэр гэж нэрлэдэг. Дараа нь Microsoft Excel нь бодит y утгууд ба дундаж y утгын хоорондох зөрүүний квадратуудын нийлбэрийг тооцоолдог бөгөөд үүнийг квадратуудын нийт нийлбэр (квадратуудын регрессийн нийлбэр + квадратуудын үлдэгдэл нийлбэр) гэж нэрлэдэг. Квадратуудын үлдэгдэл нийлбэр нь нийт квадратуудын нийлбэртэй харьцуулахад бага байх тусам детерминацын коэффициент r2 их байх ба энэ нь регрессийн тэгшитгэл нь хувьсагчдын хоорондын хамаарлыг хэр сайн тайлбарлаж байгааг хэмждэг.

Регрессийн тэгшитгэлээр таамагласан y утгууд нь тэгшитгэлийг тодорхойлоход ашигласан y утгуудын хүрээнээс гадуур байвал зөв биш байж болохыг анхаарна уу.

Жишээ 1 Налуу ба Ү огтлолцол

LINEST((1;9;5;7);(0;4;2;3)) тэнцүү (2;1), налуу = 2 ба y- огтлолцол = 1.

F ба R2 статистикийг ашиглах

Та F статистикийг ашиглан өндөр r2 утгатай үр дүн нь тохиолдлоос үүдэлтэй эсэхийг тодорхойлох боломжтой. Хэрэв ажиглагдсан F нь F-критикаас их байвал хувьсагчдын хооронд хамаарал байна. F-эгзэгтэй утгыг математикийн статистикийн аливаа лавлах номноос F-чухал утгын хүснэгтээс авч болно. Нэг талт тест ашиглан энэ утгыг олохын тулд Альфа утгыг (Альфагийн утгыг хүчтэй харилцаа байна гэж буруу дүгнэх магадлалыг заахдаа ашигладаг) 0.05-тай тэнцүү, эрх чөлөөний зэрэг ( ихэвчлэн v1 ба v2 гэж тэмдэглэдэг), v1 = k = 4 ба v2 = n - (k + 1) = 11 - (4 + 1) = 6 гэж үзье, энд k нь хувьсагчийн тоо, n нь өгөгдлийн цэгийн тоо юм. . Лавлах хүснэгтээс харахад F-эгзэгтэй нь 4.53 байна. Ажиглагдсан F-утга нь 459.753674 (энэ утгыг бидний орхигдуулсан жишээн дээр авсан) бөгөөд энэ нь F-эгзэгтэй утга болох 4.53-аас мэдэгдэхүйц их байна. Иймээс үүссэн регрессийн тэгшитгэл нь хүссэн үр дүнг таамаглахад тустай.

Ойролцоогоор дундаж алдаа- тооцоолсон утгын бодит хэмжээнээс дундаж хазайлт:

Энд y x нь тэгшитгэлээс тооцсон утга юм.

Ойролцоогоор дундаж алдаа 15% хүртэл байгаа нь зөв тохирсон тэгшитгэлийн загварыг харуулж байна.

199X оны Уралын бүсийн долоон нутаг дэвсгэрийн хувьд хоёр шинж чанарын утгыг мэддэг.

Шаардлагатай:
1. y-ийн х-ээс хамаарлыг тодорхойлохын тулд дараах функцүүдийн параметрүүдийг тооцоол.
а) шугаман;
б) хүч;
в) харуулах;
d) тэгш талт гипербол (та энэ загварыг хэрхэн урьдчилан шугаман болгох талаар бодох хэрэгтэй).
2. Загвар бүрийг үнэл дундаж ойролцоо алдаа cf ба Фишерийн F тест.

Бид шийдлийг ашиглан гүйцэтгэдэг онлайн тооцоолуурШугаман регрессийн тэгшитгэл.
a) шугаман регрессийн тэгшитгэл;
График аргыг ашиглах.
Энэ аргыг судалж буй эдийн засгийн үзүүлэлтүүдийн хоорондын холболтын хэлбэрийг нүдээр харуулахад ашигладаг. Үүнийг хийхийн тулд графикийг тэгш өнцөгт координатын системд зурж, үр дүнгийн шинж чанарын Y-ийн бие даасан утгыг ординатын тэнхлэгийн дагуу, X хүчин зүйлийн шинж чанарын бие даасан утгуудыг абсцисса тэнхлэгийн дагуу зурна.
Үр дүн ба хүчин зүйлийн шинж чанарын цэгүүдийн багцыг нэрлэдэг корреляцийн талбар.


Корреляцийн талбар дээр үндэслэн таамаглал дэвшүүлж болно (нь хүн ам) X ба Y-ийн бүх боломжит утгуудын хоорондын хамаарал шугаман байна.
Шугаман регрессийн тэгшитгэл нь y = bx + a + ε байна
Энд ε нь санамсаргүй алдаа (хазайлт, эвдрэл).
Санамсаргүй алдаа байгаа шалтгаанууд:
1. Регрессийн загварт чухал ач холбогдолтой тайлбарлагч хувьсагчдыг оруулаагүй;
2. Хувьсагчдыг нэгтгэх. Жишээлбэл, нийт хэрэглээний функц нь оролдлого юм ерөнхий илэрхийлэлхувь хүний ​​зарцуулалтын шийдвэрүүдийн нийлбэр. Энэ нь зөвхөн өөр өөр параметртэй хувь хүний ​​харилцааны ойролцоо тооцоолол юм.
3. Загварын бүтцийг буруу тодорхойлсон;
4. Буруу функциональ үзүүлэлт;
5. Хэмжилтийн алдаа.
Тодорхой ажиглалт бүрийн ε i хазайлт нь санамсаргүй бөгөөд түүвэр дэх тэдгээрийн утга тодорхойгүй тул:
1) x i ба y i ажиглалтаас зөвхөн α ба β параметрийн тооцоог гаргаж болно.
2) Регрессийн загварын α ба β параметрүүдийн үнэлгээ нь санамсаргүй шинж чанартай тус бүр a ба b утгууд юм. санамсаргүй түүвэрт тохирох;
Дараа нь тооцоолж буй регрессийн тэгшитгэл (түүврийн өгөгдлөөр бүтээгдсэн) y = bx + a + ε хэлбэртэй байх ба энд e i нь алдааны ажиглагдсан утгууд (тооцоолол) ε i ба a ба b нь тус тусын тооцоолол юм. олох ёстой регрессийн загварын α ба β параметрүүд.
α ба β параметрүүдийг тооцоолохын тулд хамгийн бага квадратын аргыг (хамгийн бага квадратын арга) ашигладаг.




Бид b = -0.35, a = 76.88-ийг авна
Регрессийн тэгшитгэл:
у = -0.35 x + 76.88

x y x 2 y 2 x y у(х) (y i -y cp) 2 (у-у(х)) 2 |y - y x |:y
45,1 68,8 2034,01 4733,44 3102,88 61,28 119,12 56,61 0,1094
59 61,2 3481 3745,44 3610,8 56,47 10,98 22,4 0,0773
57,2 59,9 3271,84 3588,01 3426,28 57,09 4,06 7,9 0,0469
61,8 56,7 3819,24 3214,89 3504,06 55,5 1,41 1,44 0,0212
58,8 55 3457,44 3025 3234 56,54 8,33 2,36 0,0279
47,2 54,3 2227,84 2948,49 2562,96 60,55 12,86 39,05 0,1151
55,2 49,3 3047,04 2430,49 2721,36 57,78 73,71 71,94 0,172
384,3 405,2 21338,41 23685,76 22162,34 405,2 230,47 201,71 0,5699

Тайлбар: y(x)-ийн утгуудыг үр дүнгийн регрессийн тэгшитгэлээс олно.
y(45.1) = -0.35*45.1 + 76.88 = 61.28
у(59) = -0.35*59 + 76.88 = 56.47
... ... ...

Ойролцоогоор алдаа
Үнэмлэхүй ойртсон алдааг ашиглан регрессийн тэгшитгэлийн чанарыг үнэлье. Ойролцоогоор дундаж алдаа- тооцоолсон утгын бодит хэмжээнээс дундаж хазайлт:

Алдаа нь 15% -иас бага тул энэ тэгшитгэлийг регресс болгон ашиглаж болно.

F-статистик. Фишерийн шалгуур.










3. Хүснэгтийн утгаЭрх чөлөөний зэрэглэлийн тоог харгалзан өгөгдсөн ач холбогдлын түвшнийг Фишерийн тархалтын хүснэгтээс тодорхойлно. нийт дүнквадратууд (илүү их дисперс) 1, шугаман регрессийн квадратуудын үлдэгдэл нийлбэрийн (бага дисперс) чөлөөт байдлын зэрэгийн тоо n-2 байна.
4. Хэрэв F тестийн бодит утга нь хүснэгтийн утгаас бага байвал тэг таамаглалыг үгүйсгэх шалтгаан байхгүй гэж тэд хэлэв.
Үгүй бол тэг таамаглалыг үгүйсгэж, тэгшитгэлийн статистик ач холбогдлын талаархи өөр таамаглалыг магадлалаар (1-α) хүлээн авна.

< Fkp, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

б) хүчний регресс;
Шийдэл нь шугаман бус регрессийн үйлчилгээг ашиглан хийгддэг. Сонгохдоо Power y = ax b гэж зааж өгнө
в) экспоненциал регресс;
г) тэгш талт гиперболын загвар.
Ердийн тэгшитгэлийн систем.

Бидний өгөгдлийн хувьд тэгшитгэлийн систем нь хэлбэртэй байна
7a + 0.1291b = 405.2
0.1291a + 0.0024b = 7.51
Эхний тэгшитгэлээс бид a-г илэрхийлж, хоёр дахь тэгшитгэлд орлуулна
Бид b = 1054.67, a = 38.44-ийг авна
Регрессийн тэгшитгэл:
y = 1054.67 / x + 38.44
Ойролцоогоор алдаа.
Үнэмлэхүй ойртсон алдааг ашиглан регрессийн тэгшитгэлийн чанарыг үнэлье.

Алдаа нь 15% -иас бага тул энэ тэгшитгэлийг регресс болгон ашиглаж болно.

Фишерийн шалгуур.
Регрессийн загварын ач холбогдлыг турших нь Фишерийн F тестийг ашиглан хийгддэг бөгөөд тооцоолсон утгыг судалж буй үзүүлэлтийн анхны цуврал ажиглалтын дисперсийн харьцаа ба үлдэгдэл дарааллын дисперсийн бодитой үнэлгээний харьцаагаар олдог. энэ загварын хувьд.
Хэрэв k1=(m) ба k2=(n-m-1) эрх чөлөөний зэрэгтэй тооцоолсон утга нь өгөгдсөн ач холбогдлын түвшинд хүснэгтлэгдсэн утгаас их байвал загварыг ач холбогдолтой гэж үзнэ.

энд m нь загвар дахь хүчин зүйлийн тоо.
Хосолсон шугаман регрессийн статистик ач холбогдлыг дараах алгоритмыг ашиглан үнэлнэ.
1. Тэгшитгэл бүхэлдээ статистикийн хувьд ач холбогдолгүй гэсэн тэг таамаг дэвшүүлэв: H 0: R 2 =0 ач холбогдлын α түвшинд.
2. Дараа нь F-шалгуурын бодит утгыг тодорхойлно:

Энд m=1 хос регрессийн хувьд.
k1=1 ба k2=5 эрх чөлөөний зэрэгтэй шалгуур үзүүлэлтийн хүснэгтийн утга, Fkp = 6.61
F-ийн бодит утгаас хойш< Fkp, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

5. F-тестийг ашиглан үр дүнд бий болсон хосолсон регрессийн тэгшитгэл нь бүхэлдээ статистикийн хувьд ач холбогдолгүй бөгөөд сарын тэтгэврийн үнэ цэнэ у болон амьжиргааны өртөг x хоорондын хамаарлын судлагдсан үзэгдлийг хангалттай тодорхойлж чадахгүй байгаа нь тогтоогдсон.

6. Нөхцөлт y пүүсийн цэвэр орлогын хэмжээг хөрөнгийн эргэлт x1, ашигласан капитал х2-тэй холбосон эконометрик олон шугаман регрессийн загварыг бий болгосон.

7. Уян хатан байдлын коэффициентийг тооцсоноор хөрөнгийн эргэлт 1%-иар өөрчлөгдөхөд компанийн цэвэр орлогын хэмжээ 0,0008%-иар, ашигласан хөрөнгө 1%-иар өөрчлөгдөхөд компанийн цэвэр орлогын хэмжээ өөрчлөгддөг болохыг харуулж байна. 0.56%-иар өөрчлөгдөнө.

8. t-тестийг ашиглан регрессийн коэффициентүүдийн статистик ач холбогдлыг үнэлэв.Х 1 тайлбарлагч хувьсагч нь статистикийн хувьд ач холбогдолгүй бөгөөд регрессийн тэгшитгэлээс хасагдах боломжтой бол нэгэн зэрэг тайлбарлагч х 2 хувьсагч нь статистик ач холбогдолтой.

9. F тестийг ашиглан үр дүнд бий болсон хосолсон регрессийн тэгшитгэл нь бүхэлдээ статистикийн ач холбогдолтой бөгөөд нөхцөлт пүүсийн цэвэр орлого y ба хөрөнгийн эргэлт х 1 болон ашигласан хөрөнгийн хоорондын хамаарлын судлагдсан үзэгдлийг хангалттай дүрсэлсэн болохыг тогтоожээ. x 2.

10. Статистикийн өгөгдлийг шугаман олон регрессийн тэгшитгэлээр ойртуулах дундаж алдааг тооцоолсон нь 29.8% байна. Статистикийн мэдээллийн санд ямар ажиглалт хийснээс болж энэ алдааны хэмжээ зөвшөөрөгдөх хэмжээнээс давж байгааг харуулав.

14. EXCEL ашиглахгүйгээр хосолсон регрессийн загвар бүтээх.

Хүснэгт 3.5-д өгсөн статистикийн материалыг ашиглан дараахь зүйлийг хийх шаардлагатай.

2. Корреляци ба тодорхойлох үзүүлэлтүүдийг ашиглан холболтын ойр байдлыг үнэлэх.

3. Уян хатан байдлын коэффициентийг ашиглан хүчин зүйлийн шинж чанар ба үр дүнгийн хоорондын уялдаа холбоог тодорхойлно.

4. Ойролцооны дундаж алдааг тодорхойлно.

5. Загварчлалын статистикийн найдвартай байдлыг Фишерийн F тест ашиглан үнэл.

Хүснэгт 3.5. Анхны өгөгдөл.

Хадгаламж, зээл, гэрчилгээний хуримтлалыг нэмэгдүүлэх, гадаад валют худалдан авахад чиглэсэн мөнгөн орлогын нэг хүнд ногдох дундаж мөнгөн орлогод эзлэх хувь, %

Сарын дундаж хуримтлагдсан цалин, c.u.

Калужская

Костромская

Орловская

Рязань

Смоленская

Хосолсон шугаман регрессийн тэгшитгэлийн үл мэдэгдэх b 0, b 1 параметрүүдийг тодорхойлохын тулд бид ердийн тэгшитгэлийн стандарт системийг ашигладаг.

(3.7)

Энэ системийг шийдэхийн тулд эхлээд Sx 2 ба Sxy утгыг тодорхойлох шаардлагатай. Эдгээр утгыг эх өгөгдлийн хүснэгтээс тодорхойлж, зохих баганаар нэмж оруулсан болно (Хүснэгт 3.6).

Хүснэгт 3.6. Регрессийн коэффициентийн тооцоололд.

Дараа нь систем (3.7) хэлбэрийг авна

Эхний тэгшитгэлээс b 0-ийг илэрхийлж, үр дүнгийн илэрхийлэлийг хоёр дахь тэгшитгэлд орлуулснаар бид дараахь зүйлийг олж авна.

Нэр томьёогоор үржүүлэх, хаалт нээхэд бид дараахь зүйлийг авна.

Эцэст нь, хуримтлалыг нэмэгдүүлэхэд чиглэсэн хүн амын мөнгөн орлогын эзлэх хувийн жинг сарын дундаж хуримтлагдсан цалин х-тэй холбосон хос шугаман регрессийн тэгшитгэл нь дараах хэлбэртэй байна.

Тиймээс, хос шугаман регрессийн тэгшитгэлийг бий болгосноор бид хамаарлын дагуу шугаман корреляцийн коэффициентийг тодорхойлно.

Харгалзах параметрүүдийн стандарт хазайлтын утгууд хаана байна.

Хамаарал (3.9) -аас шугаман корреляцийн коэффициентийг тооцоолохын тулд бид завсрын тооцоог хийдэг.

Олдсон параметрүүдийн утгыг илэрхийлэлд орлуулж (3.9) олж авна

.

Шугаман корреляцийн коэффициентийн олж авсан утга нь хуримтлалыг нэмэгдүүлэхэд чиглэсэн хүн амын мөнгөн орлогын эзлэх хувь y болон сарын дундаж хуримтлагдсан цалингийн хэмжээ х хооронд урвуу статистикийн сул хамаарал байгааг харуулж байна.

Детерминацын коэффициент нь y дээр тайлбарлагч хувьсагч x-ийг регресс болгосноор зөвхөн 9.6% нь тайлбарлагддаг гэсэн үг юм. Үүний дагуу 90.4% -тай тэнцэх 1-ийн утга нь эконометрик загварт тооцогдоогүй бусад бүх тайлбарлагч хувьсагчдын нөлөөнөөс үүссэн y хувьсагчийн дисперсийн эзлэх хувийг тодорхойлдог.

Уян хатан байдлын коэффициент нь

Улмаар сарын дундаж хуримтлагдсан цалин 1%-иар өөрчлөгдөхөд хуримтлалыг нэмэгдүүлэхэд чиглэсэн хүн амын мөнгөн орлогын эзлэх хувь мөн 1%-иар буурч, цалин нэмэгдэхийн хэрээр иргэдийн мөнгөн орлогын эзлэх хувь буурч байна. хуримтлалыг нэмэгдүүлэхэд чиглэсэн хүн ам. Энэхүү дүгнэлт нь нийтлэг ойлголттой зөрчилдөж байгаа бөгөөд зөвхөн үүссэн математик загварын буруугаар тайлбарлаж болно.

Ойролцооны дундаж алдааг тооцоолъё.

Хүснэгт 3.7. Ойролцоо дундаж алдааны тооцоолол руу.

Олж авсан утга нь (12...15)%-иас хэтэрсэн нь эконометрик загварыг бий болгосон бодит өгөгдлөөс тооцоолсон өгөгдлийн дундаж хазайлтын ач холбогдлыг харуулж байна.

Статистик загварчлалын найдвартай байдлыг Фишерийн F тест дээр үндэслэн хийнэ. Фишерийн F тооцооны шалгуурын онолын утгыг томъёоны дагуу нэг зэрэглэлийн эрх чөлөөнд тооцсон хүчин зүйл ба үлдэгдэл дисперсийн утгын харьцаагаар тодорхойлно.

энд n нь ажиглалтын тоо;

m нь тайлбарлах хувьсагчдын тоо (харгалзан авч буй жишээний хувьд m m =1).

F критийн эгзэгтэй утгыг статистикийн хүснэгтээс тодорхойлсон бөгөөд ач холбогдлын түвшний хувьд a = 0.05 нь 10.13-тай тэнцүү байна. F тооцоолсон тул

15. EXCEL ашиглахгүйгээр олон регрессийн загвар бүтээх.

Хүснэгт 3.8-д өгөгдсөн статистикийн материалыг ашиглан та:

1. Шугаман олон тооны регрессийн тэгшитгэлийг байгуулж, түүний параметрүүдийн эдийн засгийн утгыг тайлбарла.

2. Дундаж (ерөнхий) уян хатан байдлын коэффициентийг ашиглан хүчин зүйлүүд болон үүссэн шинж чанарын хоорондын хамаарлын ойролцоо байдлын харьцуулсан үнэлгээг өгнө.

3. Регрессийн коэффициентүүдийн статистик ач холбогдлыг t тест болон тэгшитгэлийн ач холбогдолгүй байдлын талаарх тэг таамаглалыг F тест ашиглан үнэлнэ.

4. Ойролцоогоор дундаж алдааг тодорхойлох замаар тэгшитгэлийн чанарыг үнэлнэ.

Хүснэгт 3.8. Анхны өгөгдөл.

Цэвэр орлого, сая ам.доллар

Хөрөнгийн эргэлт сая ам.доллар

Ашигласан хөрөнгө, сая ам.доллар

Олон шугаман регрессийн тэгшитгэлийн үл мэдэгдэх b 0, b 1, b 2 параметрүүдийг тодорхойлохын тулд бид ердийн тэгшитгэлийн стандарт системийг ашигладаг.

(3.11)

Энэ системийг шийдэхийн тулд эхлээд Sx 1 2, Sx 2 2, Sx 1 y, Sx 2 y, Sx 1 x 2 хэмжигдэхүүнүүдийн утгыг тодорхойлох шаардлагатай. Эдгээр утгыг эх өгөгдлийн хүснэгтээс тодорхойлж, зохих баганаар нэмж оруулсан болно (Хүснэгт 3.9).

Хүснэгт 3.9. Регрессийн коэффициентийн тооцоололд.

Дараа нь систем (3.11) хэлбэрийг авна

Энэ системийг шийдэхийн тулд бид үл мэдэгдэх зүйлсийг дараалан арилгахаас бүрдэх Гауссын аргыг ашиглана: системийн эхний тэгшитгэлийг 10-д хувааж, дараа нь үүссэн тэгшитгэлийг 370.6-аар үржүүлж, системийн хоёр дахь тэгшитгэлээс хасаад дараа нь үржүүлнэ. 158.20-аар үүссэн тэгшитгэлийг системийн гурав дахь тэгшитгэлээс хасна. Системийн хувиргасан хоёр ба гурав дахь тэгшитгэлд заасан алгоритмыг давтаж, бид дараахь зүйлийг олж авна.

Þ Þ

Þ .

Өөрчлөлтийн дараа бидэнд:

Дараа нь хөрөнгийн эргэлт, ашигласан капиталаас цэвэр орлогын эцсийн хамаарал нь хэлбэр юм шугаман тэгшитгэлолон регресс нь дараах хэлбэртэй байна.

Үүссэн эконометрик тэгшитгэлээс харахад ашигласан хөрөнгийн хэмжээ нэмэгдэхийн хэрээр цэвэр орлого нэмэгдэж, эсрэгээр хөрөнгийн эргэлт нэмэгдэхийн хэрээр цэвэр орлого буурч байгааг харж болно. Түүнчлэн регрессийн коэффициент их байх тусам тайлбарлагч хувьсагч хамааралтай хувьсагчид төдий чинээ их нөлөөлнө. Харж буй жишээнд регрессийн коэффициентийн утга нь коэффициентийн утгаас их байгаа тул ашигласан капитал нь хөрөнгийн эргэлтээс илүү цэвэр орлогод илүү их нөлөө үзүүлдэг. Энэ дүгнэлтийг тооцоолохын тулд бид хэсэгчилсэн уян хатан байдлын коэффициентийг тодорхойлно.

Үр дүнгийн дүн шинжилгээнээс харахад ашигласан хөрөнгө нь цэвэр орлогод илүү их нөлөө үзүүлдэг. Тодруулбал, ашигласан хөрөнгийн хэмжээ 1%-иар нэмэгдсэнээр цэвэр орлого 1.17%-иар нэмэгддэг. Үүний зэрэгцээ хөрөнгийн эргэлт 1% -иар өсөхөд цэвэр орлого 0.5% -иар буурч байна.

Фишерийн шалгуур үзүүлэлтийн онолын үнэ цэнэ F тооцоо.

F критийн эгзэгтэй утгын утгыг статистикийн хүснэгтээс тодорхойлсон бөгөөд ач холбогдлын түвшин a = 0.05 бол 4.74-тэй тэнцүү байна. F calc > F crit тул тэг таамаглалыг үгүйсгэж, үүссэн регрессийн тэгшитгэлийг статистикийн ач холбогдолтой гэж хүлээн зөвшөөрсөн.

Регрессийн коэффициент ба t-шалгуурын статистикийн ач холбогдлыг үнэлэх нь эдгээр коэффициентүүдийн тоон утгыг тэдгээрийн санамсаргүй алдааны хэмжээ, хамаарлын дагуу харьцуулах явдал юм.

t-статистикийн онолын утгыг тооцоолох ажлын томъёо нь:

, (3.13)

Энд хамаарлаас хос корреляцийн коэффициент ба олон корреляцийн коэффициентийг тооцоолно.

Дараа нь t-статистикийн онолын (тооцсон) утгууд нь дараахтай тэнцүү байна.

t crit = 2.36-тай тэнцүү ач холбогдлын түвшний хувьд статистикийн хүснэгтээс тодорхойлсон t-статистикийн критик утга нь абсолют утгаараа = - 1.798-аас их байгаа тул тэг таамаглалыг үгүйсгэхгүй бөгөөд тайлбарлагч хувьсагч х 1 байна. статистикийн хувьд ач холбогдолгүй бөгөөд үүнийг регрессийн тэгшитгэлээс хасч болно. Харин эсрэгээр, хоёр дахь регрессийн коэффициент > t crit (3.3 > 2.36), тайлбарлагч хувьсагч х 2 нь статистикийн хувьд чухал юм.

Ойролцооны дундаж алдааг тооцоолъё.

Хүснэгт 3.10. Ойролцоо дундаж алдааны тооцоолол руу.

Дараа нь дундаж ойролцоо алдаа байна

Хүлээн авсан утга нь (12…15)% -тай тэнцэх зөвшөөрөгдөх хязгаараас хэтрэхгүй байна.

16. Хэмжилтийн онолын хөгжлийн түүх

TI нь анх психофизик хэмжилтийн онол болгон хөгжсөн. Дайны дараах хэвлэлүүдэд Америкийн сэтгэл судлаач С. Стивенс хэмжилтийн масштаб дээр анхаарлаа хандуулав. 20-р зууны хоёрдугаар хагаст. TI-ийн хэрэглээний хамрах хүрээ хурдацтай өргөжиж байна. 50-иад онд АНУ-д хэвлэгдсэн "Сэтгэл зүйн шинжлэх ухааны нэвтэрхий толь"-ын нэг боть нь "Сэтгэл зүйн хэмжилт" нэртэй байв. Энэхүү нийтлэлийн зохиогчид ТИ-ийн хамрах хүрээг психофизикээс ерөнхийд нь сэтгэл судлал хүртэл өргөжүүлсэн. Энэхүү цуглуулгын "Хэмжилтийн онолын үндэс" өгүүлэлд танилцуулга нь хийсвэр математикийн түвшинд хийгдсэн бөгөөд ямар нэгэн тодорхой хэрэглээний талбарт хамааралгүй байв. Үүнд "эмпирик системийн гомоморфизмыг тоон системтэй харьцах" гэж онцлон тэмдэглэсэн (энд эдгээр математикийн нэр томьёо руу орох шаардлагагүй) бөгөөд илтгэлийн математикийн нарийн төвөгтэй байдал нь С.С. Стивенс.

TI-ийн талаархи дотоодын анхны нийтлэлүүдийн нэгэнд (60-аад оны сүүлч) шалгалтын объектыг үнэлэхдээ шинжээчдийн өгсөн оноог дүрмээр бол дарааллын масштабаар хэмждэг болохыг тогтоожээ. 70-аад оны эхээр гарч ирсэн бүтээлүүд нь TI ашиглалтын хүрээг мэдэгдэхүйц өргөжүүлэхэд хүргэсэн. Үүнийг сурган хүмүүжүүлэх квалиметри (оюутны мэдлэгийн чанарыг хэмжих), системийн судалгаа, онолын янз бүрийн асуудалд ашигласан. шинжээчдийн үнэлгээ, бүтээгдэхүүний чанарын үзүүлэлтүүдийг нэгтгэх, социологийн судалгаанд гэх мэт.

TI-ийн хоёр үндсэн асуудлын хувьд тодорхой өгөгдлийг хэмжих масштабын төрлийг тодорхойлохын зэрэгцээ өгөгдлийн шинжилгээний алгоритмыг эрэлхийлсэн бөгөөд үр дүн нь масштабын зөвшөөрөгдөх өөрчлөлтөөр өөрчлөгддөггүй (жишээ нь, харилцан адилгүй байдаг). Энэ өөрчлөлтөд).Газарзүйн ординаль хэмжүүр нь Бофортын масштабын салхи ("тайван", "хөнгөн салхи", "дунд зэргийн салхи" гэх мэт), газар хөдлөлтийн хүч чадлын хуваарь юм. Мэдээжийн хэрэг, 2 магнитудын газар хөдлөлт (таазны доор дэнлүү найгасан) нь 10 магнитудын газар хөдлөлтөөс (дэлхийн гадаргуу дээрх бүх зүйлийг бүрэн устгах) яг 5 дахин сул байна гэж хэлж болохгүй.

Анагаах ухаанд артерийн хэмжүүрүүд нь гипертензийн үе шатуудын масштаб (Мясниковын дагуу), зүрхний дутагдлын зэрэг (Стражеско-Василенко-Лангын дагуу), титэм судасны дутагдлын хүндийн хэмжүүр (Фогельсоны дагуу) гэх мэт юм. . Эдгээр бүх жингүүд нь дараах схемийн дагуу баригдсан: өвчин илрээгүй; өвчний эхний үе шат; хоёр дахь шат; гуравдугаар үе шат... Заримдаа 1а, 16 гэх мэт үе шатуудыг ялгадаг.Үе шат бүр нь өөрт тохирсон эмнэлгийн шинж чанартай байдаг. Тахир дутуугийн бүлгийг тодорхойлохдоо тоонуудыг эсрэгээр нь ашигладаг: хамгийн хүнд нь эхний хөгжлийн бэрхшээлтэй бүлэг, дараа нь хоёрдугаарт, хамгийн хөнгөн нь гуравдугаарт ордог.

Байшингийн дугаарыг мөн дарааллын хэмжүүрээр хэмждэг бөгөөд тэдгээр нь гудамжны дагуу байшингууд ямар дарааллаар байрлаж байгааг харуулдаг. Зохиолчийн цуглуулсан бүтээлийн боть дугаар эсвэл аж ахуйн нэгжийн архивт байгаа хэргийн дугаар нь ихэвчлэн тэдгээрийг бүтээсэн он дараалалтай холбоотой байдаг.

Бүтээгдэхүүн, үйлчилгээний чанарыг үнэлэхдээ дарааллын хэмжүүр нь квалиметр гэж нэрлэгддэг (шууд орчуулга - чанарын хэмжилт) түгээмэл байдаг. Тухайлбал, үйлдвэрлэлийн нэгжийг нэвтрүүлэх боломжтой эсвэл тохиромжгүй гэж үнэлдэг. Илүү нарийвчилсан дүн шинжилгээ хийхийн тулд гурван зэрэглэл бүхий хуваарийг ашигладаг: мэдэгдэхүйц согогууд байдаг - зөвхөн бага зэргийн согогууд байдаг - согог байхгүй. Заримдаа дөрвөн зэрэглэлийг ашигладаг: чухал согогууд байдаг (ашиглах боломжгүй болгодог) - мэдэгдэхүйц согогууд байдаг - зөвхөн бага зэргийн согогууд байдаг - согог байхгүй. Бүтээгдэхүүний зэрэглэл нь ижил утгатай - дээд зэрэглэлийн, нэгдүгээр зэрэглэлийн, хоёрдугаар зэрэглэлийн,...

Байгаль орчинд үзүүлэх нөлөөллийг үнэлэхдээ эхний, хамгийн ерөнхий үнэлгээ нь ихэвчлэн дараалсан байдаг, жишээлбэл: байгаль орчин тогтвортой байна - байгаль орчин нь дарангуйлагдсан (доройтсон). Байгаль орчин-эмнэлгийн цар хүрээ нь ижил төстэй: хүний ​​эрүүл мэндэд тодорхой нөлөө үзүүлэхгүй - эрүүл мэндэд сөрөг нөлөө үзүүлдэг.

Ординаль хуваарийг бусад хэсэгт ч ашигладаг. Эконометрикийн хувьд эдгээр нь үндсэндээ шинжээчдийн үнэлгээний янз бүрийн аргууд юм.

Бүх хэмжүүрийг чанарын шинж чанарын хэмжүүр ба тоон үзүүлэлтийн хэмжүүр гэсэн хоёр бүлэгт хуваадаг. Чанарын шинж чанаруудын үндсэн хэмжүүр нь эрэмбийн хуваарь ба нэршлийн хуваарь тул чанарын шинжилгээний үр дүнг олон тодорхой чиглэлээр эдгээр масштабын хэмжилт гэж үзэж болно. Тоон шинж чанарын хуваарь нь интервал, харьцаа, зөрүү, үнэмлэхүй хэмжигдэхүүн юм. Интервалын хуваарийг ашиглан боломжит энергийн хэмжээ эсвэл шулуун шугам дээрх цэгийн координатыг хэмждэг. Эдгээр тохиолдолд байгалийн гарал үүсэл болон байгалийн хэмжүүрийн нэгжийг масштаб дээр тэмдэглэж болохгүй. Судлаач эхлэх цэгийг тогтоож, хэмжих нэгжийг өөрөө сонгох ёстой. Интервалын масштаб дахь хүлээн зөвшөөрөгдөх өөрчлөлтүүд нь шугаман өсөлтийн хувиргалтууд, i.e. шугаман функцууд. Цельсийн болон Фаренгейтийн хэмжүүрүүд яг ийм хамаарлаар холбогддог: °C = 5/9 (°F - 32), энд °C нь Цельсийн хэмжүүр дэх температур (градусаар), °F нь Фаренгейтийн температур юм. масштаб.

Тоон хэмжүүрүүдээс шинжлэх ухаан, практикт хамгийн түгээмэл нь харьцааны хэмжүүр юм. Тэд байгалийн лавлах цэгтэй байдаг - тэг, i.e. тоо хэмжээ байхгүй, гэхдээ байгалийн хэмжүүр байхгүй. Ихэнх физик нэгжийг харьцааны хэмжүүрээр хэмждэг: биеийн жин, урт, цэнэг, түүнчлэн эдийн засаг дахь үнэ. Харьцааны хуваарь дахь зөвшөөрөгдөх өөрчлөлтүүд нь ижил төстэй (зөвхөн масштабыг өөрчлөх). Өөрөөр хэлбэл чөлөөт нэр томъёогүйгээр шугаман өсөлтийн хувиргалт, жишээлбэл үнийг нэг валютаас нөгөөд тогтмол ханшаар хөрвүүлэх. Бид хоёр хөрөнгө оруулалтын төслийн эдийн засгийн үр ашгийг рублийн үнийг ашиглан харьцуулж үзье. Эхний төсөл нь хоёр дахь төслөөс илүү сайн байх болтугай. Одоо тогтмол хөрвүүлэх ханшийг ашиглан Хятадын мөнгөн тэмдэгт - юань руу шилжье. Мэдээжийн хэрэг, эхний төсөл нь хоёр дахь төслөөс илүү ашигтай байх ёстой. Гэсэн хэдий ч тооцооллын алгоритмууд нь энэ нөхцөл хангагдсан эсэхийг автоматаар баталгаажуулдаггүй бөгөөд энэ нь хангагдсан эсэхийг шалгах шаардлагатай байдаг. Дундаж утгын ийм туршилтын үр дүнг доор тайлбарлав.

Ялгаатай хуваарь нь байгалийн хэмжүүртэй боловч байгалийн жишиг цэггүй. Хэрэв жилийг (эсвэл өдөр - үдээс үд хүртэл) байгалийн хэмжлийн нэгж болгон авсан бол цаг хугацааг зөрүүний хуваарь, мөн интервалын хуваариар хэмждэг. ерөнхий тохиолдол. Одоогийн мэдлэгийн түвшинд байгалийн эхлэлийн цэгийг зааж өгөх боломжгүй юм. Янз бүрийн зохиогчид ертөнцийг бүтээсэн огноо, мөн Христийн мэндэлсний мөчийг өөр өөр аргаар тооцдог.

Зөвхөн үнэмлэхүй масштабын хувьд хэмжилтийн үр дүн нь үгийн ердийн утгаараа тоонууд, жишээлбэл, өрөөнд байгаа хүмүүсийн тоо юм. Үнэмлэхүй масштабын хувьд зөвхөн таних тэмдэгийн хувиргалтыг зөвшөөрдөг.

Мэдлэгийн холбогдох салбарыг хөгжүүлэх явцад масштабын төрөл өөрчлөгдөж болно. Тиймээс эхлээд температурыг ердийн масштабаар хэмжсэн (хүйтэн - дулаан). Дараа нь - интервалын дагуу (Цельсийн, Фаренгейтийн, Реаумурын хэмжүүр). Эцэст нь үнэмлэхүй тэгийг нээсний дараа температурыг харьцааны масштабаар (Келвиний хуваарь) хэмжсэн гэж үзэж болно. Зарим бодит утгыг хэмжихийн тулд ямар хэмжүүр ашиглах талаар мэргэжилтнүүдийн хооронд санал зөрөлдөөн байдаг гэдгийг тэмдэглэх нь зүйтэй. Өөрөөр хэлбэл, хэмжилтийн үйл явцад масштабын төрлийг тодорхойлох (тодорхой төрлийн масштабыг сонгох үндэслэлтэй хамт) орно. Жагсаалтад орсон зургаан үндсэн жингээс гадна бусад жингүүдийг заримдаа ашигладаг.

17. Инвариант алгоритм ба дундаж утгууд.

Өгөгдлийн шинжилгээний алгоритмд тавигдах үндсэн шаардлагыг TI-д томъёолъё: тодорхой төрлийн масштабаар хэмжсэн өгөгдлийн үндсэн дээр хийсэн дүгнэлт нь энэ өгөгдлийн хэмжүүрийг зөвшөөрөх үед өөрчлөгдөх ёсгүй. Өөрөөр хэлбэл, хүчин төгөлдөр масштабын хувиргалтуудын үед дүгнэлт нь өөрчлөгдөөгүй байх ёстой.

Тиймээс хэмжилтийн онолын гол зорилгын нэг нь бодит объектод тоон утгыг оноохдоо судлаачийн субьектив байдалтай тэмцэх явдал юм. Тиймээс зайг аршин, метр, микрон, миль, парсек болон бусад хэмжих нэгжээр хэмжиж болно. Масс (жин) - пуд, килограмм, фунт гэх мэт Бараа, үйлчилгээний үнийг юань, рубль, тенге, гривен, лат, крон, тэмдэг, ам.доллар болон бусад валютаар (заасан хөрвүүлэх ханшийг харгалзан) зааж өгч болно. Хэмжилтийн нэгжийг сонгох нь судлаачаас хамаарна, i.e. субъектив. Статистикийн дүгнэлт нь судлаач ямар хэмжүүрийг илүүд үзэж байгаагаас хамаарахгүй, масштабын зөвшөөрөгдөх өөрчлөлтийн хувьд өөрчлөгддөггүй тохиолдолд л бодит байдалд нийцэж чадна. Эконометрик өгөгдлийн шинжилгээний олон алгоритмаас цөөхөн нь энэ нөхцлийг хангадаг. Үүнийг дундаж утгыг харьцуулж үзүүлье.

X 1, X 2,.., X n-ийг n эзлэхүүний түүвэр болгоё. Арифметик дундажийг ихэвчлэн ашигладаг. Арифметик дундажийг ашиглах нь маш түгээмэл тул энэ нэр томъёоны хоёр дахь үгийг орхигдуулдаг бөгөөд хүмүүс эдийн засгийн тодорхой өгөгдөлд дундаж цалин, дундаж орлого болон бусад дундаж үзүүлэлтүүдийн талаар ярьдаг бөгөөд энэ нь арифметик дундажийг "дундаж" гэсэн утгатай юм. Энэ уламжлал нь алдаатай дүгнэлт хийхэд хүргэдэг. Үүнийг таамагласан аж ахуйн нэгжийн ажилчдын дундаж цалинг (дундаж орлого) тооцоолох жишээн дээр харуулъя. 100 ажилчдаас 5 нь л түүнээс давсан цалинтай, үлдсэн 95 хүний ​​цалин арифметик дунджаас хамаагүй бага байна. Шалтгаан нь ойлгомжтой - нэг хүний ​​- ерөнхий захирал - 95 ажилчдын цалинг давж, ур чадвар багатай, өндөр ур чадвартай ажилчид, инженерүүд, оффисын ажилчид. Нөхцөл байдал 10 өвчтөн байгаагийн 9 нь 40 градусын температуртай, нэг нь аль хэдийн зовж шаналж, шарил хадгалах газарт 0 градусын температуртай хэвтэж байгаа эмнэлгийн тухай алдартай үлгэрт өгүүлсэнтэй адил нөхцөл байдлыг санагдуулж байна. C. Энэ хооронд эмнэлгийн дундаж температур 36 хэм байна - үүнээс илүү байж чадахгүй!

Тиймээс арифметик дундажийг зөвхөн нэлээн нэгэн төрлийн популяцид (нэг чиглэлд эсвэл өөр чиглэлд том ялгаагүй) ашиглаж болно. Цалин хөлсийг тодорхойлохын тулд ямар дундаж үзүүлэлтүүдийг ашиглах ёстой вэ? 50, 51-р ажилчдын дундаж арифметик дундажийг ашиглах нь зүй ёсны хэрэг юм. цалинбуурахгүй дарааллаар байрлуулсан. Эхлээд ур чадвар багатай 40 ажилчдын цалин, дараа нь 41-ээс 70 дахь ажилчдын цалин өндөр ур чадвартай ажилчдын цалин ирдэг. Үүний үр дүнд медиан нь яг тэдэн дээр унадаг бөгөөд 200-тай тэнцүү байна. 50 ажилчдын цалин 200-аас хэтрэхгүй, 50-аас доошгүй нь 200-аас доошгүй байдаг тул медиан нь судлагдсан утгуудын ихэнх хэсэг нь эргэн тойронд байгаа "төв" -ийг харуулж байна. бүлэглэв. Өөр нэг дундаж утга бол горим бөгөөд хамгийн их тохиолддог утга юм. Хэлэлцэж буй тохиолдолд эдгээр нь бага ур чадвартай ажилчдын цалин юм. 100. Тиймээс цалинг тодорхойлохын тулд бид гурван дундаж утгыг авна - горим (100 нэгж), медиан (200 нэгж), арифметик дундаж (400 нэгж).

Бодит амьдрал дээр ажиглагдсан орлого, цалингийн хуваарилалтын хувьд ижил загвар нь үнэн юм: горим нь дундажаас бага, дундаж нь арифметик дунджаас бага байна.

Эдийн засагт яагаад дундажийг ашигладаг вэ? Ихэвчлэн дундаж утгыг ашиглан популяцийг харьцуулахын тулд тооны цуглуулгыг нэг тоогоор солино. Жишээлбэл, Y 1, Y 2,..., Y n нь нэг шинжээчийн объектод "өгөгдсөн" шинжээчийн үнэлгээний багц (жишээлбэл, компанийн стратегийн хөгжлийн хувилбаруудын нэг) Z 1 байг. , Z 2,..., Z n -хоёр дахь (энэ хөгжлийн өөр хувилбар). Эдгээр популяцийг хэрхэн харьцуулах вэ? Мэдээжийн хэрэг, хамгийн хялбар арга бол дундаж утгууд юм.

Дундажуудыг хэрхэн тооцоолох вэ? Мэдэгдэж байна янз бүрийн төрөлдундаж утгууд: арифметик дундаж, медиан, горим, геометрийн дундаж, гармоник дундаж, квадрат дундаж. Үүнийг сануулъя ерөнхий ойлголтдундаж утгыг 19-р зууны эхний хагаст Францын математикч нэвтрүүлсэн. Академич О.Коши. Энэ нь дараах байдалтай байна: дундаж утга нь ямар ч Ф(Х 1, Х 2,..., Х n) функцууд бөгөөд аргументуудын боломжит бүх утгуудын хувьд энэ функцийн утга нь хамгийн бага утгаас багагүй байна. X 1, Х 2,... , X n тоонууд ба эдгээр тоонуудын дээд хэмжээнээс ихгүй байна. Дээр дурдсан бүх төрлийн дундаж нь Коши дундаж юм.

Хүлээн зөвшөөрөгдсөн хуваарийн өөрчлөлтөөр дундажийн утга өөрчлөгдөх нь тодорхой. Гэхдээ аль хүн амын дундаж үзүүлэлт их, аль нь бага байна гэсэн дүгнэлт өөрчлөгдөх ёсгүй (ДҮГ-ын үндсэн шаардлага гэж хүлээн зөвшөөрсөн дүгнэлтийн өөрчлөгдөөгүй байдлын шаардлагын дагуу). Харьцуулалтын үр дүн нь зөвшөөрөгдөх масштабын хувиргалттай харьцуулахад тогтвортой байгаа дундаж утгын төрлийг хайж олох математикийн харгалзах бодлогыг томъёолъё.

Ф(Х 1 Х 2 ,..., Х n) нь Коши дундаж гэж үзье. Эхний популяцийн дундаж нь хоёр дахь хүн амын дунджаас бага байх ёстой: тэгвэл TI-ийн дагуу дундаж утгыг харьцуулах үр дүнг тогтвортой байлгахын тулд зөвшөөрөгдөх өөрчлөлтийн бүлгээс g зөвшөөрөгдөх шаардлагатай. харгалзах масштаб нь эхний олонлогийн хувиргасан утгын дундаж нь хоёр дахь багцын хувиргасан утгуудын дунджаас бага байгаа нь үнэн юм. Түүнчлэн томъёолсон нөхцөл нь Y 1, Y 2,...,Y n ба Z 1, Z 2,..., Z n гэсэн хоёр багц болон зөвшөөрөгдөх аливаа хувиргалтанд үнэн байх ёстой. Бид томъёолсон нөхцөлийг хангасан дундаж утгыг зөвшөөрөгдөх (тохирох масштабаар) гэж нэрлэдэг. TI-ийн үзэж байгаагаар шинжээчдийн дүгнэлт болон авч үзэж буй масштабаар хэмжсэн бусад өгөгдөлд дүн шинжилгээ хийхдээ зөвхөн ийм дундаж утгыг ашиглаж болно.

Ашиглах замаар математикийн онол, 1970-аад онд боловсруулсан бөгөөд үндсэн масштабаар зөвшөөрөгдөх дундаж үзүүлэлтүүдийн төрлийг тодорхойлж чадсан. Нэрний масштабаар хэмжсэн өгөгдлийн хувьд зөвхөн горим дунджаар тохирох нь тодорхой байна.

18. Ординаль масштабын дундаж утгууд

Ээлжит масштабаар хэмжсэн шинжээчийн дүгнэлтийн боловсруулалтыг авч үзье. Дараах мэдэгдэл үнэн юм.

Теорем1 . Кошигийн бүх дундаж утгуудаас дарааллын хуваарийн зөвшөөрөгдөх цорын ганц дундаж нь нэр томъёо юм вариацын цуврал(ердийн статистик).

Дундаж Ф(Х 1 Х 2 ,..., Х n) нь тасралтгүй (хувьсагчийн олонлог дээр) ба тэгш хэмтэй функц байвал теорем 1 хүчинтэй байна. Сүүлийнх нь аргументуудыг дахин цэгцлэх үед Ф(Х 1 Х 2 ,..., Х n) функцын утга өөрчлөгдөхгүй гэсэн үг. Энэ нөхцөл нь нэлээд байгалийн юм, учир нь бид дарааллын хувьд биш харин нийт (багц)-ын дундаж утгыг олдог. Бид түүний элементүүдийг жагсаасан дарааллаас хамааран багц өөрчлөгддөггүй.

Теорем 1-ийн дагуу, ялангуяа медианыг дарааллын масштабаар хэмжсэн өгөгдлийн дундаж болгон ашиглаж болно (түүврийн хэмжээ сондгой бол). Хэрэв эзлэхүүн тэгш байвал вариацын цувралын хоёр гол нэр томъёоны аль нэгийг нь ашиглах хэрэгтэй - заримдаа тэдгээрийг зүүн медиан эсвэл баруун медиан гэж нэрлэдэг. Загварыг бас ашиглаж болно - энэ нь үргэлж вариацын цувралын гишүүн юм. Гэхдээ та арифметик дундаж, геометрийн дундаж гэх мэтийг хэзээ ч тооцоолж чадахгүй.

Дараах теорем үнэн.

Теорем 2. Y 1, Y 2,...,Y m нь F(x) тархалтын функцтэй бие даасан ижил тархалттай санамсаргүй хэмжигдэхүүнүүд, Z 1, Z 2,..., Zn нь функцын тархалттай, бие даасан ижил тархалттай санамсаргүй хэмжигдэхүүнүүд байг. H(x), мөн Y 1, Y 2,...,Y m ба Z 1, Z 2,..., Z n дээжүүд нь бие биенээсээ хамааралгүй бөгөөд MY X > MZ X. |g i |>X нөхцөлийг хангасан ямар ч хатуу өсөн нэмэгдэж буй тасралтгүй g функцийн хувьд үйл явдлын магадлал min(m, n)-д 1 байхын тулд F(x) тэгш бус байдал бүгд хангагдсан байх шаардлагатай бөгөөд хангалттай. x< Н(х), причем существовало число х 0 , для которого F(x 0)

Анхаарна уу.Дээд хязгаартай нөхцөл нь цэвэр математикийн шинж чанартай байдаг. Үнэн хэрэгтээ, g функц нь дарааллын хуваарьт дурын зөвшөөрөгдөх хувиргалт юм.

Теорем 2-ын дагуу теоремд өгөгдсөн тэгш бус байдлыг хангасан хоёр тархалтын түүврийг харьцуулж үзвэл арифметик дундажийг мөн дарааллын хуваарьт ашиглаж болно. Энгийнээр хэлбэл, түгээлтийн функцүүдийн аль нэг нь үргэлж нөгөөгөөсөө дээгүүр байх ёстой. Хуваарилалтын функцүүд огтлолцож чадахгүй, зөвхөн бие биендээ хүрэхийг зөвшөөрдөг. Жишээлбэл, хуваарилалтын функцууд зөвхөн ээлжээр ялгаатай байвал энэ нөхцөл хангагдсан болно.

F(x) = Н(x + ∆)

зарим нь ∆.

Хэрэв тухайн хэмжигдэхүүний нэг утгыг хэмжихээс нөгөөд шилжихэд алдааны хуваарилалт өөрчлөгддөггүй ижил хэмжигдэхүүнийг ашиглан тодорхой хэмжигдэхүүний хоёр утгыг хэмжсэн тохиолдолд сүүлчийн нөхцөл хангагдана.

Колмогоровын дагуу дундаж

Дээр дурдсан хэд хэдэн дундаж үзүүлэлтүүдийн ерөнхий дүгнэлт бол Колмогоровын дундаж юм. X 1, X 2,..., X n тоонуудын хувьд Колмогоровын дундажийг томъёогоор тооцоолно.

G((F(X l) + F(X 2)+...F(X n))/n),

Энд F нь хатуу монотон функц (жишээ нь, хатуу нэмэгдэж эсвэл хатуу буурдаг),

G нь F-ийн урвуу функц юм.

Колмогоровын дунджуудын дунд олон алдартай дүрүүд байдаг. Тэгэхээр, хэрэв F(x) = x бол Колмогоровын дундаж нь арифметик дундаж, хэрэв F(x) = lnx бол геометрийн дундаж, хэрэв F(x) = 1/x бол гармоник дундаж, хэрэв F( x) = x 2, дараа нь дундаж квадрат гэх мэт. Колмогоровын дундаж нь Коши дундажийн онцгой тохиолдол юм. Нөгөөтэйгүүр медиан ба горим зэрэг түгээмэл дундаж утгыг Колмогоровын дундажтай адилтгаж болохгүй. Дараах мэдэгдлүүд нь монографид батлагдсан.

Теорем3 . Хэрэв интервалын хуваарь дахь тогтмол байдлын тодорхой математикийн нөхцөлүүд хүчинтэй байвал Колмогоровын бүх хэрэгслээс зөвхөн арифметик дундажийг зөвшөөрнө. Тиймээс температурын (Цельсийн хэмээр) геометрийн дундаж буюу язгуур дундаж квадрат эсвэл зай нь утгагүй болно. Арифметик дундажийг дундаж болгон ашиглах ёстой. Та мөн медиан эсвэл горимыг ашиглаж болно.

Теорем 4. Хэрэв харьцааны хуваарь дахь тогтмол байдлын зарим математикийн дотоод нөхцөл хүчинтэй байвал Колмогоровын бүх дундаж утгуудаас зөвхөн F(x) = x c ба геометрийн дундаж хүчин чадлын дундажийг зөвшөөрнө.

Сэтгэгдэл. Геометрийн дундаж нь c > 0-ийн чадлын дундаж хязгаар юм.

Харьцааны хуваарьт ашиглах боломжгүй Колмогоровын дундаж үзүүлэлтүүд байдаг уу? Мэдээж байгаа. Жишээлбэл, F(x) = e x.

Дундаж утгатай адил бусад статистик шинж чанаруудыг судалж болно - тархалт, холболт, зай гэх мэт. Жишээ нь, корреляцийн коэффициент нь интервалын аяганд ямар ч зөвшөөрөгдөх хувиргалтаар өөрчлөгддөггүй гэдгийг харуулах нь тийм ч хэцүү биш юм, яг л дисперсийн харьцаатай адил дисперс нь ялгааны масштаб, вариацын коэффициент өөрчлөгддөггүй. харьцааны масштаб гэх мэт.

Дундаж утгын дээрх үр дүнг зөвхөн эдийн засаг, менежмент, шинжээчийн үнэлгээний онол, социологи төдийгүй инженерчлэлд, жишээлбэл, тэсэлгээний зуухны автоматжуулсан процессын хяналтын систем дэх мэдрэгчийг нэгтгэх аргуудыг шинжлэхэд өргөн хэрэглэгддэг. TI нь стандартчилал, чанарын менежментийн асуудлууд, ялангуяа онолын сонирхолтой үр дүнд хүрсэн квалиметрийн асуудалд практик ач холбогдолтой юм. Тиймээс, жишээлбэл, бүтээгдэхүүний чанарын бие даасан үзүүлэлтүүдийн жингийн коэффициентийн аливаа өөрчлөлт нь жигнэсэн дундаж үзүүлэлтийн дагуу бүтээгдэхүүний дарааллыг өөрчлөхөд хүргэдэг (энэ теоремыг проф. В.В. Подиновский нотолсон). Иймээс TI болон түүний аргуудын талаархи дээрх товч мэдээлэл нь тодорхой утгаараа эдийн засаг, социологи, инженерийн шинжлэх ухааныг нэгтгэсэн бөгөөд урьд өмнө үр дүнтэй дүн шинжилгээ хийх боломжгүй байсан нарийн төвөгтэй асуудлыг шийдвэрлэхэд тохиромжтой хэрэгсэл юм. Бодит загвар бүтээх, урьдчилан таамаглах асуудлыг шийдвэрлэх зам нээгдэнэ.

22. Хосолсон шугаман регресс

Одоо хос шугаман регрессийн хамгийн энгийн тохиолдлын талаар илүү нарийвчилсан судалгаа руу орцгооё. Шугаман регрессийг шулуун шугамын тэгшитгэлийн хэлбэрээр хамгийн энгийн функциональ хамаарлаар дүрсэлсэн бөгөөд загварын параметрүүдийн (тэгшитгэлийн коэффициент) ил тод тайлбараар тодорхойлогддог. Тэгшитгэлийн баруун тал нь регрессорын (тайлбарын хувьсагч) өгөгдсөн утгууд дээр үндэслэн үүссэн (тайлбарласан) хувьсагчийн онолын (тооцсон) утгыг олж авах боломжийг олгодог. Эдгээр утгыг заримдаа урьдчилан таамагласан (ижил утгаараа) гэж нэрлэдэг. онолын томъёоллуудаас олж авсан. Гэсэн хэдий ч хамаарлын мөн чанарын тухай таамаглал дэвшүүлэхдээ тэгшитгэлийн коэффициентүүд тодорхойгүй хэвээр байна. Ерөнхийдөө эдгээр коэффициентүүдийн ойролцоо утгыг янз бүрийн аргыг ашиглан олж авах боломжтой.

Гэхдээ тэдгээрийн хамгийн чухал бөгөөд өргөн тархсан нь хамгийн бага квадратын арга (OLS) юм. Энэ нь тооцоолсон (онолын) утгаас үүссэн шинж чанарын бодит утгуудын квадрат хазайлтын нийлбэрийг багасгах шаардлагад (өмнө тайлбарласны дагуу) үндэслэсэн болно. Онолын утгуудын оронд (тэдгээрийг олж авахын тулд) регрессийн тэгшитгэлийн баруун талыг квадрат хазайлтын нийлбэр болгон орлуулж, дараа нь энэ функцийн хэсэгчилсэн деривативуудыг (бодит утгын квадрат хазайлтын нийлбэр) ол. онолын үр дүнд бий болсон шинж чанар). Эдгээр хэсэгчилсэн деривативуудыг x ба y хувьсагчдаас хамааралгүй, харин a ба b параметрийн хувьд авна. Хэсэгчилсэн деривативуудыг тэгтэй тэнцүүлж, энгийн боловч төвөгтэй хувиргалтын дараа параметрүүдийг тодорхойлох ердийн тэгшитгэлийн системийг олж авдаг. x хувьсагчийн коэффициент, i.e. b-ийг регрессийн коэффициент гэж нэрлэдэг бөгөөд энэ нь хүчин зүйлийн нэг нэгжээр өөрчлөгдөхөд үр дүнгийн дундаж өөрчлөлтийг харуулдаг. a параметр нь эдийн засгийн тайлбаргүй байж болно, ялангуяа энэ коэффициентийн тэмдэг сөрөг байвал.

Хэрэглээний функцийг судлахын тулд хос шугаман регрессийг ашигладаг. Үржүүлэгчийг тооцоолохдоо хэрэглээний функц дэх регрессийн коэффициентийг ашиглана. Бараг үргэлж регрессийн тэгшитгэл нь холболтын ойр байдлын үзүүлэлтээр нэмэгддэг. Шугаман регрессийн хамгийн энгийн тохиолдлын хувьд холболтын ойр байдлын энэ үзүүлэлт нь юм шугаман коэффициентхамаарал. Гэхдээ шугаман корреляцийн коэффициент нь шугаман хэлбэрийн шинж чанаруудын хоорондын хамаарлыг тодорхойлдог тул шугаман корреляцийн коэффициентийн үнэмлэхүй утгын тэгтэй ойролцоо байх нь шинж чанаруудын хоорондын холбоо байхгүй байгааг илтгэх үзүүлэлт болж чадахгүй байна.

Загварын тодорхойлолт, хамаарлын төрлөөс хамааран өөр өөр сонголттойгоор бодит харилцаа нь нэгдмэл байдалтай ойртож магадгүй юм. Гэхдээ сонголтын чанар шугаман функцшугаман корреляцийн коэффициент - детерминацын коэффициентийг квадрат ашиглан тодорхойлно. Энэ нь үр дүнтэй шинж чанарын нийт дисперс дэх регрессээр тайлбарласан үр дүнтэй шинж чанарын y-ийн дисперсийн эзлэх хувийг тодорхойлдог. Тодорхойлолтын коэффициентийг 1 болгон нөхөж байгаа утга нь загварт тооцогдоогүй бусад хүчин зүйлийн нөлөөллөөс үүссэн дисперсийн хувийг (үлдэгдэл дисперс) тодорхойлдог.

Хосолсон регрессийг дараах хэлбэрийн y ба x хоёр хувьсагчтай холбоотой тэгшитгэлээр илэрхийлнэ.

Энд y нь хамааралтай хувьсагч (үр дүнгийн шинж чанар), x нь бие даасан хувьсагч (тайлбарлах хувьсагч эсвэл шинж чанарын хүчин зүйл) юм. Шугаман регресс ба шугаман бус регресс гэж байдаг. Шугаман регрессийг дараах хэлбэрийн тэгшитгэлээр тодорхойлно.

y = a+ bx + .

Шугаман бус регресс нь эргээд шинжилгээнд орсон тайлбарлагч хувьсагчдын хувьд шугаман бус байж болох ч тооцоолсон параметрүүдийн хувьд шугаман байж болно. Эсвэл тооцоолж буй параметрүүдийн хувьд регресс нь шугаман бус байж магадгүй юм. Тайлбарлах хувьсагчдын хувьд шугаман бус, харин тооцоолсон параметрийн хувьд шугаман регрессийн жишээнд янз бүрийн зэрэгтэй олон гишүүнт хамаарал (олон гишүүн) болон тэгш талт гипербол орно.

Тооцоолсон параметрүүдийн шугаман бус регресс нь параметртэй харьцуулахад хүч хамаарал (параметр нь экспонентт байгаа), параметр нь илтгэгчийн суурь дээр байрлах экспоненциал хамаарал, шугаман хамаарал бүхэлдээ байх үед экспоненциал хамаарал юм. экспонент дотор. Эдгээр гурван тохиолдолд санамсаргүй бүрэлдэхүүн (санамсаргүй үлдэгдэл)  багтсан болохыг анхаарна уу баруун талтэгшитгэлийг нийлбэр хэлбэрээр биш, харин хүчин зүйл хэлбэрээр, i.e. үржвэрээр! Үүссэн шинж чанарын тооцоолсон утгуудын бодит байдлаас дундаж хазайлт нь ойролцоолсон дундаж алдаагаар тодорхойлогддог. Энэ нь хувиар илэрхийлэгддэг бөгөөд 7-8% -иас хэтрэхгүй байх ёстой. Ойролцооны энэ дундаж алдаа нь бодит болон тооцоолсон утгуудын хоорондын зөрүүний харьцангуй том хэмжээний дундаж хувь юм.

Эдийн засгийн олон үзэгдэл, үйл явцын чухал шинж чанар болох дундаж уян хатан байдлын коэффициент нь чухал юм. Энэ нь өгөгдсөн функциональ харилцааны деривативын утгын үржвэр ба х-ийн дундаж утгыг у-ийн дундаж утгын харьцаагаар тооцно. Уян хатан байдлын коэффициент нь х хүчин зүйл (х хүчин зүйл) дундаж утгаасаа 1%-иар өөрчлөгдөхөд y үр дүн дундаж утгаасаа хэдэн хувиар өөрчлөгдөхийг харуулдаг.

Вариацын шинжилгээний асуудлууд нь хос регресс ба олон регресс (олон хүчин зүйл байгаа үед) болон үлдэгдэл дисперстэй нягт холбоотой байдаг. Вариацын шинжилгээхамааралтай хувьсагчийн дисперсийг судалдаг. Энэ тохиолдолд квадрат хазайлтын нийт нийлбэрийг хоёр хэсэгт хуваана. Эхний гишүүн нь регрессийн улмаас үүссэн квадрат хазайлтын нийлбэр буюу тайлбарласан (фактор). Хоёр дахь гишүүн нь хүчин зүйлийн регрессээр тайлбарлагдаагүй квадрат хазайлтын үлдэгдэл нийлбэр юм.

Үүссэн шинж чанарын y-ийн нийт дисперс дэх регрессээр тайлбарласан дисперсийн эзлэх хувь нь детерминацийн коэффициент (индекс)-ээр тодорхойлогддог бөгөөд энэ нь регрессийн улмаас үүссэн квадрат хазайлтын нийлбэрийг квадрат хазайлтын нийт нийлбэрт харьцуулсан харьцаанаас өөр зүйл биш юм. (бүх нийлбэрийн эхний гишүүн).

Загварын параметрүүдийг (үл мэдэгдэх коэффициентүүд) хамгийн бага квадратын аргыг ашиглан тодорхойлохдоо үндсэндээ зарим санамсаргүй хэмжигдэхүүнүүд олддог (тооцооллыг олж авах явцад). Санамсаргүй хэмжигдэхүүний тусгай хэлбэр болох регрессийн коэффициентийг тооцоолох нь онцгой ач холбогдолтой юм. Энэхүү санамсаргүй хэмжигдэхүүний шинж чанарууд нь тэгшитгэл дэх үлдэгдэл гишүүний шинж чанараас хамаарна (загварт). Хосолсон шугаман регрессийн загварын хувьд тайлбарлагч х хувьсагчийг санамсаргүй бус экзоген хувьсагч гэж үзнэ. Энэ нь бүх ажиглалт дахь x хувьсагчийн утгыг урьдчилан тодорхойлсон бөгөөд судалж буй хамааралтай ямар ч холбоогүй гэж үзэж болно гэсэн үг юм. Тиймээс тайлбарласан хувьсагчийн бодит утга нь санамсаргүй бус ба санамсаргүй бүрэлдэхүүн (үлдэгдэл нэр томъёо) гэсэн хоёр бүрэлдэхүүн хэсгээс бүрдэнэ.

Нөгөөтэйгүүр, хамгийн бага квадратын арга (OLS) ашиглан тодорхойлсон регрессийн коэффициент нь x ба y хувьсагчдын ковариацыг х хувьсагчийн дисперсэд хуваах коэффициенттэй тэнцүү байна. Тиймээс энэ нь бас санамсаргүй бүрэлдэхүүнийг агуулдаг. Эцсийн эцэст, ковариац нь y хувьсагчийн утгуудаас хамаардаг бөгөөд y хувьсагчийн утгууд нь санамсаргүй үлдэгдэл гишүүний  утгуудаас хамаардаг. Цаашлаад x ба y хувьсагчдын ковариац нь тооцоолсон регрессийн коэффицент бета () ба x хувьсагчийн дисперс, дээр нь x ба  хувьсагчдын ковариацын үржвэртэй тэнцүү болохыг харуулахад хялбар байдаг. Иймд бета регрессийн коэффициентийн үнэлгээ нь энэ үл мэдэгдэх регрессийн коэффициенттэй тэнцүү бөгөөд x ба  хувьсагчдын ковариацыг х хувьсагчийн дисперсэд хуваах коэффициент дээр нэмсэн. Тэдгээр. Аливаа түүврээс олж авсан регрессийн коэффициент b-ийн үнэлгээг  (бета) коэффициентийн жинхэнэ утгатай тэнцүү тогтмол утга, x ба  хувьсагчдын ковариацаас хамаарах санамсаргүй бүрэлдэхүүн гэсэн хоёр гишүүний нийлбэрээр үзүүлэв. .

23. Математикийн Гаусс-Марковын нөхцөл ба тэдгээрийн хэрэглээ.

Энгийн OLS дээр суурилсан регрессийн шинжилгээг хамгийн сайн үр дүнд хүргэхийн тулд санамсаргүй нэр томъёо нь Гаусс-Марковын дөрвөн нөхцлийг хангасан байх ёстой.

Санамсаргүй нэр томъёоны математикийн хүлээлт нь тэгтэй тэнцүү, i.e. энэ нь өрөөсгөл юм. Хэрэв регрессийн тэгшитгэл нь тогтмол гишүүнийг агуулсан бол энэ шаардлагыг хангасан гэж үзэх нь зүйн хэрэг, учир нь энэ нь тогтмол нэр томъёо бөгөөд y хувьсагчийн утгын системчилсэн хандлагыг харгалзан үзэх ёстой. регрессийн тэгшитгэлийн тайлбарлагч хувьсагчдад агуулагдахгүй.

Санамсаргүй нэр томъёоны дисперс нь бүх ажиглалтын хувьд тогтмол байна.

Үнэт зүйлийн ковариац санамсаргүй хэмжигдэхүүн, дээжийг бүрдүүлэх нь тэгтэй тэнцүү байх ёстой, i.e. тодорхой хоёр ажиглалтын санамсаргүй хугацааны утгуудын хооронд системчилсэн хамаарал байхгүй. Санамсаргүй гишүүд бие биенээсээ хараат бус байх ёстой.

Санамсаргүй нэр томъёоны тархалтын хууль нь тайлбарлагч хувьсагчдаас хамааралгүй байх ёстой.

Түүнээс гадна, олон хэрэглээнд тайлбарлагч хувьсагч нь стохастик биш, өөрөөр хэлбэл. санамсаргүй бүрэлдэхүүн хэсэг байхгүй. Ажиглалт тус бүрийн бие даасан хувьсагчийн утгыг регрессийн тэгшитгэлд тооцдоггүй гадны шалтгаанаар бүхэлд нь тодорхойлдог экзоген гэж үзэх ёстой.

Гаусс-Марковын заасан нөхцлүүдийн хамтаар санамсаргүй нэр томъёо нь хэвийн тархалттай гэж үздэг. Энэ нь маш өргөн хүрээний нөхцөлд хүчинтэй бөгөөд төвийн хязгаарын теорем (CLT) гэж нэрлэгддэг зүйл дээр суурилдаг. Энэ теоремын мөн чанар нь хэрэв санамсаргүй хэмжигдэхүүн нь бусад олон тооны санамсаргүй хэмжигдэхүүнүүдийн харилцан үйлчлэлийн ерөнхий үр дүн бөгөөд тэдгээрийн аль нь ч энэ ерөнхий үр дүнгийн зан төлөвт давамгайлах нөлөө үзүүлэхгүй бол үр дүнгийн санамсаргүй хэмжигдэхүүнийг тайлбарлах болно. ойролцоогоор хэвийн тархалтаар. Энэ ойр хэвийн тархалтТооцооллыг олж авахын тулд хэвийн тархалтыг ашиглах боломжийг танд олгоно тодорхой утгаараатүүний ерөнхий ойлголт нь Оюутны тархалт бөгөөд энэ нь ихэвчлэн "сүүл" гэж нэрлэгддэг зүйлээр ердийнхөөс мэдэгдэхүйц ялгаатай байдаг. жижиг дээжийн хувьд. Хэрэв санамсаргүй нэр томъёо хэвийн тархсан бол регрессийн коэффициентүүд мөн хэвийн тархсан байх нь чухал юм.

Тогтсон регрессийн муруй (регрессийн тэгшитгэл) нь цэгийн таамаглал гэж нэрлэгддэг асуудлыг шийдэх боломжийг бидэнд олгодог. Ийм тооцоололд х-ийн тодорхой утгыг судлагдсан ажиглалтын интервалаас гадуур авч, регрессийн тэгшитгэлийн баруун талд орлуулна (экстраполяцийн процедур). Учир нь Регрессийн коэффициентүүдийн тооцоо аль хэдийн мэдэгдэж байгаа тул х-ийн авсан утгатай харгалзах тайлбарласан y хувьсагчийн утгыг тооцоолох боломжтой. Мэдээжийн хэрэг, урьдчилан таамаглах (урьдчилан таамаглах) утгын дагуу тооцооллыг урагш (ирээдүйн утгын бүс рүү) хийдэг.

Гэхдээ тодорхой алдаатай коэффициентийг тодорхойлсон тул сонирхолгүй байна цэгийн тооцоо(цэгний урьдчилсан таамаглал) үр дүнтэй шинж чанар, хүчин зүйлийн х-ийн авсан утгатай харгалзах тодорхой магадлалаар үр дүнтэй шинж чанарын утгууд байх хязгаарын талаархи мэдлэг.

Үүнийг хийхийн тулд стандарт алдаа (стандарт хазайлт) -ийг тооцоолно. Үүнийг саяхан хэлсэн зүйлийн сүнсээр дараах байдлаар олж авч болно. Дундаж утгуудаар хийсэн тооцооллоос чөлөөт a нэр томъёоны илэрхийлэлийг шугаман регрессийн тэгшитгэлд орлуулна. Дараа нь стандарт алдаа нь дундаж үр дүнтэй y хүчин зүйлийн алдаанаас гадна регрессийн коэффициент b-ийн алдаанаас хамаарна. Энэ стандарт алдааны ердөө квадрат нийлбэртэй тэнцүү байнадундаж утгын y-ийн квадрат алдаа ба регрессийн коэффициентийн квадрат алдааны х хүчин зүйлийн утгын квадрат хазайлт ба түүний дундаж үржвэр. Цаашилбал, статистикийн хууль тогтоомжийн дагуу эхний нэр томъёо нь ерөнхий популяцийн дисперсийг түүврийн хэмжээ (эзэлхүүн)-д хуваах коэффициенттэй тэнцүү байна.

Үл мэдэгдэх дисперсийн оронд түүврийн дисперсийг тооцоолол болгон ашигладаг. Үүний дагуу регрессийн коэффициентийн алдаа нь түүврийн дисперсийг х хүчин зүйлийн дисперсэд хуваах коэффициент гэж тодорхойлогддог. Та стандарт алдаа (стандарт хазайлт) болон шугаман регрессийн загвараас илүү хамааралгүй бусад хүчин зүйлсийг авч болно. Үүний тулд дундаж алдаа, ахиу алдаа гэсэн ойлголт, тэдгээрийн хоорондын хамаарлыг ашиглана.

Гэхдээ стандарт алдааг олж авсны дараа ч гэсэн таамагласан утга ямар хил хязгаарт багтах вэ гэдэг асуулт хэвээр байна. Өөрөөр хэлбэл хэмжилтийн алдааны интервалын тухай, байгалийн таамаглалд олон тохиолдолд энэ интервалын дундыг үр дүнтэй хүчин зүйлийн y-ийн тооцоолсон (дундаж) утгаар өгдөг. Энд үл мэдэгдэх хэмжигдэхүүн ямар магадлалтайг яг тодорхой зааж өгдөг төв хязгаарын теорем аврах ажилд ирдэг. итгэлийн интервал.

Үндсэндээ алдааны стандарт томъёо нь үүнийг хэрхэн, ямар хэлбэрээр олж авсанаас үл хамааран регрессийн шугамын байрлал дахь алдааг тодорхойлдог. Х хүчин зүйлийн утга нь хүчин зүйлийн дундаж утгатай давхцах үед стандарт алдаа хамгийн багадаа хүрдэг.

24. Таамаглалыг статистикийн аргаар шалгах, Фишерийн шалгуурыг ашиглан шугаман регрессийн ач холбогдлыг үнэлэх.

Шугаман регрессийн тэгшитгэлийг олсны дараа тэгшитгэлийг бүхэлд нь болон түүний бие даасан параметрүүдийн ач холбогдлыг үнэлнэ. Регрессийн тэгшитгэлийн ач холбогдлыг бүхэлд нь үнэлэхдээ янз бүрийн шалгуурыг ашиглан хийж болно. Фишерийн F тестийг ашиглах нь нэлээд түгээмэл бөгөөд үр дүнтэй байдаг. Энэ тохиолдолд регрессийн коэффициент нь тэгтэй тэнцүү гэсэн тэг таамаглал дэвшүүлсэн, өөрөөр хэлбэл. b=0, тиймээс х хүчин зүйл y үр дүнд нөлөөлөхгүй. F-туршилтын нэн даруй тооцоолохын өмнө дисперсийн шинжилгээ хийдэг. Үүний гол байрыг y хувьсагчийн дундаж утгаас y-ийн квадрат хазайлтын нийт нийлбэрийг "тайлбарласан" ба "тайлбаргүй" гэсэн хоёр хэсэгт хуваах явдал юм.

Үүссэн шинж чанарын бие даасан утгуудын квадрат хазайлтын нийлбэр y дундаж утгаас олон хүчин зүйлийн нөлөөгөөр үүсдэг.

Бүхэл бүтэн шалтгааныг нөхцөлт байдлаар хоёр бүлэгт хуваая: судлагдсан х хүчин зүйл болон бусад хүчин зүйлүүд. Хэрэв хүчин зүйл нь үр дүнд нөлөөлөхгүй бол график дээрх регрессийн шугам нь OX ба y=y тэнхлэгтэй параллель байна. Дараа нь үүссэн шинж чанарын бүх хэлбэлзэл нь бусад хүчин зүйлийн нөлөөллөөс шалтгаалж, квадрат хазайлтын нийт нийлбэр нь үлдэгдэлтэй давхцах болно. Хэрэв бусад хүчин зүйлүүд үр дүнд нөлөөлөхгүй бол y нь функцийн хувьд х-тэй хамааралтай бөгөөд квадратуудын үлдэгдэл нийлбэр тэг болно. Энэ тохиолдолд регрессийн тайлбарласан квадрат хазайлтын нийлбэр нь нийт квадратуудын нийлбэртэй ижил байна. Корреляцийн талбайн бүх цэгүүд регрессийн шугам дээр байдаггүй тул тэдгээрийн тархалт нь x хүчин зүйлийн нөлөөллөөс үүдэлтэй байдаг, өөрөөр хэлбэл. x дээр y-ийн регресс ба бусад шалтгаанаас үүдэлтэй (тайлбаргүй өөрчлөлт). Урьдчилан таамаглахад регрессийн шугамын тохиромжтой байдал нь y шинж чанарын нийт хэлбэлзлийн хэр зэрэг нь тайлбарласан хэлбэлзэлтэй холбоотой байгаагаас хамаарна.

Мэдээжийн хэрэг, регрессийн улмаас үүссэн квадрат хазайлтын нийлбэр нь квадратуудын үлдэгдэл нийлбэрээс их байвал регрессийн тэгшитгэл нь статистикийн хувьд чухал бөгөөд x хүчин зүйл нь үр дүнд чухал нөлөө үзүүлэх болно. Энэ нь детерминацийн коэффициент нь нэгдмэл байдалд ойртохтой тэнцүү юм. Аливаа квадрат хазайлтын нийлбэр нь эрх чөлөөний зэрэгтэй холбоотой байдаг, i.e. шинж чанарын бие даасан өөрчлөлтийн эрх чөлөөний тоо. Эрх чөлөөний зэрэглэлийн тоо нь популяцийн нэгжийн тоо эсвэл түүнээс тодорхойлсон тогтмолуудын тоотой холбоотой байдаг. Судалж буй асуудалтай холбоотойгоор эрх чөлөөний зэрэглэлийн тоо нь n боломжит [(y 1 -y), (y 2 -y),...(y n -y)] хэмжээнээс хэдэн бие даасан хазайлт шаардлагатайг харуулах ёстой. өгөгдсөн квадратуудын нийлбэрийг үүсгэх. Тиймээс ∑(y-y sr) 2 квадратуудын нийт нийлбэрийн хувьд (n-1) бие даасан хазайлт шаардлагатай, учир нь n нэгжтэй хүн амд дундаж түвшинг тооцоолсны дараа зөвхөн (n-1) хазайлтын тоо чөлөөтэй өөрчлөгддөг. ∑(y-y дундаж) 2 квадратуудын тайлбарласан буюу хүчин зүйлийн нийлбэрийг тооцоолохдоо регрессийн шугамын дагуу олдсон y* үр дүнгийн шинж чанарын онолын (тооцсон) утгыг ашиглана: y(x)=a+bx.

Одоо энэ утгын дундажаас үр дүнтэй хүчин зүйлийн квадрат хазайлтын нийт нийлбэрийн өргөтгөл рүү буцъя. Энэ нийлбэр нь дээр аль хэдийн тодорхойлсон хоёр хэсгийг агуулна: регрессээр тайлбарласан квадрат хазайлтын нийлбэр ба квадрат хазайлтын үлдэгдэл нийлбэр гэж нэрлэгддэг өөр нэг нийлбэр. Энэхүү задралтай холбоотой дисперсийн шинжилгээ нь үндсэн асуултанд шууд хариулдаг: регрессийн тэгшитгэлийн ач холбогдлыг бүхэлд нь болон түүний бие даасан параметрүүдийг хэрхэн үнэлэх вэ? Энэ нь мөн энэ асуултын утгыг ихээхэн тодорхойлдог. Регрессийн тэгшитгэлийн ач холбогдлыг бүхэлд нь үнэлэхийн тулд Фишерийн шалгуурыг (F-тест) ашигладаг. Фишерийн санал болгосон аргын дагуу тэг таамаглал дэвшүүлсэн: регрессийн коэффициент нь тэгтэй тэнцүү, өөрөөр хэлбэл. утгаb=0. Энэ нь X хүчин зүйл нь Y үр дүнд нөлөөлөхгүй гэсэн үг юм.

Статистикийн судалгааны үр дүнд олж авсан оноо бараг үргэлж регрессийн шугам дээр байдаггүй гэдгийг санаарай. Тэд тархай бутархай, регрессийн шугамаас багагүй хол байдаг. Ийм тархалт нь регрессийн тэгшитгэлд тооцогдоогүй тайлбарлагч X хүчин зүйлээс ялгаатай бусад хүчин зүйлсийн нөлөөллөөс шалтгаална. Квадрат хазайлтын тайлбарласан буюу хүчин зүйлийн нийлбэрийг тооцоолохдоо регрессийн шугамаас олж авсан шинж чанарын онолын утгыг ашиглана.

Y ба X хувьсагчдын өгөгдсөн багц утгын хувьд дундаж утгын Y тооцоолсон утга нь шугаман регрессийн хувьд зөвхөн нэг параметр болох регрессийн коэффициентийн функц юм. Үүний дагуу квадрат хазайлтын хүчин зүйлийн нийлбэр нь 1-тэй тэнцүү тооны эрх чөлөөний зэрэгтэй байна. Шугаман регрессийн квадрат хазайлтын үлдэгдэл нийлбэрийн чөлөөт байдлын зэрэг нь n-2 байна.

Үүний үр дүнд анхны тэлэлт дэх квадрат хазайлтын нийлбэр бүрийг түүний эрх чөлөөний зэрэгт хувааснаар бид дундаж квадрат хазайлтыг (нэг эрх чөлөөний хэлбэлзэл) авна. Дараа нь хүчин зүйлийн дисперсийг нэг зэрэглэлийн эрх чөлөөнд үлдэгдэл дисперсийг нэг зэрэглэлийн эрх чөлөөнд хувааснаар бид тэг таамаглалыг шалгах шалгуур буюу F-харьцаа гэж нэрлэгддэг эсвэл ижил нэртэй шалгуурыг олж авдаг. Тухайлбал, тэг таамаглал үнэн бол хүчин зүйл болон үлдэгдэл дисперсүүд хоорондоо тэнцүү байна.

Тэг таамаглалыг үгүйсгэхийн тулд, i.e. Судалгаанд хамрагдаж буй харилцааны ач холбогдол (байгаа) гэсэн баримтыг илэрхийлсэн эсрэг таамаглалыг хүлээн зөвшөөрч, бодит байдал дээр байхгүй харилцааг дуурайж буй хүчин зүйлүүдийн санамсаргүй давхцал биш, чухал утгуудын хүснэгтийг ашиглах шаардлагатай байна. заасан харилцаа. Хүснэгтүүдийг ашиглан Фишерийн шалгуурын эгзэгтэй (босго) утгыг тодорхойлно. Үүнийг бас онолын гэж нэрлэдэг. Дараа нь тэд ажиглалтын өгөгдлөөр тооцоолсон шалгуур үзүүлэлтийн харгалзах эмпирик (бодит) утгатай харьцуулж, харьцааны бодит утга нь хүснэгтийн эгзэгтэй утгаас хэтэрсэн эсэхийг шалгана.

Үүнийг иймэрхүү байдлаар илүү нарийвчлан хийдэг. Тэг таамаглал байгаа эсэх магадлалын өгөгдсөн түвшинг сонгоод F-шалгуурын эгзэгтэй утгыг хүснэгтүүдээс олоорой, энэ үед 1 зэрэглэлийн эрх чөлөөний санамсаргүй зөрүү гарч болно, өөрөөр хэлбэл. хамгийн их утга. Дараа нь F-харьцааны тооцоолсон утгыг найдвартай гэж үзнэ (жишээлбэл, бодит болон үлдэгдэл хэлбэлзлийн зөрүүг илэрхийлэх), хэрэв энэ харьцаа нь хүснэгтэд үзүүлсэн хэмжээнээс их байвал. Дараа нь тэг таамаглалыг үгүйсгэж (холболтын шинж тэмдэг байхгүй гэдэг нь худлаа) бөгөөд эсрэгээр бид холболт байгаа бөгөөд энэ нь чухал (энэ нь санамсаргүй бус, ач холбогдолтой) гэсэн дүгнэлтэд хүрдэг.

Хэрэв харилцааны утга нь хүснэгтэд үзүүлсэнээс бага байвал тэг таамаглалын магадлал нь заасан түвшнээс (анх сонгосон) өндөр байх ба тэг таамаглалыг мэдэгдэхүйц аюулгүйгээр үгүйсгэх боломжгүй юм. харилцаа байгаа эсэх талаар буруу дүгнэлт гаргах. Үүний дагуу регрессийн тэгшитгэлийг ач холбогдолгүй гэж үзнэ.

F-шалгуурын утга нь өөрөө тодорхойлох коэффициенттэй холбоотой. Регрессийн тэгшитгэлийн ач холбогдлыг бүхэлд нь үнэлэхээс гадна регрессийн тэгшитгэлийн бие даасан параметрүүдийн ач холбогдлыг мөн үнэлдэг. Энэ тохиолдолд регрессийн коэффициентийн стандарт алдааг эмпирик бодит стандарт хазайлт ба чөлөөт байдлын зэрэгт ногдох эмпирик дисперсийг ашиглан тодорхойлно. Дараа нь Оюутны тархалтыг регрессийн коэффициентийн ач холбогдлыг шалгахын тулд түүний итгэлийн интервалыг тооцоолоход ашигладаг.

Оюутны t-тест ашиглан регресс ба корреляцийн коэффициентүүдийн ач холбогдлыг үнэлэхдээ эдгээр хэмжигдэхүүнүүдийн утгууд болон стандарт алдааг харьцуулах замаар гүйцэтгэнэ. Шугаман регрессийн параметрийн алдааны хэмжээ ба корреляцийн коэффициентийг дараахь томъёогоор тодорхойлно.

Энд S нь дундаж квадрат үлдэгдэл түүврийн хазайлт,

r xy – корреляцийн коэффициент.

Үүний дагуу регрессийн шугамаар таамагласан стандарт алдааны утгыг дараах томъёогоор тодорхойлно.

Регресс ба корреляцийн коэффициентүүдийн утгуудын стандарт алдаатай харгалзах харьцаа нь t-статистикийг үүсгэдэг бөгөөд харгалзах хүснэгтэн (чухал) утга ба түүний бодит утгыг харьцуулах нь тэг утгыг хүлээн зөвшөөрөх эсвэл татгалзах боломжийг олгодог. таамаглал. Харин дараа нь итгэлийн интервалыг тооцоолохын тулд үзүүлэлт бүрийн хамгийн их алдааг харгалзах үзүүлэлтийн дундаж санамсаргүй алдаагаар t статистикийн хүснэгтийн утгын үржвэрээр олно. Үнэндээ бид яг дээр нь арай өөрөөр бичсэн. Дараа нь итгэлцлийн интервалын хил хязгаарыг олж авна: доод хязгаар нь харгалзах коэффициентээс харгалзах ахиу алдааг хасч (үнэндээ дундаж), дээд хязгаар нь нэмэх (нэмэх) юм.

Шугаман регрессийн хувьд ∑(y x -y дундаж) 2 =b 2 ∑(x-x дундаж) 2. Үүнийг шугаман корреляцийн коэффициентийн томъёог ашиглан шалгахад хялбар байдаг: r 2 xy = b 2 *σ 2 x /σ 2 y.

Энд σ 2 y нь y шинж чанарын нийт дисперс;

σ 2 x - х хүчин зүйлийн нөлөөгөөр y шинж чанарын тархалт. Үүний дагуу шугаман регрессийн квадрат хазайлтын нийлбэр нь:

∑(y x -y дундаж) 2 =b 2 ∑(x-x дундаж) 2 .

Х ба у дахь ажиглалтын өгөгдсөн эзэлхүүний хувьд шугаман регрессийн квадратуудын хүчин зүйлийн нийлбэр нь b регрессийн коэффициентийн зөвхөн нэг тогтмолоос хамаардаг тул энэ квадратуудын нийлбэр нь нэг зэрэглэлийн эрх чөлөөтэй байна. y шинж чанарын тооцоолсон утгын агуулгын талыг авч үзье i.e. у х. y x утгыг шугаман регрессийн тэгшитгэлээр тодорхойлно: y x ​​= a + bx.

a параметрийг a=y-bx гэж тодорхойлж болно. Шугаман загварт a параметрийн илэрхийллийг орлуулснаар бид дараахийг олж авна: y x ​​=y-bx+bx avg =y-b(x-x авг).

Өгөгдсөн y ба x хувьсагчдын багцын хувьд шугаман регрессийн y x-ийн тооцоолсон утга нь зөвхөн нэг параметр болох регрессийн коэффициентийн функц юм. Үүний дагуу квадрат хазайлтын хүчин зүйлийн нийлбэр нь 1-тэй тэнцүү тооны эрх чөлөөний зэрэгтэй байна.

Квадратуудын нийлбэр, хүчин зүйл, үлдэгдэл нийлбэрийн чөлөөт нийлбэрийн тоо тэнцүү байна. Шугаман регрессийн квадратуудын үлдэгдэл нийлбэрийн чөлөөт байдлын зэрэгийн тоо (n-2) байна. Квадратуудын нийт нийлбэрийн эрх чөлөөний зэрэглэлийн тоог нэгийн тоогоор тодорхойлдог бөгөөд бид түүврийн өгөгдлөөс тооцоолсон дундаж утгыг ашигладаг тул бид нэг зэрэглэлийн эрх чөлөөг алддаг, өөрөөр хэлбэл. (n-1). Тиймээс бид хоёр тэнцүү байна: нийлбэр ба эрх чөлөөний зэрэглэлийн тоо. Энэ нь эргээд биднийг эрх чөлөөний зэрэгтэй харьцуулж болох хэлбэлзэл рүү буцаан авчирдаг бөгөөд тэдгээрийн харьцаа нь Фишерийн шалгуурыг өгдөг.

25. Оюутны тест ашиглан регрессийн тэгшитгэл ба коэффициентуудын бие даасан параметрүүдийн ач холбогдлыг үнэлэх.

27. Шугаман ба шугаман бус регресс, тэдгээрийг судлах арга.

Шугаман регресс ба түүний судалгаа, үнэлгээний аргууд нь маш чухал боловч хамгийн энгийн тохиолдлоос гадна тэдгээрийн тусламжтайгаар илүү төвөгтэй шугаман бус хамаарлыг шинжлэх хэрэгслийг олж аваагүй бол тийм ч чухал биш байх болно. Шугаман бус регрессийг хоёр өөр өөр ангилалд хувааж болно. Эхний бөгөөд энгийн зүйл бол тайлбарлагч хувьсагчдын хувьд шугаман бус байдал байдаг боловч тэдгээрт багтсан параметрүүдийн хувьд шугаман хэвээр байгаа бөгөөд үнэлгээнд хамрагдах шугаман бус хамаарлын ангилал юм. Үүнд янз бүрийн зэрэгтэй олон гишүүнт ба тэгш талт гипербол орно.

Тайлбарт орсон хувьсагчдын ийм шугаман бус регрессийг хувьсагчдыг зүгээр л хувиргах (орлуулах) замаар шинэ хувьсагчийн энгийн шугаман регресс болгон хялбархан бууруулж болно. Тиймээс энэ тохиолдолд параметрийн тооцоог хамгийн бага квадратаар гүйцэтгэдэг, учир нь хамаарал нь параметрүүдэд шугаман байдаг. Ийнхүү тэгш талт гиперболоор тодорхойлсон шугаман бус хамаарал нь эдийн засагт чухал үүрэг гүйцэтгэдэг.

Түүний параметрүүдийг хамгийн бага квадратын аргыг ашиглан сайн үнэлдэг бөгөөд энэ хамаарал нь түүхий эд, түлш, материалын тодорхой зардал, бүтээгдэхүүний хэмжээ, бараа бүтээгдэхүүний эргэлтийн хугацаа болон эдгээр бүх хүчин зүйлсийн худалдааны хэмжээ хоорондын хамаарлыг тодорхойлдог. эргэлт. Жишээлбэл, Филлипсийн муруй нь ажилгүйдлийн түвшин ба цалингийн өсөлтийн хувь хоорондын шугаман бус хамаарлыг тодорхойлдог.

Тооцоолсон параметрийн шугаман бус регрессийн хувьд нөхцөл байдал огт өөр байна, жишээлбэл, зэрэг нь өөрөө (түүний экспонент) параметр болох эсвэл параметрээс хамаардаг чадлын функцээр илэрхийлэгддэг. Энэ нь мөн экспоненциал функц байж болох ба зэрэглэлийн суурь нь параметр ба экспоненциал функц бөгөөд индикатор нь параметр эсвэл параметрийн хослолыг агуулна. Энэ анги нь эргээд хоёр дэд ангилалд хуваагддаг: нэг нь гадна шугаман бус, гэхдээ үндсэндээ дотоод шугаман. Энэ тохиолдолд та хувиргалтыг ашиглан загварыг шугаман хэлбэрт оруулж болно. Гэхдээ хэрэв загвар нь дотоод шугаман бус байвал шугаман функц болгон бууруулж болохгүй.

Тиймээс регрессийн шинжилгээнд зөвхөн шугаман бус загваруудыг л жинхэнэ шугаман бус гэж үзнэ. Өөрчлөлтөөр шугаман болгон бууруулж болох бусад бүх зүйлийг ийм гэж тооцдоггүй бөгөөд эконометрикийн судалгаанд эдгээрийг ихэвчлэн авч үздэг. Үүний зэрэгцээ, энэ нь эконометрикийн шугаман бус хамаарлыг үндсэндээ судлах боломжгүй гэсэн үг биш юм. Хэрэв загвар нь параметрийн хувьд дотоод шугаман бус байвал параметрүүдийг үнэлэхийн тулд давталтын процедурыг ашигладаг бөгөөд амжилт нь ашигласан давталтын аргын онцлогуудын тэгшитгэлийн төрлөөс хамаарна.

Шугаман болгон бууруулсан хамаарал руу буцъя. Хэрэв тэдгээр нь параметрийн хувьд болон хувьсагчийн хувьд шугаман бус байвал, жишээлбэл, y = a хэлбэрийн X-ийн хүчээр үржүүлсэн, илтгэгч нь параметр -  (бета):

Ийм харилцааг энгийн логарифмын тусламжтайгаар шугаман тэгшитгэлд амархан хувиргах нь ойлгомжтой.

Логарифмыг илэрхийлсэн шинэ хувьсагчдыг оруулсны дараа шугаман тэгшитгэлийг олж авна. Дараа нь регрессийг тооцоолох журам нь анхны утгуудын логарифмуудыг авч ажиглалт бүрийн шинэ хувьсагчдыг тооцоолохоос бүрдэнэ. Дараа нь шинэ хувьсагчдын регрессийн хамаарлыг тооцоолно. Анхны хувьсагч руу очихын тулд та антилогарифмыг авах хэрэгтэй, өөрөөр хэлбэл экспонентуудын оронд өөр хүчнүүд рүү буцах хэрэгтэй (эцсийн эцэст логарифм нь экспонент юм). Экспоненциал эсвэл экспоненциал функцийн тохиолдлыг мөн адил авч үзэж болно.

Шугаман бус регрессийн хувьд харгалзах хамаарлыг шугаман болгон хувиргах боломжгүй тул ердийн регрессийн үнэлгээний аргыг хэрэглэх боломжгүй. Үйл ажиллагааны ерөнхий схем нь дараах байдалтай байна.

1. Зарим үнэмшилтэй анхны параметрийн утгыг хүлээн зөвшөөрсөн;

2. Урьдчилан таамагласан Y утгыг эдгээр параметрийн утгыг ашиглан бодит X утгуудаас тооцоолно;

3. Түүвэр дэх бүх ажиглалтын хувьд үлдэгдлийг тооцож, дараа нь үлдэгдлийн квадратуудын нийлбэрийг тооцно;

4. Нэг буюу хэд хэдэн параметрийн тооцоонд бага зэрэг өөрчлөлт оруулсан;

5. Y-ийн шинэ таамагласан утгууд, үлдэгдэл ба үлдэгдэл квадратын нийлбэрийг тооцсон;

6. Хэрэв үлдэгдлийн квадратуудын нийлбэр өмнөхөөсөө бага байвал шинэ параметрийн тооцоо нь өмнөхөөсөө илүү сайн байх тул шинэ эхлэл болгон ашиглах ёстой;

7. Квадратуудын үлдэгдлийн нийлбэрийг өөрчлөхөд хүргэх параметрийн тооцоонд ийм өөрчлөлт оруулах боломжгүй болтол 4, 5, 6-р алхамуудыг дахин давтана;

8. Квадрат үлдэгдлийн нийлбэрийг багасгаж, эцсийн параметрийн тооцоог хамгийн бага квадратын тооцоо гэж дүгнэв.

гэж багасгаж болох шугаман бус функцүүдийн дунд шугаман хэлбэр, чадлын функцийг эконометрикт өргөн ашигладаг. Үүнд байгаа b параметр нь уян хатан байдлын коэффициент болох тодорхой тайлбартай. Тооцоолсон параметрийн хувьд шугаман бус боловч шугаман хэлбэрт оруулах боломжтой загваруудад хувирсан тэгшитгэлд хамгийн бага квадратын аргыг хэрэглэнэ. Үр дүнгийн тэмдэг сөрөг утгагүй үед логарифм ба үүний дагуу экспонентыг практикт ашиглах боломжтой. Үр дүнгийн шинж чанарын логарифмыг ашиглан функцүүдийн хоорондын хамаарлыг судлахдаа эконометрикт хүчний хуулийн хамаарал давамгайлдаг (эрэлт ба нийлүүлэлтийн муруй, үйлдвэрлэлийн функц, шингээлтийн муруй, бүтээгдэхүүний хөдөлмөрийн эрч хүч, үйлдвэрлэлийн цар хүрээ, хамаарал хоорондын хамаарлыг тодорхойлох) ажил эрхлэлтийн түвшин дэх ҮНБ, Энгелийн муруй).

28. Урвуу загвар ба түүний хэрэглээ

Заримдаа урвуу загвар гэж нэрлэгддэг загварыг ашигладаг бөгөөд энэ нь дотоод шугаман бус боловч үүн дотор адил талт гиперболаас ялгаатай нь тайлбарлагч хувьсагч биш, харин Y-ийн шинж чанар нь хувиргагддаг. Тиймээс урвуу загвар нь хувирдаг. дотоод шугаман бус байх ба OLS шаардлага нь үүссэн Y атрибутын бодит утгууд болон тэдгээрийн урвуу утгын хувьд хангагдахгүй. Шугаман бус регрессийн хамаарлыг судлах нь онцгой анхаарал хандуулах ёстой. Ерөнхий тохиолдолд дээд эрэмбийн олон гишүүнттэй адил хоёрдугаар зэргийн параболыг шугаман болгох үед олон тооны регрессийн тэгшитгэлийн хэлбэрийг авдаг. Шугаманчлах үед тайлбарласан хувьсагчийн хувьд шугаман бус регрессийн тэгшитгэл нь шугаман хосолсон регрессийн тэгшитгэлийн хэлбэрийг авах юм бол шугаман корреляцийн коэффициентийг хамаарлын ойр байдлыг үнэлэхэд ашиглаж болно.

Хэрэв регрессийн тэгшитгэлийг шугаман хэлбэрт шилжүүлэх нь хамааралтай хувьсагчтай (үр дүнгийн шинж чанар) холбоотой бол шинж чанаруудын хувирсан утгуудад суурилсан шугаман корреляцийн коэффициент нь зөвхөн харилцааны ойролцоо үнэлгээг өгдөг бөгөөд тоон үзүүлэлттэй давхцдаггүй. корреляцийн индекс. Корреляцийн индексийг тооцоолохдоо тэдгээрийн логарифм биш харин үүссэн Y шинж чанарын квадрат хазайлтын нийлбэрийг ашигладаг гэдгийг санах нь зүйтэй. Корреляцийн индексийн ач холбогдлыг үнэлэх нь корреляцийн коэффициентийн найдвартай байдлыг (ач холбогдол) үнэлэхтэй ижил аргаар хийгддэг. Корреляцийн индекс нь өөрөө тодорхойлох индекстэй адил Fisher F тестийг ашиглан шугаман бус регрессийн тэгшитгэлийн ерөнхий ач холбогдлыг шалгахад ашиглагддаг.

Шугаман бус загваруудыг шугаман хэлбэрт оруулах, шугаман бус регрессийг ашиглах замаар бүтээх боломж нь нэг талаас регрессийн шинжилгээний түгээмэл байдлыг нэмэгдүүлж байгааг анхаарна уу. Нөгөөтэйгүүр, энэ нь судлаачийн даалгаврыг ихээхэн хүндрүүлдэг. Хэрэв бид хосолсон регрессийн шинжилгээгээр хязгаарлагдах юм бол бид Y ба X ажиглалтыг тархалтын график болгон зурж болно. Ихэнхдээ хэд хэдэн өөр өөр шугаман бус функцууд нь ямар нэгэн муруй дээр хэвтэж байвал ажиглалтыг ойролцоогоор хийдэг. Гэхдээ олон тооны регрессийн шинжилгээний хувьд ийм график байгуулах боломжгүй.

Хамаарах хувьсагчийн ижил тодорхойлолт бүхий өөр загваруудыг авч үзэхэд сонгох журам нь харьцангуй хялбар байдаг. Төсөөлж болох бүх боломжит функц дээр үндэслэн регрессийг тооцоолж, хамааралтай хувьсагчийн өөрчлөлтийг хамгийн их тайлбарлах функцийг сонгож болно. Шугаман функц y-ийн дисперсийн ойролцоогоор 64%-ийг тайлбарлаж, гипербол функц 99.9%-ийг тайлбарлавал сүүлийнхийг сонгох нь ойлгомжтой. Гэвч хэзээ янз бүрийн загваруудөөр өөр функциональ хэлбэрийг ашигласнаар загвар сонгох асуудал илүү төвөгтэй болно.

29. Box-Cox тестийг ашиглах.

Ерөнхийдөө, хамааралтай хувьсагчийн ижил тодорхойлолт бүхий өөр загваруудыг авч үзэхэд сонголт нь энгийн байдаг. Хамаарах хувьсагчийн өөрчлөлтийг хамгийн их тайлбарладаг функц дээр анхаарлаа төвлөрүүлж, бүх боломжит функц дээр үндэслэн регрессийг тооцоолох нь хамгийн үндэслэлтэй юм. Хэрэв детерминацийн коэффициент нь нэг тохиолдолд регрессээр тайлбарласан дисперсийн эзлэх хувь, нөгөө тохиолдолд энэ хамааралтай хувьсагчийн логарифмын дисперсийн эзлэх хувь регрессээр тайлбарлагдвал сонголт нь хүндрэлгүйгээр хийгддэг. Хоёр загварын эдгээр утгууд маш ойрхон байгаа бөгөөд сонголтын асуудал илүү төвөгтэй болох нь өөр асуудал юм.

Дараа нь Box-Cox тестийн стандарт горимыг хэрэглэнэ. Хэрэв та хамааралтай хувьсагчийн хувилбар хэлбэрээр үр дүнтэй хүчин зүйл ба түүний логарифмыг ашиглан загваруудыг харьцуулах шаардлагатай бол Зарембка тестийн хувилбарыг ашиглана. Энэ нь шугаман болон логарифм загварт язгуур квадрат алдаа (MSE)-ийг шууд харьцуулах боломжийг олгодог ажиглалтын масштабын Y-ийн өөрчлөлтийг санал болгож байна. Холбогдох журам нь дараах алхмуудыг агуулна.

    Дээж дэх Y утгуудын геометрийн дундажийг тооцоолсон бөгөөд энэ нь Y-ийн логарифмын арифметик дундажийн илтгэгчтэй давхцдаг;

    Y ажиглалтыг эхний алхамд олж авсан утгад хуваах байдлаар дахин тооцоолно;

    Регрессийг шугаман загварт анхны Y утгуудын оронд масштабтай Y утгуудыг ашигладаг ба логарифм загварт Y утгуудын логарифмийг ашигладаг. Хоёр регрессийн RMSE утгыг одоо харьцуулах боломжтой болсон. квадрат хазайлтын нийлбэр багатай загвар нь ажиглагдсан утгуудын бодит харьцаанд илүү сайн нийцдэг;

    Загваруудын аль нэг нь илүү сайн тохирохгүй байгаа эсэхийг шалгахын тулд дахин тооцоолсон регрессийн стандарт хазайлтын утгуудын харьцааны логарифм ба ажиглалтын тооны хагасын үржвэрийг ашиглаж, дараа нь авч болно. энэ утгын үнэмлэхүй утга.

30. Хүчин зүйлийн харилцан хамаарал ба олон шугаман байдлын тухай ойлголт.

34. MNC-ийн үндэс ба түүний хэрэглээний хүчин төгөлдөр байдал.

Одоо OLS-ийн үндсүүд, түүний хэрэглээний хүчин төгөлдөр байдал (олон регрессийн асуудлуудыг оруулаад) болон OLS ашиглан олж авсан тооцооллын хамгийн чухал шинж чанаруудыг авч үзье. Баруун талд нь аналитик хамаарлын хамт гэдгийг эхэлцгээе регрессийн тэгшитгэлСанамсаргүй нэр томъёо нь бас чухал үүрэг гүйцэтгэдэг. Энэхүү санамсаргүй бүрэлдэхүүн хэсэг нь ажиглагдах боломжгүй хэмжигдэхүүн юм. Сами статистик тестүүдрегрессийн параметрүүд болон корреляцийн хэмжүүрүүд нь олон тооны регрессийн санамсаргүй бүрэлдэхүүн хэсгийн тархалтын талаарх батлагдах боломжгүй таамаглал дээр суурилдаг. Эдгээр таамаглал нь зөвхөн урьдчилсан таамаглал юм. Зөвхөн регрессийн тэгшитгэлийг байгуулсны дараа санамсаргүй үлдэгдлийн тооцоо (санамсаргүй бүрэлдэхүүн хэсгийн эмпирик аналогууд) априори шинж чанартай байгаа эсэхийг шалгана. Үндсэндээ загварын параметрүүдийг тооцоолохдоо санамсаргүй бүрэлдэхүүнийг өөрөө үнэлэхийн тулд үүссэн шинж чанарын онолын болон бодит утгын зөрүүг тооцоолно. Энэ нь өгөгдсөн тэгшитгэлийн үл мэдэгдэх үлдэгдлийн жишээ хэрэгжүүлэлт гэдгийг санах нь зүйтэй.

Хэвийн тэгшитгэлийн системээс олж авсан регрессийн коэффициентүүд нь харилцааны бат бөх байдлын түүврийн тооцоо юм. Шударга бус байхад л практик ач холбогдолтой болох нь ойлгомжтой. Энэ тохиолдолд үлдэгдлийн дундаж нь тэгтэй тэнцүү, эсвэл ижил утгатай бол тооцооллын дундаж нь тооцоолсон параметртэй тэнцүү байна гэдгийг эргэн санацгаая. Дараа нь үлдэгдэл нь олон тооны түүврийн тооцоололд хуримтлагдахгүй бөгөөд олсон регрессийн параметрийг өөрөө олон тооны шударга бус тооцооллын дундаж гэж үзэж болно.

Үүнээс гадна, тооцоолол нь хамгийн бага зөрүүтэй байх ёстой, өөрөөр хэлбэл. үр дүнтэй байх ба дараа нь бараг ашиглах боломжгүй цэгийн тооцооноос интервалын тооцоолол руу шилжих боломжтой болно. Эцэст нь, итгэлцлийн интервал нь параметрийн үнэн (үл мэдэгдэх) утгаас өгөгдсөн зайд тооцоог олж авах магадлал нэгтэй ойролцоо байвал ашигтай байдаг. Ийм тооцооллыг тууштай гэж нэрлэдэг бөгөөд тууштай байдлын шинж чанар нь түүврийн хэмжээ нэмэгдэхийн хэрээр тэдгээрийн нарийвчлалын өсөлтөөр тодорхойлогддог.

Гэсэн хэдий ч тууштай байдлын нөхцөл нь автоматаар хангагддаггүй бөгөөд дараах хоёр чухал шаардлагыг биелүүлэхээс ихээхэн хамаардаг. Нэгдүгээрт, үлдэгдэл нь өөрсдөө хамгийн тод санамсаргүй байдлаар стохастик байх ёстой, жишээлбэл. Бүх тодорхой функциональ хамаарлыг олон регрессийн аналитик бүрэлдэхүүн хэсэгт тусгайлан оруулах ёстой бөгөөд үүнээс гадна үлдэгдлийн утгыг өөр өөр дээжийн хувьд бие биенээсээ хамааралгүйгээр хуваарилах ёстой (үлдэгдлийн автокорреляци байхгүй). Хоёрдахь чухал шаардлага бол хазайлт (үлдэгдэл) бүрийн хэлбэлзэл нь X хувьсагчийн бүх утгын хувьд ижил байх явдал юм (гомоскедастик). Тэдгээр. ижил төстэй байдал нь бүх ажиглалтын дисперсийн тогтмол байдлаар илэрхийлэгдэнэ.

Эсрэгээр, гетероскедастик гэдэг нь янз бүрийн ажиглалтын хувьд вариацын ийм тогтмол байдлыг зөрчих явдал юм. Энэ тохиолдолд түүвэр дэх янз бүрийн ажиглалтын хувьд санамсаргүй нэр томъёоны онолын янз бүрийн хуваарилалт бүхий өндөр хазайлттай утгыг олж авах магадлал (ажиглалтын өмнө) харьцангуй өндөр байх болно.

Үлдэгдэл автокорреляци буюу одоогийн болон өмнөх (дараагийн) ажиглалтын үлдэгдэл хоорондын хамаарал байгаа эсэх нь ердийн шугаман корреляцийн коэффициентийн утгаар тодорхойлогддог. Хэрэв энэ нь тэгээс мэдэгдэхүйц ялгаатай бол үлдэгдэл нь автокорреляцитай байдаг тул магадлалын нягтын функц (үлдэгдэл хуваарилалт) нь ажиглалтын цэг болон бусад ажиглалтын цэгүүдийн үлдэгдэл утгын тархалтаас хамаарна. Х хүчин зүйлээр ажиглалтын дараалал байгаа бол байгаа статистик мэдээллийг ашиглан үлдэгдлийн автокорреляцийг тодорхойлоход тохиромжтой. Үлдэгдэл автокорреляци байхгүй байгаа нь регрессийн коэффициентүүдийн тооцооны уялдаа холбоо, үр дүнтэй байдлыг баталгаажуулдаг.

35. Гомоскедастик ба гетероскедастик, үлдэгдлийн автокорреляци, ерөнхийлсөн хамгийн бага квадратууд (GLM).

X хувьсагчийн бүх утгуудын үлдэгдлийн дисперсийн ижил байдал буюу ижил төстэй байдал нь OLS ашиглан регрессийн параметрүүдийн тууштай тооцоог олж авахад зайлшгүй шаардлагатай. Ижил төстэй байдлын нөхцлийг хангахгүй байх нь гетероскедастик гэж нэрлэгддэг зүйлд хүргэдэг. Энэ нь регрессийн коэффициентүүдийн нэг талыг барьсан тооцоололд хүргэж болно. Гетероскедастик нь регрессийн коэффициентийн үнэлгээний үр ашгийг бууруулахад голлон нөлөөлнө. Энэ тохиолдолд регрессийн коэффициентийн стандарт алдааны томъёог ашиглах нь ялангуяа хэцүү болж хувирдаг бөгөөд үүнийг ашиглах нь хүчин зүйлийн аливаа утгын үлдэгдлийн жигд тархалтыг тооцдог. Регрессийн коэффициентийн үнэлгээний шударга бус байдлын хувьд энэ нь юуны түрүүнд үлдэгдэл болон хүчин зүйлсийн бие даасан байдлаас хамаарна.

Ижил төстэй байдлыг шалгах нэлээн ойлгомжтой, хатуу биш, ур чадвар шаардсан арга бол дундаж тооцоолсон (онолын) үр дүнгийн шинж чанар эсвэл харгалзах корреляцийн талбараас үлдэгдлийн хамаарлын мөн чанарыг графикаар судлах явдал юм. Гетероскедастикийг судлах, үнэлэх аналитик аргууд нь илүү хатуу байдаг. Хэрэв гетероскедастик мэдэгдэхүйц байгаа бол OLS-ийн оронд ерөнхий OLS (GLM) ашиглахыг зөвлөж байна.

OLS-ийн ашиглалтаас үүсэх олон тооны регрессийн шаардлагуудаас гадна загварт багтсан хувьсагчдын нөхцөлийг дагаж мөрдөх шаардлагатай. Эдгээрт юуны түрүүнд ажиглалтын өгөгдсөн эзлэхүүн дэх загвар хүчин зүйлийн тоонд тавигдах шаардлагууд орно (1-7). Үгүй бол регрессийн параметрүүд статистикийн хувьд ач холбогдолгүй болно. LSM-ийг хэрэгжүүлэхдээ холбогдох тоон аргыг ашиглах үр дүнтэй байдлын үүднээс ажиглалтын тоо нь тооцоолсон параметрийн тооноос давсан байх шаардлагатай (тэгшитгэлийн системд тэгшитгэлийн тоо хайж буй тооноос их байна) хувьсагч).

Эконометрикийн хамгийн чухал ололт бол үл мэдэгдэх параметрүүдийг тооцоолох аргуудыг ихээхэн хөгжүүлж, авч үзэж буй нөлөөллийн статик ач холбогдлыг тодорхойлох шалгуурыг сайжруулсан явдал юм. Үүнтэй холбогдуулан янз бүрийн түвшинд илэрдэг гетероскедастикийн улмаас уламжлалт OLS-ийг ашиглах боломжгүй эсвэл тохиромжгүй байдал нь ерөнхий OLS (GLM) үүсэхэд хүргэсэн. Үнэн хэрэгтээ энэ нь регрессийн коэффициентүүдийн шударга, үр ашигтай, тууштай тооцооллыг хангахын тулд загварыг тохируулах, түүний тодорхойлолтыг өөрчлөх, анхны өгөгдлийг өөрчлөх явдал юм.

Үлдэгдлүүдийн дундаж нь тэг гэж тооцогддог боловч тэдгээрийн тархалт нь тогтмол байхаа больсон боловч K i-ийн утгатай пропорциональ байна, энд эдгээр утгууд нь өөр өөр утгуудын хувьд өөр өөр пропорциональ коэффициентууд байдаг. хүчин зүйл x. Тиймээс эдгээр коэффициентүүд (K i утгууд) нь дисперсийн нэг төрлийн бус байдлыг тодорхойлдог. Мэдээжийн хэрэг, эдгээр пропорциональ коэффициентүүдийн нийтлэг хүчин зүйл болох тархалтын хэмжээ өөрөө тодорхойгүй гэж үздэг.

Анхны загвар нь эдгээр коэффициентийг олон регрессийн тэгшитгэлд оруулсны дараа гетероскедатик хэвээр байна (илүү нарийвчлалтай, эдгээр нь загварын үлдэгдэл утгууд юм). Эдгээр үлдэгдэл (үлдэгдэл) нь автокорреляци болохгүй. i-р ажиглалтын үр дүнд бүртгэгдсэн анхны загвар хувьсагчдыг K i пропорциональ коэффициентийн квадрат язгуурт хуваах замаар олж авсан шинэ хувьсагчдыг танилцуулъя. Дараа нь бид хувиргасан хувьсагчдын шинэ тэгшитгэлийг олж авах бөгөөд үүнд үлдэгдэл ижил төстэй байх болно. Шинэ хувьсагч нь өөрөө жигнэсэн хуучин (анхны) хувьсагч юм.

Тиймээс ижил төстэй үлдэгдэлтэй ийм аргаар олж авсан шинэ тэгшитгэлийн параметрүүдийн үнэлгээг жинлэсэн хамгийн бага квадратын арга болгон бууруулна (үндсэндээ энэ нь OLS арга юм). Регрессийн хувьсагчийн оронд тэдгээрийн дунджаас хазайлт, регрессийн коэффициентүүдийн илэрхийлэл нь энгийн бөгөөд стандартчилагдсан (нэгдмэл) хэлбэрийг авдаг бөгөөд OLS болон OLS-ийн хувьд тоо болон хуваагч дахь залруулгын коэффициент 1/K-ээр ялимгүй ялгаатай байдаг. регрессийн коэффициентийг өгч буй бутархайн .

Өөрчлөгдсөн (тохируулсан) загварын параметрүүд нь K i пропорциональ коэффициентийн үндэс болгон ямар ойлголтыг ашиглахаас ихээхэн хамаардаг гэдгийг санах нь зүйтэй. Ихэнхдээ үлдэгдэл нь хүчин зүйлийн утгатай пропорциональ байдаг гэж үздэг. Алдаа нь дарааллын сүүлчийн хүчин зүйлийн утгатай пропорциональ байна гэсэн таамаглалыг хүлээн зөвшөөрсөн тохиолдолд загвар нь хамгийн энгийн хэлбэрийг авдаг. Дараа нь OLS нь анхны эх хувьсагчтай стандарт OLS-ийн ажиллагаатай харьцуулахад регрессийн параметрүүдийг тодорхойлохдоо өөрчлөгдсөн хувьсагчдын бага утгатай ажиглалтын жинг нэмэгдүүлэх боломжийг олгодог. Гэхдээ эдгээр шинэ хувьсагч нь эдийн засгийн өөр агуулгатай болсон.

Үлдэгдэл болон хүчин зүйлийн хэмжээтэй пропорциональ байдлын талаархи таамаглал нь бодит үндэслэлтэй байж магадгүй юм. Том, жижиг аж ахуйн нэгжүүдийг оролцуулаад тодорхой хэмжээний нэг төрлийн бус өгөгдлийг боловсруулах. Дараа нь хүчин зүйлийн их хэмжээний эзэлхүүн нь үүссэн шинж чанарын том тархалт ба үлдэгдэл утгын их хэмжээний тархалттай тохирч болно. Цаашилбал, OLS ашиглах, харьцангуй утга руу шилжих нь хүчин зүйлийн өөрчлөлтийг бууруулаад зогсохгүй алдааны зөрүүг бууруулдаг. Тиймээс регрессийн загварт гетероскедастикийг харгалзан үзэх, засах хамгийн энгийн тохиолдол нь OLS-ийн тусламжтайгаар хэрэгждэг.

OLS-ийг жигнэсэн OLS хэлбэрээр хэрэгжүүлэх дээрх арга нь нэлээд практик юм - энэ нь энгийн хэрэгжиж, эдийн засгийн ил тод тайлбартай байдаг. Мэдээжийн хэрэг, энэ нь хамгийн ерөнхий хандлага биш бөгөөд эконометрикийн онолын үндэс болох математик статистикийн хүрээнд OLS-ийг маш нарийн хэрэгжүүлдэг илүү нарийн аргыг санал болгож байна. ерөнхий үзэл. Үүнд та алдааны векторын (үлдэгдэл багана) ковариацын матрицыг мэдэх хэрэгтэй. Практик нөхцөл байдалд энэ нь ихэвчлэн шударга бус байдаг бөгөөд энэ матрицыг ийм байдлаар олох боломжгүй байж болно. Тиймээс ерөнхийдөө ийм тооцоог матрицын оронд харгалзах томъёонд ашиглахын тулд шаардлагатай матрицыг ямар нэгэн байдлаар тооцоолох шаардлагатай байдаг. Тиймээс OMNC-ийн хэрэгжилтийн тайлбарласан хувилбар нь ийм тооцооллын нэг юм. Үүнийг заримдаа хүртээмжтэй ерөнхий жижиг квадратууд гэж нэрлэдэг.

Тодорхойлолтын коэффициент нь OLS ашиглах үед тохирох чанарын хангалттай хэмжүүр болж чадахгүй гэдгийг анхаарах хэрэгтэй. OLS-ийн хэрэглээ рүү буцахдаа бид цагаан хэлбэрээр стандарт хазайлтыг (стандарт алдаа) ашиглах арга (гетероскедастик байгаа тохиолдолд тогтмол стандарт алдаа гэж нэрлэдэг) хангалттай ерөнхий шинж чанартай болохыг бид тэмдэглэж байна. Алдааны векторын ковариацын матриц диагональ байх тохиолдолд энэ аргыг хэрэглэх боломжтой. Хэрэв үлдэгдэл (алдаа) -ын автокорреляци байгаа бол ковариацын матрицад тэгээс өөр элемент (коэффициент) байгаа бол үндсэн диагональаас гадуур байвал Neve West хэлбэрийн илүү ерөнхий стандарт алдааны аргыг хэрэглэнэ. Маш чухал хязгаарлалт байдаг: тэг биш элементүүд нь үндсэн диагональаас гадна зөвхөн зэргэлдээх диагональ дээр байрладаг бөгөөд үндсэн диагональаас тодорхой хэмжээнээс ихгүй зайд байрладаг.

Дээрхээс харахад гетероскедастик байгаа эсэхийг шалгах чадвартай байх шаардлагатай нь тодорхой байна. Доорх туршилтууд нь энэ зорилготой. Тэд үлдэгдлийн дисперсийн тэгш байдлын талаархи үндсэн таамаглалыг өөр таамаглалын эсрэг (эдгээр таамаглалын тэгш бус байдлын тухай) шалгадаг. Үүнээс гадна гетероскедастик шинж чанарын хувьд априори бүтцийн хязгаарлалтууд байдаг. Голдфельд-Квант тест нь ихэвчлэн алдааны дисперс (үлдэгдэл) нь зарим бие даасан хувьсагчийн утгаас шууд хамааралтай гэсэн таамаглалыг ашигладаг. Энэхүү тестийг ашиглах схем нь дараах байдалтай байна. Нэгдүгээрт, өгөгдлийг гетероскедастик гэж сэжиглэж буй бие даасан хувьсагчийн буурах дарааллаар эрэмбэлсэн. Энэхүү эрэмбэлэгдсэн өгөгдлийн багц нь "цөөн" гэдэг үг нь ойролцоогоор дөрөвний нэгийг (25%) илэрхийлдэг дундаж цөөн хэдэн ажиглалтыг хасдаг. нийт тообүх ажиглалт. Дараа нь үлдсэн (арилгасны дараа) дундаж ажиглалтын эхний болон үлдсэн дундаж ажиглалтын сүүлийн хоёр дээр бие даасан хоёр регрессийг явуулна. Үүний дараа харгалзах хоёр үлдэгдлийг байгуулна. Эцэст нь Фишерийн F статистикийг эмхэтгэсэн бөгөөд хэрэв судалж буй таамаглал үнэн бол F нь үнэхээр зохих эрх чөлөөний зэрэгтэй Фишерийн тархалт юм. Дараа нь энэ статистикийн том утга нь шалгагдаж буй таамаглалыг үгүйсгэх ёстой гэсэн үг юм. Устгах алхамгүйгээр энэ туршилтын хүч багасна.

Breusch-Pagan тестийг хэлбэлзэл нь зарим нэмэлт хувьсагчаас хамаардаг гэж априори таамагласан тохиолдолд ашигладаг. Эхлээд энгийн (стандарт) регрессийг хийж, үлдэгдлийн векторыг олж авна. Дараа нь хэлбэлзлийн тооцоог хийдэг. Дараа нь үлдэгдэлийн квадрат векторыг эмпирик дисперсэд хуваасан регрессийг (варианцийн тооцоо) хийнэ. Үүний хувьд (регресс) вариацын тайлбарласан хэсэг олддог. Үүний тулд өөрчлөлтийн тайлбарласан хэсгийг хагас болгон хувааж, статистикийг бүтээв. Хэрэв тэг таамаглал үнэн бол (гетероскедастик үнэн биш) бол энэ утга нь тархалттай байна хэхэ-дөрвөлжин. Хэрэв тест нь эсрэгээр гетероскедастикийг илрүүлсэн бол үлдэгдэл векторын бүрэлдэхүүн хэсгүүдийг ажиглагдсан бие даасан хувьсагчдын векторын харгалзах бүрэлдэхүүн хэсгүүдэд хуваах замаар анхны загварыг өөрчилдөг.

36. Цагаан хэлбэрийн стандарт хазайлтын арга.

Дараахь дүгнэлтийг хийж болно. Гетероскедастик байгаа тохиолдолд OLS-ийг ашиглах нь жинлэсэн квадрат хазайлтын нийлбэрийг багасгахад хүргэдэг. Боломжтой OLS-ийг ашиглах нь тооцоолсон параметрийн тооноос давсан олон тооны ажиглалт хийх хэрэгцээтэй холбоотой юм. OLS-ийг ашиглахад хамгийн таатай тохиолдол бол алдаа (үлдэгдэл) нь бие даасан хувьсагчдын аль нэгтэй пропорциональ байх ба үр дүнгийн тооцоо нь нийцтэй байх тохиолдол юм. Гэсэн хэдий ч гетероскедастиктай загварт OLS биш, харин стандарт OLS ашиглах шаардлагатай бол тууштай тооцоог олж авахын тулд White эсвэл Nevier-West хэлбэрээр алдааны тооцоог ашиглаж болно.

Хугацааны цувааг шинжлэхдээ цаг хугацааны янз бүрийн үе дэх ажиглалтын статистик хамаарлыг харгалзан үзэх шаардлагатай байдаг. Энэ тохиолдолд хамааралгүй алдааны таамаглал хангагдахгүй. Ингээд авч үзье энгийн загвар, алдаа нь эхний эрэмбийн авторегресс процессыг үүсгэдэг. Энэ тохиолдолд алдаа нь энгийн давталтын хамаарлыг хангадаг бөгөөд баруун талд нь нэр томъёоны нэг нь тэг дундаж ба тогтмол дисперстэй бие даасан хэвийн тархсан санамсаргүй хэмжигдэхүүнүүдийн дараалал юм. Хоёрдахь нэр томъёо нь параметрийн үржвэр (авторегрессийн коэффициент) ба өмнөх үеийн үлдэгдлийн утгуудын үр дүн юм. Алдааны утгын дараалал (үлдэгдэл) нь өөрөө суурин санамсаргүй үйл явцыг бүрдүүлдэг. Хөдөлгөөнгүй санамсаргүй үйл явц нь түүний шинж чанар, ялангуяа дундаж ба дисперсийн цаг хугацааны туршид тогтмол байдгаараа тодорхойлогддог. Энэ тохиолдолд бидний сонирхож буй ковариацын матрицыг (түүний нөхцлүүд) параметрийн хүчийг ашиглан хялбархан бичиж болно.

Мэдэгдэж буй параметрийн авторегрессив загварыг OLS ашиглан тооцоолно. Энэ тохиолдолд алдаа нь стандарт регрессийн загварын нөхцөлийг хангасан загвар болгон хувиргах замаар анхны загварыг зүгээр л багасгахад хангалттай. Энэ нь маш ховор тохиолддог боловч авторегрессийн параметрийг мэддэг нөхцөл байдал байсаар байна. Тиймээс ерөнхийдөө үл мэдэгдэх авторегресс параметрээр тооцоо хийх шаардлагатай байдаг. Ийм үнэлгээ хийхэд хамгийн түгээмэл хэрэглэгддэг гурван журам байдаг. Кокрейн-Оркутын арга, Хилдрет-Лу процедур, Дурбин арга.

Ерөнхийдөө дараах дүгнэлтүүд үнэн юм. Хугацааны цувралын шинжилгээ нь ердийн OLS-ийг засах шаардлагатай байдаг, учир нь энэ тохиолдолд алдаа нь ихэвчлэн хамааралтай байдаг. Ихэнхдээ эдгээр алдаанууд нь нэгдүгээр зэрэглэлийн суурин авторегресс процессыг үүсгэдэг. Нэгдүгээр эрэмбийн авторегрессийн OLS тооцоологч нь шударга бус, тууштай боловч үр дүнгүй байдаг. Мэдэгдэж буй авторегрессийн коэффициенттэй OLS нь анхны системийн энгийн хувиргалт (засвар) болон дараа нь стандарт OLS-ийн хэрэглээ болгон бууруулна. Хэрэв ихэвчлэн тохиолддог шиг авторегрессийн коэффициент нь тодорхойгүй бол OLS-ийн хувьд үл мэдэгдэх параметрийг (коэффицентийг) тооцоолох хэд хэдэн процедур байдаг бөгөөд үүний дараа мэдэгдэж буй параметрийн өмнөх тохиолдлын адил хувиргалтыг хэрэгжүүлдэг. параметр.

37. Брейш-Паган тестийн тухай ойлголт, Голдфельдт-Квандт тест

Хувь хүний ​​регрессийн коэффициентүүд тэгтэй тэнцүү байх тухай H 0 таамаглалыг (хэрэв хувилбар нь H 1-тэй тэнцүү биш бол) b = 0.05 ач холбогдлын түвшинд шалгая.

Хэрэв гол таамаглал буруу болвол бид өөр хувилбарыг хүлээн авна. Энэхүү таамаглалыг шалгахын тулд Оюутны t-тестийг ашигладаг.

Ажиглалтын өгөгдлөөс олдсон t-шалгуурын утгыг (ажиглагдсан эсвэл бодит гэж нэрлэдэг) Оюутны хуваарилалтын хүснэгтээс (ихэвчлэн статистик эсвэл эконометрикийн сурах бичиг, семинарын төгсгөлд өгдөг) тодорхойлсон хүснэгтийн (чухал) утгатай харьцуулна.

Хүснэгтийн утгыг ач холбогдлын түвшин (b) ба чөлөөт байдлын зэрэгийн тооноос хамааран тодорхойлно, шугаман хос регрессийн хувьд (n-2), n нь ажиглалтын тоо юм.

Хэрэв t-тестийн бодит утга нь хүснэгтийн утгаас (модуль) их байвал үндсэн таамаглалыг үгүйсгэж (1-b) магадлалаар популяци дахь параметр эсвэл статистик шинж чанар нь тэгээс мэдэгдэхүйц ялгаатай байна гэж үзнэ. .

Хэрэв t-тестийн бодит утга нь хүснэгтийн утгаас (модуль) бага байвал үндсэн таамаглалыг үгүйсгэх шалтгаан байхгүй, өөрөөр хэлбэл. популяци дахь параметр эсвэл статистик шинж чанар нь ач холбогдлын түвшинд тэгээс онцын ялгаагүй b.

t crit (n-m-1;b/2) = (30;0.025) = 2.042

1.7-с хойш< 2.042, то статистическая значимость коэффициента регрессии b не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в энэ тохиолдолд b коэффициентийг үл тоомсорлож болно.

0.56-аас хойш< 2.042, то статистическая значимость коэффициента регрессии a не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом a можно пренебречь.

Регрессийн тэгшитгэлийн коэффициентүүдийн итгэлийн интервал.

Регрессийн коэффициентүүдийн итгэлцлийн интервалыг 95% найдвартайгаар дараах байдлаар тодорхойлно.

  • (b - t crit S b ; b + t crit S b)
  • (0.64 - 2.042 * 0.38; 0.64 + 2.042 * 0.38)
  • (-0.13;1.41)

0 (тэг) цэг нь итгэлцлийн интервал дотор оршдог тул b коэффициентийн интервалын үнэлгээ нь статистикийн хувьд ач холбогдолгүй юм.

  • (a - t crit S a ; a + t crit S a)
  • (24.56 - 2.042 * 44.25; 24.56 + 2.042 * 44.25)
  • (-65.79;114.91)

95% -ийн магадлалаар энэ параметрийн утга нь олсон интервалд байх болно гэж хэлж болно.

0 (тэг) цэг нь итгэлцлийн интервал дотор оршдог тул a коэффициентийн интервалын үнэлгээ нь статистикийн хувьд ач холбогдолгүй юм.

2) F-статистик. Фишерийн шалгуур.

Шугаман регрессийн тэгшитгэлийн ач холбогдлыг бүхэлд нь шалгахын тулд R2 тодорхойлох коэффициентийг ашигладаг.

Регрессийн загварын ач холбогдлыг турших нь Фишерийн F тестийг ашиглан хийгддэг бөгөөд тооцоолсон утгыг судалж буй үзүүлэлтийн анхны цуврал ажиглалтын дисперсийн харьцаа ба үлдэгдэл дарааллын дисперсийн бодитой үнэлгээний харьцаагаар олдог. энэ загварын хувьд.

Хэрэв k 1 =(m) ба k 2 =(n-m-1) эрх чөлөөний зэрэгтэй тооцоолсон утга нь өгөгдсөн ач холбогдлын түвшинд хүснэгтлэгдсэн утгаас их байвал загварыг ач холбогдолтой гэж үзнэ.

энд m нь загвар дахь хүчин зүйлийн тоо.

Хосолсон шугаман регрессийн статистик ач холбогдлыг дараах алгоритмыг ашиглан үнэлнэ.

  • 1. Тэгшитгэл бүхэлдээ статистикийн хувьд ач холбогдолгүй гэсэн тэг таамаглал дэвшүүлэв: H 0: R 2 =0 ач холбогдлын b түвшинд.
  • 2. Дараа нь F-шалгуурын бодит утгыг тодорхойлно:

Энд m=1 хос регрессийн хувьд.

3. Квадратуудын нийт нийлбэр (илүү их дисперс)-ийн чөлөөт байдлын зэрэг нь 1, үлдэгдэлийн чөлөөт байдлын зэрэг нь өгөгдсөн ач холбогдлын түвшнийг харгалзан хүснэгтийн утгыг Фишерийн хуваарилалтын хүснэгтээс тодорхойлно. Шугаман регрессийн квадратуудын нийлбэр (бага дисперс) нь n-2 .

F хүснэгт нь дээд тал нь боломжит утгаөгөгдсөн эрх чөлөө, ач холбогдлын зэрэгтэй санамсаргүй хүчин зүйлийн нөлөөн дэх шалгуур b. Ач холбогдолын түвшин b - үнэн бол зөв таамаглалыг үгүйсгэх магадлал. Ихэвчлэн b-ийг 0.05 эсвэл 0.01-тэй тэнцүү авдаг.

4. Хэрэв F тестийн бодит утга нь хүснэгтийн утгаас бага байвал тэг таамаглалыг үгүйсгэх шалтгаан байхгүй гэж тэд хэлэв.

Үгүй бол тэг таамаглалыг үгүйсгэж, (1-b) магадлалаар тэгшитгэлийн статистик ач холбогдлын талаархи өөр таамаглалыг бүхэлд нь хүлээн авна.

Эрх чөлөөний зэрэгтэй шалгуур үзүүлэлтийн хүснэгтийн утга k 1 =1 ба k 2 =30, F хүснэгт = 4.17

F-ийн бодит утгаас хойш< F табл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

Фишерийн F-тест ба Оюутны t-статистикийн хоорондын хамаарлыг тэгшитгэлээр илэрхийлнэ.

Регрессийн тэгшитгэлийн чанарын үзүүлэлтүүд.

Үлдэгдэл автокорреляцийг шалгах.

OLS ашиглан чанарын регрессийн загварыг бий болгох чухал урьдчилсан нөхцөл бол бусад бүх ажиглалтын хазайлтын утгуудаас санамсаргүй хазайлтын утгуудын бие даасан байдал юм. Энэ нь аливаа хазайлт, ялангуяа зэргэлдээх хазайлтын хооронд ямар ч хамаарал байхгүй гэдгийг баталгаажуулдаг.

Автокорреляци (цуваа хамаарал) нь цаг хугацаа (цаг хугацааны цуваа) эсвэл орон зайд (хөндлөн цуваа) эрэмблэгдсэн ажиглагдсан үзүүлэлтүүдийн хоорондын хамаарлыг хэлнэ. Хугацааны цувааны өгөгдлийг ашиглах үед регрессийн шинжилгээнд үлдэгдлийн автокорреляци (хугацаа) түгээмэл байдаг ба хөндлөн огтлолын өгөгдлийг ашиглах үед маш ховор байдаг.

Эдийн засгийн асуудалд эерэг автокорреляци сөрөг автокорреляциас хамаагүй илүү байдаг. Ихэнх тохиолдолд эерэг автокорреляци нь чиглэлтэй холбоотой байдаг байнгын өртөлтзагварт харгалзаагүй зарим хүчин зүйл.

Сөрөг автокорреляци гэдэг нь үндсэндээ эерэг хазайлтыг сөрөг, эсрэгээр нь дагаж мөрддөг гэсэн үг юм. Улирлын мэдээгээр (өвөл-зун) ундааны эрэлт, орлогын хоорондох ижил хамаарлыг авч үзвэл ийм нөхцөл байдал үүсч болно.

Автокорреляцийг үүсгэх гол шалтгаануудын дунд дараахь зүйлс орно.

  • 1. Тодорхойлолтын алдаа. Загварт ямар нэгэн чухал тайлбарлагч хувьсагчийг анхаарч үзэхгүй байх, эсвэл хамаарлын хэлбэрийг буруу сонгох нь ихэвчлэн ажиглалтын цэгүүдийн регрессийн шугамаас системчилсэн хазайлтад хүргэдэг бөгөөд энэ нь автокорреляцид хүргэдэг.
  • 2. Инерци. Олон эдийн засгийн үзүүлэлтүүд(инфляци, ажилгүйдэл, ҮНБ гэх мэт) нь бизнесийн үйл ажиллагааны хэлбэлзэлтэй холбоотой тодорхой мөчлөгийн шинж чанартай байдаг. Тиймээс индикаторуудын өөрчлөлт нь тэр даруй тохиолддоггүй, гэхдээ тодорхой инерцтэй байдаг.
  • 3. Аалзны торны эффект. Үйлдвэрлэлийн болон бусад олон салбарт эдийн засгийн үзүүлэлтүүд нь эдийн засгийн нөхцөл байдлын өөрчлөлтөд хоцрогдолтой (цаг хугацааны хоцрогдол) хариу үйлдэл үзүүлдэг.
  • 4. Өгөгдлийг жигд болгох. Ихэнхдээ тодорхой урт хугацааны өгөгдлийг бүрдүүлэгч интервалаар нь дундажлах замаар олж авдаг. Энэ нь авч үзэж буй хугацаанд үүссэн хэлбэлзлийг тодорхой жигдрүүлж, улмаар автокорреляцийг үүсгэж болзошгүй юм.

Автокорреляцийн үр дагавар нь гетероскедастикийн үр дагавартай төстэй: регрессийн коэффициент ба детерминацийн коэффициентийн ач холбогдлыг тодорхойлсон t- ба F-статистикийн дүгнэлт нь буруу байх магадлалтай.



Сайт дээр шинэ

>

Хамгийн алдартай