տուն Հիգիենա Ինչպես գտնել excel-ում մոտարկման միջին սխալը: Ռեգրեսիոն մոդելավորման արդյունքների վիճակագրական հավաստիության գնահատում Fisher's F թեստի միջոցով

Հիգիենա

Ինչպես գտնել excel-ում մոտարկման միջին սխալը: Ռեգրեսիոն մոդելավորման արդյունքների վիճակագրական հավաստիության գնահատում Fisher's F թեստի միջոցով

Ստուգենք H 0 վարկածը անհատական ռեգրեսիոն գործակիցների զրոյի հավասարության մասին (եթե այլընտրանքը հավասար չէ H 1-ին) նշանակության b = 0,05 մակարդակում։

Եթե պարզվում է, որ հիմնական վարկածը սխալ է, մենք ընդունում ենք այլընտրանքայինը։ Այս վարկածը ստուգելու համար օգտագործվում է Student-ի t-թեստը:

Դիտորդական տվյալներից հայտնաբերված t-չափանիշի արժեքը (նաև կոչվում է դիտարկված կամ փաստացի) համեմատվում է Ուսանողների բաշխման աղյուսակներից որոշված աղյուսակային (կրիտիկական) արժեքի հետ (որոնք սովորաբար տրվում են վիճակագրության կամ էկոնոմետրիկայի վերաբերյալ դասագրքերի և սեմինարների վերջում):

Սեղանի արժեքըորոշվում է կախված նշանակության մակարդակից (բ) և ազատության աստիճանների քանակից, որը գծային զույգ ռեգրեսիայի դեպքում հավասար է (n-2), n-ը դիտարկումների քանակն է։

Եթե t-թեստի իրական արժեքը մեծ է աղյուսակի արժեքից (մոդուլ), ապա հիմնական վարկածը մերժվում է և համարվում է, որ (1-b) հավանականությամբ պարամետրը կամ վիճակագրական բնութագիրը բնակչությունըզգալիորեն տարբերվում է զրոյից:

Եթե t-test-ի իրական արժեքը փոքր է աղյուսակի արժեքից (մոդուլ), ապա հիմք չկա մերժելու հիմնական վարկածը, այսինքն. Պոպուլյացիայի մեջ պարամետրը կամ վիճակագրական բնութագիրը նշանակալիության մակարդակի զրոյից էականորեն չի տարբերվում բ.

t crit (n-m-1;b/2) = (30;0.025) = 2.042

1.7-ից սկսած< 2.042, то статистическая значимость коэффициента регрессии b не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в այս դեպքում b գործակիցը կարելի է անտեսել:

0.56-ից սկսած< 2.042, то статистическая значимость коэффициента регрессии a не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом a можно пренебречь.

Ռեգրեսիայի հավասարման գործակիցների վստահության միջակայքը:

Որոշենք ռեգրեսիոն գործակիցների վստահության միջակայքերը, որոնք 95% հուսալիությամբ կլինեն հետևյալը.

(b - t crit S b ; b + t crit S b)
(0.64 - 2.042 * 0.38; 0.64 + 2.042 * 0.38)
(-0.13;1.41)

Քանի որ 0 (զրո) կետը ներսում է վստահության միջակայքը, ապա b գործակցի ինտերվալային գնահատականը վիճակագրորեն աննշան է։

(a - t crit S a ; a + t crit S a)
(24.56 - 2.042 * 44.25; 24.56 + 2.042 * 44.25)
(-65.79;114.91)

95% հավանականությամբ կարելի է ասել, որ այս պարամետրի արժեքը կգտնվի գտնված միջակայքում:

Քանի որ 0 (զրո) կետը գտնվում է վստահության միջակայքում, a գործակցի միջակայքի գնահատումը վիճակագրորեն աննշան է:

2) Զ-վիճակագրություն. Ֆիշերի չափանիշը.

Հավասարման նշանակությունը ստուգելու համար օգտագործվում է որոշման R2 գործակիցը գծային ռեգրեսիաընդհանրապես.

Ռեգրեսիոն մոդելի նշանակության փորձարկումն իրականացվում է Ֆիշերի F թեստի միջոցով, որի հաշվարկված արժեքը հայտնաբերվում է որպես ուսումնասիրվող ցուցիչի դիտարկումների սկզբնական շարքի շեղումների հարաբերակցություն և մնացորդային հաջորդականության շեղումների անաչառ գնահատում: այս մոդելի համար:

Եթե k 1 =(m) և k 2 =(n-m-1) ազատության աստիճաններով հաշվարկված արժեքը մեծ է աղյուսակային արժեքից տվյալ նշանակության մակարդակում, ապա մոդելը համարվում է նշանակալի:

որտեղ m-ը մոդելի գործոնների թիվն է:

Զուգակցված գծային ռեգրեսիայի վիճակագրական նշանակությունը գնահատվում է հետևյալ ալգորիթմի միջոցով.

1. Առաջարկվում է զրոյական վարկած, որ հավասարումը որպես ամբողջություն վիճակագրորեն աննշան է. H 0: R 2 =0 նշանակության մակարդակում b.
2. Այնուհետև որոշեք F-չափանիշի իրական արժեքը.

որտեղ m=1 զույգ ռեգրեսիայի համար:

3. Աղյուսակային արժեքը որոշվում է Ֆիշերի բաշխման աղյուսակներից՝ տվյալ նշանակության մակարդակի համար՝ հաշվի առնելով, որ քառակուսիների ընդհանուր գումարի ազատության աստիճանների թիվը (ավելի մեծ շեղում) 1 է, իսկ ազատության աստիճանների թիվը մնացորդայինի համար։ Գծային ռեգրեսիայում քառակուսիների գումարը (ավելի փոքր շեղում) n-2 է:

F աղյուսակը չափանիշի առավելագույն հնարավոր արժեքն է պատահական գործոնների ազդեցության տակ ազատության և նշանակալիության տվյալ աստիճանի բ. Նշանակության մակարդակ բ - ճիշտ վարկածը մերժելու հավանականությունը, պայմանով, որ այն ճիշտ է: Սովորաբար b-ն հավասար է 0,05 կամ 0,01:

4. Եթե F-թեստի իրական արժեքը փոքր է աղյուսակի արժեքից, ապա ասում են, որ հիմք չկա մերժելու զրոյական վարկածը։

Հակառակ դեպքում, զրոյական վարկածը մերժվում է և (1-բ) հավանականությամբ ընդունվում է այլընտրանքային վարկածը ընդհանուր հավասարման վիճակագրական նշանակության մասին։

Ազատության աստիճաններով չափանիշի աղյուսակ արժեքը k 1 =1 և k 2 =30, F աղյուսակ = 4.17

Քանի որ փաստացի արժեքը Ֆ< F табл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

Fisher F-test-ի և Student t-վիճակագրության միջև կապն արտահայտվում է հավասարությամբ.

Ռեգրեսիայի հավասարման որակի ցուցանիշներ.

Թեստավորում մնացորդների ավտոկոռելյացիայի համար:

OLS-ի օգտագործմամբ որակական ռեգրեսիոն մոդել կառուցելու կարևոր նախապայման է պատահական շեղումների արժեքների անկախությունը բոլոր մյուս դիտարկումներում շեղումների արժեքներից: Սա ապահովում է, որ որևէ կապ չկա որևէ շեղումների և, մասնավորապես, հարակից շեղումների միջև:

Ավտոկորելացիան (սերիական հարաբերակցություն) սահմանվում է որպես ժամանակի (ժամանակային շարքի) կամ տարածության (խաչ շարքերի) դասավորված դիտարկվող ցուցիչների միջև հարաբերակցությունը: Մնացորդների (վարիանսների) ավտոհարաբերակցությունը տարածված է ռեգրեսիոն վերլուծության մեջ, երբ օգտագործվում են ժամանակային շարքի տվյալները, և շատ հազվադեպ, երբ օգտագործվում են խաչմերուկային տվյալներ:

Տնտեսական խնդիրների դեպքում դրական ավտոկորելացիան շատ ավելի տարածված է, քան բացասական ավտոկորելացիան: Շատ դեպքերում դրական ավտոկորելացիան պայմանավորված է ուղղորդմամբ մշտական բացահայտումորոշ գործոններ, որոնք հաշվի չեն առնվել մոդելում:

Բացասական ավտոկորելացիան ըստ էության նշանակում է, որ դրական շեղմանը հաջորդում է բացասականը և հակառակը: Այս իրավիճակը կարող է առաջանալ, եթե սեզոնային տվյալների համաձայն (ձմեռ-ամառ) դիտարկվի զովացուցիչ ըմպելիքների պահանջարկի և եկամտի միջև նույն հարաբերությունները:

Ավտոկորելացիա առաջացնող հիմնական պատճառներից են հետևյալը.

1. Տեխնիկական սխալներ: Մոդելում որևէ կարևոր բացատրական փոփոխական հաշվի չառնելը կամ կախվածության ձևի սխալ ընտրությունը սովորաբար հանգեցնում են դիտարկման կետերի համակարգային շեղումների ռեգրեսիայի գծից, ինչը կարող է հանգեցնել ավտոկոռելյացիայի:
2. Իներցիա. Շատերը տնտեսական ցուցանիշները(գնաճ, գործազրկություն, ՀՆԱ և այլն) ունեն որոշակի ցիկլային բնույթ՝ կապված ձեռնարկատիրական գործունեության տատանումների հետ։ Հետևաբար, ցուցանիշների փոփոխությունը ոչ թե ակնթարթորեն է տեղի ունենում, այլ ունի որոշակի իներցիա։
3. Սարդոստայնի էֆեկտ։ Շատ արտադրական և այլ ոլորտներում տնտեսական ցուցանիշները տնտեսական պայմանների փոփոխությանը արձագանքում են ուշացումով (ժամանակային ուշացումով):
4. Տվյալների հարթեցում. Հաճախ որոշակի երկար ժամանակահատվածի համար տվյալներ են ստացվում՝ միջինացնելով տվյալները դրա բաղկացուցիչ միջակայքում: Սա կարող է հանգեցնել դիտարկվող ժամանակահատվածում տեղի ունեցած տատանումների որոշակի հարթեցման, որն իր հերթին կարող է առաջացնել ավտոկորելացիա:

Ավտոկորելյացիայի հետևանքները նման են հետերոսկեդաստիկության հետևանքների. t- և F- վիճակագրությունից ստացված եզրակացությունները, որոնք որոշում են ռեգրեսիոն գործակցի և որոշման գործակիցի նշանակությունը, հավանաբար սխալ են:

5. Օգտագործելով F-թեստը, պարզվեց, որ ստացված զուգակցված ռեգրեսիոն հավասարումը, որպես ամբողջություն, վիճակագրորեն աննշան է և համարժեք կերպով չի նկարագրում ամսական կենսաթոշակային y արժեքի և x ապրուստի արժեքի միջև կապի ուսումնասիրված երևույթը:

6. Ստեղծվել է էկոնոմետրիկ բազմակի գծային ռեգրեսիայի մոդել, որը կապում է պայմանական y ընկերության զուտ եկամտի չափը կապիտալի շրջանառության x1 և օգտագործված կապիտալի հետ x2:

7. Հաշվարկելով էլաստիկության գործակիցները՝ ցույց է տրվում, որ երբ կապիտալի շրջանառությունը փոխվում է 1%-ով, ընկերության զուտ եկամտի չափը փոխվում է 0,0008%-ով, իսկ երբ օգտագործվող կապիտալը փոխվում է 1%-ով, ընկերության զուտ եկամտի չափը։ փոխվում է 0,56%-ով։

8. t-test-ի միջոցով գնահատվել է ռեգրեսիոն գործակիցների վիճակագրական նշանակությունը, պարզվել է, որ բացատրական x 1 փոփոխականը վիճակագրորեն աննշան է և կարող է բացառվել ռեգրեսիայի հավասարումից, մինչդեռ բացատրական x 2 փոփոխականը. վիճակագրորեն նշանակալի.

9. Օգտագործելով F- թեստը, պարզվեց, որ արդյունքում ստացված զուգակցված ռեգրեսիոն հավասարումը, որպես ամբողջություն, վիճակագրորեն նշանակալի է և համարժեքորեն նկարագրում է պայմանական ընկերության y զուտ եկամտի և կապիտալի շրջանառության x 1 և օգտագործված կապիտալի միջև կապի ուսումնասիրված երևույթը: x 2.

10. Հաշվարկվել է գծային հավասարմամբ վիճակագրական տվյալների մոտարկման միջին սխալը. բազմակի ռեգրեսիա, որը կազմել է 29,8%։ Ցույց է տրվում, թե վիճակագրական տվյալների բազայում ո՞ր դիտարկման շնորհիվ է այս սխալի մեծությունը գերազանցում թույլատրելի արժեքը։

14. Զուգակցված ռեգրեսիայի մոդելի ստեղծում՝ առանց EXCEL-ի օգտագործման:

Օգտագործելով վիճակագրական նյութԱղյուսակ 3.5-ում տրված անհրաժեշտ է.

2. Գնահատեք կապի սերտությունը՝ օգտագործելով հարաբերակցության և որոշման ցուցանիշները:

3. Օգտագործելով առաձգականության գործակիցը, որոշեք գործակցի բնութագրիչի և ստացվածի միջև կապի աստիճանը:

4. Սահմանել միջին սխալմոտարկումներ.

5. Գնահատեք մոդելավորման վիճակագրական հավաստիությունը՝ օգտագործելով Fisher's F-test-ը:

Աղյուսակ 3.5. Նախնական տվյալներ.

	Կանխիկ եկամուտների մասնաբաժինը, որն ուղղված է ավանդների, վարկերի, հավաստագրերի և արտարժույթի ձեռքբերման խնայողությունների ավելացմանը, մեկ շնչին ընկնող կանխիկ միջին եկամտի ընդհանուր չափով, %	Միջին ամսական հաշվեգրված աշխատավարձը, ք.ա.

Կալուժսկայա
Կոստրոմսկայա
Օրլովսկայա
Ռյազան
Սմոլենսկայա

Զույգ գծային ռեգրեսիայի հավասարման b 0 , b 1 անհայտ պարամետրերը որոշելու համար մենք օգտագործում ենք նորմալ հավասարումների ստանդարտ համակարգը, որն ունի ձև.

(3.7)

Այս համակարգը լուծելու համար նախ անհրաժեշտ է որոշել Sx 2-ի և Sxy-ի արժեքները: Այս արժեքները որոշվում են աղբյուրի տվյալների աղյուսակից՝ լրացնելով այն համապատասխան սյունակներով (Աղյուսակ 3.6):

Աղյուսակ 3.6. Դեպի ռեգրեսիոն գործակիցների հաշվարկ.

Այնուհետև (3.7) համակարգը ստանում է ձև

Առաջին հավասարումից b 0 արտահայտելով և ստացված արտահայտությունը փոխարինելով երկրորդ հավասարմամբ՝ ստանում ենք.

Կատարելով տերմին առ անդամ բազմապատկում և բացելով փակագծերը՝ ստանում ենք.

Վերջապես, զուգակցված գծային ռեգրեսիոն հավասարումը, որը կապում է բնակչության կանխիկ եկամուտների մասնաբաժնի արժեքը, որը նպատակաուղղված է խնայողությունների y մեծացմանը միջին ամսական հաշվեգրված աշխատավարձի x-ի հետ, ունի ձև.

Այսպիսով, երբ կառուցված է զուգակցված գծային ռեգրեսիայի հավասարումը, մենք որոշում ենք գծային հարաբերակցության գործակիցը ըստ կախվածության.

որտեղ են համապատասխան պարամետրերի ստանդարտ շեղումների արժեքները:

Կախվածությունից (3.9) գծային հարաբերակցության գործակիցը հաշվարկելու համար մենք կատարում ենք միջանկյալ հաշվարկներ։

Գտնված պարամետրերի արժեքները փոխարինելով (3.9) արտահայտությամբ՝ մենք ստանում ենք

Գծային հարաբերակցության գործակցի ստացված արժեքը ցույց է տալիս թույլ հակադարձ վիճակագրական կապի առկայություն բնակչության դրամական եկամուտների տեսակարար կշռի միջև, որն ուղղված է խնայողությունների ավելացմանը y և միջին ամսական հաշվեգրված աշխատավարձի չափին x:

Որոշման գործակիցը կազմում է , ինչը նշանակում է, որ միայն 9,6%-ն է բացատրվում y-ի վրա x բացատրական փոփոխականի ռեգրեսիայով։ Համապատասխանաբար, 1 արժեքը, որը հավասար է 90,4%-ին, բնութագրում է y փոփոխականի շեղման տեսակարար կշիռը, որն առաջացել է էկոնոմետրիկ մոդելում հաշվի չառնված մյուս բոլոր բացատրական փոփոխականների ազդեցությամբ:

Առաձգականության գործակիցն է

Հետևաբար, երբ միջին ամսական հաշվեգրված աշխատավարձը փոխվում է 1%-ով, բնակչության կանխիկ եկամուտների մասնաբաժինը, որն ուղղված է խնայողությունների ավելացմանը, նույնպես նվազում է 1%-ով, իսկ աշխատավարձի աճի հետ մեկտեղ նվազում է նաև բնակչության կանխիկ եկամուտների տեսակարար կշիռը: բնակչությունը՝ ուղղված խնայողությունների ավելացմանը. Այս եզրակացությունը հակասում է ողջախոհությանը և կարող է բացատրվել միայն ստեղծված մաթեմատիկական մոդելի սխալմամբ:

Հաշվենք միջին մոտավոր սխալը։

Աղյուսակ 3.7. Միջին մոտավոր սխալի հաշվարկման ուղղությամբ:

Ստացված արժեքը գերազանցում է (12...15)%-ը, ինչը ցույց է տալիս հաշվարկված տվյալների միջին շեղման նշանակությունը փաստացի տվյալներից, որոնց վրա կառուցվել է էկոնոմետրիկ մոդելը։

Վիճակագրական մոդելավորման հուսալիությունը կկատարվի Ֆիշերի F-թեստի հիման վրա: Ֆիշերի չափանիշի F calc-ի տեսական արժեքը որոշվում է գործոնի արժեքների և մնացորդային դիսպերսիաների արժեքների հարաբերակցությունից՝ հաշվարկված ազատության մեկ աստիճանի համար՝ ըստ բանաձևի:

որտեղ n-ը դիտարկումների թիվն է.

m-ը բացատրական փոփոխականների թիվն է (քննարկվող օրինակի համար m m =1):

F crit կրիտիկական արժեքը որոշվում է վիճակագրական աղյուսակներից և նշանակալիության մակարդակի համար a = 0,05 հավասար է 10,13-ի: Քանի որ F հաշվարկված

15. Բազմակի ռեգրեսիայի մոդելի կառուցում առանց EXCEL-ի օգտագործման:

Օգտագործելով աղյուսակ 3.8-ում տրված վիճակագրական նյութը՝ դուք պետք է.

1. Կառուցել գծային հավասարումբազմակի ռեգրեսիա, բացատրել դրա պարամետրերի տնտեսական նշանակությունը:

2. Տրե՛ք գործոնների և ստացված հատկանիշի միջև կապի սերտության համեմատական գնահատական՝ օգտագործելով առաձգականության միջին (ընդհանուր) գործակիցները:

3. Գնահատեք վիճակագրական նշանակությունռեգրեսիայի գործակիցները՝ օգտագործելով t-թեստը և հավասարման ոչ նշանակալիության զրոյական վարկածը՝ օգտագործելով F-թեստը:

4. Գնահատե՛ք հավասարման որակը՝ որոշելով մոտարկման միջին սխալը:

Աղյուսակ 3.8. Նախնական տվյալներ.

Զուտ եկամուտ, միլիոն ԱՄՆ դոլար	Կապիտալ շրջանառությունը միլիոն ԱՄՆ դոլար	Օգտագործված կապիտալ, մլն ԱՄՆ դոլար

Բազմակի գծային ռեգրեսիոն հավասարման b 0 , b 1 , b 2 անհայտ պարամետրերը որոշելու համար մենք օգտագործում ենք նորմալ հավասարումների ստանդարտ համակարգը, որն ունի ձև.

(3.11)

Այս համակարգը լուծելու համար նախ անհրաժեշտ է որոշել Sx 1 2, Sx 2 2, Sx 1 y, Sx 2 y, Sx 1 x 2 մեծությունների արժեքները։ Այս արժեքները որոշվում են աղբյուրի տվյալների աղյուսակից՝ լրացնելով այն համապատասխան սյունակներով (Աղյուսակ 3.9):

Աղյուսակ 3.9. Դեպի ռեգրեսիոն գործակիցների հաշվարկ.

Այնուհետև (3.11) համակարգը ստանում է ձև

Այս համակարգը լուծելու համար մենք կօգտագործենք Գաուսի մեթոդը, որը բաղկացած է անհայտների հաջորդական վերացումից. համակարգի առաջին հավասարումը բաժանել 10-ի, ապա ստացված հավասարումը բազմապատկել 370.6-ով և հանել այն համակարգի երկրորդ հավասարումից, ապա բազմապատկել ստացված հավասարումը 158.20-ով և հանել այն համակարգի երրորդ հավասարումից: Կրկնելով նշված ալգորիթմը համակարգի փոխակերպված երկրորդ և երրորդ հավասարումների համար՝ մենք ստանում ենք.

Þ Þ

Þ .

Փոխակերպումից հետո մենք ունենք.

Այնուհետև զուտ եկամտի վերջնական կախվածությունը կապիտալի շրջանառությունից և կապիտալից, որն օգտագործվում է գծային բազմակի ռեգրեսիոն հավասարման տեսքով, ունի ձև.

Ստացված էկոնոմետրիկ հավասարումից երևում է, որ օգտագործվող կապիտալի աճի հետ զուտ եկամուտն ավելանում է և, ընդհակառակը, կապիտալի շրջանառության աճով, զուտ եկամուտը նվազում է։ Բացի այդ, որքան մեծ է ռեգրեսիայի գործակիցը, այնքան մեծ է բացատրական փոփոխականի ազդեցությունը կախված փոփոխականի վրա: Քննարկվող օրինակում ռեգրեսիայի գործակցի արժեքը ավելի մեծ է, քան գործակցի արժեքը, հետևաբար օգտագործված կապիտալը զգալիորեն ավելի մեծ ազդեցություն ունի զուտ եկամտի վրա, քան կապիտալի շրջանառությունը: Այս եզրակացությունը քանակականացնելու համար մենք որոշելու ենք մասնակի առաձգականության գործակիցները:

Արդյունքների վերլուծությունը ցույց է տալիս նաև, որ օգտագործված կապիտալն ավելի մեծ ազդեցություն ունի զուտ եկամտի վրա։ Այսպիսով, մասնավորապես, օգտագործվող կապիտալի 1%-ով ավելացման դեպքում զուտ եկամուտն ավելանում է 1,17%-ով։ Միաժամանակ, կապիտալի շրջանառության 1%-ով աճի դեպքում զուտ եկամուտը նվազում է 0,5%-ով։

Ֆիշերի չափանիշի տեսական արժեքը F հաշվարկ.

F crit կրիտիկական արժեքի արժեքը որոշվում է վիճակագրական աղյուսակներից և a = 0,05 նշանակության մակարդակի համար հավասար է 4,74-ի: Քանի որ F calc > F crit, զրոյական վարկածը մերժվում է, և արդյունքում ստացված ռեգրեսիայի հավասարումն ընդունվում է որպես վիճակագրորեն նշանակալի:

Ռեգրեսիայի գործակիցների և t-չափանիշի վիճակագրական նշանակությունը գնահատելը հանգում է այս գործակիցների թվային արժեքը նրանց պատահական սխալների մեծության հետ համեմատելուն և ըստ հարաբերությունների.

t-վիճակագրության տեսական արժեքը հաշվարկելու աշխատանքային բանաձևը հետևյալն է.

, (3.13)

որտեղ զույգ հարաբերակցության գործակիցները և բազմակի հարաբերակցության գործակիցը հաշվարկվում են կախվածությունից.

Այնուհետև t-վիճակագրության տեսական (հաշվարկված) արժեքները համապատասխանաբար հավասար են.

Քանի որ t-վիճակագրության կրիտիկական արժեքը, որը որոշվում է վիճակագրական աղյուսակներից a = 0,05 հավասար t crit = 2,36 մակարդակի համար, բացարձակ արժեքով ավելի մեծ է, քան = - 1,798, ապա զրոյական վարկածը չի մերժվում, և բացատրական փոփոխականը x 1 է: վիճակագրորեն աննշան է և այն կարելի է բացառել ռեգրեսիայի հավասարումից: Ընդհակառակը, երկրորդ ռեգրեսիայի գործակցի համար > t crit (3.3 > 2.36) և բացատրական x 2 փոփոխականը վիճակագրորեն նշանակալի է:

Հաշվենք միջին մոտավոր սխալը։

Աղյուսակ 3.10. Միջին մոտավոր սխալի հաշվարկման ուղղությամբ:

Այնուհետև միջին մոտավոր սխալն է

Ստացված արժեքը չի գերազանցում (12…15)%-ի թույլատրելի սահմանը:

16. Չափումների տեսության զարգացման պատմություն

TI-ն առաջին անգամ մշակվել է որպես հոգեֆիզիկական չափումների տեսություն: Հետպատերազմյան հրապարակումներում ամերիկացի հոգեբան Ս.Ս. Սթիվենսը կենտրոնացավ չափման սանդղակների վրա: 20-րդ դարի երկրորդ կեսին։ TI-ի կիրառման շրջանակը արագորեն ընդլայնվում է։ 50-ականներին ԱՄՆ-ում հրատարակված «Հոգեբանական գիտությունների հանրագիտարանի» հատորներից մեկը կոչվում էր «Հոգեբանական չափումներ»։ Այս հրապարակման հեղինակներն ընդլայնել են ԹԻ-ի շրջանակը հոգեֆիզիկայից մինչև ընդհանրապես հոգեբանություն: Այս ժողովածուի «Չափման տեսության հիմունքները» հոդվածում ներկայացումը վերացական մաթեմատիկական մակարդակի վրա էր՝ առանց որևէ կոնկրետ կիրառման ոլորտի հղումների: Դրանում շեշտը դրվեց «էմպիրիկ համակարգերի հոմոմորֆիզմների վրա՝ թվային հարաբերություններով» (այս մաթեմատիկական տերմինների մեջ մտնելու կարիք չկա), և ներկայացման մաթեմատիկական բարդությունը մեծացավ Ս.Ս. Սթիվենս.

TI-ի վերաբերյալ առաջին ներպետական հոդվածներից մեկում (60-ականների վերջ) հաստատվեց, որ փորձաքննության օբյեկտները գնահատելիս փորձագետների կողմից նշանակված միավորները, որպես կանոն, չափվում են հերթական սանդղակով: 70-ականների սկզբին հայտնված աշխատանքները հանգեցրին ԹԻ-ի օգտագործման շրջանակի զգալի ընդլայնմանը։ Այն կիրառվել է մանկավարժական որակաչափության (ուսանողների գիտելիքների որակի չափման), համակարգերի հետազոտության և տարբեր տեսական խնդիրների մեջ։ փորձագիտական գնահատականներ, արտադրանքի որակի ցուցանիշների ագրեգացման համար, սոցիոլոգիական ուսումնասիրություններում և այլն։

Որպես TI-ի երկու հիմնական խնդիր՝ կոնկրետ տվյալների չափման սանդղակի տիպի սահմանմանը զուգահեռ, առաջ է քաշվել տվյալների վերլուծության ալգորիթմների որոնում, որի արդյունքը չի փոխվում սանդղակի որևէ թույլատրելի փոխակերպմամբ (այսինքն՝ անփոփոխ է. Աշխարհագրության մեջ սովորական սանդղակներն են Բոֆորտի սանդղակի քամիները («հանգիստ», «թեթև քամի», «չափավոր քամի» և այլն), երկրաշարժի ուժգնության սանդղակը: Ակնհայտորեն չի կարելի ասել, որ 2 բալ ուժգնությամբ երկրաշարժը (առաստաղի տակ ճոճվող ճրագը) ուղիղ 5 անգամ ավելի թույլ է, քան 10 բալ ուժգնությամբ երկրաշարժը (երկրի մակերևույթի ամեն ինչի լիակատար ոչնչացում):

Բժշկության մեջ շարքային կշեռքներն են հիպերտոնիայի փուլերի սանդղակը (ըստ Մյասնիկովի), սրտի անբավարարության աստիճանների սանդղակը (ըստ Ստրաժեսկո-Վասիլենկո-Լանգի), կորոնար անբավարարության ծանրության սանդղակը (ըստ Ֆոգելսոնի) և այլն։ . Այս բոլոր կշեռքները կառուցված են հետևյալ սխեմայով. հիվանդություն չի հայտնաբերվել. հիվանդության առաջին փուլը; երկրորդ փուլ; երրորդ փուլ... Երբեմն առանձնանում են 1ա, 16 և այլն փուլերը, յուրաքանչյուր փուլ ունի իրեն հատուկ բժշկական հատկանիշ: Հաշմանդամության խմբերը նկարագրելիս թվերն օգտագործվում են հակառակ հերթականությամբ՝ ամենածանրը հաշմանդամության առաջին խումբն է, ապա երկրորդը՝ ամենաթեթևը՝ երրորդը։

Տան համարները չափվում են նաև հերթական սանդղակով. դրանք ցույց են տալիս, թե ինչ հերթականությամբ են տները գտնվում փողոցի երկայնքով: Գրողի հավաքած ստեղծագործություններում ծավալային համարները կամ ձեռնարկության արխիվում գործի համարները սովորաբար կապված են դրանց ստեղծման ժամանակագրական կարգի հետ:

Ապրանքների և ծառայությունների որակը գնահատելիս շարքային կշեռքները տարածված են, այսպես կոչված, որակաչափության մեջ (բառացի թարգմանություն - որակի չափում): Մասնավորապես, արտադրության միավորը գնահատվում է անցանելի կամ ոչ պիտանի։ Ավելի մանրակրկիտ վերլուծության համար օգտագործվում է երեք աստիճանավորում ունեցող սանդղակ. կան էական թերություններ - կան միայն աննշան թերություններ - չկան թերություններ: Երբեմն օգտագործվում են չորս աստիճանավորումներ. կան կրիտիկական թերություններ (հնարավոր չէ օգտագործել) - կան էական թերություններ - կան միայն աննշան թերություններ - չկան թերություններ: Նմանատիպ նշանակություն ունի ապրանքների դասակարգումը` պրեմիում, առաջին կարգ, երկրորդ կարգ,...

Շրջակա միջավայրի վրա ազդեցությունները գնահատելիս առաջին, ամենաընդհանուր գնահատականը սովորաբար սովորական է, օրինակ՝ բնական միջավայրը կայուն է. բնական միջավայրը՝ ճնշված (դեգրադացված): Բնապահպանական-բժշկական սանդղակը նման է. մարդու առողջության վրա ընդգծված ազդեցություն չկա, նշվում է առողջության վրա բացասական ազդեցություն։

Հերթական սանդղակը կիրառվում է նաև այլ ոլորտներում։ Տնտեսագիտության մեջ դրանք հիմնականում փորձագիտական գնահատման տարբեր մեթոդներ են:

Բոլոր չափման սանդղակները բաժանվում են երկու խմբի՝ որակական բնութագրերի սանդղակներ և քանակական բնութագրերի սանդղակներ։ Հերթական սանդղակը և անվանման սանդղակը որակական հատկանիշների հիմնական սանդղակներն են, ուստի շատ կոնկրետ ոլորտներում որակական վերլուծության արդյունքները կարող են դիտվել որպես չափումներ այս սանդղակների վրա: Քանակական բնութագրերի սանդղակները միջակայքերի, հարաբերակցության, տարբերությունների, բացարձակ սանդղակներն են։ Օգտագործելով ինտերվալային սանդղակ՝ չափվում է պոտենցիալ էներգիայի մեծությունը կամ ուղիղ գծի կետի կոորդինատը։ Այս դեպքերում սանդղակի վրա չեն կարող նշվել ոչ բնական ծագումը, ոչ էլ բնական չափման միավորը: Հետազոտողը պետք է սահմանի ելակետը և ինքն ընտրի չափման միավորը: Ընդունելի փոխակերպումները միջակայքի սանդղակում գծային աճող փոխակերպումներ են, այսինքն. գծային ֆունկցիաներ. Ցելսիուսի և Ֆարենհեյթի ջերմաստիճանի սանդղակները կապված են հենց այս կախվածությամբ՝ °C = 5/9 (°F - 32), որտեղ °C ջերմաստիճանն է (աստիճաններով) Ցելսիուսի սանդղակի վրա, իսկ °F-ը Ֆարենհեյթի ջերմաստիճանն է։ սանդղակ.

Քանակական սանդղակներից գիտության և պրակտիկայում ամենատարածվածը հարաբերակցության սանդղակներն են: Նրանք ունեն բնական հղման կետ՝ զրո, այսինքն. քանակի բացակայություն, բայց ոչ բնական չափման միավոր: Ֆիզիկական միավորների մեծ մասը չափվում է հարաբերակցության սանդղակով՝ մարմնի զանգվածը, երկարությունը, լիցքը, ինչպես նաև տնտեսության գները: Հարաբերակցության սանդղակի ընդունելի փոխակերպումները նման են (փոխելով միայն սանդղակը): Այլ կերպ ասած՝ գծային աճող փոխակերպումներ՝ առանց ազատ ժամկետի, օրինակ՝ գների փոխարկումը մեկ արժույթից մյուսը ֆիքսված փոխարժեքով։ Ենթադրենք, մենք համեմատում ենք երկու ներդրումային նախագծերի տնտեսական արդյունավետությունը՝ օգտագործելով գները ռուբլով: Թող առաջին նախագիծը երկրորդից լավը ստացվի։ Այժմ եկեք անցնենք չինական արժույթին՝ յուանին՝ օգտագործելով ֆիքսված փոխարժեքը։ Ակնհայտ է, որ առաջին նախագիծը կրկին պետք է ավելի շահավետ լինի, քան երկրորդը։ Այնուամենայնիվ, հաշվարկային ալգորիթմները ավտոմատ կերպով չեն ապահովում այս պայմանի կատարումը, և անհրաժեշտ է ստուգել, որ այն բավարարված է: Միջին արժեքների նման թեստի արդյունքները նկարագրված են ստորև:

Տարբերության սանդղակը ունի բնական չափման միավոր, բայց չունի բնական հղման կետ: Ժամանակը չափվում է տարբերությունների սանդղակով, եթե տարին (կամ օրը՝ կեսօրից մինչև կեսօր) ընդունվում է որպես բնական չափման միավոր, և ընդմիջումների սանդղակով։ ընդհանուր դեպք. Գիտելիքների ներկա մակարդակում անհնար է նշել բնական ելակետ: Տարբեր հեղինակներ տարբեր կերպ են հաշվարկում աշխարհի ստեղծման տարեթիվը, ինչպես նաև Քրիստոսի Ծննդյան պահը։

Միայն բացարձակ սանդղակի համար չափման արդյունքները թվեր են բառի սովորական իմաստով, օրինակ՝ սենյակում գտնվող մարդկանց թիվը: Բացարձակ մասշտաբի համար թույլատրվում է միայն ինքնության վերափոխում:

Համապատասխան գիտելիքի ոլորտի զարգացման գործընթացում սանդղակի տեսակը կարող է փոխվել։ Այսպիսով, սկզբում ջերմաստիճանը չափվում էր սովորական սանդղակով (ավելի սառը - ավելի տաք): Այնուհետև՝ ըստ ինտերվալի (Ցելսիուսի, Ֆարենհայթի, Ռոմուրի սանդղակներ): Վերջապես, բացարձակ զրոյի հայտնաբերումից հետո ջերմաստիճանը կարելի է համարել չափված հարաբերակցության սանդղակով (Քելվինի սանդղակ): Հարկ է նշել, որ երբեմն մասնագետների միջև տարաձայնություններ են առաջանում այն հարցում, թե որ սանդղակներով պետք է հաշվի առնել որոշակի իրական արժեքներ չափված: Այլ կերպ ասած, չափման գործընթացը ներառում է նաև սանդղակի տեսակի որոշումը (կշեռքի որոշակի տեսակի ընտրության հիմնավորման հետ մեկտեղ): Բացի թվարկված կշեռքների վեց հիմնական տեսակներից, երբեմն օգտագործվում են նաև այլ կշեռքներ:

17. Անփոփոխ ալգորիթմներ և միջին արժեքներ:

Եկեք ձևակերպենք ՏՏ-ում տվյալների վերլուծության ալգորիթմների հիմնական պահանջը. որոշակի տեսակի սանդղակի վրա չափված տվյալների հիման վրա արված եզրակացությունները չպետք է փոխվեն, երբ այդ տվյալների չափման սանդղակը թույլատրելի է: Այլ կերպ ասած, եզրակացությունները պետք է լինեն անփոփոխ սանդղակի վավերական փոխակերպումների դեպքում:

Այսպիսով, չափումների տեսության հիմնական նպատակներից մեկը իրական օբյեկտներին թվային արժեքներ նշանակելիս հետազոտողի սուբյեկտիվության դեմ պայքարելն է: Այսպիսով, հեռավորությունները կարող են չափվել արշիններով, մետրերով, միկրոններով, մղոններով, պարսեկներով և չափման այլ միավորներով: Զանգված (քաշ) - ֆունտներով, կիլոգրամներով, ֆունտներով և այլն: Ապրանքների և ծառայությունների գները կարող են նշված լինել յուանով, ռուբլով, տենգեով, գրիվնայով, լատով, կրոնով, մարկերով, ԱՄՆ դոլարով և այլ արժույթներով (ենթարկվում են փոխարկման սահմանված փոխարժեքների): Ընդգծենք մի շատ կարևոր, թեև բավականին ակնհայտ փաստ՝ չափման միավորների ընտրությունը կախված է հետազոտողից, այսինքն. սուբյեկտիվ. Վիճակագրական եզրակացությունները կարող են համարժեք լինել իրականությանը միայն այն դեպքում, երբ դրանք կախված չեն հետազոտողի նախընտրած չափման միավորից, երբ դրանք անփոփոխ են սանդղակի թույլատրելի փոխակերպման առումով: Էկոնոմետրիկ տվյալների վերլուծության բազմաթիվ ալգորիթմներից միայն մի քանիսն են բավարարում այս պայմանը: Եկեք դա ցույց տանք՝ համեմատելով միջին արժեքները։

Թող X 1, X 2,..., X n լինի n ծավալի նմուշ: Հաճախ օգտագործվում է միջին թվաբանականը: Թվաբանական միջինի օգտագործումն այնքան տարածված է, որ տերմինի երկրորդ բառը հաճախ բաց է թողնվում, և մարդիկ խոսում են միջին աշխատավարձի, միջին եկամուտի և այլ միջինների մասին կոնկրետ տնտեսական տվյալների համար, ինչը նշանակում է «միջին» թվաբանական միջինը: Այս ավանդույթը կարող է հանգեցնել սխալ եզրակացությունների։ Սա ցույց տանք՝ օգտագործելով հիպոթետիկ ձեռնարկության աշխատողների միջին աշխատավարձը (միջին եկամուտը) հաշվարկելու օրինակը։ 100 աշխատողներից միայն 5-ն ունի այն գերազանցող աշխատավարձ, իսկ մնացած 95-ի աշխատավարձը զգալիորեն ցածր է միջին թվաբանականից։ Պատճառն ակնհայտ է՝ մեկ անձի՝ գլխավոր տնօրենի աշխատավարձը գերազանցում է 95 աշխատողի՝ ցածր որակավորում ունեցող և բարձր որակավորում ունեցող աշխատողների, ինժեներների և գրասենյակային աշխատողների աշխատավարձը։ Իրավիճակը հիշեցնում է այն, ինչ նկարագրված է հիվանդանոցի մասին հայտնի պատմության մեջ, որտեղ կա 10 հիվանդ, որոնցից 9-ի ջերմաստիճանը 40°C է, իսկ մեկը արդեն տուժել է՝ պառկած դիահերձարանում 0° ջերմաստիճանով։ Գ. Մինչդեռ հիվանդանոցում միջին ջերմաստիճանը 36°C է, ավելի լավ չէր կարող լինել:

Այսպիսով, միջին թվաբանականը կարող է օգտագործվել միայն բավականին միատարր պոպուլյացիաների համար (առանց այս կամ այն ուղղությամբ մեծ արտանետումների): Ի՞նչ միջին ցուցանիշներ պետք է օգտագործվեն աշխատավարձը նկարագրելու համար: Միանգամայն բնական է օգտագործել մեդիանը՝ 50-րդ և 51-րդ աշխատողների միջին թվաբանականը, եթե նրանց. աշխատավարձերըդասավորված ոչ նվազման կարգով. Սկզբում գալիս են 40 ցածր որակավորում ունեցող աշխատողների աշխատավարձերը, իսկ հետո՝ 41-ից 70-րդը՝ բարձր որակավորում ունեցող աշխատողների աշխատավարձերը։ Հետևաբար, մեդիանն ընկնում է հենց նրանց վրա և հավասար է 200-ի: 50 աշխատողների համար աշխատավարձը չի գերազանցում 200-ը, իսկ 50-ի համար՝ առնվազն 200-ը, ուստի միջինը ցույց է տալիս այն «կենտրոնը», որի շուրջ ուսումնասիրված արժեքների մեծ մասը խմբավորված են. Մեկ այլ միջին արժեք է ռեժիմը, ամենահաճախ հանդիպող արժեքը: Քննարկվող դեպքում դրանք ցածր որակավորում ունեցող աշխատողների աշխատավարձերն են, այսինքն. 100. Այսպիսով, աշխատավարձը նկարագրելու համար մենք ունենք երեք միջին արժեք՝ ռեժիմը (100 միավոր), միջինը (200 միավոր) և միջին թվաբանականը (400 միավոր):

Իրական կյանքում դիտարկվող եկամտի և աշխատավարձի բաշխման դեպքում նույն օրինաչափությունը ճիշտ է. ռեժիմը միջինից փոքր է, իսկ միջինը միջին թվաբանականից փոքր է:

Ինչու են միջինները օգտագործվում տնտեսագիտության մեջ: Սովորաբար թվերի հավաքածուն փոխարինել մեկ թվով, որպեսզի համեմատենք պոպուլյացիաները՝ օգտագործելով միջինները: Թող, օրինակ, Y 1, Y 2,..., Y n լինի փորձագիտական գնահատականների մի շարք, որոնք «տրված են» փորձաքննության մեկ օբյեկտին (օրինակ, ընկերության ռազմավարական զարգացման տարբերակներից մեկը), Z 1. , Z 2,..., Z n -երկրորդը (այս մշակման մեկ այլ տարբերակ): Ինչպե՞ս են այս պոպուլյացիաները համեմատվում: Ակնհայտ է, որ ամենահեշտ ճանապարհը միջին արժեքներով է:

Ինչպե՞ս հաշվարկել միջին ցուցանիշները: Հայտնի է տարբեր տեսակներմիջին արժեքներ՝ միջին թվաբանական, միջին, եղանակ, երկրաչափական միջին, ներդաշնակ միջին, քառակուսի միջին։ Հիշեցնենք, որ ընդհանուր հայեցակարգմիջին արժեքը ներմուծել է 19-րդ դարի առաջին կեսի ֆրանսիացի մաթեմատիկոսը։ Ակադեմիկոս Օ.Կոշի. Այն հետևյալն է. միջին արժեքը ցանկացած Ֆ(Х 1, Х 2,..., Х n) ֆունկցիան է այնպես, որ բոլորի համար հնարավոր արժեքներփաստարկներ, այս ֆունկցիայի արժեքը ոչ պակաս է X 1, X 2,..., X n թվերի նվազագույնից և ոչ ավելի, քան այդ թվերի առավելագույնը: Վերը թվարկված միջինների բոլոր տեսակները Կոշիի միջին ցուցանիշներն են:

Ընդունելի սանդղակի փոխակերպմամբ միջինի արժեքը ակնհայտորեն փոխվում է։ Բայց եզրակացությունները, թե որ բնակչության համար է միջինն ավելի մեծ, իսկ որում՝ ավելի քիչ, չպետք է փոխվեն (համաձայն Եզրակացությունների անփոփոխության պահանջի, որն ընդունված է որպես հիմնական պահանջ ԹԻ-ում): Ձևակերպենք միջին արժեքների տեսակի որոնման համապատասխան մաթեմատիկական խնդիրը, որի համեմատության արդյունքը կայուն է թույլատրելի մասշտաբների փոխակերպումների նկատմամբ։

Թող Ф(Х 1 Х 2 ,..., Х n) լինի Քոշիի միջինը։ Թող առաջին բնակչության միջինը փոքր լինի երկրորդ պոպուլյացիայի միջինից. այնուհետև, ըստ TI-ի, միջինների համեմատման արդյունքի կայունության համար անհրաժեշտ է, որ ցանկացած թույլատրելի փոխակերպման համար g թույլատրելի փոխակերպումների խմբից: համապատասխան սանդղակը, ճիշտ է, որ առաջին պոպուլյացիայից փոխակերպված արժեքների միջինը նույնպես փոքր է երկրորդ հավաքածուի փոխակերպված արժեքների միջինից: Ավելին, ձևակերպված պայմանը պետք է ճշմարիտ լինի Y 1, Y 2,...,Y n և Z 1, Z 2,..., Z n և, հիշեցնենք, ցանկացած թույլատրելի փոխակերպման համար: Մենք թույլատրելի ենք անվանում միջին արժեքները, որոնք բավարարում են ձևակերպված պայմանը (համապատասխան մասշտաբով): Ըստ ԹԻ-ի, միայն նման միջինները կարող են օգտագործվել փորձագիտական կարծիքները և դիտարկվող սանդղակով չափված այլ տվյալներ վերլուծելիս:

Օգտագործելով մաթեմատիկական տեսություն, որը մշակվել է 1970-ականներին, կարողանում է նկարագրել ընդունելի միջինների տեսակը հիմնական սանդղակով։ Հասկանալի է, որ անունների սանդղակով չափված տվյալների համար միայն ռեժիմը հարմար է որպես միջին:

18. Միջին արժեքները հերթական սանդղակով

Դիտարկենք հերթական սանդղակով չափված փորձագիտական եզրակացությունների մշակումը։ Հետևյալ պնդումը ճիշտ է.

Թեորեմ1 . Կոշիի բոլոր միջիններից միակ ընդունելի միջինները հերթական սանդղակում տերմիններն են տատանումների շարք(սովորական վիճակագրություն):

Թեորեմ 1-ը վավեր է, պայմանով, որ միջին Ф(Х 1 Х 2 ,..., Х n) շարունակական (փոփոխականների բազմության վրա) և սիմետրիկ ֆունկցիա է։ Վերջինս նշանակում է, որ երբ արգումենտները վերադասավորվում են, Ф(Х 1 Х 2 ,..., Х n) ֆունկցիայի արժեքը չի փոխվում։ Այս պայմանը միանգամայն բնական է, քանի որ մենք գտնում ենք միջին արժեքը ամբողջության (բազմության), այլ ոչ թե հաջորդականության համար։ Հավաքածուն չի փոխվում՝ կախված այն հաջորդականությունից, որով մենք թվարկում ենք դրա տարրերը։

Համաձայն թեորեմ 1-ի, մասնավորապես, միջինը կարող է օգտագործվել որպես միջին սանդղակով չափված տվյալների համար (եթե ընտրանքի չափը կենտ է): Եթե ծավալը հավասար է, ապա պետք է օգտագործվի տատանումների շարքի երկու կենտրոնական տերմիններից մեկը՝ ինչպես դրանք երբեմն անվանում են՝ ձախ միջին կամ աջ մեդիան: Նորաձևությունը կարող է օգտագործվել նաև՝ այն միշտ էլ վարիացիոն շարքի անդամ է: Բայց երբեք չես կարող հաշվարկել միջին թվաբանականը, երկրաչափական միջինը և այլն:

Հետևյալ թեորեմը ճիշտ է.

Թեորեմ 2. Թող Y 1, Y 2,...,Y m լինեն անկախ նույնականորեն բաշխված պատահական փոփոխականներ F(x) բաշխման ֆունկցիայով, իսկ Z 1, Z 2,..., Zn լինեն անկախ նույնական բաշխված պատահական փոփոխականներ ֆունկցիաների բաշխումներով: H(x), իսկ Y 1, Y 2,...,Y m և Z 1, Z 2,..., Z n նմուշները միմյանցից անկախ են և MY X > MZ X: Որպեսզի իրադարձության հավանականությունը հակվի 1-ին min(m, n) ցանկացած խիստ աճող շարունակական ֆունկցիայի համար, որը բավարարում է |g i |>X պայմանը, անհրաժեշտ է և բավարար, որ F(x) անհավասարությունը բավարարվի բոլորի համար: x< Н(х), причем существовало число х 0 , для которого F(x 0)

Նշում.Վերին սահմանով պայմանը զուտ ներմաթեմատիկական է։ Փաստորեն, g ֆունկցիան կամայական թույլատրելի փոխակերպում է հերթական սանդղակով։

Համաձայն 2-րդ թեորեմի՝ թվաբանական միջինը կարող է օգտագործվել նաև հերթական մասշտաբով, եթե համեմատվում են թեորեմում տրված անհավասարությանը բավարարող երկու բաշխման նմուշներ։ Պարզ ասած, բաշխման գործառույթներից մեկը միշտ պետք է ընկած լինի մյուսից վեր: Բաշխման գործառույթները չեն կարող հատվել, նրանց թույլատրվում է միայն դիպչել միմյանց: Այս պայմանը բավարարվում է, օրինակ, եթե բաշխման գործառույթները տարբերվում են միայն հերթափոխով.

F(x) = Н(x + ∆)

որոշ ∆.

Վերջին պայմանը բավարարվում է, եթե միևնույն չափիչ գործիքի միջոցով չափվում են որոշակի քանակի երկու արժեք, որոնցում սխալների բաշխումը չի փոխվում խնդրո առարկա քանակի մի արժեքից մյուսը չափելիս:

Միջին ըստ Կոլմոգորովի

Վերը թվարկված մի քանի միջինների ընդհանրացումն է Կոլմոգորովի միջինը: X 1, X 2,..., X n թվերի համար Կոլմոգորովի միջինը հաշվարկվում է բանաձևով.

G((F(X l) + F(X 2)+...F(X n))/n),

որտեղ F-ը խիստ միատոն ֆունկցիա է (այսինքն՝ խիստ աճող կամ խիստ նվազող),

G-ն F-ի հակադարձ ֆունկցիան է:

Կոլմոգորովի միջին ցուցանիշների մեջ կան շատ հայտնի կերպարներ։ Այսպիսով, եթե F(x) = x, ապա Կոլմոգորովի միջինը թվաբանական միջինն է, եթե F(x) = lnx, ապա երկրաչափական միջինը, եթե F(x) = 1/x, ապա հարմոնիկ միջինը, եթե F( x) = x 2, ապա միջին քառակուսին և այլն: Կոլմոգորովի միջինը Կոշիի միջինի հատուկ դեպքն է։ Մյուս կողմից, այնպիսի հանրաճանաչ միջինները, ինչպիսիք են միջինը և ռեժիմը, չեն կարող ներկայացվել որպես Կոլմոգորովի միջին ցուցանիշներ: Մենագրության մեջ ապացուցված են հետևյալ պնդումները.

Թեորեմ3 . Եթե ինտերվալային սանդղակում օրինաչափության որոշակի ներմաթեմատիկական պայմաններ վավեր են, Կոլմոգորովի բոլոր միջոցներից թույլատրելի է միայն թվաբանական միջինը։ Այսպիսով, ջերմաստիճանների (Ցելսիուսով) կամ հեռավորությունների երկրաչափական միջինը կամ արմատային միջին քառակուսին անիմաստ են: Որպես միջին պետք է օգտագործվի միջին թվաբանականը: Կարող եք նաև օգտագործել միջինը կամ ռեժիմը:

Թեորեմ 4. Եթե գործակիցների սանդղակի օրինաչափության որոշակի ներմաթեմատիկական պայմանները վավեր են, ապա Կոլմոգորովի բոլոր միջիններից թույլատրելի են միայն ուժային միջինները F(x) = x c-ով և երկրաչափական միջիններով:

Մեկնաբանություն. Երկրաչափական միջինը c > 0-ի համար հզորության միջոցների սահմանն է:

Կա՞ն Կոլմոգորովի միջին ցուցանիշներ, որոնք չեն կարող օգտագործվել հարաբերակցության սանդղակի մեջ: Իհարկե ունեն: Օրինակ F(x) = e x.

Միջին արժեքների նման, կարելի է ուսումնասիրել այլ վիճակագրական բնութագրեր՝ ցրման, կապի, հեռավորության ցուցանիշներ և այլն։ Դժվար չէ ցույց տալ, օրինակ, որ հարաբերակցության գործակիցը չի փոխվում որևէ թույլատրելի փոխակերպմամբ մեկ ամանի միջակայքում, ճիշտ ինչպես դիսպերսիաների հարաբերակցությունը, դիսպերսիան չի փոխվում տարբերությունների մասշտաբով, տատանումների գործակիցը. գործակիցների սանդղակը և այլն:

Վերոնշյալ արդյունքները միջին արժեքների վրա լայնորեն օգտագործվում են ոչ միայն տնտեսագիտության, կառավարման, փորձագիտական գնահատումների տեսության կամ սոցիոլոգիայի, այլև ճարտարագիտության մեջ, օրինակ՝ պայթուցիկ վառարանների ավտոմատացված գործընթացների կառավարման համակարգերում սենսորների ագրեգացման մեթոդները վերլուծելու համար: ԹԻ-ն մեծ գործնական նշանակություն ունի ստանդարտացման և որակի կառավարման խնդիրներում, մասնավորապես որակաչափության մեջ, որտեղ ստացվել են հետաքրքիր տեսական արդյունքներ: Այսպիսով, օրինակ, արտադրանքի որակի առանձին ցուցանիշների քաշային գործակիցների ցանկացած փոփոխություն հանգեցնում է ապրանքների պատվերի փոփոխության՝ ըստ միջին կշռված ցուցանիշի (այս թեորեմն ապացուցվել է պրոֆ. Վ.Վ. Պոդինովսկու կողմից): Հետևաբար, ԹԻ-ի և դրա մեթոդների մասին վերը նշված հակիրճ տեղեկատվությունը, ինչ-որ իմաստով, համատեղում է տնտեսագիտությունը, սոցիոլոգիան և ճարտարագիտական գիտությունները և համարժեք ապարատ է բարդ խնդիրների լուծման համար, որոնք նախկինում ենթակա չէին արդյունավետ վերլուծության, ավելին, այսպիսով. ճանապարհ է բացվում իրատեսական մոդելներ կառուցելու և կանխատեսումների խնդրի լուծման համար։

22. Զույգ գծային ռեգրեսիա

Այժմ անդրադառնանք զույգ գծային ռեգրեսիայի ամենապարզ դեպքի ավելի մանրամասն ուսումնասիրությանը: Գծային ռեգրեսիան նկարագրվում է ամենապարզ ֆունկցիոնալ հարաբերություններով ուղիղ գծի հավասարման տեսքով և բնութագրվում է մոդելի պարամետրերի թափանցիկ մեկնաբանությամբ (հավասարման գործակիցներ): Հավասարման աջ կողմը թույլ է տալիս մեզ ստանալ ստացված (բացատրված) փոփոխականի տեսական (հաշվարկված) արժեքները՝ հիմնվելով ռեգրեսորի (բացատրական փոփոխականի) տվյալ արժեքների վրա: Այս արժեքները երբեմն կոչվում են նաև կանխատեսված (նույն իմաստով), այսինքն. ստացված տեսական բանաձևերից։ Այնուամենայնիվ, կախվածության բնույթի մասին վարկած առաջ քաշելիս, հավասարման գործակիցները դեռ մնում են անհայտ։ Ընդհանուր առմամբ, այս գործակիցների մոտավոր արժեքների ստացումը հնարավոր է տարբեր մեթոդների միջոցով:

Բայց դրանցից ամենակարեւորն ու տարածվածը մեթոդն է նվազագույն քառակուսիները(MNC): Այն հիմնված է (ինչպես արդեն բացատրվել է) պահանջի վրա՝ նվազագույնի հասցնել ստացված բնութագրիչի իրական արժեքների քառակուսի շեղումների գումարը հաշվարկված (տեսական) արժեքներից: Տեսական արժեքների փոխարեն (դրանք ստանալու համար), ռեգրեսիոն հավասարման աջ կողմերը փոխարինեք քառակուսի շեղումների գումարով, այնուհետև գտեք այս ֆունկցիայի մասնակի ածանցյալները (փաստացի արժեքների քառակուսի շեղումների գումարը): ստացված բնութագրերից տեսականից): Այս մասնակի ածանցյալները վերցված են ոչ թե x և y փոփոխականների, այլ a և b պարամետրերի նկատմամբ։ Մասնակի ածանցյալները հավասարվում են զրոյի և պարզ, բայց ծանր փոխակերպումներից հետո ստացվում է նորմալ հավասարումների համակարգ՝ պարամետրերը որոշելու համար։ x փոփոխականի գործակիցը, այսինքն. b-ն կոչվում է ռեգրեսիայի գործակից, այն ցույց է տալիս արդյունքի միջին փոփոխությունը գործակցի մեկ միավորով փոփոխությամբ։ a պարամետրը կարող է չունենալ տնտեսական մեկնաբանություն, հատկապես, եթե այս գործակցի նշանը բացասական է։

Սպառման ֆունկցիան ուսումնասիրելու համար օգտագործվում է զույգ գծային ռեգրեսիա: Բազմապատկիչը հաշվարկելու համար օգտագործվում է սպառման ֆունկցիայի ռեգրեսիայի գործակիցը: Գրեթե միշտ ռեգրեսիայի հավասարումը լրացվում է կապի սերտության ցուցիչով։ Գծային ռեգրեսիայի ամենապարզ դեպքի համար կապի սերտության այս ցուցանիշն է գծային գործակիցհարաբերակցությունները. Բայց քանի որ գծային հարաբերակցության գործակիցը բնութագրում է հատկանիշների միջև հարաբերությունների սերտությունը գծային ձևով, գծային հարաբերակցության գործակցի բացարձակ արժեքի մոտությունը զրոյին դեռևս չի ծառայում որպես հատկանիշների միջև կապի բացակայության ցուցիչ:

Մոդելի ճշգրտման տարբեր ընտրությամբ և, հետևաբար, կախվածության տեսակից է, որ իրական հարաբերությունները կարող են բավականին մոտ լինել միասնությանը: Բայց ընտրության որակը գծային ֆունկցիաորոշվում է օգտագործելով գծային հարաբերակցության գործակցի քառակուսին` որոշման գործակիցը: Այն բնութագրում է արդյունավետ հատկանիշի y շեղումների մասնաբաժինը, որը բացատրվում է ռեգրեսիայով, արդյունավետ հատկանիշի ընդհանուր շեղումների մեջ: Արժեքը, որը լրացնում է որոշման գործակիցը 1-ին, բնութագրում է դիսպերսիայի մասնաբաժինը, որն առաջացել է մոդելում հաշվի չառնված այլ գործոնների ազդեցությամբ (մնացորդային շեղում):

Զույգ ռեգրեսիան ներկայացված է հետևյալ ձևի y և x երկու փոփոխականներին առնչվող հավասարմամբ.

որտեղ y-ը կախված փոփոխականն է (արդյունավետ հատկանիշ), իսկ x-ը անկախ փոփոխականն է (բացատրական փոփոխական կամ հատկանիշ-գործոն): Տարբերում են գծային ռեգրեսիա և ոչ գծային ռեգրեսիա։ Գծային ռեգրեսիան նկարագրվում է ձևի հավասարմամբ.

y = a+ bx + .

Ոչ գծային ռեգրեսիան, իր հերթին, կարող է լինել ոչ գծային՝ վերլուծության մեջ ներառված բացատրական փոփոխականների նկատմամբ, բայց գծային՝ գնահատված պարամետրերի նկատմամբ: Կամ գուցե ռեգրեսիան գնահատվող պարամետրերի առումով ոչ գծային է: Ռեգրեսիայի օրինակները, որոնք ոչ գծային են բացատրական փոփոխականներում, բայց գծային՝ գնահատված պարամետրերով, ներառում են տարբեր աստիճանի բազմանդամային կախվածություններ (բազմանդամներ) և հավասարակողմ հիպերբոլա։

Գնահատված պարամետրերի համար ոչ գծային ռեգրեսիան հզորության կախվածությունն է պարամետրին (պարամետրը ցուցիչում է), էքսպոնենցիալ կախվածություն, որտեղ պարամետրը գտնվում է ցուցանիշի հիմքում և էքսպոնենցիալ կախվածություն, երբ ամբողջ գծային կախվածությունն ամբողջությամբ է։ ցուցիչում։ Նկատի ունեցեք, որ այս բոլոր երեք դեպքերում պատահական բաղադրիչը (պատահական մնացորդը)  ներառված է աջ կողմհավասարումներ գործոնի տեսքով, և ոչ թե գումարելիի տեսքով, այսինքն. բազմապատկելով! Ստացված բնութագրիչի հաշվարկված արժեքների միջին շեղումը իրականից բնութագրվում է մոտարկման միջին սխալով: Այն արտահայտվում է տոկոսով և չպետք է գերազանցի 7-8%-ը։ Մոտավորության այս միջին սխալը պարզապես իրական և հաշվարկված արժեքների միջև եղած տարբերությունների հարաբերական մեծությունների տոկոսային միջինն է:

Կարևոր է առաձգականության միջին գործակիցը, որը հանդիսանում է բազմաթիվ տնտեսական երևույթների և գործընթացների կարևոր բնութագիր։ Այն հաշվարկվում է որպես տվյալ ֆունկցիոնալ հարաբերությունների ածանցյալի արժեքի և x-ի միջին արժեքի և y-ի միջին արժեքի հարաբերակցության արդյունք: Էլաստիկության գործակիցը ցույց է տալիս, թե միջինում քանի տոկոսով կփոխվի y արդյունքը իր միջին արժեքից, երբ x գործակիցը փոխվի իր (գործոն x) միջին արժեքից 1%-ով։

Վարիանսների վերլուծության խնդիրները սերտորեն կապված են զույգ ռեգրեսիայի և բազմակի ռեգրեսիայի (երբ կան բազմաթիվ գործոններ) և մնացորդային դիսպերսիայի հետ։ Տարբերության վերլուծությունուսումնասիրում է կախյալ փոփոխականի շեղումը. Այս դեպքում քառակուսի շեղումների ընդհանուր գումարը բաժանվում է երկու մասի. Առաջին անդամը ռեգրեսիայի հետևանքով առաջացած քառակուսի շեղումների գումարն է կամ բացատրված (գործոնային): Երկրորդ անդամը քառակուսի շեղումների մնացորդային գումարն է, որը չի բացատրվում գործոնային ռեգրեսիայի միջոցով:

Հետընթացով բացատրված շեղումների մասնաբաժինը ստացված y բնութագրիչի ընդհանուր շեղման մեջ բնութագրվում է որոշման գործակցով (ինդեքսով), որը ոչ այլ ինչ է, քան ռեգրեսիայի հետևանքով առաջացած քառակուսի շեղումների գումարի հարաբերակցությունը քառակուսի շեղումների ընդհանուր գումարին։ (առաջին կիսամյակը ամբողջ գումարի նկատմամբ):

Երբ մոդելի պարամետրերը (անհայտների գործակիցները) որոշվում են նվազագույն քառակուսիների մեթոդով, ապա, ըստ էության, հայտնաբերվում են որոշ պատահական փոփոխականներ (գնահատումներ ստանալու գործընթացում): Հատկապես կարևոր է ռեգրեսիայի գործակիցի գնահատումը, որը պատահական փոփոխականի որևէ հատուկ ձև է: Այս պատահական փոփոխականի հատկությունները կախված են հավասարման մեջ (մոդելում) մնացորդային անդամի հատկություններից։ Զուգակցված գծային ռեգրեսիայի մոդելի համար դիտարկեք x բացատրական փոփոխականը որպես ոչ պատահական էկզոգեն փոփոխական։ Սա պարզապես նշանակում է, որ x փոփոխականի արժեքները բոլոր դիտարկումներում կարելի է համարել կանխորոշված և ոչ մի կերպ կապված ուսումնասիրվող կախվածության հետ: Այսպիսով, բացատրված փոփոխականի իրական արժեքը բաղկացած է երկու բաղադրիչից՝ ոչ պատահական և պատահական բաղադրիչ (մնացորդային տերմին):

Մյուս կողմից, նվազագույն քառակուսիների մեթոդով (OLS) որոշված ռեգրեսիայի գործակիցը հավասար է x և y փոփոխականների կովարիանսը x փոփոխականի շեղման վրա բաժանելու գործակիցին։ Հետևաբար այն պարունակում է նաև պատահական բաղադրիչ: Ի վերջո, կովարիանսը կախված է y փոփոխականի արժեքներից, որտեղ y փոփոխականի արժեքները կախված են  պատահական մնացորդային տերմինի արժեքներից: Ավելին, հեշտ է ցույց տալ, որ x և y փոփոխականների կովարիանսը հավասար է գնահատված ռեգրեսիոն գործակցի բետա () և x փոփոխականի շեղման արտադրյալին, գումարած x և  փոփոխականների կովարիանսը: Այսպիսով, ռեգրեսիոն գործակցի բետա-ի գնահատումը հավասար է հենց այս անհայտ ռեգրեսիոն գործակցին, որը գումարվում է x և  փոփոխականների կովարիանսը x փոփոխականի շեղման վրա բաժանելու գործակցին։ Նրանք. Ցանկացած ընտրանքից ստացված ռեգրեսիայի b գործակցի գնահատումը ներկայացվում է որպես երկու անդամի գումար՝ հաստատուն արժեք, որը հավասար է  գործակցի իրական արժեքին (բետա), և պատահական բաղադրիչ՝ կախված x և  փոփոխականների կովարիանսից: .

23. Գաուս-Մարկովի մաթեմատիկական պայմանները և դրանց կիրառումը.

Որպեսզի սովորական OLS-ի վրա հիմնված ռեգրեսիոն վերլուծությունը տա լավագույն արդյունքները, պատահական տերմինը պետք է բավարարի Գաուս-Մարկովի չորս պայմանները:

Պատահական անդամի մաթեմատիկական ակնկալիքը հավասար է զրոյի, այսինքն. դա անաչառ է: Եթե ռեգրեսիոն հավասարումը ներառում է հաստատուն անդամ, ապա բնական է այս պահանջը կատարված համարել, քանի որ սա հաստատուն անդամ է և պետք է հաշվի առնի y փոփոխականի արժեքների ցանկացած համակարգված միտում, որը, ընդհակառակը, պետք է. չպարունակվեն ռեգրեսիայի հավասարման բացատրական փոփոխականներում:

Պատահական անդամի շեղումը հաստատուն է բոլոր դիտարկումների համար:

Արժեքների կովարիանս պատահական փոփոխականներ, նմուշը կազմելը պետք է հավասար լինի զրոյի, այսինքն. որևէ երկու կոնկրետ դիտարկումներում պատահական տերմինի արժեքների միջև համակարգված կապ չկա: Պատահական անդամները պետք է անկախ լինեն միմյանցից:

Պատահական տերմինի բաշխման օրենքը պետք է անկախ լինի բացատրական փոփոխականներից:

Ավելին, շատ կիրառություններում բացատրական փոփոխականները ստոխաստիկ չեն, այսինքն. պատահական բաղադրիչ չունեն: Յուրաքանչյուր դիտարկման մեջ ցանկացած անկախ փոփոխականի արժեքը պետք է համարվի էկզոգեն՝ ամբողջությամբ որոշված արտաքին պատճառներով, որոնք հաշվի չեն առնվել ռեգրեսիայի հավասարման մեջ:

Նշված Գաուս-Մարկովի պայմանների հետ միասին ենթադրվում է նաև, որ պատահական տերմինն ունի նորմալ բաշխում։ Այն վավեր է շատ լայն պայմաններում և հիմնված է այսպես կոչված կենտրոնական սահմանային թեորեմի (CLT) վրա։ Այս թեորեմի էությունն այն է, որ եթե պատահական փոփոխականը մեծ թվով այլ պատահական փոփոխականների փոխազդեցության ընդհանուր արդյունքն է, որոնցից և ոչ մեկը գերակշռող ազդեցություն չունի այս ընդհանուր արդյունքի վարքագծի վրա, ապա ստացված պատահական փոփոխականը նկարագրվելու է։ մոտավորապես նորմալ բաշխմամբ։ Այս մոտիկությունը նորմալ բաշխումթույլ է տալիս օգտագործել նորմալ բաշխումը գնահատումներ ստանալու համար և է որոշակի իմաստովդրա ընդհանրացումը ուսանողական բաշխումն է, որը նկատելիորեն տարբերվում է նորմալից հիմնականում այսպես կոչված «պոչերի» վրա, այսինքն. փոքր նմուշների համար: Կարևոր է նաև, որ եթե պատահական տերմինը նորմալ բաշխված է, ապա ռեգրեսիայի գործակիցները նույնպես նորմալ բաշխված կլինեն:

Սահմանված ռեգրեսիոն կորը (ռեգեսիոն հավասարումը) թույլ է տալիս լուծել այսպես կոչված կետային կանխատեսման խնդիրը։ Նման հաշվարկներում x-ի որոշակի արժեք վերցվում է ուսումնասիրված դիտարկման միջակայքից դուրս և փոխարինվում է ռեգրեսիայի հավասարման աջ կողմում (էքստրապոլացիայի ընթացակարգ): Որովհետեւ Արդեն հայտնի են ռեգրեսիայի գործակիցների գնահատականները, այնուհետև կարելի է հաշվարկել x-ի վերցված արժեքին համապատասխան բացատրված y փոփոխականի արժեքը։ Բնականաբար, կանխատեսման (կանխատեսման) իմաստին համապատասխան, հաշվարկներն իրականացվում են առաջ (դեպի ապագա արժեքների տարածաշրջան):

Սակայն քանի որ գործակիցները որոշվել են որոշակի սխալով, դա հետաքրքիր չէ միավորի գնահատում(կետերի կանխատեսում) արդյունավետ բնութագրի համար և այն սահմանների իմացությունը, որոնցում որոշակի հավանականությամբ կլինեն արդյունավետ բնութագրի արժեքները, որոնք համապատասխանում են x գործոնի վերցված արժեքին:

Դա անելու համար հաշվարկվում է ստանդարտ սխալը (ստանդարտ շեղումը): Այն կարելի է ձեռք բերել հենց նոր ասվածի ոգով հետևյալ կերպ. Ազատ տերմինի արտահայտությունը գնահատումներից միջին արժեքների միջոցով փոխարինվում է գծային ռեգրեսիայի հավասարման մեջ: Այնուհետև պարզվում է, որ ստանդարտ սխալը կախված է միջին արդյունավետ գործակցի y սխալից և հավելյալ՝ ռեգրեսիայի գործակցի սխալից: Պարզապես այս ստանդարտ սխալի քառակուսին գումարին հավասար y միջին արժեքի քառակուսի սխալը և ռեգրեսիայի գործակցի քառակուսի սխալի արտադրյալը x գործոնի արժեքի և նրա միջին արժեքի քառակուսի շեղումով։ Ավելին, առաջին անդամը, ըստ վիճակագրության օրենքների, հավասար է ընդհանուր բնակչության շեղումը ընտրանքի չափի (ծավալի) վրա բաժանելու գործակցին:

Անհայտ շեղման փոխարեն որպես գնահատում օգտագործվում է ընտրանքի շեղումը: Համապատասխանաբար, ռեգրեսիայի գործակցի սխալը սահմանվում է որպես ընտրանքային շեղումը x գործոնի շեղման վրա բաժանելու գործակից: Դուք կարող եք ստանալ ստանդարտ սխալ (ստանդարտ շեղում) և այլ նկատառումներ, որոնք ավելի անկախ են գծային ռեգրեսիայի մոդելից: Դա անելու համար օգտագործվում է միջին սխալի և սահմանային սխալի հայեցակարգը և նրանց միջև կապը:

Բայց նույնիսկ ստանդարտ սխալը ստանալուց հետո հարցը մնում է այն սահմանների մասին, որոնց սահմաններում կլինի կանխատեսված արժեքը: Այլ կերպ ասած, չափման սխալի միջակայքի մասին, բնական ենթադրության մեջ շատ դեպքերում, որ այս միջակայքի միջինը տրվում է y արդյունավետ գործոնի հաշվարկված (միջին) արժեքով։ Այստեղ օգնության է գալիս կենտրոնական սահմանային թեորեմը, որը հստակ ցույց է տալիս, թե ինչ հավանականությամբ է անհայտ մեծությունը գտնվում այս վստահության միջակայքում։

Ըստ էության, ստանդարտ սխալի բանաձևը, անկախ նրանից, թե ինչպես և ինչ ձևով է այն ստացվել, բնութագրում է ռեգրեսիոն գծի դիրքի սխալը։ Ստանդարտ սխալը հասնում է նվազագույնի, երբ x գործոնի արժեքը համընկնում է գործոնի միջին արժեքի հետ:

24. Հիպոթեզների վիճակագրական փորձարկում և գծային ռեգրեսիայի նշանակության գնահատում Ֆիշերի չափանիշով:

Գծային ռեգրեսիայի հավասարումը գտնելուց հետո գնահատվում է և՛ հավասարման՝ որպես ամբողջության, և՛ նրա առանձին պարամետրերի նշանակությունը: Ընդհանուր առմամբ ռեգրեսիոն հավասարման նշանակությունը գնահատելը կարող է իրականացվել տարբեր չափանիշների կիրառմամբ: Բավականին տարածված և արդյունավետ է Fisher's F թեստի օգտագործումը: Այս դեպքում առաջ է քաշվում զրոյական վարկած, որ ռեգրեսիայի գործակիցը հավասար է զրոյի, այսինքն. b=0, և, հետևաբար, x գործոնը չի ազդում y արդյունքի վրա: F-թեստի անմիջական հաշվարկին նախորդում է շեղումների վերլուծությունը: Դրանում կենտրոնական տեղը զբաղեցնում է y փոփոխականի քառակուսի շեղումների ընդհանուր գումարի տարրալուծումը y միջին արժեքից երկու մասի՝ «բացատրված» և «անբացատրելի».

Ստացված y բնութագրիչի անհատական արժեքների քառակուսի շեղումների ընդհանուր գումարը միջին y արժեքից պայմանավորված է բազմաթիվ գործոնների ազդեցությամբ:

Պատճառների ամբողջությունը պայմանականորեն բաժանենք երկու խմբի՝ ուսումնասիրված x գործոն և այլ գործոններ։ Եթե գործակիցը չի ազդում արդյունքի վրա, ապա գրաֆիկի վրա ռեգրեսիոն գիծը զուգահեռ է OX և y=y առանցքին: Այնուհետև ստացված բնութագրի ողջ շեղումը պայմանավորված է այլ գործոնների ազդեցությամբ, և քառակուսի շեղումների ընդհանուր գումարը կհամընկնի մնացորդի հետ: Եթե այլ գործոններ չեն ազդում արդյունքի վրա, ապա y-ն ֆունկցիոնալորեն կապված է x-ի հետ, իսկ քառակուսիների մնացորդային գումարը զրո է: Այս դեպքում ռեգրեսիայով բացատրվող քառակուսի շեղումների գումարը համընկնում է ընդհանուր գումարըքառակուսիներ. Քանի որ հարաբերակցության դաշտի ոչ բոլոր կետերն են գտնվում ռեգրեսիոն գծի վրա, դրանց ցրումը միշտ տեղի է ունենում x գործոնի ազդեցությամբ, այսինքն. y-ի ռեգրեսիա x-ի վրա և առաջացած այլ պատճառներով (անբացատրելի տատանումներ): Կանխատեսման համար ռեգրեսիոն գծի համապատասխանությունը կախված է նրանից, թե y հատկանիշի ընդհանուր տատանումների որքան մասն է հաշվառվում բացատրված փոփոխությամբ:

Ակնհայտ է, որ եթե ռեգրեսիայի պատճառով քառակուսի շեղումների գումարն ավելի մեծ է, քան քառակուսիների մնացորդային գումարը, ապա ռեգրեսիոն հավասարումը վիճակագրորեն նշանակալի է, և x գործոնը էական ազդեցություն ունի արդյունքի վրա: Սա համարժեք է նրան, որ որոշման գործակիցը կմոտենա միասնությանը։ Քառակուսի շեղումների ցանկացած գումար կապված է ազատության աստիճանների թվի հետ, այսինքն. հատկանիշի անկախ փոփոխության ազատության թիվը: Ազատության աստիճանների թիվը կապված է բնակչության միավորների քանակի կամ դրանից որոշվող հաստատունների թվի հետ։ Ուսումնասիրվող խնդրի հետ կապված՝ ազատության աստիճանների թիվը պետք է ցույց տա, թե որքան անկախ շեղումներ են պահանջվում n-ից հնարավոր [(y 1 -y), (y 2 -y),...(y n -y)]: քառակուսիների տրված գումար կազմելու համար: Այսպիսով, ∑(y-y sr) քառակուսիների ընդհանուր գումարի համար պահանջվում է 2, (n-1) անկախ շեղումներ, քանի որ. n միավորի պոպուլյացիայի դեպքում, միջին մակարդակը հաշվարկելուց հետո, միայն (n-1) շեղումների թիվը ազատորեն տատանվում է: ∑(y-y միջին) 2 քառակուսիների բացատրված կամ գործակցային գումարը հաշվարկելիս օգտագործվում են արդյունքային բնութագրի y* տեսական (հաշվարկված) արժեքները, որոնք գտնվում են ռեգրեսիայի գծի երկայնքով՝ y(x)=a+bx:

Այժմ վերադառնանք այս արժեքի միջինից արդյունավետ գործոնի քառակուսի շեղումների ընդհանուր գումարի ընդլայնմանը: Այս գումարը պարունակում է երկու մաս, որոնք արդեն սահմանված են վերևում՝ քառակուսի շեղումների գումարը, որը բացատրվում է ռեգրեսիայով և մեկ այլ գումար, որը կոչվում է քառակուսի շեղումների մնացորդային գումար: Այս տարրալուծման հետ կապված է շեղումների վերլուծությունը, որն ուղղակիորեն պատասխանում է հիմնարար հարցին. ինչպե՞ս գնահատել ռեգրեսիոն հավասարման նշանակությունը որպես ամբողջություն և դրա առանձին պարամետրերը: Այն նաև մեծապես որոշում է այս հարցի իմաստը։ Ընդհանուր առմամբ ռեգրեսիոն հավասարման նշանակությունը գնահատելու համար օգտագործվում է Ֆիշերի չափանիշը (F-test): Ֆիշերի առաջարկած մոտեցման համաձայն առաջ է քաշվում զրոյական վարկած՝ ռեգրեսիայի գործակիցը հավասար է զրոյի, այսինքն. արժեքըb=0. Սա նշանակում է, որ X գործոնը չի ազդում Y արդյունքի վրա:

Հիշենք, որ գրեթե միշտ վիճակագրական ուսումնասիրության արդյունքում ստացված միավորները հենց ռեգրեսիոն գծի վրա չեն ընկած։ Նրանք ցրված են՝ քիչ թե շատ հեռու լինելով ռեգրեսիայի գծից։ Նման դիսպերսիան պայմանավորված է X-ի բացատրական գործոնից տարբեր այլ գործոնների ազդեցությամբ, որոնք հաշվի չեն առնվում ռեգրեսիայի հավասարման մեջ: Քառակուսի շեղումների բացատրված կամ գործոնային գումարը հաշվարկելիս օգտագործվում են ռեգրեսիոն գծից հայտնաբերված ստացված բնութագրի տեսական արժեքները:

Y և X փոփոխականների արժեքների տվյալ հավաքածուի համար Y միջին արժեքի հաշվարկված արժեքը գծային ռեգրեսիայի մեջ է միայն մեկ պարամետրի ֆունկցիա՝ ռեգրեսիայի գործակից: Համապատասխանաբար, քառակուսի շեղումների գործակցային գումարը ունի 1-ի հավասար ազատության աստիճաններ։ Իսկ գծային ռեգրեսիայում քառակուսի շեղումների մնացորդային գումարի ազատության աստիճանների թիվը n-2 է։

Հետևաբար, սկզբնական ընդլայնման քառակուսի շեղումների յուրաքանչյուր գումարը բաժանելով նրա ազատության աստիճանների թվին, մենք ստանում ենք միջին քառակուսի շեղումները (տարբերակ ազատության մեկ աստիճանի համար): Այնուհետև, գործոնի շեղումը ազատության մեկ աստիճանի վրա բաժանելով մնացորդային շեղման մեկ աստիճանի ազատության վրա, մենք ստանում ենք զրոյական վարկածի փորձարկման չափանիշ, այսպես կոչված, F հարաբերակցությունը կամ նույնանուն չափանիշը: Մասնավորապես, եթե զրոյական վարկածը ճշմարիտ է, գործակիցը և մնացորդային շեղումները պարզապես հավասար են միմյանց:

Մերժել զրոյական վարկածը, այսինքն. ընդունելով հակառակ վարկածը, որն արտահայտում է ուսումնասիրվող հարաբերությունների նշանակության (ներկայության) փաստը, և ոչ միայն իրականում գոյություն չունեցող հարաբերություն մոդելավորող գործոնների պատահական համընկնումը, անհրաժեշտ է օգտագործել կրիտիկական արժեքների աղյուսակները: նշված հարաբերությունները. Աղյուսակների միջոցով որոշվում է Ֆիշերի չափանիշի կրիտիկական (շեմային) արժեքը։ Այն նաև կոչվում է տեսական։ Այնուհետև նրանք ստուգում են՝ համեմատելով այն դիտողական տվյալներից հաշվարկված չափանիշի համապատասխան էմպիրիկ (փաստացի) արժեքի հետ, թե արդյոք հարաբերակցության փաստացի արժեքը գերազանցում է աղյուսակների կրիտիկական արժեքը։

Սա արվում է ավելի մանրամասն այսպես. Ընտրեք զրոյական հիպոթեզի առկայության հավանականության տվյալ մակարդակը և աղյուսակներից գտեք F-չափանիշի կրիտիկական արժեքը, որի դեպքում դեռևս կարող է առաջանալ շեղումների պատահական շեղում 1 աստիճանով ազատության, այսինքն. առավելագույն նման արժեքը. Այնուհետև F- հարաբերակցության հաշվարկված արժեքը համարվում է հուսալի (այսինքն՝ արտահայտելով իրական և մնացորդային շեղումների տարբերությունը), եթե այս հարաբերակցությունը ավելի մեծ է, քան աղյուսակավորվածը: Հետո զրոյական վարկածը մերժվում է (ճիշտ չէ, որ կապի նշաններ չկան) և, ընդհակառակը, գալիս ենք այն եզրակացության, որ կապ կա և էական է (ոչ պատահական է, էական է)։

Եթե պարզվում է, որ հարաբերությունների արժեքը աղյուսակավորվածից փոքր է, ապա զրոյական վարկածի հավանականությունը պարզվում է, որ ավելի բարձր է, քան նշված մակարդակը (որը սկզբում ընտրվել է), և զրոյական վարկածը չի կարող մերժվել առանց նկատելի վտանգի: հարաբերությունների առկայության մասին սխալ եզրակացություն ստանալը. Ըստ այդմ, ռեգրեսիայի հավասարումը համարվում է աննշան:

F-չափանիշի արժեքը ինքնին կապված է որոշման գործակցի հետ։ Բացի ռեգրեսիոն հավասարման նշանակությունը որպես ամբողջություն գնահատելուց, գնահատվում է նաև ռեգրեսիոն հավասարման առանձին պարամետրերի նշանակությունը: Այս դեպքում ռեգրեսիայի գործակցի ստանդարտ սխալը որոշվում է՝ օգտագործելով էմպիրիկ փաստացի ստանդարտ շեղումը և ազատության մեկ աստիճանի էմպիրիկ շեղումը: Այնուհետև ուսանողի բաշխումն օգտագործվում է ռեգրեսիայի գործակցի նշանակությունը ստուգելու համար՝ դրա վստահության միջակայքերը հաշվարկելու համար:

Ռեգրեսիայի և հարաբերակցության գործակիցների նշանակության գնահատումը Student's t-test-ի միջոցով կատարվում է համեմատելով այս մեծությունների արժեքները և ստանդարտ սխալը: Գծային ռեգրեսիայի պարամետրերի և հարաբերակցության գործակիցի սխալի մեծությունը որոշվում է հետևյալ բանաձևերով.

որտեղ S-ն արմատի միջին քառակուսի մնացորդային նմուշի շեղումն է,

r xy – հարաբերակցության գործակից:

Համապատասխանաբար, ռեգրեսիոն գծով կանխատեսված ստանդարտ սխալի արժեքը տրվում է բանաձևով.

Ռեգրեսիայի և հարաբերակցության գործակիցների արժեքների համապատասխան հարաբերակցությունները իրենց ստանդարտ սխալին կազմում են այսպես կոչված t-վիճակագրությունը, իսկ համապատասխան աղյուսակային (կրիտիկական) արժեքի և դրա իրական արժեքի համեմատությունը թույլ է տալիս ընդունել կամ մերժել զրոյականը: վարկած. Բայց հետո, վստահության միջակայքը հաշվարկելու համար, յուրաքանչյուր ցուցանիշի համար առավելագույն սխալը հայտնաբերվում է որպես t վիճակագրության աղյուսակային արժեքի արտադրյալ՝ համապատասխան ցուցիչի միջին պատահական սխալով: Փաստորեն, մենք իրականում այն գրել ենք մի փոքր այլ կերպ հենց վերևում: Այնուհետև ստացվում են վստահության միջակայքերի սահմանները. ստորին սահմանը համապատասխան գործակիցներից (իրականում միջինը) հանելով համապատասխան սահմանային սխալը, իսկ վերին սահմանը՝ գումարումով (ավելացումով):

Գծային ռեգրեսիայում ∑(y x -y միջին) 2 =b 2 ∑(x-x միջին) 2. Սա հեշտ է ստուգել՝ հղում կատարելով գծային հարաբերակցության գործակցի բանաձևին՝ r 2 xy = b 2 *σ 2 x / σ 2 y

որտեղ σ 2 y-ը y հատկանիշի ընդհանուր շեղումն է;

σ 2 x - y բնութագրիչի ցրումը x գործոնի պատճառով: Համապատասխանաբար, գծային ռեգրեսիայի պատճառով քառակուսի շեղումների գումարը կլինի.

∑(y x -y միջին) 2 =b 2 ∑(x-x միջին) 2:

Քանի որ x-ում և y-ում դիտումների տվյալ ծավալի համար գծային ռեգրեսիայի քառակուսիների գումարը կախված է ռեգրեսիայի b գործակցի միայն մեկ հաստատունից, ապա քառակուսիների այս գումարն ունի ազատության մեկ աստիճան: Եկեք դիտարկենք y հատկանիշի հաշվարկված արժեքի բովանդակային կողմը, այսինքն. y x. y x արժեքը որոշվում է գծային ռեգրեսիայի հավասարմամբ՝ y x = a + bx:

a պարամետրը կարող է սահմանվել որպես a=y-bx: Փոխարինելով a պարամետրի արտահայտությունը գծային մոդելում՝ մենք ստանում ենք՝ y x =y-bx+bx avg =y-b(x-x avg):

y և x փոփոխականների տրված բազմության համար y x-ի հաշվարկված արժեքը գծային ռեգրեսիայում միայն մեկ պարամետրի՝ ռեգրեսիայի գործակիցի ֆունկցիա է։ Համապատասխանաբար, քառակուսի շեղումների գործոնային գումարը ունի 1-ի հավասար ազատության աստիճաններ։

Կա հավասարություն քառակուսիների ընդհանուրի, գործակիցների և մնացորդային գումարների ազատության աստիճանների քանակի միջև: Գծային ռեգրեսիայում քառակուսիների մնացորդային գումարի ազատության աստիճանների թիվը (n-2): Քառակուսիների ընդհանուր գումարի ազատության աստիճանների թիվը որոշվում է դրանց քանակով, և քանի որ մենք օգտագործում ենք ընտրանքային տվյալներից հաշվարկված միջինը, մենք կորցնում ենք ազատության մեկ աստիճան, այսինքն. (n-1): Այսպիսով, մենք ունենք երկու հավասարություն՝ գումարների և ազատության աստիճանների քանակի համար։ Եվ դա, իր հերթին, մեզ հետ է բերում ազատության աստիճանի համեմատելի տարբերությունների, որոնց հարաբերակցությունը տալիս է Ֆիշերի չափանիշը:

25. Ուսանողի թեստի միջոցով ռեգրեսիոն հավասարման և գործակիցների առանձին պարամետրերի նշանակությունը գնահատելը:

27. Գծային և ոչ գծային ռեգրեսիա և դրանց ուսումնասիրության մեթոդներ:

Գծային ռեգրեսիան և դրա հետազոտման ու գնահատման մեթոդներն այդքան կարևոր չէին լինի, եթե, ի լրումն այս շատ կարևոր, բայց ամենապարզ դեպքի, մենք նրանց օգնությամբ չստանանք ավելի բարդ ոչ գծային կախվածությունները վերլուծելու գործիք: Ոչ գծային ռեգրեսիաները կարելի է բաժանել երկու զգալիորեն տարբեր դասերի: Առաջինը և ավելի պարզը ոչ գծային կախվածությունների դասն է, որտեղ բացատրական փոփոխականների նկատմամբ կա ոչ գծայինություն, բայց դրանք գծային են մնում դրանցում ներառված պարամետրերում և ենթակա են գնահատման։ Սա ներառում է տարբեր աստիճանի բազմանդամներ և հավասարակողմ հիպերբոլա։

Բացատրության մեջ ներառված փոփոխականների համար նման ոչ գծային ռեգրեսիան փոփոխականները պարզապես փոխակերպելով (փոխարինելով) հեշտությամբ կարող է վերածվել սովորական գծային ռեգրեսիայի նոր փոփոխականների համար: Հետևաբար, այս դեպքում պարամետրերի գնահատումը կատարվում է պարզապես նվազագույն քառակուսիներով, քանի որ կախվածությունները պարամետրերում գծային են: Այսպիսով, տնտեսագիտության մեջ կարևոր դեր է խաղում հավասարակողմ հիպերբոլայով նկարագրված ոչ գծային կախվածությունը.

Դրա պարամետրերը լավ են գնահատվում՝ օգտագործելով նվազագույն քառակուսիների մեթոդը, և այդ կախվածությունն ինքնին բնութագրում է հումքի, վառելիքի, նյութերի հատուկ ծախսերի կապը արտադրանքի ծավալի, ապրանքների շրջանառության ժամանակի և այս բոլոր գործոնների միջև առևտրի քանակի հետ։ շրջանառություն. Օրինակ, Ֆիլիպսի կորը բնութագրում է գործազրկության մակարդակի և աշխատավարձի աճի տոկոսի միջև ոչ գծային կապը:

Իրավիճակը բոլորովին այլ է ռեգրեսիայի դեպքում, որը ոչ գծային է գնահատվող պարամետրերում, օրինակ, ներկայացված է հզորության ֆունկցիայով, որտեղ աստիճանն ինքնին (դրա ցուցիչը) պարամետր է կամ կախված է պարամետրից: Այն կարող է լինել նաև էքսպոնենցիալ ֆունկցիա, որտեղ աստիճանի հիմքը պարամետր է և էքսպոնենցիալ ֆունկցիա, որում կրկին ցուցիչը պարունակում է պարամետր կամ պարամետրերի համակցություն։ Այս դասը, իր հերթին, բաժանված է երկու ենթադասերի. մեկը ներառում է արտաքին ոչ գծային, բայց ըստ էության ներքին գծային: Այս դեպքում դուք կարող եք մոդելը բերել գծային ձևի, օգտագործելով փոխակերպումները: Այնուամենայնիվ, եթե մոդելը ներքին ոչ գծային է, ապա այն չի կարող կրճատվել գծային ֆունկցիայի:

Այսպիսով, իրական ոչ գծային են համարվում միայն այն մոդելները, որոնք ռեգրեսիոն վերլուծության մեջ ենթագծային չեն: Մնացած բոլորը, որոնք փոխակերպումների միջոցով կարող են վերածվել գծային, որպես այդպիսին չեն համարվում, և հենց նրանք են համարվում առավել հաճախ էկոնոմետրիկ ուսումնասիրություններում: Միևնույն ժամանակ, դա չի նշանակում, որ անհնար է ուսումնասիրել էկոնոմետիկայի էապես ոչ գծային կախվածությունները։ Եթե մոդելն իր պարամետրերով ներքին ոչ գծային է, ապա պարամետրերը գնահատելու համար օգտագործվում են կրկնվող ընթացակարգեր, որոնց հաջողությունը կախված է օգտագործվող կրկնվող մեթոդի հատկանիշների հավասարման տեսակից:

Վերադառնանք գծայինի կրճատված կախվածություններին։ Եթե դրանք ոչ գծային են և՛ պարամետրերով, և՛ փոփոխականներով, օրինակ՝ y = a ձևի բազմապատկված X-ի հզորությամբ, որի ցուցիչը  (բետա) պարամետրն է.

Ակնհայտ է, որ նման հարաբերությունը հեշտությամբ կարող է վերածվել գծային հավասարման պարզ լոգարիթմի միջոցով:

Լոգարիթմներ նշանակող նոր փոփոխականներ ներմուծելուց հետո ստացվում է գծային հավասարում։ Այնուհետև ռեգրեսիայի գնահատման ընթացակարգը բաղկացած է յուրաքանչյուր դիտարկման համար նոր փոփոխականների հաշվարկից՝ սկզբնական արժեքների լոգարիթմները վերցնելով: Այնուհետև գնահատվում է նոր փոփոխականների ռեգրեսիոն կախվածությունը։ Բնօրինակ փոփոխականներին գնալու համար դուք պետք է վերցնեք հակալոգարիթմը, այսինքն՝ իրականում վերադառնաք իրենց հզորություններին՝ դրանց ցուցիչների փոխարեն (ի վերջո, լոգարիթմը ցուցիչն է)։ Նմանապես կարելի է դիտարկել էքսպոնենցիալ կամ էքսպոնենցիալ ֆունկցիաների դեպքը։

Զգալիորեն ոչ գծային ռեգրեսիայի դեպքում հնարավոր չէ կիրառել ռեգրեսիայի գնահատման սովորական ընթացակարգը, քանի որ համապատասխան հարաբերությունը չի կարող փոխակերպվել գծայինի: Գործողությունների ընդհանուր սխեման հետևյալն է.

1. Ընդունված են որոշ հավանական սկզբնական պարամետրերի արժեքներ.

2. Կանխատեսված Y արժեքները հաշվարկվում են փաստացի X արժեքներից՝ օգտագործելով այս պարամետրային արժեքները.

3. Նմուշի բոլոր դիտարկումների համար հաշվարկվում են մնացորդները, իսկ հետո մնացորդների քառակուսիների գումարը.

4. Փոքր փոփոխություններ են կատարվում մեկ կամ մի քանի պարամետրերի գնահատականներում.

5. Հաշվարկվում են Y-ի նոր կանխատեսված արժեքները, մնացորդները և մնացորդների քառակուսիների գումարը.

6. Եթե մնացորդների քառակուսիների գումարը ավելի քիչ է, քան նախկինում, ապա նոր պարամետրերի գնահատումները ավելի լավն են, քան նախորդները և պետք է օգտագործվեն որպես նոր ելակետ.

7. 4-րդ, 5-րդ և 6-րդ քայլերը նորից կրկնվում են այնքան ժամանակ, մինչև անհնար դառնա այնպիսի փոփոխություններ կատարել պարամետրերի գնահատականներում, որոնք կհանգեցնեն քառակուսիների մնացորդների գումարի փոփոխության.

8. Եզրակացություն է արվում, որ քառակուսի մնացորդների գումարը նվազագույնի է հասցված, իսկ վերջնական պարամետրերի գնահատումները նվազագույն քառակուսիների գնահատականներն են:

Ոչ գծային ֆունկցիաների շարքում, որոնց կարելի է կրճատել գծային ձև, հզորության ֆունկցիան լայնորեն կիրառվում է էկոնոմետրիկայի մեջ։ Նրա մեջ b պարամետրն ունի հստակ մեկնաբանություն՝ լինելով առաձգականության գործակից։ Մոդելներում, որոնք գնահատված պարամետրերով ոչ գծային են, բայց կարող են վերածվել գծային ձևի, փոխակերպված հավասարումների նկատմամբ կիրառվում է նվազագույն քառակուսիների մեթոդը: Լոգարիթմների և, համապատասխանաբար, ցուցիչների գործնական օգտագործումը հնարավոր է, երբ ստացված նշանը բացասական արժեքներ չունի։ Ստացված հատկանիշի լոգարիթմի օգտագործմամբ ֆունկցիաների փոխհարաբերություններն ուսումնասիրելիս էկոնոմետրիկայում գերակշռում են ուժ-օրենք կախվածությունը (պահանջարկի և առաջարկի կորեր, արտադրության ֆունկցիաներ, կլանման կորեր՝ ապրանքների աշխատանքի ինտենսիվության, արտադրության մասշտաբի, կախվածության միջև կապը բնութագրելու համար։ ՀՆԱ-ն զբաղվածության մակարդակի վրա, Էնգելի կորեր):

28. Հակադարձ մոդելը և դրա օգտագործումը

Երբեմն օգտագործվում է այսպես կոչված հակադարձ մոդելը, որը ներքին ոչ գծային է, սակայն դրանում, ի տարբերություն հավասարակողմ հիպերբոլայի, փոխակերպման ենթակա է ոչ թե բացատրական փոփոխականը, այլ ստացված Y հատկանիշը: Հետևաբար, հակադարձ մոդելը ստացվում է. լինի ներքին ոչ գծային, և OLS-ի պահանջը չի բավարարվում ստացված Y հատկանիշի իրական արժեքների և դրանց հակադարձ արժեքների համար: Առանձնահատուկ ուշադրության է արժանի ոչ գծային ռեգրեսիայի հարաբերակցության ուսումնասիրությունը: Ընդհանուր դեպքում, երկրորդ աստիճանի պարաբոլան, ինչպես ավելի բարձր կարգի բազմանդամները, երբ գծայինացվում է, ստանում է բազմակի ռեգրեսիայի հավասարման ձև։ Եթե գծայինացված ռեգրեսիոն հավասարումը, որը բացատրված փոփոխականի նկատմամբ ոչ գծային է, ընդունում է գծային զուգակցված ռեգրեսիոն հավասարման ձև, ապա գծային հարաբերակցության գործակիցը կարող է օգտագործվել հարաբերությունների սերտությունը գնահատելու համար:

Եթե ռեգրեսիոն հավասարման գծային ձևի փոխակերպումները կապված են կախված փոփոխականի հետ (արդյունքային բնութագրիչ), ապա բնութագրերի փոխակերպված արժեքների վրա հիմնված գծային հարաբերակցության գործակիցը տալիս է հարաբերությունների միայն մոտավոր գնահատական և թվային առումով չի համընկնում հարաբերակցության ինդեքս. Պետք է նկատի ունենալ, որ հարաբերակցության ինդեքսը հաշվարկելիս օգտագործվում են ստացված Y բնութագրիչի քառակուսի շեղումների գումարները, այլ ոչ թե դրանց լոգարիթմները։ Հարաբերակցության ինդեքսի նշանակության գնահատումը կատարվում է այնպես, ինչպես գնահատվում է հարաբերակցության գործակցի հավաստիությունը (նշանակությունը): Հարաբերակցության ինդեքսն ինքնին, ինչպես որոշման ինդեքսը, օգտագործվում է ոչ գծային ռեգրեսիայի հավասարման ընդհանուր նշանակությունը ստուգելու համար՝ օգտագործելով Fisher F թեստը:

Նկատի ունեցեք, որ ոչ գծային մոդելների կառուցման հնարավորությունը՝ և՛ դրանք գծային ձևի վերածելով, և՛ ոչ գծային ռեգրեսիայի կիրառմամբ, մի կողմից, մեծացնում է ռեգրեսիոն վերլուծության ունիվերսալությունը: Մյուս կողմից, դա զգալիորեն բարդացնում է հետազոտողի խնդիրները: Եթե մենք սահմանափակվենք զուգակցված ռեգրեսիոն վերլուծությամբ, կարող ենք Y և X դիտարկումները գծագրել որպես ցրված գրաֆիկ: Հաճախ մի քանի տարբեր ոչ գծային ֆունկցիաներ մոտավոր դիտարկումներ են կատարում, եթե դրանք ընկած են ինչ-որ կորի վրա: Բայց բազմակի ռեգրեսիայի վերլուծության դեպքում նման գրաֆիկ չի կարող կառուցվել։

Կախված փոփոխականի նույն սահմանմամբ այլընտրանքային մոդելներ դիտարկելիս ընտրության ընթացակարգը համեմատաբար պարզ է: Կարելի է գնահատել ռեգրեսիան՝ հիմնվելով բոլոր հնարավոր երևակայելի ֆունկցիաների վրա և ընտրել այն ֆունկցիան, որն առավելապես բացատրում է կախված փոփոխականի փոփոխությունը: Հասկանալի է, որ երբ գծային ֆունկցիան բացատրում է y-ի շեղման մոտավորապես 64%-ը, իսկ հիպերբոլիկ ֆունկցիան՝ 99,9%-ը, ակնհայտորեն պետք է ընտրել վերջինը: Բայց երբ տարբեր մոդելներօգտագործել տարբեր ֆունկցիոնալ ձևեր, մոդելի ընտրության խնդիրը զգալիորեն բարդանում է:

29. Օգտագործելով Box-Cox թեստը:

Ընդհանուր առմամբ, կախված փոփոխականի նույն սահմանմամբ այլընտրանքային մոդելներ դիտարկելիս ընտրությունը պարզ է: Առավել խելամիտ է գնահատել ռեգրեսիան՝ հիմնված բոլոր հավանական ֆունկցիաների վրա՝ կենտրոնանալով այն ֆունկցիայի վրա, որն առավելապես բացատրում է կախված փոփոխականի փոփոխությունը: Եթե որոշման գործակիցը չափում է մի դեպքում՝ ռեգրեսիայով բացատրվող շեղումների համամասնությունը, իսկ մյուս դեպքում՝ ռեգրեսիայով բացատրվող այս կախյալ փոփոխականի լոգարիթմի շեղումների համամասնությունը, ապա ընտրությունը կատարվում է առանց դժվարության։ Այլ հարց է, երբ երկու մոդելների համար այս արժեքները շատ մոտ են, և ընտրության խնդիրը զգալիորեն բարդանում է:

Այնուհետև պետք է կիրառվի Box-Cox թեստի տեսքով ստանդարտ ընթացակարգը: Եթե պարզապես անհրաժեշտ է համեմատել մոդելները՝ օգտագործելով արդյունավետ գործոնը և դրա լոգարիթմը՝ կախված փոփոխականի տարբերակի տեսքով, ապա օգտագործվում է Zarembka թեստի տարբերակը: Այն առաջարկում է դիտարկման Y սանդղակի փոխակերպում, որը թույլ է տալիս ուղղակիորեն համեմատել արմատային միջին քառակուսի սխալը (MSE) գծային և լոգարիթմական մոդելներում: Համապատասխան ընթացակարգը ներառում է հետևյալ քայլերը.

Ընտրանքում հաշվարկվում է Y արժեքների միջին երկրաչափական միջինը, որը համընկնում է Y-ի լոգարիթմի միջին թվաբանական ցուցանիշի հետ.

Y դիտարկումները վերահաշվարկվում են այնպես, որ դրանք բաժանվում են առաջին քայլում ստացված արժեքի վրա.

Ռեգրեսիան գնահատվում է գծային մոդելի համար՝ օգտագործելով մասշտաբային Y արժեքները սկզբնական Y արժեքների փոխարեն, և լոգարիթմական մոդելի համար՝ օգտագործելով մասշտաբային Y արժեքների լոգարիթմը: Երկու ռեգրեսիաների համար RMSE արժեքներն այժմ համեմատելի են և հետևաբար: Քառակուսի շեղումների ավելի փոքր գումարով մոդելն ավելի լավ է համապատասխանում դիտարկվող արժեքների իրական հարաբերություններին.

Ստուգելու համար, որ մոդելներից մեկը զգալիորեն ավելի լավ համապատասխանություն չի ապահովում, կարելի է օգտագործել դիտարկումների քանակի կեսի արտադրյալը և ստանդարտ շեղման արժեքների հարաբերակցության լոգարիթմը վերահաշվարկված ռեգրեսիաներում, այնուհետև վերցնել այս արժեքի բացարձակ արժեքը:

30. Գործոնների փոխկապակցվածության և բազմակողմանիության հասկացությունները.

34. ՄՆԿ-ի հիմունքները և դրա կիրառման հիմնավորվածությունը:

Այժմ անդրադառնանք OLS-ի հիմունքներին, դրա կիրառման վավերականությանը (ներառյալ բազմակի ռեգրեսիայի խնդիրները) և OLS-ի միջոցով ստացված գնահատումների կարևորագույն հատկություններին: Սկսենք նրանից, որ ռեգրեսիոն հավասարման աջ կողմում վերլուծական կախվածության հետ մեկտեղ կարևոր դեր է խաղում նաև պատահական տերմինը։ Այս պատահական բաղադրիչը աննկատելի մեծություն է: Սամի վիճակագրական թեստերռեգրեսիայի պարամետրերը և հարաբերակցության չափումները հիմնված են բազմակի ռեգրեսիայի այս պատահական բաղադրիչի բաշխման վերաբերյալ չստուգվող ենթադրությունների վրա: Այս ենթադրությունները միայն նախնական են։ Միայն ռեգրեսիոն հավասարումը կառուցելուց հետո է ստուգվում, թե արդյոք պատահական մնացորդների գնահատումները (պատահական բաղադրիչի էմպիրիկ անալոգները) ունե՞ն առաջիորի հատկություններ: Ըստ էության, երբ մոդելի պարամետրերը գնահատվում են, հաշվարկվում են ստացված հատկանիշի տեսական և փաստացի արժեքների տարբերությունները, որպեսզի այդպիսով գնահատվի հենց պատահական բաղադրիչը: Կարևոր է նկատի ունենալ, որ սա ընդամենը տվյալ հավասարման անհայտ մնացորդի օրինակելի իրականացումն է:

Նորմալ հավասարումների համակարգից ստացված ռեգրեսիայի գործակիցները հարաբերության ուժի նմուշային գնահատականներն են: Հասկանալի է, որ դրանք գործնական նշանակություն ունեն միայն այն դեպքում, երբ դրանք անաչառ են։ Հիշենք, որ այս դեպքում մնացորդների միջինը հավասար է զրոյի, կամ, որը նույնն է, գնահատման միջինը հավասար է բուն գնահատված պարամետրին։ Այնուհետև մնացորդները չեն կուտակվի ընտրանքային գնահատումների մեծ քանակի վրա, և հայտնաբերված ռեգրեսիոն պարամետրը ինքնին կարող է համարվել որպես մեծ թվով անաչառ գնահատականների միջին:

Բացի այդ, գնահատումները պետք է ունենան ամենափոքր շեղումը, այսինքն. լինի արդյունավետ, և այնուհետև հնարավոր է դառնում գործնականում անօգտագործելի կետերի գնահատումներից անցնել ինտերվալների գնահատման: Վերջապես, վստահության միջակայքերը օգտակար են, երբ պարամետրի իրական (անհայտ) արժեքից տվյալ հեռավորության վրա գնահատում ստանալու հավանականությունը մոտ է մեկին: Նման գնահատականները կոչվում են հետևողական և հետևողականության հատկությունը բնութագրվում է դրանց ճշգրտության աճով՝ ընտրանքի չափի մեծացման հետ մեկտեղ:

Այնուամենայնիվ, հետևողականության պայմանը ինքնաբերաբար չի բավարարվում և էապես կախված է հետևյալ երկու կարևոր պահանջների կատարումից. Նախ, մնացորդներն իրենք պետք է լինեն ստոխաստիկ՝ առավել ցայտուն պատահականությամբ, այսինքն. բոլոր հստակ ֆունկցիոնալ կախվածությունները պետք է հատուկ ներառվեն բազմակի ռեգրեսիայի վերլուծական բաղադրիչում, և ի լրումն, մնացորդների արժեքները պետք է բաշխվեն միմյանցից անկախ տարբեր նմուշների համար (առանց մնացորդների ավտոկոռելացիա): Երկրորդ, ոչ պակաս կարևոր պահանջն այն է, որ յուրաքանչյուր շեղման (մնացորդային) շեղումը նույնական լինի X փոփոխականների բոլոր արժեքների համար (հոմոսկեդաստիկություն): Նրանք. միասեռականությունն արտահայտվում է բոլոր դիտարկումների համար տարբերության կայունությամբ.

Ընդհակառակը, հետերոսկեդաստիկությունը տարբեր դիտարկումների համար շեղումների նման կայունության խախտում է: Այս դեպքում, ընտրանքի տարբեր դիտարկումների համար պատահական տերմինի տարբեր տեսական բաշխմամբ խիստ շեղվող արժեքներ ստանալու a priori (դիտարկումներից առաջ) հավանականությունը համեմատաբար բարձր կլինի:

Մնացորդների ավտոկորելացիան կամ ընթացիկ և նախորդ (հետագա) դիտարկումների մնացորդների միջև հարաբերակցության առկայությունը որոշվում է սովորական գծային հարաբերակցության գործակցի արժեքով: Եթե այն զգալիորեն տարբերվում է զրոյից, ապա մնացորդները ավտոկոռելացված են և, հետևաբար, հավանականության խտության ֆունկցիան (մնացորդների բաշխումը) կախված է դիտակետից և մնացորդային արժեքների բաշխումից այլ դիտակետերում: Հարմար է որոշել մնացորդների ավտոկորելացիան՝ օգտագործելով առկա վիճակագրական տվյալները, եթե առկա է դիտարկումների դասակարգում ըստ X գործոնի:

35. Հոմոսկեդաստիկություն և հետերոսկեդաստիկություն, մնացորդների ավտոկոռելացիա, ընդհանրացված նվազագույն քառակուսիներ (GLM):

X փոփոխականների բոլոր արժեքների համար մնացորդների շեղումների նույնականությունը կամ հոմոսկեդաստիկությունը նույնպես բացարձակապես անհրաժեշտ է OLS-ի միջոցով ռեգրեսիայի պարամետրերի հետևողական գնահատականներ ստանալու համար: Հոմոսկեդաստականության պայմանը չբավարարելը հանգեցնում է այսպես կոչված հետերոսկեդաստականության։ Դա կարող է հանգեցնել ռեգրեսիայի գործակիցների կողմնակալ գնահատականների: Հետերոսկեդաստիկությունը հիմնականում կազդի ռեգրեսիոն գործակիցների գնահատումների արդյունավետության նվազման վրա: Այս դեպքում հատկապես դժվար է դառնում օգտագործել ռեգրեսիոն գործակցի ստանդարտ սխալի բանաձևը, որի օգտագործումը ենթադրում է մնացորդների միատեսակ ցրում գործոնի ցանկացած արժեքի համար: Ինչ վերաբերում է ռեգրեսիայի գործակիցների գնահատումների անաչառությանը, ապա դա առաջին հերթին կախված է մնացորդների անկախությունից և բուն գործոնների արժեքներից:

Միանգամայն պարզ, թեև ոչ խիստ և հմտություն պահանջող մի միջոց՝ հոմոսկեդաստիկությունը ստուգելու համար մնացորդների կախվածության բնույթը գրաֆիկականորեն ուսումնասիրելն է միջին հաշվարկված (տեսական) արդյունքային հատկանիշից կամ համապատասխան հարաբերակցության դաշտերից: Հետերոսկեդաստականության ուսումնասիրության և գնահատման վերլուծական մեթոդներն ավելի խիստ են: Եթե կա հետերոսկեդաստիկության զգալի առկայությունը, ապա խորհուրդ է տրվում OLS-ի փոխարեն օգտագործել ընդհանրացված OLS (GLM):

Բացի OLS-ի օգտագործումից բխող բազմակի ռեգրեսիայի պահանջներից, անհրաժեշտ է նաև համապատասխանել մոդելում ներառված փոփոխականների պայմաններին: Սրանք, առաջին հերթին, ներառում են պահանջներ՝ կապված դիտարկումների տվյալ ծավալի մոդելային գործոնների քանակի հետ (1-ից 7): Հակառակ դեպքում ռեգրեսիայի պարամետրերը վիճակագրորեն աննշան կլինեն: LSM-ի ներդրման ժամանակ համապատասխան թվային մեթոդների կիրառման արդյունավետության տեսանկյունից անհրաժեշտ է, որ դիտարկումների թիվը գերազանցի գնահատված պարամետրերի քանակը (հավասարումների համակարգում հավասարումների քանակը ավելի մեծ է, քան փնտրվածը. փոփոխականներ):

Էկոնոմետրիկայի ամենանշանակալի ձեռքբերումը անհայտ պարամետրերի գնահատման մեթոդների զգալի զարգացումն է և դիտարկվող էֆեկտների ստատիկ նշանակությունը բացահայտելու չափանիշների կատարելագործումը: Այս առումով, ավանդական OLS-ի օգտագործման անհնարինությունը կամ աննպատակահարմարությունը տարբեր աստիճանի դրսևորվող հետերոսկեդաստիկության պատճառով հանգեցրեց ընդհանրացված OLS-ի (GLM) զարգացմանը: Փաստորեն, սա ներառում է մոդելի ճշգրտում, դրա ճշգրտման փոփոխություն և սկզբնական տվյալների վերափոխում՝ ապահովելու ռեգրեսիայի գործակիցների անաչառ, արդյունավետ և հետևողական գնահատումներ:

Ենթադրվում է, որ մնացորդների միջինը զրո է, բայց դրանց ցրվածությունն այլևս հաստատուն չէ, այլ համաչափ է K i-ի արժեքներին, որտեղ այդ արժեքները համաչափության գործակիցներ են, որոնք տարբեր են տարբեր արժեքների համար։ գործոն x. Այսպիսով, հենց այս գործակիցներն են (K i արժեքները), որոնք բնութագրում են դիսպերսիայի տարասեռությունը։ Բնականաբար, ենթադրվում է, որ ինքնին ցրվածության չափը, որը ընդհանուր գործոն է այս համաչափության գործակիցների համար, անհայտ է:

Բնօրինակ մոդելը, այս գործակիցները բազմակի ռեգրեսիայի հավասարման մեջ մտցնելուց հետո, շարունակում է մնալ հետերոսկեդաստիկ (ավելի ճիշտ՝ սրանք մոդելի մնացորդային արժեքներն են): Թող այս մնացորդները (մնացորդները) ինքնակորելացված չլինեն: Ներկայացնենք նոր փոփոխականներ, որոնք ստացվել են i-րդ դիտարկման արդյունքում գրանցված սկզբնական մոդելային փոփոխականները K i համաչափության գործակիցների քառակուսի արմատի բաժանելով։ Այնուհետև փոխակերպված փոփոխականներում մենք ստանում ենք նոր հավասարում, որում մնացորդները կլինեն հոմոսկեդաստիկ: Նոր փոփոխականներն իրենք կշռված հին (օրիգինալ) փոփոխականներ են:

Հետևաբար, հոմոսկեդաստիկ մնացորդներով այս կերպ ստացված նոր հավասարման պարամետրերի գնահատումը կնվազեցվի մինչև կշռված նվազագույն քառակուսիների մեթոդը (ըստ էության, սա OLS մեթոդն է): Երբ օգտագործվում են ռեգրեսիոն փոփոխականների փոխարեն, դրանց շեղումները միջինից, ռեգրեսիոն գործակիցների արտահայտությունները ստանում են պարզ և ստանդարտացված (միատեսակ) ձև, որը փոքր-ինչ տարբերվում է OLS-ի և OLS-ի համար՝ համարիչի և հայտարարի 1/K ուղղիչ գործակցով: ռեգրեսիայի գործակիցը տվող կոտորակի։

Պետք է հիշել, որ փոխակերպված (ճշգրտված) մոդելի պարամետրերը զգալիորեն կախված են նրանից, թե որ հայեցակարգն է օգտագործվում որպես համաչափության գործակիցների K i-ի հիմք: Հաճախ ենթադրվում է, որ մնացորդները պարզապես համաչափ են գործոնի արժեքներին: Մոդելը ստանում է իր ամենապարզ ձևը, երբ ընդունվում է այն վարկածը, որ սխալները համաչափ են ըստ հերթականության վերջին գործոնի արժեքներին: Այնուհետև OLS-ը հնարավորություն է տալիս մեծացնել դիտարկումների կշիռը փոխակերպված փոփոխականների ավելի փոքր արժեքներով ռեգրեսիայի պարամետրերը որոշելիս՝ համեմատած սկզբնական աղբյուրի փոփոխականներով ստանդարտ OLS-ի աշխատանքի հետ: Բայց այս նոր փոփոխականներն արդեն ստանում են այլ տնտեսական բովանդակություն։

Գործոնի չափին մնացորդների համաչափության մասին վարկածը կարող է իրական հիմք ունենալ: Թող մշակվի որոշակի անբավարար միատարր տվյալներ, օրինակ՝ միաժամանակ ներառելով խոշոր և փոքր ձեռնարկությունները։ Այնուհետև գործոնի մեծ ծավալային արժեքները կարող են համապատասխանել ինչպես ստացված բնութագրիչի մեծ ցրմանը, այնպես էլ մնացորդային արժեքների մեծ ցրմանը: Ավելին, OLS-ի օգտագործումը և համապատասխան անցումը հարաբերական արժեքներին ոչ միայն նվազեցնում է գործոնի փոփոխությունը, այլև նվազեցնում է սխալի շեղումը: Այսպիսով, ռեգրեսիոն մոդելներում հետերոսկեդաստիկությունը հաշվի առնելու և շտկելու ամենապարզ դեպքն իրականացվում է OLS-ի կիրառմամբ։

OLS-ի կշռված OLS-ի տեսքով ներդրման վերոնշյալ մոտեցումը բավականին գործնական է. այն պարզապես իրականացվում է և ունի թափանցիկ տնտեսական մեկնաբանություն: Իհարկե, սա ամենաընդհանուր մոտեցումը չէ, և մաթեմատիկական վիճակագրության համատեքստում, որը ծառայում է որպես էկոնոմետրիկայի տեսական հիմք, մեզ առաջարկվում է շատ ավելի խիստ մեթոդ, որն իրականացնում է OLS-ն իր իրականության մեջ: ընդհանուր տեսարան. Դրանում դուք պետք է իմանաք սխալի վեկտորի (մնացորդային սյունակ) կովարիանսի մատրիցը: Եվ սա սովորաբար անարդար է գործնական իրավիճակներում, և հնարավոր չէ գտնել այս մատրիցը որպես այդպիսին: Հետևաբար, ընդհանուր առմամբ, անհրաժեշտ է ինչ-որ կերպ գնահատել պահանջվող մատրիցը, որպեսզի համապատասխան բանաձևերում օգտագործվի նման գնահատական՝ բուն մատրիցայի փոխարեն: Այսպիսով, OMNC-ի իրականացման նկարագրված տարբերակը ներկայացնում է նման գնահատականներից մեկը: Այն երբեմն կոչվում է մատչելի ընդհանրացված նվազագույն քառակուսիներ:

Պետք է նաև հաշվի առնել, որ որոշման գործակիցը չի կարող ծառայել որպես համապատասխանության որակի բավարար չափանիշ OLS-ի օգտագործման ժամանակ: Վերադառնալով OLS-ի կիրառմանը, մենք նաև նշում ենք, որ սպիտակ ձևով ստանդարտ շեղումների (ստանդարտ սխալներ) օգտագործման մեթոդը (այսպես կոչված, հետևողական ստանդարտ սխալներ հետերոսկեդաստիկության առկայության դեպքում) ունի բավարար ընդհանրություն: Այս մեթոդը կիրառելի է այն պայմանով, որ սխալի վեկտորի կովարիանսի մատրիցը անկյունագծային է: Եթե առկա է մնացորդների (սխալների) ավտոկոռելացիա, երբ կովարիանսային մատրիցում և հիմնական անկյունագծից դուրս կան ոչ զրոյական տարրեր (գործակիցներ), ապա պետք է օգտագործվի ավելի ընդհանուր ստանդարտ սխալի մեթոդ Նև Վեսթ ձևով: Կա մի զգալի սահմանափակում. ոչ զրոյական տարրերը, բացի հիմնական անկյունագծից, հանդիպում են միայն հարակից անկյունագծերի վրա՝ հիմնական շեղանկյունից ոչ ավելի, քան որոշակի քանակով հեռավորություն:

Վերոնշյալից պարզ է դառնում, որ անհրաժեշտ է կարողանալ ստուգել տվյալները հետերոսկեդաստականության համար: Ստորև բերված թեստերը ծառայում են այս նպատակին: Նրանք ստուգում են հիմնական վարկածը մնացորդների շեղումների հավասարության մասին այլընտրանքային վարկածի նկատմամբ (այս վարկածների անհավասարության մասին)։ Բացի այդ, կան a priori կառուցվածքային սահմանափակումներ հետերոսկեդաստականության բնույթի վերաբերյալ: Գոլդֆելդ-Քվանդտի թեստը սովորաբար օգտագործում է այն ենթադրությունը, որ սխալի շեղումը (մնացորդային) ուղղակիորեն կախված է որոշ անկախ փոփոխականի արժեքից: Այս թեստի օգտագործման սխեման հետևյալն է. Նախ, տվյալները դասավորված են անկախ փոփոխականի նվազման կարգով, որի համար կասկածվում է հետերոսկեդաստիկությունը: Այս պատվիրված տվյալների հավաքածուն այնուհետև վերացնում է միջին մի քանի դիտարկումները, որտեղ «քիչ» բառը նշանակում է մոտավորապես քառորդը (25%): ընդհանուր թիվըբոլոր դիտարկումները։ Հաջորդը, երկու անկախ ռեգրեսիաներ են կատարվում մնացած (վերացումից հետո) միջին դիտարկումներից առաջինի և այս մնացած միջին դիտարկումներից վերջին երկուսի վրա: Դրանից հետո կառուցվում են երկու համապատասխան մնացորդներ։ Վերջապես, կազմվում է Fisher F վիճակագրությունը, և եթե ուսումնասիրվող վարկածը ճշմարիտ է, ապա F-ն իսկապես Ֆիշերի բաշխումն է՝ ազատության համապատասխան աստիճաններով: Այնուհետև այս վիճակագրության մեծ արժեքը նշանակում է, որ փորձարկվող վարկածը պետք է մերժվի: Առանց վերացման քայլի, այս թեստի հզորությունը նվազում է:

Breusch-Pagan թեստն օգտագործվում է այն դեպքերում, երբ ապրիորի ենթադրվում է, որ շեղումները կախված են որոշ լրացուցիչ փոփոխականներից։ Նախ կատարվում է սովորական (ստանդարտ) ռեգրեսիա և ստացվում է մնացորդների վեկտոր։ Այնուհետև կազմվում է շեղումների գնահատում: Այնուհետև կատարվում է մնացորդների քառակուսի վեկտորի ռեգրեսիա, որը բաժանված է էմպիրիկ շեղումով (վարիանսի գնահատում): Դրա համար (ռեգեսիա) գտնված է տատանումների բացատրված մասը։ Եվ այս բացատրված տարբերակի համար կիսով չափ բաժանված, վիճակագրություն է կառուցվում: Եթե զրոյական վարկածը ճշմարիտ է (ոչ մի հետերոսկեդաստիկություն ճիշտ չէ), ապա այս արժեքը ունի բաշխում. հեե- քառակուսի. Եթե թեստը, ընդհակառակը, բացահայտում է հետերոսկեդաստիկություն, ապա սկզբնական մոդելը փոխակերպվում է՝ մնացորդների վեկտորի բաղադրիչները բաժանելով դիտարկվող անկախ փոփոխականների վեկտորի համապատասխան բաղադրիչներին։

36. Ստանդարտ շեղման մեթոդ Սպիտակ ձևով:

Հետևյալ եզրակացությունները կարելի է անել. OLS-ի օգտագործումը հետերոսկեդաստիկության առկայության դեպքում հանգեցնում է կշռված քառակուսի շեղումների գումարի նվազագույնի: Հասանելի OLS-ի օգտագործումը կապված է գնահատված պարամետրերի քանակը գերազանցող մեծ թվով դիտարկումների անհրաժեշտության հետ: OLS-ի օգտագործման առավել բարենպաստ դեպքն այն դեպքն է, երբ սխալը (մնացորդները) համաչափ է անկախ փոփոխականներից մեկին և արդյունքում ստացված գնահատականները համահունչ են: Եթե, այնուամենայնիվ, հետերոսկեդաստիկությամբ մոդելում անհրաժեշտ է օգտագործել ոչ թե OLS, այլ ստանդարտ OLS, ապա հետևողական գնահատականներ ստանալու համար կարելի է օգտագործել սխալի գնահատականները White կամ Nevje-West ձևով:

Ժամանակային շարքերը վերլուծելիս հաճախ անհրաժեշտ է լինում հաշվի առնել դիտարկումների վիճակագրական կախվածությունը ժամանակի տարբեր կետերում: Այս դեպքում անկապ սխալների ենթադրությունը չի բավարարվում: Եկեք դիտարկենք պարզ մոդել, որի դեպքում սխալները կազմում են առաջին կարգի ավտոռեգեսիվ գործընթաց։ Այս դեպքում սխալները բավարարում են պարզ կրկնվող կապը, որի աջ կողմում տերմիններից մեկը անկախ նորմալ բաշխված պատահական փոփոխականների հաջորդականությունն է՝ զրոյական միջին և հաստատուն շեղումով: Երկրորդ տերմինը պարամետրի (ավտոգրեսիայի գործակից) և ժամանակի նախորդ կետում մնացորդների արժեքների արտադրյալն է: Սխալների արժեքների (մնացորդների) հաջորդականությունն ինքնին ստեղծում է անշարժ պատահական գործընթաց: Ստացիոնար պատահական գործընթացը բնութագրվում է ժամանակի ընթացքում դրա բնութագրերի կայունությամբ, մասնավորապես՝ միջինի և շեղումների: Այս դեպքում մեզ հետաքրքրող կովարիանսային մատրիցը (դրա պայմանները) կարելի է հեշտությամբ գրել՝ օգտագործելով պարամետրի հզորությունները:

Հայտնի պարամետրի համար ավտոռեգեսիվ մոդելի գնահատումը կատարվում է OLS-ի միջոցով: Այս դեպքում բավական է պարզապես կրճատել սկզբնական մոդելը պարզ փոխակերպմամբ այն մոդելի, որի սխալները բավարարում են ստանդարտ ռեգրեսիոն մոդելի պայմանները: Դա շատ հազվադեպ է, բայց այնուամենայնիվ կա մի իրավիճակ, երբ հայտնի է ավտոռեգեսիայի պարամետրը: Հետևաբար, ընդհանուր առմամբ անհրաժեշտ է գնահատում կատարել անհայտ ավտոռեգեսիվ պարամետրով: Նման գնահատման համար կան երեք առավել հաճախ օգտագործվող ընթացակարգեր: Cochrane-Orcutt մեթոդը, Hildreth-Lu ընթացակարգը և Durbin մեթոդը:

Ընդհանուր առմամբ, հետևյալ եզրակացությունները ճիշտ են. Ժամանակային շարքերի վերլուծությունը պահանջում է սովորական OLS-ի ուղղում, քանի որ այս դեպքում սխալները սովորաբար փոխկապակցված են: Հաճախ այդ սխալները կազմում են առաջին կարգի ստացիոնար ավտոռեգեսիվ գործընթաց: Առաջին կարգի ավտոռեգեսիայի OLS գնահատողները անաչառ են, հետևողական, բայց անարդյունավետ: Հայտնի ավտոռեգեսիայի գործակցով OLS-ը կրճատվում է մինչև սկզբնական համակարգի պարզ փոխակերպումները (ուղղումները), այնուհետև ստանդարտ OLS-ի կիրառումը: Եթե, ինչպես ավելի հաճախ է պատահում, ավտոռեգեսիվ գործակիցը անհայտ է, ապա OLS-ի համար կան մի քանի ընթացակարգեր, որոնք բաղկացած են անհայտ պարամետրի (գործակիցի) գնահատումից, որից հետո կիրառվում են նույն փոխակերպումները, ինչպես հայտնիի նախորդ դեպքում: պարամետր.

37. Բրեյշ-հեթանոսական թեստի հայեցակարգ, Գոլդֆելդ-Քվանդտի թեստ

Մոտավորության սխալը ամենահաճախ առաջացող խնդիրներից մեկն է սկզբնաղբյուրի տվյալների մոտարկման որոշակի մեթոդներ կիրառելիս: Կան տարբեր տեսակի մոտավոր սխալներ.

Աղբյուրի տվյալների սխալների հետ կապված սխալներ;

Սխալներ, որոնք կապված են մոտավոր մոդելի և մոտավոր տվյալների կառուցվածքի անհամապատասխանության հետ:

Excel-ն ունի լավ զարգացած Գծային ֆունկցիա տվյալների մշակման և մոտարկումների համար, որն օգտագործում է բարդ մաթեմատիկա: Դրա մասին պատկերացում կազմելու համար անդրադառնանք (F1-ի միջոցով) այս մշակման նկարագրական մասին, որը ներկայացնում ենք հապավումներով և նշագրման որոշ փոփոխություններով։

Հաշվում է մի շարքի վիճակագրությունը՝ օգտագործելով նվազագույն քառակուսիները՝ հաշվարկելու այն ուղիղ գիծը, որը լավագույնս համապատասխանում է առկա տվյալներին: Ֆունկցիան վերադարձնում է զանգված, որը նկարագրում է ստացված տողը: Քանի որ արժեքների զանգվածը վերադարձվում է, ֆունկցիան պետք է նշվի որպես զանգվածի բանաձև:

Ուղիղ գծի հավասարումը հետևյալն է.

y=a+b1*x1+b2*x2+...bn*xn

Շարահյուսություն:

LINEST (y;x;const;վիճակագրություն)

Զանգված y - հայտնի արժեքներ y.

Զանգված x - x-ի հայտնի արժեքներ: X զանգվածը կարող է պարունակել փոփոխականների մեկ կամ մի քանի շարք:

Const է բուլյան արժեք, որը սահմանում է, թե արդյոք կեղծ անդամը պետք է հավասար լինի 0-ի:

Եթե const արգումենտը ճշմարիտ է, 1 կամ բաց թողնված, ապա a-ն գնահատվում է ինչպես միշտ: Եթե const արգումենտը FALSE է կամ 0, ապա a-ն սահմանվում է 0-ի:

Վիճակագրությունը բուլյան արժեք է, որը ցույց է տալիս, թե արդյոք լրացուցիչ ռեգրեսիայի վիճակագրությունը պետք է վերադարձվի: Եթե վիճակագրական փաստարկը TRUE է կամ 1, ապա LINEST-ը վերադարձնում է լրացուցիչ ռեգրեսիայի վիճակագրություն: Եթե վիճակագրությունը FALSE է, 0 կամ բաց թողնված, ապա LINEST-ը վերադարձնում է միայն գործակիցները և ընդհատումը:

Լրացուցիչ ռեգրեսիայի վիճակագրություն.

se1,se2,...,sen - ստանդարտ սխալի արժեքներ b1,b2,...,bn գործակիցների համար:

sea - ստանդարտ սխալի արժեք a հաստատունի համար (sea = #N/A, եթե const-ը FALSE է):

r2-ը դետերմինիզմի գործակիցն է։ Համեմատվում են y-ի իրական արժեքները և գծի հավասարումից ստացված արժեքները. Համեմատության արդյունքների հիման վրա հաշվարկվում է դետերմինիզմի գործակիցը, որը նորմալացվում է 0-ից մինչև 1: Եթե այն հավասար է 1-ի, ապա մոդելի հետ կա ամբողջական հարաբերակցություն, այսինքն. y-ի փաստացի և գնահատված արժեքների միջև տարբերություն չկա: Հակառակ դեպքում, եթե որոշման գործակիցը 0 է, ապա ռեգրեսիոն հավասարումը անհաջող է կանխատեսել y-ի արժեքները: R2-ի հաշվարկման մասին տեղեկությունների համար տե՛ս այս բաժնի վերջում գտնվող «Ծանոթագրություններ»:

sey-ը y-ի գնահատման ստանդարտ սխալն է:

F-վիճակագրություն կամ F-դիտարկված արժեք: F-վիճակագրությունն օգտագործվում է որոշելու համար, թե արդյոք կախված և անկախ փոփոխականների միջև դիտարկված կապը պատահականության հետևանք է, թե ոչ:

df - ազատության աստիճաններ: Ազատության աստիճանները օգտակար են վիճակագրական աղյուսակում F- կրիտիկական արժեքները գտնելու համար: Մոդելի վստահության մակարդակը որոշելու համար աղյուսակի արժեքները համեմատում եք LINEST ֆունկցիայի կողմից վերադարձված F վիճակագրության հետ:

ssreg-ը քառակուսիների ռեգրեսիոն գումարն է:

ssresid-ը քառակուսիների մնացորդային գումարն է:

Ստորև բերված նկարը ցույց է տալիս լրացուցիչ ռեգրեսիայի վիճակագրության վերադարձի հերթականությունը:

Նշումներ

Գործառույթից ընտրված տեղեկատվությունը կարելի է ստանալ INDEX ֆունկցիայի միջոցով, օրինակ.

Y-հատում (ազատ ժամկետ):

INDEX(LINEST(y,x),2)

LINEST ֆունկցիայի միջոցով հաշվարկված ուղիղ գծի օգտագործմամբ մոտարկման ճշգրտությունը կախված է տվյալների ցրման աստիճանից: Որքան ավելի մոտ են տվյալները ուղիղ գծին, այնքան ավելի ճշգրիտ է մոդելը, որն օգտագործվում է LINEST ֆունկցիայի կողմից: LINEST ֆունկցիան օգտագործում է նվազագույն քառակուսիներ՝ տվյալներին լավագույնս համապատասխանելը որոշելու համար:

Կատարելով ռեգրեսիոն վերլուծություն՝ Microsoft Excelյուրաքանչյուր կետի համար հաշվարկում է կանխատեսված y արժեքի և իրական y արժեքի տարբերության քառակուսին: Այս քառակուսի տարբերությունների գումարը կոչվում է քառակուսիների մնացորդային գումար: Microsoft Excel-ն այնուհետև հաշվարկում է իրական y արժեքների և միջին y արժեքների միջև եղած տարբերությունների քառակուսիների գումարը, որը կոչվում է քառակուսիների ընդհանուր գումար (քառակուսիների ռեգրեսիոն գումար + քառակուսիների մնացորդային գումար): Որքան փոքր է քառակուսիների մնացորդային գումարը քառակուսիների ընդհանուր գումարի համեմատ, այնքան մեծ է որոշման գործակիցը r2, որը ցույց է տալիս, թե որքան լավ է ստացված հավասարումը օգտագործելով. ռեգրեսիոն վերլուծություն, բացատրում է փոփոխականների փոխհարաբերությունները:

Նկատի ունեցեք, որ ռեգրեսիոն հավասարմամբ կանխատեսված y արժեքները կարող են ճիշտ չլինել, եթե դուրս են գալիս y արժեքների միջակայքից, որոնք օգտագործվել են հավասարումը սահմանելու համար:

Օրինակ 1 Լանջ և Y-հատում

LINEST((1;9;5;7);(0;4;2;3)) հավասար է (2;1), թեքություն = 2 և y-հատում = 1:

Օգտագործելով F և R2 վիճակագրությունը

Դուք կարող եք օգտագործել F վիճակագրությունը՝ որոշելու համար, թե արդյոք բարձր r2 արժեք ունեցող արդյունքը պատահականության հետևանք է: Եթե F-ն ավելի մեծ է, քան F-կրիտիկականը, ապա փոփոխականների միջև կա հարաբերություն: F-critical-ը կարելի է ստանալ մաթեմատիկական վիճակագրության վերաբերյալ ցանկացած տեղեկատու գրքում F- կրիտիկական արժեքների աղյուսակից: Այս արժեքը միակողմանի թեստի միջոցով գտնելու համար սահմանեք Ալֆայի արժեքը (Ալֆայի արժեքը օգտագործվում է սխալ եզրակացության հավանականությունը ցույց տալու համար, որ կա ուժեղ հարաբերություններ) հավասար է 0,05-ի, իսկ ազատության աստիճանների քանակի համար ( սովորաբար նշանակվում է v1 և v2), դնենք v1 = k = 4 և v2 = n - (k + 1) = 11 - (4 + 1) = 6, որտեղ k-ը փոփոխականների թիվն է, իսկ n-ը տվյալների կետերի քանակը: . Հղման աղյուսակից F-կրիտիկականը 4.53 է: Դիտարկված F արժեքը 459.753674 է (այս արժեքը ստացվել է մեր բաց թողած օրինակում), որը նկատելիորեն ավելի մեծ է, քան F- կրիտիկական արժեք 4.53. Հետեւաբար, արդյունքում ռեգրեսիայի հավասարումըօգտակար է ցանկալի արդյունքը կանխատեսելու համար:

Կառուցված էկոնոմետրիկայի որակի ընդհանուր գնահատման համար այնպիսի բնութագրիչներ, ինչպիսիք են որոշման գործակիցը, հարաբերակցության ինդեքսը, միջին հարաբերական սխալմոտարկում, ինչպես նաև ստուգում է ռեգրեսիոն հավասարման նշանակությունը՝ օգտագործելով Ֆ-Ֆիշերի չափանիշը. Թվարկված բնութագրերը բավականին ունիվերսալ են և կարող են օգտագործվել ինչպես գծային, այնպես էլ ոչ գծային մոդելների, ինչպես նաև երկու կամ ավելի գործոնային փոփոխականներով մոդելների համար։ Մի շարք մնացորդներ որոշիչ դեր են խաղում թվարկված որակական բոլոր բնութագրիչները հաշվարկելիս εi, որը հաշվարկվում է ուսումնասիրվող հատկանիշի փաստացի (դիտարկումներից ստացված) արժեքներից հանելով. y iարժեքներ, որոնք հաշվարկվում են մոդելի հավասարման միջոցով y рi.

Որոշման գործակից

ցույց է տալիս, թե ուսումնասիրվող հատկանիշի փոփոխության ինչ մասնաբաժինն է հաշվի առնված մոդելում: Այլ կերպ ասած, որոշման գործակիցը ցույց է տալիս, թե ուսումնասիրվող փոփոխականի փոփոխության որ մասը կարող է հաշվարկվել՝ հիմնվելով մոդելում ներառված գործոնային փոփոխականների փոփոխության վրա՝ օգտագործելով գործոնային փոփոխականները միացնող ֆունկցիայի ընտրված տեսակը և ուսումնասիրվող բնութագիրը։ մոդելի հավասարումը.

Որոշման գործակից Ռ 2կարող է արժեքներ վերցնել 0-ից մինչև 1: Որքան մոտ է որոշման գործակիցը Ռ 2մեկին, որ ավելի լավ որակմոդելներ.

Հարաբերակցության ինդեքս կարելի է հեշտությամբ հաշվարկել՝ իմանալով որոշման գործակիցը.

Հարաբերակցության ինդեքս Ռբնութագրում է մոդելի կառուցման ժամանակ ընտրված կապի տեսակի սերտությունը մոդելում հաշվի առնված գործոնների և ուսումնասիրվող փոփոխականի միջև: Գծային զույգ ռեգրեսիայի դեպքում դրա բացարձակ արժեքը համընկնում է զույգերի հարաբերակցության գործակցի հետ. r(x, y), որը մենք ավելի վաղ ուսումնասիրել ենք և բնութագրում է գծային հարաբերությունների սերտությունը xԵվ y. Հարաբերակցության ինդեքսի արժեքները, ակնհայտորեն, նույնպես գտնվում են 0-ից 1 միջակայքում: Որքան մոտ է արժեքը: Ռմիասնության համար, որքան ավելի սերտորեն կապում է ֆունկցիայի ընտրված տեսակը գործոնային փոփոխականները և ուսումնասիրվող բնութագիրը, այնքան լավ կլինի մոդելի որակը:

(2.11)

արտահայտված է որպես տոկոս և բնութագրում է մոդելի ճշգրտությունը: Գործնական խնդիրներ լուծելիս մոդելի ընդունելի ճշգրտությունը կարող է որոշվել տնտեսական իրագործելիության նկատառումներից ելնելով` հաշվի առնելով կոնկրետ իրավիճակը: Լայնորեն կիրառվող չափանիշն այն է, որ ճշգրտությունը համարվում է բավարար, եթե միջին հարաբերական սխալը 15%-ից պակաս է: Եթե E rel.vg. 5%-ից պակաս, ապա ասում են, որ մոդելն ունի բարձր ճշգրտություն: Վերլուծության և կանխատեսման համար խորհուրդ չի տրվում օգտագործել անբավարար ճշգրտությամբ մոդելներ, այսինքն՝ երբ E rel.vg.ավելի քան 15%:

Ֆիշերի F թեստ օգտագործվում է ռեգրեսիոն հավասարման նշանակությունը գնահատելու համար: F-չափանիշի հաշվարկված արժեքը որոշվում է հարաբերությունից.

. (2.12)

Կրիտիկական արժեք Ֆ-չափանիշները որոշվում են աղյուսակներից որոշակի նշանակության α մակարդակով և ազատության աստիճաններով (կարող եք օգտագործել FRIST ֆունկցիան Excel-ում): Այստեղ, ինչպես նախկինում, մ- մոդելում հաշվի առնված գործոնների քանակը, n- դիտարկումների քանակը. Եթե հաշվարկված արժեքը մեծ է կրիտիկական արժեքից, ապա մոդելի հավասարումը համարվում է նշանակալի: Որքան բարձր է հաշվարկված արժեքը Ֆ-չափանիշներ, այնքան լավ է մոդելի որակը:

Եկեք որոշենք մեր ստեղծած գծային մոդելի որակական բնութագրերը Օրինակ 1. Եկեք օգտագործենք աղյուսակ 2-ի տվյալները: Որոշման գործակից:

Ուստի գծային մոդելի շրջանակներում վաճառքի ծավալի 90,1% փոփոխությունը բացատրվում է օդի ջերմաստիճանի փոփոխությամբ։

Հարաբերակցության ինդեքս

Հարաբերակցության ինդեքսի արժեքը զուգակցված գծային մոդելի դեպքում, ինչպես տեսնում ենք, բացարձակ արժեքով իսկապես հավասար է համապատասխան փոփոխականների (վաճառքի ծավալը և ջերմաստիճանը) հարաբերակցության գործակցին: Քանի որ ստացված արժեքը բավականին մոտ է միասնությանը, կարող ենք եզրակացնել, որ ուսումնասիրվող փոփոխականի (վաճառքի ծավալի) և գործակցային փոփոխականի (ջերմաստիճանի) միջև կա սերտ գծային հարաբերություն:

Ֆիշերի F թեստ

Կրիտիկական արժեք F krժամը α = 0.1; ν 1 =1; ν 2 =7-1-1=5 է 4,06: Հաշվարկված արժեքը Ֆ-չափանիշն ավելի մեծ է, քան աղյուսակայինը, հետևաբար, մոդելի հավասարումը նշանակալի է:

Մոտավորության միջին հարաբերական սխալ

Կառուցված գծային զույգ ռեգրեսիոն մոդելն ունի անբավարար ճշգրտություն (>15%) և խորհուրդ չի տրվում օգտագործել վերլուծության և կանխատեսման համար:

Արդյունքում, չնայած այն հանգամանքին, որ վիճակագրական բնութագրերի մեծ մասը բավարարում է դրանց չափանիշները, գծային զույգ ռեգրեսիոն մոդելը հարմար չէ վաճառքի ծավալը կանխատեսելու համար՝ կախված օդի ջերմաստիճանից: Այս փոփոխականների միջև կապի ոչ գծային բնույթն ըստ դիտողական տվյալների միանգամայն հստակ տեսանելի է Նկ. 1-ում: Վերլուծությունը հաստատեց դա։

Մենք կորոշենք էմպիրիկ ռեգրեսիայի գործակիցները b 0 , b 1՝ օգտագործելով MS Excel աղյուսակների պրոցեսորի «Տվյալների վերլուծություն» հավելյալի «Regression» գործիքը։

Գործակիցների որոշման ալգորիթմը հետևյալն է.

1. Մուտքագրեք նախնական տվյալները MS Excel աղյուսակների պրոցեսորում:

2. Զանգահարեք տվյալների վերլուծության հավելումը (Նկար 2):

3. Ընտրեք վերլուծության գործիքը Regression (Նկար 3):

4. Լրացրե՛ք Regression պատուհանի համապատասխան դիրքերը (Նկար 4):

5. Սեղմեք OK կոճակը Regression պատուհանում և ստացեք խնդրի լուծման արձանագրություն (Նկար 5):

Նկար 3 – Ռեգրեսիա գործիքի ընտրություն

Նկար 4 – Ռեգրեսիայի պատուհան

Նկար 5 – Խնդիրը լուծելու արձանագրություն

Գծապատկեր 5-ից երևում է, որ էմպիրիկ ռեգրեսիայի գործակիցները համապատասխանաբար հավասար են.

b 0 = 223,

b1 = 0,0088:

Այնուհետև ամսական y կենսաթոշակի արժեքը կենսապահովման նվազագույն արժեքի հետ կապող զուգակցված գծային ռեգրեսիայի հավասարումը ունի ձև.

.(3.2)

Հաջորդիվ, առաջադրանքին համապատասխան, անհրաժեշտ է գնահատել վիճակագրական հարաբերության սերտությունը x ապրուստի արժեքի և ամսական y կենսաթոշակի արժեքի միջև: Այս գնահատումը կարելի է կատարել՝ օգտագործելով հարաբերակցության գործակիցը: Նկար 5-ում այս գործակցի արժեքը նշանակված է որպես բազմակի R և, համապատասխանաբար, հավասար է 0,038-ի: Քանի որ տեսականորեն այս գործակցի արժեքը գտնվում է –1-ից +1-ի սահմաններում, կարելի է եզրակացնել, որ վիճակագրական կապը x ապրուստի արժեքի և ամսական y կենսաթոշակի արժեքի միջև էական չէ:

Նկար 5-ում ներկայացված «R – քառակուսի» պարամետրը հարաբերակցության գործակցի քառակուսին է և կոչվում է որոշման գործակից: Այս գործակցի արժեքը բնութագրում է ռեգրեսիայով բացատրված y կախյալ փոփոխականի դիսպերսիայի մասնաբաժինը (բացատրական x փոփոխական): Համապատասխանաբար, 1- արժեքը բնութագրում է y փոփոխականի շեղման տեսակարար կշիռը, որն առաջացել է էկոնոմետրիկ մոդելում հաշվի չառնված մյուս բոլոր բացատրական փոփոխականների ազդեցությամբ: Գծապատկեր 5-ից երևում է, որ ստացված էկոնոմետրիկ մոդելում հաշվի չառնված բոլոր բացատրական փոփոխականների մասնաբաժինը մոտավորապես 1 - 0,00145 = 0,998 կամ 99,8% է:

Հաջորդ փուլում, առաջադրանքին համապատասխան, անհրաժեշտ է որոշել x բացատրական փոփոխականի և y կախյալ փոփոխականի կապի աստիճանը՝ օգտագործելով առաձգականության գործակիցը։ Զուգակցված գծային ռեգրեսիայի մոդելի առաձգականության գործակիցը սահմանվում է հետևյալ կերպ.

Հետեւաբար, եթե կյանքի արժեքը փոխվում է 1%-ով, ամսական կենսաթոշակը փոխվում է 0,000758%-ով:

. (3.4)

Դա անելու համար մենք լրացնում ենք բնօրինակ աղյուսակ 1-ը երկու սյունակով, որոնցում մենք որոշում ենք կախվածության (3.2) օգտագործմամբ հաշվարկված արժեքները և տարբերության արժեքը:

Աղյուսակ 3.2. Միջին մոտավոր սխալի հաշվարկ.

Այնուհետև միջին մոտավոր սխալն է

Պրակտիկայից հայտնի է, որ միջին մոտավոր սխալի արժեքը չպետք է գերազանցի (12...15)%-ը.

Վերջին փուլում մենք կգնահատենք մոդելավորման վիճակագրական հավաստիությունը՝ օգտագործելով Fisher's F թեստը: Դա անելու համար մենք կփորձարկենք H 0 զրոյական վարկածը ստացված ռեգրեսիոն հավասարման վիճակագրական աննշանության մասին՝ ըստ պայմանի.

եթե տվյալ նշանակության մակարդակում a = 0.05 F-չափանիշի տեսական (հաշվարկված) արժեքը ավելի մեծ է, քան նրա կրիտիկական արժեքը F crit (աղյուսակային), ապա զրոյական վարկածը մերժվում է, և արդյունքում ստացված ռեգրեսիոն հավասարումն ընդունվում է որպես նշանակալի:

Նկար 5-ից հետևում է, որ F-ը հաշվարկված է = 0,0058: F-չափանիշի կրիտիկական արժեքը որոշվում է FASTER վիճակագրական ֆունկցիայի միջոցով (Նկար 6): Ֆունկցիայի մուտքային պարամետրերն են նշանակության մակարդակը (հավանականությունը) և ազատության աստիճանների քանակը 1 և 2: Զուգակցված ռեգրեսիոն մոդելի համար ազատության աստիճանների թիվը համապատասխանաբար 1 է (մեկ բացատրական փոփոխական) և n-2 = 6: -2=4.

Նկար 6 – Վիճակագրական ֆունկցիայի ավելի արագ պատուհան

Նկար 6-ից երևում է, որ F-թեստի կրիտիկական արժեքը 7.71 է:

Քանի որ F հաշվարկված< F крит, то нулевая гипотеза не отвергается и полученное регрессионное уравнение статистически незначимо.

13. EXCEL-ի միջոցով բազմակի ռեգրեսիայի մոդելի կառուցում:

Հանձնարարության տարբերակին համապատասխան՝ անհրաժեշտ է օգտագործել վիճակագրական նյութ։

1. Կառուցեք գծային բազմակի ռեգրեսիոն հավասարում և բացատրեք դրա պարամետրերի տնտեսական նշանակությունը:

3. Գնահատե՛ք ռեգրեսիոն գործակիցների վիճակագրական նշանակությունը՝ օգտագործելով Student-ի t-թեստը և հավասարման նշանակության մասին զրոյական վարկածը՝ օգտագործելով F-թեստը:

4. Գնահատե՛ք հավասարման որակը՝ որոշելով մոտարկման միջին սխալը:

Զույգ ռեգրեսիոն մոդելի կառուցման սկզբնական տվյալները տրված են Աղյուսակ 3.3-ում:

Աղյուսակ 3.3. Նախնական տվյալներ.

Զուտ եկամուտ, միլիոն ԱՄՆ դոլար	Կապիտալ շրջանառություն, մլ. ԱՄՆ դոլար, x 1	Օգտագործված կապիտալ, մլ. ԱՄՆ դոլար x 2
6,6	6,9	83,6
2,7	93,6	25,4
1,6	10,0	6,4
2,4	31,5	12,5
3,3	36,7	14,3
1,8	13,8	6,5
2,4	64,8	22,7
1,6	30,4	15,8
1,4	12,1	9,3
0,9	31,3	18,9

Ռեգրեսիոն հավասարման կառուցման տեխնոլոգիան նման է 3.1 պարագրաֆում նկարագրված ալգորիթմին: Ռեգրեսիոն հավասարման կառուցման արձանագրությունը ներկայացված է Նկար 7-ում:

ԱՐԴՅՈՒՆՔՆԵՐԻ ԵԶՐԱԿԱՑՈՒԹՅՈՒՆ
Ռեգրեսիայի վիճակագրություն
Հոգնակի Ռ	0,901759207
R-քառակուսի	0,813169667
Նորմալացված R-քառակուսի	0,759789572
Ստանդարտ սխալ	0,789962026
Դիտարկումներ
Տարբերության վերլուծություն
	Դ Ֆ	MS	Ֆ
Հետընթաց		9,50635999	15,23357468
Մնացորդը		0,624040003
Ընդամենը
	Հնարավորություններ	t-վիճակագրություն
Y-հատում	1,113140304	2,270238114
Փոփոխական X 1	-0,000592199	-0,061275574
Փոփոխական X 2	0,063902851	5,496523193