տուն Կանխարգելում Զուգակցված գծային հարաբերակցության գործակիցների մատրիցա։ Զույգ հարաբերակցության գործակիցների մատրիցայի կառուցում

Զուգակցված գծային հարաբերակցության գործակիցների մատրիցա։ Զույգ հարաբերակցության գործակիցների մատրիցայի կառուցում

Սկզբում մոդելում ժամըներառել բոլոր հիմնական բաղադրիչները (հաշվարկված արժեքները նշված են փակագծերում տ-չափանիշներ):

Մոդելի որակը բնութագրվում է որոշման բազմակի գործակիցով r = 0,517, մոտարկման միջին հարաբերական սխալ = 10,4%, մնացորդային շեղում s 2= 1,79 և Ֆդիտելի = 121. Շնորհիվ այն բանի, որ Ֆ obs > Ֆ kr =2,85 α = 0,05, v 1 = 6, v 2= 14, ռեգրեսիոն հավասարումը նշանակալի է և ռեգրեսիոն գործակիցներից առնվազն մեկը՝ β 1, β 2, β 3, β 4, հավասար չէ զրոյի։

Եթե ​​ռեգրեսիայի հավասարման նշանակությունը (վարկած H 0:β 1 = β 2 = β 3 = β 4 = 0-ն ստուգվել է α = 0,05-ում, ապա ռեգրեսիոն գործակիցների նշանակությունը, այսինքն. վարկածներ H0: β ժ = 0 (j = 1, 2, 3, 4), պետք է փորձարկվի 0,05-ից մեծ նշանակության մակարդակով, օրինակ α-ում = 0.1. Այնուհետև α = 0.1, v= 14 բալ տքր = 1.76, և նշանակալի, ինչպես հետևում է (53.41) հավասարումից, ռեգրեսիոն գործակիցներն են β 1, β 2, β 3:

Հաշվի առնելով, որ հիմնական բաղադրիչները փոխկապակցված չեն միմյանց հետ, մենք կարող ենք անմիջապես վերացնել բոլոր աննշան գործակիցները հավասարումից, և հավասարումը կստանա իր ձևը.

(53.42)

Համեմատելով (53.41) և (53.42) հավասարումները՝ մենք տեսնում ենք, որ բացառելով աննշան հիմնական բաղադրիչները. զ 4Եվ զ 5, չի ազդել հավասարման գործակիցների արժեքների վրա բ 0 = 9,52, բ 1 = 0,93, b 2 = 0.66 եւ համապատասխան տ ժ (ժ = 0, 1, 2, 3).

Դա պայմանավորված է հիմնական բաղադրիչների անհամատեղելի բնույթով: Հետաքրքիրն այստեղ սկզբնական ցուցանիշների (53.22), (53.23) և հիմնական բաղադրիչների (53.41), (53.42) ռեգրեսիոն հավասարումների զուգահեռությունն է։

Հավասարումը (53.42) նշանակալի է, քանի որ Ֆ obs = 194 > Ֆքր = 3.01, հայտնաբերվել է α = 0.05, v 1 = 4, v 2= 16. Հավասարման գործակիցները նույնպես նշանակալից են, քանի որ տ ժ > տքր . = 1,746, որը համապատասխանում է α = 0,01, v= 16 համար ժ= 0, 1, 2, 3. Որոշման գործակից r= 0.486 ցույց է տալիս, որ տատանումների 48.6%-ը ժամըառաջին երեք հիմնական բաղադրիչների ազդեցության շնորհիվ։

Հավասարումը (53.42) բնութագրվում է մոտարկման միջին հարաբերական սխալով = 9.99% և մնացորդային շեղումով s 2 = 1,91.

Հիմնական բաղադրիչների ռեգրեսիոն հավասարումը (53.42) ունի մի փոքր ավելի լավ մոտավոր հատկություններ, համեմատած ռեգրեսիոն մոդելի հետ (53.23), որը հիմնված է նախնական ցուցանիշների վրա. r= 0,486 > r= 0,469; = 9,99% < (X) = 10,5% և s 2 (զ) = 1,91 < s 2 (x) = 1.97. Բացի այդ, (53.42) հավասարման մեջ հիմնական բաղադրիչներն են գծային ֆունկցիաներբոլոր սկզբնական ցուցանիշները, մինչդեռ հավասարումը (53.23) ներառում է ընդամենը երկու փոփոխական ( x 1Եվ x 4). Մի շարք դեպքերում անհրաժեշտ է հաշվի առնել, որ մոդելը (53.42) դժվար է մեկնաբանել, քանի որ այն ներառում է երրորդը. հիմնական բաղադրիչ զ 3, որը մենք չենք մեկնաբանել և որի ներդրումն է նախնական ցուցանիշների ընդհանուր ցրման մեջ ( x 1, ..., x 5)կազմում է ընդամենը 8,6%: Այնուամենայնիվ, բացառություն զ 3(53.42) հավասարումից զգալիորեն վատթարանում է մոդելի մոտավոր հատկությունները. r= 0,349; = 12,4% և s 2(զ) = 2,41։ Այնուհետև նպատակահարմար է ընտրել (53.23) հավասարումը որպես եկամտաբերության ռեգրեսիոն մոդել:

Կլաստերային վերլուծություն

IN վիճակագրական հետազոտությունԱռաջնային տվյալների խմբավորումը լուծման հիմնական տեխնիկան է դասակարգման խնդիրներ,և, հետևաբար, հիմք է հավաքված տեղեկատվության հետ հետագա աշխատանքի համար:

Ավանդաբար այս խնդիրը լուծվում է հետևյալ կերպ. Օբյեկտը նկարագրող բազմաթիվ հատկանիշներից ընտրվում է մեկը՝ հետազոտողի տեսանկյունից առավել տեղեկատվականը, և տվյալները խմբավորվում են այս հատկանիշի արժեքներին համապատասխան: Եթե ​​անհրաժեշտ է դասակարգել մի քանի չափանիշների հիման վրա, որոնք դասակարգվում են ըստ կարևորության, ապա նախ դասակարգումն իրականացվում է ըստ առաջին բնութագրիչի, ապա ստացված դասերից յուրաքանչյուրը բաժանվում է ենթադասերի՝ ըստ երկրորդ բնութագրի. և այլն։ Համակցված վիճակագրական խմբավորումների մեծ մասը կառուցված է նույն ձևով:

Այն դեպքերում, երբ հնարավոր չէ կազմակերպել դասակարգման բնութագրերը, օգտագործվում է բազմաչափ խմբավորման ամենապարզ մեթոդը` ինտեգրալ ցուցիչի (ցուցանիշի) ստեղծումը, որը գործառականորեն կախված է սկզբնական բնութագրերից, որին հաջորդում է դասակարգումը ըստ այս ցուցանիշի:

Այս մոտեցման մշակումը դասակարգման տարբերակ է, որը հիմնված է մի քանի ընդհանուր ցուցանիշների (հիմնական բաղադրիչների) վրա, որոնք ստացվել են գործոնի կամ բաղադրիչի վերլուծության մեթոդների միջոցով:

Եթե ​​կան մի քանի առանձնահատկություններ (նախնական կամ ընդհանրացված), դասակարգման խնդիրը կարող է լուծվել կլաստերային վերլուծության մեթոդներով, որոնք տարբերվում են այլ բազմաչափ դասակարգման մեթոդներից ուսուցման նմուշների բացակայությամբ, այսինքն. a priori տեղեկատվություն բնակչության բաշխվածության մասին։

Դասակարգման խնդրի լուծման սխեմաների միջև եղած տարբերությունները մեծապես որոշվում են նրանով, թե ինչ են նշանակում «նմանություն» և «նմանության աստիճան» հասկացությունները:

Աշխատանքի նպատակը ձևակերպելուց հետո բնական է փորձել որոշել որակի չափանիշները, օբյեկտիվ գործառույթը, որոնց արժեքները թույլ կտան համեմատել. տարբեր սխեմաներդասակարգումները.

Տնտեսական հետազոտություններում օբյեկտիվ գործառույթ, որպես կանոն, պետք է նվազագույնի հասցնի մի շարք օբյեկտների վրա որոշված ​​որոշ պարամետր (օրինակ, սարքավորումների դասակարգման նպատակը կարող է լինել խմբավորում, որը նվազագույնի է հասցնում վերանորոգման աշխատանքների ժամանակի և գումարի ընդհանուր արժեքը):

Այն դեպքերում, երբ հնարավոր չէ ձևակերպել առաջադրանքի նպատակը, դասակարգման որակի չափանիշ կարող է լինել հայտնաբերված խմբերի իմաստալից մեկնաբանության հնարավորությունը:

Դիտարկենք հետևյալ խնդիրը. Թող հավաքածուն ուսումնասիրվի Պառարկաներ, որոնցից յուրաքանչյուրը բնութագրվում է կչափված նշաններ. Պահանջվում է այս ամբողջությունը բաժանել խմբերի (դասերի), որոնք որոշակի իմաստով միատարր են։ Միևնույն ժամանակ, բաշխման բնույթի մասին a priori տեղեկատվություն գործնականում չկա կ- ծավալային վեկտոր Xդասարանների ներսում։

Բաժանման արդյունքում ստացված խմբերը սովորաբար կոչվում են կլաստերներ* (տաքսա**, պատկերներ), դրանց գտնելու մեթոդները՝ կլաստերային վերլուծություն (համապատասխանաբար՝ թվային տաքսոնոմիա կամ օրինաչափությունների ճանաչում՝ ինքնաուսուցմամբ)։

* Կլաստեր(անգլերեն) - տարրերի խումբ, որը բնութագրվում է որոշ ընդհանուր հատկությամբ:

**Թահոպ(Անգլերեն) - ցանկացած կատեգորիայի համակարգված խումբ:

Հենց սկզբից պետք է հստակ հասկանալ, թե դասակարգման երկու խնդիրներից որն է լուծելու։ Եթե ​​սովորական մուտքագրման խնդիրը լուծվում է, ապա դիտարկումների ամբողջությունը բաժանվում է համեմատաբար փոքր թվով խմբավորման տարածքների (օրինակ՝ ինտերվալ տատանումների շարքմիաչափ դիտարկումների դեպքում), որպեսզի նման շրջանի տարրերը հնարավորինս մոտ լինեն միմյանց։

Մեկ այլ խնդրի լուծումը դիտումների արդյունքների բնական շերտավորումն է` միմյանցից որոշակի հեռավորության վրա ընկած հստակ սահմանված կլաստերների մեջ:

Եթե ​​առաջին տիպավորման խնդիրը միշտ լուծում ունի, ապա երկրորդ դեպքում կարող է պարզվել, որ դիտարկումների բազմությունը չի բացահայտում բնական շերտավորումը կլաստերների մեջ, այսինքն. կազմում է մեկ կլաստեր:

Չնայած կլաստերային վերլուծության շատ մեթոդներ բավականին տարրական են, աշխատանքի մեծ մասը, որտեղ դրանք առաջարկվել են, վերաբերում են վերջին տասնամյակին: Սա բացատրվում է արդյունավետ լուծումկլաստերի որոնման առաջադրանքներ, որոնք պահանջում են մեծ թվով թվաբանական և տրամաբանական գործողություններ, հնարավոր դարձավ միայն համակարգչային տեխնիկայի առաջացման ու զարգացման շնորհիվ։

Կլաստերային վերլուծության խնդիրներում նախնական տվյալների ներկայացման սովորական ձևը մատրիցն է

որի յուրաքանչյուր տողը ներկայացնում է չափման արդյունքները կդիտարկված նշանները հետազոտված օբյեկտներից մեկում. Հատուկ իրավիճակներում և՛ օբյեկտների խմբավորումը, և՛ առանձնահատկությունների խմբավորումը կարող են հետաքրքրություն առաջացնել: Այն դեպքերում, երբ այս երկու առաջադրանքների միջև տարբերությունը էական չէ, օրինակ, որոշ ալգորիթմներ նկարագրելիս մենք կօգտագործենք միայն «օբյեկտ» տերմինը, ներառյալ «առանձնահատկություն» տերմինը այս հայեցակարգում:

Մատրիցա XԿլաստերային վերլուծության խնդիրներում տվյալները ներկայացնելու միակ միջոցը չէ: Երբեմն նախնական տեղեկատվությունը տրվում է քառակուսի մատրիցայի տեսքով

տարր r ijորը որոշում է հարևանության աստիճանը ես-րդ օբյեկտը ժ-մու.

Կլաստերային վերլուծության ալգորիթմների մեծ մասը հիմնված է հեռավորությունների (կամ մոտիկության) մատրիցայի վրա կամ պահանջում է դրա առանձին տարրերի հաշվարկ, այնպես որ, եթե տվյալները ներկայացված են ձևով. X,ապա կլաստերների որոնման խնդրի լուծման առաջին փուլը կլինի օբյեկտների կամ հատկանիշների միջև հեռավորությունների կամ մոտիկության հաշվարկման մեթոդի ընտրությունը:

Բնութագրերի միջև հարևանությունը որոշելու հարցը որոշ չափով ավելի հեշտ է լուծել: Որպես կանոն, հատկանիշների կլաստերային վերլուծությունը հետապնդում է նույն նպատակները, ինչ գործոնային վերլուծությունփոխկապակցված հատկանիշների խմբերի նույնականացում, որոնք արտացոլում են ուսումնասիրվող օբյեկտների որոշակի կողմը: Հարևանության չափանիշն այս դեպքում բազմազան է վիճակագրական գործակիցներհաղորդակցություններ.


Առնչվող տեղեկություններ.


Գործոնները, որոնք համակցված են...

Եվ համակողմանի:

4. Մոդելի մեջ բազմակի ռեգրեսիաԳործոնների միջև զուգակցված հարաբերակցության գործակիցների մատրիցայի որոշիչը և մոտ է զրոյի: Սա նշանակում է, որ գործոնները և ... գործոնների բազմակողմանիությունը:

5. Էկոնոմետրիկ մոդելի համար գծային հավասարումտիպի բազմակի ռեգրեսիա, կառուցվել է զուգակցված գործակիցների մատրիցա գծային հարաբերակցություն (y- կախված փոփոխական; x (1),x (2), x (3), x (4)- անկախ փոփոխականներ):


Գոյություն ունեցող (սերտորեն կապված) անկախ (բացատրական) փոփոխականներ չենx(2)Եվ x (3)

1. Տրված է էկոնոմետրիկ ռեգրեսիոն մոդելի կառուցման նախնական տվյալների աղյուսակ.

Կեղծ փոփոխականներ չեն

աշխատանքային փորձ

աշխատանքի արտադրողականությունը

2. Մսի սպառման կախվածությունը սպառողի եկամտի մակարդակից և սեռից ուսումնասիրելիս կարող ենք խորհուրդ տալ...

օգտագործել կեղծ փոփոխական՝ սպառողի սեռ

Բնակչությունը բաժանել երկու մասի՝ կին սպառողների և տղամարդ սպառողների համար

3. Մենք ուսումնասիրում ենք բնակարանի գնի կախվածությունը ( ժամը) իր բնակելի տարածքից ( X) և տան տեսակը: Մոդելը ներառում է կեղծ փոփոխականներ, որոնք արտացոլում են դիտարկվող տների տեսակները՝ մոնոլիտ, պանել, աղյուս: Ստացվել է ռեգրեսիայի հավասարումը.
Որտեղ ,
Աղյուսի և մոնոլիտի հատուկ ռեգրեսիոն հավասարումներ են ...

տան տիպի աղյուսի համար

տան տիպի մոնոլիտի համար

4. Վերլուծելիս արդյունաբերական ձեռնարկություններերեք շրջաններում (Մարի Էլի Հանրապետություն, Չուվաշիայի Հանրապետություն, Թաթարստանի Հանրապետություն) կառուցվել են երեք մասնակի ռեգրեսիայի հավասարումներ.

Մարի Էլի Հանրապետության համար;

Չուվաշիայի Հանրապետության համար;

Թաթարստանի Հանրապետության համար։

Նշեք կեղծ փոփոխականների տեսակը և կեղծ փոփոխականների հետ հավասարումը, որն ընդհանրացնում է մասնակի ռեգրեսիայի երեք հավասարումները:

5. Էկոնոմետրիկայի մեջ կեղծ փոփոխականը սովորաբար համարվում է...

փոփոխական, որն ընդունում է 0 և 1 արժեքները

քանակական կերպով նկարագրելով որակական բնութագիրը

1. Բնակչության մեկ շնչի հաշվով միջին դրամական եկամուտների կախվածության ռեգրեսիոն մոդելի համար (RUB, ժամըՏարածաշրջանային համախառն արտադրանքի ծավալից (հազար ռուբլի, x 1) և գործազրկության մակարդակը առարկայից (%, x 2) ստացված է հավասարումը. Փոփոխականի համար ռեգրեսիայի գործակցի արժեքը x 2ցույց է տալիս, որ երբ գործազրկության մակարդակը փոխվում է 1%-ով, մեկ շնչի հաշվով միջին դրամական եկամուտը ______ ռուբլի՝ համախառն տարածաշրջանային արդյունքի հաստատուն արժեքով:

կփոխվի (-1,67)

2. Գծային բազմակի ռեգրեսիայի հավասարման մեջ. , որտեղ է հիմնական միջոցների արժեքը (հազար ռուբլի); - աշխատողների թիվը (հազար մարդ); y- ծավալը արդյունաբերական արտադրություն(հազար ռուբլի) պարամետր փոփոխականով x 1, հավասար է 10,8-ի, նշանակում է, որ հիմնական միջոցների ծավալի _____-ով աճով արդյունաբերական արտադրանքի ծավալը _____ աշխատողների մշտական ​​թվով:


1 հազար ռուբլու դիմաց: ... կավելանա 10,8 հազար ռուբլով:

3. Հայտնի է, որ կախյալ փոփոխականի մնացորդային շեղման տեսակարար կշիռը նրա ընդհանուր դիսպերսիայում կազմում է 0,2։ Այնուհետև որոշման գործակցի արժեքը կազմում է ... 0,8

4. Կառուցվել է էկոնոմետրիկ մոդել՝ շահույթից կախվածության համարարտադրության միավորի վաճառք (ռուբ., ժամը) արժեքից աշխատանքային կապիտալձեռնարկություններ (հազար ռուբլի, x 1): Հետևաբար, միջին չափըվաճառքից ստացված շահույթը, որը կախված չէ ձեռնարկության շրջանառու միջոցների ծավալից, կազմում է _____ ռուբլի: 10.75

5. F-վիճակագրությունը հաշվարկվում է որպես ______ շեղումների հարաբերակցություն ________ դիսպերսիայի՝ հաշվարկված ազատության աստիճանի հաշվով: գործոնային...մնացորդային

1. Էկոնոմետրիկ ռեգրեսիոն հավասարման մոդելի համար մոդելի սխալը սահմանվում է որպես ______ կախված փոփոխականի իրական արժեքի և դրա գնահատված արժեքի միջև: Տարբերություն

2. Քանակը կոչվում է...պատահական բաղադրիչ

3. Ռեգրեսիոն հավասարման էկոնոմետրիկ մոդելում կախված փոփոխականի փաստացի արժեքի շեղումը նրա հաշվարկված արժեքից բնութագրում է ... մոդելի սխալը.

4. Հայտնի է, որ բացատրված շեղումների տեսակարար կշիռը ընդհանուր դիսպերսիայում կազմում է 0,2: Այնուհետև որոշման գործակցի արժեքը ... 0,2 է

5. Մեթոդով նվազագույն քառակուսիներըզույգ հավասարման պարամետրեր գծային ռեգրեսիա որոշվում են ______ պայմանով մնացորդներ:նվազագույնի հասցնելով քառակուսիների գումարը

1. Մնացորդների մեջ ավտոկորելացիան հայտնաբերելու համար օգտագործեք...

Durbin-Watson վիճակագրություն

2. Հայտնի է, որ առաջին կարգի մնացորդների ավտոկորելյացիոն գործակիցըհավասար է –0,3-ի: Տրված են նաև Դուրբին-Վաթսոնի վիճակագրության կրիտիկական արժեքները՝ անհայտ թվով դիտարկումներով տվյալ քանակի պարամետրերի համար: Ելնելով այս բնութագրերից՝ կարող ենք եզրակացնել, որ...մնացորդների ավտոկոռելացիա չկա

1. Հաշվել զույգ հարաբերակցության գործակիցների մատրիցը; վերլուծել ստացված բնութագրի միացման սերտությունը և ուղղությունը Յյուրաքանչյուր գործոնի հետ X; նախահաշիվը վիճակագրական նշանակությունհարաբերակցության գործակիցներ r(Յ,X i); ընտրել առավել տեղեկատվական գործոնը:

2. Կառուցեք զուգավորված ռեգրեսիոն մոդել՝ առավել տեղեկատվական գործոնով; տալ ռեգրեսիայի գործակցի տնտեսական մեկնաբանություն:

3. Գնահատեք մոդելի որակը՝ օգտագործելով մոտարկման միջին հարաբերական սխալը, որոշման գործակիցը և Ֆիշերի F թեստը (ընդունել նշանակության մակարդակ α=0,05):

4. γ=80% վստահության հավանականությամբ գուշակե՛ք ցուցանիշի միջին արժեքը Յ(գործոնների կանխատեսման արժեքները տրված են Հավելված 6-ում): Ներկայացրե՛ք գրաֆիկորեն փաստացի և մոդելային արժեքները Յ, կանխատեսման արդյունքներ.

5. Օգտագործելով ներառման մեթոդը, կառուցել երկգործոն մոդելներ՝ դրանցում պահպանելով ամենատեղեկատվական գործոնը; կառուցել երեք գործոն մոդելի հետ ամբողջական ցանկըգործոններ.

6. Ընտրեք կառուցված բազմաթիվ մոդելներից լավագույնը: Տվեք դրա գործակիցների տնտեսական մեկնաբանությունը:

7. Ստուգեք բազմակի ռեգրեսիայի գործակիցների նշանակությունը՝ օգտագործելով տ–Ուսանողի թեստ (ընդունել նշանակալիության մակարդակ α=0.05): Արդյո՞ք բազմակի մոդելի որակը բարելավվել է զուգակցված մոդելի համեմատ:

8. Գնահատեք գործոնների ազդեցությունը արդյունքի վրա՝ օգտագործելով առաձգականության գործակիցները, բետա և դելտա գործակիցները:

Առաջադրանք 2. Միակողմանի ժամանակային շարքի մոդելավորում

Հավելված 7-ը ցույց է տալիս ժամանակային շարքերը Y(t)սոցիալ-տնտեսական ցուցանիշների համար Ալթայի շրջան 2000 թվականից մինչև 2011 թվականն ընկած ժամանակահատվածում: Պահանջվում է ուսումնասիրել առաջադրանքի տարբերակին համապատասխան ցուցանիշի դինամիկան:

Տարբերակ Ցուցանիշի անվանումը, անվանումը, չափման միավորը
Ե1 Սպառողների միջին ծախսերը մեկ շնչի հաշվով (ամսական), ռուբ.
Y2 Աղտոտիչների արտանետումները դեպի մթնոլորտային օդը, հազար տոննա
Y3 Երկրորդային բնակարանային շուկայում միջին գները (տարեվերջին, ընդհանուր մակերեսի մեկ քառակուսի մետրի համար), ռուբլի
Ե4 Ծավալը վճարովի ծառայություններմեկ շնչի հաշվով, ռուբ
Ե5 Տնտեսությունում զբաղվածների միջին տարեկան թիվը, հազ
Y6 Սեփական մարդատար ավտոմեքենաների քանակը 1000 բնակչի հաշվով (տարեվերջին), միավոր
Y7 Մեկ շնչի հաշվով կանխիկ միջին եկամուտը (ամսական), ռուբ.
Y8 Սպառողական գների ինդեքս (դեկտեմբերը նախորդ տարվա դեկտեմբերի համեմատ), %
Յ9 Ներդրումներ հիմնական միջոցներում (փաստացի գներով), միլիոն ռուբլի
Ե10 Մանրածախ առևտրի շրջանառությունը մեկ շնչի հաշվով (փաստացի գներով), ռուբլի


Աշխատանքային կարգը

1. Կառուցեք գծային ժամանակային շարքի մոդել, որի պարամետրերը կարելի է գնահատել նվազագույն քառակուսիներով: Բացատրե՛ք ռեգրեսիայի գործակիցի նշանակությունը:

2. Գնահատել կառուցված մոդելի համարժեքությունը՝ օգտագործելով պատահականության, անկախության և մնացորդային բաղադրիչի համապատասխանությունը նորմալ բաշխման օրենքին:

3. Գնահատեք մոդելի ճշգրտությունը՝ հիմնվելով մոտարկման միջին հարաբերական սխալի կիրառման վրա:

4. Քննարկվող ցուցանիշը կանխատեսել մեկ տարի առաջ (կանխատեսման միջակայքը հաշվարկել ժ վստահության հավանականությունը 70%).

5. Գրաֆիկորեն ներկայացրեք ցուցիչի փաստացի արժեքները, մոդելավորման և կանխատեսման արդյունքները:

6. Հաշվի՛ր լոգարիթմական, բազմանդամ (2-րդ աստիճանի բազմանդամ), հզորության, էքսպոնենցիալ և հիպերբոլիկ միտումների պարամետրերը։ Ելնելով գրաֆիկական պատկերից և որոշման ինդեքսի արժեքից՝ ընտրեք առավելագույնը հարմար տեսքմիտում.

7. Օգտագործելով լավագույն ոչ գծային մոդելը, կատարեք տվյալ ցուցանիշի կետային կանխատեսումը գալիք տարվա համար: Համեմատեք ստացված արդյունքը գծային մոդելի միջոցով կառուցված վստահության կանխատեսման միջակայքի հետ:

ՕՐԻՆԱԿ

Մահապատիժներ թեստային աշխատանք

Խնդիր 1

Ընկերությունը վաճառում է օգտագործված մեքենաներ։ Էկոնոմետրիկ մոդելավորման համար ցուցանիշների անվանումները և նախնական տվյալները ներկայացված են աղյուսակում.

Վաճառքի գինը, հազ.ե. ( Յ) Նոր մեքենայի գինը, հազ.ե. ( X1) Ծառայության ժամկետ, տարիներ ( X2) Ձախ ղեկ՝ 1, աջ ղեկ՝ 0, ( X3)
8,33 13,99 3,8
10,40 19,05 2,4
10,60 17,36 4,5
16,58 25,00 3,5
20,94 25,45 3,0
19,13 31,81 3,5
13,88 22,53 3,0
8,80 16,24 5,0
13,89 16,54 2,0
11,03 19,04 4,5
14,88 22,61 4,6
20,43 27,56 4,0
14,80 22,51 3,3
26,05 31,75 2,3

Պահանջվում է:

1. Հաշվել զույգ հարաբերակցության գործակիցների մատրիցը; վերլուծել ստացված Y բնութագրիչի և X գործոններից յուրաքանչյուրի միջև կապի սերտությունն ու ուղղությունը. գնահատել հարաբերակցության գործակիցների վիճակագրական նշանակությունը r(Y, X i); ընտրել առավել տեղեկատվական գործոնը:

Մենք օգտագործում ենք Excel (Տվյալների / Տվյալների վերլուծություն / CORRELATION):

Մենք ստանում ենք բոլոր առկա փոփոխականների միջև զույգ հարաբերակցության գործակիցների մատրիցա.

U X1 X2 X3
U
X1 0,910987
X2 -0,4156 -0,2603
X3 0,190785 0,221927 -0,30308

Եկեք վերլուծենք ստացված բնութագրի միջև հարաբերակցության գործակիցները Յև գործոններից յուրաքանչյուրը X j:

> 0, հետևաբար, փոփոխականների միջև ՅԵվ X 1 կա ուղղակի հարաբերակցություն՝ որքան բարձր է նոր մեքենայի գինը, այնքան բարձր է վաճառքի գինը:

> 0.7 – այս կախվածությունը մոտ է:

< 0, значит, между переменными ՅԵվ X 2 դիտարկված

հակադարձ հարաբերակցություն. մեքենաների վաճառքի գինն ավելի ցածր է

երկար սպասարկման ժամկետով բջջային հեռախոսներ.

– այս կախվածությունը չափավոր է, ավելի մոտ թույլին:

> 0, ինչը նշանակում է փոփոխականների միջև ՅԵվ X 3 կա ուղիղ հարաբերակցություն՝ ձախ ղեկով մեքենաների վաճառքի գինն ավելի բարձր է։

< 0,4 – эта зависимость слабая.

Գտնված հարաբերակցության գործակիցների նշանակությունը ստուգելու համար օգտագործում ենք Student-ի թեստը։

Յուրաքանչյուր հարաբերակցության գործակցի համար եկեք հաշվարկենք տ- վիճակագրություն ըստ բանաձևի և մուտքագրեք հաշվարկի արդյունքները հարաբերակցության աղյուսակի լրացուցիչ սյունակում.

U X1 X2 X3 t-վիճակագրություն
U
X1 0,910987 7,651524603
X2 -0,4156 -0,2603 1,582847988
X3 0,190785 0,221927 -0,30308 0,673265587

Ըստ նշանակության մակարդակում Ուսանողների բաշխման կրիտիկական կետերի աղյուսակի և ազատության աստիճանների քանակը, որոնք մենք սահմանում ենք կրիտիկական արժեք(Հավելված 1, կամ STUDARASTER ֆունկցիա):Y և ծառայության ժամկետը X 2-ը հուսալի է:

< , следовательно, коэффициент не является значимым. На основании выборочных данных нет оснований утверждать, что зависимость между ценой реализации Յև ղեկի դիրքը X 3-ը հուսալի է:

Այսպիսով, ամենամոտ և էական հարաբերությունը նկատվում է վաճառքի գնի միջև Յև նոր մեքենայի գինը X 1 ; գործոն X 1-ը ամենատեղեկատվականն է:

y x (1) x (2) x (3) x (4) x (5)
y 1.00 0.43 0.37 0.40 0.58 0.33
x (1) 0.43 1.00 0.85 0.98 0.11 0.34
x (2) 0.37 0.85 1.00 0.88 0.03 0.46
x (3) 0.40 0.98 0.88 1.00 0.03 0.28
x (4) 0.58 0.11 0.03 0.03 1.00 0.57
x (5) 0.33 0.34 0.46 0.28 0.57 1.00

Զուգակցված հարաբերակցության գործակիցների մատրիցայի վերլուծությունը ցույց է տալիս, որ արդյունավետ ցուցանիշն առավել սերտորեն կապված է ցուցանիշի հետ. x(4) - 1 հեկտարի համար սպառվող պարարտանյութի քանակը ():

Միևնույն ժամանակ, ատրիբուտ-փաստարկների կապը բավականին սերտ է։ Այսպիսով, անիվավոր տրակտորների քանակի միջև կա գործնականորեն ֆունկցիոնալ հարաբերություն ( x(1)) և մակերեսային հողագործության գործիքների քանակը .

Բազմագծայինության առկայությունը ցույց են տալիս նաև հարաբերակցության գործակիցները և . Հաշվի առնելով ցուցանիշների սերտ հարաբերությունները x (1) , x(2) և x(3), մեջ ռեգրեսիոն մոդելՆրանցից միայն մեկը կարող է մուտք գործել բերքատվություն:

Բազմագծայինության բացասական ազդեցությունը ցույց տալու համար դիտարկեք եկամտաբերության ռեգրեսիոն մոդելը, ներառյալ բոլոր մուտքային ցուցանիշները.

F obs = 121:

Հավասարման գործակիցների գնահատումների ստանդարտ շեղումների ճշգրտված գնահատականների արժեքները նշված են փակագծերում. .

Հետևյալ համարժեքության պարամետրերը ներկայացված են ռեգրեսիոն հավասարման ներքո. որոշման բազմակի գործակից; մնացորդային շեղումների շտկված գնահատականը, մոտարկման միջին հարաբերական սխալը և չափանիշի հաշվարկված արժեքը F obs = 121:

Ռեգրեսիայի հավասարումը նշանակալի է, քանի որ F obs = 121 > F kp = 2,85 հայտնաբերված աղյուսակից Ֆ-բաշխումները a=0.05-ում; n 1 =6 և n 2 =14:

Սրանից հետևում է, որ Q¹0, այսինքն. և q հավասարման գործակիցներից առնվազն մեկը ժ (ժ= 0, 1, 2, ..., 5) զրո չէ:

Անհատական ​​ռեգրեսիոն H0 գործակիցների նշանակության մասին վարկածը ստուգելու համար q j =0, որտեղ ժ=1,2,3,4,5, համեմատե՛ք կրիտիկական արժեքը տ kp = 2.14, հայտնաբերված աղյուսակից տ-բաշխումները նշանակության մակարդակով a=2 Ք=0.05 և ազատության աստիճանների թիվը n=14, հաշվարկված արժեքով: Հավասարումից բխում է, որ ռեգրեսիայի գործակիցը վիճակագրորեն նշանակալի է միայն այն դեպքում, երբ x(4) ½-ից սկսած տ 4 ½=2,90 > տ kp = 2,14.



Տնտեսական մեկնաբանության ենթակա չէ բացասական նշաններռեգրեսիայի գործակիցները ժամը x(1) և x(5) . Գործակիցների բացասական արժեքներից հետևում է, որ անիվավոր տրակտորներով գյուղատնտեսության հագեցվածության աճը ( x(1)) և բույսերի առողջության արտադրանք ( x(5)) բացասաբար է ազդում բերքատվության վրա: Հետևաբար, ստացված ռեգրեսիոն հավասարումն անընդունելի է:

Նշանակալի գործակիցներով ռեգրեսիոն հավասարում ստանալու համար մենք օգտագործում ենք քայլ առ քայլ ալգորիթմռեգրեսիոն վերլուծություն. Սկզբում մենք օգտագործում ենք քայլ առ քայլ ալգորիթմ՝ փոփոխականների վերացումով։

Բացառենք փոփոխականը մոդելից x(1) , որը համապատասխանում է նվազագույնին բացարձակ արժեքարժեքը ½ տ 1 ½=0,01: Մնացած փոփոխականների համար մենք կրկին կառուցում ենք ռեգրեսիայի հավասարումը.

Ստացված հավասարումը նշանակալի է, քանի որ F դիտարկված = 155 > F kp = 2,90, հայտնաբերված նշանակության մակարդակում a = 0,05 և ազատության աստիճանների թվերը n 1 = 5 և n 2 = 15 ըստ աղյուսակի: Ֆ- բաշխում, այսինքն. վեկտոր q¹0. Այնուամենայնիվ, միայն ռեգրեսիայի գործակիցը ժամը x(4) . Մոտավոր արժեքներ ½ տ j ½ այլ գործակիցների համար ավելի քիչ է տ kr = 2,131, հայտնաբերված աղյուսակից տ-բաշխումները a=2-ում Ք=0.05 և n=15:

Փոփոխականը մոդելից բացառելով x(3) , որը համապատասխանում է նվազագույն արժեքին տ 3 =0.35 և մենք ստանում ենք ռեգրեսիայի հավասարումը.

(2.9)

Ստացված հավասարման մեջ գործակիցը ժամը x(5) . Բացառելով x(5) մենք ստանում ենք ռեգրեսիայի հավասարումը.

(2.10)

Մենք ստացանք նշանակալի հավասարումռեգրեսիաներ էական և մեկնաբանելի գործակիցներով։

Այնուամենայնիվ, ստացված հավասարումը մեր օրինակում եկամտաբերության միակ «լավ» և «լավագույն» մոդելը չէ:

Եկեք դա ցույց տանք Բազմագծայինության պայմաններում փոփոխականների ներառմամբ փուլային ալգորիթմն ավելի արդյունավետ է:Առաջին քայլը եկամտաբերության մոդելում yներառված փոփոխական x(4) , որն ունի ամենաբարձր հարաբերակցության գործակիցը y, բացատրվում է փոփոխականով - r(y,x(4))=0,58. Երկրորդ քայլում, ներառյալ հավասարումը հետ միասին x(4) փոփոխականներ x(1) կամ x(3), մենք կստանանք մոդելներ, որոնք տնտեսական պատճառներով և վիճակագրական բնութագրերով գերազանցում են (2.10).

(2.11)

(2.12)

Հավասարման մեջ մնացած երեք փոփոխականներից որևէ մեկը ներառելը վատթարանում է դրա հատկությունները: Տես, օրինակ, հավասարումը (2.9):

Այսպիսով, մենք ունենք եկամտաբերության երեք «լավ» մոդել, որոնցից պետք է ընտրել մեկը՝ տնտեսական և վիճակագրական նկատառումներով։

Ըստ վիճակագրական չափանիշներամենադեկվատ մոդելն է (2.11): Այն համապատասխանում է մնացորդային շեղման նվազագույն արժեքներին = 2,26 և մոտարկման միջին հարաբերական սխալին և բարձրագույն արժեքներև F obs = 273:

Մի քանի վատագույն կատարումըմոդելը (2.12) ունի համարժեքություն, իսկ հետո մոդելը (2.10):

Այժմ մենք կընտրենք լավագույն մոդելները (2.11) և (2.12): Այս մոդելները տարբերվում են միմյանցից փոփոխականների առումով x(1) և x(3) . Այնուամենայնիվ, եկամտաբերության մոդելներում փոփոխականը x(1) (անիվավոր տրակտորների քանակը 100 հա-ում) ավելի նախընտրելի է, քան փոփոխականը x(3) (մակերեսային հողագործության գործիքների քանակը 100 հա-ի վրա), որը որոշ չափով երկրորդական է (կամ բխում է. x (1)).

Այս առումով, տնտեսական նկատառումներից ելնելով, նախապատվությունը պետք է տրվի մոդելին (2.12): Այսպիսով, փուլային ռեգրեսիոն վերլուծության ալգորիթմն իրականացնելուց հետո՝ փոփոխականների ընդգրկմամբ և հաշվի առնելով այն փաստը, որ երեք հարակից փոփոխականներից միայն մեկը պետք է մտնի հավասարում ( x (1) , x(2) կամ x(3)) ընտրել վերջնական ռեգրեսիայի հավասարումը.

Հավասարումը նշանակալի է a=0.05-ում, քանի որ F obs = 266 > F kp = 3.20, հայտնաբերված աղյուսակից Ֆ-բաշխումները a=-ում Ք=0,05; n 1 =3 և n 2 =17: ½ հավասարման բոլոր ռեգրեսիայի գործակիցները նույնպես նշանակալի են տ j½> տ kp(a=2 Ք=0,05; n=17)=2.11. Ռեգրեսիոն q 1 գործակիցը պետք է համարվի նշանակալի (q 1 ¹0) տնտեսական պատճառներով, մինչդեռ. տ 1 = 2,09 միայն մի փոքր պակաս տ kp = 2.11.

Ռեգրեսիոն հավասարումից հետևում է, որ 100 հեկտար վարելահողին տրակտորների քանակի աճը մեկով (ֆիքսված արժեքով) x(4)) հանգեցնում է հացահատիկի բերքատվության ավելացմանը միջինը 0,345 ց/հա-ով։

Էլաստիկության գործակիցների մոտավոր հաշվարկը e 1 »0,068 և e 2 »0,161 ցույց է տալիս, որ աճող ցուցանիշներով. x(1) և x(4) 1%-ով, հացահատիկի բերքատվությունը միջինում ավելանում է համապատասխանաբար 0,068%-ով և 0,161%-ով։

Բազմակի գործակիցորոշումը ցույց է տալիս, որ եկամտաբերության տատանումների միայն 46.9%-ն է բացատրվում մոդելում ներառված ցուցանիշներով ( x(1) և x(4)), այսինքն՝ բուսաբուծության հագեցվածությունը տրակտորներով և պարարտանյութերով։ Մնացած տատանումները պայմանավորված են չհաշվառված գործոնների գործողությամբ ( x (2) , x (3) , x(5), եղանակային պայմաններ և այլն): Մոտավորության միջին հարաբերական սխալը բնութագրում է մոդելի համարժեքությունը, ինչպես նաև մնացորդային շեղման արժեքը: Ռեգրեսիոն հավասարումը մեկնաբանելիս հետաքրքրություն են ներկայացնում մոտարկման հարաբերական սխալների արժեքները. . Հիշենք, որ արդյունավետ ցուցիչի մոդելային արժեքը բնութագրում է միջին եկամտաբերության արժեքը դիտարկվող շրջանների ամբողջության համար՝ պայմանով, որ բացատրական փոփոխականների արժեքները x(1) և x(4) ամրագրված են նույն մակարդակի վրա, մասնավորապես x (1) = x i(1) և x (4) = xi(4) . Այնուհետև, ըստ d-ի արժեքների եսԴուք կարող եք համեմատել շրջանները ըստ եկամտաբերության: Տարածքներ, որոնց d արժեքները համապատասխանում են ես>0, ունեն միջինից բարձր եկամտաբերություն, իսկ դ ես<0 - ниже среднего.

Մեր օրինակում բերքատվության առումով բուսաբուծությունն ամենաարդյունավետն է դ–ին համապատասխանող տարածքում 7 =28%, որտեղ եկամտաբերությունը 28%-ով բարձր է տարածաշրջանային միջինից, իսկ ամենաքիչ արդյունավետը d-ով տարածքում է. 20 =-27,3%.


Առաջադրանքներ և վարժություններ

2.1. Ընդհանուր բնակչությունից ( y, x (1) , ..., x(ժ)), որտեղ yունի նորմալ բաշխման օրենք՝ պայմանական մաթեմատիկական ակնկալիքով և շեղում s 2, պատահական նմուշ n, թող գնա ( y i, x i (1) , ..., x i(ժ)) - արդյունք եսրդ դիտարկումը ( ես=1, 2, ..., n) Որոշեք՝ ա) վեկտորի նվազագույն քառակուսիների գնահատման մաթեմատիկական ակնկալիքը ք; բ) վեկտորի ամենափոքր քառակուսիների գնահատման կովարիանս մատրիցը ք; գ) գնահատման մաթեմատիկական ակնկալիքը.

2.2. Ըստ 2.1 խնդրի պայմանների՝ գտե՛ք ռեգրեսիայի պատճառով քառակուսի շեղումների գումարի մաթեմատիկական ակնկալիքը, այսինքն. EQ Ռ, Որտեղ

.

2.3. Համաձայն 2.1 խնդրի պայմանների՝ որոշեք ռեգրեսիոն գծերի նկատմամբ մնացորդային տատանումների արդյունքում առաջացած քառակուսի շեղումների գումարի մաթեմատիկական ակնկալիքը, այսինքն. EQ ost, որտեղ

2.4. Ապացուցեք, որ երբ H 0 վարկածը կատարվում է՝ q=0 վիճակագրություն

ունի F-բաշխում n 1 =p+1 և n 2 =n-p-1 ազատության աստիճաններով:

2.5. Ապացուցեք, որ երբ H 0: q j =0 վարկածը կատարվում է, վիճակագրությունն ունի t-բաշխում n=n-p-1 ազատության աստիճանների թվով:

2.6. Ելնելով կերային հացի կրճատման կախվածությունից (Աղյուսակ 2.3) տվյալների վրա ( y) պահպանման տևողության վրա ( x) գտեք պայմանական ակնկալիքի կետային գնահատականը այն ենթադրությամբ, որ ընդհանուր ռեգրեսիոն հավասարումը գծային է:

Աղյուսակ 2.3.

Պահանջվում է. ա) գտնել մնացորդային շեղման s 2 գնահատականները՝ ենթադրելով, որ ընդհանուր ռեգրեսիայի հավասարումն ունի ձևը. բ) a=0.05-ում ստուգեք ռեգրեսիոն հավասարման նշանակությունը, այսինքն. վարկած H 0: q=0; գ) g=0.9 հուսալիությամբ որոշել q 0, q 1 պարամետրերի միջակայքային գնահատականները. դ) g=0.95 հավաստիությամբ որոշել պայմանական մաթեմատիկական ակնկալիքի միջակայքի գնահատումը ժամը. X 0 =6; ե) g=0.95-ում որոշել կանխատեսման վստահության միջակայքը կետում X=12.

2.7. Բաժնետոմսերի գների 5 ամսվա աճի տեմպերի դինամիկայի տվյալների հիման վրա՝ տրված աղյուսակում. 2.4.

Աղյուսակ 2.4.

ամիսներ ( x)
y (%)

և ենթադրելով, որ ընդհանուր ռեգրեսիոն հավասարումը ունի ձևը, պահանջվում է. բ) a=0.01-ում ստուգեք ռեգրեսիոն գործակցի նշանակությունը, այսինքն. վարկածներ H 0: q 1 =0;

գ) g=0,95 հուսալիությամբ գտնել q 0 և q 1 պարամետրերի միջակայքային գնահատականները. դ) g=0.9 հուսալիությամբ սահմանել պայմանական մաթեմատիկական ակնկալիքի ինտերվալային գնահատում. x 0 =4; ե) g=0.9-ում որոշել կանխատեսման վստահության միջակայքը կետում x=5.

2.8. Երիտասարդ կենդանիների քաշի ավելացման դինամիկայի ուսումնասիրության արդյունքները բերված են Աղյուսակ 2.5-ում:

Աղյուսակ 2.5.

Ենթադրելով, որ ընդհանուր ռեգրեսիայի հավասարումը գծային է, պահանջվում է. բ) a=0.05-ում ստուգեք ռեգրեսիոն հավասարման նշանակությունը, այսինքն. վարկածներ H 0: q=0;

գ) g=0,8 հուսալիությամբ գտնել q 0 և q 1 պարամետրերի միջակայքային գնահատականները. դ) g=0.98 հավաստիությամբ որոշել և համեմատել պայմանական մաթեմատիկական ակնկալիքի միջակայքային գնահատականները. x 0 =3 և x 1 =6;

ե) g=0.98-ում որոշել կանխատեսման վստահության միջակայքը կետում x=8.

2.9. Արժեքը ( y) գրքի մեկ օրինակ՝ կախված տպաքանակից ( x) (հազար օրինակ) բնութագրվում է հրատարակչության կողմից հավաքագրված տվյալներով (Աղյուսակ 2.6): Որոշի՛ր հիպերբոլիկ ռեգրեսիոն հավասարման նվազագույն քառակուսիների գնահատականը և պարամետրերը, կառուցի՛ր g=0.9 հուսալիությամբ։ վստահության միջակայքերը q 0 և q 1 պարամետրերի համար, ինչպես նաև պայմանական մաթեմատիկական ակնկալիքը x=10.

Աղյուսակ 2.6.

Որոշեք ձևի ռեգրեսիոն հավասարման գնահատականները և պարամետրերը, փորձարկեք H 0 վարկածը a = 0,05-ում: q 1 = 0 և կառուցեք վստահության միջակայքեր g = 0,9 հուսալիությամբ q 0 և q 1 պարամետրերի և պայմանական մաթեմատիկական ակնկալիքների համար. x=20.

2.11. Աղյուսակում 2.8-ում ներկայացված են հետևյալ մակրոտնտեսական ցուցանիշների աճի տեմպերի (%) տվյալները n=Աշխարհի 10 զարգացած երկիր 1992թ.-ի համար. ՀՆԱ - x(1) , արդյունաբերական արտադրություն - x(2) , գների ինդեքս - x (3) .

Աղյուսակ 2.8.

Երկրներ x և ռեգրեսիոն հավասարման պարամետրեր, մնացորդային շեղումների գնահատում; բ) a=0.05-ում ստուգեք ռեգրեսիոն գործակցի նշանակությունը, այսինքն. H 0: q 1 =0; գ) g=0.9 հուսալիությամբ, գտնել ինտերվալային գնահատականները q 0 և q 1; դ) g=0.95-ում գտեք կետի վստահության միջակայքը X 0 =x i, Որտեղ ես=5; ե) համեմատել ռեգրեսիոն հավասարումների վիճակագրական բնութագրերը՝ 1, 2 և 3։

2.12. Լուծեք 2.11 խնդիրը վերցնելով ( ժամը) ինդեքս x(1) , և բացատրական համար ( X) փոփոխական x (3) .

1. Այվազյան Ս.Ա., Մխիթարյան Վ.Ս. Կիրառական վիճակագրություն և էկոնոմետիկայի հիմունքներ. Դասագիրք. Մ., ՄԻԱԲԱՆՈՒԹՅՈՒՆ, 1998 (2-րդ հրատարակություն 2001 թ.);

2. Այվազյան Ս.Ա., Մխիթարյան Վ.Ս. Կիրառական վիճակագրություն խնդիրներում և վարժություններում. Դասագիրք. M. UNITY - DANA, 2001;

3. Այվազյան Ս.Ա., Էնյուկով Ի.Ս., Մեշալկին Լ.Դ. Կիրառական վիճակագրություն. Կախվածության հետազոտություն. Մ., Ֆինանսներ և վիճակագրություն, 1985, 487 pp.;

4. Այվազյան Ս.Ա., Բուխստաբեր Վ.Մ., Էնյուկով Ի.Ս., Մեշալկին Լ.Դ. Կիրառական վիճակագրություն. Դասակարգում և չափերի կրճատում: M., Finance and Statistics, 1989, 607 pp.;

5. Johnston J. Էկոնոմետրիկ մեթոդներ, M.: Statistics, 1980, 446 pp.;

6. Դուբրով Ա.Վ., Մխիթարյան Վ.Ս., Տրոշին Լ.Ի. Բազմաչափ վիճակագրական մեթոդներ. Մ., Ֆինանսներ և վիճակագրություն, 2000;

7. Մխիթարյան Վ.Ս., Տրոշին Լ.Ի. Կախվածությունների ուսումնասիրություն՝ օգտագործելով հարաբերակցության և ռեգրեսիայի մեթոդները: M., MESI, 1995, 120 pp.;

8. Մխիթարյան Վ.Ս., Դուբրով Ա.Մ., Տրոշին Լ.Ի. Բազմաչափ վիճակագրական մեթոդներ տնտեսագիտության մեջ. M., MESI, 1995, 149 pp.;

9. Դուբրով Ա.Մ., Մխիթարյան Վ.Ս., Տրոշին Լ.Ի. Մաթեմատիկական վիճակագրություն գործարարների և մենեջերների համար. M., MESI, 2000, 140 pp.

10. Լուկաշին Յու.Ի. Ռեգրեսիա և ադապտիվ կանխատեսման մեթոդներ. Դասագիրք, Մ., ՄԵՍԻ, 1997:

11. Լուկաշին Յու.Ի. Կարճաժամկետ կանխատեսման հարմարվողական մեթոդներ. - Մ., Վիճակագրություն, 1979։


ԴԻՄՈՒՄՆԵՐ


Հավելված 1. Անկախ համակարգչային հետազոտության առաջադրանքների տարբերակներ:

Զույգերի հարաբերակցության գործակիցների մատրիցամատրից է, որի տարրերը զուգակցված հարաբերակցության գործակիցներն են: Օրինակ, երեք փոփոխականների համար այս մատրիցը նման է.
- yx 1x 2x 3
y1 r yx1r yx2r yx3
x 1r x1y1 r x1x2r x1x3
x 2r x2yr x2x11 r x2x3
x 3rx3yr x3x1r x3x21

Տեղադրեք զուգակցված գործակիցների մատրիցը դաշտում:

Օրինակ. Համաձայն 2003 թվականին Կեմերովոյի մարզի 154 գյուղատնտեսական ձեռնարկությունների տվյալների՝ ուսումնասիրել հացահատիկի արտադրության արդյունավետությունը (Աղյուսակ 13):

  1. Որոշել գյուղատնտեսական ձեռնարկություններում հացահատիկի շահութաբերությունը ձևավորող գործոնները 2003 թ.
  2. Կառուցեք զույգ հարաբերակցության գործակիցների մատրիցա: Որոշեք, թե որ գործոններն են բազմակողմանի:
  3. Կառուցեք ռեգրեսիոն հավասարում, որը բնութագրում է հացահատիկի շահութաբերության կախվածությունը բոլոր գործոններից:
  4. Գնահատեք ստացված ռեգրեսիոն հավասարման նշանակությունը: Ո՞ր գործոններն են էապես ազդում այս մոդելում հացահատիկի եկամտաբերության ձևավորման վրա:
  5. Գնահատել թիվ 3 գյուղատնտեսական ձեռնարկությունում հացահատիկի արտադրության եկամտաբերությունը.

ԼուծումՀաշվիչի միջոցով մենք ստանում ենք բազմակի ռեգրեսիայի հավասարումը.

1. Ռեգրեսիայի հավասարման գնահատում.
Եկեք որոշենք ռեգրեսիայի գործակիցների գնահատման վեկտորը: Նվազագույն քառակուսիների մեթոդով վեկտորը ստացվում է արտահայտությունից.
s = (X T X) -1 X T Y
Մատրիցա X

1 0.43 2.02 0.29
1 0.87 1.29 0.55
1 1.01 1.09 0.7
1 0.63 1.68 0.41
1 0.52 0.3 0.37
1 0.44 1.98 0.3
1 1.52 0.87 1.03
1 2.19 0.8 1.3
1 1.8 0.81 1.17
1 1.57 0.84 1.06
1 0.94 1.16 0.64
1 0.72 1.52 0.44
1 0.73 1.47 0.46
1 0.77 1.41 0.49
1 1.21 0.97 0.88
1 1.25 0.93 0.91
1 1.31 0.91 0.94
1 0.38 2.08 0.27
1 0.41 2.05 0.28
1 0.48 1.9 0.32
1 0.58 1.73 0.38
1 0 0 0

Մատրիցա Y
0.22
0.67
0.79
0.42
0.32
0.24
0.95
1.05
0.99
0.96
0.73
0.52
2.1
0.58
0.87
0.89
0.91
0.14
0.18
0.27
0.37
0

Մատրիցա X T
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
0.43 0.87 1.01 0.63 0.52 0.44 1.52 2.19 1.8 1.57 0.94 0.72 0.73 0.77 1.21 1.25 1.31 0.38 0.41 0.48 0.58 0
2.02 1.29 1.09 1.68 0.3 1.98 0.87 0.8 0.81 0.84 1.16 1.52 1.47 1.41 0.97 0.93 0.91 2.08 2.05 1.9 1.73 0
0.29 0.55 0.7 0.41 0.37 0.3 1.03 1.3 1.17 1.06 0.64 0.44 0.46 0.49 0.88 0.91 0.94 0.27 0.28 0.32 0.38 0

Բազմապատկել մատրիցները, (X T X)
Գտե՛ք det(X T X) T = 34,35 որոշիչը
Գտեք հակադարձ մատրիցը (X T X) -1
0.6821 0.3795 -0.2934 -1.0118
0.3795 9.4402 -0.133 -14.4949
-0.2934 -0.133 0.1746 0.3204
-1.0118 -14.4949 0.3204 22.7272

Ռեգրեսիայի գործակիցների գնահատումների վեկտորը հավասար է
s = (X T X) -1 X T Y =
0.1565
0.3375
0.0043
0.2986

Ռեգրեսիոն հավասարում (ռեգեսիոն հավասարման գնահատում)
Y = 0,1565 + 0,3375X 1 + 0,0043X 2 + 0,2986X 3

Զույգերի հարաբերակցության գործակիցների մատրիցա

Դիտարկումների թիվը n = 22 է։ Մոդելում անկախ փոփոխականների թիվը ճիշտ 3 է, իսկ ռեգրեսորների թիվը՝ հաշվի առնելով միավոր վեկտորը, հավասար է անհայտ գործակիցների թվին։ Հաշվի առնելով Y նշանը, մատրիցի չափը հավասար է 5-ի: X անկախ փոփոխականների մատրիցն ունի չափ (22 x 5): X T X մատրիցը որոշվում է ուղղակի բազմապատկմամբ կամ հետևյալ նախապես հաշվարկված գումարներով.
Y-ից և X-ից կազմված մատրիցա
1 0.22 0.43 2.02 0.29
1 0.67 0.87 1.29 0.55
1 0.79 1.01 1.09 0.7
1 0.42 0.63 1.68 0.41
1 0.32 0.52 0.3 0.37
1 0.24 0.44 1.98 0.3
1 0.95 1.52 0.87 1.03
1 1.05 2.19 0.8 1.3
1 0.99 1.8 0.81 1.17
1 0.96 1.57 0.84 1.06
1 0.73 0.94 1.16 0.64
1 0.52 0.72 1.52 0.44
1 2.1 0.73 1.47 0.46
1 0.58 0.77 1.41 0.49
1 0.87 1.21 0.97 0.88
1 0.89 1.25 0.93 0.91
1 0.91 1.31 0.91 0.94
1 0.14 0.38 2.08 0.27
1 0.18 0.41 2.05 0.28
1 0.27 0.48 1.9 0.32
1 0.37 0.58 1.73 0.38
1 0 0 0 0

Փոխադրված մատրիցա.
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
0.22 0.67 0.79 0.42 0.32 0.24 0.95 1.05 0.99 0.96 0.73 0.52 2.1 0.58 0.87 0.89 0.91 0.14 0.18 0.27 0.37 0
0.43 0.87 1.01 0.63 0.52 0.44 1.52 2.19 1.8 1.57 0.94 0.72 0.73 0.77 1.21 1.25 1.31 0.38 0.41 0.48 0.58 0
2.02 1.29 1.09 1.68 0.3 1.98 0.87 0.8 0.81 0.84 1.16 1.52 1.47 1.41 0.97 0.93 0.91 2.08 2.05 1.9 1.73 0
0.29 0.55 0.7 0.41 0.37 0.3 1.03 1.3 1.17 1.06 0.64 0.44 0.46 0.49 0.88 0.91 0.94 0.27 0.28 0.32 0.38 0

Matrix A T A.
22 14.17 19.76 27.81 13.19
14.17 13.55 15.91 16.58 10.56
19.76 15.91 23.78 22.45 15.73
27.81 16.58 22.45 42.09 14.96
13.19 10.56 15.73 14.96 10.45

Ստացված մատրիցն ունի հետևյալ համապատասխանությունը.

Գտնենք զույգ հարաբերակցության գործակիցները։
y-ի և x 1-ի համար

Միջին արժեքներ



Ցրվածություն





Հարաբերակցության գործակից

y-ի և x 2-ի համար
Հավասարումը y = ax + b է
Միջին արժեքներ



Ցրվածություն


Ստանդարտ շեղում


Հարաբերակցության գործակից

y-ի և x 3-ի համար
Հավասարումը y = ax + b է
Միջին արժեքներ



Ցրվածություն


Ստանդարտ շեղում


Հարաբերակցության գործակից

x 1-ի և x 2-ի համար
Հավասարումը y = ax + b է
Միջին արժեքներ



Ցրվածություն


Ստանդարտ շեղում


Հարաբերակցության գործակից

x 1-ի և x 3-ի համար
Հավասարումը y = ax + b է
Միջին արժեքներ



Ցրվածություն


Ստանդարտ շեղում


Հարաբերակցության գործակից

x 2-ի և x 3-ի համար
Հավասարումը y = ax + b է
Միջին արժեքներ



Ցրվածություն


Ստանդարտ շեղում


Հարաբերակցության գործակից

Զույգերի հարաբերակցության գործակիցների մատրիցա.
- y x 1 x 2 x 3
y 1 0.62 -0.24 0.61
x 1 0.62 1 -0.39 0.99
x 2 -0.24 -0.39 1 -0.41
x 3 0.61 0.99 -0.41 1

Այս մատրիցայի առաջին շարքի վերլուծությունը թույլ է տալիս ընտրել գործոնների բնութագրերը, որոնք կարող են ներառվել բազմակի հարաբերակցության մոդելում: Գործոնների բնութագրերը, որոնց համար r yxi< 0.5 исключают из модели.
Colinearity-ը գործոնների փոխհարաբերությունն է: Հետևյալ անհավասարությունները կարող են ընդունվել որպես բազմակողմանիության չափանիշ.
r(x j y) > r(x k x j); r(x k y) > r(x k x j).
Եթե ​​անհավասարություններից մեկը չի բավարարվում, ապա բացառվում է x k կամ x j պարամետրը, որի կապը ստացված Y ցուցանիշի հետ ամենաքիչ սերտ է։
3. Ռեգրեսիոն հավասարման պարամետրերի վերլուծություն.
Անցնենք ստացված ռեգրեսիոն հավասարման վիճակագրական վերլուծությանը` հավասարման և դրա գործակիցների նշանակության ստուգում, մոտարկման բացարձակ և հարաբերական սխալների ուսումնասիրություն.
Անկողմնակալ շեղումների գնահատման համար մենք կատարում ենք հետևյալ հաշվարկները.
Անկողմնակալ սխալ e = Y - X *s ( բացարձակ սխալմոտավորություն)
-0.18
0.05
0.08
-0.08
-0.12
-0.16
-0.03
-0.24
-0.13
-0.05
0.06
-0.02
1.55
0.01
0.04
0.04
0.03
-0.23
-0.21
-0.15
-0.1
-0.16

s e 2 = (Y - X *s) T (Y - X *s)
Անաչառ շեղումների գնահատումն է

Դասարան ստանդարտ շեղումհավասար է

Եկեք գտնենք վեկտորի կովարիանսային մատրիցայի գնահատումը k = a*(X T X) -1
0.26 0.15 -0.11 -0.39
0.15 3.66 -0.05 -5.61
-0.11 -0.05 0.07 0.12
-0.39 -5.61 0.12 8.8

Մոդելի պարամետրերի շեղումները որոշվում են S 2 i = K ii հարաբերակցությամբ, այսինքն. սրանք այն տարրերն են, որոնք ընկած են հիմնական անկյունագծի վրա
Ռեգրեսիոն մոդելի իմաստալից վերլուծության հնարավորությունները ընդլայնելու համար օգտագործվում են մասնակի առաձգականության գործակիցներ, որոնք որոշվում են բանաձևով.


Մասնակի առաձգականության գործակից E 1< 1. Следовательно, его влияние на результативный признак Y незначительно.

Մասնակի առաձգականության գործակից E 2< 1. Следовательно, его влияние на результативный признак Y незначительно.

Մասնակի առաձգականության գործակից E 3< 1. Следовательно, его влияние на результативный признак Y незначительно.
Արդյունքի վրա գործոնների համատեղ ազդեցության սերտությունը գնահատվում է բազմակի հարաբերակցության ինդեքսով (0-ից 1):

Y հատկանիշի և X գործոնների միջև կապը չափավոր է
Որոշման գործակից
R2 = 0,622 = 0,38
դրանք. 38,0855% դեպքերում x-ի փոփոխությունները հանգեցնում են y-ի փոփոխությունների: Այսինքն՝ ռեգրեսիոն հավասարման ընտրության ճշգրտությունը միջին է
Հարաբերակցության գործակցի նշանակությունը

Օգտագործելով Ուսանողի աղյուսակը մենք գտնում ենք Ttable
T աղյուսակ (n-m-1;a) = (18;0.05) = 1.734
Քանի որ Tob > Ttabl, մենք մերժում ենք այն վարկածը, որ հարաբերակցության գործակիցը հավասար է 0-ի: Այսինքն՝ հարաբերակցության գործակիցը վիճակագրորեն նշանակալի է
Հարաբերակցության գործակցի միջակայքի գնահատում (վստահության միջակայք)

Հարաբերակցության գործակցի համար վստահության միջակայքը
r(0.3882;0.846)
5. Ռեգրեսիոն հավասարման գործակիցների վերաբերյալ վարկածների ստուգում (բազմակի ռեգրեսիոն հավասարման պարամետրերի նշանակության ստուգում):
1) t-վիճակագրություն


Ռեգրեսիայի b 0 գործակցի վիճակագրական նշանակությունը հաստատված չէ

Բ 1 ռեգրեսիոն գործակցի վիճակագրական նշանակությունը հաստատված չէ

Բ 2 ռեգրեսիոն գործակցի վիճակագրական նշանակությունը հաստատված չէ

Բ 3 ռեգրեսիոն գործակցի վիճակագրական նշանակությունը հաստատված չէ
Ռեգրեսիայի հավասարման գործակիցների վստահության միջակայքը
Որոշենք ռեգրեսիոն գործակիցների վստահության միջակայքերը, որոնք 95% հուսալիությամբ կլինեն հետևյալը.
(b i - t i S i; b i + t i S i)
բ 0: (-0.7348; 1.0478)
բ 1: (-2.9781; 3.6531)
բ 2: (-0.4466;0.4553)
բ 3: (-4.8459; 5.4431)

2) Զ-վիճակագրություն. Ֆիշերի չափանիշը


Fkp = 2,93
Քանի որ Ֆ< Fkp, то коэффициент детерминации статистически не значим и уравнение регрессии статистически ненадежно.
6. Հետերոսկեդաստիկության առկայության ստուգում մնացորդների գրաֆիկական վերլուծության միջոցով:
Այս դեպքում X i բացատրական փոփոխականի արժեքները գծագրվում են աբսցիսայի առանցքի երկայնքով, իսկ e i 2 շեղման քառակուսիները՝ օրդինատների առանցքի երկայնքով:

y y(x) e=y-y(x) ե 2
0.22 0.4 -0.18 0.03
0.67 0.62 0.05 0
0.79 0.71 0.08 0.01
0.42 0.5 -0.08 0.01
0.32 0.44 -0.12 0.02
0.24 0.4 -0.16 0.03
0.95 0.98 -0.03 0
1.05 1.29 -0.24 0.06
0.99 1.12 -0.13 0.02
0.96 1.01 -0.05 0
0.73 0.67 0.06 0
0.52 0.54 -0.02 0
2.1 0.55 1.55 2.41
0.58 0.57 0.01 0
0.87 0.83 0.04 0
0.89 0.85 0.04 0
0.91 0.88 0.03 0
0.14 0.37 -0.23 0.05
0.18 0.39 -0.21 0.04
0.27 0.42 -0.15 0.02
0.37 0.47 -0.1 0.01
0.16 -0.16 0.02


Նորություն կայքում

>

Ամենահայտնի