տուն Ստոմատիտ Իրականացնել ռեգրեսիոն վերլուծություն: Մաթեմատիկական վիճակագրության մեթոդներ

Իրականացնել ռեգրեսիոն վերլուծություն: Մաթեմատիկական վիճակագրության մեթոդներ

Ռեգրեսիան և հարաբերակցության վերլուծությունը վիճակագրական հետազոտության մեթոդներ են: Սրանք ամենատարածված եղանակներն են՝ ցույց տալու պարամետրի կախվածությունը մեկ կամ մի քանի անկախ փոփոխականներից:

Ստորև՝ կոնկրետ գործնական օրինակներԴիտարկենք այս երկու շատ տարածված վերլուծությունները տնտեսագետների շրջանում։ Կբերենք նաև դրանց համադրման ժամանակ արդյունքներ ստանալու օրինակ։

Ռեգրեսիայի վերլուծություն Excel-ում

Ցույց է տալիս որոշ արժեքների (անկախ, անկախ) ազդեցությունը կախված փոփոխականի վրա: Օրինակ՝ ինչպես է տնտեսապես ակտիվ բնակչության թիվը կախված ձեռնարկությունների քանակից, չափից աշխատավարձերև այլ պարամետրեր: Կամ՝ ինչպե՞ս են ՀՆԱ-ի մակարդակի վրա ազդում օտարերկրյա ներդրումները, էներգակիրների գները և այլն։

Վերլուծության արդյունքը թույլ է տալիս ընդգծել առաջնահերթությունները: Եվ հիմնվելով հիմնական գործոնների վրա՝ կանխատեսել, պլանավորել առաջնահերթ ոլորտների զարգացումը և կայացնել կառավարման որոշումներ։

Հետընթացը տեղի է ունենում.

  • գծային (y = a + bx);
  • պարաբոլիկ (y = a + bx + cx 2);
  • էքսպոնենցիալ (y = a * exp (bx));
  • հզորություն (y = a*x^b);
  • հիպերբոլիկ (y = b/x + a);
  • լոգարիթմական (y = b * 1n (x) + a);
  • էքսպոնենցիալ (y = a * b^x):

Եկեք դիտարկենք Excel-ում ռեգրեսիոն մոդել կառուցելու և արդյունքների մեկնաբանման օրինակ: Վերցնենք ռեգրեսիայի գծային տեսակը։

Առաջադրանք. 6 ձեռնարկություններում վերլուծվել են միջին ամսական աշխատավարձը և աշխատանքից ազատված աշխատողների թիվը։ Պետք է որոշել, թե ինչ կախվածություն է թողնում աշխատողների թիվը միջին աշխատավարձից։

Մոդել գծային ռեգրեսիաունի հետևյալ ձևը.

Y = a 0 + a 1 x 1 +…+a k x k.

Այնտեղ, որտեղ a-ն ռեգրեսիայի գործակիցներն են, x-ը ազդող փոփոխականներ են, k-ն գործոնների քանակն է:

Մեր օրինակում Y-ն աշխատողներից հեռանալու ցուցանիշն է: Ազդող գործոնը աշխատավարձն է (x):

Excel-ն ունի ներկառուցված գործառույթներ, որոնք կարող են օգնել ձեզ հաշվարկել գծային ռեգրեսիայի մոդելի պարամետրերը: Բայց «Վերլուծական փաթեթ» հավելումը դա կանի ավելի արագ:

Մենք ակտիվացնում ենք հզոր վերլուծական գործիք.

Ակտիվացնելուց հետո հավելումը հասանելի կլինի Տվյալների ներդիրում:

Հիմա եկեք ինքնին անենք ռեգրեսիոն վերլուծությունը:



Առաջին հերթին ուշադրություն ենք դարձնում R-քառակուսին և գործակիցներին։

R-քառակուսին որոշման գործակիցն է: Մեր օրինակում՝ 0,755 կամ 75,5%: Սա նշանակում է, որ մոդելի հաշվարկված պարամետրերը բացատրում են ուսումնասիրված պարամետրերի փոխհարաբերությունների 75.5%-ը: Որքան բարձր է որոշման գործակիցը, այնքան լավ է մոդելը: Լավ - 0.8-ից բարձր: Վատ – 0,5-ից պակաս (նման վերլուծությունը հազիվ թե ողջամիտ համարվի): Մեր օրինակում՝ «վատ չէ»:

64.1428 գործակիցը ցույց է տալիս, թե ինչ կլինի Y-ը, եթե դիտարկվող մոդելի բոլոր փոփոխականները հավասար են 0-ի: Այսինքն, վերլուծված պարամետրի արժեքի վրա ազդում են նաև մոդելում չնկարագրված այլ գործոններ:

-0,16285 գործակիցը ցույց է տալիս X փոփոխականի կշիռը Y-ի վրա: Այսինքն, այս մոդելի միջին ամսական աշխատավարձը ազդում է -0,16285 քաշով հրաժարվողների թվի վրա (սա ազդեցության փոքր աստիճան է): «-» նշանը ցույց է տալիս բացասական ազդեցություն. որքան բարձր է աշխատավարձը, այնքան քիչ մարդիկ են հրաժարվում: Ինչն արդարացի է։



Հարաբերակցության վերլուծություն Excel-ում

Հարաբերակցության վերլուծությունը օգնում է պարզել, թե արդյոք մեկ կամ երկու նմուշների ցուցանիշների միջև կապ կա: Օրինակ, մեքենայի շահագործման ժամանակի և վերանորոգման արժեքի, սարքավորումների գնի և շահագործման տևողության, երեխաների հասակի և քաշի միջև և այլն:

Եթե ​​կա կապ, ապա մի պարամետրի աճը հանգեցնում է մյուսի ավելացմանը (դրական հարաբերակցության) կամ նվազմանը (բացասականին): Հարաբերակցության վերլուծությունը օգնում է վերլուծաբանին որոշել, թե արդյոք մեկ ցուցանիշի արժեքը կարող է օգտագործվել կանխատեսելու համար հնարավոր իմաստըուրիշ.

Հարաբերակցության գործակիցը նշվում է r-ով: Տատանվում է +1-ից մինչև -1: Հարաբերությունների դասակարգում համար տարբեր տարածքներտարբեր կլինի: Երբ գործակիցը 0 է գծային կախվածություննմուշների միջև գոյություն չունի:

Եկեք նայենք, թե ինչպես գտնել հարաբերակցության գործակիցը Excel-ի միջոցով:

Զուգակցված գործակիցները գտնելու համար օգտագործվում է CORREL ֆունկցիան։

Նպատակը. Որոշեք, թե արդյոք կապ կա խառատահաստոցի շահագործման ժամանակի և դրա պահպանման ծախսերի միջև:

Տեղադրեք կուրսորը ցանկացած բջիջում և սեղմեք fx կոճակը:

  1. «Վիճակագրական» կատեգորիայում ընտրեք CORREL ֆունկցիան:
  2. Արգումենտ «Զանգված 1» - արժեքների առաջին միջակայքը - մեքենայի աշխատանքի ժամանակը՝ A2:A14:
  3. Արգումենտ «Array 2» - արժեքների երկրորդ միջակայք – վերանորոգման արժեքը՝ B2:B14: Սեղմեք OK:

Կապի տեսակը որոշելու համար անհրաժեշտ է դիտարկել գործակցի բացարձակ թիվը (գործունեության յուրաքանչյուր ոլորտ ունի իր սանդղակը):

Համար հարաբերակցության վերլուծությունմի քանի պարամետր (ավելի քան 2), ավելի հարմար է օգտագործել «Տվյալների վերլուծություն» («Վերլուծական փաթեթ» հավելումը): Ցանկից պետք է ընտրել հարաբերակցությունը և նշանակել զանգվածը: Բոլորը.

Ստացված գործակիցները կցուցադրվեն հարաբերակցության մատրիցով: Սրա նման:

Հարաբերակցության և ռեգրեսիայի վերլուծություն

Գործնականում այս երկու տեխնիկան հաճախ օգտագործվում են միասին:

Օրինակ:


Այժմ տեսանելի են դարձել ռեգրեսիոն վերլուծության տվյալները։

Ռեգրեսիոն վերլուծության հիմնական նպատակըԱյն բաղկացած է հաղորդակցության վերլուծական ձևի որոշումից, որում արդյունավետ բնութագրի փոփոխությունը պայմանավորված է մեկ կամ մի քանի գործոնային բնութագրերի ազդեցությամբ, իսկ մյուս բոլոր գործոնների ամբողջությունը, որոնք նույնպես ազդում են արդյունավետ բնութագրի վրա, ընդունվում են որպես հաստատուն և միջին արժեքներ:
Ռեգրեսիայի վերլուծության խնդիրներ:
ա) Կախվածության ձևի հաստատում. Ինչ վերաբերում է երևույթների փոխհարաբերությունների բնույթին և ձևին, առանձնացվում է դրական գծային և ոչ գծային և բացասական գծային և ոչ գծային ռեգրեսիա:
բ) այս կամ այն ​​տիպի մաթեմատիկական հավասարման տեսքով ռեգրեսիոն ֆունկցիայի որոշում և կախյալ փոփոխականի վրա բացատրական փոփոխականների ազդեցության սահմանում.
գ) Գնահատում Ոչ հայտնի արժեքներկախյալ փոփոխական. Օգտագործելով ռեգրեսիայի գործառույթը, դուք կարող եք վերարտադրել կախված փոփոխականի արժեքները բացատրական փոփոխականների նշված արժեքների միջակայքում (այսինքն՝ լուծել ինտերպոլացիայի խնդիրը) կամ գնահատել գործընթացի ընթացքը նշված միջակայքից դուրս (այսինքն. լուծել էքստրապոլյացիայի խնդիրը): Արդյունքը կախված փոփոխականի արժեքի գնահատումն է:

Զույգ ռեգրեսիան y և x երկու փոփոխականների միջև փոխհարաբերության հավասարումն է, որտեղ y-ը կախված փոփոխականն է (արդյունքային հատկանիշ); x-ը անկախ բացատրական փոփոխական է (հատկանիշ-գործոն):

Տարբերում են գծային և ոչ գծային ռեգրեսիաներ։
Գծային ռեգրեսիա՝ y = a + bx + ε
Ոչ գծային ռեգրեսիաները բաժանվում են երկու դասի՝ ռեգրեսիաներ, որոնք ոչ գծային են վերլուծության մեջ ներառված բացատրական փոփոխականների նկատմամբ, բայց գծային՝ գնահատված պարամետրերի նկատմամբ, և ռեգրեսիաներ, որոնք գնահատված պարամետրերի նկատմամբ ոչ գծային են:
Ռեգրեսիաներ, որոնք ոչ գծային են բացատրական փոփոխականներում.

Ռեգրեսիաներ, որոնք գնահատված պարամետրերի նկատմամբ ոչ գծային են. Ռեգրեսիոն հավասարման կառուցումը հանգում է նրա պարամետրերի գնահատմանը: Ռեգրեսիաների գծային պարամետրերը պարամետրերով գնահատելու համար օգտագործեք մեթոդը նվազագույն քառակուսիները(MNC): Նվազագույն քառակուսիների մեթոդը հնարավորություն է տալիս ստանալ այնպիսի պարամետրերի գնահատումներ, որոնց դեպքում արդյունքային բնութագրիչի y փաստացի արժեքների քառակուսի շեղումների գումարը տեսականից նվազագույն է, այսինքն.
.
Գծային և ոչ գծային հավասարումների համար, որոնք կրճատվում են գծային, լուծեք հաջորդ համակարգը a-ի և b-ի վերաբերյալ.

Դուք կարող եք օգտագործել այս համակարգից բխող պատրաստի բանաձևերը.

Գնահատվում է ուսումնասիրվող երևույթների միջև կապի սերտությունը գծային գործակիցԶույգ հարաբերակցությունը գծային ռեգրեսիայի համար.

և հարաբերակցության ինդեքսը՝ ոչ գծային ռեգրեսիայի համար.

Կառուցված մոդելի որակը կգնահատվի որոշման գործակցով (ինդեքսով), ինչպես նաև մոտարկման միջին սխալով։
Միջին մոտարկման սխալ - հաշվարկված արժեքների միջին շեղում իրական արժեքներից.
.
Արժեքների թույլատրելի սահմանը ոչ ավելի, քան 8-10%:
Միջին էլաստիկության գործակիցը ցույց է տալիս, թե միջինում քանի տոկոսով կփոխվի արդյունքը y-ի միջին արժեքից, երբ x գործակիցը փոխվի իր միջին արժեքից 1%-ով.
.

Առաջադրանք շեղումների վերլուծությունբաղկացած է կախված փոփոխականի շեղումների վերլուծությունից.
,
Որտեղ - ընդհանուր գումարըքառակուսի շեղումներ;
- ռեգրեսիայի պատճառով քառակուսի շեղումների գումարը («բացատրված» կամ «գործոնային»).
- քառակուսի շեղումների մնացորդային գումարը.
Ռեգրեսիայով բացատրված շեղման տեսակարար կշիռը արդյունք y բնութագրիչի ընդհանուր դիսպերսիայում բնութագրվում է R2 որոշման գործակցով (ինդեքսով).

Որոշման գործակիցը գործակցի կամ հարաբերակցության ինդեքսի քառակուսին է։

F-թեստը, որը գնահատում է ռեգրեսիոն հավասարման որակը, բաղկացած է ռեգրեսիոն հավասարման վիճակագրական աննշանության և հարաբերությունների սերտության ցուցիչի վերաբերյալ No վարկածի փորձարկումից: Դա անելու համար համեմատություն է կատարվում իրական F փաստի և Fisher F-ի չափանիշի F աղյուսակի կրիտիկական (աղյուսակային) արժեքների միջև: F փաստը որոշվում է գործակցի և մնացորդային շեղումների արժեքների հարաբերակցությունից՝ հաշվարկված ազատության աստիճանով.
,
որտեղ n-ը բնակչության միավորների թիվն է. m-ը x փոփոխականների պարամետրերի թիվն է:
F աղյուսակը չափանիշի առավելագույն հնարավոր արժեքն է պատահական գործոնների ազդեցության տակ ազատության և նշանակության մակարդակի տվյալ աստիճանի a. Նշանակության ա մակարդակը ճիշտ վարկածը մերժելու հավանականությունն է՝ հաշվի առնելով, որ այն ճիշտ է։ Սովորաբար a-ն վերցվում է հավասար 0,05 կամ 0,01:
Եթե ​​F աղյուսակ< F факт, то Н о - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если F табл >F փաստ, ապա H o վարկածը չի մերժվում և ճանաչվում է ռեգրեսիոն հավասարման վիճակագրական աննշանությունն ու անհուսալիությունը։
Փոխարժեքի համար վիճակագրական նշանակությունՀաշվարկվում են ռեգրեսիայի և հարաբերակցության գործակիցները, Student-ի t-թեստը և վստահության միջակայքերը յուրաքանչյուր ցուցանիշի համար: Առաջարկվում է հիպոթեզ ցուցիչների պատահական բնույթի մասին, այսինքն. զրոյից դրանց աննշան տարբերության մասին։ Ռեգրեսիայի և հարաբերակցության գործակիցների նշանակության գնահատումը Student-ի t-թեստի միջոցով իրականացվում է դրանց արժեքները պատահական սխալի մեծության հետ համեմատելով.
; ; .
Գծային ռեգրեսիայի պարամետրերի և հարաբերակցության գործակիցի պատահական սխալները որոշվում են բանաձևերով.



Համեմատելով t-վիճակագրության փաստացի և կրիտիկական (աղյուսակային) արժեքները՝ t աղյուսակ և t փաստ, մենք ընդունում կամ մերժում ենք H o վարկածը:
Fisher F-test-ի և Student t-վիճակագրության միջև կապն արտահայտվում է հավասարությամբ

Եթե ​​t սեղան< t факт то H o отклоняется, т.е. a, b и не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х. Если t табл >t-ն փաստ է, որ H o վարկածը չի մերժվում և ճանաչվում է a, b կամ-ի ձևավորման պատահական բնույթը։
Վստահության միջակայքը հաշվարկելու համար մենք յուրաքանչյուր ցուցանիշի համար որոշում ենք առավելագույն սխալ D.
, .
Վստահության միջակայքերը հաշվարկելու բանաձևերը հետևյալն են.
; ;
; ;
Եթե ​​զրոն ընկնում է վստահության միջակայքում, այսինքն. Եթե ​​ստորին սահմանը բացասական է, իսկ վերին սահմանը դրական է, ապա գնահատված պարամետրը վերցվում է զրո, քանի որ այն չի կարող միաժամանակ ընդունել և՛ դրական, և՛ բացասական արժեքներ:
Կանխատեսման արժեքը որոշվում է համապատասխան (կանխատեսման) արժեքը ռեգրեսիոն հավասարման մեջ փոխարինելով: Կանխատեսման միջին ստանդարտ սխալը հաշվարկվում է.
,
Որտեղ
և կառուցվում է վստահության միջակայքըկանխատեսում:
; ;
Որտեղ .

Օրինակ լուծում

Առաջադրանք թիվ 1. 199X-ին Ուրալի շրջանի յոթ տարածքների համար հայտնի են երկու բնութագրերի արժեքներ.
Աղյուսակ 1.
Պահանջվում է: 1. y-ի կախվածությունը x-ից բնութագրելու համար հաշվարկեք հետեւյալ ֆունկցիաների պարամետրերը.
ա) գծային;
բ) հզորություն (նախ պետք է կատարեք փոփոխականների գծայինացման ընթացակարգը՝ վերցնելով երկու մասերի լոգարիթմը);
գ) ցուցադրական;
դ) հավասարակողմ հիպերբոլա (դուք նաև պետք է պարզեք, թե ինչպես կարելի է նախապես գծայինացնել այս մոդելը):
2. Գնահատե՛ք յուրաքանչյուր մոդել՝ օգտագործելով մոտավորության միջին սխալը և Ֆիշերի F թեստը:

Լուծում (տարբերակ թիվ 1)

Գծային ռեգրեսիայի a և b պարամետրերը հաշվարկելու համար (հաշվարկը կարող է կատարվել հաշվիչի միջոցով):
լուծել նորմալ հավասարումների համակարգ ԱԵվ բ.
Նախնական տվյալների հիման վրա մենք հաշվարկում ենք :
y x yx x 2 y 2 A i
լ 68,8 45,1 3102,88 2034,01 4733,44 61,3 7,5 10,9
2 61,2 59,0 3610,80 3481,00 3745,44 56,5 4,7 7,7
3 59,9 57,2 3426,28 3271,84 3588,01 57,1 2,8 4,7
4 56,7 61,8 3504,06 3819,24 3214,89 55,5 1,2 2,1
5 55,0 58,8 3234,00 3457,44 3025,00 56,5 -1,5 2,7
6 54,3 47,2 2562,96 2227,84 2948,49 60,5 -6,2 11,4
7 49,3 55,2 2721,36 3047,04 2430,49 57,8 -8,5 17,2
Ընդամենը 405,2 384,3 22162,34 21338,41 23685,76 405,2 0,0 56,7
Ամուսնացնել. իմաստը (Ընդամենը/n) 57,89 54,90 3166,05 3048,34 3383,68 X X 8,1
ս 5,74 5,86 X X X X X X
s 2 32,92 34,34 X X X X X X


Ռեգրեսիայի հավասարում. y = 76,88 - 0,35X.Միջին օրական աշխատավարձի 1 ռուբլով ավելացմամբ. պարենային ապրանքների ձեռքբերման ծախսերի տեսակարար կշիռը նվազում է միջինը 0,35 տոկոսային կետով։
Եկեք հաշվարկենք գծային զույգ հարաբերակցության գործակիցը.

Կապը չափավոր է, հակադարձ։
Եկեք որոշենք որոշման գործակիցը.

Արդյունքի 12,7% տատանումը բացատրվում է x գործոնի տատանումով։ Փաստացի արժեքների փոխարինում ռեգրեսիայի հավասարման մեջ X,որոշենք տեսական (հաշվարկված) արժեքները . Եկեք գտնենք միջին մոտավոր սխալի արժեքը.

Միջին հաշվով, հաշվարկված արժեքները իրականից շեղվում են 8,1% -ով:
Եկեք հաշվարկենք F-չափանիշը.

1-ից սկսած< Ֆ < ¥ , պետք է հաշվի առնել Ֆ -1 .
Ստացված արժեքը ցույց է տալիս վարկածն ընդունելու անհրաժեշտությունը Բայց ախհայտնաբերված կախվածության պատահական բնույթը և հավասարման պարամետրերի վիճակագրական աննշանությունը և կապի սերտության ցուցանիշը:
1բ.Ուժային մոդելի կառուցմանը նախորդում է փոփոխականների գծայինացման ընթացակարգը։ Օրինակում գծայինացումն իրականացվում է՝ հաշվի առնելով հավասարման երկու կողմերի լոգարիթմները.


ՈրտեղY=lg(y), X=lg(x), C=lg(a):

Հաշվարկների համար մենք օգտագործում ենք աղյուսակի տվյալները: 1.3.

Աղյուսակ 1.3

Յ X YX Y2 X 2 A i
1 1,8376 1,6542 3,0398 3,3768 2,7364 61,0 7,8 60,8 11,3
2 1,7868 1,7709 3,1642 3,1927 3,1361 56,3 4,9 24,0 8,0
3 1,7774 1,7574 3,1236 3,1592 3,0885 56,8 3,1 9,6 5,2
4 1,7536 1,7910 3,1407 3,0751 3,2077 55,5 1,2 1,4 2,1
5 1,7404 1,7694 3,0795 3,0290 3,1308 56,3 -1,3 1,7 2,4
6 1,7348 1,6739 2,9039 3,0095 2,8019 60,2 -5,9 34,8 10,9
7 1,6928 1,7419 2,9487 2,8656 3,0342 57,4 -8,1 65,6 16,4
Ընդամենը 12,3234 12,1587 21,4003 21,7078 21,1355 403,5 1,7 197,9 56,3
Միջին արժեքը 1,7605 1,7370 3,0572 3,1011 3,0194 X X 28,27 8,0
σ 0,0425 0,0484 X X X X X X X
σ 2 0,0018 0,0023 X X X X X X X

Հաշվենք C և b.


Մենք ստանում ենք գծային հավասարում. .
Կատարելով դրա հզորացումը՝ մենք ստանում ենք.

Փաստացի արժեքների փոխարինում այս հավասարման մեջ X,մենք ստանում ենք արդյունքի տեսական արժեքներ: Օգտագործելով դրանք՝ մենք կհաշվարկենք ցուցիչները՝ կապի խստություն - հարաբերակցության ինդեքս և միջին մոտարկման սխալ

Power-Law մոդելի կատարումը ցույց է տալիս, որ այն մի փոքր ավելի լավ է գծային ֆունկցիանկարագրում է հարաբերությունները.

1c. Էքսպոնենցիալ կորի հավասարման կառուցում

նախորդում է փոփոխականների գծայինացման ընթացակարգը՝ հաշվի առնելով հավասարման երկու կողմերի լոգարիթմները.

Հաշվարկների համար մենք օգտագործում ենք աղյուսակի տվյալները:

Յ x Yx Y2 x 2 A i
1 1,8376 45,1 82,8758 3,3768 2034,01 60,7 8,1 65,61 11,8
2 1,7868 59,0 105,4212 3,1927 3481,00 56,4 4,8 23,04 7,8
3 1,7774 57,2 101,6673 3,1592 3271,84 56,9 3,0 9,00 5,0
4 1,7536 61,8 108,3725 3,0751 3819,24 55,5 1,2 1,44 2,1
5 1,7404 58,8 102,3355 3,0290 3457,44 56,4 -1,4 1,96 2,5
6 1,7348 47,2 81,8826 3,0095 2227,84 60,0 -5,7 32,49 10,5
7 1,6928 55,2 93,4426 2,8656 3047,04 57,5 -8,2 67,24 16,6
Ընդամենը 12,3234 384,3 675,9974 21,7078 21338,41 403,4 -1,8 200,78 56,3
Ամուսնացնել. zn. 1,7605 54,9 96,5711 3,1011 3048,34 X X 28,68 8,0
σ 0,0425 5,86 X X X X X X X
σ 2 0,0018 34,339 X X X X X X X

Ռեգրեսիայի պարամետրերի արժեքները A և INկազմել է.


Ստացված գծային հավասարումը հետևյալն է. . Եկեք ուժեղացնենք ստացված հավասարումը և գրենք այն սովորական ձևով.

Մենք կգնահատենք կապի սերտությունը հարաբերակցության ինդեքսի միջոցով.

Ուսման ընթացքում ուսանողները շատ հաճախ հանդիպում են տարբեր հավասարումների։ Դրանցից մեկը՝ ռեգրեսիայի հավասարումը, քննարկվում է այս հոդվածում։ Այս տեսակի հավասարումը հատուկ օգտագործվում է մաթեմատիկական պարամետրերի միջև փոխհարաբերությունների բնութագրերը նկարագրելու համար: Այս տեսակըհավասարություններն օգտագործվում են վիճակագրության և էկոնոմետրիկայի մեջ։

Ռեգրեսիայի սահմանում

Մաթեմատիկայի մեջ ռեգրեսիան նշանակում է որոշակի մեծություն, որը նկարագրում է տվյալների մի շարքի միջին արժեքի կախվածությունը մեկ այլ մեծության արժեքներից: Ռեգրեսիոն հավասարումը ցույց է տալիս, որպես որոշակի հատկանիշի ֆունկցիա, մեկ այլ հատկանիշի միջին արժեքը: Ռեգրեսիայի ֆունկցիան ունի ձև պարզ հավասարում y = x, որտեղ y-ը գործում է որպես կախյալ փոփոխական, իսկ x-ը որպես անկախ փոփոխական (հատկանիշ-գործոն): Իրականում ռեգրեսիան արտահայտվում է որպես y = f (x):

Որո՞նք են փոփոխականների միջև փոխհարաբերությունների տեսակները:

Ընդհանուր առմամբ, գոյություն ունեն հարաբերությունների երկու հակադիր տեսակ՝ հարաբերակցություն և ռեգրեսիա:

Առաջինը բնութագրվում է պայմանական փոփոխականների հավասարությամբ։ IN այս դեպքումՀստակ հայտնի չէ, թե որ փոփոխականն է կախված մյուսից։

Եթե ​​փոփոխականների միջև հավասարություն չկա, և պայմաններն ասում են, թե որ փոփոխականն է բացատրական և որը կախված, ապա կարելի է խոսել երկրորդ տիպի կապի առկայության մասին։ Գծային ռեգրեսիոն հավասարում կառուցելու համար անհրաժեշտ կլինի պարզել, թե ինչ տեսակի հարաբերություն է նկատվում։

Ռեգրեսիաների տեսակները

Այսօր կան ռեգրեսիայի 7 տարբեր տեսակներ՝ հիպերբոլիկ, գծային, բազմակի, ոչ գծային, զույգական, հակադարձ, լոգարիթմականորեն գծային։

Հիպերբոլիկ, գծային և լոգարիթմական

Գծային ռեգրեսիայի հավասարումը օգտագործվում է վիճակագրության մեջ՝ հստակ բացատրելու հավասարման պարամետրերը։ Կարծես y = c+t*x+E: Հիպերբոլիկ հավասարումն ունի կանոնավոր հիպերբոլայի ձև y = c + m / x + E: Լոգարիթմորեն գծային հավասարումն արտահայտում է հարաբերությունը լոգարիթմական ֆունկցիայի միջոցով. In y = c + m * In x + E-ում:

Բազմակի և ոչ գծային

Եվս երկուսը բարդ տեսակներՌեգրեսիան բազմակի է և ոչ գծային: Հավասարումը բազմակի ռեգրեսիաարտահայտվում է y = f(x 1, x 2 ...x c) + E ֆունկցիայով։ Այս իրավիճակում y-ը գործում է որպես կախյալ փոփոխական, իսկ x-ը՝ որպես բացատրական փոփոխական։ E փոփոխականը ստոխաստիկ է, այն ներառում է այլ գործոնների ազդեցությունը հավասարման մեջ: Ոչ գծային հավասարումհետընթացը մի քիչ հակասական է: Մի կողմից հաշվի առնված ցուցանիշների համեմատ այն գծային չէ, բայց մյուս կողմից ցուցանիշները գնահատողի դերում գծային է։

Ռեգրեսիաների հակադարձ և զուգակցված տեսակներ

Հակադարձը ֆունկցիայի տեսակ է, որը պետք է փոխարկվի գծային տեսք. Առավել ավանդական կիրառական ծրագրերում այն ​​ունի y = 1/c + m*x+E ֆունկցիայի ձև։ Զույգ ռեգրեսիոն հավասարումը ցույց է տալիս տվյալների միջև կապը որպես y = f (x) + E ֆունկցիա: Ինչպես մյուս հավասարումներում, y-ն կախված է x-ից, իսկ E-ն ստոխաստիկ պարամետր է:

Հարաբերակցության հայեցակարգ

Սա ցուցիչ է, որը ցույց է տալիս երկու երևույթների կամ գործընթացների միջև հարաբերությունների առկայությունը: Հարաբերությունների ուժն արտահայտվում է որպես հարաբերակցության գործակից: Դրա արժեքը տատանվում է [-1;+1] միջակայքում: Բացասական ցուցանիշցույց է տալիս առկայություն հետադարձ կապ, դրական՝ ուղիղ գծի մասին։ Եթե ​​գործակիցը վերցնում է 0-ի արժեք, ապա հարաբերություն չկա: Ինչպես ավելի մոտ արժեքդեպի 1 - որքան ուժեղ է կապը պարամետրերի միջև, որքան մոտ է 0-ին, այնքան թույլ է այն:

Մեթոդներ

Հարաբերակցության պարամետրային մեթոդները կարող են գնահատել հարաբերությունների ուժը: Դրանք օգտագործվում են բաշխման գնահատման հիման վրա՝ ուսումնասիրելու այն պարամետրերը, որոնք ենթարկվում են նորմալ բաշխման օրենքին:

Գծային ռեգրեսիայի հավասարման պարամետրերն անհրաժեշտ են կախվածության տեսակը, ռեգրեսիոն հավասարման գործառույթը պարզելու և ընտրված հարաբերությունների բանաձևի ցուցանիշները գնահատելու համար։ Հարաբերակցության դաշտը օգտագործվում է որպես կապի նույնականացման մեթոդ: Դա անելու համար բոլոր առկա տվյալները պետք է պատկերված լինեն գրաֆիկորեն: Բոլոր հայտնի տվյալները պետք է գծագրվեն ուղղանկյուն երկչափ կոորդինատային համակարգում: Այսպես է ձևավորվում հարաբերակցության դաշտը։ Նկարագրող գործոնի արժեքները նշվում են աբսցիսայի առանցքի երկայնքով, մինչդեռ կախված գործոնի արժեքները նշվում են օրդինատների առանցքի երկայնքով: Եթե ​​պարամետրերի միջև կա ֆունկցիոնալ հարաբերություն, դրանք շարվում են գծի տեսքով:

Եթե ​​նման տվյալների հարաբերակցության գործակիցը 30%-ից պակաս է, կարելի է գործնականում խոսել լիակատար բացակայությունհաղորդակցություններ. Եթե ​​այն գտնվում է 30%-ից 70%-ի սահմաններում, ապա դա ցույց է տալիս միջին-փակ կապերի առկայությունը: 100% ցուցանիշը ֆունկցիոնալ կապի վկայություն է:

Ոչ գծային ռեգրեսիոն հավասարումը, ինչպես գծայինը, պետք է լրացվի հարաբերակցության ինդեքսով (R):

Հարաբերակցություն բազմակի ռեգրեսիայի համար

Որոշման գործակիցը քառակուսի ցուցիչն է բազմակի հարաբերակցություն. Նա խոսում է ներկայացված ցուցիչների սերտ կապի մասին ուսումնասիրվող հատկանիշի հետ։ Այն կարող է խոսել նաև արդյունքի վրա պարամետրերի ազդեցության բնույթի մասին: Բազմակի ռեգրեսիայի հավասարումը գնահատվում է այս ցուցանիշով:

Բազմակի հարաբերակցության ցուցանիշը հաշվարկելու համար անհրաժեշտ է հաշվարկել դրա ցուցանիշը։

Նվազագույն քառակուսի մեթոդ

Այս մեթոդը ռեգրեսիոն գործոնների գնահատման միջոց է: Դրա էությունը ֆունկցիայից գործոնի կախվածության արդյունքում ստացված քառակուսի շեղումների գումարը նվազագույնի հասցնելն է։

Նման մեթոդով կարելի է գնահատել զույգ գծային ռեգրեսիոն հավասարումը: Հավասարումների այս տեսակն օգտագործվում է, երբ ցուցիչների միջև զուգակցված գծային հարաբերություն է հայտնաբերվում:

Հավասարման պարամետրեր

Գծային ռեգրեսիայի ֆունկցիայի յուրաքանչյուր պարամետր ունի որոշակի նշանակություն: Զուգակցված գծային ռեգրեսիոն հավասարումը պարունակում է երկու պարամետր՝ c և m: m պարամետրը ցույց է տալիս y ֆունկցիայի վերջնական ցուցիչի միջին փոփոխությունը, պայմանով, որ x փոփոխականը նվազի (մեծանա) մեկ պայմանական միավորով: Եթե ​​x փոփոխականը զրո է, ապա ֆունկցիան հավասար է c պարամետրին։ Եթե ​​x փոփոխականը զրո չէ, ապա c գործոնը տնտեսական նշանակություն չունի։ Ֆունկցիայի վրա միակ ազդեցությունը c գործոնի դիմաց գտնվող նշանն է: Եթե ​​կա մինուս, ապա կարելի է ասել, որ արդյունքի փոփոխությունը գործոնի համեմատ դանդաղ է։ Եթե ​​կա գումարած, ապա սա ցույց է տալիս արդյունքի արագացված փոփոխություն:

Յուրաքանչյուր պարամետր, որը փոխում է ռեգրեսիոն հավասարման արժեքը, կարող է արտահայտվել հավասարման միջոցով: Օրինակ, c գործոնը ունի c = y - mx ձևը:

Խմբավորված տվյալներ

Կան առաջադրանքների պայմաններ, որոնցում բոլոր տեղեկությունները խմբավորված են ըստ x հատկանիշի, բայց որոշակի խմբի համար նշվում են կախված ցուցիչի համապատասխան միջին արժեքները: Այս դեպքում միջին արժեքները բնութագրում են, թե ինչպես է փոխվում x-ից կախված ցուցանիշը: Այսպիսով, խմբավորված տեղեկատվությունը օգնում է գտնել ռեգրեսիայի հավասարումը: Այն օգտագործվում է որպես հարաբերությունների վերլուծություն։ Այնուամենայնիվ, այս մեթոդն ունի իր թերությունները. Ցավոք, միջին ցուցանիշները հաճախ ենթարկվում են արտաքին տատանումների։ Այս տատանումները չեն արտացոլում հարաբերությունների օրինաչափությունը, դրանք պարզապես քողարկում են դրա «աղմուկը»: Միջինները ցույց են տալիս հարաբերությունների օրինաչափություններ, որոնք շատ ավելի վատն են, քան գծային ռեգրեսիոն հավասարումը: Այնուամենայնիվ, դրանք կարող են օգտագործվել որպես հավասարում գտնելու հիմք: Բազմապատկելով առանձին բնակչության թիվը համապատասխան միջինով, կարելի է ստանալ y գումարը խմբի ներսում: Հաջորդը, դուք պետք է գումարեք ստացված բոլոր գումարները և գտնեք վերջնական ցուցանիշը y: Մի փոքր ավելի դժվար է հաշվարկներ կատարել xy գումարի ցուցիչով։ Եթե ​​միջակայքերը փոքր են, մենք կարող ենք պայմանականորեն ընդունել x ցուցանիշը բոլոր միավորների համար (խմբում) նույնը: Դուք պետք է այն բազմապատկեք y-ի գումարով, որպեսզի պարզեք x-ի և y-ի արտադրյալների գումարը: Այնուհետև բոլոր գումարները գումարվում են և ստացվում է xy ընդհանուր գումարը:

Բազմակի զույգ ռեգրեսիայի հավասարում. հարաբերությունների կարևորության գնահատում

Ինչպես արդեն քննարկվեց, բազմակի ռեգրեսիան ունի y = f (x 1,x 2,…,x m)+E ձևի ֆունկցիա: Ամենից հաճախ նման հավասարումը օգտագործվում է ապրանքի առաջարկի և պահանջարկի խնդիրը լուծելու, հետգնված բաժնետոմսերի տոկոսային եկամուտների և արտադրության արժեքի ֆունկցիայի պատճառներն ու տեսակը ուսումնասիրելու համար: Այն նաև ակտիվորեն օգտագործվում է մակրոտնտեսական հետազոտությունների և հաշվարկների լայն տեսականիում, սակայն միկրոտնտեսության մակարդակում այս հավասարումն օգտագործվում է մի փոքր ավելի հազվադեպ:

Բազմաթիվ ռեգրեսիայի հիմնական խնդիրն է կառուցել հսկայական քանակությամբ տեղեկատվություն պարունակող տվյալների մոդել, որպեսզի հետագայում որոշվի, թե ինչ ազդեցություն ունի գործոններից յուրաքանչյուրն առանձին և ընդհանուր առմամբ այն ցուցանիշի և դրա գործակիցների վրա: Ռեգրեսիայի հավասարումը կարող է ընդունել տարբեր արժեքներ: Այս դեպքում հարաբերությունները գնահատելու համար սովորաբար օգտագործվում են երկու տեսակի ֆունկցիաներ՝ գծային և ոչ գծային։

Գծային ֆունկցիան պատկերված է հետևյալ հարաբերության տեսքով՝ y = a 0 + a 1 x 1 + a 2 x 2,+ ... + a m x m: Այս դեպքում a2, a m-ը համարվում են «մաքուր» ռեգրեսիոն գործակիցներ: Դրանք անհրաժեշտ են y պարամետրի միջին փոփոխությունը յուրաքանչյուր համապատասխան x պարամետրի փոփոխությամբ (նվազում կամ աճ) մեկ միավորով բնութագրելու համար՝ այլ ցուցանիշների կայուն արժեքների պայմանով:

Ոչ գծային հավասարումներն ունեն, օրինակ, ուժային ֆունկցիայի y=ax 1 b1 x 2 b2 ...x m bm ձևը։ Այս դեպքում b 1, b 2 ..... b m ցուցանիշները կոչվում են առաձգականության գործակիցներ, դրանք ցույց են տալիս, թե ինչպես կփոխվի արդյունքը (որքանով%) համապատասխան x ցուցանիշի 1% աճով (նվազմամբ) և այլ գործոնների կայուն ցուցանիշով։

Ինչ գործոններ պետք է հաշվի առնել բազմակի ռեգրեսիա կառուցելիս

Բազմակի ռեգրեսիա ճիշտ կառուցելու համար անհրաժեշտ է պարզել, թե որ գործոններին պետք է հատուկ ուշադրություն դարձնել։

Անհրաժեշտ է որոշակի պատկերացում ունենալ տնտեսական գործոնների և մոդելավորվողի միջև փոխհարաբերությունների բնույթի մասին: Գործոնները, որոնք պետք է ներառվեն, պետք է համապատասխանեն հետևյալ չափանիշներին.

  • Պետք է ենթարկվի քանակական չափման: Օբյեկտի որակը բնութագրող գործոն օգտագործելու համար նրան ամեն դեպքում պետք է տալ քանակական ձև։
  • Չպետք է լինի գործոնների փոխկապակցվածություն կամ ֆունկցիոնալ հարաբերություններ: Նման գործողությունները առավել հաճախ հանգեցնում են անդառնալի հետևանքներ- սովորական հավասարումների համակարգը դառնում է անվերապահ, և դա ենթադրում է դրա անհուսալիությունը և անհասկանալի գնահատականները:
  • Հսկայական հարաբերակցության ցուցանիշի դեպքում հնարավոր չէ պարզել գործոնների մեկուսացված ազդեցությունը ցուցանիշի վերջնական արդյունքի վրա, հետևաբար գործակիցները դառնում են անմեկնելի։

Շինարարական մեթոդներ

Գոյություն ունի մեծ գումարմեթոդներ և տեխնիկա, որոնք բացատրում են, թե ինչպես կարելի է գործոններ ընտրել հավասարման համար: Այնուամենայնիվ, այս բոլոր մեթոդները հիմնված են գործակիցների ընտրության վրա, օգտագործելով հարաբերակցության ցուցանիշը: Դրանց թվում են.

  • Վերացման մեթոդ.
  • Անցման մեթոդ.
  • Փուլային ռեգրեսիոն վերլուծություն.

Առաջին մեթոդը ներառում է բոլոր գործակիցների զտումը ընդհանուր հավաքածուից: Երկրորդ մեթոդը ներառում է բազմաթիվ լրացուցիչ գործոնների ներդրում: Դե, երրորդը գործոնների վերացումն է, որոնք նախկինում օգտագործվում էին հավասարման համար: Այս մեթոդներից յուրաքանչյուրն իրավունք ունի գոյություն ունենալ: Նրանք ունեն իրենց դրական ու բացասական կողմերը, բայց բոլորն էլ կարող են յուրովի լուծել ավելորդ ցուցանիշների վերացման հարցը։ Որպես կանոն, յուրաքանչյուր առանձին մեթոդով ստացված արդյունքները բավականին մոտ են։

Բազմաչափ վերլուծության մեթոդներ

Գործոնների որոշման նման մեթոդները հիմնված են փոխկապակցված բնութագրերի առանձին համակցությունների դիտարկման վրա: Դրանք ներառում են տարբերակիչ վերլուծություն, ձևի ճանաչում, հիմնական բաղադրիչի վերլուծություն և կլաստերային վերլուծություն: Բացի այդ, կա նաև գործոնային վերլուծություն, սակայն այն առաջացել է բաղադրիչի մեթոդի մշակման շնորհիվ։ Դրանք բոլորը կիրառվում են որոշակի հանգամանքներում՝ որոշակի պայմանների և գործոնների առկայության դեպքում:

Ներկայությամբ հարաբերական կապԳործոնի և արդյունքի նշանների միջև բժիշկները հաճախ ստիպված են լինում պարզել, թե ինչ չափով կարող է փոխվել մեկ նշանի արժեքը, երբ մյուսը փոխվում է ընդհանուր ընդունված չափման միավորի կամ հաստատված հետազոտողի կողմից:

Օրինակ՝ ինչպե՞ս կփոխվի 1-ին դասարանի դպրոցականների (աղջիկների կամ տղաների) մարմնի քաշը, եթե հասակը բարձրանա 1 սմ-ով, այդ նպատակների համար կիրառվում է ռեգրեսիոն վերլուծության մեթոդը։

Նորմատիվ սանդղակների և չափորոշիչների մշակման համար առավել հաճախ օգտագործվում է ռեգրեսիոն վերլուծության մեթոդը ֆիզիկական զարգացում.

  1. Ռեգրեսիայի սահմանում. Ռեգրեսիան ֆունկցիա է, որը թույլ է տալիս մեկ հատկանիշի միջին արժեքից որոշել մեկ այլ հատկանիշի միջին արժեքը, որը փոխկապակցված է առաջինի հետ:

    Այդ նպատակով օգտագործվում է ռեգրեսիայի գործակիցը և մի շարք այլ պարամետրեր։ Օրինակ, դուք կարող եք հաշվարկել թիվը մրսածությունմիջինը աշուն-ձմեռ ժամանակահատվածում օդի միջին ամսական ջերմաստիճանի որոշակի արժեքներում:

  2. Ռեգրեսիայի գործակիցի որոշում. Ռեգրեսիայի գործակիցը այն բացարձակ արժեքն է, որով միջինում փոխվում է մեկ հատկանիշի արժեքը, երբ մեկ այլ հարակից հատկանիշ փոխվում է չափման որոշակի միավորով:
  3. Ռեգրեսիայի գործակցի բանաձևը. R y/x = r xy x (σ y / σ x)
    որտեղ R у/х - ռեգրեսիայի գործակից;
    r xy - հարաբերակցության գործակից x և y բնութագրերի միջև;
    (σ y և σ x) - x և y բնութագրերի ստանդարտ շեղումներ:

    Մեր օրինակում;
    σ x = 4.6 (օդի ջերմաստիճանի ստանդարտ շեղում աշուն-ձմեռ ժամանակահատվածում;
    σ y = 8,65 (վարակիչ և սառը հիվանդությունների թվի ստանդարտ շեղում):
    Այսպիսով, R y/x-ը ռեգրեսիայի գործակիցն է:
    R у/х = -0.96 x (4.6 / 8.65) = 1.8, այսինքն. երբ օդի միջին ամսական ջերմաստիճանը (x) նվազի 1 աստիճանով, աշուն-ձմեռ ժամանակահատվածում վարակիչ և սառը հիվանդությունների միջին թիվը (y) կփոխվի 1,8 դեպքով։

  4. Ռեգրեսիայի հավասարում. y = M y + R y/x (x - M x)
    որտեղ y-ը բնութագրիչի միջին արժեքն է, որը պետք է որոշվի, երբ մեկ այլ բնութագրիչի միջին արժեքը փոխվում է (x);
    x-ը մեկ այլ հատկանիշի հայտնի միջին արժեքն է.
    R y / x - ռեգրեսիայի գործակից;
    M x, M y - x և y բնութագրերի հայտնի միջին արժեքները:

    Օրինակ, վարակիչ և սառը հիվանդությունների միջին թիվը (y) կարելի է որոշել առանց հատուկ չափումների օդի միջին ամսական ջերմաստիճանի ցանկացած միջին արժեքով (x): Այսպիսով, եթե x = - 9°, R y/x = 1,8 հիվանդություններ, M x = -7°, M y = 20 հիվանդություններ, ապա y = 20 + 1,8 x (9-7) = 20 + 3 ,6 = 23,6 հիվանդություններ.
    Այս հավասարումը կիրառվում է երկու բնութագրերի (x և y) միջև գծային հարաբերությունների դեպքում։

  5. Ռեգրեսիայի հավասարման նպատակը. Ռեգրեսիոն հավասարումը օգտագործվում է ռեգրեսիոն գիծ կառուցելու համար: Վերջինս թույլ է տալիս առանց հատուկ չափումների որոշել մեկ հատկանիշի ցանկացած միջին արժեք (y), եթե փոխվում է մեկ այլ հատկանիշի արժեքը (x): Այս տվյալների հիման վրա կառուցվում է գրաֆիկ. ռեգրեսիայի գիծ, որը կարող է օգտագործվել մրսածության միջին թիվը որոշելու համար միջին ամսական ջերմաստիճանի ցանկացած արժեքով մրսածության թվի հաշվարկված արժեքների միջակայքում:
  6. Ռեգրեսիոն Սիգմա (բանաձև).
    որտեղ σ Rу/х - ռեգրեսիայի սիգմա (ստանդարտ շեղում);
    σ y - y բնութագրիչի ստանդարտ շեղում;
    r xy - հարաբերակցության գործակից x և y բնութագրերի միջև:

    Այսպիսով, եթե σ y - մրսածության թվի ստանդարտ շեղումը = 8,65; r xy - հարաբերակցության գործակիցը մրսածության քանակի (y) և օդի միջին ամսական ջերմաստիճանի միջև աշուն-ձմեռ ժամանակահատվածում (x) հավասար է - 0,96-ի, ապա.

  7. Ռեգրեսիայի սիգմա հանձնարարություն. Նկարագրում է ստացված հատկանիշի (y) բազմազանության չափը։

    Օրինակ, այն բնութագրում է մրսածության քանակի բազմազանությունը աշուն-ձմեռ ժամանակահատվածում օդի միջին ամսական ջերմաստիճանի որոշակի արժեքով։ Այսպիսով, օդի ջերմաստիճանում x 1 = -6° մրսածության միջին թիվը կարող է տատանվել 15,78 հիվանդությունից մինչև 20,62 հիվանդություն:
    x 2 = -9°-ի դեպքում մրսածության միջին թիվը կարող է տատանվել 21,18 հիվանդությունից մինչև 26,02 հիվանդություն և այլն:

    Ռեգրեսիոն սիգմա օգտագործվում է ռեգրեսիոն սանդղակի կառուցման համար, որն արտացոլում է ստացված բնութագրի արժեքների շեղումը ռեգրեսիոն գծի վրա գծագրված միջին արժեքից:

  8. Ռեգրեսիայի սանդղակը հաշվարկելու և գծագրելու համար անհրաժեշտ տվյալներ
    • ռեգրեսիայի գործակից - R у/х;
    • ռեգրեսիայի հավասարումը - y = M y + R y / x (x-M x);
    • ռեգրեսիոն սիգմա - σ Rx/y
  9. Հաշվարկների հաջորդականությունը և ռեգրեսիայի սանդղակի գրաֆիկական ներկայացումը.
    • որոշեք ռեգրեսիայի գործակիցը բանաձևով (տես պարբերություն 3): Օրինակ, անհրաժեշտ է որոշել, թե միջինում որքանով կփոխվի մարմնի քաշը (որոշակի տարիքում՝ կախված սեռից), եթե Միջին բարձրությունըկփոխվի 1 սմ-ով։
    • օգտագործելով ռեգրեսիայի հավասարման բանաձևը (տես կետ 4), որոշեք, թե ինչպիսին կլինի, օրինակ, մարմնի քաշը միջինում (y, y 2, y 3 ...) * որոշակի բարձրության արժեքի համար (x, x 2, x 3): ..) .
      ________________
      * «y»-ի արժեքը պետք է հաշվարկվի «x»-ի առնվազն երեք հայտնի արժեքների համար:

      Միևնույն ժամանակ, հայտնի են մարմնի քաշի և հասակի միջին արժեքները (M x և M y) որոշակի տարիքի և սեռի համար.

    • հաշվարկել ռեգրեսիոն սիգմա՝ իմանալով σ y և r xy-ի համապատասխան արժեքները և դրանց արժեքները փոխարինելով բանաձևով (տես պարբերություն 6):
    • հայտնի x 1, x 2, x 3 և համապատասխան միջին արժեքների հիման վրա y 1, y 2 y 3, ինչպես նաև ամենափոքր (y - σ rу/х) և ամենամեծ (y + σ rу) /х) արժեքները (y) կառուցում են ռեգրեսիայի սանդղակ:

      Ռեգրեսիայի սանդղակը գրաֆիկորեն ներկայացնելու համար գծապատկերում նախ նշվում են x, x2, x3 արժեքները (օրդինատների առանցքը), այսինքն. կառուցվում է ռեգրեսիոն գիծ, ​​օրինակ՝ մարմնի քաշի (y) կախվածությունը բարձրությունից (x):

      Այնուհետեւ համապատասխան կետերում նշվում են y 1, y 2, y 3 թվային արժեքներռեգրեսիոն սիգմա, այսինքն. Գտե՛ք գրաֆիկի ամենափոքրը և ամենաբարձր արժեքը y 1, y 2, y 3.

  10. Ռեգրեսիայի սանդղակի գործնական կիրառում. Մշակվում են նորմատիվ սանդղակներ և չափորոշիչներ, մասնավորապես ֆիզիկական զարգացման համար։ Օգտագործելով ստանդարտ սանդղակ, դուք կարող եք անհատական ​​գնահատական ​​տալ երեխաների զարգացմանը: Այս դեպքում ֆիզիկական զարգացումը գնահատվում է որպես ներդաշնակ, եթե, օրինակ, որոշակի բարձրության վրա երեխայի մարմնի քաշը գտնվում է ռեգրեսիայի մեկ սիգմայի սահմաններում մարմնի քաշի միջին հաշվարկված միավորի նկատմամբ՝ (y) տվյալ հասակի համար (x) ( y ± 1 σ Ry/x):

    Ֆիզիկական զարգացումը համարվում է աններդաշնակ մարմնի քաշի առումով, եթե երեխայի մարմնի քաշը որոշակի հասակի համար գտնվում է ռեգրեսիայի երկրորդ սիգմայի սահմաններում. (y ± 2 σ Ry/x)

    Ֆիզիկական զարգացումը կտրուկ աններդաշնակ կլինի մարմնի ավելցուկային և անբավարար քաշի պատճառով, եթե որոշակի հասակի համար մարմնի քաշը գտնվում է ռեգրեսիայի երրորդ սիգմայի սահմաններում (y ± 3 σ Ry/x):

Արդյունքների համաձայն վիճակագրական հետազոտություն 5 տարեկան տղաների ֆիզիկական զարգացումը, հայտնի է, որ նրանց միջին հասակը (x) 109 սմ է, իսկ մարմնի միջին քաշը (y) 19 կգ։ Հասակի և մարմնի քաշի հարաբերակցության գործակիցը +0,9 է, ստանդարտ շեղումները ներկայացված են աղյուսակում։

Պահանջվում է:

  • հաշվարկել ռեգրեսիայի գործակիցը;
  • օգտագործելով ռեգրեսիոն հավասարումը, որոշեք, թե ինչպիսին կլինի 5 տարեկան տղաների մարմնի ակնկալվող քաշը x1 = 100 սմ, x2 = 110 սմ, x3 = 120 սմ բարձրությամբ;
  • հաշվարկել ռեգրեսիոն սիգմա, կառուցել ռեգրեսիոն սանդղակ և ներկայացնել դրա լուծման արդյունքները գրաֆիկորեն.
  • համապատասխան եզրակացություններ անել.

Խնդրի պայմանները և դրա լուծման արդյունքները ներկայացված են ամփոփ աղյուսակում։

Աղյուսակ 1

Խնդրի պայմանները Խնդրի լուծման արդյունքները
ռեգրեսիայի հավասարումը ռեգրեսիոն սիգմա ռեգրեսիոն սանդղակ (մարմնի ակնկալվող քաշը (կգ-ով))
Մ σ r xy R y/x X U σ R x/y y - ս Rу/х y + ս Rу/х
1 2 3 4 5 6 7 8 9 10
Բարձրություն (x) 109 սմ ± 4,4 սմ +0,9 0,16 100 սմ 17,56 կգ ± 0,35 կգ 17,21 կգ 17,91 կգ
Մարմնի զանգված (y) 19 կգ ± 0,8 կգ 110 սմ 19,16 կգ 18,81 կգ 19,51 կգ
120 սմ 20,76 կգ 20,41 կգ 21,11 կգ

Լուծում.

Եզրակացություն.Այսպիսով, ռեգրեսիայի սանդղակը մարմնի քաշի հաշվարկված արժեքների սահմաններում թույլ է տալիս որոշել այն բարձրության կամ գնահատման ցանկացած այլ արժեքով: անհատական ​​զարգացումերեխա. Դա անելու համար վերականգնեք ռեգրեսիայի գծին ուղղահայացը:

  1. Վլասով Վ.Վ. Համաճարակաբանություն. - M.: GEOTAR-MED, 2004. - 464 p.
  2. Լիսիցին Յու.Պ. Հանրային առողջությունև առողջապահություն։ Դասագիրք բուհերի համար. - M.: GEOTAR-MED, 2007. - 512 p.
  3. Բժիշկ Վ.Ա., Յուրիև Վ.Կ. Դասախոսությունների դասընթաց հանրային առողջության և առողջապահության վերաբերյալ. Մաս 1. Հանրային առողջություն. - Մ.: Բժշկություն, 2003. - 368 էջ.
  4. Մինյաև Վ.Ա., Վիշնյակով Ն.Ի. Սոցիալական բժշկության և առողջապահության կազմակերպություն (Ձեռնարկ 2 հատորով): - Սանկտ Պետերբուրգ, 1998. -528 էջ.
  5. Կուչերենկո Վ.Զ., Ագարկով Ն.Մ. և այլն: Սոցիալական հիգիենայի և առողջապահական կազմակերպություն ( Ուսուցողական) - Մոսկվա, 2000. - 432 էջ.
  6. S. Glanz. Բժշկական և կենսաբանական վիճակագրություն. Թարգմանություն անգլերենից - Մ., Պրակտիկա, 1998. - 459 էջ.

Ռեգրեսիոն վերլուծությունընկած է էկոնոմետրիկ մոդելների մեծ մասի ստեղծման հիմքում, որոնք ներառում են ծախսերի գնահատման մոդելներ: Գնահատման մոդելներ կառուցելու համար այս մեթոդը կարող է օգտագործվել, եթե անալոգների (համեմատելի օբյեկտների) և ծախսերի (համեմատության տարրերի) քանակը միմյանց հետ կապված են հետևյալ կերպ. Պ> (5 -g-10) x դեպի,դրանք. պետք է լինի 5-10 անգամ ավելի շատ անալոգներ, քան ծախսերի գործոնները: Տվյալների քանակի և գործոնների քանակի հարաբերակցության նույն պահանջը վերաբերում է այլ առաջադրանքներին՝ կապ հաստատել օբյեկտի արժեքի և սպառողական պարամետրերի միջև. ուղղիչ ինդեքսների հաշվարկման ընթացակարգի հիմնավորումը. գների միտումների բացահայտում; մաշվածության և ազդող գործոնների փոփոխությունների միջև կապ հաստատելը. ծախսերի ստանդարտների հաշվարկման համար կախվածության ձեռքբերում և այլն: Այս պահանջին համապատասխանելը անհրաժեշտ է, որպեսզի կրճատվի տվյալների ընտրանքի հետ աշխատելու հավանականությունը, որը չի բավարարում պատահական փոփոխականների նորմալ բաշխման պահանջը:

Հետադարձ կապը արտացոլում է միայն ստացված փոփոխականի փոփոխությունների միջին միտումը, օրինակ՝ արժեքը, մեկ կամ մի քանի գործոն փոփոխականների փոփոխություններից, օրինակ՝ գտնվելու վայրը, սենյակների քանակը, տարածքը, հատակը և այլն: Սա ռեգրեսիայի և ֆունկցիոնալ հարաբերությունների միջև տարբերությունն է, որի արդյունքում ստացված փոփոխականի արժեքը խստորեն սահմանված է գործոնային փոփոխականների տվյալ արժեքի համար:

Հետընթաց կապի առկայություն / ստացվածի միջև ժամըև գործոնային փոփոխականներ x p ..., x k(գործոնները) ցույց է տալիս, որ այս հարաբերությունը որոշվում է ոչ միայն ընտրված գործոնի փոփոխականների ազդեցությամբ, այլ նաև փոփոխականների ազդեցությամբ, որոնցից մի քանիսն ընդհանուր առմամբ անհայտ են, մյուսները չեն կարող գնահատվել և հաշվի առնել.

Չհաշվառված փոփոխականների ազդեցությունը նշվում է այս հավասարման երկրորդ անդամով ?, որը կոչվում է մոտավոր սխալ:

Առանձնացվում են ռեգրեսիայի կախվածության հետևյալ տեսակները.

  • ? զուգակցված ռեգրեսիա - երկու փոփոխականների (արդյունք և գործոն) հարաբերություններ.
  • ? բազմակի ռեգրեսիա - կապը մեկ արդյունքի փոփոխականի և հետազոտության մեջ ընդգրկված երկու կամ ավելի գործոն փոփոխականների միջև:

Ռեգրեսիոն վերլուծության հիմնական խնդիրն է քանակականացումփոփոխականների (զույգ ռեգրեսիայի) և բազմակի փոփոխականների (բազմակի ռեգրեսիայի դեպքում) հարաբերությունների սերտությունը: Կապի սերտությունը քանակապես արտահայտվում է հարաբերակցության գործակցով։

Ռեգրեսիոն վերլուծության օգտագործումը հնարավորություն է տալիս սահմանել հիմնական գործոնների (հեդոնական բնութագրերի) ազդեցության օրինակը հետազոտվող ցուցիչի վրա, ինչպես ամբողջությամբ, այնպես էլ նրանցից յուրաքանչյուրի համար առանձին: Ռեգրեսիոն վերլուծության օգնությամբ, որպես մաթեմատիկական վիճակագրության մեթոդ, հնարավոր է նախ գտնել և նկարագրել ստացված (որոնվող) փոփոխականի վերլուծական կախվածության ձևը գործոններից և, երկրորդ, գնահատել սերտությունը. այս կախվածությունը.

Առաջին խնդիրը լուծելով` ստացվում է մաթեմատիկական ռեգրեսիոն մոդել, որի օգնությամբ այնուհետև հաշվարկվում է ցանկալի ցուցանիշը գործոնների տվյալ արժեքների համար: Երկրորդ խնդրի լուծումը թույլ է տալիս հաստատել հաշվարկված արդյունքի հավաստիությունը։

Այսպիսով, ռեգրեսիոն վերլուծությունը կարող է սահմանվել որպես ֆորմալ (մաթեմատիկական) ընթացակարգերի մի շարք, որոնք նախատեսված են արդյունքի և գործոնային փոփոխականների միջև հարաբերությունների սերտությունը, ուղղությունը և վերլուծական արտահայտությունը չափելու համար, այսինքն. Նման վերլուծության արդյունքը պետք է լինի կառուցվածքային և քանակապես սահմանված ձևի վիճակագրական մոդել.

Որտեղ y -ստացված փոփոխականի միջին արժեքը (ցանկալի ցուցանիշ, օրինակ՝ ինքնարժեք, վարձավճար, կապիտալիզացիայի դրույքաչափ) ըստ Պնրա դիտարկումները; x - գործոնի փոփոխականի արժեքը (/րդ ծախսային գործակիցը); դեպի -գործոնային փոփոխականների քանակը.

Գործառույթ f (x l,...,x lc),Ստացված փոփոխականի կախվածությունը գործոնային գործոններից նկարագրելը կոչվում է ռեգրեսիոն հավասարում (ֆունկցիա): «Ռեգեսիա» տերմինը (հետադարձ (լատիներեն) - նահանջ, վերադարձ ինչ-որ բանի) կապված է մեթոդի ձևավորման փուլում լուծված կոնկրետ խնդիրներից մեկի առանձնահատկությունների հետ և ներկայումս չի արտացոլում մեթոդի ողջ էությունը, բայց շարունակում է կիրառվել։

Ռեգրեսիայի վերլուծություն ընդհանուր դեպքներառում է հետևյալ քայլերը.

  • ? միատարր առարկաների նմուշի ձևավորում և այդ օբյեկտների մասին նախնական տեղեկատվության հավաքում.
  • ? ստացված փոփոխականի վրա ազդող հիմնական գործոնների ընտրություն.
  • ? Օգտագործման նմուշի նորմալության ստուգում X 2 կամ երկանդամ թեստ;
  • ? Հաղորդակցության ձևի վերաբերյալ վարկածի ընդունում.
  • ? մաթեմատիկական մշակումտվյալներ;
  • ? ռեգրեսիայի մոդելի ձեռքբերում;
  • ? իր վիճակագրական ցուցանիշների գնահատում.
  • ? ստուգման հաշվարկներ՝ օգտագործելով ռեգրեսիոն մոդել;
  • ? արդյունքների վերլուծություն։

Գործողությունների նշված հաջորդականությունը տեղի է ունենում, երբ ուսումնասիրվում է և՛ գործակցային փոփոխականի և մեկ արդյունքային փոփոխականի միջև զուգակցված հարաբերությունը, և՛ արդյունքային փոփոխականի և մի քանի գործոնայինի միջև բազմակի հարաբերություն:

Ռեգրեսիոն վերլուծության օգտագործումը որոշակի պահանջներ է դնում նախնական տեղեկատվության վրա.

  • ? օբյեկտների վիճակագրական նմուշը պետք է միատարր լինի գործառական և կառուցվածքային-տեխնոլոգիական առումով.
  • ? բավականին շատ;
  • ? ուսումնասիրվող արժեքի ցուցիչը՝ ստացված փոփոխականը (գինը, ծախսերը, ծախսերը) - պետք է բերվի նույն պայմաններին՝ նմուշի բոլոր օբյեկտների համար դրա հաշվարկման համար.
  • ? գործոնային փոփոխականները պետք է չափվեն բավականաչափ ճշգրիտ.
  • ? գործոնային փոփոխականները պետք է լինեն անկախ կամ նվազագույն կախված:

Նմուշի միատարրության և ամբողջականության պահանջները հակասական են. որքան խստացվի առարկաների ընտրությունը՝ հիմնված դրանց միատարրության վրա, այնքան փոքր կլինի ստացված նմուշը, և, ընդհակառակը, նմուշը մեծացնելու համար անհրաժեշտ է ներառել առարկաներ, որոնք այնքան էլ նման չեն: միմյանց.

Միատարր օբյեկտների խմբի վերաբերյալ տվյալները հավաքելուց հետո դրանք վերլուծվում են՝ տեսական ռեգրեսիոն գծի տեսքով ստացված և գործոնային փոփոխականների միջև կապի ձևը հաստատելու համար: Տեսական ռեգրեսիոն գիծ գտնելու գործընթացը բաղկացած է մոտավոր կորի ողջամիտ ընտրությունից և դրա հավասարման գործակիցների հաշվարկից: Ռեգրեսիոն գիծը հարթ կոր է (առանձին դեպքում ուղիղ գիծ), որը նկարագրում է մաթեմատիկական ֆունկցիայի օգտագործումը ընդհանուր միտումուսումնասիրված կախվածությունը և կողմնակի գործոնների ազդեցությունից անկանոն, պատահական արտանետումների հարթեցումը:

Գնահատման առաջադրանքներում զուգակցված ռեգրեսիայի կախվածությունները ցուցադրելու համար առավել հաճախ օգտագործվում են հետևյալ գործառույթները. y - a 0 + արս + սուժ - յ - աջ&ի + սցուցիչ - y -գծային էքսպոնենցիալ - y - a 0 + ap* + c.Այստեղ - եմոտավոր սխալ, որը առաջացել է չհաշվառված պատահական գործոնների գործողությամբ:

Այս ֆունկցիաներում y-ը ստացված փոփոխականն է. x - գործոն փոփոխական (գործոն); Ա 0 , a r a 2 -ռեգրեսիոն մոդելի պարամետրեր, ռեգրեսիոն գործակիցներ.

Գծային էքսպոնենցիալ մոդելը պատկանում է այսպես կոչված հիբրիդային մոդելների դասին.

Որտեղ

որտեղ x (i = 1, /) - գործոնների արժեքներ;

b t (i = 0, /) - ռեգրեսիայի հավասարման գործակիցներ:

Այս հավասարման մեջ բաղադրիչները Ա, ԲԵվ Զհամապատասխանում են գնահատվող ակտիվի առանձին բաղադրիչների արժեքին, օրինակ՝ հողամասի արժեքին և բարելավման արժեքին և պարամետրին. Քտարածված է. Այն նախատեսված է կարգավորելու կողմից գնահատվող ակտիվի բոլոր բաղադրիչների արժեքը ընդհանուր գործոնազդեցություններ, ինչպիսիք են գտնվելու վայրը.

Գործակիցների արժեքները, որոնք գտնվում են համապատասխան գործակիցների ուժի մեջ, երկուական փոփոխականներ են (0 կամ 1): Աստիճանի հիմքում ընկած գործոնները դիսկրետ կամ շարունակական փոփոխականներ են:

Բազմապատկման գործակիցների հետ կապված գործոնները նույնպես շարունակական կամ դիսկրետ են:

Հստակեցումն իրականացվում է, որպես կանոն, օգտագործելով էմպիրիկ մոտեցում և ներառում է երկու փուլ.

  • ? գրաֆիկի վրա ռեգրեսիոն դաշտի կետերի գծում;
  • ? հնարավոր մոտավոր կորի տեսակի գրաֆիկական (տեսողական) վերլուծություն.

Ռեգրեսիայի կորի տեսակը միշտ չէ, որ կարող է անմիջապես ընտրվել: Այն որոշելու համար նախ գծագրեք ռեգրեսիոն դաշտի կետերը՝ հիմնվելով սկզբնական տվյալների վրա: Այնուհետև տեսողականորեն գծեք կետերի դիրքի երկայնքով՝ փորձելով պարզել կապի որակական օրինաչափությունը՝ միատեսակ աճ կամ միատեսակ անկում, աճ (նվազում) դինամիկայի արագության աճով (նվազում), սահուն մոտեցում որոշակիին։ մակարդակ.

Այս էմպիրիկ մոտեցումը լրացվում է տրամաբանական վերլուծությամբ՝ ելնելով ուսումնասիրվող գործոնների տնտեսական և ֆիզիկական բնույթի և նրանց փոխադարձ ազդեցության մասին արդեն հայտնի պատկերացումներից։

Օրինակ, հայտնի է, որ ստացված փոփոխականների կախվածություններն են տնտեսական ցուցանիշները(գներ, վարձակալություններ) մի շարք գործոնային փոփոխականներից՝ գնագոյացնող գործոններ (բնակավայրի կենտրոնից հեռավորությունը, տարածքը և այլն) իրենց բնույթով ոչ գծային են, և դրանք կարելի է բնութագրել բավականին խիստ՝ ըստ հզորության, էքսպոնենցիալ կամ քառակուսի ֆունկցիաներ. Բայց գործակիցների փոփոխությունների փոքր միջակայքերի համար ընդունելի արդյունքներ կարելի է ստանալ գծային ֆունկցիայի միջոցով:

Եթե, այնուամենայնիվ, դեռևս անհնար է անմիջապես որևէ գործառույթի վստահ ընտրություն կատարել, ապա ընտրվում են երկու կամ երեք գործառույթ, հաշվարկվում են դրանց պարամետրերը և այնուհետև, օգտագործելով կապի սերտության համապատասխան չափանիշները, գործառույթը վերջապես ընտրված.

Տեսականորեն կորի ձևը գտնելու հետընթացը կոչվում է ճշգրտումմոդելը և դրա գործակիցները. calibrationմոդելներ.

Եթե ​​պարզվի, որ ստացված y փոփոխականը կախված է մի քանի գործոն փոփոխականներից (գործոններից) x (, x 2, ..., x k,ապա նրանք դիմում են բազմակի ռեգրեսիայի մոդելի կառուցմանը: Սովորաբար օգտագործվում են բազմաթիվ հաղորդակցության երեք ձևեր. y - a 0 + a x x x + ա^ x 2 + ... + a k x k,ցուցիչ - y - a 0 a*i a x t-a x b,ուժ - y - a 0 x x ix 2 a 2. .x^կամ դրանց համակցությունները.

Էքսպոնենցիալ և ուժային ֆունկցիաները ավելի ունիվերսալ են, քանի որ դրանք մոտավոր ոչ գծային հարաբերություններ են, որոնք կախվածությունների գնահատման ժամանակ ուսումնասիրվածների մեծ մասն են։ Բացի այդ, դրանք կարող են օգտագործվել օբյեկտների և մեթոդի գնահատման մեջ վիճակագրական մոդելավորումզանգվածային գնահատման, իսկ անհատական ​​գնահատման ուղղակի համեմատության մեթոդի մեջ՝ ուղղիչ գործոններ սահմանելիս։

Կալիբրացման փուլում ռեգրեսիոն մոդելի պարամետրերը հաշվարկվում են նվազագույն քառակուսիների մեթոդով, որի էությունն այն է, որ ստացված փոփոխականի հաշվարկված արժեքների քառակուսի շեղումների գումարը. ժամը., այսինքն. հաշվարկված՝ օգտագործելով ընտրված միացման հավասարումը, փաստացի արժեքներից պետք է լինի նվազագույնը.

Արժեքներ ժ) (. և u.հայտնի են, հետևաբար Քմիայն հավասարման գործակիցների ֆունկցիա է։ Նվազագույնը գտնելու համար Սդուք պետք է մասնակի ածանցյալներ վերցնեք Քհավասարման գործակիցներով և հավասարեցնել դրանք զրոյի.

Արդյունքում ստանում ենք նորմալ հավասարումների համակարգ, որոնց թիվը հավասար է ցանկալի ռեգրեսիոն հավասարման որոշված ​​գործակիցների թվին։

Ենթադրենք՝ պետք է գտնել գործակիցները գծային հավասարում y - ա 0 + արս.Քառակուսի շեղումների գումարն ունի ձև.

/=1

Տարբերակել ֆունկցիան Քանհայտ գործակիցներով ա 0և և հավասարեցնել մասնակի ածանցյալները զրոյի.

Փոխակերպումներից հետո մենք ստանում ենք.

Որտեղ Պ -բնօրինակ իրական արժեքների քանակը ժամըդրանք (անալոգների քանակը):

Ռեգրեսիոն հավասարման գործակիցների հաշվարկման տրված կարգը կիրառելի է նաև ոչ գծային կախվածությունների դեպքում, եթե այդ կախվածությունները կարելի է գծայինացնել, այսինքն. հանգեցնել գծային ձևի՝ օգտագործելով փոփոխականների փոփոխությունը: Լոգարիթմից և փոփոխականների համապատասխան փոփոխությունից հետո ուժային և էքսպոնենցիալ ֆունկցիաները ստանում են գծային ձև: Օրինակ, հզորության ֆունկցիան լոգարիթմից հետո ստանում է ձև. y = 1p 0 +a x 1փ. Փոփոխականները փոխարինելուց հետո Y-Մեջ y, L 0 -Մեջ և թիվ X- x-ում մենք ստանում ենք գծային ֆունկցիա

Y=A 0 + cijX,որոնց գործակիցները հայտնաբերված են վերը նկարագրված եղանակով:

Նվազագույն քառակուսիների մեթոդը նույնպես օգտագործվում է բազմակի ռեգրեսիայի մոդելի գործակիցները հաշվարկելու համար։ Այսպիսով, երկու փոփոխականներով գծային ֆունկցիայի հաշվարկման նորմալ հավասարումների համակարգ XjԵվ x 2մի շարք փոխակերպումներից հետո այսպիսի տեսք ունի.

Սովորաբար այս համակարգըհավասարումները լուծվում են գծային հանրահաշվի մեթոդներով: Հոգնակի հզորության գործառույթտանում են դեպի գծային ձև՝ վերցնելով լոգարիթմները և փոխելով փոփոխականները նույն կերպ, ինչ զույգ հզորության ֆունկցիան:

Հիբրիդային մոդելներ օգտագործելիս հայտնաբերվում են բազմակի ռեգրեսիայի գործակիցներ՝ օգտագործելով հաջորդական մոտարկումների մեթոդի թվային ընթացակարգերը:

Մի քանի ռեգրեսիոն հավասարումներից վերջնական ընտրություն կատարելու համար անհրաժեշտ է յուրաքանչյուր հավասարում ստուգել հարաբերությունների ուժը, որը չափվում է հարաբերակցության գործակցով, շեղումով և տատանումների գործակցով: Ուսանողի և Ֆիշերի թեստերը կարող են օգտագործվել նաև գնահատման համար: Որքան մեծ է կապի սերտությունը կորը, այնքան ավելի նախընտրելի է այն, քանի որ մնացած բոլոր բաները հավասար են:

Եթե ​​այս դասի խնդիրը լուծվում է, երբ անհրաժեշտ է հաստատել ծախսերի ցուցիչի կախվածությունը ծախսերի գործոններից, ապա հասկանալի է հնարավորինս շատ ազդող գործոններ հաշվի առնելու և դրանով իսկ ավելի ճշգրիտ բազմակի ռեգրեսիայի մոդել կառուցելու ցանկությունը: . Այնուամենայնիվ, գործոնների քանակի ընդլայնումը խոչընդոտվում է երկու օբյեկտիվ սահմանափակումներով: Նախ, բազմակի ռեգրեսիայի մոդել կառուցելու համար անհրաժեշտ է օբյեկտների շատ ավելի մեծ նմուշ, քան զուգակցված մոդել կառուցելը: Ընդհանրապես ընդունված է, որ նմուշի օբյեկտների թիվը պետք է գերազանցի թվին Պգործոնները առնվազն 5-10 անգամ: Սրանից հետևում է, որ երեք ազդող գործոններով մոդել կառուցելու համար անհրաժեշտ է հավաքել մոտավորապես 20 օբյեկտի նմուշ՝ գործոնի արժեքների տարբեր հավաքածուով: Երկրորդ, մոդելի համար ընտրված գործոնները, որոնք ազդում են ծախսերի ցուցիչի վրա, պետք է բավականաչափ անկախ լինեն միմյանցից: Դա հեշտ չէ ապահովել, քանի որ նմուշը սովորաբար միավորում է միևնույն ընտանիքին պատկանող առարկաները, որոնց համար օբյեկտից առարկա տեղի է ունենում բազմաթիվ գործոնների բնական փոփոխություն:

Ռեգրեսիոն մոդելների որակը սովորաբար ստուգվում է՝ օգտագործելով հետևյալ վիճակագրական ցուցանիշները.

Ռեգրեսիայի հավասարման սխալի ստանդարտ շեղում (գնահատման սխալ).

Որտեղ Պ -նմուշի չափը (անալոգների քանակը);

դեպի -գործոնների քանակը (արժեքի գործոններ);

Սխալ, անբացատրելի ռեգրեսիայի հավասարումը(նկ. 3.2);

u. -ստացված փոփոխականի փաստացի արժեքը (օրինակ, արժեքը); y t -արդյունքի փոփոխականի հաշվարկված արժեքը.

Այս ցուցանիշը նույնպես կոչվում է գնահատման ստանդարտ սխալ (RMS սխալ) Նկարում կետերը ցույց են տալիս նմուշի հատուկ արժեքներ, խորհրդանիշը ցույց է տալիս նմուշի միջին արժեքների գիծը, իսկ թեք գծիկ-կետավոր գիծը ռեգրեսիայի գիծն է:


Բրինձ. 3.2.

Գնահատման սխալի ստանդարտ շեղումը չափում է y-ի իրական արժեքների շեղման չափը համապատասխան հաշվարկված արժեքներից ժամը( , ստացվել է ռեգրեսիոն մոդելի միջոցով: Եթե նմուշը, որի վրա հիմնված է մոդելը, ենթակա է նորմալ բաշխման օրենքին, ապա կարելի է պնդել, որ իրական արժեքների 68%-ը ժամըտիրույթում են ժամը ± &eռեգրեսիայի գծից, իսկ 95%-ը գտնվում է միջակայքում ժամը ± 2դ էլ. Այս ցուցանիշը հարմար է, քանի որ չափման միավորները sg?համապատասխանեցնել չափման միավորներին ժամը,. Այս առումով, այն կարող է օգտագործվել գնահատման գործընթացում ձեռք բերված արդյունքի ճշգրտությունը նշելու համար: Օրինակ, արժեքի վկայագրում կարող եք նշել, որ շուկայական արժեքը ստացվել է ռեգրեսիոն մոդելի միջոցով Վսկսած միջակայքում գտնվելու 95% հավանականությամբ (V -2d,.)նախքան (y + 2 դ):

Ստացված փոփոխականի տատանումների գործակիցը.

Որտեղ y -ստացված փոփոխականի միջին արժեքը (նկ. 3.2):

Ռեգրեսիոն վերլուծության ժամանակ փոփոխության գործակիցը var է ստանդարտ շեղումարդյունք՝ արտահայտված որպես ստացված փոփոխականի միջին արժեքի տոկոս։ Տատանումների գործակիցը կարող է չափանիշ ծառայել ստացված ռեգրեսիոն մոդելի կանխատեսող որակների համար. որքան փոքր է արժեքը. var, այնքան բարձր են մոդելի կանխատեսող որակները։ Տատանումների գործակիցի օգտագործումը նախընտրելի է &e ցուցանիշից, քանի որ այն հարաբերական ցուցանիշ է: Այս ցուցանիշը գործնականում օգտագործելիս կարելի է խորհուրդ տալ չօգտագործել մոդել, որի տատանումների գործակիցը գերազանցում է 33%-ը, քանի որ այս դեպքում չի կարելի ասել, որ ընտրանքի տվյալները ենթակա են նորմալ բաշխման օրենքի:

Որոշման գործակից (քառակուսի բազմակի հարաբերակցության գործակից):

Այս ցուցանիշը օգտագործվում է արդյունքում ստացված ռեգրեսիոն մոդելի ընդհանուր որակը վերլուծելու համար: Այն ցույց է տալիս, թե ստացված փոփոխականի շեղման քանի տոկոսն է բացատրվում մոդելում ներառված բոլոր գործոնային փոփոխականների ազդեցությամբ: Որոշման գործակիցը միշտ գտնվում է զրոյից մինչև մեկ միջակայքում: Որքան մոտ է որոշման գործակիցի արժեքը միասնությանը, այնքան ավելի լավ մոդելնկարագրում է սկզբնական տվյալների շարքը: Որոշման գործակիցը կարելի է տարբեր կերպ ներկայացնել.

Ահա ռեգրեսիայի մոդելով բացատրված սխալը.

Ա - սխալ, անբացատրելի

ռեգրեսիոն մոդել. Տնտեսական տեսանկյունից այս չափանիշը թույլ է տալիս դատել, թե գնային տատանումների քանի տոկոսն է բացատրվում ռեգրեսիայի հավասարմամբ:

Ցուցանիշի ընդունելիության ճշգրիտ սահմանը Ռ 2Բոլոր դեպքերի համար հնարավոր չէ հստակեցնել։ Պետք է հաշվի առնել և՛ ընտրանքի չափը, և՛ հավասարման իմաստալից մեկնաբանությունը: Որպես կանոն, նույն տեսակի օբյեկտների վերաբերյալ տվյալներ ուսումնասիրելիս, որոնք ստացվել են մոտավորապես նույն պահին, արժեքը Ռ 2չի գերազանցում 0,6-0,7 մակարդակը։ Եթե ​​կանխատեսման բոլոր սխալները զրո են, այսինքն. երբ արդյունքի և գործոնային փոփոխականների միջև կապը ֆունկցիոնալ է, ապա Ռ 2 =1.

Ճշգրտված որոշման գործակից.

Որոշման ճշգրտված գործակցի ներդրման անհրաժեշտությունը բացատրվում է նրանով, որ գործոնների քանակի աճով. Դեպիորոշման սովորական գործակիցը գրեթե միշտ մեծանում է, բայց ազատության աստիճանների թիվը նվազում է (p - k- 1). Մուտքագրված ճշգրտումը միշտ նվազեցնում է արժեքը R2,քանի որ - 1) > (p-k- 1). Արդյունքում արժեքը R 2 CKOf)կարող է նույնիսկ բացասական դառնալ: Սա նշանակում է, որ արժեքը Ռ 2ճշգրտումից առաջ մոտ էր զրոյի, և փոփոխականի շեղումների համամասնությունը բացատրվում էր ռեգրեսիայի հավասարմամբ ժամըշատ փոքր.

Ռեգրեսիոն մոդելների երկու տարբերակներից, որոնք տարբերվում են որոշման ճշգրտված գործակցի արժեքով, բայց ունեն հավասարապես լավ որակի այլ չափանիշներ, նախընտրելի է որոշման ճշգրտված գործակցի ավելի մեծ արժեք ունեցող տարբերակը: Որոշման գործակիցը չի ճշգրտվում, եթե (p - k): k> 20.

Ֆիշերի գործակիցը.

Այս չափանիշն օգտագործվում է որոշման գործակցի նշանակությունը գնահատելու համար։ Քառակուսիների մնացորդային գումարը ներկայացնում է կանխատեսման սխալի չափը՝ օգտագործելով հայտնի ծախսերի արժեքների ռեգրեսիան y..Դրա համեմատությունը քառակուսիների ռեգրեսիոն գումարի հետ ցույց է տալիս, թե քանի անգամ է ռեգրեսիոն կախվածությունը կանխատեսում արդյունքը միջինից ավելի լավ ժամը. Գոյություն ունի կրիտիկական արժեքների աղյուսակ Ֆ ՌՖիշերի գործակիցը՝ կախված համարիչի ազատության աստիճանների քանակից - Դեպի, հայտարար v 2 = p - k- 1 և նշանակության մակարդակ ա. Եթե ​​Ֆիշերի թեստի հաշվարկված արժեքը Ֆ Ռավելին աղյուսակի արժեքը, ապա որոշման գործակցի աննշանության մասին վարկածը, այսինքն. ռեգրեսիոն հավասարման մեջ ներկառուցված կապերի և իրականում գոյություն ունեցող կապերի անհամապատասխանության մասին, p = 1 - a հավանականությամբ մերժվում է:

Միջին մոտավոր սխալ(միջին տոկոսային շեղումը) հաշվարկվում է որպես միջին հարաբերական տարբերություն՝ արտահայտված որպես տոկոս, ստացված փոփոխականի փաստացի և հաշվարկված արժեքների միջև.

Ինչպես ավելի քիչ արժեքայս ցուցանիշից, այնքան լավ մոդելի կանխատեսող որակները: Երբ այս ցուցանիշը 7%-ից բարձր չէ, մոդելը շատ ճշգրիտ է: Եթե 8 > 15% -ը ցույց է տալիս մոդելի անբավարար ճշգրտությունը:

Ռեգրեսիայի գործակցի ստանդարտ սխալ.

որտեղ (/I) -1 .- մատրիցայի անկյունագծային տարր (X G X)~ 1 k -գործոնների քանակը;

X-գործոնի փոփոխական արժեքների մատրիցա.

X 7 -գործոնի փոփոխական արժեքների փոխադրված մատրիցա;

(ԺԼ) _| - մատրիցայի հակադարձ մատրիցա:

Որքան փոքր են այս ցուցանիշները յուրաքանչյուր ռեգրեսիայի գործակցի համար, այնքան ավելի հուսալի է գնահատվում համապատասխան ռեգրեսիոն գործակիցը:

Ուսանողի թեստ (t-վիճակագրություն):

Այս չափանիշը թույլ է տալիս չափել հարաբերությունների հուսալիության (նշանակության) աստիճանը, որը որոշվում է տվյալ ռեգրեսիայի գործակցով։ Եթե ​​հաշվարկված արժեքը տ. աղյուսակի արժեքից մեծ

տավ, որտեղ v - p - k - 1-ը ազատության աստիճանների թիվն է, ապա այդ գործակիցը վիճակագրորեն աննշան լինելու վարկածը մերժվում է հավանականությամբ (100 - ա)%։ Գոյություն ունեն /- բաշխումների հատուկ աղյուսակներ, որոնք թույլ են տալիս, հիմնվելով նշանակության տվյալ մակարդակի վրա և ազատության աստիճանների քանակից v, որոշել. կրիտիկական արժեքչափանիշ. a-ի համար առավել հաճախ օգտագործվող արժեքը 5% է:

Multicollinearity, այսինքն. Գործոնների փոփոխականների միջև փոխհարաբերությունների ազդեցությունը հանգեցնում է դրանց սահմանափակ քանակով բավարարվելու անհրաժեշտությանը: Եթե ​​դա հաշվի չառնվի, ապա դուք կարող եք հայտնվել անտրամաբանական ռեգրեսիայի մոդելի հետ: Բազմագծայինության բացասական ազդեցությունից խուսափելու համար զույգ առնչվող գործակիցները հաշվարկվում են բազմակի ռեգրեսիայի մոդել կառուցելուց առաջ: r xjxjընտրված փոփոխականների միջև X.Եվ X

Այստեղ XjX; -երկու գործոնային փոփոխականների արտադրյալի միջին արժեքը.

XjXj-երկու գործոնային փոփոխականների միջին արժեքների արտադրյալը.

x գործակցի փոփոխականի շեղման գնահատում..

Երկու փոփոխականները համարվում են ռեգրեսիոն առնչվող (այսինքն՝ համագիծ), եթե դրանց զույգ հարաբերակցության գործակիցը հավասար է. բացարձակ արժեքխիստ ավելի քան 0.8: Այս դեպքում այս փոփոխականներից որևէ մեկը պետք է բացառվի քննարկումից:

Ստացված ռեգրեսիոն մոդելների տնտեսական վերլուծության հնարավորություններն ընդլայնելու նպատակով միջին առաձգականության գործակիցներ,որոշվում է բանաձևով.

Որտեղ Xj-համապատասխան գործոնի փոփոխականի միջին արժեքը.

y -ստացված փոփոխականի միջին արժեքը. ա ես -ռեգրեսիայի գործակիցը համապատասխան գործոն փոփոխականի համար:

Էլաստիկության գործակիցը ցույց է տալիս, թե միջինում քանի տոկոսով կփոխվի ստացված փոփոխականի արժեքը, երբ գործոնի փոփոխականը փոխվի 1%-ով, այսինքն. ինչպես է ստացված փոփոխականն արձագանքում գործոնի փոփոխականի փոփոխություններին: Օրինակ՝ ինչպե՞ս է արձագանքում քմ-ի գինը։ մ մակերեսով բնակարան քաղաքի կենտրոնից հեռավորության վրա։

Որոշակի ռեգրեսիոն գործակցի նշանակությունը վերլուծելու տեսանկյունից օգտակար է գնահատել. որոշման մասնակի գործակից.

Ահա ստացվածի շեղման գնահատականը

փոփոխական. Այս գործակիցը ցույց է տալիս, թե ստացված փոփոխականի քանի տոկոսով է բացատրվում ռեգրեսիոն հավասարման մեջ ներառված i-րդ գործոն փոփոխականի տատանումները։

  • Հեդոնիկ բնութագրերը հասկացվում են որպես օբյեկտի բնութագրիչներ, որոնք արտացոլում են նրա օգտակար (արժեքավոր) հատկությունները գնորդների և վաճառողների տեսանկյունից:


Նորություն կայքում

>

Ամենահայտնի