Bahay Pagpapagaling ng ngipin ng mga bata Ang isang regression equation ay ginagamit upang subukan ang statistical significance. Pagtatasa ng kahalagahan ng equation ng regression at mga coefficient nito

Ang isang regression equation ay ginagamit upang subukan ang statistical significance. Pagtatasa ng kahalagahan ng equation ng regression at mga coefficient nito

Pagtatasa ng kahalagahan ng isang equation maramihang pagbabalik

Ang pagbuo ng isang empirical regression equation ay ang unang yugto ng econometric analysis. Ang pinakaunang equation ng regression na binuo mula sa isang sample ay napakabihirang kasiya-siya sa mga tuntunin ng ilang mga katangian. Samakatuwid susunod ang pinakamahalagang gawain Ang pagsusuri sa ekonometric ay isang pagsubok sa kalidad ng equation ng regression. Sa econometrics, isang mahusay na itinatag na pamamaraan para sa naturang pagpapatunay ay pinagtibay.

Kaya, ang pagsuri sa istatistikal na kalidad ng tinantyang regression equation ay isinasagawa gamit ang ang mga sumusunod na direksyon:

· pagsuri sa kahalagahan ng equation ng regression;

· pagsusuri istatistikal na kahalagahan regression equation coefficients;

· pagsuri sa mga katangian ng data, ang pagiging posible nito ay ipinapalagay kapag tinatantya ang equation (pagsuri sa pagiging posible ng mga lugar ng OLS).

Ang pagsubok sa kahalagahan ng multiple regression equation, pati na rin ang paired regression, ay isinasagawa gamit ang Fisher test. SA sa kasong ito(hindi tulad ng pairwise regression) isang null hypothesis ang inilalagay H 0 na ang lahat ng coefficient ng regression ay katumbas ng zero ( b 1=0, b 2=0, … , b m=0). Ang Fisher criterion ay tinutukoy ng sumusunod na formula:

saan D katotohanan - pagkakaiba ng kadahilanan na ipinaliwanag sa pamamagitan ng pagbabalik, bawat isang antas ng kalayaan; D ost - natitirang pagpapakalat sa bawat antas ng kalayaan; R 2- koepisyent maramihang pagpapasiya; T X sa regression equation (sa paired linear regression T= 1); P - bilang ng mga obserbasyon.

Ang resultang halaga ng F-test ay inihambing sa halaga ng talahanayan sa isang tiyak na antas ng kahalagahan. Kung ang aktwal na halaga nito ay mas malaki kaysa sa halaga ng talahanayan, pagkatapos ay ang hypothesis Pero ang kawalang-halaga ng regression equation ay tinanggihan, at ang alternatibong hypothesis tungkol sa istatistikal na kahalagahan nito ay tinatanggap.

Gamit ang Fisher criterion, maaari mong suriin ang kahalagahan ng hindi lamang ang regression equation sa kabuuan, kundi pati na rin ang kahalagahan ng karagdagang pagsasama ng bawat salik sa modelo. Ang ganitong pagtatasa ay kinakailangan upang hindi mai-load ang modelo ng mga kadahilanan na walang makabuluhang epekto sa resulta. Bilang karagdagan, dahil ang modelo ay binubuo ng ilang mga kadahilanan, maaari silang ipasok dito sa iba't ibang mga pagkakasunud-sunod, at dahil mayroong isang ugnayan sa pagitan ng mga kadahilanan, ang kahalagahan ng pagsasama ng parehong kadahilanan sa modelo ay maaaring mag-iba depende sa pagkakasunud-sunod kung saan ang Ang mga kadahilanan ay ipinapasok dito.

Upang masuri ang kahalagahan ng pagsasama ng karagdagang salik sa modelo, kinakalkula ang bahagyang criterion ng Fisher Fxi. Ito ay batay sa paghahambing ng pagtaas sa pagkakaiba-iba ng kadahilanan dahil sa pagsasama ng isang karagdagang kadahilanan sa modelo na may natitirang pagkakaiba-iba bawat isang antas ng kalayaan para sa regression sa kabuuan. Samakatuwid, ang formula ng pagkalkula pribadong F-test para sa kadahilanan ay magkakaroon ng sumusunod na anyo:

saan R 2 yx 1 x 2… xi… xp - koepisyent ng maramihang pagpapasiya para sa isang buong set na modelo P mga kadahilanan ; R 2 yx 1 x 2… x i -1 x i +1… xp- koepisyent ng maramihang pagpapasiya para sa isang modelo na walang kasamang salik x i;P- bilang ng mga obserbasyon; T- bilang ng mga parameter para sa mga kadahilanan x sa regression equation.

Ang aktwal na halaga ng bahagyang pagsubok ni Fisher ay inihambing sa naka-tabulate na isa sa antas ng kahalagahan na 0.05 o 0.1 at ang mga katumbas na bilang ng antas ng kalayaan. Kung ang aktwal na halaga F xi lumampas F talahanayan, pagkatapos ay ang karagdagang pagsasama ng kadahilanan x i sa modelo ay nabibigyang katwiran ayon sa istatistika, at ang "purong" regression coefficient b i sa kadahilanan x i makabuluhang istatistika. Kung F xi mas kaunti F talahanayan, kung gayon ang karagdagang pagsasama ng salik sa modelo ay hindi makabuluhang nagpapataas ng bahagi ng ipinaliwanag na pagkakaiba-iba sa resulta y, at, samakatuwid, ang pagsasama nito sa modelo ay walang saysay, ang regression coefficient para sa salik na ito sa kasong ito ay hindi gaanong mahalaga sa istatistika.

Gamit ang bahagyang pagsubok ni Fisher, maaari mong subukan ang kahalagahan ng lahat ng mga koepisyent ng regression sa ilalim ng pag-aakalang ang bawat katumbas na salik x i ay ipinasok sa maramihang regression equation sa huli, at lahat ng iba pang salik ay naisama na sa modelo kanina.

Pagtatasa ng kahalagahan ng "purong" regression coefficients b i Sa pamamagitan ng Pagsusulit ng mag-aaral maaaring isagawa nang hindi kinakalkula ang pribado F-pamantayan. Sa kasong ito, tulad ng ipinares na regression, inilalapat ang formula para sa bawat salik

t bi = b i / m bi ,

saan b i- koepisyent ng "purong" regression na may salik x i ; m bi- karaniwang error ng regression coefficient b i .

Upang masuri ang kahalagahan at kabuluhan ng koepisyent ng ugnayan, ginagamit ang t-test ng Mag-aaral.

Ang average na error ng correlation coefficient ay matatagpuan gamit ang formula:

N
at batay sa error, ang t-criterion ay kinakalkula:

Ang kinakalkula na halaga ng t-test ay inihambing sa naka-tabulate na halaga na makikita sa talahanayan ng pamamahagi ng Mag-aaral sa antas ng kabuluhan na 0.05 o 0.01 at ang bilang ng mga antas ng kalayaan n-1. Kung ang kinakalkula na halaga ng t-test ay mas malaki kaysa sa halaga ng talahanayan, kung gayon ang koepisyent ng ugnayan ay itinuturing na makabuluhan.

Sa kaso ng isang curvilinear na relasyon, ang F-test ay ginagamit upang masuri ang kahalagahan ng relasyon ng ugnayan at ang regression equation. Ito ay kinakalkula ng formula:

o

kung saan ang η ay ang ratio ng ugnayan; n - bilang ng mga obserbasyon; m – bilang ng mga parameter sa equation ng regression.

Ang kinakalkula na halaga ng F ay inihambing sa naka-tabulate para sa tinatanggap na antas ng kahalagahan α (0.05 o 0.01) at ang mga bilang ng antas ng kalayaan k 1 =m-1 at k 2 =n-m. Kung ang kinakalkula na halaga ng F ay lumampas sa unang talahanayan, ang kaugnayan ay itinuturing na makabuluhan.

Ang kahalagahan ng coefficient ng regression ay itinatag gamit ang Student t-test, na kinakalkula gamit ang formula:

kung saan ang σ 2 at i ay ang variance ng regression coefficient.

Ito ay kinakalkula ng formula:

kung saan ang k ay ang bilang ng mga katangian ng salik sa equation ng regression.

Ang regression coefficient ay itinuturing na makabuluhan kung t a 1 ≥t cr. Ang t cr ay matatagpuan sa talahanayan ng mga kritikal na punto ng distribusyon ng Mag-aaral sa tinatanggap na antas ng kahalagahan at ang bilang ng mga antas ng kalayaan k=n-1.

4.3 Pagsusuri ng ugnayan at regression sa Excel

Magsagawa tayo ng ugnayan at pagsusuri ng regression ng relasyon sa pagitan ng ani at mga gastos sa paggawa sa bawat 1 quintal ng butil. Upang gawin ito, buksan ang isang Excel sheet at ipasok ang mga halaga ng katangian ng kadahilanan sa mga cell A1:A30 ang ani ng mga pananim na butil, sa mga cell B1:B30, ang halaga ng nagresultang katangian ay ang halaga ng paggawa sa bawat 1 quintal ng butil. Sa menu na Mga Tool, piliin ang opsyon sa Pagsusuri ng Data. Sa pamamagitan ng pag-left-click sa item na ito, bubuksan namin ang Regression tool. I-click ang OK button at ang Regression dialog box ay lilitaw sa screen. Sa field ng Input interval Y, ipasok ang mga halaga ng resultang katangian (pagha-highlight ng mga cell B1:B30), sa field ng Input interval X, ipasok ang mga halaga ng katangian ng kadahilanan (pagha-highlight ng mga cell A1:A30). Markahan ang 95% na antas ng posibilidad at piliin ang Bagong Worksheet. Mag-click sa pindutan ng OK. Ang talahanayan ng "KONKLUSYON NG MGA RESULTA" ay lilitaw sa worksheet, na nagpapakita ng mga resulta ng pagkalkula ng mga parameter ng equation ng regression, coefficient ng ugnayan at iba pang mga tagapagpahiwatig na nagbibigay-daan sa iyo upang matukoy ang kahalagahan ng koepisyent ng ugnayan at ang mga parameter ng equation ng regression.

KONKLUSYON NG MGA RESULTA

Mga istatistika ng regression

Maramihang R

R-square

Normalized R-squared

Karaniwang error

Mga obserbasyon

Pagsusuri ng pagkakaiba-iba

Kahalagahan F

Regression

Logro

Karaniwang error

t-statistic

P-Halaga

Ibaba 95%

Nangungunang 95%

Ibaba 95.0%

Nangungunang 95.0%

Y-intersection

Variable X 1

Sa talahanayang ito, ang "Multiple R" ay ang koepisyent ng ugnayan, ang "R-squared" ay ang koepisyent ng determinasyon. "Mga Coefficient: Y-intersection" - libreng termino ng equation ng regression 2.836242; “Variable X1” – regression coefficient -0.06654. Mayroon ding mga halaga ng Fisher's F-test 74.9876, Student's t-test 14.18042, "Standard error 0.112121", na kinakailangan upang masuri ang kahalagahan ng correlation coefficient, mga parameter ng regression equation at ang buong equation.

Batay sa data sa talahanayan, bubuo kami ng isang regression equation: y x ​​= 2.836-0.067x. Ang regression coefficient a 1 = -0.067 ay nangangahulugan na sa pagtaas ng ani ng butil ng 1 c/ha, ang mga gastos sa paggawa sa bawat 1 c ng butil ay bumaba ng 0.067 man-hours.

Ang koepisyent ng ugnayan ay r=0.85>0.7, samakatuwid, ang relasyon sa pagitan ng mga pinag-aralan na katangian sa populasyon na ito ay malapit. Ang koepisyent ng determinasyon r 2 =0.73 ay nagpapakita na ang 73% ng pagkakaiba-iba sa epektibong katangian (mga gastos sa paggawa sa bawat 1 quintal ng butil) ay sanhi ng pagkilos ng factor trait (bunga ng butil).

Sa talahanayan ng mga kritikal na punto ng pamamahagi ng Fisher-Snedecor, nakita namin ang kritikal na halaga ng F-test sa antas ng kabuluhan na 0.05 at ang bilang ng mga antas ng kalayaan k 1 =m-1=2-1=1 at k 2 =n-m=30-2=28, ito ay katumbas ng 4.21. Dahil ang kinakalkula na halaga ng criterion ay mas malaki kaysa sa naka-tabulate (F=74.9896>4.21), ang regression equation ay itinuturing na makabuluhan.

Upang masuri ang kahalagahan ng koepisyent ng ugnayan, kalkulahin natin ang t-test ng Mag-aaral:

SA
Sa talahanayan ng mga kritikal na punto ng pamamahagi ng Mag-aaral, nakita namin ang kritikal na halaga ng t-test sa antas ng kabuluhan na 0.05 at ang bilang ng mga antas ng kalayaan n-1=30-1=29, ito ay katumbas ng 2.0452. Dahil ang kinakalkula na halaga ay mas malaki kaysa sa halaga ng talahanayan, ang koepisyent ng ugnayan ay makabuluhan.

Pagtatantya ng kahalagahan ng mga parameter ng equation ng regression

Ang kahalagahan ng mga parameter ng linear regression equation ay tinasa gamit ang Student's test:

Kung t calc. > t cr, pagkatapos ay tinatanggap ang pangunahing hypothesis ( H o), na nagpapahiwatig ng istatistikal na kahalagahan ng mga parameter ng regression;

Kung t calc.< t cr, pagkatapos ay tinatanggap ang alternatibong hypothesis ( H 1), na nagpapahiwatig ng istatistikal na kawalan ng kahalagahan ng mga parameter ng regression.

saan m a , m b- karaniwang mga error ng mga parameter a At b:

(2.19)

(2.20)

Ang kritikal (tabular) na halaga ng criterion ay matatagpuan gamit ang mga istatistikal na talahanayan ng distribusyon ng Mag-aaral (Appendix B) o gamit ang mga talahanayan Excel(seksyon ng "Statistical" function wizard):

t cr = STUDARSOBR( α=1-P; k=n-2), (2.21)

saan k=n-2 kumakatawan din sa bilang ng mga antas ng kalayaan .

Ang pagtatasa ng statistical significance ay maaari ding ilapat sa linear correlation coefficient

saan Ginoo- karaniwang error sa pagtukoy ng mga halaga ng koepisyent ng ugnayan r yx

(2.23)

Nasa ibaba ang mga opsyon para sa mga gawain para sa praktikal at gawain sa laboratoryo sa mga paksa ng ikalawang seksyon.

Mga tanong sa sariling pagsusulit para sa seksyon 2

1. Ipahiwatig ang mga pangunahing bahagi ng modelong ekonomiko at ang kanilang kakanyahan.

2. Ang pangunahing nilalaman ng mga yugto ng econometric na pananaliksik.

3. Ang kakanyahan ng mga diskarte sa pagtukoy ng mga parameter ng linear regression.

4. Kakanyahan at mga kakaiba ng aplikasyon ng pamamaraan hindi bababa sa mga parisukat kapag tinutukoy ang mga parameter ng equation ng regression.

5. Anong mga tagapagpahiwatig ang ginagamit upang masuri ang lapit ng ugnayan sa pagitan ng mga salik na pinag-aaralan?

6. Kakanyahan linear coefficient mga ugnayan.

7. Ang kakanyahan ng koepisyent ng pagpapasiya.

8. Kakanyahan at pangunahing tampok ng mga pamamaraan para sa pagtatasa ng kasapatan (statistical significance) mga modelo ng regression.

9. Pagtatasa ng kasapatan ng mga modelo ng linear regression sa pamamagitan ng approximation coefficient.

10. Ang kakanyahan ng diskarte sa pagtatasa ng kasapatan ng mga modelo ng regression gamit ang Fisher criterion. Kahulugan ng empirical at kritikal na halaga pamantayan.

11. Ang kakanyahan ng konsepto ng "variance analysis" na may kaugnayan sa econometric na pananaliksik.

12. Kakanyahan at pangunahing tampok ng pamamaraan para sa pagtatasa ng kahalagahan ng mga parameter linear equation regression.

13. Mga tampok ng paggamit ng distribusyon ng Mag-aaral kapag tinatasa ang kahalagahan ng mga parameter ng isang linear regression equation.

14. Ano ang gawain ng pagtataya ng mga solong halaga ng socio-economic phenomenon na pinag-aaralan?

1. Bumuo ng patlang ng ugnayan at bumalangkas ng palagay tungkol sa anyo ng equation para sa ugnayan ng mga salik na pinag-aaralan;

2. Isulat ang mga pangunahing equation ng paraan ng hindi bababa sa mga parisukat, gawin ang mga kinakailangang pagbabago, gumuhit ng isang talahanayan para sa mga intermediate na kalkulasyon at tukuyin ang mga parameter ng linear regression equation;

3. Suriin ang kawastuhan ng mga kalkulasyon na isinagawa gamit karaniwang mga pamamaraan at mga function mga spreadsheet Excel.

4. Pag-aralan ang mga resulta, bumalangkas ng mga konklusyon at rekomendasyon.

1. Pagkalkula ng halaga ng linear correlation coefficient;

2. Paggawa ng mesa pagsusuri ng pagkakaiba-iba;

3. Pagtataya ng koepisyent ng pagpapasiya;

4. Suriin ang kawastuhan ng mga kalkulasyon gamit ang mga karaniwang pamamaraan at paggana ng mga spreadsheet ng Excel.

5. Pag-aralan ang mga resulta, bumalangkas ng mga konklusyon at rekomendasyon.

4. Magsagawa ng pangkalahatang pagtatasa ng kasapatan ng napiling regression equation;

1. Pagtatasa ng kasapatan ng equation batay sa mga halaga ng approximation coefficient;

2. Pagtatasa ng kasapatan ng equation batay sa mga halaga ng coefficient of determination;

3. Pagtatasa ng kasapatan ng equation gamit ang Fisher criterion;

4. Magsagawa ng pangkalahatang pagtatasa ng kasapatan ng mga parameter ng equation ng regression;

5. Suriin ang kawastuhan ng mga kalkulasyon gamit ang mga karaniwang pamamaraan at function ng Excel spreadsheet.

6. Pag-aralan ang mga resulta, bumalangkas ng mga konklusyon at rekomendasyon.

1. Paggamit ng mga karaniwang pamamaraan ng Excel Spreadsheet Functions Wizard (mula sa mga seksyong "Mathematical" at "Statistical");

2. Paghahanda ng data at mga tampok ng paggamit ng LINEST function;

3. Paghahanda ng data at mga tampok ng paggamit ng function na "PREDICTION".

1. Paggamit ng mga karaniwang pamamaraan ng Excel spreadsheet data analysis package;

2. Paghahanda ng data at mga tampok ng paglalapat ng "REGRESSION" na pamamaraan;

3. Interpretasyon at synthesis ng regression analysis table data;

4. Interpretasyon at synthesis ng data mula sa pagsusuri ng talahanayan ng pagkakaiba-iba;

5. Interpretasyon at generalization ng data mula sa talahanayan para sa pagtatasa ng kahalagahan ng mga parameter ng regression equation;

Kapag nagsasagawa ng gawaing laboratoryo batay sa isa sa mga opsyon, dapat mong kumpletuhin ang mga sumusunod na partikular na gawain:

1. Piliin ang anyo ng equation para sa ugnayan ng mga salik na pinag-aaralan;

2. Tukuyin ang mga parameter ng equation ng regression;

3. Tayahin ang malapit na kaugnayan ng mga salik na pinag-aaralan;

4. Tayahin ang kasapatan ng napiling regression equation;

5. Tayahin ang istatistikal na kahalagahan ng mga parameter ng equation ng regression.

6. Suriin ang kawastuhan ng mga kalkulasyon gamit ang mga karaniwang pamamaraan at function ng Excel spreadsheet.

7. Pag-aralan ang mga resulta, bumalangkas ng mga konklusyon at rekomendasyon.

Mga takdang-aralin para sa praktikal at laboratoryo sa paksang "Paired linear regression at correlation sa econometric na pananaliksik."

Opsyon 1 Opsyon 2 Opsyon 3 Opsyon 4 Opsyon 5
x y x y x y x y x y
Opsyon 6 Opsyon 7 Opsyon 8 Opsyon 9 Opsyon 10
x y x y x y x y x y

Sa socio-economic na pananaliksik kadalasang kinakailangan na magtrabaho sa isang limitadong populasyon o may sample na data. Samakatuwid, pagkatapos ng mga parameter ng matematika ng equation ng regression, kinakailangan upang suriin ang mga ito at ang equation sa kabuuan para sa statistical significance, i.e. ito ay kinakailangan upang matiyak na ang resultang equation at ang mga parameter nito ay nabuo sa ilalim ng impluwensya ng hindi random na mga kadahilanan.

Una sa lahat, ang istatistikal na kahalagahan ng equation sa kabuuan ay tinasa. Karaniwang isinasagawa ang pagsusuri gamit ang Fisher's F test. Ang pagkalkula ng F-criterion ay batay sa panuntunan ng pagdaragdag ng mga pagkakaiba-iba. Namely, ang pangkalahatang pagpapakalat katangian-resulta = kadahilanan pagpapakalat + natitirang pagpapakalat.

Tunay na presyo

Teoretikal na presyo
Sa pamamagitan ng pagbuo ng isang regression equation, maaari mong kalkulahin ang teoretikal na halaga ng katangian ng resulta, i.e. kinakalkula gamit ang equation ng regression na isinasaalang-alang ang mga parameter nito.

Ang mga halagang ito ay magpapakita ng katangian ng resulta, na nabuo sa ilalim ng impluwensya ng mga kadahilanan na kasama sa pagsusuri.

Palaging may mga pagkakaiba (nalalabi) sa pagitan ng mga aktwal na halaga ng katangian ng resulta at ang mga kinakalkula batay sa equation ng regression, dahil sa impluwensya ng iba pang mga kadahilanan na hindi kasama sa pagsusuri.

Ang pagkakaiba sa pagitan ng teoretikal at aktwal na mga halaga ng katangian ng resulta ay tinatawag na mga residual. Pangkalahatang pagkakaiba-iba ng katangian ng resulta:

Ang pagkakaiba-iba sa katangian ng resulta, na sanhi ng pagkakaiba-iba sa mga katangian ng mga salik na kasama sa pagsusuri, ay tinasa sa pamamagitan ng mga paghahambing ng mga teoretikal na halaga ng mga resulta. katangian at mga karaniwang halaga nito. Ang natitirang pagkakaiba-iba sa pamamagitan ng paghahambing ng teoretikal at aktwal na mga halaga ng nagresultang katangian. Ang kabuuang pagkakaiba, nalalabi at aktwal ay may magkakaibang bilang ng antas ng kalayaan.

heneral, P- bilang ng mga yunit sa populasyon na pinag-aaralan

aktwal, P- bilang ng mga salik na kasama sa pagsusuri

Nalalabi

Ang Fisher's F test ay kinakalkula bilang ratio sa , at kinakalkula para sa isang antas ng kalayaan.

Ang paggamit ng Fisher F test bilang pagtatantya ng istatistikal na kahalagahan ng isang regression equation ay napaka-lohikal. - ito ang resulta. katangian, tinutukoy ng mga salik na kasama sa pagsusuri, i.e. ito ang proporsyon ng ipinaliwanag na resulta. tanda. - ito ay isang (variation) ng isang katangian ng resulta na dulot ng mga salik na ang impluwensya ay hindi isinasaalang-alang, i.e. hindi kasama sa pagsusuri.

yun. Ang F-test ay idinisenyo upang suriin makabuluhan sobra sa . Kung hindi ito makabuluhang mas mababa kaysa sa , at higit pa kung lumampas ito sa , hindi kasama sa pagsusuri ang mga salik na aktwal na nakakaimpluwensya sa katangian ng resulta.

Fisher's F test ay naka-tabulate, ang aktwal na halaga ay inihambing sa naka-tabulated na halaga. Kung , kung gayon ang equation ng regression ay itinuturing na makabuluhang istatistika. Kung, sa kabaligtaran, ang equation ay hindi makabuluhan sa istatistika at hindi magagamit sa pagsasanay, ang kahalagahan ng equation sa kabuuan ay nagpapahiwatig ng istatistikal na kahalagahan ng mga tagapagpahiwatig ng ugnayan.

Pagkatapos matantya ang equation sa kabuuan, kinakailangan upang suriin ang istatistikal na kahalagahan ng mga parameter ng equation. Ang pagtatasa na ito ay isinasagawa gamit ang t-statistics ng Mag-aaral. Ang t-statistic ay kinakalkula bilang ratio ng mga parameter ng equation (modulo) sa kanilang karaniwang mean square error. Kung ang isang one-factor na modelo ay tinatantya, pagkatapos ay 2 mga istatistika ang kinakalkula.

Sa lahat ng mga programa sa computer, ang pagkalkula ng karaniwang error at t-statistics para sa mga parameter ay isinasagawa kasama ang pagkalkula ng mga parameter mismo. T-statistics na naka-tabulate. Kung ang halaga ay , kung gayon ang parameter ay itinuturing na makabuluhang istatistika, ibig sabihin. nabuo sa ilalim ng impluwensya ng mga di-random na mga kadahilanan.

Ang pagkalkula ng t-statistics ay mahalagang nangangahulugang pagsubok sa null hypothesis na ang parameter ay hindi gaanong mahalaga, i.e. ang pagkakapantay-pantay nito sa zero. Sa isang one-factor na modelo, 2 hypotheses ang tinasa: at

Ang antas ng kahalagahan ng pagtanggap ng null hypothesis ay nakasalalay sa antas ng pagtanggap posibilidad ng kumpiyansa. Kaya't kung itinakda ng mananaliksik ang antas ng posibilidad sa 95%, ang antas ng kahalagahan ng pagtanggap ay kakalkulahin, samakatuwid, kung ang antas ng kabuluhan ay ≥ 0.05, kung gayon ito ay tinatanggap at ang mga parameter ay itinuturing na hindi gaanong mahalaga sa istatistika. Kung , ang kahalili ay tinatanggihan at tinatanggap: at .

Ang mga pakete ng software ng istatistika ay nagbibigay din ng antas ng kahalagahan para sa pagtanggap ng mga null hypotheses. Ang pagtatasa sa kahalagahan ng equation ng regression at mga parameter nito ay maaaring magbigay ng mga sumusunod na resulta:

Una, ang equation sa kabuuan ay makabuluhan (ayon sa F-test) at lahat ng parameter ng equation ay makabuluhan din sa istatistika. Nangangahulugan ito na ang resultang equation ay maaaring gamitin upang kunin ang pareho mga desisyon sa pamamahala, at para sa pagtataya.

Pangalawa, ayon sa F-test, ang equation ay makabuluhang istatistika, ngunit hindi bababa sa isa sa mga parameter ng equation ay hindi makabuluhan. Maaaring gamitin ang equation upang gumawa ng mga desisyon sa pamamahala tungkol sa mga salik na sinusuri, ngunit hindi magagamit para sa pagtataya.

Pangatlo, ang equation ay hindi makabuluhan sa istatistika, o ayon sa F-test ang equation ay makabuluhan, ngunit ang lahat ng mga parameter ng resultang equation ay hindi makabuluhan. Ang equation ay hindi maaaring gamitin para sa anumang layunin.

Upang makilala ang equation ng regression bilang isang modelo ng relasyon sa pagitan ng resulta-attribute at factor-attribute, kinakailangan na ang lahat ang pinakamahalagang salik, pagtukoy sa resulta, upang ang makabuluhang interpretasyon ng mga parameter ng equation ay tumutugma sa theoretically based na mga koneksyon sa phenomenon na pinag-aaralan. Ang koepisyent ng pagpapasiya R2 ay dapat na > 0.5.

Kapag gumagawa ng multiple regression equation, ipinapayong magsagawa ng pagtatasa gamit ang tinatawag na adjusted coefficient of determination (R 2). Ang halaga ng R2 (pati na rin ang ugnayan) ay tumataas sa bilang ng mga salik na kasama sa pagsusuri. Ang halaga ng koepisyent ay lalo na na-overestimated sa maliliit na populasyon. Upang sugpuin ang negatibong impluwensya, ang R 2 at mga ugnayan ay inaayos na isinasaalang-alang ang bilang ng mga antas ng kalayaan, i.e. ang bilang ng malayang pag-iiba-iba ng mga elemento kapag may kasamang ilang salik.

Naayos na koepisyent ng pagpapasiya

P–laki ng populasyon/bilang ng mga obserbasyon

k– bilang ng mga salik na kasama sa pagsusuri

n-1– bilang ng mga antas ng kalayaan

(1-R 2)- ang halaga ng natitira/hindi maipaliwanag na pagkakaiba ng resultang katangian

Laging mas mababa R 2. batay sa isa ay maaaring ihambing ang mga pagtatantya ng mga equation sa magkaibang numero nasuri na mga salik.

34. Mga problema sa pag-aaral ng time series.

Ang time series ay tinatawag na time series o time series. Ang time series ay isang time-ordered sequence ng mga indicator na nagpapakilala sa isang partikular na phenomenon (GDP volume mula 90 hanggang 98). Ang layunin ng pag-aaral ng mga serye ng oras ay upang matukoy ang pattern ng pag-unlad ng hindi pangkaraniwang bagay na pinag-aaralan (ang pangunahing kalakaran) at pagtataya sa batayan na ito. Mula sa kahulugan ng RD, sumusunod na ang anumang serye ay binubuo ng dalawang elemento: oras t at ang antas ng serye (mga tiyak na halaga ng tagapagpahiwatig na batayan kung saan itinayo ang serye ng RD). Ang serye ng DR ay maaaring 1) sandali - serye, ang mga tagapagpahiwatig na kung saan ay naitala sa isang punto sa oras, sa isang tiyak na petsa, 2) agwat - serye, ang mga tagapagpahiwatig na kung saan ay nakuha para sa isang tiyak na tagal ng panahon (1. populasyon ng St. Petersburg, 2. dami ng GDP para sa panahon). Ang paghahati ng mga serye sa mga sandali at pagitan ay kinakailangan, dahil tinutukoy nito ang mga detalye ng pagkalkula ng ilang mga tagapagpahiwatig ng serye ng DR. Pagsusuma ng mga antas serye ng pagitan nagbibigay ng isang makabuluhang nabibigyang kahulugan na resulta, na hindi masasabi tungkol sa pagbubuod ng mga antas ng serye ng sandali, dahil ang huli ay naglalaman ng paulit-ulit na pagbibilang. Ang pinakamahalagang problema sa pagsusuri ng mga serye ng oras ay ang problema ng pagiging maihahambing ng mga antas ng serye. Ang konsepto na ito ay lubhang magkakaibang. Ang mga antas ay dapat na maihahambing sa mga tuntunin ng mga pamamaraan ng pagkalkula at sa mga tuntunin ng teritoryo at saklaw ng mga yunit ng populasyon. Kung ang serye ng DR ay itinayo sa mga tuntunin ng gastos, ang lahat ng antas ay dapat ipakita o kalkulahin sa maihahambing na mga presyo. Kapag gumagawa ng mga serye ng agwat, ang mga antas ay dapat na makilala ang magkaparehong mga yugto ng panahon. Kapag gumagawa ng serye ng sandali, ang mga antas ay dapat na naitala sa parehong petsa. Maaaring kumpleto o hindi kumpleto ang serye ng DR. Ang mga hindi kumpletong hanay ay ginagamit sa mga opisyal na publikasyon (1980,1985,1990,1995,1996,1997,1998,1999...). Komprehensibong pagsusuri Kasama sa RD ang pag-aaral ng mga sumusunod na punto:

1. pagkalkula ng mga tagapagpahiwatig ng mga pagbabago sa mga antas ng RD

2. pagkalkula ng mga average na tagapagpahiwatig ng RD

3. pagkilala sa pangunahing trend ng serye, pagbuo ng mga modelo ng trend

4. pagtatasa ng autocorrelation sa RD, pagbuo ng mga autoregressive na modelo

5. RD correlation (pag-aaral ng mga koneksyon sa pagitan ng m/y DR series)

6. pagtataya ng taxiway.

35. Mga tagapagpahiwatig ng mga pagbabago sa mga antas ng serye ng oras .

SA pangkalahatang pananaw Maaaring katawanin ang RowD:

y – DR level, t – sandali o tagal ng panahon kung saan kabilang ang level (indicator), n – haba ng DR Series (bilang ng mga tuldok). kapag nag-aaral ng isang serye ng dinamika, ang mga sumusunod na indicator ay kinakalkula: 1. absolute growth, 2. growth coefficient (growth rate), 3. acceleration, 4. growth coefficient (growth rate), 5. ganap na halaga 1% pagtaas. Ang mga kalkuladong tagapagpahiwatig ay maaaring: 1. chain - nakuha sa pamamagitan ng paghahambing ng bawat antas ng serye sa kasunod na nauna, 2. basic - nakuha sa pamamagitan ng paghahambing sa antas na pinili bilang batayan para sa paghahambing (maliban kung partikular na nakasaad, ang 1st level ng serye ay kinuha bilang batayan). 1. Pagtaas ng chain:. Ipinapakita kung magkano ang higit pa o mas kaunti. Ang mga ganap na pagtaas ng kadena ay tinatawag na mga tagapagpahiwatig ng rate ng pagbabago sa mga antas serye ng oras. Baseline absolute growth: . Kung ang mga antas ng serye ay mga relatibong tagapagpahiwatig na ipinahayag sa %, kung gayon ang ganap na pagtaas ay ipinahayag sa mga punto ng pagbabago. 2. rate ng paglago (rate ng paglago): Kinakalkula ito bilang ratio ng mga antas ng serye sa mga nauna kaagad (chain growth coefficients), o sa antas na kinuha bilang batayan ng paghahambing (basic growth coefficients): . Tinutukoy kung gaano karaming beses ang bawat antas ng serye > o< предшествующего или базисного. На основе коэффициентов роста рассчитываются темпы роста. Это коэффициенты роста, выраженные в %ах: 3. batay sa ganap na pagtaas, ang tagapagpahiwatig ay kinakalkula - pagpabilis ng ganap na paglaki: . Ang acceleration ay isang ganap na pagtaas sa mga ganap na pagtaas. Sinusuri kung paano nagbabago ang mga natamo, kung sila ay matatag o bumibilis (tumataas). 4. rate ng paglago ay ang ratio ng paglago sa base ng paghahambing. Ipinahayag sa %: ; . Ang rate ng paglago ay ang rate ng paglago na minus 100%. Ipinapakita kung anong % ang ibinigay na antas ng serye ay > o< предшествующего либо базисного. 5. абсолютное значение 1% прироста. Рассчитывается как отношение абсолютного прироста к темпу прироста, т.е.: - сотая доля предыдущего уровня. Все эти показатели рассчитываются для оценки степени изменения уровней ряда. Цепные коэффициенты и темпы роста называются показателями интенсивности изменения уровней ДРядов.

2. Pagkalkula ng mga average na tagapagpahiwatig ng RD Kinakalkula ang mga average na antas ng row, average na ganap na pagtaas, average na rate ng paglago at average na rate ng paglago. Ang mga average na tagapagpahiwatig ay kinakalkula na may layuning buod ng impormasyon at gawing posible na ihambing ang mga antas at tagapagpahiwatig ng kanilang pagbabago sa iba't ibang serye. 1. antas ng gitnang hilera a) para sa interval time series ay kinakalkula gamit ang simpleng arithmetic mean: , kung saan ang n ay ang bilang ng mga antas sa time series; b) para sa serye ng sandali, ang average na antas ay kinakalkula gamit ang isang tiyak na formula, na tinatawag na chronological average: . 2. average na ganap na pagtaas kinakalkula batay sa chain absolute increases batay sa simpleng arithmetic average:

. 3. Average na rate ng paglago kinakalkula batay sa mga coefficient ng paglago ng chain gamit ang geometric mean formula: . Kapag nagkomento sa mga average na tagapagpahiwatig ng serye ng DR, kinakailangang ipahiwatig ang 2 puntos: ang panahon na nagpapakilala sa nasuri na tagapagpahiwatig at ang agwat ng oras kung saan itinayo ang serye ng DR. 4. Average na rate ng paglago: . 5. average na rate ng paglago: .

Ang pagsusuri ng regression ay isang istatistikal na paraan ng pananaliksik na nagbibigay-daan sa iyo upang ipakita ang pagtitiwala ng isang partikular na parameter sa isa o higit pang mga independiyenteng variable. Sa panahon ng pre-computer, medyo mahirap ang paggamit nito, lalo na pagdating sa malalaking volume ng data. Ngayon, natutunan kung paano bumuo ng regression sa Excel, malulutas mo ang mga kumplikadong problema sa istatistika sa loob lamang ng ilang minuto. Nasa ibaba ang mga tiyak na halimbawa mula sa larangan ng ekonomiya.

Mga Uri ng Regression

Ang konseptong ito mismo ay ipinakilala sa matematika noong 1886. Nangyayari ang pagbabalik:

  • linear;
  • parabolic;
  • pagpapatahimik;
  • exponential;
  • hyperbolic;
  • demonstrative;
  • logarithmic.

Halimbawa 1

Isaalang-alang natin ang problema sa pagtukoy ng pagtitiwala sa bilang ng mga miyembro ng koponan na huminto sa average na suweldo sa 6 na pang-industriya na negosyo.

Gawain. Sa anim na negosyo, sinuri namin ang average bawat buwan sahod at ang bilang ng mga empleyadong umalis dahil sa sa kalooban. Sa form na tabular mayroon kami:

Bilang ng mga taong huminto

suweldo

30,000 rubles

35,000 rubles

40,000 rubles

45,000 rubles

50,000 rubles

55,000 rubles

60,000 rubles

Para sa gawain ng pagtukoy ng pag-asa ng bilang ng mga humihinto na manggagawa sa average na suweldo sa 6 na negosyo, ang modelo ng regression ay may anyo ng equation na Y = a 0 + a 1 x 1 +...+a k x k, kung saan ang x i ay ang nakakaimpluwensya sa mga variable, a i ang regression coefficients, at k ang bilang ng mga salik.

Para sa problemang ito, ang Y ang tagapagpahiwatig ng pagtigil sa mga empleyado, at ang salik na nakakaimpluwensya ay suweldo, na tinutukoy namin ng X.

Gamit ang mga kakayahan ng processor ng Excel spreadsheet

Ang pagsusuri ng regression sa Excel ay dapat na mauna sa pamamagitan ng paglalapat ng mga built-in na function sa umiiral na data ng tabular. Gayunpaman, para sa mga layuning ito ay mas mainam na gamitin ang napakakapaki-pakinabang na add-on na "Analysis Pack". Upang i-activate ito kailangan mo:

  • mula sa tab na "File" pumunta sa seksyong "Mga Opsyon";
  • sa window na bubukas, piliin ang linya na "Mga Add-on";
  • mag-click sa pindutang "Go" na matatagpuan sa ibaba, sa kanan ng linya ng "Pamamahala";
  • lagyan ng check ang kahon sa tabi ng pangalang “Package ng pagsusuri” at kumpirmahin ang iyong mga aksyon sa pamamagitan ng pag-click sa “Ok”.

Kung nagawa nang tama ang lahat, lalabas ang kinakailangang button sa kanang bahagi ng tab na "Data", na matatagpuan sa itaas ng worksheet ng Excel.

sa Excel

Ngayong nasa kamay na namin ang lahat ng kinakailangang virtual na tool para magsagawa ng mga kalkulasyon ng ekonomiko, maaari na naming simulan na lutasin ang aming problema. Para dito:

  • Mag-click sa pindutan ng "Pagsusuri ng Data";
  • sa window na bubukas, mag-click sa pindutan ng "Regression";
  • sa tab na lilitaw, ipasok ang hanay ng mga halaga para sa Y (ang bilang ng mga humihinto sa mga empleyado) at para sa X (kanilang mga suweldo);
  • Kinukumpirma namin ang aming mga aksyon sa pamamagitan ng pagpindot sa pindutang "Ok".

Bilang resulta, awtomatikong pupunuin ng program ang isang bagong spreadsheet ng data ng pagsusuri ng regression. Tandaan! Pinapayagan ka ng Excel na manu-manong itakda ang lokasyon na gusto mo para sa layuning ito. Halimbawa, maaaring ito ang parehong sheet kung saan matatagpuan ang mga halaga ng Y at X, o kahit isang bagong workbook na partikular na idinisenyo upang mag-imbak ng naturang data.

Pagsusuri ng mga resulta ng regression para sa R-squared

Sa Excel, ang data na nakuha sa pagproseso ng data sa halimbawang isinasaalang-alang ay may form:

Una sa lahat, dapat mong bigyang pansin ang halaga ng R-squared. Ito ay kumakatawan sa koepisyent ng pagpapasiya. Sa halimbawang ito, R-square = 0.755 (75.5%), ibig sabihin, ang mga kinakalkula na parameter ng modelo ay nagpapaliwanag ng ugnayan sa pagitan ng mga parameter na isinasaalang-alang ng 75.5%. Kung mas mataas ang halaga ng koepisyent ng pagpapasiya, mas angkop ang napiling modelo para sa isang partikular na gawain. Itinuturing itong wastong ilarawan ang totoong sitwasyon kapag ang halaga ng R-square ay higit sa 0.8. Kung R-squared<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

Pagsusuri ng Logro

Ang numerong 64.1428 ay nagpapakita kung ano ang magiging halaga ng Y kung ang lahat ng mga variable na xi sa modelong aming isinasaalang-alang ay na-reset sa zero. Sa madaling salita, maaari itong pagtalunan na ang halaga ng nasuri na parameter ay naiimpluwensyahan din ng iba pang mga kadahilanan na hindi inilarawan sa isang partikular na modelo.

Ang susunod na koepisyent -0.16285, na matatagpuan sa cell B18, ay nagpapakita ng bigat ng impluwensya ng variable X sa Y. Nangangahulugan ito na ang average na buwanang suweldo ng mga empleyado sa loob ng modelong isinasaalang-alang ay nakakaapekto sa bilang ng mga umalis na may timbang na -0.16285, i.e. ang antas ng impluwensya nito ay ganap na maliit. Ang "-" sign ay nagpapahiwatig na ang koepisyent ay negatibo. Ito ay malinaw, dahil alam ng lahat na mas mataas ang suweldo sa negosyo, mas kaunting mga tao ang nagpapahayag ng pagnanais na wakasan ang kontrata sa pagtatrabaho o huminto.

Maramihang pagbabalik

Ang terminong ito ay tumutukoy sa isang equation ng relasyon na may ilang mga independiyenteng variable ng anyo:

y=f(x 1 +x 2 +…x m) + ε, kung saan ang y ay ang resultang katangian (dependent variable), at x 1, x 2,…x m ay mga factor na katangian (independent variable).

Pagtatantya ng Parameter

Para sa multiple regression (MR), ito ay isinasagawa gamit ang least squares method (OLS). Para sa mga linear na equation ng form Y = a + b 1 x 1 +…+b m x m + ε bumuo kami ng isang sistema ng mga normal na equation (tingnan sa ibaba)

Upang maunawaan ang prinsipyo ng pamamaraan, isaalang-alang ang isang two-factor case. Pagkatapos ay mayroon kaming isang sitwasyon na inilarawan ng formula

Mula dito nakukuha natin ang:

kung saan ang σ ay ang pagkakaiba-iba ng kaukulang tampok na makikita sa index.

Ang OLS ay naaangkop sa MR equation sa isang standardized scale. Sa kasong ito, nakukuha namin ang equation:

kung saan ang t y, t x 1, … t xm ay mga standardized na variable, kung saan ang average na mga halaga ay katumbas ng 0; Ang β i ay ang standardized regression coefficients, at ang standard deviation ay 1.

Pakitandaan na ang lahat ng β i sa kasong ito ay tinukoy bilang normal at sentralisado, samakatuwid ang kanilang paghahambing sa isa't isa ay itinuturing na tama at katanggap-tanggap. Bilang karagdagan, kaugalian na i-screen out ang mga salik sa pamamagitan ng pagtatapon sa mga may pinakamababang halaga ng βi.

Problema sa Paggamit ng Linear Regression Equation

Ipagpalagay na mayroon kaming talahanayan ng dynamics ng presyo para sa isang partikular na produkto N sa nakalipas na 8 buwan. Kinakailangan na gumawa ng isang desisyon sa pagpapayo ng pagbili ng isang batch nito sa presyong 1850 rubles/t.

numero ng buwan

pangalan ng buwan

presyo ng produkto N

1750 rubles bawat tonelada

1755 rubles bawat tonelada

1767 rubles bawat tonelada

1760 rubles bawat tonelada

1770 rubles bawat tonelada

1790 rubles bawat tonelada

1810 rubles bawat tonelada

1840 rubles bawat tonelada

Upang malutas ang problemang ito sa processor ng spreadsheet ng Excel, kailangan mong gamitin ang tool na "Pagsusuri ng Data", na kilala na mula sa halimbawang ipinakita sa itaas. Susunod, piliin ang seksyong "Regression" at itakda ang mga parameter. Dapat tandaan na sa patlang na "Input interval Y" isang hanay ng mga halaga ang dapat ipasok para sa dependent variable (sa kasong ito, ang mga presyo para sa mga kalakal sa mga partikular na buwan ng taon), at sa "Input interval X" - para sa malayang variable (numero ng buwan). Kumpirmahin ang pagkilos sa pamamagitan ng pag-click sa “Ok”. Sa isang bagong sheet (kung ipinahiwatig kaya) nakakakuha kami ng data para sa regression.

Gamit ang mga ito, bumuo kami ng isang linear equation ng form y=ax+b, kung saan ang mga parameter a at b ay ang mga coefficient ng linya na may pangalan ng buwan na numero at ang mga coefficient at linya na "Y-intersection" mula sa sheet na may ang mga resulta ng pagsusuri ng regression. Kaya, ang linear regression equation (LR) para sa gawain 3 ay nakasulat bilang:

Presyo ng produkto N = 11.714* buwan na numero + 1727.54.

o sa algebraic notation

y = 11.714 x + 1727.54

Pagsusuri ng mga resulta

Upang mapagpasyahan kung ang resultang linear regression equation ay sapat, ang coefficients ng multiple correlation (MCC) at determinasyon ay ginagamit, gayundin ang Fisher test at ang Student t test. Sa Excel spreadsheet na may mga resulta ng regression, ang mga ito ay tinatawag na multiple R, R-squared, F-statistic at t-statistic, ayon sa pagkakabanggit.

Ginagawang posible ng KMC R na masuri ang lapit ng probabilistikong relasyon sa pagitan ng mga independiyente at umaasa na mga variable. Ang mataas na halaga nito ay nagpapahiwatig ng medyo malakas na koneksyon sa pagitan ng mga variable na "Bilang ng buwan" at "Presyo ng produkto N sa rubles bawat 1 tonelada". Gayunpaman, ang likas na katangian ng relasyon na ito ay nananatiling hindi alam.

Ang parisukat ng coefficient of determination R2 (RI) ay isang numerical na katangian ng proporsyon ng kabuuang scatter at nagpapakita ng scatter ng kung aling bahagi ng pang-eksperimentong data, i.e. ang mga halaga ng dependent variable ay tumutugma sa linear regression equation. Sa problemang isinasaalang-alang, ang halagang ito ay katumbas ng 84.8%, ibig sabihin, ang istatistikal na data ay inilalarawan na may mataas na antas ng katumpakan ng nagreresultang SD.

Ang F-statistics, na tinatawag ding Fisher's test, ay ginagamit upang suriin ang kahalagahan ng isang linear na relasyon, pinabulaanan o kinukumpirma ang hypothesis ng pagkakaroon nito.

(Pagsusulit ng mag-aaral) ay tumutulong upang suriin ang kahalagahan ng koepisyent na may hindi alam o libreng termino ng linear na relasyon. Kung ang halaga ng t-test > tcr, kung gayon ang hypothesis tungkol sa kawalang-halaga ng libreng termino ng linear equation ay tinanggihan.

Sa problemang isinasaalang-alang para sa libreng termino, gamit ang mga tool sa Excel, nakuha na t = 169.20903, at p = 2.89E-12, ibig sabihin, mayroon kaming zero na posibilidad na ang tamang hypothesis tungkol sa kawalang-halaga ng libreng termino ay tatanggihan. . Para sa koepisyent para sa hindi kilalang t=5.79405, at p=0.001158. Sa madaling salita, ang posibilidad na ang tamang hypothesis tungkol sa kawalang-halaga ng koepisyent para sa isang hindi kilalang ay tatanggihan ay 0.12%.

Kaya, ito ay maaaring argued na ang resultang linear regression equation ay sapat.

Ang problema ng pagiging posible ng pagbili ng isang bloke ng pagbabahagi

Ang maramihang pagbabalik sa Excel ay ginagawa gamit ang parehong tool sa Pagsusuri ng Data. Isaalang-alang natin ang isang partikular na problema sa aplikasyon.

Ang pamunuan ng kumpanya ng NNN ay dapat magpasya sa pagiging advisability ng pagbili ng 20% ​​stake sa MMM JSC. Ang halaga ng package (SP) ay 70 milyong US dollars. Ang mga espesyalista sa NNN ay nangolekta ng data sa mga katulad na transaksyon. Napagpasyahan na suriin ang halaga ng bloke ng mga pagbabahagi ayon sa mga naturang parameter, na ipinahayag sa milyun-milyong dolyar ng US, bilang:

  • mga account na dapat bayaran (VK);
  • taunang dami ng turnover (VO);
  • account receivable (VD);
  • halaga ng mga fixed asset (COF).

Bilang karagdagan, ginagamit ang parameter ng atraso ng sahod ng negosyo (V3 P) sa libu-libong US dollars.

Solusyon gamit ang Excel spreadsheet processor

Una sa lahat, kailangan mong lumikha ng isang talahanayan ng pinagmulan ng data. Mukhang ganito:

  • tawagan ang window ng "Pagsusuri ng Data";
  • piliin ang seksyong "Regression";
  • Sa kahon na "Input interval Y", ipasok ang hanay ng mga halaga ng mga dependent variable mula sa column G;
  • Mag-click sa icon na may pulang arrow sa kanan ng window ng “Input interval X” at i-highlight ang hanay ng lahat ng values ​​mula sa column B, C, D, F sa sheet.

Markahan ang item na "Bagong worksheet" at i-click ang "Ok".

Kumuha ng pagsusuri ng regression para sa isang partikular na problema.

Pag-aaral ng mga resulta at konklusyon

"Kinakolekta" namin ang equation ng regression mula sa rounded data na ipinakita sa itaas sa Excel spreadsheet:

SP = 0.103*SOF + 0.541*VO - 0.031*VK +0.405*VD +0.691*VZP - 265.844.

Sa isang mas pamilyar na anyo ng matematika, maaari itong isulat bilang:

y = 0.103*x1 + 0.541*x2 - 0.031*x3 +0.405*x4 +0.691*x5 - 265.844

Ang data para sa MMM JSC ay ipinakita sa talahanayan:

Ang pagpapalit sa kanila sa equation ng regression, makakakuha tayo ng figure na 64.72 milyong US dollars. Nangangahulugan ito na ang mga bahagi ng MMM JSC ay hindi sulit na bilhin, dahil ang kanilang halaga na 70 milyong US dollars ay medyo napalaki.

Tulad ng nakikita mo, ang paggamit ng Excel spreadsheet at ang regression equation ay naging posible upang makagawa ng isang matalinong desisyon tungkol sa pagiging posible ng isang napaka-espesipikong transaksyon.

Ngayon alam mo na kung ano ang regression. Ang mga halimbawa ng Excel na tinalakay sa itaas ay tutulong sa iyo na malutas ang mga praktikal na problema sa larangan ng ekonometrika.



Bago sa site

>

Pinaka sikat