ઘર સ્વચ્છતા રીગ્રેસન સમીકરણ પરિમાણોનો અંદાજ. રેખીય રીગ્રેસન પરિમાણોનો અંદાજ

રીગ્રેસન સમીકરણ પરિમાણોનો અંદાજ. રેખીય રીગ્રેસન પરિમાણોનો અંદાજ

રીગ્રેસન સમીકરણ હંમેશા જોડાણની નિકટતાના સૂચક સાથે પૂરક છે. ઉપયોગ કરીને રેખીય રીગ્રેસનઆવા સૂચક એ રેખીય સહસંબંધ ગુણાંક r yt છે. સૂત્રમાં વિવિધ ફેરફારો છે રેખીય ગુણાંકસહસંબંધ

તે ધ્યાનમાં રાખવું જોઈએ કે રેખીય સહસંબંધ ગુણાંકનું મૂલ્ય તેના રેખીય સ્વરૂપમાં વિચારણા હેઠળની લાક્ષણિકતાઓ વચ્ચેના જોડાણની નિકટતાનું મૂલ્યાંકન કરે છે. તેથી નિકટતા સંપૂર્ણ મૂલ્યશૂન્યથી રેખીય સહસંબંધ ગુણાંકનો અર્થ એ નથી કે લાક્ષણિકતાઓ વચ્ચે કોઈ જોડાણ નથી.

પસંદગીની ગુણવત્તાનું મૂલ્યાંકન કરવા રેખીય કાર્યરેખીય સહસંબંધ ગુણાંક r yt 2 નો વર્ગ, જેને નિર્ધારણનો ગુણાંક કહેવાય છે, તેની ગણતરી કરવામાં આવે છે. નિર્ધારણનો ગુણાંક અસરકારક લાક્ષણિકતાના કુલ ભિન્નતામાં રીગ્રેસન દ્વારા સમજાવાયેલ t પર અસરકારક લાક્ષણિકતાના વિચલનના પ્રમાણને લાક્ષણિકતા આપે છે.

બિનરેખીય રીગ્રેશન સમીકરણ, જેમ કે માં રેખીય અવલંબન, એક સહસંબંધ સૂચક દ્વારા પૂરક છે, એટલે કે સહસંબંધ સૂચક આર.

બીજા ક્રમનો પેરાબોલા, જેમ કે વધુના બહુપદી ઉચ્ચ ક્રમ, જ્યારે રેખીય કરવામાં આવે છે, ત્યારે સમીકરણનું સ્વરૂપ લે છે બહુવિધ રીગ્રેસન. જો સમજાવેલ સાપેક્ષ બિનરેખીય હોય ચલ સમીકરણરેખીયકરણ દરમિયાન રીગ્રેસન જોડી કરેલ રીગ્રેસનના રેખીય સમીકરણનું સ્વરૂપ લે છે, પછી સંબંધની નિકટતાનું મૂલ્યાંકન કરવા માટે, એક રેખીય સહસંબંધ ગુણાંકનો ઉપયોગ કરી શકાય છે, જેનું મૂલ્ય આ કિસ્સામાં સહસંબંધ સૂચકાંક સાથે સુસંગત હશે.

જ્યારે રેખીય સ્વરૂપમાં સમીકરણના રૂપાંતરણમાં આશ્રિત ચલનો સમાવેશ થાય છે ત્યારે પરિસ્થિતિ અલગ હોય છે. આ કિસ્સામાં, રૂપાંતરિત વિશેષતા મૂલ્યો પર આધારિત રેખીય સહસંબંધ ગુણાંક માત્ર સંબંધની નિકટતાનો અંદાજિત અંદાજ આપે છે અને આંકડાકીય રીતે સહસંબંધ સૂચકાંક સાથે મેળ ખાતો નથી. હા, માટે પાવર કાર્ય

લોગરીધમિકલી રેખીય સમીકરણમાં પસાર થયા પછી

lny = lna + blnx

એક રેખીય સહસંબંધ ગુણાંક x અને y ચલોના વાસ્તવિક મૂલ્યો માટે નહીં, પરંતુ તેમના લઘુગણક માટે, એટલે કે, r lnylnx માટે શોધી શકાય છે. તદનુસાર, તેના મૂલ્યનો વર્ગ કુલ વર્ગના વિચલનોના પરિબળના ગુણોત્તરને દર્શાવશે, પરંતુ y માટે નહીં, પરંતુ તેના લઘુગણક માટે:

દરમિયાન, સહસંબંધ અનુક્રમણિકાની ગણતરી કરતી વખતે, લાક્ષણિકતા y ના ચોરસ વિચલનોના સરવાળાનો ઉપયોગ કરવામાં આવે છે, અને તેમના લઘુગણકનો નહીં. આ હેતુ માટે, પરિણામી લાક્ષણિકતાના સૈદ્ધાંતિક મૂલ્યો નિર્ધારિત કરવામાં આવે છે, એટલે કે, સમીકરણ દ્વારા ગણવામાં આવતા મૂલ્યના એન્ટિલોગરિધમ અને ચોરસના શેષ સરવાળા તરીકે.

ગણતરી R 2 yx ના છેદમાં તેમના સરેરાશ મૂલ્યમાંથી વાસ્તવિક મૂલ્યો y ના ચોરસ વિચલનોનો કુલ સરવાળો સામેલ છે અને છેદ r 2 lnxlny ગણતરીમાં ભાગ લે છે. વિચારણા હેઠળના સૂચકોના અંશ અને છેદ તે મુજબ અલગ પડે છે:

  • - સહસંબંધ સૂચકાંકમાં અને
  • - સહસંબંધ ગુણાંકમાં.

પરિણામોની સમાનતા અને કમ્પ્યુટર પ્રોગ્રામ્સનો ઉપયોગ કરીને ગણતરીઓની સરળતાને લીધે, રેખીય સહસંબંધ ગુણાંકનો ઉપયોગ બિનરેખીય કાર્યો માટે જોડાણની નિકટતાને દર્શાવવા માટે વ્યાપકપણે થાય છે.

લાક્ષણિકતા y ના મૂલ્યના રૂપાંતર સાથે બિનરેખીય કાર્યોમાં R અને r અથવા R અને r ના મૂલ્યોની નજીક હોવા છતાં, તે યાદ રાખવું જોઈએ કે જો, લાક્ષણિકતાઓની રેખીય અવલંબન સાથે, સમાન સહસંબંધ ગુણાંક લાક્ષણિકતા ધરાવે છે. રીગ્રેસન, એ યાદ રાખવું જોઈએ કે જો, લાક્ષણિકતાઓની રેખીય અવલંબન સાથે, એક અને સમાન સહસંબંધ ગુણાંક રીગ્રેશન બંનેને લાક્ષણિકતા આપે છે અને, ત્યારથી, પછી કાર્ય માટે વક્રીકૃત અવલંબન સાથે y=j(x) રીગ્રેસન x માટે સમાન નથી =f(y).

કારણ કે સહસંબંધ સૂચકાંકની ગણતરી પરિબળ અને ગુણોત્તરનો ઉપયોગ કરે છે કુલ રકમવર્ગ વિચલનો, પછી નિર્ધારણના ગુણાંક જેવો જ અર્થ ધરાવે છે. વિશેષ અભ્યાસોમાં, બિનરેખીય સંબંધો માટેના મૂલ્યને નિર્ધારણ સૂચકાંક કહેવામાં આવે છે.

સહસંબંધ ઇન્ડેક્સના મહત્વનું મૂલ્યાંકન સહસંબંધ ગુણાંકની વિશ્વસનીયતાના મૂલ્યાંકનની જેમ જ હાથ ધરવામાં આવે છે.

ફિશર F ટેસ્ટનો ઉપયોગ કરીને એકંદર બિનરેખીય રીગ્રેસન સમીકરણના મહત્વને ચકાસવા માટે સહસંબંધ સૂચકનો ઉપયોગ થાય છે.

મૂલ્ય m ચોરસના પરિબળના સરવાળા માટે સ્વતંત્રતાની ડિગ્રીની સંખ્યા અને (n - m - 1) - ચોરસના અવશેષ સરવાળા માટે સ્વતંત્રતાની ડિગ્રીની સંખ્યા દર્શાવે છે.

પાવર ફંક્શન m = 1 માટે અને F- માપદંડનું સૂત્ર રેખીય અવલંબન માટે સમાન સ્વરૂપ લે છે:

બીજી ડિગ્રીના પેરાબોલા માટે

y = a 0 + a 1 x + a 2 x 2 +em = 2

F- માપદંડની ગણતરી કોષ્ટકમાં પણ કરી શકાય છે વિચલનનું વિશ્લેષણરીગ્રેસન પરિણામો, રેખીય કાર્ય માટે બતાવ્યા પ્રમાણે.

રેખીય કાર્યનો ઉપયોગ કરવાની સંભાવનાને ન્યાયી ઠેરવવા માટે નિર્ધારણના અનુક્રમણિકાને નિર્ધારણના ગુણાંક સાથે સરખાવી શકાય છે. રીગ્રેસન રેખાની વક્રતા જેટલી વધારે છે, તેટલો ઓછો નિર્ધારણ ગુણાંક નિર્ધારણ અનુક્રમણિકા છે. આ સૂચકોની સમાનતાનો અર્થ એ છે કે રીગ્રેસન સમીકરણના સ્વરૂપને જટિલ બનાવવાની જરૂર નથી અને રેખીય કાર્યનો ઉપયોગ કરી શકાય છે.

વ્યવહારમાં, જો નિર્ધારણ અનુક્રમણિકા અને નિર્ધારણના ગુણાંક વચ્ચેનો તફાવત 0.1 કરતાં વધુ ન હોય, તો સંબંધના રેખીય સ્વરૂપની ધારણાને વાજબી ગણવામાં આવે છે.

જો t fact >t કોષ્ટક હોય, તો પછી માનવામાં આવેલ સહસંબંધ સૂચકો વચ્ચેનો તફાવત નોંધપાત્ર છે અને બિનરેખીય રીગ્રેશનને રેખીય કાર્ય સમીકરણ સાથે બદલવું અશક્ય છે. વ્યવહારીક રીતે, જો મૂલ્ય ટી< 2, то различия между R yx и r yx несущественны, и, следовательно, возможно применение линейной регрессии, даже если есть предположения о некоторой нелинейности рассматриваемых соотношений признаков фактора и результата.

સહસંબંધ વિશ્લેષણ.

જોડી કરેલ રીગ્રેસન સમીકરણ.

ગ્રાફિકલ પદ્ધતિનો ઉપયોગ કરીને.

આ પદ્ધતિનો ઉપયોગ અભ્યાસ કરેલ આર્થિક સૂચકાંકો વચ્ચેના જોડાણના સ્વરૂપને દૃષ્ટિની રીતે દર્શાવવા માટે થાય છે. આ કરવા માટે, લંબચોરસ સંકલન પ્રણાલીમાં એક ગ્રાફ દોરવામાં આવે છે, પરિણામી લાક્ષણિકતા Y ના વ્યક્તિગત મૂલ્યો ઓર્ડિનેટ અક્ષ સાથે પ્લોટ કરવામાં આવે છે, અને પરિબળ લાક્ષણિકતા X ના વ્યક્તિગત મૂલ્યો એબ્સિસા અક્ષ સાથે પ્લોટ કરવામાં આવે છે.

પરિણામી અને પરિબળ લાક્ષણિકતાઓના બિંદુઓના સમૂહને કહેવામાં આવે છે સહસંબંધ ક્ષેત્ર.

સહસંબંધ ક્ષેત્રના આધારે, એક પૂર્વધારણા આગળ મૂકી શકાય છે (માટે વસ્તી) કે X અને Y ના તમામ સંભવિત મૂલ્યો વચ્ચેનો સંબંધ રેખીય છે.

રેખીય રીગ્રેશન સમીકરણ y = bx + a + ε છે

અહીં ε એક રેન્ડમ ભૂલ છે (વિચલન, ખલેલ).

રેન્ડમ ભૂલના અસ્તિત્વના કારણો:

1. રીગ્રેસન મોડેલમાં નોંધપાત્ર સમજૂતીત્મક ચલોનો સમાવેશ કરવામાં નિષ્ફળતા;

2. ચલોનું એકત્રીકરણ. ઉદાહરણ તરીકે, કુલ વપરાશ કાર્ય એક પ્રયાસ છે સામાન્ય અભિવ્યક્તિવ્યક્તિગત ખર્ચના નિર્ણયોનો એકંદર. આ ફક્ત વ્યક્તિગત સંબંધોનો અંદાજ છે જે વિવિધ પરિમાણો ધરાવે છે.

3. મોડેલની રચનાનું ખોટું વર્ણન;

4. ખોટી કાર્યાત્મક સ્પષ્ટીકરણ;

5. માપન ભૂલો.

દરેક ચોક્કસ અવલોકન માટે વિચલનો ε i રેન્ડમ હોવાથી અને નમૂનામાં તેમના મૂલ્યો અજ્ઞાત છે, તો પછી:

1) અવલોકનો x i અને y i પરથી માત્ર α અને β પરિમાણોનો અંદાજ મેળવી શકાય છે

2) α અને β પરિમાણોનો અંદાજ રીગ્રેશન મોડલઅનુક્રમે a અને b ના મૂલ્યો છે, જે પ્રકૃતિમાં રેન્ડમ છે, કારણ કે રેન્ડમ નમૂનાને અનુરૂપ;

પછી અનુમાનિત રીગ્રેસન સમીકરણ (નમૂના ડેટા પરથી બનેલ) ફોર્મ y = bx + a + ε હશે, જ્યાં e i એ ભૂલોના અવલોકન કરેલ મૂલ્યો (અંદાજ) છે ε i , અને a અને b અનુક્રમે, અંદાજો છે રીગ્રેશન મોડલના પરિમાણો α અને β જે શોધવા જોઈએ.

પરિમાણોનો અંદાજ કાઢવા માટે α અને β - લઘુત્તમ ચોરસ પદ્ધતિ (ઓછામાં ઓછી ચોરસ પદ્ધતિ) નો ઉપયોગ થાય છે. પદ્ધતિ ઓછામાં ઓછા ચોરસરીગ્રેસન સમીકરણના પરિમાણોના શ્રેષ્ઠ (સતત, કાર્યક્ષમ અને નિષ્પક્ષ) અંદાજો આપે છે.

પરંતુ માત્ર ત્યારે જ જો અમુક જગ્યાઓ રેન્ડમ ટર્મ (ε) અને સ્વતંત્ર ચલ (x) સંબંધિત હોય.

ઔપચારિક રીતે, OLS માપદંડ નીચે પ્રમાણે લખી શકાય છે:

S = ∑(y i - y * i) 2 → મિનિટ

સામાન્ય સમીકરણોની સિસ્ટમ.

a n + b∑x = ∑y

a∑x + b∑x 2 = ∑y x

અમારા ડેટા માટે, સમીકરણોની સિસ્ટમ ફોર્મ ધરાવે છે

15a + 186.4 b = 17.01

186.4 a + 2360.9 b = 208.25

પ્રથમ સમીકરણથી આપણે વ્યક્ત કરીએ છીએ અને બીજા સમીકરણમાં બદલો:

અમે પ્રયોગમૂલક રીગ્રેસન ગુણાંક મેળવીએ છીએ: b = -0.07024, a = 2.0069

રીગ્રેશન સમીકરણ (અનુભાવિક રીગ્રેસન સમીકરણ):

y = -0.07024 x + 2.0069

પ્રયોગમૂલક રીગ્રેસન ગુણાંક aઅને bસૈદ્ધાંતિક ગુણાંક β i ના માત્ર અંદાજો છે, અને સમીકરણ પોતે જ વિચારણા હેઠળના ચલોના વર્તનમાં સામાન્ય વલણને પ્રતિબિંબિત કરે છે.

રીગ્રેસન પરિમાણોની ગણતરી કરવા માટે, અમે ગણતરી કોષ્ટક બનાવીશું (કોષ્ટક 1)

1. રીગ્રેસન સમીકરણ પરિમાણો.

નમૂનાનો અર્થ થાય છે.

નમૂના ભિન્નતા:

પ્રમાણભૂત વિચલન

1.1. સહસંબંધ ગુણાંક

સહવર્તન.

અમે જોડાણની નિકટતાના સૂચકની ગણતરી કરીએ છીએ. આ સૂચક નમૂના રેખીય સહસંબંધ ગુણાંક છે, જે સૂત્ર દ્વારા ગણવામાં આવે છે:

રેખીય સહસંબંધ ગુણાંક -1 થી +1 સુધીના મૂલ્યો લે છે.

લાક્ષણિકતાઓ વચ્ચેના જોડાણો નબળા અને મજબૂત (નજીક) હોઈ શકે છે. તેમના માપદંડોનું મૂલ્યાંકન ચૅડૉક સ્કેલ પર કરવામાં આવે છે:

0.1 < r xy < 0.3: слабая;

0.3 < r xy < 0.5: умеренная;

0.5 < r xy < 0.7: заметная;

0.7 < r xy < 0.9: высокая;

0.9 < r xy < 1: весьма высокая;

અમારા ઉદાહરણમાં, લક્ષણ Y અને પરિબળ X વચ્ચેનો સંબંધ ઉચ્ચ અને વ્યસ્ત છે.

વધુમાં, રેખીય જોડી સહસંબંધ ગુણાંકને રીગ્રેસન ગુણાંક b દ્વારા નક્કી કરી શકાય છે:

1.2. રીગ્રેસન સમીકરણ(રીગ્રેસન સમીકરણનો અંદાજ).

રેખીય રીગ્રેસન સમીકરણ y = -0.0702 x + 2.01 છે

રેખીય રીગ્રેસન સમીકરણના ગુણાંકને આર્થિક અર્થ આપી શકાય છે.

રીગ્રેશન ગુણાંક b = -0.0702 તેના માપના એકમ દીઠ પરિબળ xના મૂલ્યમાં વધારો અથવા ઘટાડો સાથે અસરકારક સૂચક (માપ y ના એકમોમાં) માં સરેરાશ ફેરફાર દર્શાવે છે. આ ઉદાહરણમાં, 1 એકમના વધારા સાથે, y સરેરાશ -0.0702 ઘટે છે.

ગુણાંક a = 2.01 ઔપચારિક રીતે y નું અનુમાનિત સ્તર બતાવે છે, પરંતુ માત્ર જો x = 0 નમૂના મૂલ્યોની નજીક હોય.

પરંતુ જો x=0 એ x ના નમૂના મૂલ્યોથી દૂર છે, તો શાબ્દિક અર્થઘટન ખોટા પરિણામો તરફ દોરી શકે છે, અને જો રીગ્રેસન રેખા અવલોકન કરેલ નમૂનાના મૂલ્યોને એકદમ સચોટ રીતે વર્ણવે છે, તો પણ કોઈ ગેરેંટી નથી કે આ પણ થશે જ્યારે ડાબે અથવા જમણે એક્સ્ટ્રાપોલેટિંગ થાય છે ત્યારે કેસ હોય છે.

રીગ્રેશન સમીકરણમાં યોગ્ય x મૂલ્યોને બદલીને, અમે દરેક અવલોકન માટે પ્રદર્શન સૂચક y(x) ના સંરેખિત (અનુમાનિત) મૂલ્યો નક્કી કરી શકીએ છીએ.

y અને x વચ્ચેનો સંબંધ રીગ્રેસન ગુણાંક b (જો > 0 - સીધો સંબંધ, અન્યથા - વ્યસ્ત) ની નિશાની નક્કી કરે છે. અમારા ઉદાહરણમાં, જોડાણ વિપરીત છે.

1.3. સ્થિતિસ્થાપકતા ગુણાંક.

જો પરિણામી સૂચક y અને પરિબળ લાક્ષણિકતા x ના માપનના એકમોમાં તફાવત હોય તો પરિણામી લાક્ષણિકતા પરના પરિબળોના પ્રભાવનું સીધું મૂલ્યાંકન કરવા માટે રીગ્રેસન ગુણાંક (ઉદાહરણ તરીકે b) નો ઉપયોગ કરવો યોગ્ય નથી.

આ હેતુઓ માટે, સ્થિતિસ્થાપકતા ગુણાંક અને બીટા ગુણાંકની ગણતરી કરવામાં આવે છે.

સરેરાશ સ્થિતિસ્થાપકતા ગુણાંક E એ દર્શાવે છે કે સરેરાશ કેટલા ટકા પરિણામ એકંદરમાં બદલાશે ખાતેજ્યારે પરિબળ બદલાય ત્યારે તેના સરેરાશ મૂલ્યમાંથી xતેના સરેરાશ મૂલ્યના 1% દ્વારા.

સ્થિતિસ્થાપકતા ગુણાંક સૂત્ર દ્વારા જોવા મળે છે:

સ્થિતિસ્થાપકતા ગુણાંક 1 કરતા ઓછો છે. તેથી, જો X 1% બદલાય છે, તો Y 1% કરતા ઓછા બદલાશે. બીજા શબ્દોમાં કહીએ તો, Y પર X નો પ્રભાવ નોંધપાત્ર નથી.

બીટા ગુણાંક

બીટા ગુણાંકતેના પ્રમાણભૂત વિચલનના મૂલ્યના કયા ભાગ દ્વારા દર્શાવે છે કે જ્યારે પરિબળ લાક્ષણિકતા તેના પ્રમાણભૂત વિચલનના મૂલ્ય દ્વારા સ્થિર સ્તરે નિશ્ચિત બાકીના સ્વતંત્ર ચલોના મૂલ્ય સાથે બદલાય ત્યારે પરિણામી લાક્ષણિકતાનું સરેરાશ મૂલ્ય બદલાશે:

તે. પ્રમાણભૂત વિચલન S x દ્વારા x માં વધારો, Y ના સરેરાશ મૂલ્યમાં 0.82 પ્રમાણભૂત વિચલન S y દ્વારા ઘટાડો તરફ દોરી જશે.

1.4. અંદાજ ભૂલ.

ચાલો નિરપેક્ષ અંદાજની ભૂલનો ઉપયોગ કરીને રીગ્રેસન સમીકરણની ગુણવત્તાનું મૂલ્યાંકન કરીએ. સરેરાશ અંદાજ ભૂલ - વાસ્તવિક મૂલ્યોમાંથી ગણતરી કરેલ મૂલ્યોનું સરેરાશ વિચલન:

5% -7% ની અંદર અંદાજિત ભૂલ એ મૂળ ડેટા માટે રીગ્રેસન સમીકરણની સારી ફિટ સૂચવે છે.

ભૂલ 7% કરતા ઓછી હોવાથી, આ સમીકરણનો ઉપયોગ રીગ્રેસન તરીકે થઈ શકે છે.

લીનિયર રીગ્રેસન ફોર્મનું સમીકરણ શોધવા માટે નીચે આવે છે

પ્રથમ અભિવ્યક્તિ આપેલ પરિબળ મૂલ્યો માટે પરવાનગી આપે છે xપરિબળના વાસ્તવિક મૂલ્યોને તેમાં બદલીને પરિણામી લાક્ષણિકતાના સૈદ્ધાંતિક મૂલ્યોની ગણતરી કરો x. ગ્રાફમાં, સૈદ્ધાંતિક મૂલ્યો સીધી રેખા પર આવેલા છે, જે રીગ્રેસન રેખાને રજૂ કરે છે.

રેખીય રીગ્રેસનનું નિર્માણ તેના પરિમાણોનો અંદાજ કાઢવા માટે નીચે આવે છે - અને b. રેખીય રીગ્રેસન પરિમાણોનો અંદાજ કાઢવાનો શાસ્ત્રીય અભિગમ આધારિત છે ઓછામાં ઓછા ચોરસ પદ્ધતિ (LSM).

ન્યૂનતમ શોધવા માટે, દરેક પરિમાણો માટે સરવાળા (4) ના આંશિક ડેરિવેટિવ્સની ગણતરી કરવી જરૂરી છે - અને b- અને તેમને શૂન્ય સાથે સરખાવો.

(5)

ચાલો પરિવર્તન કરીએ, આપણને મળે છે સામાન્ય સમીકરણોની સિસ્ટમ:

(6)

આ સિસ્ટમમાં n-નમૂનાનું કદ, રકમ મૂળ ડેટામાંથી સરળતાથી ગણવામાં આવે છે. અમે આદર સાથે સિસ્ટમ ઉકેલવા અને b, અમને મળે છે:

(7)

. (8)

અભિવ્યક્તિ (7) બીજા સ્વરૂપમાં લખી શકાય છે:

(9)

જ્યાં લક્ષણ સહપ્રવૃત્તિ, પરિબળ વિક્ષેપ x

પરિમાણ bકહેવાય છે રીગ્રેસન ગુણાંક.તેનું મૂલ્ય એક એકમ દ્વારા પરિબળમાં ફેરફાર સાથે પરિણામમાં સરેરાશ ફેરફાર દર્શાવે છે. રીગ્રેસન ગુણાંકના સ્પષ્ટ આર્થિક અર્થઘટનની શક્યતા છે રેખીય સમીકરણઇકોનોમેટ્રિક અભ્યાસમાં રીગ્રેશન એકદમ સામાન્ય છે.

ઔપચારિક રીતે a- અર્થ yખાતે x=0.જો xશૂન્ય મૂલ્ય ધરાવતું નથી અને હોઈ શકતું નથી, તો મુક્ત શબ્દનું આ અર્થઘટન aઅર્થ નથી. પરિમાણ aકોઈ આર્થિક સામગ્રી ન હોઈ શકે. તેને આર્થિક રીતે અર્થઘટન કરવાના પ્રયાસો વાહિયાતતા તરફ દોરી શકે છે, ખાસ કરીને જ્યારે a< 0. Интерпретировать можно лишь знак при параметре aજો a> 0, પછી પરિણામમાં સંબંધિત ફેરફાર પરિબળમાં ફેરફાર કરતાં વધુ ધીમેથી થાય છે. ચાલો આ સંબંધિત ફેરફારોની તુલના કરીએ:

< при > 0, > 0

કેટલીકવાર સરેરાશમાંથી વિચલનો માટે રેખીય જોડી પ્રમાણે રીગ્રેસન સમીકરણ લખવામાં આવે છે:

ક્યાં, . આ કિસ્સામાં, મફત શબ્દ શૂન્યની બરાબર છે, જે અભિવ્યક્તિ (10) માં પ્રતિબિંબિત થાય છે. આ હકીકત ભૌમિતિક વિચારણાઓથી અનુસરે છે: સમાન સીધી રેખા (3) રીગ્રેસન સમીકરણને અનુરૂપ છે, પરંતુ જ્યારે વિચલનોમાં રીગ્રેસનનો અંદાજ કાઢે છે, ત્યારે કોઓર્ડિનેટ્સનું મૂળ કોઓર્ડિનેટ્સ સાથે બિંદુ પર જાય છે. આ કિસ્સામાં, અભિવ્યક્તિમાં (8) બંને સરવાળો શૂન્યના સમાન હશે, જે મુક્ત શબ્દની સમાનતાને શૂન્યમાં જોડશે.

ચાલો, ઉદાહરણ તરીકે, એક પ્રકારનાં ઉત્પાદનનું ઉત્પાદન કરતા સાહસોના જૂથ માટે, ખર્ચ કાર્યને ધ્યાનમાં લઈએ



ટેબલ 1.

ઉત્પાદન આઉટપુટ હજાર એકમો() ઉત્પાદન ખર્ચ, મિલિયન રુબેલ્સ()
31,1
67,9
141,6
104,7
178,4
104,7
141,6
કુલ: 22 770,0

સામાન્ય સમીકરણોની સિસ્ટમ આના જેવી દેખાશે:

તેને હલ કરીને, આપણે મેળવીએ છીએ a= -5.79, b=36.84.

રીગ્રેસન સમીકરણ છે:

મૂલ્યોને સમીકરણમાં બદલીને એક્સ, ચાલો સૈદ્ધાંતિક મૂલ્યો શોધીએ y(કોષ્ટકની છેલ્લી કૉલમ).

તીવ્રતા aકોઈ આર્થિક અર્થ નથી. જો ચલો xઅને yસરેરાશ સ્તરોથી વિચલનોની દ્રષ્ટિએ વ્યક્ત કરવામાં આવે છે, પછી ગ્રાફ પરની રીગ્રેસન રેખા કોઓર્ડિનેટ્સના મૂળમાંથી પસાર થશે. રીગ્રેસન ગુણાંક અંદાજ બદલાશે નહીં:

, ક્યાં , .

બીજા ઉદાહરણ તરીકે, ફોર્મના વપરાશ કાર્યને ધ્યાનમાં લો:

,

જ્યાં C વપરાશ છે, y- આવક, K, L-વિકલ્પો આ રેખીય રીગ્રેસન સમીકરણનો ઉપયોગ સામાન્ય રીતે બેલેન્સ શીટ સમીકરણ સાથે કરવામાં આવે છે:

,

જ્યાં આઈ- રોકાણનું કદ, આર- બચત.

સરળતા માટે, ધારો કે આવક વપરાશ અને રોકાણ પર ખર્ચવામાં આવે છે. આમ, સમીકરણોની સિસ્ટમ ગણવામાં આવે છે:

બેલેન્સ શીટ સમાનતાની હાજરી રીગ્રેસન ગુણાંકના મૂલ્ય પર નિયંત્રણો લાદે છે, જે એક કરતા વધારે ન હોઈ શકે, એટલે કે. .

ચાલો ધારીએ કે વપરાશ કાર્ય છે:

.

રીગ્રેસન ગુણાંક વપરાશ કરવાની વૃત્તિને દર્શાવે છે. તે દર્શાવે છે કે આવકના દર હજાર રુબેલ્સમાંથી, સરેરાશ 650 રુબેલ્સ વપરાશ પર ખર્ચવામાં આવે છે, અને 350 રુબેલ્સ. રોકાણ કર્યું. જો આપણે આવક પર રોકાણના કદના રીગ્રેશનની ગણતરી કરીએ, એટલે કે. , પછી રીગ્રેસન સમીકરણ હશે . આ સમીકરણને વ્યાખ્યાયિત કરવાની જરૂર નથી, કારણ કે તે વપરાશ કાર્યમાંથી ઉતરી આવ્યું છે. આ બે સમીકરણોના રીગ્રેસન ગુણાંક સમાનતા દ્વારા સંબંધિત છે:

જો રીગ્રેસન ગુણાંક એક કરતા વધારે હોય, તો , અને માત્ર આવક જ નહીં, પણ બચત પણ વપરાશ પર ખર્ચવામાં આવે છે.



વપરાશ કાર્યમાં રીગ્રેસન ગુણાંકનો ઉપયોગ ગુણકની ગણતરી કરવા માટે થાય છે:

અહીં m≈2.86, તેથી વધારાનું રોકાણ 1 હજાર રુબેલ્સ છે. પર લાંબા ગાળાના 2.86 હજાર રુબેલ્સની વધારાની આવક તરફ દોરી જશે, અન્ય વસ્તુઓ સમાન છે.

રેખીય રીગ્રેશનમાં, રેખીય સહસંબંધ ગુણાંક જોડાણની નિકટતાના સૂચક તરીકે કાર્ય કરે છે આર:

તેના મૂલ્યો સીમાઓની અંદર છે: . જો b> 0, પછી ક્યારે b< 0 . ઉદાહરણ અનુસાર, આનો અર્થ આઉટપુટના જથ્થા પર ઉત્પાદન ખર્ચની ખૂબ નજીકની અવલંબન છે.

રેખીય કાર્યને ફિટ કરવાની ગુણવત્તાનું મૂલ્યાંકન કરવા માટે, ગણતરી કરો નિર્ધારણ ગુણાંકરેખીય સહસંબંધ ગુણાંકના વર્ગ તરીકે આર 2. તે પરિણામી લાક્ષણિકતાના ભિન્નતાના શેરને લાક્ષણિકતા આપે છે yપરિણામી લક્ષણના કુલ ભિન્નતામાં રીગ્રેસન દ્વારા સમજાવાયેલ:

મૂલ્ય ભિન્નતાના શેરને દર્શાવે છે y, મોડેલમાં ધ્યાનમાં લેવામાં ન આવતા અન્ય પરિબળોના પ્રભાવને કારણે.

ઉદાહરણમાં. રીગ્રેસન સમીકરણ 98.2% ભિન્નતાને સમજાવે છે, અને અન્ય પરિબળો 1.8% માટે જવાબદાર છે, આ શેષ તફાવત છે.

OLS ની પૂર્વશરતો (ગૌસ-માર્કોવ શરતો)

ઉપર સૂચવ્યા મુજબ, વચ્ચે જોડાણ yઅને xજોડીમાં રીગ્રેસન કાર્યાત્મક નથી, પરંતુ સહસંબંધિત છે. તેથી, પરિમાણ અંદાજ aઅને bછે રેન્ડમ ચલો, જેનાં ગુણધર્મો નોંધપાત્ર રીતે રેન્ડમ ઘટક ε ના ગુણધર્મો પર આધાર રાખે છે. ઓછામાં ઓછા ચોરસનો ઉપયોગ કરીને શ્રેષ્ઠ પરિણામો મેળવવા માટે, રેન્ડમ વિચલન (ગૌસ-માર્કોવ શરતો) સંબંધિત નીચેની પૂર્વજરૂરીયાતો પૂરી કરવી આવશ્યક છે:

1 0 . અપેક્ષિત મૂલ્યબધા અવલોકનો માટે રેન્ડમ વિચલન શૂન્ય છે: .

20 રેન્ડમ વિચલનોનો ભિન્નતા સતત છે: .

આ પૂર્વશરતની શક્યતા કહેવાય છે હોમોસેડેસ્ટીસીટી(વિચલન ભિન્નતાની સ્થિરતા). આ પૂર્વધારણાની અશક્યતા કહેવાય છે વિજાતીયતા(વિચલન ભિન્નતાની અસંગતતા)

ત્રીસ રેન્ડમ વિચલનો ε હુંઅને ε જેમાટે એકબીજાથી સ્વતંત્ર છે:

આ સ્થિતિની શક્યતા કહેવાય છે સ્વયંસંબંધની ગેરહાજરી.

4 0 રેન્ડમ ભિન્નતા સ્પષ્ટીકરણ ચલોથી સ્વતંત્ર હોવી જોઈએ.

સામાન્ય રીતે, આ સ્થિતિ આપોઆપ સંતુષ્ટ થાય છે જો આપેલ મોડેલમાં સમજૂતીત્મક ચલો રેન્ડમ ન હોય. વધુમાં, ઇકોનોમેટ્રિક મોડલ્સ માટે આ પૂર્વશરતની શક્યતા પ્રથમ ત્રણની સરખામણીમાં એટલી જટિલ નથી.

જો ઉલ્લેખિત પૂર્વજરૂરીયાતો પૂરી થાય છે, તો પછી ગૌસનું પ્રમેય-માર્કોવા: OLS નો ઉપયોગ કરીને મેળવેલ અંદાજો (7) અને (8) તમામ રેખીય નિષ્પક્ષ અંદાજોના વર્ગમાં સૌથી નાનો તફાવત ધરાવે છે .

આમ, જો ગૌસ-માર્કોવની શરતો પૂરી થાય, તો અંદાજો (7) અને (8) રીગ્રેસન ગુણાંકના નિષ્પક્ષ અંદાજો જ નહીં, પણ સૌથી અસરકારક પણ છે, એટલે કે. મૂલ્યોના સંદર્ભમાં રેખીય હોય તેવા આ પરિમાણોના કોઈપણ અન્ય અંદાજોની તુલનામાં સૌથી નાનું વિક્ષેપ છે y i.

તે ગૌસ-માર્કોવ પરિસ્થિતિઓના મહત્વની સમજ છે જે એક સક્ષમ સંશોધકને રીગ્રેસન વિશ્લેષણનો ઉપયોગ કરીને અસમર્થથી અલગ પાડે છે. જો આ શરતો પૂરી ન થાય, તો સંશોધકને આની જાણ હોવી જોઈએ. જો સુધારાત્મક પગલાં શક્ય હોય, તો વિશ્લેષકે તે લેવા સક્ષમ હોવા જોઈએ. જો પરિસ્થિતિને સુધારી શકાતી નથી, તો સંશોધક એ મૂલ્યાંકન કરવા સક્ષમ હોવા જોઈએ કે આ પરિણામોને કેટલી ગંભીરતાથી અસર કરી શકે છે.

રીગ્રેસન સમીકરણનો ઉપયોગ કરીને આગાહી કરવા માટે, તમારે રીગ્રેસન ગુણાંક અને સમીકરણોની ગણતરી કરવાની જરૂર છે. અને અહીં આગાહીની ચોકસાઈને અસર કરતી બીજી સમસ્યા છે. તે હકીકતમાં આવેલું છે કે સામાન્ય રીતે દરેક જણ નથી શક્ય મૂલ્યોચલ X અને Y, એટલે કે. આગાહી સમસ્યાઓમાં સંયુક્ત વિતરણની સામાન્ય વસ્તી જાણીતી નથી, આ સામાન્ય વસ્તીમાંથી માત્ર એક નમૂના જાણીતો છે. પરિણામે, આગાહી કરતી વખતે, રેન્ડમ ઘટક ઉપરાંત, ભૂલોનો બીજો સ્રોત ઉદ્ભવે છે - સામાન્ય વસ્તીને નમૂનાના અપૂર્ણ પત્રવ્યવહારને કારણે થતી ભૂલો અને રીગ્રેસન સમીકરણના ગુણાંક નક્કી કરવામાં પરિણામી ભૂલો.

બીજા શબ્દોમાં કહીએ તો, એ હકીકતને કારણે કે વસ્તી અજાણ છે, ચોક્કસ મૂલ્યોગુણાંક અને રીગ્રેસન સમીકરણો નક્કી કરી શકાતા નથી. આ અજ્ઞાત વસ્તીમાંથી નમૂનાનો ઉપયોગ કરીને, વ્યક્તિ ફક્ત સાચા ગુણાંકનો અંદાજ મેળવી શકે છે અને.

આવા ફેરબદલીના પરિણામે આગાહીની ભૂલો ન્યૂનતમ હોય તે માટે, મૂલ્યાંકન એવી પદ્ધતિનો ઉપયોગ કરીને હાથ ધરવામાં આવવું જોઈએ કે જે મેળવેલ નિષ્પક્ષ અને કાર્યક્ષમ મૂલ્યોની બાંયધરી આપે. જો સમાન વસ્તીના નવા નમૂનાઓ સાથે ઘણી વખત પુનરાવર્તિત કરવામાં આવે ત્યારે, સ્થિતિ અને સંતુષ્ટ હોય તો પદ્ધતિ નિષ્પક્ષ અંદાજો પ્રદાન કરે છે. પદ્ધતિ અસરકારક અંદાજો પ્રદાન કરે છે જો, જ્યારે સમાન વસ્તીના નવા નમૂનાઓ સાથે ઘણી વખત પુનરાવર્તિત થાય છે, ત્યારે a અને b ના લઘુત્તમ વિક્ષેપની ખાતરી કરવામાં આવે છે, એટલે કે. શરતો અને પૂરી થાય છે.

સંભાવના સિદ્ધાંતમાં, એક પ્રમેય સાબિત થયો છે જે મુજબ નમૂનાના ડેટા પર આધારિત રેખીય રીગ્રેસન સમીકરણના ગુણાંકની કાર્યક્ષમતા અને નિષ્પક્ષ અંદાજ ઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને સુનિશ્ચિત કરવામાં આવે છે.

લઘુત્તમ ચોરસ પદ્ધતિનો સાર નીચે મુજબ છે. દરેક નમૂના બિંદુ માટે, ફોર્મનું સમીકરણ લખવામાં આવે છે . પછી ગણતરી કરેલ અને વાસ્તવિક મૂલ્યો વચ્ચેની ભૂલ જોવા મળે છે. આવા મૂલ્યો શોધવાની ઑપ્ટિમાઇઝેશન સમસ્યાનું નિરાકરણ અને તે તમામ n બિંદુઓ માટે લઘુત્તમ ચોરસ ભૂલોનો સરવાળો પૂરો પાડે છે, એટલે કે. શોધ સમસ્યાનો ઉકેલ , ગુણાંકના નિષ્પક્ષ અને કાર્યક્ષમ અંદાજો આપે છે અને . જોડીવાળા રેખીય રીગ્રેસનના કિસ્સામાં, આ ઉકેલનું સ્વરૂપ છે:

એ નોંધવું જોઈએ કે નમૂનામાંથી આ રીતે મેળવેલ સામાન્ય વસ્તી માટે રીગ્રેસન ગુણાંકના સાચા મૂલ્યોના નિષ્પક્ષ અને અસરકારક અંદાજો એકવાર લાગુ કરવામાં આવે ત્યારે ભૂલો સામે બિલકુલ બાંયધરી આપતા નથી. ગેરંટી એ છે કે, સમાન વસ્તીના અન્ય નમૂનાઓ સાથે આ કામગીરીના વારંવાર પુનરાવર્તનના પરિણામે, અન્ય કોઈપણ પદ્ધતિની તુલનામાં ઓછી માત્રામાં ભૂલોની ખાતરી આપવામાં આવે છે અને આ ભૂલોનો ફેલાવો ન્યૂનતમ હશે.

રીગ્રેસન સમીકરણના પ્રાપ્ત ગુણાંક રીગ્રેસન લાઇનની સ્થિતિ નક્કી કરે છે; તે મૂળ નમૂનાના બિંદુઓ દ્વારા રચાયેલી વાદળની મુખ્ય ધરી છે. બંને ગુણાંકનો ખૂબ જ ચોક્કસ અર્થ છે. ગુણાંક પર મૂલ્ય દર્શાવે છે, પરંતુ ઘણા કિસ્સાઓમાં તેનો અર્થ નથી; વધુમાં, તે ઘણીવાર અર્થમાં પણ નથી હોતો; તેથી, ગુણાંકના આપેલ અર્થઘટનનો કાળજીપૂર્વક ઉપયોગ કરવો આવશ્યક છે. અર્થનું વધુ સાર્વત્રિક અર્થઘટન નીચે મુજબ છે. જો , તો સ્વતંત્ર ચલમાં સંબંધિત ફેરફાર (ટકામાં ફેરફાર) હંમેશા આશ્રિત ચલમાં સંબંધિત ફેરફાર કરતાં ઓછો હોય છે.

ગુણાંક બતાવે છે કે જ્યારે સ્વતંત્ર ચલ એક એકમ દ્વારા બદલાશે ત્યારે આશ્રિત ચલ કેટલા એકમો બદલાશે. ગુણાંકને ઘણીવાર રીગ્રેસન ગુણાંક કહેવામાં આવે છે, તે ભાર મૂકે છે કે તે કરતાં વધુ મહત્વપૂર્ણ છે. ખાસ કરીને, જો આશ્રિત અને સ્વતંત્ર ચલોના મૂલ્યોને બદલે આપણે તેમના સરેરાશ મૂલ્યોમાંથી તેમના વિચલનો લઈએ, તો રીગ્રેસન સમીકરણ ફોર્મમાં પરિવર્તિત થાય છે. . બીજા શબ્દોમાં કહીએ તો, રૂપાંતરિત સંકલન પ્રણાલીમાં, કોઈપણ રીગ્રેસન રેખા કોઓર્ડિનેટ્સના મૂળમાંથી પસાર થાય છે (ફિગ. 13) અને ત્યાં કોઈ ગુણાંક નથી.

આકૃતિ 13. રૂપાંતરિત સંકલન પ્રણાલીમાં રીગ્રેસન અવલંબનની સ્થિતિ.

રીગ્રેસન સમીકરણના પરિમાણો અમને જણાવે છે કે આશ્રિત અને સ્વતંત્ર ચલો એકબીજા સાથે કેવી રીતે સંબંધિત છે, પરંતુ સંબંધની નિકટતાની ડિગ્રી વિશે અમને કંઈ કહેતા નથી, એટલે કે. ડેટા ક્લાઉડના મુખ્ય અક્ષની સ્થિતિ બતાવો, પરંતુ કનેક્શનની ચુસ્તતાની ડિગ્રી (મેઘ કેટલો સાંકડો અથવા પહોળો છે) વિશે કશું કહેતું નથી.

પ્રદેશના પ્રદેશો માટે, 200X માટે ડેટા પ્રદાન કરવામાં આવે છે.

પ્રદેશ નંબર એક સક્ષમ-શરીર વ્યક્તિનું દિવસ દીઠ માથાદીઠ સરેરાશ લિવિંગ વેતન, ઘસવું., x સરેરાશ દૈનિક વેતન, ઘસવું., વાય
1 78 133
2 82 148
3 87 134
4 79 154
5 89 162
6 106 195
7 67 139
8 88 158
9 73 152
10 87 162
11 76 159
12 115 173

કસરત:

1. એક સહસંબંધ ક્ષેત્ર બનાવો અને જોડાણના સ્વરૂપ વિશે એક પૂર્વધારણા બનાવો.

2. રેખીય રીગ્રેસન સમીકરણના પરિમાણોની ગણતરી કરો

4. સરેરાશ (સામાન્ય) સ્થિતિસ્થાપકતા ગુણાંકનો ઉપયોગ કરીને, પરિબળ અને પરિણામ વચ્ચેના સંબંધની મજબૂતાઈનું તુલનાત્મક મૂલ્યાંકન આપો.

7. જો પરિબળનું અનુમાનિત મૂલ્ય તેના સરેરાશ સ્તરથી 10% વધે તો પરિણામના અનુમાનિત મૂલ્યની ગણતરી કરો. મહત્વના સ્તર માટે આગાહી વિશ્વાસ અંતરાલ નક્કી કરો.

ઉકેલ:

ચાલો નક્કી કરીએ આ કાર્યએક્સેલનો ઉપયોગ કરીને.

1. ઉપલબ્ધ ડેટા x અને y ની સરખામણી કરીને, ઉદાહરણ તરીકે, તેમને પરિબળ xના વધતા ક્રમમાં ક્રમાંકિત કરીને, વ્યક્તિ લાક્ષણિકતાઓ વચ્ચે સીધો સંબંધની હાજરીનું અવલોકન કરી શકે છે, જ્યારે માથાદીઠ સરેરાશ નિર્વાહ સ્તરમાં વધારો સરેરાશ દૈનિક વધારો કરે છે. વેતન આના આધારે, અમે ધારણા કરી શકીએ છીએ કે લાક્ષણિકતાઓ વચ્ચેનો સંબંધ સીધો છે અને તેને સીધી રેખા સમીકરણ દ્વારા વર્ણવી શકાય છે. ગ્રાફિકલ વિશ્લેષણના આધારે સમાન નિષ્કર્ષની પુષ્ટિ થાય છે.

સહસંબંધ ક્ષેત્ર બનાવવા માટે, તમે Excel PPP નો ઉપયોગ કરી શકો છો. ક્રમમાં પ્રારંભિક ડેટા દાખલ કરો: પ્રથમ x, પછી y.

કોષોનો વિસ્તાર પસંદ કરો જેમાં ડેટા છે.

પછી પસંદ કરો: માર્કર્સ સાથે દાખલ કરો / સ્કેટર પ્લોટ / સ્કેટરઆકૃતિ 1 માં બતાવ્યા પ્રમાણે.

આકૃતિ 1 સહસંબંધ ક્ષેત્રનું નિર્માણ

સહસંબંધ ક્ષેત્રનું પૃથ્થકરણ રેક્ટિલિનિયર અવલંબનની નજીકની હાજરી દર્શાવે છે, કારણ કે બિંદુઓ લગભગ સીધી રેખામાં સ્થિત છે.

2. રેખીય રીગ્રેસન સમીકરણના પરિમાણોની ગણતરી કરવા માટે
ચાલો બિલ્ટ-ઇન આંકડાકીય કાર્યનો ઉપયોગ કરીએ LINEST.

આ માટે:

1) વિશ્લેષિત ડેટા ધરાવતી અસ્તિત્વમાંની ફાઇલ ખોલો;
2) રીગ્રેશન આંકડાઓના પરિણામો પ્રદર્શિત કરવા માટે ખાલી કોષોનો 5x2 વિસ્તાર (5 પંક્તિઓ, 2 કૉલમ) પસંદ કરો.
3) સક્રિય કરો કાર્ય વિઝાર્ડ: મુખ્ય મેનુમાં પસંદ કરો ફોર્મ્યુલા / ઇન્સર્ટ ફંક્શન.
4) વિંડોમાં શ્રેણીતમે લઈ રહ્યા છો આંકડાકીય, ફંક્શન વિન્ડોમાં - LINEST. બટન પર ક્લિક કરો બરાબરઆકૃતિ 2 માં બતાવ્યા પ્રમાણે;

આકૃતિ 2 ફંક્શન વિઝાર્ડ ડાયલોગ બોક્સ

5) ફંક્શન દલીલો ભરો:

માટે જાણીતા મૂલ્યો

x ના જાણીતા મૂલ્યો

સતત - બુલિયન મૂલ્ય, જે સમીકરણમાં મુક્ત શબ્દની હાજરી અથવા ગેરહાજરી સૂચવે છે; જો કોન્સ્ટન્ટ = 1, તો ફ્રી ટર્મ સામાન્ય રીતે ગણવામાં આવે છે, જો કોન્સ્ટન્ટ = 0, તો ફ્રી ટર્મ 0 છે;

આંકડા- એક તાર્કિક મૂલ્ય જે સૂચવે છે કે રીગ્રેસન વિશ્લેષણ પર વધારાની માહિતી પ્રદર્શિત કરવી કે નહીં. જો આંકડા = 1, તો વધારાની માહિતીપ્રદર્શિત થાય છે, જો આંકડા = 0, તો માત્ર સમીકરણ પરિમાણોના અંદાજો પ્રદર્શિત થાય છે.

બટન પર ક્લિક કરો બરાબર;

આકૃતિ 3 LINEST કાર્ય દલીલો સંવાદ બોક્સ

6) અંતિમ કોષ્ટકનું પ્રથમ તત્વ પસંદ કરેલ વિસ્તારના ઉપલા ડાબા કોષમાં દેખાશે. આખું ટેબલ ખોલવા માટે, બટન દબાવો , અને પછી કી સંયોજન માટે ++ .

વધારાના રીગ્રેસન આંકડા નીચેના ડાયાગ્રામમાં બતાવેલ ક્રમમાં આઉટપુટ થશે:

ગુણાંક મૂલ્ય b ગુણાંક મૂલ્ય
પ્રમાણભૂત ભૂલ b માનક ભૂલ એ
માનક ભૂલ y
F- આંકડાકીય
ચોરસનો રીગ્રેશન સરવાળો

આકૃતિ 4 LINEST કાર્યની ગણતરીનું પરિણામ

અમને રીગ્રેસન સ્તર મળ્યું:

અમે નિષ્કર્ષ કાઢીએ છીએ: માથાદીઠ નિર્વાહના સરેરાશ સ્તરમાં 1 ઘસવાના વધારા સાથે. સરેરાશ દૈનિક વેતન સરેરાશ 0.92 રુબેલ્સ દ્વારા વધે છે.

મતલબ 52% વિવિધતા વેતન(y) પરિબળ x ની વિવિધતા - માથાદીઠ સરેરાશ નિર્વાહ સ્તર, અને 48% - મોડેલમાં સમાવિષ્ટ ન હોય તેવા અન્ય પરિબળોની ક્રિયા દ્વારા સમજાવવામાં આવે છે.

નિર્ધારણના ગણતરી કરેલ ગુણાંકનો ઉપયોગ કરીને, સહસંબંધ ગુણાંકની ગણતરી કરી શકાય છે: .

જોડાણનું મૂલ્યાંકન નજીક તરીકે કરવામાં આવે છે.

4. સરેરાશ (સામાન્ય) સ્થિતિસ્થાપકતા ગુણાંકનો ઉપયોગ કરીને, અમે પરિણામ પર પરિબળના પ્રભાવની મજબૂતાઈ નક્કી કરીએ છીએ.

સીધી રેખા સમીકરણ માટે, અમે સૂત્રનો ઉપયોગ કરીને સરેરાશ (કુલ) સ્થિતિસ્થાપકતા ગુણાંક નક્કી કરીએ છીએ:

x મૂલ્યોવાળા કોષોના ક્ષેત્રફળને પસંદ કરીને અને પસંદ કરીને આપણે સરેરાશ મૂલ્યો શોધીશું સૂત્રો / ઓટોસમ / સરેરાશ, અને આપણે y ના મૂલ્યો સાથે તે જ કરીશું.

આકૃતિ 5 સરેરાશ કાર્ય મૂલ્યો અને દલીલની ગણતરી

આમ, જો સરેરાશ માથાદીઠ જીવન ખર્ચ તેના સરેરાશ મૂલ્યથી 1% બદલાય છે, તો સરેરાશ દૈનિક વેતન સરેરાશ 0.51% બદલાશે.

ડેટા વિશ્લેષણ સાધનનો ઉપયોગ પ્રત્યાગમાનઉપલબ્ધ:
- રીગ્રેસન આંકડાઓના પરિણામો,
- ભિન્નતાના વિશ્લેષણના પરિણામો,
- પરિણામો આત્મવિશ્વાસના અંતરાલ,
- અવશેષો અને રીગ્રેશન લાઇન ફિટિંગ ગ્રાફ,
- અવશેષો અને સામાન્ય સંભાવના.

પ્રક્રિયા નીચે મુજબ છે:

1) ઍક્સેસ તપાસો વિશ્લેષણ પેકેજ. મુખ્ય મેનૂમાં, પસંદ કરો: ફાઇલ/વિકલ્પો/એડ-ઓન્સ.

2) ડ્રોપડાઉન સૂચિમાં નિયંત્રણવસ્તુ પસંદ કરો એક્સેલ એડ-ઇન્સઅને બટન દબાવો જાઓ.

3) વિંડોમાં ઍડ-ઑન્સબોક્સ ચેક કરો વિશ્લેષણ પેકેજઅને પછી બટન પર ક્લિક કરો બરાબર.

જો વિશ્લેષણ પેકેજક્ષેત્ર યાદીમાં નથી ઉપલબ્ધ એડ-ઓન્સ, બટન દબાવો સમીક્ષાશોધ કરવા માટે.

જો તમને એક સંદેશ પ્રાપ્ત થાય છે જે દર્શાવે છે કે વિશ્લેષણ પેકેજ તમારા કમ્પ્યુટર પર ઇન્સ્ટોલ કરેલું નથી, તો ક્લિક કરો હાતેને સ્થાપિત કરવા માટે.

4) મુખ્ય મેનુમાં, પસંદ કરો: ડેટા / ડેટા વિશ્લેષણ / વિશ્લેષણ સાધનો / રીગ્રેસનઅને પછી બટન પર ક્લિક કરો બરાબર.

5) ડેટા ઇનપુટ અને આઉટપુટ પરિમાણો સંવાદ બોક્સ ભરો:

ઇનપુટ અંતરાલ Y- પરિણામી વિશેષતાનો ડેટા ધરાવતી શ્રેણી;

ઇનપુટ અંતરાલ X- પરિબળ લાક્ષણિકતાનો ડેટા ધરાવતી શ્રેણી;

ટૅગ્સ- એક ધ્વજ જે સૂચવે છે કે પ્રથમ લાઇનમાં કૉલમના નામ છે કે નહીં;

સતત - શૂન્ય- સમીકરણમાં મુક્ત શબ્દની હાજરી અથવા ગેરહાજરી દર્શાવતો ધ્વજ;

આઉટપુટ અંતરાલ- ભાવિ શ્રેણીના ઉપલા ડાબા કોષને સૂચવવા માટે તે પૂરતું છે;

6) નવી કાર્યપત્રક - તમે નવી શીટ માટે મનસ્વી નામનો ઉલ્લેખ કરી શકો છો.

પછી બટન પર ક્લિક કરો બરાબર.

આકૃતિ 6 રીગ્રેશન ટૂલ માટે પરિમાણો દાખલ કરવા માટે સંવાદ બોક્સ

સમસ્યા ડેટા માટે રીગ્રેસન વિશ્લેષણના પરિણામો આકૃતિ 7 માં રજૂ કરવામાં આવ્યા છે.

આકૃતિ 7 રીગ્રેશન ટૂલનો ઉપયોગ કરવાનું પરિણામ

5. ચાલો ઉપયોગ કરીને મૂલ્યાંકન કરીએ સરેરાશ ભૂલસમીકરણોની અંદાજિત ગુણવત્તા. ચાલો આકૃતિ 8 માં પ્રસ્તુત રીગ્રેસન વિશ્લેષણના પરિણામોનો ઉપયોગ કરીએ.

આકૃતિ 8 રીગ્રેશન ટૂલનો ઉપયોગ કરવાનું પરિણામ "શેષનો ઉપાડ"

ચાલો આકૃતિ 9 માં બતાવ્યા પ્રમાણે નવું કોષ્ટક બનાવીએ. કૉલમ C માં આપણે ગણતરી કરીએ છીએ સંબંધિત ભૂલસૂત્ર અનુસાર અંદાજ:

આકૃતિ 9 સરેરાશ અંદાજ ભૂલની ગણતરી

સરેરાશ અંદાજની ભૂલની ગણતરી સૂત્રનો ઉપયોગ કરીને કરવામાં આવે છે:

બાંધવામાં આવેલા મોડેલની ગુણવત્તાનું મૂલ્યાંકન સારી તરીકે કરવામાં આવે છે, કારણ કે તે 8 - 10% થી વધુ નથી.

6. કોષ્ટકમાંથી સી રીગ્રેસન આંકડા(આકૃતિ 4) અમે ફિશરના એફ-ટેસ્ટનું વાસ્તવિક મૂલ્ય લખીએ છીએ:

કારણ કે 5% મહત્વના સ્તરે, પછી આપણે નિષ્કર્ષ પર આવી શકીએ કે રીગ્રેશન સમીકરણ નોંધપાત્ર છે (સંબંધ સાબિત થયો છે).

8. મૂલ્યાંકન આંકડાકીય મહત્વઅમે વિદ્યાર્થીના ટી-આંકડાનો ઉપયોગ કરીને અને દરેક સૂચકના વિશ્વાસ અંતરાલની ગણતરી કરીને રીગ્રેસન પરિમાણો હાથ ધરીશું.

અમે સૂચકાંકો અને શૂન્ય વચ્ચેના આંકડાકીય રીતે નજીવા તફાવત વિશે પૂર્વધારણા H 0 આગળ મૂકી છે:

.

સ્વતંત્રતાની ડિગ્રીની સંખ્યા માટે

આકૃતિ 7 માં વાસ્તવિક t-આંકડાકીય મૂલ્યો છે:

સહસંબંધ ગુણાંક માટે ટી-ટેસ્ટની ગણતરી બે રીતે કરી શકાય છે:

પદ્ધતિ I:

જ્યાં - સહસંબંધ ગુણાંકની રેન્ડમ ભૂલ.

અમે આકૃતિ 7 માં કોષ્ટકમાંથી ગણતરી માટે ડેટા લઈશું.

પદ્ધતિ II:

વાસ્તવિક t-આંકડાકીય મૂલ્યો કોષ્ટક મૂલ્યો કરતાં વધી જાય છે:

તેથી, પૂર્વધારણા H 0 નકારી કાઢવામાં આવે છે, એટલે કે, રીગ્રેસન પરિમાણો અને સહસંબંધ ગુણાંક તક દ્વારા શૂન્યથી અલગ નથી, પરંતુ આંકડાકીય રીતે નોંધપાત્ર છે.

પરિમાણ a માટે વિશ્વાસ અંતરાલ તરીકે વ્યાખ્યાયિત થયેલ છે

પરિમાણ a માટે, આકૃતિ 7 માં બતાવ્યા પ્રમાણે 95% મર્યાદા હતી:

રીગ્રેસન ગુણાંક માટે આત્મવિશ્વાસ અંતરાલ આ રીતે વ્યાખ્યાયિત થયેલ છે

રીગ્રેશન ગુણાંક b માટે, આકૃતિ 7 માં બતાવ્યા પ્રમાણે 95% મર્યાદા હતી:

આત્મવિશ્વાસના અંતરાલની ઉપલી અને નીચલી મર્યાદાઓનું વિશ્લેષણ એ નિષ્કર્ષ તરફ દોરી જાય છે કે સંભાવના સાથે પરિમાણો a અને b, નિર્દિષ્ટ મર્યાદામાં હોવાથી, શૂન્ય મૂલ્યો લેતા નથી, એટલે કે. આંકડાકીય રીતે મામૂલી નથી અને શૂન્યથી નોંધપાત્ર રીતે અલગ છે.

7. રીગ્રેસન સમીકરણના મેળવેલ અંદાજો તેને આગાહી માટે ઉપયોગમાં લેવાની મંજૂરી આપે છે. જો જીવનનિર્વાહની અનુમાનિત કિંમત છે:

પછી રહેવાની કિંમતનું અનુમાનિત મૂલ્ય હશે:

અમે સૂત્રનો ઉપયોગ કરીને આગાહી ભૂલની ગણતરી કરીએ છીએ:

જ્યાં

અમે એક્સેલ PPP નો ઉપયોગ કરીને તફાવતની પણ ગણતરી કરીશું. આ માટે:

1) સક્રિય કરો કાર્ય વિઝાર્ડ: મુખ્ય મેનુમાં પસંદ કરો ફોર્મ્યુલા / ઇન્સર્ટ ફંક્શન.

3) પરિબળ લાક્ષણિકતાની સંખ્યાત્મક માહિતી ધરાવતી શ્રેણી ભરો. ક્લિક કરો બરાબર.

આકૃતિ 10 વિચલનની ગણતરી

અમને વેરિઅન્સ વેલ્યુ મળી છે

સ્વતંત્રતાની ડિગ્રી દીઠ શેષ ભિન્નતાની ગણતરી કરવા માટે, અમે આકૃતિ 7 માં બતાવ્યા પ્રમાણે વિચલનના વિશ્લેષણના પરિણામોનો ઉપયોગ કરીશું.

0.95 ની સંભાવના સાથે y ના વ્યક્તિગત મૂલ્યોની આગાહી કરવા માટે આત્મવિશ્વાસ અંતરાલ અભિવ્યક્તિ દ્વારા નક્કી કરવામાં આવે છે:

અંતરાલ એકદમ વિશાળ છે, મુખ્યત્વે અવલોકનોની નાની માત્રાને કારણે. સામાન્ય રીતે, સરેરાશ માસિક પગારની આગાહી વિશ્વસનીય હોવાનું બહાર આવ્યું છે.

સમસ્યાની સ્થિતિ આમાંથી લેવામાં આવી છે: અર્થમિતિશાસ્ત્ર પર વર્કશોપ: પ્રોક. ભથ્થું / I.I. એલિસીવા, એસ.વી. કુરીશેવા, એન.એમ. ગોર્ડેન્કો અને અન્ય; એડ. I.I. એલિસીવા. - એમ.: ફાઇનાન્સ એન્ડ સ્ટેટિસ્ટિક્સ, 2003. - 192 પૃષ્ઠ: બીમાર.



સાઇટ પર નવું

>

સૌથી વધુ લોકપ્રિય