ઘર ઓર્થોપેડિક્સ ઓછામાં ઓછી ચોરસ પદ્ધતિ શું છે? પ્રાયોગિક ડેટાનો અંદાજ

ઓછામાં ઓછી ચોરસ પદ્ધતિ શું છે? પ્રાયોગિક ડેટાનો અંદાજ

પ્રાયોગિક ડેટાનો અંદાજ એ એક વિશ્લેષણાત્મક કાર્ય સાથે પ્રાયોગિક રીતે મેળવેલા ડેટાને બદલવા પર આધારિત પદ્ધતિ છે જે મૂળ મૂલ્યો (પ્રયોગ અથવા પ્રયોગ દરમિયાન મેળવેલ ડેટા) સાથે નોડલ પોઈન્ટ પર સૌથી વધુ નજીકથી પસાર થાય છે અથવા એકરૂપ થાય છે. હાલમાં, વિશ્લેષણાત્મક કાર્યને વ્યાખ્યાયિત કરવાની બે રીતો છે:

n-ડિગ્રી ઇન્ટરપોલેશન બહુપદી બનાવીને જે પસાર થાય છે સીધા બધા બિંદુઓ દ્વારાઆપેલ ડેટા એરે. IN આ બાબતેઅંદાજિત કાર્ય આ રીતે રજૂ થાય છે: લેગ્રેન્જ સ્વરૂપમાં પ્રક્ષેપ બહુપદી અથવા ન્યૂટન સ્વરૂપમાં પ્રક્ષેપ બહુપદી.

n-ડિગ્રી અંદાજિત બહુપદી બનાવીને જે પસાર થાય છે પોઈન્ટની તાત્કાલિક નજીકમાંઆપેલ ડેટા એરેમાંથી. આમ, અંદાજિત કાર્ય પ્રયોગ દરમિયાન ઉદ્ભવતા તમામ અવ્યવસ્થિત અવાજ (અથવા ભૂલો) ને સરળ બનાવે છે: પ્રયોગ દરમિયાન માપેલા મૂલ્યો રેન્ડમ પરિબળો પર આધાર રાખે છે જે તેમના પોતાના અનુસાર વધઘટ થાય છે. રેન્ડમ કાયદા(માપ અથવા સાધનની ભૂલો, અચોક્કસતા અથવા પ્રાયોગિક ભૂલો). આ કિસ્સામાં, અંદાજિત કાર્ય પદ્ધતિનો ઉપયોગ કરીને નક્કી કરવામાં આવે છે ઓછામાં ઓછા ચોરસ.

ઓછામાં ઓછી ચોરસ પદ્ધતિ(અંગ્રેજી સાહિત્યમાં ઓર્ડિનરી લીસ્ટ સ્ક્વેર્સ, OLS) એ અંદાજિત કાર્ય નક્કી કરવા પર આધારિત ગાણિતિક પદ્ધતિ છે જે પ્રાયોગિક ડેટાના આપેલ એરેમાંથી પોઈન્ટની સૌથી નજીકમાં બનાવવામાં આવે છે. મૂળ અને અંદાજિત કાર્યો F(x) ની નિકટતા સંખ્યાત્મક માપ દ્વારા નિર્ધારિત કરવામાં આવે છે, એટલે કે: અંદાજિત વળાંક F(x) માંથી પ્રાયોગિક ડેટાના વર્ગ વિચલનોનો સરવાળો સૌથી નાનો હોવો જોઈએ.

ઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને બાંધવામાં આવેલ અંદાજિત વળાંક

ઓછામાં ઓછી ચોરસ પદ્ધતિનો ઉપયોગ થાય છે:

જ્યારે સમીકરણોની સંખ્યા અજાણ્યાઓની સંખ્યા કરતાં વધી જાય ત્યારે સમીકરણોની અતિનિર્ધારિત પ્રણાલીઓને ઉકેલવા માટે;

સામાન્ય કિસ્સામાં ઉકેલ શોધવા માટે (ઓવરરાઇડ નથી) બિનરેખીય સિસ્ટમોસમીકરણો

કેટલાક અંદાજિત કાર્ય સાથે અંદાજિત બિંદુ મૂલ્યો માટે.

ઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને અંદાજિત કાર્ય પ્રાયોગિક ડેટાના આપેલ એરેમાંથી ગણતરી કરેલ અંદાજિત કાર્યના લઘુત્તમ સરવાળા વર્ગના વિચલનોની સ્થિતિ પરથી નક્કી કરવામાં આવે છે. લઘુત્તમ ચોરસ પદ્ધતિનો આ માપદંડ નીચેની અભિવ્યક્તિ તરીકે લખાયેલ છે:

નોડલ પોઈન્ટ પર ગણતરી કરેલ અંદાજિત કાર્યના મૂલ્યો,

નોડલ પોઈન્ટ પર પ્રાયોગિક ડેટાની આપેલ શ્રેણી.

ચતુર્ભુજ માપદંડમાં સંખ્યાબંધ "સારા" ગુણધર્મો છે, જેમ કે ભિન્નતા, બહુપદી અંદાજિત કાર્યો સાથે અંદાજિત સમસ્યાનો અનન્ય ઉકેલ પૂરો પાડે છે.

સમસ્યાની પરિસ્થિતિઓના આધારે, અંદાજિત કાર્ય એ ડિગ્રી m નું બહુપદી છે

અંદાજિત કાર્યની ડિગ્રી નોડલ બિંદુઓની સંખ્યા પર આધારિત નથી, પરંતુ તેનું પરિમાણ હંમેશા આપેલ પ્રાયોગિક ડેટા એરેના પરિમાણ (બિંદુઓની સંખ્યા) કરતા ઓછું હોવું જોઈએ.

∙ જો અંદાજિત કાર્યની ડિગ્રી m=1 હોય, તો આપણે સીધી રેખા (રેખીય રીગ્રેસન) સાથે ટેબ્યુલર ફંક્શનનું અનુમાન કરીએ છીએ.

∙ જો અંદાજિત ફંક્શનની ડિગ્રી m=2 હોય, તો આપણે ટેબલ ફંક્શનનો અંદાજ લગાવીએ છીએ ચતુર્ભુજ પેરાબોલા(ચતુર્ભુજ અંદાજ).

∙ જો અંદાજિત ફંક્શનની ડિગ્રી m=3 હોય, તો આપણે ક્યુબિક પેરાબોલા (ઘન અંદાજ) વડે ટેબલ ફંક્શનનો અંદાજ લગાવીએ છીએ.

IN સામાન્ય કેસજ્યારે આપેલ માટે ડિગ્રી m ની અંદાજિત બહુપદી બાંધવી જરૂરી હોય કોષ્ટક મૂલ્યો, તમામ નોડલ પોઈન્ટ્સ પર લઘુત્તમ વર્ગ વિચલનોની શરત નીચેના સ્વરૂપમાં ફરીથી લખવામાં આવી છે:

- ડિગ્રી m ના અંદાજિત બહુપદીના અજાણ્યા ગુણાંક;

ઉલ્લેખિત કોષ્ટક મૂલ્યોની સંખ્યા.

ન્યૂનતમ ફંક્શનના અસ્તિત્વ માટે જરૂરી શરત એ છે કે અજાણ્યા ચલોના સંદર્ભમાં તેના આંશિક ડેરિવેટિવ્સની શૂન્યની સમાનતા. . પરિણામે આપણને મળે છે નીચેની સિસ્ટમસમીકરણો

ચાલો પરિણામને પરિવર્તિત કરીએ રેખીય સિસ્ટમસમીકરણો: કૌંસ ખોલો અને મુક્ત શબ્દોને અભિવ્યક્તિની જમણી બાજુએ ખસેડો. રેખીય પરિણામી સિસ્ટમ બીજગણિત અભિવ્યક્તિઓનીચેના ફોર્મમાં લખવામાં આવશે:

રેખીય બીજગણિત અભિવ્યક્તિઓની આ સિસ્ટમ મેટ્રિક્સ સ્વરૂપમાં ફરીથી લખી શકાય છે:

પરિણામ એક સિસ્ટમ હતી રેખીય સમીકરણોપરિમાણ m+1, જેમાં m+1 અજ્ઞાતનો સમાવેશ થાય છે. આ સિસ્ટમ રેખીય સમસ્યાઓ ઉકેલવા માટે કોઈપણ પદ્ધતિનો ઉપયોગ કરીને ઉકેલી શકાય છે. બીજગણિતીય સમીકરણો(ઉદાહરણ તરીકે, ગૌસીયન પદ્ધતિ દ્વારા). સોલ્યુશનના પરિણામે, અંદાજિત કાર્યના અજ્ઞાત પરિમાણો મળી આવશે જે મૂળ ડેટામાંથી અંદાજિત કાર્યના વર્ગ વિચલનોનો ન્યૂનતમ સરવાળો પૂરો પાડે છે, એટલે કે. શ્રેષ્ઠ શક્ય ચતુર્ભુજ અંદાજ. તે યાદ રાખવું જોઈએ કે જો સ્રોત ડેટાનું એક મૂલ્ય પણ બદલાય છે, તો બધા ગુણાંક તેમના મૂલ્યો બદલશે, કારણ કે તે સ્રોત ડેટા દ્વારા સંપૂર્ણપણે નિર્ધારિત છે.

રેખીય અવલંબન દ્વારા સ્ત્રોત ડેટાનો અંદાજ

(રેખીય રીગ્રેશન)

ઉદાહરણ તરીકે, અંદાજિત કાર્ય નક્કી કરવા માટેની તકનીકને ધ્યાનમાં લો, જે ફોર્મમાં આપવામાં આવે છે રેખીય અવલંબન. ન્યૂનતમ ચોરસ પદ્ધતિ અનુસાર, લઘુત્તમ વર્ગ વિચલનોના સરવાળા માટેની શરત નીચેના સ્વરૂપમાં લખાયેલ છે:

કોષ્ટક ગાંઠોના કોઓર્ડિનેટ્સ;

અંદાજિત કાર્યના અજ્ઞાત ગુણાંક, જે રેખીય અવલંબન તરીકે ઉલ્લેખિત છે.

ન્યૂનતમ ફંક્શનના અસ્તિત્વ માટે જરૂરી શરત એ છે કે અજાણ્યા ચલોના સંદર્ભમાં તેના આંશિક ડેરિવેટિવ્સની શૂન્યની સમાનતા. પરિણામે, અમે સમીકરણોની નીચેની સિસ્ટમ મેળવીએ છીએ:

ચાલો પરિણામી સમીકરણોની રેખીય પ્રણાલીમાં પરિવર્તન કરીએ.

અમે રેખીય સમીકરણોની પરિણામી સિસ્ટમ હલ કરીએ છીએ. વિશ્લેષણાત્મક સ્વરૂપમાં અંદાજિત કાર્યના ગુણાંક નીચે પ્રમાણે નક્કી કરવામાં આવે છે (ક્રેમરની પદ્ધતિ):

આ ગુણાંકો આપેલ ટેબ્યુલર મૂલ્યો (પ્રાયોગિક ડેટા) માંથી અંદાજિત કાર્યના ચોરસના સરવાળાને ઘટાડવાના માપદંડ અનુસાર રેખીય અંદાજિત કાર્યનું નિર્માણ સુનિશ્ચિત કરે છે.

ન્યૂનતમ ચોરસ પદ્ધતિના અમલ માટે અલ્ગોરિધમ

1. પ્રારંભિક ડેટા:

N ની સંખ્યા સાથે પ્રાયોગિક ડેટાની શ્રેણીનો ઉલ્લેખ કરવામાં આવ્યો છે

અંદાજિત બહુપદી (m) ની ડિગ્રી ઉલ્લેખિત છે

2. ગણતરી અલ્ગોરિધમ:

2.1. પરિમાણો સાથેના સમીકરણોની સિસ્ટમ બનાવવા માટે ગુણાંક નક્કી કરવામાં આવે છે

સમીકરણોની સિસ્ટમના ગુણાંક ( ડાબી બાજુસમીકરણો)

- સમીકરણોની સિસ્ટમના ચોરસ મેટ્રિક્સના કૉલમ નંબરની અનુક્રમણિકા

રેખીય સમીકરણોની સિસ્ટમની મફત શરતો ( જમણો ભાગસમીકરણો)

- સમીકરણોની સિસ્ટમના ચોરસ મેટ્રિક્સની પંક્તિ સંખ્યાની અનુક્રમણિકા

2.2. પરિમાણ સાથે રેખીય સમીકરણોની સિસ્ટમની રચના.

2.3. ડિગ્રી m ના અંદાજિત બહુપદીના અજાણ્યા ગુણાંક નક્કી કરવા માટે રેખીય સમીકરણોની સિસ્ટમ ઉકેલવી.

2.4. તમામ નોડલ બિંદુઓ પરના મૂળ મૂલ્યોમાંથી અંદાજિત બહુપદીના વર્ગના વિચલનોના સરવાળાનું નિર્ધારણ

ચોરસ વિચલનોના સરવાળાનું મળેલ મૂલ્ય એ ન્યૂનતમ શક્ય છે.

અન્ય કાર્યોનો ઉપયોગ કરીને અંદાજ

એ નોંધવું જોઈએ કે જ્યારે ન્યૂનતમ ચોરસ પદ્ધતિ અનુસાર અંદાજિત સ્ત્રોત ડેટાનો ઉપયોગ કરવામાં આવે છે, ત્યારે લઘુગણક કાર્યનો ઉપયોગ કેટલીકવાર અંદાજિત કાર્ય તરીકે થાય છે, ઘાતાંકીય કાર્યઅને પાવર ફંક્શન.

લઘુગણક અંદાજ

ચાલો કેસને ધ્યાનમાં લઈએ જ્યારે અંદાજિત કાર્ય ફોર્મના લઘુગણક કાર્ય દ્વારા આપવામાં આવે છે:

ઓછામાં ઓછા ચોરસ પદ્ધતિનો સાર છે સમય અથવા અવકાશમાં કોઈપણ અવ્યવસ્થિત ઘટનાના વિકાસના વલણને શ્રેષ્ઠ રીતે વર્ણવતા વલણ મોડેલના પરિમાણો શોધવામાં (એક વલણ એ એક રેખા છે જે આ વિકાસના વલણને દર્શાવે છે). ન્યૂનતમ સ્ક્વેર મેથડ (LSM)નું કાર્ય માત્ર અમુક ટ્રેન્ડ મોડલ શોધવાનું જ નહીં, પણ શ્રેષ્ઠ અથવા શ્રેષ્ઠ મોડલ શોધવાનું છે. જો અવલોકન કરેલ વાસ્તવિક મૂલ્યો અને અનુરૂપ ગણતરી કરેલ વલણ મૂલ્યો વચ્ચેના ચોરસ વિચલનોનો સરવાળો ન્યૂનતમ (સૌથી નાનો) હોય તો આ મોડેલ શ્રેષ્ઠ રહેશે:

ક્યાં - પ્રમાણભૂત વિચલનઅવલોકન કરેલ વાસ્તવિક મૂલ્ય વચ્ચે

અને અનુરૂપ ગણતરી કરેલ વલણ મૂલ્ય,

જે ઘટનાનો અભ્યાસ કરવામાં આવી રહ્યો છે તેનું વાસ્તવિક (અવલોકન કરેલ) મૂલ્ય,

ટ્રેન્ડ મોડલનું ગણતરી કરેલ મૂલ્ય,

અભ્યાસ કરવામાં આવી રહેલી ઘટનાના અવલોકનોની સંખ્યા.

MNCનો ઉપયોગ તેના પોતાના પર ભાગ્યે જ થાય છે. એક નિયમ તરીકે, મોટેભાગે તેનો ઉપયોગ સહસંબંધ અભ્યાસમાં આવશ્યક તકનીકી તકનીક તરીકે થાય છે. એ યાદ રાખવું જોઈએ કે MNCની માહિતીનો આધાર જ વિશ્વસનીય હોઈ શકે છે આંકડાકીય શ્રેણી, અને અવલોકનોની સંખ્યા 4 કરતા ઓછી ન હોવી જોઈએ, અન્યથા OLS સ્મૂથિંગ પ્રક્રિયાઓ સામાન્ય સમજ ગુમાવી શકે છે.

MNC ટૂલકીટ નીચેની પ્રક્રિયાઓ માટે ઉકળે છે:

પ્રથમ પ્રક્રિયા. તે તારણ આપે છે કે જ્યારે પસંદ કરેલ પરિબળ-દલીલ બદલાય છે ત્યારે પરિણામી એટ્રિબ્યુટને બદલવાની કોઈ વૃત્તિ છે કે કેમ, અથવા બીજા શબ્દોમાં કહીએ તો, " વચ્ચે કોઈ જોડાણ છે? ખાતે "અને" એક્સ ».

બીજી પ્રક્રિયા. તે નિર્ધારિત કરવામાં આવે છે કે કઈ રેખા (પ્રવાહ) આ વલણનું શ્રેષ્ઠ વર્ણન અથવા લાક્ષણિકતા કરી શકે છે.

ત્રીજી પ્રક્રિયા.

ઉદાહરણ. ચાલો કહીએ કે અમારી પાસે અભ્યાસ હેઠળના ખેતર માટે સરેરાશ સૂર્યમુખી ઉપજ વિશે માહિતી છે (કોષ્ટક 9.1).

કોષ્ટક 9.1

અવલોકન નંબર

ઉત્પાદકતા, c/ha

છેલ્લા 10 વર્ષોમાં આપણા દેશમાં સૂર્યમુખીના ઉત્પાદનમાં ટેકનોલોજીનું સ્તર વર્ચ્યુઅલ રીતે યથાવત રહ્યું હોવાથી, તેનો અર્થ એ છે કે, દેખીતી રીતે, વિશ્લેષણના સમયગાળા દરમિયાન ઉપજમાં વધઘટ હવામાન અને આબોહવાની પરિસ્થિતિઓમાં થતી વધઘટ પર ખૂબ નિર્ભર હતી. શું આ ખરેખર સાચું છે?

પ્રથમ OLS પ્રક્રિયા. વિશ્લેષિત 10 વર્ષમાં હવામાન અને આબોહવાની પરિસ્થિતિઓમાં ફેરફારને આધારે સૂર્યમુખીની ઉપજમાં વલણના અસ્તિત્વ વિશેની પૂર્વધારણાનું પરીક્ષણ કરવામાં આવ્યું છે.

આ ઉદાહરણમાં, માટે " y "સૂર્યમુખીની ઉપજ લેવાની સલાહ આપવામાં આવે છે, અને માટે" x » – વિશ્લેષણ કરેલ સમયગાળામાં અવલોકન કરેલ વર્ષની સંખ્યા. વચ્ચેના કોઈપણ સંબંધના અસ્તિત્વ વિશેની પૂર્વધારણાનું પરીક્ષણ x "અને" y "બે રીતે કરી શકાય છે: મેન્યુઅલી અને કમ્પ્યુટર પ્રોગ્રામ્સનો ઉપયોગ કરીને. અલબત્ત, જો ઉપલબ્ધ હોય કમ્પ્યુટર સાધનોઆ સમસ્યા પોતે જ ઉકેલે છે. પરંતુ MNC ટૂલ્સને વધુ સારી રીતે સમજવા માટે, " વચ્ચેના સંબંધના અસ્તિત્વ વિશેની પૂર્વધારણાને ચકાસવાની સલાહ આપવામાં આવે છે. x "અને" y » મેન્યુઅલી, જ્યારે માત્ર એક પેન અને સામાન્ય કેલ્ક્યુલેટર હાથમાં હોય. આવા કિસ્સાઓમાં, વલણના અસ્તિત્વ વિશેની પૂર્વધારણાને ગતિશીલતાની વિશ્લેષિત શ્રેણીની ગ્રાફિકલ છબીના સ્થાન દ્વારા દૃષ્ટિની રીતે શ્રેષ્ઠ રીતે તપાસવામાં આવે છે - સહસંબંધ ક્ષેત્ર:

અમારા ઉદાહરણમાં સહસંબંધ ક્ષેત્ર ધીમે ધીમે વધતી રેખાની આસપાસ સ્થિત છે. આ પોતે સૂર્યમુખી ઉપજમાં ફેરફારોમાં ચોક્કસ વલણનું અસ્તિત્વ સૂચવે છે. કોઈપણ વલણની હાજરી વિશે વાત કરવી ત્યારે જ અશક્ય છે જ્યારે સહસંબંધ ક્ષેત્ર વર્તુળ, વર્તુળ, સખત રીતે વર્ટિકલ અથવા સખત રીતે આડા વાદળ જેવું લાગે અથવા અસ્તવ્યસ્ત રીતે છૂટાછવાયા બિંદુઓથી બનેલું હોય. અન્ય તમામ કિસ્સાઓમાં, " વચ્ચેના સંબંધના અસ્તિત્વ વિશેની પૂર્વધારણા x "અને" y ", અને સંશોધન ચાલુ રાખો.

બીજી OLS પ્રક્રિયા. તે નિર્ધારિત કરવામાં આવે છે કે કઈ રેખા (પ્રવાહ) વિશ્લેષણના સમયગાળા દરમિયાન સૂર્યમુખીની ઉપજમાં ફેરફારના વલણનું શ્રેષ્ઠ વર્ણન અથવા લાક્ષણિકતા કરી શકે છે.

જો તમારી પાસે કોમ્પ્યુટર ટેકનોલોજી છે, તો શ્રેષ્ઠ વલણની પસંદગી આપમેળે થાય છે. મેન્યુઅલી પ્રક્રિયા કરતી વખતે, પસંદગી શ્રેષ્ઠ કાર્યહાથ ધરવામાં આવે છે, એક નિયમ તરીકે, દૃષ્ટિની - સહસંબંધ ક્ષેત્રના સ્થાન દ્વારા. એટલે કે, ગ્રાફના પ્રકારને આધારે, પ્રયોગમૂલક વલણ (વાસ્તવિક માર્ગ) સાથે શ્રેષ્ઠ રીતે બંધબેસતી રેખાનું સમીકરણ પસંદ કરવામાં આવે છે.

જેમ જાણીતું છે, પ્રકૃતિમાં કાર્યાત્મક અવલંબનની વિશાળ વિવિધતા છે, તેથી તેમાંથી નાના ભાગનું પણ દૃષ્ટિની રીતે વિશ્લેષણ કરવું અત્યંત મુશ્કેલ છે. સદભાગ્યે, વાસ્તવિક આર્થિક વ્યવહારમાં, મોટાભાગના સંબંધોનું વર્ણન પેરાબોલા, અથવા હાઇપરબોલા અથવા સીધી રેખા દ્વારા તદ્દન ચોક્કસ રીતે કરી શકાય છે. આ સંદર્ભમાં, શ્રેષ્ઠ કાર્ય પસંદ કરવાના "મેન્યુઅલ" વિકલ્પ સાથે, તમે તમારી જાતને ફક્ત આ ત્રણ મોડલ્સ સુધી મર્યાદિત કરી શકો છો.

હાયપરબોલા:

સેકન્ડ ઓર્ડર પેરાબોલા: :

તે જોવાનું સરળ છે કે અમારા ઉદાહરણમાં, વિશ્લેષણ કરાયેલા 10 વર્ષોમાં સૂર્યમુખી ઉપજમાં ફેરફારનું વલણ સીધી રેખા દ્વારા શ્રેષ્ઠ રીતે દર્શાવવામાં આવે છે, તેથી રીગ્રેસન સમીકરણ સીધી રેખાનું સમીકરણ હશે.

ત્રીજી પ્રક્રિયા. પરિમાણોની ગણતરી કરવામાં આવે છે રીગ્રેસન સમીકરણઆપેલ લીટીનું લક્ષણ, અથવા બીજા શબ્દોમાં કહીએ તો, એક વિશ્લેષણાત્મક સૂત્ર નક્કી કરવામાં આવે છે જે વર્ણવે છે શ્રેષ્ઠ મોડેલવલણ.

રીગ્રેસન સમીકરણના પરિમાણોની કિંમતો શોધવી, અમારા કિસ્સામાં પરિમાણો અને , OLS નો મુખ્ય ભાગ છે. આ પ્રક્રિયા સામાન્ય સમીકરણોની સિસ્ટમને ઉકેલવા માટે નીચે આવે છે.

(9.2)

સમીકરણોની આ પદ્ધતિ ગૌસ પદ્ધતિ દ્વારા તદ્દન સરળતાથી ઉકેલી શકાય છે. ચાલો યાદ કરીએ કે ઉકેલના પરિણામે, અમારા ઉદાહરણમાં, પરિમાણોના મૂલ્યો અને જોવા મળે છે. આમ, મળેલ રીગ્રેસન સમીકરણનું નીચેનું સ્વરૂપ હશે:

તેમાં ઘણી એપ્લિકેશનો છે, કારણ કે તે અન્ય સરળ લોકો દ્વારા આપેલ કાર્યની અંદાજિત રજૂઆતને મંજૂરી આપે છે. LSM અવલોકનોની પ્રક્રિયામાં અત્યંત ઉપયોગી થઈ શકે છે, અને તેનો ઉપયોગ રેન્ડમ ભૂલો ધરાવતા અન્યના માપના પરિણામોના આધારે અમુક માત્રાનો અંદાજ કાઢવા સક્રિયપણે થાય છે. આ લેખમાં, તમે એક્સેલમાં ઓછામાં ઓછા ચોરસ ગણતરીઓ કેવી રીતે અમલમાં મૂકવી તે શીખીશું.

વિશિષ્ટ ઉદાહરણનો ઉપયોગ કરીને સમસ્યાનું નિવેદન

ધારો કે બે સૂચકાંકો X અને Y છે. વધુમાં, Y X પર આધાર રાખે છે. કારણ કે OLS અમને રીગ્રેસન વિશ્લેષણના દૃષ્ટિકોણથી રસ લે છે (એક્સેલમાં તેની પદ્ધતિઓ બિલ્ટ-ઇન ફંક્શન્સનો ઉપયોગ કરીને અમલમાં મૂકવામાં આવે છે), આપણે તરત જ વિચારણા તરફ આગળ વધવું જોઈએ. ચોક્કસ સમસ્યા.

તેથી, X એ કરિયાણાની દુકાનની છૂટક જગ્યા છે, જે ચોરસ મીટરમાં માપવામાં આવે છે, અને Y એ વાર્ષિક ટર્નઓવર છે, જે લાખો રુબેલ્સમાં માપવામાં આવે છે.

જો સ્ટોર પાસે આ અથવા તે છૂટક જગ્યા હોય તો તેનું ટર્નઓવર (Y) શું હશે તેની આગાહી કરવી જરૂરી છે. દેખીતી રીતે, કાર્ય Y = f (X) વધી રહ્યું છે, કારણ કે હાઇપરમાર્કેટ સ્ટોલ કરતાં વધુ માલ વેચે છે.

આગાહી માટે ઉપયોગમાં લેવાતા પ્રારંભિક ડેટાની શુદ્ધતા વિશે થોડાક શબ્દો

ચાલો કહીએ કે અમારી પાસે n સ્ટોર્સ માટે ડેટાનો ઉપયોગ કરીને એક ટેબલ બનાવવામાં આવ્યું છે.

અનુસાર ગાણિતિક આંકડા, જો ઓછામાં ઓછા 5-6 ઑબ્જેક્ટ્સ પરના ડેટાની તપાસ કરવામાં આવે તો પરિણામો વધુ કે ઓછા સાચા હશે. વધુમાં, "અસંગત" પરિણામોનો ઉપયોગ કરી શકાતો નથી. ખાસ કરીને, એક ચુનંદા નાના બુટિકનું ટર્નઓવર હોઈ શકે છે જે "માસમાર્કેટ" વર્ગના મોટા રિટેલ આઉટલેટ્સના ટર્નઓવર કરતાં અનેક ગણું વધારે છે.

પદ્ધતિનો સાર

કોષ્ટક ડેટાને કાર્ટેશિયન પ્લેન પર પોઈન્ટ M 1 (x 1, y 1), ... M n (x n, y n) ના સ્વરૂપમાં દર્શાવી શકાય છે. હવે સમસ્યાનો ઉકેલ અંદાજિત કાર્ય y = f (x) ની પસંદગીમાં ઘટાડી દેવામાં આવશે, જે બિંદુ M 1, M 2, .. M n ની શક્ય તેટલી નજીકથી પસાર થતો ગ્રાફ ધરાવે છે.

અલબત્ત, તમે ઉચ્ચ-ડિગ્રી બહુપદીનો ઉપયોગ કરી શકો છો, પરંતુ આ વિકલ્પ અમલમાં મૂકવો માત્ર મુશ્કેલ નથી, પણ ફક્ત ખોટો પણ છે, કારણ કે તે મુખ્ય વલણને પ્રતિબિંબિત કરશે નહીં જેને શોધવાની જરૂર છે. સૌથી વાજબી ઉકેલ એ સીધી રેખા y = ax + b શોધવાનું છે, જે પ્રાયોગિક ડેટાનું શ્રેષ્ઠ અનુમાન કરે છે, અથવા વધુ સ્પષ્ટ રીતે, a અને b ના સહગુણાંકો.

ચોકસાઈનું મૂલ્યાંકન

કોઈપણ અંદાજ સાથે, તેની ચોકસાઈનું મૂલ્યાંકન કરવાનું વિશેષ મહત્વ છે. ચાલો બિંદુ x i, એટલે કે e i = y i - f (x i) માટે કાર્યાત્મક અને પ્રાયોગિક મૂલ્યો વચ્ચેનો તફાવત (વિચલન) e i દ્વારા દર્શાવીએ.

દેખીતી રીતે, અંદાજની ચોકસાઈનું મૂલ્યાંકન કરવા માટે, તમે વિચલનોના સરવાળાનો ઉપયોગ કરી શકો છો, એટલે કે, X ની Y પર નિર્ભરતાની અંદાજિત રજૂઆત માટે સીધી રેખા પસંદ કરતી વખતે, તમારે તેને પ્રાધાન્ય આપવાની જરૂર છે સૌથી નાનું મૂલ્યસરવાળો અને i તમામ ગણવામાં આવે છે. જો કે, બધું એટલું સરળ નથી, કારણ કે સકારાત્મક વિચલનો સાથે નકારાત્મક પણ હશે.

વિચલન મોડ્યુલો અથવા તેમના ચોરસનો ઉપયોગ કરીને સમસ્યા ઉકેલી શકાય છે. છેલ્લી પદ્ધતિ સૌથી વધુ ઉપયોગમાં લેવાય છે. તેનો ઉપયોગ રીગ્રેશન એનાલિસિસ (બે બિલ્ટ-ઇન ફંક્શનનો ઉપયોગ કરીને એક્સેલમાં અમલીકરણ) સહિત ઘણા ક્ષેત્રોમાં થાય છે અને લાંબા સમયથી તેની અસરકારકતા સાબિત કરી છે.

ઓછામાં ઓછી ચોરસ પદ્ધતિ

એક્સેલ, જેમ તમે જાણો છો, તેમાં બિલ્ટ-ઇન ઓટોસમ ફંક્શન છે જે તમને પસંદ કરેલ શ્રેણીમાં સ્થિત તમામ મૂલ્યોના મૂલ્યોની ગણતરી કરવાની મંજૂરી આપે છે. આમ, અભિવ્યક્તિની કિંમત (e 1 2 + e 2 2 + e 3 2 + ... e n 2) ની ગણતરી કરવામાં આપણને કશું રોકશે નહીં.

IN ગાણિતિક સંકેતતે આના જેવું લાગે છે:

નિર્ણય શરૂઆતમાં સીધી રેખાનો ઉપયોગ કરીને અંદાજે લેવામાં આવ્યો હોવાથી, અમારી પાસે છે:

આમ, શ્રેષ્ઠ વર્ણન કરતી રેખા શોધવાનું કાર્ય ચોક્કસ અવલંબનજથ્થા X અને Y, બે ચલોના લઘુત્તમ કાર્યની ગણતરી કરવા માટે નીચે આવે છે:

આ કરવા માટે, તમારે નવા ચલ a અને b થી શૂન્યના સંદર્ભમાં આંશિક ડેરિવેટિવ્સને સમાન કરવાની જરૂર છે, અને ફોર્મના 2 અજ્ઞાત સાથે બે સમીકરણો ધરાવતી આદિમ પ્રણાલીને ઉકેલવાની જરૂર છે:

2 વડે ભાગાકાર અને રકમની હેરફેર સહિત કેટલાક સરળ પરિવર્તનો પછી, અમને મળે છે:

તેને હલ કરીને, ઉદાહરણ તરીકે, ક્રેમરની પદ્ધતિનો ઉપયોગ કરીને, અમે ચોક્કસ ગુણાંક a * અને b * સાથે સ્થિર બિંદુ મેળવીએ છીએ. આ ન્યૂનતમ છે, એટલે કે ચોક્કસ વિસ્તાર માટે સ્ટોરમાં શું ટર્નઓવર હશે તેની આગાહી કરવા માટે, સીધી રેખા y = a * x + b * યોગ્ય છે, જે પ્રશ્નમાંના ઉદાહરણ માટે રીગ્રેશન મોડલ છે. અલબત્ત, તે તમને ચોક્કસ પરિણામ શોધવાની મંજૂરી આપશે નહીં, પરંતુ તે તમને સ્ટોર ક્રેડિટ પર ચોક્કસ વિસ્તારની ખરીદી ચૂકવશે કે કેમ તે અંગેનો વિચાર મેળવવામાં મદદ કરશે.

Excel માં ઓછામાં ઓછા ચોરસ કેવી રીતે અમલમાં મૂકવું

એક્સેલમાં ઓછામાં ઓછા ચોરસનો ઉપયોગ કરીને મૂલ્યોની ગણતરી કરવા માટેનું કાર્ય છે. તેનું નીચેનું સ્વરૂપ છે: “TREND” (જાણીતા Y મૂલ્યો; જાણીતા X મૂલ્યો; નવા X મૂલ્યો; સતત). ચાલો આપણા ટેબલ પર Excel માં OLS ની ગણતરી માટે સૂત્ર લાગુ કરીએ.

આ કરવા માટે, સેલમાં "=" ચિહ્ન દાખલ કરો જેમાં Excel માં ઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને ગણતરીનું પરિણામ પ્રદર્શિત થવું જોઈએ અને "TREND" ફંક્શન પસંદ કરો. ખુલતી વિંડોમાં, યોગ્ય ફીલ્ડ્સ ભરો, હાઇલાઇટ કરો:

  • Y માટે જાણીતા મૂલ્યોની શ્રેણી (આ કિસ્સામાં, વેપાર ટર્નઓવર માટેનો ડેટા);
  • શ્રેણી x 1 , …x n , એટલે કે છૂટક જગ્યાનું કદ;
  • બંને પ્રખ્યાત અને અજાણ્યા મૂલ્યો x, જેના માટે તમારે ટર્નઓવરનું કદ શોધવાની જરૂર છે (વર્કશીટ પર તેમના સ્થાન વિશેની માહિતી માટે, નીચે જુઓ).

વધુમાં, સૂત્રમાં લોજિકલ ચલ "કોન્સ્ટ" શામેલ છે. જો તમે અનુરૂપ ફીલ્ડમાં 1 દાખલ કરો છો, તો તેનો અર્થ એ થશે કે તમારે ગણતરીઓ હાથ ધરવી જોઈએ, એમ ધારીને કે b = 0.

જો તમારે એક કરતાં વધુ x મૂલ્યની આગાહી શોધવાની જરૂર હોય, તો સૂત્ર દાખલ કર્યા પછી તમારે "Enter" દબાવવું જોઈએ નહીં, પરંતુ તમારે કીબોર્ડ પર "Shift" + "Control" + "Enter" સંયોજન ટાઇપ કરવાની જરૂર છે.

કેટલીક સુવિધાઓ

રીગ્રેશન વિશ્લેષણ ડમી માટે પણ સુલભ હોઈ શકે છે. અજ્ઞાત ચલોની શ્રેણીના મૂલ્યની આગાહી કરવા માટેનું એક્સેલ સૂત્ર-TREND-નો ઉપયોગ એવા લોકો પણ કરી શકે છે જેમણે ક્યારેય ઓછામાં ઓછા ચોરસ વિશે સાંભળ્યું નથી. તેના કાર્યની કેટલીક વિશેષતાઓ જાણવા માટે તે પૂરતું છે. વિશેષ રીતે:

  • જો તમે ચલ y ના જાણીતા મૂલ્યોની શ્રેણીને એક પંક્તિ અથવા કૉલમમાં ગોઠવો છો, તો દરેક પંક્તિ (કૉલમ) સાથે જાણીતા મૂલ્યો x ને પ્રોગ્રામ દ્વારા અલગ ચલ તરીકે ગણવામાં આવશે.
  • જો TREND વિન્ડો જાણીતી x સાથેની શ્રેણીને સૂચવતી નથી, તો પછી જો ફંક્શનનો ઉપયોગ તેમાં થાય છે એક્સેલ પ્રોગ્રામતેને પૂર્ણાંકો ધરાવતા એરે તરીકે ગણશે, જેની સંખ્યા ચલ y ના આપેલ મૂલ્યો સાથેની શ્રેણીને અનુરૂપ છે.
  • "અનુમાનિત" મૂલ્યોના એરેને આઉટપુટ કરવા માટે, વલણની ગણતરી કરવા માટેની અભિવ્યક્તિ એરે ફોર્મ્યુલા તરીકે દાખલ કરવી આવશ્યક છે.
  • જો x ની નવી કિંમતો ઉલ્લેખિત નથી, તો TREND ફંક્શન તેમને જાણીતા મૂલ્યોની સમાન ગણે છે. જો તેઓ ઉલ્લેખિત નથી, તો પછી એરે 1 દલીલ તરીકે લેવામાં આવે છે; 2; 3; 4;…, જે પહેલાથી જ ઉલ્લેખિત પરિમાણો y સાથેની શ્રેણી સાથે સુસંગત છે.
  • નવા x મૂલ્યો ધરાવતી શ્રેણીમાં આપેલ y મૂલ્યો ધરાવતી શ્રેણીની સમાન અથવા વધુ પંક્તિઓ અથવા કૉલમ્સ હોવા જોઈએ. બીજા શબ્દોમાં કહીએ તો, તે સ્વતંત્ર ચલો માટે પ્રમાણસર હોવું જોઈએ.
  • જાણીતા x મૂલ્યો સાથેની એરેમાં બહુવિધ ચલો હોઈ શકે છે. જો કે, જો આપણે ફક્ત એક વિશે વાત કરી રહ્યા છીએ, તો તે જરૂરી છે કે x અને y ના આપેલ મૂલ્યો સાથેની શ્રેણીઓ પ્રમાણસર હોવી જોઈએ. કેટલાક ચલોના કિસ્સામાં, આપેલ y મૂલ્યો સાથેની શ્રેણી એક કૉલમ અથવા એક પંક્તિમાં બંધબેસતી હોય તે જરૂરી છે.

PREDICTION કાર્ય

ઘણા કાર્યોનો ઉપયોગ કરીને અમલમાં મૂકાયેલ છે. તેમાંથી એકને "પ્રેડીકશન" કહેવામાં આવે છે. તે "TREND" જેવું જ છે, એટલે કે તે ઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને ગણતરીઓનું પરિણામ આપે છે. જો કે, માત્ર એક X માટે, જેના માટે Y નું મૂલ્ય અજ્ઞાત છે.

હવે તમે ડમીઝ માટે એક્સેલમાં સૂત્રો જાણો છો જે તમને રેખીય વલણ અનુસાર ચોક્કસ સૂચકના ભાવિ મૂલ્યની આગાહી કરવાની મંજૂરી આપે છે.

ઉદાહરણ.

ચલોના મૂલ્યો પર પ્રાયોગિક ડેટા એક્સઅને ખાતેકોષ્ટકમાં આપેલ છે.

તેમના સંરેખણના પરિણામે, કાર્ય પ્રાપ્ત થાય છે

ઉપયોગ કરીને ઓછામાં ઓછી ચોરસ પદ્ધતિ, રેખીય અવલંબન દ્વારા આ ડેટાને અંદાજિત કરો y=ax+b(પરિમાણો શોધો અને b). બે લીટીઓમાંથી કઈ વધુ સારી (ઓછામાં ઓછા ચોરસ પદ્ધતિના અર્થમાં) પ્રાયોગિક ડેટાને સંરેખિત કરે છે તે શોધો. એક ચિત્ર બનાવો.

ન્યૂનતમ ચોરસ પદ્ધતિ (LSM) નો સાર.

કાર્ય એ રેખીય અવલંબન ગુણાંક શોધવાનું છે કે જેના પર બે ચલોનું કાર્ય છે અને b સૌથી નાનું મૂલ્ય લે છે. એટલે કે આપેલ છે અને bમળેલી સીધી રેખામાંથી પ્રાયોગિક ડેટાના ચોરસ વિચલનોનો સરવાળો સૌથી નાનો હશે. આ ન્યૂનતમ ચોરસ પદ્ધતિનો આખો મુદ્દો છે.

આમ, ઉદાહરણને ઉકેલવાથી બે ચલોના કાર્યની સીમા શોધવા માટે નીચે આવે છે.

ગુણાંક શોધવા માટેના સૂત્રો મેળવતા.

બે અજ્ઞાત સાથેના બે સમીકરણોની સિસ્ટમ સંકલિત અને હલ કરવામાં આવે છે. ફંક્શનના આંશિક ડેરિવેટિવ્ઝ શોધવા ચલો દ્વારા અને b, અમે આ ડેરિવેટિવ્ઝને શૂન્ય સાથે સરખાવીએ છીએ.

અમે કોઈપણ પદ્ધતિનો ઉપયોગ કરીને સમીકરણોની પરિણામી સિસ્ટમ હલ કરીએ છીએ (ઉદાહરણ તરીકે અવેજી પદ્ધતિ દ્વારાઅથવા ક્રેમરની પદ્ધતિ) અને ઓછામાં ઓછા ચોરસ પદ્ધતિ (LSM) નો ઉપયોગ કરીને ગુણાંક શોધવા માટે સૂત્રો મેળવો.

આપેલ અને bકાર્ય સૌથી નાનું મૂલ્ય લે છે. આ હકીકતનો પુરાવો આપવામાં આવ્યો છે પૃષ્ઠના અંતે ટેક્સ્ટમાં નીચે.

તે ઓછામાં ઓછા ચોરસની આખી પદ્ધતિ છે. પરિમાણ શોધવા માટેનું સૂત્ર aસરવાળો ,,, અને પરિમાણ સમાવે છે n- પ્રાયોગિક ડેટાનો જથ્થો. અમે આ રકમના મૂલ્યોની અલગથી ગણતરી કરવાની ભલામણ કરીએ છીએ. ગુણાંક bગણતરી બાદ મળી a.

મૂળ ઉદાહરણને યાદ કરવાનો સમય છે.

ઉકેલ.

અમારા ઉદાહરણમાં n=5. જરૂરી ગુણાંકના સૂત્રોમાં સમાવિષ્ટ રકમની ગણતરી કરવાની સગવડતા માટે અમે કોષ્ટક ભરીએ છીએ.

કોષ્ટકની ચોથી પંક્તિના મૂલ્યો 2જી પંક્તિના મૂલ્યોને દરેક સંખ્યા માટે 3જી પંક્તિના મૂલ્યો દ્વારા ગુણાકાર કરીને મેળવવામાં આવે છે. i.

કોષ્ટકની પાંચમી પંક્તિના મૂલ્યો દરેક સંખ્યા માટે 2જી પંક્તિમાંના મૂલ્યોને વર્ગીકરણ કરીને મેળવવામાં આવે છે. i.

કોષ્ટકની છેલ્લી કૉલમમાંના મૂલ્યો એ પંક્તિઓની આજુબાજુના મૂલ્યોનો સરવાળો છે.

ગુણાંક શોધવા માટે અમે ઓછામાં ઓછા ચોરસ પદ્ધતિના સૂત્રોનો ઉપયોગ કરીએ છીએ અને b. અમે કોષ્ટકના છેલ્લા કૉલમમાંથી અનુરૂપ મૂલ્યોને તેમાં બદલીએ છીએ:

આથી, y = 0.165x+2.184- ઇચ્છિત અંદાજિત સીધી રેખા.

તેમાંથી કઈ લીટીઓ છે તે શોધવાનું બાકી છે y = 0.165x+2.184અથવા મૂળ ડેટાનું વધુ સારી રીતે અનુમાન કરે છે, એટલે કે ઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને અંદાજ કાઢે છે.

ઓછામાં ઓછા ચોરસ પદ્ધતિના અંદાજમાં ભૂલ.

આ કરવા માટે, તમારે આ રેખાઓમાંથી મૂળ ડેટાના ચોરસ વિચલનોના સરવાળાની ગણતરી કરવાની જરૂર છે. અને , એક નાનું મૂલ્ય એ લાઇનને અનુરૂપ છે જે ઓછામાં ઓછા ચોરસ પદ્ધતિના અર્થમાં મૂળ ડેટાનું વધુ સારી રીતે અનુમાન કરે છે.

ત્યારથી, પછી સીધા y = 0.165x+2.184મૂળ ડેટાનું વધુ સારી રીતે અનુમાન કરે છે.

ઓછામાં ઓછા ચોરસ (LS) પદ્ધતિનું ગ્રાફિક ચિત્ર.

આલેખ પર બધું સ્પષ્ટ દેખાય છે. લાલ રેખા એ મળેલી સીધી રેખા છે y = 0.165x+2.184, વાદળી રેખા છે , ગુલાબી બિંદુઓ મૂળ ડેટા છે.

વ્યવહારમાં, વિવિધ પ્રક્રિયાઓનું મોડેલિંગ કરતી વખતે - ખાસ કરીને, આર્થિક, ભૌતિક, તકનીકી, સામાજિક - ચોક્કસ નિશ્ચિત બિંદુઓ પર તેમના જાણીતા મૂલ્યોમાંથી કાર્યોના અંદાજિત મૂલ્યોની ગણતરી કરવાની એક અથવા બીજી પદ્ધતિનો વ્યાપકપણે ઉપયોગ થાય છે.

આ પ્રકારની કાર્ય અંદાજીત સમસ્યા વારંવાર ઊભી થાય છે:

    પ્રયોગના પરિણામે મેળવેલા ટેબ્યુલર ડેટાનો ઉપયોગ કરીને અભ્યાસ હેઠળની પ્રક્રિયાના લાક્ષણિક જથ્થાના મૂલ્યોની ગણતરી માટે અંદાજિત સૂત્રોનું નિર્માણ કરતી વખતે;

    સંખ્યાત્મક એકીકરણ, ભિન્નતા, ઉકેલમાં વિભેદક સમીકરણોવગેરે;

    જો જરૂરી હોય તો, માનવામાં આવેલા અંતરાલના મધ્યવર્તી બિંદુઓ પર કાર્યોના મૂલ્યોની ગણતરી કરો;

    જ્યારે ગણવામાં અંતરાલની બહાર પ્રક્રિયાના લાક્ષણિક જથ્થાના મૂલ્યો નક્કી કરવામાં આવે છે, ખાસ કરીને જ્યારે આગાહી કરવામાં આવે છે.

જો, કોષ્ટક દ્વારા નિર્દિષ્ટ કરેલ ચોક્કસ પ્રક્રિયાનું મોડેલ બનાવવા માટે, અમે ઓછામાં ઓછા ચોરસ પદ્ધતિના આધારે આ પ્રક્રિયાનું અંદાજે વર્ણન કરતા ફંક્શનનું નિર્માણ કરીએ છીએ, તો તેને અંદાજિત કાર્ય (રીગ્રેસન) કહેવામાં આવશે, અને અંદાજિત ફંક્શન્સનું નિર્માણ કરવાનું કાર્ય કહેવામાં આવશે. એક અંદાજ સમસ્યા.

આ લેખ આ પ્રકારની સમસ્યાને ઉકેલવા માટે MS Excel પેકેજની ક્ષમતાઓની ચર્ચા કરે છે, વધુમાં, તે ટેબ્યુલેટેડ કાર્યો (જે રીગ્રેસન વિશ્લેષણનો આધાર છે) માટે રીગ્રેસન બનાવવા (બનાવવા) માટેની પદ્ધતિઓ અને તકનીકો પ્રદાન કરે છે.

એક્સેલ પાસે રીગ્રેશન બનાવવા માટેના બે વિકલ્પો છે.

    પસંદ કરેલ રીગ્રેશન ઉમેરી રહ્યા છે ( વલણ રેખાઓ- ટ્રેન્ડલાઇન્સ) અભ્યાસ હેઠળની પ્રક્રિયાની લાક્ષણિકતા માટે ડેટા ટેબલના આધારે બનાવેલ આકૃતિમાં (જો બાંધવામાં આવેલ ડાયાગ્રામ હોય તો જ ઉપલબ્ધ છે);

    એક્સેલ વર્કશીટના બિલ્ટ-ઇન આંકડાકીય કાર્યોનો ઉપયોગ કરીને, તમને સ્રોત ડેટા કોષ્ટકમાંથી સીધા જ રીગ્રેશન્સ (ટ્રેન્ડ લાઇન્સ) મેળવવાની મંજૂરી આપે છે.

ચાર્ટમાં વલણ રેખાઓ ઉમેરી રહ્યા છીએ

ડેટાના કોષ્ટક માટે કે જે પ્રક્રિયાનું વર્ણન કરે છે અને ડાયાગ્રામ દ્વારા દર્શાવવામાં આવે છે, એક્સેલ પાસે અસરકારક રીગ્રેસન વિશ્લેષણ સાધન છે જે તમને આની મંજૂરી આપે છે:

    ઓછામાં ઓછા ચોરસ પદ્ધતિના આધારે બનાવો અને ડાયાગ્રામમાં પાંચ પ્રકારના રીગ્રેશન ઉમેરો, જે અભ્યાસ હેઠળની પ્રક્રિયાને ચોકસાઈની વિવિધ ડિગ્રી સાથે મોડેલ કરે છે;

    આકૃતિમાં રચાયેલ રીગ્રેસન સમીકરણ ઉમેરો;

    ચાર્ટ પર પ્રદર્શિત ડેટા માટે પસંદ કરેલ રીગ્રેશનના પત્રવ્યવહારની ડિગ્રી નક્કી કરો.

ચાર્ટ ડેટાના આધારે, એક્સેલ તમને રેખીય, બહુપદી, લઘુગણક, પાવર, ઘાતાંકીય પ્રકારના રીગ્રેસન મેળવવાની મંજૂરી આપે છે, જે સમીકરણ દ્વારા નિર્દિષ્ટ છે:

y = y(x)

જ્યાં x એ એક સ્વતંત્ર ચલ છે જે ઘણીવાર કુદરતી સંખ્યાઓના ક્રમ (1; 2; 3; ...) ના મૂલ્યો લે છે અને ઉત્પન્ન કરે છે, ઉદાહરણ તરીકે, અભ્યાસ હેઠળની પ્રક્રિયાના સમયની ગણતરી (લાક્ષણિકતાઓ).

1 . લીનિયર રીગ્રેશન મોડેલિંગ લાક્ષણિકતાઓ માટે સારું છે જેના મૂલ્યો સતત દરે વધે છે અથવા ઘટે છે. અભ્યાસ હેઠળની પ્રક્રિયા માટે આ સૌથી સરળ મોડલ છે. તે સમીકરણ અનુસાર બનાવવામાં આવે છે:

y = mx + b

જ્યાં m એ ઝોકના ખૂણાની સ્પર્શક છે રેખીય રીગ્રેસન abscissa અક્ષ માટે; b - ઓર્ડિનેટ અક્ષ સાથે રેખીય રીગ્રેશનના આંતરછેદના બિંદુનું સંકલન.

2 . બહુપદી વલણ રેખા એવી લાક્ષણિકતાઓનું વર્ણન કરવા માટે ઉપયોગી છે કે જેમાં ઘણી અલગ ચરમસીમાઓ (મેક્સિમા અને મિનિમા) હોય છે. બહુપદી ડિગ્રીની પસંદગી અભ્યાસ કરવામાં આવી રહેલી લાક્ષણિકતાના અંતિમ ભાગની સંખ્યા દ્વારા નક્કી કરવામાં આવે છે. આમ, સેકન્ડ-ડિગ્રી બહુપદી એવી પ્રક્રિયાને સારી રીતે વર્ણવી શકે છે જેમાં માત્ર એક મહત્તમ અથવા લઘુત્તમ હોય છે; ત્રીજી ડિગ્રીનું બહુપદી - બે કરતાં વધુ અંતિમ નથી; ચોથી ડિગ્રીનો બહુપદી - ત્રણ કરતાં વધુ અંતિમો નહીં, વગેરે.

આ કિસ્સામાં, વલણ રેખા સમીકરણ અનુસાર બનાવવામાં આવી છે:

y = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

જ્યાં સહગુણાંકો c0, c1, c2,... c6 એ સ્થિરાંકો છે જેની કિંમતો બાંધકામ દરમિયાન નક્કી થાય છે.

3 . લૉગરિધમિક ટ્રેન્ડ લાઇનનો સફળતાપૂર્વક ઉપયોગ કરવામાં આવે છે જ્યારે મોડેલિંગ લાક્ષણિકતાઓ કે જેના મૂલ્યો શરૂઆતમાં ઝડપથી બદલાય છે અને પછી ધીમે ધીમે સ્થિર થાય છે.

y = c ln(x) + b

4 . જો અભ્યાસ હેઠળના સંબંધોના મૂલ્યો વૃદ્ધિ દરમાં સતત ફેરફાર દ્વારા દર્શાવવામાં આવે તો પાવર-લો ટ્રેન્ડ લાઇન સારા પરિણામો આપે છે. આવી અવલંબનનું ઉદાહરણ એ કારની એકસરખી પ્રવેગિત ગતિનો ગ્રાફ છે. જો ડેટામાં શૂન્ય અથવા નકારાત્મક મૂલ્યો હોય, તો તમે પાવર ટ્રેન્ડ લાઇનનો ઉપયોગ કરી શકતા નથી.

સમીકરણ અનુસાર બાંધવામાં આવે છે:

y = c xb

જ્યાં સહગુણાંકો b, c સ્થિર છે.

5 . જ્યારે ડેટામાં ફેરફારનો દર સતત વધી રહ્યો હોય ત્યારે ઘાતાંકીય વલણ રેખાનો ઉપયોગ કરવો જોઈએ. શૂન્ય અથવા નકારાત્મક મૂલ્યો ધરાવતા ડેટા માટે, આ પ્રકારનો અંદાજ પણ લાગુ પડતો નથી.

સમીકરણ અનુસાર બાંધવામાં આવે છે:

y = c ebx

જ્યાં સહગુણાંકો b, c સ્થિર છે.

ટ્રેન્ડ લાઇન પસંદ કરતી વખતે, એક્સેલ આપમેળે R2 ની કિંમતની ગણતરી કરે છે, જે અંદાજની વિશ્વસનીયતા દર્શાવે છે: કરતાં નજીકનું મૂલ્યએકતા માટે R2, વધુ વિશ્વસનીય રીતે વલણ રેખા અભ્યાસ હેઠળની પ્રક્રિયાને અનુમાનિત કરે છે. જો જરૂરી હોય તો, R2 મૂલ્ય હંમેશા ચાર્ટ પર પ્રદર્શિત કરી શકાય છે.

સૂત્ર દ્વારા નિર્ધારિત:

ડેટા શ્રેણીમાં વલણ રેખા ઉમેરવા માટે:

    ડેટાની શ્રેણીના આધારે ચાર્ટ સક્રિય કરો, એટલે કે ચાર્ટ વિસ્તારની અંદર ક્લિક કરો. ડાયાગ્રામ આઇટમ મુખ્ય મેનુમાં દેખાશે;

    આ આઇટમ પર ક્લિક કર્યા પછી, સ્ક્રીન પર એક મેનુ દેખાશે જેમાં તમારે એડ ટ્રેન્ડ લાઇન આદેશ પસંદ કરવો જોઈએ.

સમાન ક્રિયાઓ ડેટા શ્રેણીમાંથી એકને અનુરૂપ ગ્રાફ પર માઉસ પોઇન્ટરને ખસેડીને અને જમણું-ક્લિક કરીને સરળતાથી અમલમાં મૂકી શકાય છે; દેખાતા સંદર્ભ મેનૂમાં, ટ્રેન્ડ લાઇન ઉમેરો આદેશ પસંદ કરો. ટ્રેન્ડલાઈન ડાયલોગ બોક્સ સ્ક્રીન પર ટાઈપ ટેબ સાથે દેખાશે (ફિગ. 1).

આ પછી તમારે જરૂર છે:

પ્રકાર ટેબ પર જરૂરી ટ્રેન્ડ લાઇન પ્રકાર પસંદ કરો (રેખીય પ્રકાર મૂળભૂત રીતે પસંદ થયેલ છે). બહુપદી પ્રકાર માટે, ડિગ્રી ક્ષેત્રમાં, પસંદ કરેલ બહુપદીની ડિગ્રી સ્પષ્ટ કરો.

1 . બિલ્ટ ઓન સીરીઝ ફીલ્ડ પ્રશ્નમાં રહેલા ચાર્ટમાં તમામ ડેટા સીરીઝની યાદી આપે છે. ચોક્કસ ડેટા સીરીઝમાં ટ્રેન્ડ લાઇન ઉમેરવા માટે, બિલ્ટ ઓન સીરીઝ ફીલ્ડમાં તેનું નામ પસંદ કરો.

જો જરૂરી હોય તો, પેરામીટર્સ ટેબ (ફિગ. 2) પર જઈને, તમે ટ્રેન્ડ લાઇન માટે નીચેના પરિમાણો સેટ કરી શકો છો:

    અંદાજિત (સરળ) વળાંક ક્ષેત્રના નામમાં વલણ રેખાનું નામ બદલો.

    ફોરકાસ્ટ ફીલ્ડમાં આગાહી માટે સમયગાળાની સંખ્યા (આગળ અથવા પાછળ) સેટ કરો;

    ડાયાગ્રામ એરિયામાં ટ્રેન્ડ લાઇનનું સમીકરણ પ્રદર્શિત કરો, જેના માટે તમારે ડાયાગ્રામ ચેકબોક્સ પર શો સમીકરણ સક્ષમ કરવું જોઈએ;

    ડાયાગ્રામ વિસ્તારમાં અંદાજિત વિશ્વસનીયતા મૂલ્ય R2 પ્રદર્શિત કરો, જેના માટે તમારે ડાયાગ્રામ (R^2) ચેકબોક્સ પર અંદાજિત વિશ્વસનીયતા મૂલ્ય મૂકોને સક્ષમ કરવું જોઈએ;

    Y અક્ષ સાથે વલણ રેખાના આંતરછેદ બિંદુને સેટ કરો, જેના માટે તમારે એક બિંદુ પર Y અક્ષ સાથે વળાંકના આંતરછેદ માટે ચેકબોક્સને સક્ષમ કરવું જોઈએ;

    ડાયલોગ બોક્સ બંધ કરવા માટે OK બટન પર ક્લિક કરો.

પહેલેથી દોરેલી ટ્રેન્ડ લાઇનને સંપાદિત કરવાનું શરૂ કરવા માટે, ત્યાં ત્રણ રીતો છે:

    ફોર્મેટ મેનૂમાંથી સિલેક્ટેડ ટ્રેન્ડ લાઇન કમાન્ડનો ઉપયોગ કરો, અગાઉ ટ્રેન્ડ લાઇન પસંદ કર્યા પછી;

    સંદર્ભ મેનૂમાંથી ફોર્મેટ ટ્રેન્ડ લાઇન આદેશ પસંદ કરો, જેને ટ્રેન્ડ લાઇન પર જમણું-ક્લિક કરીને બોલાવવામાં આવે છે;

    ટ્રેન્ડ લાઇન પર ડબલ ક્લિક કરો.

ટ્રેન્ડ લાઈન ફોર્મેટ ડાયલોગ બોક્સ સ્ક્રીન પર દેખાશે (ફિગ. 3), જેમાં ત્રણ ટેબ હશે: વ્યૂ, ટાઈપ, પેરામીટર્સ અને છેલ્લી બેની સામગ્રીઓ ટ્રેન્ડ લાઈન ડાયલોગ બોક્સ (ફિગ. 1) ની સમાન ટેબ સાથે સંપૂર્ણ રીતે મેળ ખાય છે. -2). વ્યુ ટેબ પર, તમે લાઇનનો પ્રકાર, તેનો રંગ અને જાડાઈ સેટ કરી શકો છો.

પહેલેથી દોરેલી ટ્રેન્ડ લાઇન કાઢી નાખવા માટે, કાઢી નાખવાની ટ્રેન્ડ લાઇન પસંદ કરો અને Delete કી દબાવો.

ગણવામાં આવતા રીગ્રેશન એનાલિસિસ ટૂલના ફાયદા છે:

    તેના માટે ડેટા ટેબલ બનાવ્યા વિના ચાર્ટ પર ટ્રેન્ડ લાઇન બનાવવાની સંબંધિત સરળતા;

    સૂચિત વલણ રેખાઓના પ્રકારોની એકદમ વિશાળ સૂચિ, અને આ સૂચિમાં સૌથી વધુ ઉપયોગમાં લેવાતા રીગ્રેસન પ્રકારોનો સમાવેશ થાય છે;

    મનસ્વી (સામાન્ય બુદ્ધિની મર્યાદામાં) દ્વારા અભ્યાસ હેઠળની પ્રક્રિયાના વર્તનની આગાહી કરવાની ક્ષમતા આગળ અને પાછળના પગલાઓની સંખ્યા;

    વિશ્લેષણાત્મક સ્વરૂપમાં વલણ રેખા સમીકરણ મેળવવાની ક્ષમતા;

    સંભાવના, જો જરૂરી હોય તો, અંદાજની વિશ્વસનીયતાનું મૂલ્યાંકન મેળવવાની.

ગેરફાયદામાં નીચેનાનો સમાવેશ થાય છે:

    ટ્રેન્ડ લાઇનનું બાંધકામ ફક્ત ત્યારે જ હાથ ધરવામાં આવે છે જો ડેટાની શ્રેણી પર કોઈ આકૃતિ બનાવવામાં આવી હોય;

    તેના માટે પ્રાપ્ત ટ્રેન્ડ લાઇન સમીકરણોના આધારે અભ્યાસ હેઠળની લાક્ષણિકતા માટે ડેટા શ્રેણી બનાવવાની પ્રક્રિયા કંઈક અંશે અવ્યવસ્થિત છે: આવશ્યક રીગ્રેશન સમીકરણો મૂળ ડેટા શ્રેણીના મૂલ્યોમાં દરેક ફેરફાર સાથે અપડેટ કરવામાં આવે છે, પરંતુ માત્ર ડાયાગ્રામ વિસ્તારની અંદર , જ્યારે ડેટા શ્રેણી, જૂના વલણ રેખા સમીકરણના આધારે જનરેટ થયેલ, યથાવત રહે છે;

    PivotChart રિપોર્ટ્સમાં, ચાર્ટ અથવા સંબંધિત PivotTable રિપોર્ટના દૃશ્યને બદલવાથી હાલની ટ્રેન્ડલાઈન સાચવવામાં આવતી નથી, એટલે કે તમે ટ્રેન્ડલાઈન દોરો તે પહેલાં અથવા અન્યથા PivotChart રિપોર્ટને ફોર્મેટ કરો તે પહેલાં, તમારે ખાતરી કરવી જોઈએ કે રિપોર્ટ લેઆઉટ જરૂરી જરૂરિયાતોને પૂર્ણ કરે છે.

ગ્રાફ, હિસ્ટોગ્રામ, ફ્લેટ નોન-સ્ટાન્ડર્ડ એરિયા ચાર્ટ, બાર ચાર્ટ, સ્કેટર ચાર્ટ, બબલ ચાર્ટ અને સ્ટોક ચાર્ટ જેવા ચાર્ટ પર પ્રસ્તુત ડેટા શ્રેણીને પૂરક બનાવવા માટે ટ્રેન્ડ લાઇનનો ઉપયોગ કરી શકાય છે.

તમે 3D, નોર્મલાઇઝ્ડ, રડાર, પાઇ અને ડોનટ ચાર્ટમાં ડેટા શ્રેણીમાં ટ્રેન્ડ લાઇન ઉમેરી શકતા નથી.

એક્સેલના બિલ્ટ-ઇન કાર્યોનો ઉપયોગ કરીને

ચાર્ટ વિસ્તારની બહાર ટ્રેન્ડ લાઇન્સ બનાવવા માટે એક્સેલ પાસે રીગ્રેશન એનાલિસિસ ટૂલ પણ છે. ત્યાં સંખ્યાબંધ આંકડાકીય કાર્યપત્રક કાર્યો છે જેનો તમે આ હેતુ માટે ઉપયોગ કરી શકો છો, પરંતુ તે બધા જ તમને રેખીય અથવા ઘાતાંકીય રીગ્રેસન બનાવવાની મંજૂરી આપે છે.

એક્સેલમાં રેખીય રીગ્રેસન બનાવવા માટે ઘણા કાર્યો છે, ખાસ કરીને:

    વલણ;

  • ઢોળાવ અને કાપો.

તેમજ ઘાતાંકીય વલણ રેખા બનાવવા માટેના કેટલાક કાર્યો, ખાસ કરીને:

    LGRFPRIBL.

એ નોંધવું જોઈએ કે TREND અને GROWTH કાર્યોનો ઉપયોગ કરીને રીગ્રેસન બનાવવા માટેની તકનીકો લગભગ સમાન છે. LINEST અને LGRFPRIBL ની જોડી વિશે પણ એવું જ કહી શકાય. આ ચાર કાર્યો માટે, મૂલ્યોનું કોષ્ટક બનાવવા એરે ફોર્મ્યુલા જેવી એક્સેલ સુવિધાઓનો ઉપયોગ કરે છે, જે કંઈક અંશે રીગ્રેશન બનાવવાની પ્રક્રિયાને અવ્યવસ્થિત કરે છે. એ પણ નોંધ કરો કે રેખીય રીગ્રેસનનું નિર્માણ, અમારા મતે, સ્લોપ અને ઈન્ટરસેપ્ટ ફંક્શનનો ઉપયોગ કરીને સૌથી સહેલાઈથી પરિપૂર્ણ થાય છે, જ્યાં તેમાંથી પ્રથમ રેખીય રીગ્રેસનનો ઢોળાવ નક્કી કરે છે, અને બીજું y પર રીગ્રેસન દ્વારા અટકાવાયેલ સેગમેન્ટને નિર્ધારિત કરે છે. -અક્ષ.

રીગ્રેસન વિશ્લેષણ માટે બિલ્ટ-ઇન ફંક્શન ટૂલના ફાયદા છે:

    વલણ રેખાઓને વ્યાખ્યાયિત કરતા તમામ બિલ્ટ-ઇન આંકડાકીય કાર્યો માટે અભ્યાસ હેઠળની લાક્ષણિકતાની ડેટા શ્રેણી બનાવવાની એકદમ સરળ, સમાન પ્રક્રિયા;

    જનરેટેડ ડેટા સિરીઝના આધારે ટ્રેન્ડ લાઇન બનાવવા માટેની માનક પદ્ધતિ;

    આગળ અથવા પાછળના પગલાઓની આવશ્યક સંખ્યા દ્વારા અભ્યાસ હેઠળની પ્રક્રિયાના વર્તનની આગાહી કરવાની ક્ષમતા.

ગેરફાયદામાં એ હકીકતનો સમાવેશ થાય છે કે એક્સેલમાં અન્ય (રેખીય અને ઘાતાંકીય સિવાય) પ્રકારની ટ્રેન્ડ લાઇન બનાવવા માટે બિલ્ટ-ઇન ફંક્શન્સ નથી. આ સંજોગો ઘણીવાર અભ્યાસ હેઠળની પ્રક્રિયાનું પૂરતું સચોટ મોડલ પસંદ કરવાની તેમજ વાસ્તવિકતાની નજીક હોય તેવી આગાહીઓ મેળવવાની મંજૂરી આપતું નથી. વધુમાં, TREND અને GROWTH ફંક્શનનો ઉપયોગ કરતી વખતે, વલણ રેખાઓના સમીકરણો જાણતા નથી.

એ નોંધવું જોઇએ કે લેખકોએ રીગ્રેસન વિશ્લેષણના અભ્યાસક્રમને પૂર્ણતાની કોઈપણ ડિગ્રી સાથે રજૂ કરવાનું નક્કી કર્યું નથી. તેનું મુખ્ય કાર્ય, વિશિષ્ટ ઉદાહરણોનો ઉપયોગ કરીને, એક્સેલ પેકેજની ક્ષમતાઓ બતાવવાનું છે જ્યારે અંદાજિત સમસ્યાઓ હલ કરવામાં આવે છે; એક્સેલમાં રીગ્રેશન અને આગાહી બનાવવા માટે કયા અસરકારક સાધનો છે તે દર્શાવો; રીગ્રેશન એનાલિસિસનું વ્યાપક જ્ઞાન ન ધરાવતા વપરાશકર્તા દ્વારા પણ આવી સમસ્યાઓને પ્રમાણમાં સરળતાથી કેવી રીતે ઉકેલી શકાય તે સમજાવો.

ચોક્કસ સમસ્યાઓ ઉકેલવાના ઉદાહરણો

ચાલો લિસ્ટેડ એક્સેલ ટૂલ્સનો ઉપયોગ કરીને ચોક્કસ સમસ્યાઓ ઉકેલવા જોઈએ.

સમસ્યા 1

1995-2002 માટે મોટર ટ્રાન્સપોર્ટ એન્ટરપ્રાઇઝના નફા પરના ડેટાના કોષ્ટક સાથે. તમારે નીચેના કરવાની જરૂર છે:

    એક આકૃતિ બનાવો.

    ચાર્ટમાં રેખીય અને બહુપદી (ચતુર્ભુજ અને ઘન) વલણ રેખાઓ ઉમેરો.

    ટ્રેન્ડ લાઇન સમીકરણોનો ઉપયોગ કરીને, 1995-2004 માટે દરેક ટ્રેન્ડ લાઇન માટે એન્ટરપ્રાઇઝના નફા પર ટેબ્યુલર ડેટા મેળવો.

    2003 અને 2004 માટે એન્ટરપ્રાઇઝના નફાની આગાહી કરો.

સમસ્યાનો ઉકેલ

    એક્સેલ વર્કશીટના સેલ A4:C11 ની શ્રેણીમાં, ફિગમાં બતાવેલ વર્કશીટ દાખલ કરો. 4.

    સેલ B4:C11 ની શ્રેણી પસંદ કર્યા પછી, અમે એક આકૃતિ બનાવીએ છીએ.

    અમે બનાવેલ રેખાકૃતિને સક્રિય કરીએ છીએ અને ઉપર વર્ણવેલ પદ્ધતિ અનુસાર, ટ્રેન્ડ લાઇન ડાયલોગ બોક્સમાં ટ્રેન્ડ લાઇનનો પ્રકાર પસંદ કર્યા પછી (ફિગ. 1 જુઓ), અમે વૈકલ્પિક રીતે રેખાકૃતિમાં રેખીય, ચતુર્ભુજ અને ઘન વલણ રેખાઓ ઉમેરીએ છીએ. એ જ સંવાદ બોક્સમાં, પેરામીટર્સ ટેબ ખોલો (જુઓ. આકૃતિ 2), અંદાજિત (સરળ) વળાંક ફીલ્ડના નામમાં, જે વલણ ઉમેરવામાં આવી રહ્યું છે તેનું નામ દાખલ કરો અને ફોરકાસ્ટ ફોરવર્ડ ફોર: પીરિયડ્સ ફીલ્ડમાં, સેટ કરો. મૂલ્ય 2, કારણ કે તે આગળના બે વર્ષ માટે નફાની આગાહી કરવાનું આયોજન છે. ડાયાગ્રામ વિસ્તારમાં રીગ્રેસન સમીકરણ અને અંદાજિત વિશ્વસનીયતા મૂલ્ય R2 પ્રદર્શિત કરવા માટે, સ્ક્રીન ચેકબોક્સ પર શો સમીકરણને સક્ષમ કરો અને ડાયાગ્રામ પર અંદાજિત વિશ્વસનીયતા મૂલ્ય (R^2) મૂકો. સારી વિઝ્યુઅલ ધારણા માટે, અમે બાંધવામાં આવેલી ટ્રેન્ડ લાઇનનો પ્રકાર, રંગ અને જાડાઈ બદલીએ છીએ, જેના માટે અમે ટ્રેન્ડ લાઇન ફોર્મેટ ડાયલોગ બોક્સની વ્યૂ ટેબનો ઉપયોગ કરીએ છીએ (ફિગ. 3 જુઓ). ઉમેરાયેલ વલણ રેખાઓ સાથે પરિણામી રેખાકૃતિ ફિગમાં બતાવવામાં આવી છે. 5.

    1995-2004 માટે દરેક ટ્રેન્ડ લાઇન માટે એન્ટરપ્રાઇઝના નફા પર ટેબ્યુલર ડેટા મેળવવા માટે. ચાલો ફિગમાં પ્રસ્તુત વલણ રેખા સમીકરણોનો ઉપયોગ કરીએ. 5. આ કરવા માટે, D3:F3 શ્રેણીના કોષોમાં, પસંદ કરેલ ટ્રેન્ડ લાઇનના પ્રકાર વિશેની ટેક્સ્ટ માહિતી દાખલ કરો: લીનિયર ટ્રેન્ડ, ક્વાડ્રેટિક ટ્રેન્ડ, ક્યુબિક ટ્રેન્ડ. આગળ, સેલ D4 માં રેખીય રીગ્રેસન ફોર્મ્યુલા દાખલ કરો અને, ફિલ માર્કરનો ઉપયોગ કરીને, સેલ શ્રેણી D5:D13 ના સંબંધિત સંદર્ભો સાથે આ સૂત્રની નકલ કરો. એ નોંધવું જોઈએ કે કોષ D4:D13 ની શ્રેણીમાંથી રેખીય રીગ્રેસન સૂત્ર સાથેના દરેક કોષમાં A4:A13 શ્રેણીમાંથી અનુરૂપ કોષ દલીલ તરીકે છે. એ જ રીતે, ચતુર્ભુજ રીગ્રેસન માટે, કોષોની શ્રેણી E4:E13 ભરો, અને ક્યુબિક રીગ્રેસન માટે, કોષોની શ્રેણી F4:F13 ભરો. આમ, 2003 અને 2004 માટે એન્ટરપ્રાઇઝના નફા માટેનું અનુમાન સંકલિત કરવામાં આવ્યું છે. ત્રણ વલણોનો ઉપયોગ કરીને. મૂલ્યોનું પરિણામી કોષ્ટક ફિગમાં બતાવવામાં આવ્યું છે. 6.

સમસ્યા 2

    એક આકૃતિ બનાવો.

    ચાર્ટમાં લઘુગણક, શક્તિ અને ઘાતાંકીય વલણ રેખાઓ ઉમેરો.

    પ્રાપ્ત વલણ રેખાઓના સમીકરણો, તેમજ તે દરેક માટે અંદાજિત R2 ના વિશ્વસનીયતા મૂલ્યો મેળવો.

    ટ્રેન્ડ લાઇન સમીકરણોનો ઉપયોગ કરીને, 1995-2002 માટે દરેક ટ્રેન્ડ લાઇન માટે એન્ટરપ્રાઇઝના નફા પર ટેબ્યુલર ડેટા મેળવો.

    આ વલણ રેખાઓનો ઉપયોગ કરીને 2003 અને 2004 માટે કંપનીના નફાની આગાહી કરો.

સમસ્યાનો ઉકેલ

સમસ્યા 1 ઉકેલવા માટે આપવામાં આવેલી પદ્ધતિને અનુસરીને, અમે તેમાં ઉમેરવામાં આવેલ લઘુગણક, શક્તિ અને ઘાતાંકીય વલણ રેખાઓ સાથેનો એક આકૃતિ મેળવીએ છીએ (ફિગ. 7). આગળ, પ્રાપ્ત વલણ રેખા સમીકરણોનો ઉપયોગ કરીને, અમે 2003 અને 2004 માટે અનુમાનિત મૂલ્યો સહિત, એન્ટરપ્રાઇઝના નફા માટે મૂલ્યોનું કોષ્ટક ભરીએ છીએ. (ફિગ. 8).

ફિગ માં. 5 અને અંજીર. તે જોઈ શકાય છે કે લઘુગણક વલણ સાથેનું મોડેલ અંદાજિત વિશ્વસનીયતાના સૌથી નીચા મૂલ્યને અનુરૂપ છે

R2 = 0.8659

R2 ના ઉચ્ચતમ મૂલ્યો બહુપદી વલણ સાથેના મોડલને અનુરૂપ છે: ચતુર્ભુજ (R2 = 0.9263) અને ઘન (R2 = 0.933).

સમસ્યા 3

કાર્ય 1 માં આપેલ 1995-2002 માટે મોટર ટ્રાન્સપોર્ટ એન્ટરપ્રાઇઝના નફા પરના ડેટાના કોષ્ટક સાથે, તમારે નીચેના પગલાં ભરવા આવશ્યક છે.

    TREND અને GROW ફંક્શનનો ઉપયોગ કરીને રેખીય અને ઘાતાંકીય વલણ રેખાઓ માટે ડેટા શ્રેણી મેળવો.

    TREND અને GROWTH કાર્યોનો ઉપયોગ કરીને, 2003 અને 2004 માટે એન્ટરપ્રાઇઝના નફાની આગાહી કરો.

    મૂળ ડેટા અને પરિણામી ડેટા શ્રેણી માટે ડાયાગ્રામ બનાવો.

સમસ્યાનો ઉકેલ

ચાલો સમસ્યા 1 માટે વર્કશીટનો ઉપયોગ કરીએ (ફિગ. 4 જુઓ). ચાલો TREND ફંક્શનથી શરૂઆત કરીએ:

    કોષોની શ્રેણી D4:D11 પસંદ કરો, જે એન્ટરપ્રાઇઝના નફા પરના જાણીતા ડેટાને અનુરૂપ TREND કાર્યના મૂલ્યોથી ભરેલી હોવી જોઈએ;

    Insert મેનુમાંથી ફંક્શન કમાન્ડને કૉલ કરો. દેખાતા ફંક્શન વિઝાર્ડ સંવાદ બોક્સમાં, આંકડાકીય શ્રેણીમાંથી TREND ફંક્શન પસંદ કરો અને પછી OK બટન પર ક્લિક કરો. પ્રમાણભૂત ટૂલબાર પર (ઇન્સર્ટ ફંક્શન) બટનને ક્લિક કરીને સમાન કામગીરી કરી શકાય છે.

    દેખાતા ફંક્શન આર્ગ્યુમેન્ટ્સ ડાયલોગ બોક્સમાં, Known_values_y ફીલ્ડમાં સેલ C4:C11 ની શ્રેણી દાખલ કરો; Known_values_x ફીલ્ડમાં - કોષોની શ્રેણી B4:B11;

    દાખલ કરેલ ફોર્મ્યુલાને એરે ફોર્મ્યુલા બનાવવા માટે, કી સંયોજન + + નો ઉપયોગ કરો.

ફોર્મ્યુલા બારમાં આપણે દાખલ કરેલ ફોર્મ્યુલા આના જેવું દેખાશે: =(TREND(C4:C11,B4:B11)).

પરિણામે, કોષોની શ્રેણી D4:D11 TREND કાર્ય (ફિગ. 9) ના અનુરૂપ મૂલ્યોથી ભરેલી છે.

2003 અને 2004 માટે એન્ટરપ્રાઇઝના નફાની આગાહી કરવી. જરૂરી:

    કોષોની શ્રેણી D12:D13 પસંદ કરો જ્યાં TREND કાર્ય દ્વારા અનુમાનિત મૂલ્યો દાખલ કરવામાં આવશે.

    TREND ફંક્શનને કૉલ કરો અને દેખાય છે તે ફંક્શન આર્ગ્યુમેન્ટ્સ સંવાદ બોક્સમાં, Known_values_y ફીલ્ડમાં દાખલ કરો - કોષોની શ્રેણી C4:C11; Known_values_x ફીલ્ડમાં - કોષોની શ્રેણી B4:B11; અને New_values_x ફીલ્ડમાં - B12:B13 કોષોની શ્રેણી.

    કી સંયોજન Ctrl + Shift + Enter નો ઉપયોગ કરીને આ સૂત્રને એરે ફોર્મ્યુલામાં ફેરવો.

    દાખલ કરેલ સૂત્ર આના જેવું દેખાશે: =(TREND(C4:C11;B4:B11;B12:B13)), અને કોષોની શ્રેણી D12:D13 TREND ફંક્શનના અનુમાનિત મૂલ્યોથી ભરવામાં આવશે (ફિગ જુઓ. 9).

ડેટા સિરીઝ GROWTH ફંક્શનનો ઉપયોગ કરીને એ જ રીતે ભરવામાં આવે છે, જેનો ઉપયોગ બિનરેખીય નિર્ભરતાના વિશ્લેષણમાં થાય છે અને તેના રેખીય સમકક્ષ TRENDની જેમ બરાબર કાર્ય કરે છે.

આકૃતિ 10 ફોર્મ્યુલા ડિસ્પ્લે મોડમાં કોષ્ટક બતાવે છે.

પ્રારંભિક ડેટા અને પ્રાપ્ત ડેટા શ્રેણી માટે, આકૃતિ ફિગમાં બતાવેલ છે. અગિયાર

સમસ્યા 4

વર્તમાન મહિનાની 1 લી થી 11 તારીખ સુધીના સમયગાળા માટે મોટર ટ્રાન્સપોર્ટ એન્ટરપ્રાઇઝની રવાનગી સેવા દ્વારા સેવાઓ માટેની અરજીઓની પ્રાપ્તિ પરના ડેટાના કોષ્ટક સાથે, તમારે નીચેની ક્રિયાઓ કરવી આવશ્યક છે.

    રેખીય રીગ્રેસન માટે ડેટા શ્રેણી મેળવો: SLOPE અને INTERCEPT કાર્યોનો ઉપયોગ કરીને; LINEST ફંક્શનનો ઉપયોગ કરીને.

    LGRFPRIBL ફંક્શનનો ઉપયોગ કરીને ઘાતાંકીય રીગ્રેસન માટે શ્રેણીબદ્ધ ડેટા મેળવો.

    ઉપરોક્ત કાર્યોનો ઉપયોગ કરીને, વર્તમાન મહિનાની 12મીથી 14મી સુધીના સમયગાળા માટે ડિસ્પેચ સેવામાં અરજીઓની પ્રાપ્તિ વિશે આગાહી કરો.

    મૂળ અને પ્રાપ્ત ડેટા શ્રેણી માટે ડાયાગ્રામ બનાવો.

સમસ્યાનો ઉકેલ

નોંધ કરો કે, TREND અને GROWTH ફંક્શનથી વિપરીત, ઉપર સૂચિબદ્ધ કોઈપણ ફંક્શન (SLOPE, INTERCEPT, LINEST, LGRFPRIB) રીગ્રેશન નથી. આ વિધેયો માત્ર સહાયક ભૂમિકા ભજવે છે, જરૂરી રીગ્રેસન પરિમાણો નક્કી કરે છે.

SLOPE, INTERCEPT, LINEST, LGRFPRIB ફંક્શનનો ઉપયોગ કરીને બનેલ રેખીય અને ઘાતાંકીય રીગ્રેશન માટે, TREND અને GROWTH કાર્યોને અનુરૂપ રેખીય અને ઘાતાંકીય રીગ્રેશનથી વિપરીત, તેમના સમીકરણોનો દેખાવ હંમેશા જાણીતો છે.

1 . ચાલો સમીકરણ સાથે રેખીય રીગ્રેસન બનાવીએ:

y = mx+b

SLOPE અને INTERCEPT ફંક્શનનો ઉપયોગ કરીને, SLOPE ફંક્શન દ્વારા નિર્ધારિત રીગ્રેશન સ્લોપ m સાથે અને ઈન્ટરસેપ્ટ ફંક્શન દ્વારા ફ્રી ટર્મ b.

આ કરવા માટે, અમે નીચેની ક્રિયાઓ કરીએ છીએ:

    સેલ શ્રેણી A4:B14 માં મૂળ કોષ્ટક દાખલ કરો;

    પરિમાણ m નું મૂલ્ય સેલ C19 માં નક્કી કરવામાં આવશે. આંકડાકીય શ્રેણીમાંથી સ્લોપ ફંક્શન પસંદ કરો; કોષોની શ્રેણી B4:B14 જાણીતા_મૂલ્યો_y ફીલ્ડમાં અને કોષોની શ્રેણી A4:A14 જાણીતા_મૂલ્યો_x ફીલ્ડમાં દાખલ કરો. ફોર્મ્યુલા સેલ C19: =SLOPE(B4:B14,A4:A14) માં દાખલ કરવામાં આવશે;

    સમાન તકનીકનો ઉપયોગ કરીને, સેલ D19 માં પરિમાણ b નું મૂલ્ય નક્કી કરવામાં આવે છે. અને તેની સામગ્રી આના જેવી દેખાશે: =SEGMENT(B4:B14,A4:A14). આમ, રેખીય રીગ્રેસન બનાવવા માટે જરૂરી પરિમાણો m અને b ના મૂલ્યો અનુક્રમે C19, D19 કોષોમાં સંગ્રહિત થશે;

    આગળ, ફોર્મમાં સેલ C4 માં રેખીય રીગ્રેસન ફોર્મ્યુલા દાખલ કરો: =$C*A4+$D. આ સૂત્રમાં, કોષો C19 અને D19 સંપૂર્ણ સંદર્ભો સાથે લખવામાં આવે છે (સંભવિત નકલ દરમિયાન કોષનું સરનામું બદલવું જોઈએ નહીં). નિરપેક્ષ સંદર્ભ ચિહ્ન $ કોષ સરનામાં પર કર્સર મૂક્યા પછી કીબોર્ડમાંથી અથવા F4 કીનો ઉપયોગ કરીને ટાઇપ કરી શકાય છે. ફિલ હેન્ડલનો ઉપયોગ કરીને, આ ફોર્મ્યુલાને સેલ C4:C17 ની શ્રેણીમાં કૉપિ કરો. અમે જરૂરી ડેટા શ્રેણી (ફિગ. 12) મેળવીએ છીએ. વિનંતીઓની સંખ્યા પૂર્ણાંક છે તે હકીકતને કારણે, તમારે સેલ ફોર્મેટ વિન્ડોની નંબર ટેબ પર દશાંશ સ્થાનોની સંખ્યા સાથે નંબર ફોર્મેટને 0 પર સેટ કરવું જોઈએ.

2 . ચાલો હવે સમીકરણ દ્વારા આપવામાં આવેલ રેખીય રીગ્રેસન બનાવીએ:

y = mx+b

LINEST ફંક્શનનો ઉપયોગ કરીને.

આ માટે:

    સેલ શ્રેણી C20:D20: =(LINEST(B4:B14,A4:A14)) માં એરે ફોર્મ્યુલા તરીકે LINEST ફંક્શન દાખલ કરો. પરિણામે, અમે સેલ C20 માં પરિમાણ m નું મૂલ્ય અને સેલ D20 માં પરિમાણ b નું મૂલ્ય મેળવીએ છીએ;

    કોષ D4 માં સૂત્ર દાખલ કરો: =$C*A4+$D;

    સેલ શ્રેણી D4:D17 માં ફિલ માર્કરનો ઉપયોગ કરીને આ ફોર્મ્યુલાની નકલ કરો અને ઇચ્છિત ડેટા શ્રેણી મેળવો.

3 . અમે સમીકરણ સાથે ઘાતાંકીય રીગ્રેસન બનાવીએ છીએ:

LGRFPRIBL ફંક્શનનો ઉપયોગ કરીને તે સમાન રીતે કરવામાં આવે છે:

    સેલ રેન્જ C21:D21માં આપણે LGRFPRIBL ફંક્શનને એરે ફોર્મ્યુલા તરીકે દાખલ કરીએ છીએ: =( LGRFPRIBL (B4:B14,A4:A14)). આ કિસ્સામાં, પરિમાણ m નું મૂલ્ય સેલ C21 માં નક્કી કરવામાં આવશે, અને પરિમાણ b નું મૂલ્ય સેલ D21 માં નક્કી કરવામાં આવશે;

    ફોર્મ્યુલા સેલ E4 માં દાખલ કરવામાં આવે છે: =$D*$C^A4;

    ફિલ માર્કરનો ઉપયોગ કરીને, આ સૂત્ર E4:E17 કોષોની શ્રેણીમાં નકલ કરવામાં આવે છે, જ્યાં ઘાતાંકીય રીગ્રેસન માટે ડેટા શ્રેણી સ્થિત હશે (ફિગ. 12 જુઓ).

ફિગ માં. આકૃતિ 13 એક ટેબલ બતાવે છે જ્યાં તમે જરૂરી કોષ શ્રેણીઓ તેમજ ફોર્મ્યુલા સાથે અમે ઉપયોગ કરીએ છીએ તે કાર્યો જોઈ શકો છો.

તીવ્રતા આર 2 કહેવાય છે નિર્ધારણ ગુણાંક.

રીગ્રેસન અવલંબન બનાવવાનું કાર્ય મોડેલ (1) ના ગુણાંક m ના વેક્ટરને શોધવાનું છે કે જેના પર ગુણાંક R મહત્તમ મૂલ્ય લે છે.

R ના મહત્વનું મૂલ્યાંકન કરવા માટે, ફિશરની F ટેસ્ટનો ઉપયોગ કરવામાં આવે છે, સૂત્રનો ઉપયોગ કરીને ગણતરી કરવામાં આવે છે.

જ્યાં n- નમૂનાનું કદ (પ્રયોગોની સંખ્યા);

k એ મોડેલ ગુણાંકની સંખ્યા છે.

જો F ડેટા માટે અમુક નિર્ણાયક મૂલ્ય કરતાં વધી જાય nઅને kઅને સ્વીકૃત આત્મવિશ્વાસની સંભાવના, તો R નું મૂલ્ય નોંધપાત્ર ગણવામાં આવે છે. કોષ્ટકો નિર્ણાયક મૂલ્યો F ગાણિતિક આંકડાઓ પર સંદર્ભ પુસ્તકોમાં આપવામાં આવે છે.

આમ, R નું મહત્વ માત્ર તેના મૂલ્ય દ્વારા જ નહીં, પણ પ્રયોગોની સંખ્યા અને મોડેલના ગુણાંક (પરિમાણો) ની સંખ્યા વચ્ચેના સંબંધ દ્વારા પણ નક્કી કરવામાં આવે છે. ખરેખર, સાદા રેખીય મોડેલ માટે n=2 માટેનો સહસંબંધ ગુણોત્તર 1 ની બરાબર છે (તમે હંમેશા પ્લેન પર 2 બિંદુઓ દ્વારા એક સીધી રેખા દોરી શકો છો). જો કે, જો પ્રાયોગિક ડેટા રેન્ડમ ચલ હોય, તો R ના આવા મૂલ્ય પર ખૂબ સાવધાની સાથે વિશ્વાસ કરવો જોઈએ. સામાન્ય રીતે, નોંધપાત્ર આર અને વિશ્વસનીય રીગ્રેસન મેળવવા માટે, તેઓ ખાતરી કરવા માટે પ્રયત્ન કરે છે કે પ્રયોગોની સંખ્યા નોંધપાત્ર રીતે મોડેલ ગુણાંક (n>k) ની સંખ્યા કરતાં વધી જાય.

રેખીય રીગ્રેશન મોડેલ બનાવવા માટે તમારે આની જરૂર છે:

1) પ્રાયોગિક ડેટા ધરાવતી n પંક્તિઓ અને m કૉલમ્સની સૂચિ તૈયાર કરો (આઉટપુટ મૂલ્ય ધરાવતી કૉલમ વાયસૂચિમાં કાં તો પ્રથમ અથવા છેલ્લું હોવું જોઈએ); ઉદાહરણ તરીકે, ચાલો પાછલા કાર્યમાંથી ડેટા લઈએ, "પીરિયડ નંબર" નામની કૉલમ ઉમેરીને, 1 થી 12 સુધીના સમયગાળાની સંખ્યાઓને નંબર આપો. (આ મૂલ્યો હશે. એક્સ)

2) મેનુ ડેટા/ડેટા એનાલિસિસ/રીગ્રેશન પર જાઓ

જો "ટૂલ્સ" મેનૂમાં "ડેટા વિશ્લેષણ" આઇટમ ખૂટે છે, તો તમારે તે જ મેનૂમાં "એડ-ઇન્સ" આઇટમ પર જવું જોઈએ અને "વિશ્લેષણ પેકેજ" ચેકબોક્સને ચેક કરવું જોઈએ.

3) "રીગ્રેશન" સંવાદ બોક્સમાં, સેટ કરો:

· ઇનપુટ અંતરાલ Y;

· ઇનપુટ અંતરાલ X;

· આઉટપુટ અંતરાલ - અંતરાલનો ઉપરનો ડાબો કોષ જેમાં ગણતરીના પરિણામો મૂકવામાં આવશે (તેને નવી વર્કશીટ પર મૂકવાની ભલામણ કરવામાં આવે છે);

4) "ઓકે" ક્લિક કરો અને પરિણામોનું વિશ્લેષણ કરો.

ઓછામાં ઓછી ચોરસ પદ્ધતિરીગ્રેસન સમીકરણના પરિમાણોનો અંદાજ કાઢવા માટે વપરાય છે.
રેખાઓની સંખ્યા (સ્રોત ડેટા)

લાક્ષણિકતાઓ વચ્ચેના સ્ટોકેસ્ટિક સંબંધોનો અભ્યાસ કરવાની પદ્ધતિઓમાંની એક રીગ્રેસન વિશ્લેષણ છે.
રીગ્રેસન વિશ્લેષણ એ રીગ્રેસન સમીકરણની વ્યુત્પત્તિ છે, જેની મદદથી રેન્ડમ ચલ (પરિણામ વિશેષતા) નું સરેરાશ મૂલ્ય જોવા મળે છે જો અન્ય (અથવા અન્ય) ચલોનું મૂલ્ય (પરિબળ-લક્ષણો) જાણીતું હોય. તેમાં નીચેના પગલાં શામેલ છે:

  1. જોડાણના સ્વરૂપની પસંદગી (વિશ્લેષણાત્મક રીગ્રેસન સમીકરણનો પ્રકાર);
  2. સમીકરણ પરિમાણોનો અંદાજ;
  3. વિશ્લેષણાત્મક રીગ્રેસન સમીકરણની ગુણવત્તાનું મૂલ્યાંકન.
મોટેભાગે, લક્ષણોના આંકડાકીય સંબંધનું વર્ણન કરવા માટે રેખીય સ્વરૂપનો ઉપયોગ થાય છે. રેખીય સંબંધો પર ધ્યાન તેના પરિમાણોના સ્પષ્ટ આર્થિક અર્થઘટન, ચલોની મર્યાદિત ભિન્નતા અને હકીકત એ છે કે મોટાભાગના કિસ્સાઓમાં સંબંધોના બિનરેખીય સ્વરૂપો ગણતરી કરવા માટે રેખીય સ્વરૂપમાં રૂપાંતરિત થાય છે. .
રેખીય જોડી પ્રમાણે સંબંધના કિસ્સામાં, રીગ્રેસન સમીકરણ આ સ્વરૂપ લેશે: y i =a+b·x i +u i . આ સમીકરણના પરિમાણો a અને b ડેટા પરથી અંદાજવામાં આવે છે આંકડાકીય અવલોકન x અને y. આવા મૂલ્યાંકનનું પરિણામ એ સમીકરણ છે: , જ્યાં , પરિમાણો a અને b નો અંદાજ છે, તે રીગ્રેસન સમીકરણ (ગણતરી મૂલ્ય) માંથી પ્રાપ્ત પરિણામી વિશેષતા (ચલ) નું મૂલ્ય છે.

મોટેભાગે પરિમાણોનો અંદાજ કાઢવા માટે વપરાય છે ઓછામાં ઓછા ચોરસ પદ્ધતિ (LSM).
ઓછામાં ઓછી ચોરસ પદ્ધતિ રીગ્રેસન સમીકરણના પરિમાણોના શ્રેષ્ઠ (સતત, કાર્યક્ષમ અને નિષ્પક્ષ) અંદાજો પ્રદાન કરે છે. પરંતુ જો રેન્ડમ ટર્મ (u) અને સ્વતંત્ર ચલ (x) સંબંધિત અમુક ધારણાઓ પૂરી થાય તો જ (OLS ધારણાઓ જુઓ).

ઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને રેખીય જોડી સમીકરણના પરિમાણોનો અંદાજ કાઢવાની સમસ્યાનીચે મુજબ છે: પરિમાણોના આવા અંદાજો મેળવવા માટે, , જેના પર પરિણામી લાક્ષણિકતાના વાસ્તવિક મૂલ્યોના વર્ગ વિચલનોનો સરવાળો - ગણતરી કરેલ મૂલ્યોમાંથી y i - ન્યૂનતમ છે.
ઔપચારિક રીતે OLS માપદંડઆ રીતે લખી શકાય છે: .

ઓછામાં ઓછા ચોરસ પદ્ધતિઓનું વર્ગીકરણ

  1. ઓછામાં ઓછી ચોરસ પદ્ધતિ.
  2. મહત્તમ સંભાવના પદ્ધતિ (સામાન્ય શાસ્ત્રીય રેખીય રીગ્રેસન મોડેલ માટે, રીગ્રેસન અવશેષોની સામાન્યતા નક્કી કરવામાં આવે છે).
  3. સામાન્યકૃત લઘુત્તમ ચોરસ OLS પદ્ધતિનો ઉપયોગ ભૂલોના સ્વતઃસંબંધના કિસ્સામાં અને હેટરોસેડેસ્ટીસીટીના કિસ્સામાં થાય છે.
  4. વેઇટેડ ન્યૂનતમ ચોરસ પદ્ધતિ ( ખાસ કેસહેટરોસેડેસ્ટિક અવશેષો સાથે OLS).

ચાલો મુદ્દો સમજાવીએ શાસ્ત્રીય પદ્ધતિગ્રાફિકલી ઓછામાં ઓછા ચોરસ. આ કરવા માટે, અમે એક લંબચોરસ કોઓર્ડિનેટ સિસ્ટમમાં ઓબ્ઝર્વેશનલ ડેટા (x i, y i, i=1;n) પર આધારિત સ્કેટર પ્લોટ બનાવીશું (આવા સ્કેટર પ્લોટને સહસંબંધ ક્ષેત્ર કહેવામાં આવે છે). ચાલો એક સીધી રેખા પસંદ કરવાનો પ્રયાસ કરીએ જે સહસંબંધ ક્ષેત્રના બિંદુઓની સૌથી નજીક હોય. ઓછામાં ઓછા ચોરસ પદ્ધતિ અનુસાર, રેખા પસંદ કરવામાં આવે છે જેથી સહસંબંધ ક્ષેત્રના બિંદુઓ અને આ રેખા વચ્ચેના ઊભી અંતરના વર્ગોનો સરવાળો ન્યૂનતમ હોય.

આ સમસ્યા માટે ગાણિતિક સંકેત: .
y i અને x i =1...n ના મૂલ્યો અમને જાણીતા છે; આ અવલોકન ડેટા છે. એસ ફંક્શનમાં તેઓ સ્થિરાંકોનું પ્રતિનિધિત્વ કરે છે. આ ફંક્શનમાંના ચલ એ પરિમાણોના જરૂરી અંદાજો છે - , . બે ચલોના ફંક્શનનું ન્યૂનતમ શોધવા માટે, દરેક પેરામીટર માટે આ ફંક્શનના આંશિક ડેરિવેટિવ્સની ગણતરી કરવી જરૂરી છે અને તેને શૂન્ય સાથે સરખાવી જોઈએ, એટલે કે. .
પરિણામે, અમે 2 સામાન્ય રેખીય સમીકરણોની સિસ્ટમ મેળવીએ છીએ:
નક્કી કરે છે આ સિસ્ટમ, અમે જરૂરી પરિમાણ અંદાજો શોધીએ છીએ:

રીગ્રેસન સમીકરણના પરિમાણોની ગણતરીની શુદ્ધતા રકમની તુલના કરીને ચકાસી શકાય છે (ગણતરીના રાઉન્ડિંગને કારણે કેટલીક વિસંગતતા હોઈ શકે છે).
પરિમાણ અંદાજની ગણતરી કરવા માટે, તમે કોષ્ટક 1 બનાવી શકો છો.
રીગ્રેશન ગુણાંક b નું ચિહ્ન સંબંધની દિશા સૂચવે છે (જો b >0, સંબંધ સીધો છે, જો b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
ઔપચારિક રીતે, પરિમાણ aનું મૂલ્ય એ શૂન્યની બરાબર x સાથે y નું સરેરાશ મૂલ્ય છે. જો લક્ષણ-પરિબળ શૂન્ય મૂલ્ય ધરાવતું નથી અને ન હોઈ શકે, તો પરિમાણ a નું ઉપરોક્ત અર્થઘટન અર્થપૂર્ણ નથી.

લાક્ષણિકતાઓ વચ્ચેના સંબંધની નિકટતાનું મૂલ્યાંકન રેખીય જોડી સહસંબંધ ગુણાંકનો ઉપયોગ કરીને હાથ ધરવામાં આવે છે - r x,y. તે સૂત્રનો ઉપયોગ કરીને ગણતરી કરી શકાય છે: . વધુમાં, રેખીય જોડી સહસંબંધ ગુણાંકને રીગ્રેસન ગુણાંક b દ્વારા નક્કી કરી શકાય છે: .
રેખીય જોડી સહસંબંધ ગુણાંકના સ્વીકાર્ય મૂલ્યોની શ્રેણી –1 થી +1 સુધીની છે. સહસંબંધ ગુણાંકનું ચિહ્ન સંબંધની દિશા દર્શાવે છે. જો r x, y >0, તો કનેક્શન સીધું છે; જો r x, y<0, то связь обратная.
જો આ ગુણાંક તીવ્રતામાં એકતાની નજીક છે, તો પછી લાક્ષણિકતાઓ વચ્ચેના સંબંધને એકદમ નજીકના રેખીય તરીકે અર્થઘટન કરી શકાય છે. જો તેનું મોડ્યુલ એક ê r x , y ê =1 જેટલું હોય, તો લાક્ષણિકતાઓ વચ્ચેનો સંબંધ કાર્યાત્મક રેખીય છે. જો x અને y લક્ષણો રેખીય રીતે સ્વતંત્ર છે, તો r x,y 0 ની નજીક છે.
r x,y ની ગણતરી કરવા માટે, તમે કોષ્ટક 1 નો પણ ઉપયોગ કરી શકો છો.

કોષ્ટક 1

N અવલોકનોx iy ix i ∙y i
1 x 1y 1x 1 y 1
2 x 2y 2x 2 y 2
...
nx ny nx n y n
કૉલમ સરવાળો∑x∑y∑xy
સરેરાશ મૂલ્ય
પરિણામી રીગ્રેસન સમીકરણની ગુણવત્તાનું મૂલ્યાંકન કરવા માટે, નિર્ધારણના સૈદ્ધાંતિક ગુણાંકની ગણતરી કરો - R 2 yx:

,
જ્યાં d 2 એ રીગ્રેશન સમીકરણ દ્વારા સમજાવાયેલ y નું વિચલન છે;
e 2 - અવશેષ (રીગ્રેસન સમીકરણ દ્વારા ન સમજાવાયેલ) y નું વિચલન;
s 2 y - y નો કુલ (કુલ) વિચલન.
નિર્ધારણનો ગુણાંક કુલ ભિન્નતા (વિક્ષેપ) y માં રીગ્રેસન (અને પરિણામે, પરિબળ x) દ્વારા સમજાવાયેલ પરિણામી લક્ષણ y ના વિવિધતા (વિખેરવું) ના પ્રમાણને દર્શાવે છે. નિર્ધારણનો ગુણાંક R 2 yx 0 થી 1 સુધીના મૂલ્યો લે છે. તદનુસાર, મૂલ્ય 1-R 2 yx એ મોડેલ અને સ્પષ્ટીકરણની ભૂલોમાં ધ્યાનમાં લેવામાં ન આવતા અન્ય પરિબળોના પ્રભાવને કારણે થતા ભિન્નતા y ના પ્રમાણને દર્શાવે છે.
જોડી કરેલ રેખીય રીગ્રેશન સાથે, R 2 yx = r 2 yx.

સાઇટ પર નવું

>

સૌથી વધુ લોકપ્રિય