घर बच्चों की दंत चिकित्सा सांख्यिकीय महत्व का परीक्षण करने के लिए एक प्रतिगमन समीकरण का उपयोग किया जाता है। प्रतिगमन समीकरण और उसके गुणांकों के महत्व का आकलन करना

सांख्यिकीय महत्व का परीक्षण करने के लिए एक प्रतिगमन समीकरण का उपयोग किया जाता है। प्रतिगमन समीकरण और उसके गुणांकों के महत्व का आकलन करना

किसी समीकरण के महत्व का आकलन करना एकाधिक प्रतिगमन

अनुभवजन्य प्रतिगमन समीकरण का निर्माण अर्थमितीय विश्लेषण का प्रारंभिक चरण है। किसी नमूने से निर्मित पहला प्रतिगमन समीकरण कुछ विशेषताओं के संदर्भ में बहुत कम ही संतोषजनक होता है। इसलिए अगला सबसे महत्वपूर्ण कार्यअर्थमितीय विश्लेषण प्रतिगमन समीकरण की गुणवत्ता का परीक्षण है। अर्थमिति में, ऐसे सत्यापन के लिए एक सुस्थापित योजना अपनाई गई है।

इसलिए, अनुमानित प्रतिगमन समीकरण की सांख्यिकीय गुणवत्ता की जाँच का उपयोग करके किया जाता है निम्नलिखित निर्देश:

· प्रतिगमन समीकरण के महत्व की जाँच करना;

· इंतिहान आंकड़ों की महत्ताप्रतिगमन समीकरण गुणांक;

· डेटा के गुणों की जाँच करना, जिसकी व्यवहार्यता समीकरण का अनुमान लगाते समय मान ली गई थी (ओएलएस परिसर की व्यवहार्यता की जाँच करना)।

एकाधिक प्रतिगमन समीकरण, साथ ही युग्मित प्रतिगमन के महत्व का परीक्षण, फिशर परीक्षण का उपयोग करके किया जाता है। में इस मामले में(जोड़ीवार प्रतिगमन के विपरीत) एक शून्य परिकल्पना सामने रखी गई है एच 0सभी प्रतिगमन गुणांक शून्य के बराबर हैं ( बी 1=0, बी 2=0, … , बी एम=0). फिशर मानदंड निम्नलिखित सूत्र द्वारा निर्धारित किया जाता है:

कहाँ डीतथ्य - स्वतंत्रता की एक डिग्री के अनुसार, प्रतिगमन द्वारा समझाया गया कारक भिन्नता; डीओएसटी - स्वतंत्रता की डिग्री के अनुसार अवशिष्ट फैलाव; आर 2- गुणांक एकाधिक दृढ़ संकल्प; टी एक्सप्रतिगमन समीकरण में (युग्मित में)। रेखीय प्रतिगमन टी= 1); पी -अवलोकनों की संख्या.

परिणामी एफ-परीक्षण मान की तुलना एक निश्चित महत्व स्तर पर तालिका मान से की जाती है। यदि इसका वास्तविक मान तालिका मान से अधिक है, तो परिकल्पना लेकिनप्रतिगमन समीकरण के महत्व को अस्वीकार कर दिया गया है, और इसके सांख्यिकीय महत्व के बारे में वैकल्पिक परिकल्पना को स्वीकार कर लिया गया है।

फिशर मानदंड का उपयोग करके, आप न केवल समग्र रूप से प्रतिगमन समीकरण के महत्व का मूल्यांकन कर सकते हैं, बल्कि मॉडल में प्रत्येक कारक के अतिरिक्त समावेशन के महत्व का भी मूल्यांकन कर सकते हैं। मॉडल पर उन कारकों का बोझ न डालने के लिए ऐसा मूल्यांकन आवश्यक है जिनका परिणाम पर महत्वपूर्ण प्रभाव नहीं पड़ता है। इसके अलावा, चूंकि मॉडल में कई कारक शामिल होते हैं, इसलिए उन्हें अलग-अलग अनुक्रमों में इसमें पेश किया जा सकता है, और चूंकि कारकों के बीच एक संबंध होता है, इसलिए मॉडल में एक ही कारक को शामिल करने का महत्व उस अनुक्रम के आधार पर भिन्न हो सकता है जिसमें इसमें कारकों का परिचय दिया जाता है।

मॉडल में एक अतिरिक्त कारक को शामिल करने के महत्व का आकलन करने के लिए, आंशिक फिशर मानदंड की गणना की जाती है एफएक्सआई.यह समग्र रूप से प्रतिगमन के लिए स्वतंत्रता की एक डिग्री के अवशिष्ट विचरण के साथ मॉडल में एक अतिरिक्त कारक को शामिल करने के कारण कारक विचरण में वृद्धि की तुलना पर आधारित है। इसलिए, गणना सूत्र निजी एफ-परीक्षणकारक के लिए निम्नलिखित रूप होगा:

कहाँ आर 2 वाईएक्स 1 एक्स 2… एक्सआई… एक्सपी -पूर्ण-सेट मॉडल के लिए एकाधिक निर्धारण का गुणांक पीकारकों ; आर 2 वाईएक्स 1 एक्स 2… एक्स आई -1 एक्स आई +1… एक्सपी- एक मॉडल के लिए एकाधिक निर्धारण का गुणांक जिसमें एक कारक शामिल नहीं है एक्स मैं;पी- अवलोकनों की संख्या; टी- कारकों के लिए मापदंडों की संख्या एक्सप्रतिगमन समीकरण में.

फिशर के आंशिक परीक्षण के वास्तविक मूल्य की तुलना 0.05 या 0.1 के महत्व स्तर और स्वतंत्रता की डिग्री की संगत संख्या पर सारणीबद्ध परीक्षण से की जाती है। यदि वास्तविक मूल्य एफ xiसे अधिक है एफ टेबल, फिर कारक का अतिरिक्त समावेशन एक्स मैंमॉडल में सांख्यिकीय रूप से उचित है, और "शुद्ध" प्रतिगमन गुणांक है बी मैंकारक पर एक्स मैंआंकड़ों की दृष्टि से महत्वपूर्ण। अगर एफ xiकम एफ टेबल, तो मॉडल में कारक के अतिरिक्त समावेशन से परिणाम में स्पष्ट भिन्नता की हिस्सेदारी में उल्लेखनीय वृद्धि नहीं होती है हाँ,और, इसलिए, मॉडल में इसे शामिल करने का कोई मतलब नहीं है; इस मामले में इस कारक के लिए प्रतिगमन गुणांक सांख्यिकीय रूप से महत्वहीन है।

फिशर के आंशिक परीक्षण का उपयोग करके, आप इस धारणा के तहत सभी प्रतिगमन गुणांक के महत्व का परीक्षण कर सकते हैं कि प्रत्येक संबंधित कारक एक्स मैंएकाधिक प्रतिगमन समीकरण में अंत में प्रवेश किया गया है, और अन्य सभी कारक पहले से ही मॉडल में शामिल किए गए थे।

"शुद्ध" प्रतिगमन गुणांक के महत्व का आकलन करना बी मैंद्वारा विद्यार्थी का टी टेस्टनिजी गणना के बिना किया जा सकता है एफ-मानदंड। इस मामले में, युग्मित प्रतिगमन की तरह, सूत्र प्रत्येक कारक के लिए लागू किया जाता है

टी द्वि = बी मैं / एम द्वि,

कहाँ बी मैं- कारक के साथ "शुद्ध" प्रतिगमन का गुणांक एक्स मैं ; एम द्वि- प्रतिगमन गुणांक की मानक त्रुटि बी मैं .

सहसंबंध गुणांक के महत्व और महत्व का आकलन करने के लिए, छात्र के टी-टेस्ट का उपयोग किया जाता है।

सहसंबंध गुणांक की औसत त्रुटि सूत्र का उपयोग करके पाई जाती है:

एन
और त्रुटि के आधार पर, टी-मानदंड की गणना की जाती है:

परिकलित टी-परीक्षण मान की तुलना छात्र की वितरण तालिका में 0.05 या 0.01 के महत्व स्तर और स्वतंत्रता एन-1 की डिग्री की संख्या पर पाए गए सारणीबद्ध मान से की जाती है। यदि टी-टेस्ट का परिकलित मान तालिका मान से अधिक है, तो सहसंबंध गुणांक महत्वपूर्ण माना जाता है।

वक्रीय संबंध के मामले में, एफ-परीक्षण का उपयोग सहसंबंध संबंध और प्रतिगमन समीकरण के महत्व का आकलन करने के लिए किया जाता है। इसकी गणना सूत्र द्वारा की जाती है:

या

जहां η सहसंबंध अनुपात है; n - अवलोकनों की संख्या; मी - प्रतिगमन समीकरण में मापदंडों की संख्या।

परिकलित F मान की तुलना स्वीकृत महत्व स्तर α (0.05 या 0.01) और स्वतंत्रता की डिग्री k 1 =m-1 और k 2 =n-m के लिए सारणीबद्ध मान से की जाती है। यदि परिकलित F मान तालिका एक से अधिक है, तो संबंध महत्वपूर्ण माना जाता है।

प्रतिगमन गुणांक का महत्व छात्र टी-टेस्ट का उपयोग करके स्थापित किया जाता है, जिसकी गणना सूत्र का उपयोग करके की जाती है:

जहां σ 2 और i प्रतिगमन गुणांक का प्रसरण है।

इसकी गणना सूत्र द्वारा की जाती है:

जहां k प्रतिगमन समीकरण में कारक विशेषताओं की संख्या है।

प्रतिगमन गुणांक को महत्वपूर्ण माना जाता है यदि t a 1 ≥t cr। t cr स्वीकृत महत्व स्तर और स्वतंत्रता की डिग्री की संख्या k=n-1 पर छात्र वितरण के महत्वपूर्ण बिंदुओं की तालिका में पाया जाता है।

4.3. एक्सेल में सहसंबंध और प्रतिगमन विश्लेषण

आइए प्रति 1 क्विंटल अनाज की उपज और श्रम लागत के बीच संबंध का सहसंबंध और प्रतिगमन विश्लेषण करें। ऐसा करने के लिए, एक एक्सेल शीट खोलें और सेल A1:A30 में कारक विशेषता के मान दर्ज करें अनाज की फसलों की उपज, कोशिकाओं B1:B30 में, परिणामी विशेषता का मूल्य प्रति 1 क्विंटल अनाज पर श्रम की लागत है। टूल्स मेनू में, डेटा विश्लेषण विकल्प चुनें। इस आइटम पर बायाँ-क्लिक करके, हम रिग्रेशन टूल खोलेंगे। ओके बटन पर क्लिक करें और रिग्रेशन डायलॉग बॉक्स स्क्रीन पर दिखाई देगा। इनपुट अंतराल Y फ़ील्ड में, परिणामी विशेषता के मान दर्ज करें (सेल्स B1:B30 को हाइलाइट करते हुए), इनपुट अंतराल X फ़ील्ड में, कारक विशेषता के मान दर्ज करें (सेल्स A1:A30 को हाइलाइट करते हुए)। 95% संभाव्यता स्तर को चिह्नित करें और नई वर्कशीट चुनें। ठीक बटन पर क्लिक करें। वर्कशीट पर "परिणामों का निष्कर्ष" तालिका दिखाई देती है, जो प्रतिगमन समीकरण के मापदंडों, सहसंबंध गुणांक और अन्य संकेतकों की गणना के परिणाम दिखाती है जो आपको सहसंबंध गुणांक और प्रतिगमन समीकरण के मापदंडों के महत्व को निर्धारित करने की अनुमति देते हैं।

परिणामों का निष्कर्ष

प्रतिगमन आँकड़े

बहुवचन आर

आर स्कवेयर

सामान्यीकृत आर-वर्ग

मानक त्रुटि

टिप्पणियों

भिन्नता का विश्लेषण

महत्व एफ

वापसी

कठिनाइयाँ

मानक त्रुटि

टी आँकड़ा

पी-मूल्य

निचला 95%

शीर्ष 95%

निचला 95.0%

शीर्ष 95.0%

वाई-चौराहा

वेरिएबल एक्स 1

इस तालिका में, "एकाधिक आर" सहसंबंध गुणांक है, "आर-वर्ग" निर्धारण का गुणांक है। "गुणांक: Y-प्रतिच्छेदन" - प्रतिगमन समीकरण 2.836242 का मुक्त पद; "परिवर्तनीय X1" - प्रतिगमन गुणांक -0.06654। फिशर के एफ-टेस्ट 74.9876, स्टूडेंट के टी-टेस्ट 14.18042, "मानक त्रुटि 0.112121" के मान भी हैं, जो सहसंबंध गुणांक, प्रतिगमन समीकरण के मापदंडों और संपूर्ण समीकरण के महत्व का आकलन करने के लिए आवश्यक हैं।

तालिका में डेटा के आधार पर, हम एक प्रतिगमन समीकरण बनाएंगे: y x ​​​​= 2.836-0.067x। प्रतिगमन गुणांक a 1 = -0.067 का अर्थ है कि अनाज की उपज में 1 c/ha की वृद्धि के साथ, प्रति 1 c अनाज पर श्रम लागत 0.067 मानव-घंटे कम हो जाती है।

सहसंबंध गुणांक r=0.85>0.7 है, इसलिए, इस जनसंख्या में अध्ययन की गई विशेषताओं के बीच संबंध घनिष्ठ है। निर्धारण का गुणांक r 2 =0.73 दर्शाता है कि प्रभावी गुण (प्रति 1 क्विंटल अनाज पर श्रम लागत) में 73% भिन्नता कारक गुण (अनाज की उपज) की क्रिया के कारण होती है।

फिशर-स्नेडेकोर वितरण के महत्वपूर्ण बिंदुओं की तालिका में, हम 0.05 के महत्व स्तर पर एफ-परीक्षण का महत्वपूर्ण मूल्य और स्वतंत्रता की डिग्री की संख्या k 1 =m-1=2-1=1 और k पाते हैं। 2 =n-m=30-2=28, यह 4.21 के बराबर है। चूँकि मानदंड का परिकलित मान सारणीबद्ध (F=74.9896>4.21) से अधिक है, इसलिए प्रतिगमन समीकरण को महत्वपूर्ण माना जाता है।

सहसंबंध गुणांक के महत्व का आकलन करने के लिए, आइए छात्र के टी-टेस्ट की गणना करें:

में
छात्र वितरण के महत्वपूर्ण बिंदुओं की तालिका में, हम 0.05 के महत्व स्तर पर टी-टेस्ट का महत्वपूर्ण मान पाते हैं और स्वतंत्रता की डिग्री की संख्या n-1=30-1=29, यह 2.0452 के बराबर है। चूँकि परिकलित मान तालिका मान से अधिक है, सहसंबंध गुणांक महत्वपूर्ण है।

प्रतिगमन समीकरण मापदंडों के महत्व का अनुमान

रेखीय प्रतिगमन समीकरण के मापदंडों के महत्व का आकलन छात्र के परीक्षण का उपयोग करके किया जाता है:

अगर टीकैल्क. > टीकरोड़, तो मुख्य परिकल्पना स्वीकार की जाती है ( एच ओ), प्रतिगमन मापदंडों के सांख्यिकीय महत्व को दर्शाता है;

अगर टीकैल्क.< टीकरोड़, तो वैकल्पिक परिकल्पना स्वीकार की जाती है ( एच 1), प्रतिगमन मापदंडों के सांख्यिकीय महत्व को दर्शाता है।

कहाँ एम ए , एम बी- मापदंडों की मानक त्रुटियाँ और बी:

(2.19)

(2.20)

मानदंड का महत्वपूर्ण (सारणीबद्ध) मान छात्र वितरण (परिशिष्ट बी) की सांख्यिकीय तालिकाओं या तालिकाओं का उपयोग करके पाया जाता है एक्सेल("सांख्यिकीय" फ़ंक्शन विज़ार्ड का अनुभाग):

टीकरोड़ = STUDARSOBR( α=1-पी; k=n-2), (2.21)

कहाँ k=n-2स्वतंत्रता की कोटि की संख्या का भी प्रतिनिधित्व करता है .

सांख्यिकीय महत्व का आकलन रैखिक सहसंबंध गुणांक पर भी लागू किया जा सकता है

कहाँ श्री– सहसंबंध गुणांक के मूल्यों को निर्धारित करने में मानक त्रुटि आर वाईएक्स

(2.23)

व्यावहारिक और के लिए कार्यों के विकल्प नीचे दिए गए हैं प्रयोगशाला कार्यदूसरे खंड के विषयों पर.

अनुभाग 2 के लिए स्व-परीक्षण प्रश्न

1. अर्थमितीय मॉडल के मुख्य घटकों और उनके सार को इंगित करें।

2. अर्थमितीय अनुसंधान के चरणों की मुख्य सामग्री।

3. रैखिक प्रतिगमन मापदंडों को निर्धारित करने के लिए दृष्टिकोण का सार।

4. विधि के अनुप्रयोग का सार और विशिष्टताएँ कम से कम वर्गोंप्रतिगमन समीकरण के मापदंडों का निर्धारण करते समय।

5. अध्ययन के तहत कारकों के बीच संबंधों की निकटता का आकलन करने के लिए किन संकेतकों का उपयोग किया जाता है?

6. सार रैखिक गुणांकसहसंबंध।

7. निर्धारण गुणांक का सार.

8. पर्याप्तता (सांख्यिकीय महत्व) का आकलन करने के लिए प्रक्रियाओं का सार और मुख्य विशेषताएं प्रतिगमन मॉडल.

9. सन्निकटन गुणांक द्वारा रैखिक प्रतिगमन मॉडल की पर्याप्तता का आकलन करना।

10. फिशर मानदंड का उपयोग करके प्रतिगमन मॉडल की पर्याप्तता का आकलन करने के दृष्टिकोण का सार। अनुभवजन्य और की परिभाषा महत्वपूर्ण मूल्यकसौटी.

11. अर्थमितीय अनुसंधान के संबंध में "विचरण विश्लेषण" की अवधारणा का सार।

12. मापदंडों के महत्व का आकलन करने की प्रक्रिया का सार और मुख्य विशेषताएं रेखीय समीकरणप्रतिगमन.

13. रेखीय प्रतिगमन समीकरण के मापदंडों के महत्व का आकलन करते समय छात्र वितरण का उपयोग करने की विशेषताएं।

14. अध्ययन के तहत सामाजिक-आर्थिक घटना के एकल मूल्यों का पूर्वानुमान लगाने का कार्य क्या है?

1. एक सहसंबंध क्षेत्र का निर्माण करें और अध्ययन के तहत कारकों के संबंध के लिए समीकरण के रूप के बारे में एक धारणा तैयार करें;

2. न्यूनतम वर्ग विधि के मूल समीकरण लिखें, आवश्यक परिवर्तन करें, मध्यवर्ती गणना के लिए एक तालिका बनाएं और रैखिक प्रतिगमन समीकरण के पैरामीटर निर्धारित करें;

3. का उपयोग करके की गई गणनाओं की शुद्धता की जाँच करें मानक प्रक्रियाऔर कार्य स्प्रेडशीटएक्सेल.

4. परिणामों का विश्लेषण करें, निष्कर्ष और सिफारिशें तैयार करें।

1. रैखिक सहसंबंध गुणांक के मान की गणना;

2. एक मेज बनाना भिन्नता का विश्लेषण;

3. निर्धारण के गुणांक का अनुमान;

4. एक्सेल स्प्रेडशीट की मानक प्रक्रियाओं और कार्यों का उपयोग करके गणना की शुद्धता की जांच करें।

5. परिणामों का विश्लेषण करें, निष्कर्ष और सिफारिशें तैयार करें।

4. चयनित प्रतिगमन समीकरण की पर्याप्तता का सामान्य मूल्यांकन करें;

1. सन्निकटन गुणांक के मूल्यों के आधार पर समीकरण की पर्याप्तता का आकलन करना;

2. निर्धारण गुणांक के मूल्यों के आधार पर समीकरण की पर्याप्तता का आकलन करना;

3. फिशर मानदंड का उपयोग करके समीकरण की पर्याप्तता का आकलन करना;

4. प्रतिगमन समीकरण के मापदंडों की पर्याप्तता का सामान्य मूल्यांकन करें;

5. एक्सेल स्प्रेडशीट की मानक प्रक्रियाओं और कार्यों का उपयोग करके गणना की शुद्धता की जांच करें।

6. परिणामों का विश्लेषण करें, निष्कर्ष और सिफारिशें तैयार करें।

1. एक्सेल स्प्रेडशीट फ़ंक्शंस विज़ार्ड की मानक प्रक्रियाओं का उपयोग करना ("गणितीय" और "सांख्यिकीय" अनुभागों से);

2. डेटा तैयारी और LINEST फ़ंक्शन का उपयोग करने की विशेषताएं;

3. डेटा तैयारी और "भविष्यवाणी" फ़ंक्शन का उपयोग करने की विशेषताएं।

1. एक्सेल स्प्रेडशीट डेटा विश्लेषण पैकेज की मानक प्रक्रियाओं का उपयोग करना;

2. डेटा तैयारी और "रिग्रेशन" प्रक्रिया को लागू करने की विशेषताएं;

3. प्रतिगमन विश्लेषण तालिका डेटा की व्याख्या और संश्लेषण;

4. विचरण तालिका के विश्लेषण से डेटा की व्याख्या और संश्लेषण;

5. प्रतिगमन समीकरण के मापदंडों के महत्व का आकलन करने के लिए तालिका से डेटा की व्याख्या और सामान्यीकरण;

किसी एक विकल्प के आधार पर प्रयोगशाला कार्य करते समय, आपको निम्नलिखित विशिष्ट कार्य पूरे करने होंगे:

1. अध्ययनाधीन कारकों के संबंध के लिए समीकरण के रूप का चयन करें;

2. प्रतिगमन समीकरण के पैरामीटर निर्धारित करें;

3. अध्ययनाधीन कारकों के घनिष्ठ संबंध का आकलन करें;

4. चयनित प्रतिगमन समीकरण की पर्याप्तता का आकलन करें;

5. प्रतिगमन समीकरण के मापदंडों के सांख्यिकीय महत्व का आकलन करें।

6. एक्सेल स्प्रेडशीट की मानक प्रक्रियाओं और कार्यों का उपयोग करके गणना की शुद्धता की जांच करें।

7. परिणामों का विश्लेषण करें, निष्कर्ष और सिफारिशें तैयार करें।

"अर्थमितीय अनुसंधान में युग्मित रैखिक प्रतिगमन और सहसंबंध" विषय पर व्यावहारिक और प्रयोगशाला कार्य के लिए असाइनमेंट।

विकल्प 1 विकल्प 2 विकल्प 3 विकल्प 4 विकल्प 5
एक्स एक्स एक्स एक्स एक्स
विकल्प 6 विकल्प 7 विकल्प 8 विकल्प 9 विकल्प 10
एक्स एक्स एक्स एक्स एक्स

सामाजिक-आर्थिक अनुसंधान में अक्सर सीमित आबादी में या नमूना डेटा के साथ काम करना आवश्यक होता है। इसलिए, प्रतिगमन समीकरण के गणितीय मापदंडों के बाद, सांख्यिकीय महत्व के लिए उनका और समग्र रूप से समीकरण का मूल्यांकन करना आवश्यक है, अर्थात। यह सुनिश्चित करना आवश्यक है कि परिणामी समीकरण और उसके पैरामीटर गैर-यादृच्छिक कारकों के प्रभाव में बने हों।

सबसे पहले, समग्र रूप से समीकरण के सांख्यिकीय महत्व का आकलन किया जाता है। मूल्यांकन आम तौर पर फिशर एफ परीक्षण का उपयोग करके किया जाता है। एफ-मानदंड की गणना भिन्नताओं को जोड़ने के नियम पर आधारित है। अर्थात्, सामान्य फैलाव विशेषता-परिणाम = कारक फैलाव + अवशिष्ट फैलाव।

वास्तविक कीमत

सैद्धांतिक कीमत
एक प्रतिगमन समीकरण का निर्माण करके, आप परिणाम विशेषता के सैद्धांतिक मूल्य की गणना कर सकते हैं, यानी। इसके मापदंडों को ध्यान में रखते हुए प्रतिगमन समीकरण का उपयोग करके गणना की जाती है।

ये मान विश्लेषण में शामिल कारकों के प्रभाव में गठित परिणाम-विशेषता को चित्रित करेंगे।

विश्लेषण में शामिल नहीं किए गए अन्य कारकों के प्रभाव के कारण, परिणाम विशेषता के वास्तविक मूल्यों और प्रतिगमन समीकरण के आधार पर गणना किए गए मूल्यों के बीच हमेशा विसंगतियां (अवशेष) होती हैं।

परिणाम विशेषता के सैद्धांतिक और वास्तविक मूल्यों के बीच के अंतर को अवशेष कहा जाता है। परिणाम विशेषता की सामान्य भिन्नता:

विश्लेषण में शामिल कारकों की विशेषताओं में भिन्नता के कारण परिणाम विशेषता में भिन्नता का मूल्यांकन परिणामों के सैद्धांतिक मूल्यों की तुलना के माध्यम से किया जाता है। विशेषता और उसके औसत मूल्य। परिणामी विशेषता के सैद्धांतिक और वास्तविक मूल्यों की तुलना के माध्यम से अवशिष्ट भिन्नता। कुल भिन्नता, अवशिष्ट और वास्तविक में स्वतंत्रता की डिग्री की अलग-अलग संख्या होती है।

सामान्य, पी- अध्ययन की जा रही जनसंख्या में इकाइयों की संख्या

वास्तविक, पी- विश्लेषण में शामिल कारकों की संख्या

अवशिष्ट

फिशर के एफ परीक्षण की गणना अनुपात के रूप में की जाती है, और स्वतंत्रता की एक डिग्री के लिए गणना की जाती है।

प्रतिगमन समीकरण के सांख्यिकीय महत्व के अनुमान के रूप में फिशर एफ परीक्षण का उपयोग करना बहुत तार्किक है। - यह परिणाम है. विशेषता, विश्लेषण में शामिल कारकों द्वारा निर्धारित की जाती है, अर्थात। यह समझाया गया परिणाम का अनुपात है। संकेत। - यह उन कारकों के कारण परिणाम विशेषता का एक (भिन्नता) है जिनके प्रभाव को ध्यान में नहीं रखा जाता है, यानी। विश्लेषण में शामिल नहीं है.

वह। एफ-परीक्षण मूल्यांकन के लिए डिज़ाइन किया गया है महत्वपूर्णअधिक . यदि यह काफी कम नहीं है, और इससे भी अधिक यदि यह अधिक है, तो विश्लेषण में उन कारकों को शामिल नहीं किया जाता है जो वास्तव में परिणाम विशेषता को प्रभावित करते हैं।

फिशर का एफ परीक्षण सारणीबद्ध है, वास्तविक मूल्य की तुलना सारणीबद्ध मूल्य से की जाती है। यदि, तो प्रतिगमन समीकरण को सांख्यिकीय रूप से महत्वपूर्ण माना जाता है। यदि, इसके विपरीत, समीकरण सांख्यिकीय रूप से महत्वपूर्ण नहीं है और व्यवहार में इसका उपयोग नहीं किया जा सकता है, तो समग्र रूप से समीकरण का महत्व सहसंबंध संकेतकों के सांख्यिकीय महत्व को इंगित करता है।

समग्र रूप से समीकरण का अनुमान लगाने के बाद, समीकरण के मापदंडों के सांख्यिकीय महत्व का मूल्यांकन करना आवश्यक है। यह मूल्यांकन छात्र के टी-सांख्यिकी का उपयोग करके किया जाता है। टी-सांख्यिकी की गणना समीकरण (मॉड्यूलो) के मापदंडों और उनके मानक माध्य वर्ग त्रुटि के अनुपात के रूप में की जाती है। यदि एक-कारक मॉडल का अनुमान लगाया जाता है, तो 2 आँकड़ों की गणना की जाती है।

सभी कंप्यूटर प्रोग्रामों में, मापदंडों के लिए मानक त्रुटि और टी-सांख्यिकी की गणना स्वयं मापदंडों की गणना के साथ की जाती है। टी-आँकड़े सारणीबद्ध। यदि मान है, तो पैरामीटर को सांख्यिकीय रूप से महत्वपूर्ण माना जाता है, अर्थात। गैर-यादृच्छिक कारकों के प्रभाव में गठित।

टी-सांख्यिकी की गणना करने का अनिवार्य रूप से मतलब शून्य परिकल्पना का परीक्षण करना है कि पैरामीटर महत्वहीन है, यानी। इसकी समानता शून्य है। एक-कारक मॉडल के साथ, 2 परिकल्पनाओं का मूल्यांकन किया जाता है: और

शून्य परिकल्पना को स्वीकार करने का महत्व स्तर स्वीकृत स्तर पर निर्भर करता है आत्मविश्वास की संभावना. इसलिए यदि शोधकर्ता संभाव्यता स्तर को 95% पर सेट करता है, तो स्वीकृति महत्व स्तर की गणना की जाएगी, इसलिए, यदि महत्व स्तर ≥ 0.05 है, तो इसे स्वीकार किया जाता है और मापदंडों को सांख्यिकीय रूप से महत्वहीन माना जाता है। यदि , तो विकल्प अस्वीकार कर दिया जाता है और स्वीकार कर लिया जाता है: और .

सांख्यिकीय सॉफ़्टवेयर पैकेज अशक्त परिकल्पनाओं को स्वीकार करने के लिए महत्व स्तर भी प्रदान करते हैं। प्रतिगमन समीकरण और उसके मापदंडों के महत्व का आकलन करने से निम्नलिखित परिणाम मिल सकते हैं:

सबसे पहले, समग्र रूप से समीकरण महत्वपूर्ण है (एफ-परीक्षण के अनुसार) और समीकरण के सभी पैरामीटर भी सांख्यिकीय रूप से महत्वपूर्ण हैं। इसका मतलब यह है कि परिणामी समीकरण का उपयोग दोनों को लेने के लिए किया जा सकता है प्रबंधन निर्णय, और पूर्वानुमान के लिए।

दूसरे, एफ-परीक्षण के अनुसार, समीकरण सांख्यिकीय रूप से महत्वपूर्ण है, लेकिन समीकरण का कम से कम एक पैरामीटर महत्वपूर्ण नहीं है। समीकरण का उपयोग विश्लेषण किए जा रहे कारकों के संबंध में प्रबंधन निर्णय लेने के लिए किया जा सकता है, लेकिन पूर्वानुमान के लिए इसका उपयोग नहीं किया जा सकता है।

तीसरा, समीकरण सांख्यिकीय रूप से महत्वपूर्ण नहीं है, या एफ-परीक्षण के अनुसार समीकरण महत्वपूर्ण है, लेकिन परिणामी समीकरण के सभी पैरामीटर महत्वपूर्ण नहीं हैं। समीकरण का उपयोग किसी भी उद्देश्य के लिए नहीं किया जा सकता है।

प्रतिगमन समीकरण को परिणाम-विशेषता और कारक-विशेषताओं के बीच संबंध के एक मॉडल के रूप में मान्यता देने के लिए, यह आवश्यक है कि सभी सबसे महत्वपूर्ण कारक, परिणाम का निर्धारण करना, ताकि समीकरण के मापदंडों की सार्थक व्याख्या अध्ययन की जा रही घटना में सैद्धांतिक रूप से आधारित कनेक्शन से मेल खाए। निर्धारण R2 का गुणांक > 0.5 होना चाहिए।

एकाधिक प्रतिगमन समीकरण का निर्माण करते समय, तथाकथित समायोजित निर्धारण गुणांक (आर 2) का उपयोग करके मूल्यांकन करने की सलाह दी जाती है। विश्लेषण में शामिल कारकों की संख्या के साथ R2 का मूल्य (साथ ही सहसंबंध) बढ़ता है। गुणांक का मान विशेष रूप से छोटी आबादी में अधिक अनुमानित है। नकारात्मक प्रभाव को दबाने के लिए, आर 2 और सहसंबंधों को स्वतंत्रता की डिग्री की संख्या को ध्यान में रखते हुए समायोजित किया जाता है, अर्थात। कुछ कारकों को शामिल करने पर स्वतंत्र रूप से भिन्न तत्वों की संख्या।

निर्धारण का समायोजित गुणांक

पी-जनसंख्या का आकार/अवलोकनों की संख्या

- विश्लेषण में शामिल कारकों की संख्या

एन-1- स्वतंत्रता की डिग्री की संख्या

(1-आर 2)- परिणामी विशेषता के शेष/अस्पष्टीकृत विचरण का मान

हमेशा कम आर 2. के आधार पर समीकरणों के अनुमानों की तुलना कर सकते हैं अलग-अलग नंबरविश्लेषण किये गये कारक.

34. समय श्रृंखला के अध्ययन की समस्याएँ।

समय शृंखला को समय शृंखला या समय शृंखला कहा जाता है। एक समय श्रृंखला एक विशेष घटना (जीडीपी वॉल्यूम 90 से 98 तक) को दर्शाने वाले संकेतकों का एक समय-क्रमबद्ध अनुक्रम है। समय श्रृंखला का अध्ययन करने का उद्देश्य अध्ययन के तहत घटना (मुख्य प्रवृत्ति) के विकास के पैटर्न की पहचान करना और इस आधार पर पूर्वानुमान लगाना है। आरडी की परिभाषा से यह निष्कर्ष निकलता है कि किसी भी श्रृंखला में दो तत्व होते हैं: समय टी और श्रृंखला का स्तर (सूचक के वे विशिष्ट मान जिनके आधार पर आरडी श्रृंखला बनाई जाती है)। डीआर श्रृंखला हो सकती है 1) क्षण - श्रृंखला, जिसके संकेतक एक निश्चित समय पर, एक निश्चित तिथि पर दर्ज किए जाते हैं, 2) अंतराल - श्रृंखला, जिसके संकेतक एक निश्चित अवधि के लिए प्राप्त किए जाते हैं (1. जनसंख्या की सेंट पीटर्सबर्ग, 2. अवधि के लिए सकल घरेलू उत्पाद की मात्रा)। श्रृंखला को क्षण और अंतराल में विभाजित करना आवश्यक है, क्योंकि यह डीआर श्रृंखला के कुछ संकेतकों की गणना की विशिष्टता निर्धारित करता है। स्तरों का योग अंतराल श्रृंखलाएक सार्थक रूप से व्याख्या करने योग्य परिणाम देता है, जिसे क्षण श्रृंखला के स्तरों के योग के बारे में नहीं कहा जा सकता है, क्योंकि बाद में बार-बार गिनती होती है। समय श्रृंखला के विश्लेषण में सबसे महत्वपूर्ण समस्या श्रृंखला स्तरों की तुलनीयता की समस्या है। यह अवधारणा बहुत विविध है. गणना पद्धतियों और जनसंख्या इकाइयों के क्षेत्र और कवरेज के संदर्भ में स्तर तुलनीय होना चाहिए। यदि डीआर श्रृंखला का निर्माण लागत के संदर्भ में किया गया है, तो सभी स्तरों को तुलनीय कीमतों में प्रस्तुत या गणना की जानी चाहिए। अंतराल श्रृंखला का निर्माण करते समय, स्तरों को समय की समान अवधियों को चिह्नित करना चाहिए। क्षण श्रृंखला का निर्माण करते समय, स्तरों को उसी तिथि पर दर्ज किया जाना चाहिए। डीआर श्रृंखला पूर्ण या अपूर्ण हो सकती है। आधिकारिक प्रकाशनों में अपूर्ण पंक्तियों का उपयोग किया जाता है (1980,1985,1990,1995,1996,1997,1998,1999...)। व्यापक विश्लेषणआरडी में निम्नलिखित बिंदुओं का अध्ययन शामिल है:

1. आरडी स्तरों में परिवर्तन के संकेतकों की गणना

2. औसत आरडी संकेतकों की गणना

3. श्रृंखला की मुख्य प्रवृत्ति की पहचान करना, ट्रेंड मॉडल का निर्माण करना

4. आरडी में ऑटोसहसंबंध का मूल्यांकन, ऑटोरेग्रेसिव मॉडल का निर्माण

5. आरडी सहसंबंध (एम/वाई डीआर श्रृंखला के बीच कनेक्शन का अध्ययन)

6. टैक्सीवे पूर्वानुमान।

35. समय श्रृंखला स्तरों में परिवर्तन के संकेतक .

में सामान्य रूप से देखें RowD का प्रतिनिधित्व किया जा सकता है:

y - डीआर स्तर, टी - क्षण या समय की अवधि जिससे स्तर (संकेतक) संबंधित है, एन - डीआर श्रृंखला की लंबाई (अवधि की संख्या)। गतिशीलता की एक श्रृंखला का अध्ययन करते समय, निम्नलिखित संकेतकों की गणना की जाती है: 1. पूर्ण विकास, 2. विकास गुणांक (विकास दर), 3. त्वरण, 4. विकास गुणांक (विकास दर), 5. निरपेक्ष मूल्य 1% की बढ़ोतरी. परिकलित संकेतक इस प्रकार हो सकते हैं: 1. श्रृंखला - श्रृंखला के प्रत्येक स्तर की तुलना उसके ठीक पिछले स्तर से करके प्राप्त की जाती है, 2. बुनियादी - तुलना के आधार के रूप में चयनित स्तर के साथ तुलना करके प्राप्त की जाती है (जब तक कि विशेष रूप से न कहा गया हो, श्रृंखला का पहला स्तर) श्रृंखला को आधार के रूप में लिया जाता है)। 1. श्रृंखला निरपेक्ष वृद्धि:. दिखाता है कि कितना कम या ज्यादा. श्रृंखला निरपेक्ष वृद्धि को स्तरों में परिवर्तन की दर का संकेतक कहा जाता है समय श्रृंखला. आधारभूत पूर्ण वृद्धि: . यदि श्रृंखला स्तर % में व्यक्त सापेक्ष संकेतक हैं, तो पूर्ण वृद्धि परिवर्तन बिंदुओं में व्यक्त की जाती है। 2. विकास दर (विकास दर):इसकी गणना श्रृंखला के स्तरों के ठीक पूर्ववर्ती स्तरों (श्रृंखला वृद्धि गुणांक) या तुलना के आधार के रूप में लिए गए स्तर (बुनियादी विकास गुणांक) के अनुपात के रूप में की जाती है:। यह दर्शाता है कि श्रृंखला के प्रत्येक स्तर पर कितनी बार > या< предшествующего или базисного. На основе коэффициентов роста рассчитываются темпы роста. Это коэффициенты роста, выраженные в %ах: 3. पूर्ण वृद्धि के आधार पर सूचक की गणना की जाती है - पूर्ण विकास में तेजी: . त्वरण पूर्ण वृद्धि में पूर्ण वृद्धि है। मूल्यांकन करता है कि लाभ स्वयं कैसे बदलते हैं, चाहे वे स्थिर हों या तेज (बढ़ते हुए) हों। 4. विकास दरतुलनात्मक आधार पर वृद्धि का अनुपात है। में व्यक्त किया %: ; . विकास दर माइनस 100% है। दिखाता है कि श्रृंखला का दिया गया स्तर कितना % है > या< предшествующего либо базисного. 5. абсолютное значение 1% прироста. Рассчитывается как отношение абсолютного прироста к темпу прироста, т.е.: - сотая доля предыдущего уровня. Все эти показатели рассчитываются для оценки степени изменения уровней ряда. Цепные коэффициенты и темпы роста называются показателями интенсивности изменения уровней ДРядов.

2. औसत आरडी संकेतकों की गणना औसत पंक्ति स्तर, औसत पूर्ण वृद्धि, औसत विकास दर और औसत विकास दर की गणना की जाती है। औसत संकेतकों की गणना जानकारी को सारांशित करने और विभिन्न श्रृंखलाओं में उनके परिवर्तन के स्तर और संकेतकों की तुलना करना संभव बनाने के उद्देश्य से की जाती है। 1. मध्य पंक्ति स्तरए) अंतराल समय श्रृंखला के लिए सरल अंकगणितीय माध्य का उपयोग करके गणना की जाती है:, जहां एन समय श्रृंखला में स्तरों की संख्या है; बी) क्षण श्रृंखला के लिए, औसत स्तर की गणना एक विशिष्ट सूत्र का उपयोग करके की जाती है, जिसे कालानुक्रमिक औसत कहा जाता है: . 2. औसत पूर्ण वृद्धिसरल अंकगणितीय औसत के आधार पर श्रृंखला निरपेक्ष वृद्धि के आधार पर गणना की गई:

. 3. औसत विकास दरज्यामितीय माध्य सूत्र का उपयोग करके श्रृंखला वृद्धि गुणांक के आधार पर गणना की जाती है:। डीआर श्रृंखला के औसत संकेतकों पर टिप्पणी करते समय, 2 बिंदुओं को इंगित करना आवश्यक है: वह अवधि जो विश्लेषण किए गए संकेतक की विशेषता है और वह समय अंतराल जिसके लिए डीआर श्रृंखला बनाई गई थी। 4. औसत विकास दर: . 5. औसत विकास दर: .

प्रतिगमन विश्लेषण एक सांख्यिकीय अनुसंधान पद्धति है जो आपको एक या अधिक स्वतंत्र चर पर किसी विशेष पैरामीटर की निर्भरता दिखाने की अनुमति देती है। पूर्व-कंप्यूटर युग में, इसका उपयोग काफी कठिन था, खासकर जब बात बड़ी मात्रा में डेटा की हो। आज, एक्सेल में रिग्रेशन बनाना सीखकर, आप कुछ ही मिनटों में जटिल सांख्यिकीय समस्याओं को हल कर सकते हैं। नीचे अर्थशास्त्र के क्षेत्र से विशिष्ट उदाहरण दिए गए हैं।

प्रतिगमन के प्रकार

यह अवधारणा स्वयं 1886 में गणित में पेश की गई थी। प्रतिगमन होता है:

  • रैखिक;
  • परवलयिक;
  • बेहोश करना;
  • घातीय;
  • अतिपरवलिक;
  • प्रदर्शनात्मक;
  • लघुगणक.

उदाहरण 1

आइए 6 औद्योगिक उद्यमों में औसत वेतन पर नौकरी छोड़ने वाले टीम के सदस्यों की संख्या की निर्भरता निर्धारित करने की समस्या पर विचार करें।

काम। छह उद्यमों में हमने औसत मासिक विश्लेषण किया वेतनऔर उन कर्मचारियों की संख्या जो इसके कारण चले गए इच्छानुसार. सारणीबद्ध रूप में हमारे पास है:

छोड़ने वालों की संख्या

वेतन

30,000 रूबल

35,000 रूबल

40,000 रूबल

45,000 रूबल

50,000 रूबल

55,000 रूबल

60,000 रूबल

6 उद्यमों में औसत वेतन पर नौकरी छोड़ने वाले श्रमिकों की संख्या की निर्भरता निर्धारित करने के कार्य के लिए, प्रतिगमन मॉडल में समीकरण Y = a 0 + a 1 x 1 +...+ak x k का रूप है, जहां x i हैं चर को प्रभावित करने वाले, a i प्रतिगमन गुणांक हैं, और k कारकों की संख्या है।

इस समस्या के लिए, Y कर्मचारियों को छोड़ने का संकेतक है, और प्रभावित करने वाला कारक वेतन है, जिसे हम X द्वारा दर्शाते हैं।

एक्सेल स्प्रेडशीट प्रोसेसर की क्षमताओं का उपयोग करना

एक्सेल में प्रतिगमन विश्लेषण मौजूदा सारणीबद्ध डेटा में अंतर्निहित फ़ंक्शन लागू करने से पहले होना चाहिए। हालाँकि, इन उद्देश्यों के लिए बहुत उपयोगी "विश्लेषण पैक" ऐड-ऑन का उपयोग करना बेहतर है। इसे सक्रिय करने के लिए आपको चाहिए:

  • "फ़ाइल" टैब से "विकल्प" अनुभाग पर जाएँ;
  • खुलने वाली विंडो में, "ऐड-ऑन" पंक्ति का चयन करें;
  • नीचे "प्रबंधन" लाइन के दाईं ओर स्थित "गो" बटन पर क्लिक करें;
  • "विश्लेषण पैकेज" नाम के बगल में स्थित बॉक्स को चेक करें और "ओके" पर क्लिक करके अपने कार्यों की पुष्टि करें।

यदि सब कुछ सही ढंग से किया जाता है, तो आवश्यक बटन एक्सेल वर्कशीट के ऊपर स्थित "डेटा" टैब के दाईं ओर दिखाई देगा।

एक्सेल में

अब जब हमारे पास अर्थमितीय गणना करने के लिए सभी आवश्यक आभासी उपकरण हैं, तो हम अपनी समस्या का समाधान शुरू कर सकते हैं। इसके लिए:

  • "डेटा विश्लेषण" बटन पर क्लिक करें;
  • खुलने वाली विंडो में, "रिग्रेशन" बटन पर क्लिक करें;
  • दिखाई देने वाले टैब में, Y (छोड़ने वाले कर्मचारियों की संख्या) और X (उनका वेतन) के लिए मानों की सीमा दर्ज करें;
  • हम "ओके" बटन दबाकर अपने कार्यों की पुष्टि करते हैं।

परिणामस्वरूप, प्रोग्राम स्वचालित रूप से प्रतिगमन विश्लेषण डेटा के साथ एक नई स्प्रेडशीट भर देगा। टिप्पणी! एक्सेल आपको इस उद्देश्य के लिए पसंदीदा स्थान को मैन्युअल रूप से सेट करने की अनुमति देता है। उदाहरण के लिए, यह वही शीट हो सकती है जहां Y और X मान स्थित हैं, या यहां तक ​​कि विशेष रूप से ऐसे डेटा को संग्रहीत करने के लिए डिज़ाइन की गई एक नई कार्यपुस्तिका भी हो सकती है।

आर-वर्ग के लिए प्रतिगमन परिणामों का विश्लेषण

एक्सेल में, विचाराधीन उदाहरण में डेटा के प्रसंस्करण के दौरान प्राप्त डेटा का रूप है:

सबसे पहले आपको आर-स्क्वायर वैल्यू पर ध्यान देना चाहिए। यह निर्धारण के गुणांक का प्रतिनिधित्व करता है। इस उदाहरण में, आर-वर्ग = 0.755 (75.5%), यानी, मॉडल के परिकलित पैरामीटर विचाराधीन मापदंडों के बीच संबंध को 75.5% तक समझाते हैं। निर्धारण के गुणांक का मूल्य जितना अधिक होगा, किसी विशिष्ट कार्य के लिए चयनित मॉडल उतना ही अधिक उपयुक्त होगा। इसे वास्तविक स्थिति का सही वर्णन करने वाला माना जाता है जब आर-स्क्वायर मान 0.8 से ऊपर होता है। यदि आर-वर्ग है<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

बाधाओं का विश्लेषण

संख्या 64.1428 दर्शाती है कि यदि हम जिस मॉडल पर विचार कर रहे हैं उसमें सभी चर xi को शून्य पर रीसेट कर दिया जाए तो Y का मान क्या होगा। दूसरे शब्दों में, यह तर्क दिया जा सकता है कि विश्लेषण किए गए पैरामीटर का मूल्य अन्य कारकों से भी प्रभावित होता है जो किसी विशिष्ट मॉडल में वर्णित नहीं हैं।

सेल बी18 में स्थित अगला गुणांक -0.16285, वाई पर चर एक्स के प्रभाव का भार दिखाता है। इसका मतलब है कि विचाराधीन मॉडल के भीतर कर्मचारियों का औसत मासिक वेतन -0.16285 के भार के साथ छोड़ने वालों की संख्या को प्रभावित करता है, अर्थात। इसके प्रभाव की मात्रा बिल्कुल छोटी है। "-" चिह्न इंगित करता है कि गुणांक ऋणात्मक है। यह स्पष्ट है, क्योंकि हर कोई जानता है कि उद्यम में वेतन जितना अधिक होगा, कम लोग रोजगार अनुबंध समाप्त करने या नौकरी छोड़ने की इच्छा व्यक्त करते हैं।

एकाधिक प्रतिगमन

यह शब्द फॉर्म के कई स्वतंत्र चर के साथ एक संबंध समीकरण को संदर्भित करता है:

y=f(x 1 +x 2 +…x m) + ε, जहां y परिणामी विशेषता (आश्रित चर) है, और x 1, x 2,…x m कारक विशेषताएं (स्वतंत्र चर) हैं।

पैरामीटर अनुमान

एकाधिक प्रतिगमन (एमआर) के लिए, इसे न्यूनतम वर्ग विधि (ओएलएस) का उपयोग करके किया जाता है। Y = a + b 1 x 1 +…+b m x m + ε के रूप के रैखिक समीकरणों के लिए हम सामान्य समीकरणों की एक प्रणाली बनाते हैं (नीचे देखें)

विधि के सिद्धांत को समझने के लिए, दो-कारक मामले पर विचार करें। फिर हमारे पास सूत्र द्वारा वर्णित स्थिति है

यहाँ से हमें मिलता है:

जहां σ सूचकांक में परिलक्षित संबंधित विशेषता का विचरण है।

ओएलएस मानकीकृत पैमाने पर एमआर समीकरण पर लागू होता है। इस मामले में, हमें समीकरण मिलता है:

जिसमें t y, t x 1, … t xm मानकीकृत चर हैं, जिनके लिए औसत मान 0 के बराबर हैं; β मैं मानकीकृत प्रतिगमन गुणांक हैं, और मानक विचलन 1 है।

कृपया ध्यान दें कि इस मामले में सभी β i को सामान्यीकृत और केंद्रीकृत के रूप में निर्दिष्ट किया गया है, इसलिए एक दूसरे के साथ उनकी तुलना सही और स्वीकार्य मानी जाती है। इसके अलावा, सबसे कम βi मान वाले कारकों को त्यागकर कारकों की जांच करने की प्रथा है।

रेखीय प्रतिगमन समीकरण का उपयोग करने में समस्या

मान लीजिए कि हमारे पास पिछले 8 महीनों में किसी विशिष्ट उत्पाद एन के लिए मूल्य गतिशीलता की एक तालिका है। 1850 रूबल/टी की कीमत पर इसका एक बैच खरीदने की उपयुक्तता पर निर्णय लेना आवश्यक है।

माह संख्या

महीने का नाम

उत्पाद की कीमत एन

1750 रूबल प्रति टन

1755 रूबल प्रति टन

1767 रूबल प्रति टन

1760 रूबल प्रति टन

1770 रूबल प्रति टन

1790 रूबल प्रति टन

1810 रूबल प्रति टन

1840 रूबल प्रति टन

एक्सेल स्प्रेडशीट प्रोसेसर में इस समस्या को हल करने के लिए, आपको "डेटा विश्लेषण" टूल का उपयोग करने की आवश्यकता है, जो पहले से ही ऊपर प्रस्तुत उदाहरण से ज्ञात है। इसके बाद, "रिग्रेशन" अनुभाग चुनें और पैरामीटर सेट करें। यह याद रखना चाहिए कि "इनपुट अंतराल वाई" फ़ील्ड में आश्रित चर के लिए मूल्यों की एक श्रृंखला दर्ज की जानी चाहिए (इस मामले में, वर्ष के विशिष्ट महीनों में माल की कीमतें), और "इनपुट अंतराल एक्स" में - स्वतंत्र चर (माह संख्या) के लिए. "ओके" पर क्लिक करके कार्रवाई की पुष्टि करें। एक नई शीट पर (यदि ऐसा संकेत दिया गया है) हम प्रतिगमन के लिए डेटा प्राप्त करते हैं।

उनका उपयोग करके, हम फॉर्म y=ax+b का एक रैखिक समीकरण बनाते हैं, जहां पैरामीटर a और b महीने की संख्या के नाम के साथ रेखा के गुणांक हैं और शीट से गुणांक और रेखाएं "Y-चौराहे" हैं। प्रतिगमन विश्लेषण के परिणाम. इस प्रकार, कार्य 3 के लिए रैखिक प्रतिगमन समीकरण (एलआर) इस प्रकार लिखा गया है:

उत्पाद की कीमत एन = 11.714* माह संख्या + 1727.54।

या बीजगणितीय संकेतन में

y = 11.714 x + 1727.54

परिणामों का विश्लेषण

यह तय करने के लिए कि परिणामी रैखिक प्रतिगमन समीकरण पर्याप्त है या नहीं, एकाधिक सहसंबंध (एमसीसी) और निर्धारण के गुणांक का उपयोग किया जाता है, साथ ही फिशर परीक्षण और छात्र टी परीक्षण भी किया जाता है। प्रतिगमन परिणामों के साथ एक्सेल स्प्रेडशीट में, उन्हें क्रमशः एकाधिक आर, आर-स्क्वायर, एफ-स्टेटिस्टिक और टी-स्टेटिस्टिक कहा जाता है।

केएमसी आर स्वतंत्र और आश्रित चर के बीच संभाव्य संबंध की निकटता का आकलन करना संभव बनाता है। इसका उच्च मूल्य चर "महीने की संख्या" और "प्रति 1 टन रूबल में उत्पाद एन की कीमत" के बीच काफी मजबूत संबंध को इंगित करता है। हालाँकि, इस रिश्ते की प्रकृति अज्ञात बनी हुई है।

निर्धारण के गुणांक R2 (RI) का वर्ग कुल बिखराव के अनुपात की एक संख्यात्मक विशेषता है और प्रयोगात्मक डेटा के किस भाग का बिखराव दिखाता है, अर्थात। आश्रित चर के मान रैखिक प्रतिगमन समीकरण से मेल खाते हैं। विचाराधीन समस्या में, यह मान 84.8% के बराबर है, यानी, परिणामी एसडी द्वारा सांख्यिकीय डेटा को उच्च सटीकता के साथ वर्णित किया गया है।

एफ-सांख्यिकी, जिसे फिशर परीक्षण भी कहा जाता है, का उपयोग रैखिक संबंध के महत्व का मूल्यांकन करने, इसके अस्तित्व की परिकल्पना का खंडन करने या पुष्टि करने के लिए किया जाता है।

(छात्र का परीक्षण) रैखिक संबंध के अज्ञात या मुक्त पद के साथ गुणांक के महत्व का मूल्यांकन करने में मदद करता है। यदि t-परीक्षण का मान > tcr है, तो रैखिक समीकरण के मुक्त पद की महत्वहीनता के बारे में परिकल्पना खारिज कर दी जाती है।

फ्री टर्म के लिए विचाराधीन समस्या में, एक्सेल टूल का उपयोग करके, यह प्राप्त किया गया कि t = 169.20903, और p = 2.89E-12, यानी, हमारे पास शून्य संभावना है कि फ्री टर्म के महत्व के बारे में सही परिकल्पना खारिज कर दी जाएगी। . अज्ञात t=5.79405, और p=0.001158 के गुणांक के लिए। दूसरे शब्दों में, किसी अज्ञात के लिए गुणांक के महत्व के बारे में सही परिकल्पना को अस्वीकार कर दिए जाने की संभावना 0.12% है।

इस प्रकार, यह तर्क दिया जा सकता है कि परिणामी रैखिक प्रतिगमन समीकरण पर्याप्त है।

शेयरों का एक ब्लॉक खरीदने की व्यवहार्यता की समस्या

एक्सेल में एकाधिक प्रतिगमन एक ही डेटा विश्लेषण उपकरण का उपयोग करके किया जाता है। आइए एक विशिष्ट अनुप्रयोग समस्या पर विचार करें।

एनएनएन कंपनी के प्रबंधन को एमएमएम जेएससी में 20% हिस्सेदारी खरीदने की उपयुक्तता पर निर्णय लेना होगा। पैकेज की लागत (एसपी) 70 मिलियन अमेरिकी डॉलर है। एनएनएन विशेषज्ञों ने इसी तरह के लेनदेन पर डेटा एकत्र किया है। शेयरों के ब्लॉक के मूल्य का मूल्यांकन ऐसे मापदंडों के अनुसार करने का निर्णय लिया गया, जो लाखों अमेरिकी डॉलर में व्यक्त किए गए हैं:

  • देय खाते (वीके);
  • वार्षिक कारोबार की मात्रा (वीओ);
  • प्राप्य खाते (वीडी);
  • अचल संपत्तियों की लागत (सीओएफ)।

इसके अलावा, हजारों अमेरिकी डॉलर में उद्यम के वेतन बकाया (V3 P) के पैरामीटर का उपयोग किया जाता है।

एक्सेल स्प्रेडशीट प्रोसेसर का उपयोग कर समाधान

सबसे पहले, आपको स्रोत डेटा की एक तालिका बनाने की आवश्यकता है। यह इस तरह दिख रहा है:

  • "डेटा विश्लेषण" विंडो पर कॉल करें;
  • "प्रतिगमन" अनुभाग का चयन करें;
  • "इनपुट अंतराल Y" बॉक्स में, कॉलम G से आश्रित चर के मानों की सीमा दर्ज करें;
  • "इनपुट अंतराल एक्स" विंडो के दाईं ओर लाल तीर वाले आइकन पर क्लिक करें और शीट पर कॉलम बी, सी, डी, एफ से सभी मानों की सीमा को हाइलाइट करें।

"नई वर्कशीट" आइटम को चिह्नित करें और "ओके" पर क्लिक करें।

किसी दी गई समस्या के लिए प्रतिगमन विश्लेषण प्राप्त करें।

परिणामों और निष्कर्षों का अध्ययन

हम एक्सेल स्प्रेडशीट पर ऊपर प्रस्तुत गोल डेटा से प्रतिगमन समीकरण "एकत्रित" करते हैं:

एसपी = 0.103*एसओएफ + 0.541*वीओ - 0.031*वीके +0.405*वीडी +0.691*वीजेडपी - 265.844।

अधिक परिचित गणितीय रूप में, इसे इस प्रकार लिखा जा सकता है:

y = 0.103*x1 + 0.541*x2 - 0.031*x3 +0.405*x4 +0.691*x5 - 265.844

एमएमएम जेएससी के लिए डेटा तालिका में प्रस्तुत किया गया है:

उन्हें प्रतिगमन समीकरण में प्रतिस्थापित करने पर, हमें 64.72 मिलियन अमेरिकी डॉलर का आंकड़ा मिलता है। इसका मतलब यह है कि एमएमएम जेएससी के शेयर खरीदने लायक नहीं हैं, क्योंकि उनका 70 मिलियन अमेरिकी डॉलर का मूल्य काफी बढ़ा हुआ है।

जैसा कि आप देख सकते हैं, एक्सेल स्प्रेडशीट और रिग्रेशन समीकरण के उपयोग ने एक बहुत ही विशिष्ट लेनदेन की व्यवहार्यता के संबंध में एक सूचित निर्णय लेना संभव बना दिया है।

अब आप जानते हैं कि प्रतिगमन क्या है। ऊपर चर्चा किए गए एक्सेल उदाहरण आपको अर्थमिति के क्षेत्र में व्यावहारिक समस्याओं को हल करने में मदद करेंगे।



साइट पर नया

>

सबसे लोकप्रिय