घर अक़ल ढ़ाड़ें युग्मित रैखिक सहसंबंध गुणांक का मैट्रिक्स। जोड़ी सहसंबंध गुणांक के मैट्रिक्स का विश्लेषण

युग्मित रैखिक सहसंबंध गुणांक का मैट्रिक्स। जोड़ी सहसंबंध गुणांक के मैट्रिक्स का विश्लेषण

प्रारंभ में मॉडल में परसभी मुख्य घटकों को शामिल करें (गणना किए गए मान कोष्ठक में दर्शाए गए हैं टी-मानदंड):

मॉडल की गुणवत्ता की विशेषता है: निर्धारण के एकाधिक गुणांक आर = 0.517, सन्निकटन की औसत सापेक्ष त्रुटि = 10.4%, अवशिष्ट विचरण एस 2= 1.79 और एफनमूदार = 121. इस तथ्य के कारण कि एफअवलोकन > एफ kr =2.85 पर α = 0.05, वि 1 = 6, वि 2= 14, प्रतिगमन समीकरण महत्वपूर्ण है और प्रतिगमन गुणांकों में से कम से कम एक - β 1, β 2, β 3, β 4 - शून्य के बराबर नहीं है।

यदि प्रतिगमन समीकरण का महत्व (परिकल्पना) एच 0:β 1 = β 2 = β 3 = β 4 = 0 की जाँच α = 0.05 पर की गई, तो प्रतिगमन गुणांक का महत्व, अर्थात। परिकल्पना H0: β जे = 0 (जे = 1, 2, 3, 4), का परीक्षण 0.05 से अधिक महत्व स्तर पर किया जाना चाहिए, उदाहरण के लिए α पर = 0.1. फिर α = 0.1 पर, वी= 14 परिमाण टीकरोड़ = 1.76, और महत्वपूर्ण, समीकरण (53.41) के अनुसार, प्रतिगमन गुणांक β 1, β 2, β 3 हैं।

यह ध्यान में रखते हुए कि मुख्य घटक एक दूसरे के साथ सहसंबद्ध नहीं हैं, हम समीकरण से सभी महत्वहीन गुणांकों को तुरंत हटा सकते हैं, और समीकरण रूप ले लेगा

(53.42)

समीकरण (53.41) और (53.42) की तुलना करने पर, हम देखते हैं कि महत्वहीन प्रमुख घटकों को छोड़कर च 4और च 5, समीकरण के गुणांकों के मूल्यों को प्रभावित नहीं किया बी 0 = 9,52, बी 1 = 0,93, बी 2 = 0.66 और संगत टी जे (जे = 0, 1, 2, 3).

यह प्रमुख घटकों की असंबंधित प्रकृति के कारण है। यहां जो दिलचस्प है वह प्रारंभिक संकेतकों (53.22), (53.23) और प्रमुख घटकों (53.41), (53.42) के लिए प्रतिगमन समीकरणों का समानांतर है।

समीकरण (53.42) महत्वपूर्ण है क्योंकि एफओब्स = 194 > एफकरोड़ = 3.01, α = 0.05 पर पाया गया, वि 1 = 4, वि 2= 16. चूँकि, समीकरण के गुणांक भी महत्वपूर्ण हैं टी जे > टीकरोड़ . = 1.746, α = 0.01 के अनुरूप, वी= 16 के लिए जे= 0, 1, 2, 3. निर्धारण गुणांक आर= 0.486 इंगित करता है कि 48.6% भिन्नता है परपहले तीन मुख्य घटकों के प्रभाव के कारण।

समीकरण (53.42) की विशेषता सन्निकटन की औसत सापेक्ष त्रुटि = 9.99% और एक अवशिष्ट विचरण है एस 2 = 1,91.

प्रारंभिक संकेतकों के आधार पर प्रमुख घटकों (53.42) पर प्रतिगमन समीकरण में प्रतिगमन मॉडल (53.23) की तुलना में थोड़ा बेहतर अनुमानित गुण हैं: आर= 0,486 > आर= 0,469; = 9,99% < (एक्स) = 10.5% और एस 2 (एफ) = 1,91 < एस 2 (एक्स) = 1.97. इसके अतिरिक्त, समीकरण (53.42) में, प्रमुख घटक हैं रैखिक कार्यसभी प्रारंभिक संकेतक, जबकि समीकरण (53.23) में केवल दो चर शामिल हैं ( एक्स 1और एक्स 4). कई मामलों में, यह ध्यान रखना आवश्यक है कि मॉडल (53.42) की व्याख्या करना मुश्किल है, क्योंकि इसमें एक तिहाई शामिल है मुख्य घटक च 3, जिसकी हमने व्याख्या नहीं की है और जिसका प्रारंभिक संकेतकों के कुल फैलाव में योगदान है ( एक्स 1, ..., x 5)केवल 8.6% है. हालाँकि, अपवाद च 3समीकरण (53.42) से मॉडल के अनुमानित गुण काफी खराब हो जाते हैं: आर= 0.349; = 12.4% और एस 2(एफ) = 2.41. फिर उपज के प्रतिगमन मॉडल के रूप में समीकरण (53.23) को चुनने की सलाह दी जाती है।

क्लस्टर विश्लेषण

में सांख्यिकीय अनुसंधानप्राथमिक डेटा का समूहन मुख्य समाधान तकनीक है वर्गीकरण समस्याएँ,और इसलिए एकत्रित जानकारी के साथ आगे के सभी कार्यों का आधार।

परंपरागत रूप से, इस समस्या को निम्नानुसार हल किया जाता है। किसी वस्तु का वर्णन करने वाली कई विशेषताओं में से, एक का चयन किया जाता है, जो शोधकर्ता के दृष्टिकोण से सबसे अधिक जानकारीपूर्ण होती है, और डेटा को इस सुविधा के मूल्यों के अनुसार समूहीकृत किया जाता है। यदि महत्व की डिग्री के आधार पर आपस में क्रमबद्ध कई मानदंडों के आधार पर वर्गीकरण करना आवश्यक है, तो पहले वर्गीकरण को पहले मानदंड के अनुसार किया जाता है, फिर प्रत्येक परिणामी वर्ग को दूसरे मानदंड के अनुसार उपवर्गों में विभाजित किया जाता है। , वगैरह। अधिकांश संयोजनात्मक सांख्यिकीय समूहों का निर्माण इसी तरह से किया जाता है।

ऐसे मामलों में जहां वर्गीकरण विशेषताओं को व्यवस्थित करना संभव नहीं है, बहुआयामी समूहीकरण की सबसे सरल विधि का उपयोग किया जाता है - एक अभिन्न संकेतक (सूचकांक) का निर्माण, प्रारंभिक विशेषताओं पर कार्यात्मक रूप से निर्भर, इस संकेतक के अनुसार वर्गीकरण के बाद।

इस दृष्टिकोण का विकास कारक या घटक विश्लेषण विधियों का उपयोग करके प्राप्त कई सामान्यीकरण संकेतकों (प्रमुख घटकों) के आधार पर एक वर्गीकरण विकल्प है।

यदि कई विशेषताएं (प्रारंभिक या सामान्यीकृत) हैं, तो वर्गीकरण समस्या को क्लस्टर विश्लेषण विधियों द्वारा हल किया जा सकता है, जो प्रशिक्षण नमूनों की अनुपस्थिति से अन्य बहुआयामी वर्गीकरण विधियों से भिन्न होते हैं, अर्थात। जनसंख्या के वितरण के बारे में प्राथमिक जानकारी।

वर्गीकरण समस्या को हल करने की योजनाओं के बीच अंतर काफी हद तक "समानता" और "समानता की डिग्री" की अवधारणाओं से निर्धारित होता है।

कार्य का लक्ष्य तैयार होने के बाद, गुणवत्ता मानदंड, उद्देश्य फ़ंक्शन निर्धारित करने का प्रयास करना स्वाभाविक है, जिसके मूल्य हमें तुलना करने की अनुमति देंगे विभिन्न योजनाएँवर्गीकरण.

आर्थिक अनुसंधान में उद्देश्य समारोह, एक नियम के रूप में, वस्तुओं के एक सेट पर निर्धारित कुछ पैरामीटर को कम करना चाहिए (उदाहरण के लिए, उपकरणों को वर्गीकृत करने का उद्देश्य एक समूहीकरण हो सकता है जो मरम्मत कार्य के लिए समय और धन की कुल लागत को कम करता है)।

ऐसे मामलों में जहां कार्य के लक्ष्य को औपचारिक बनाना संभव नहीं है, वर्गीकरण की गुणवत्ता की कसौटी पाए गए समूहों की सार्थक व्याख्या की संभावना हो सकती है।

आइए निम्नलिखित समस्या पर विचार करें। सेट का अध्ययन किया जाए एनवस्तुएं, जिनमें से प्रत्येक की विशेषता है केमापा संकेत. इस समग्रता को ऐसे समूहों (वर्गों) में विभाजित करना आवश्यक है जो एक निश्चित अर्थ में सजातीय हों। साथ ही, वितरण की प्रकृति के बारे में व्यावहारिक रूप से कोई पूर्व जानकारी नहीं है के-आयामी वेक्टर एक्सकक्षाओं के अंदर.

विभाजन के परिणामस्वरूप प्राप्त समूहों को आमतौर पर क्लस्टर* (टैक्स**, छवियां) कहा जाता है, उन्हें खोजने के तरीकों को क्लस्टर विश्लेषण (क्रमशः, संख्यात्मक वर्गीकरण या स्व-सीखने के साथ पैटर्न पहचान) कहा जाता है।

* झुंड(अंग्रेजी) - कुछ सामान्य संपत्ति द्वारा विशेषता वाले तत्वों का एक समूह।

**ताहोप(अंग्रेज़ी) - किसी भी श्रेणी का एक व्यवस्थित समूह।

प्रारंभ से ही यह स्पष्ट रूप से समझना आवश्यक है कि दोनों में से किस वर्गीकरण समस्या का समाधान किया जाना है। यदि सामान्य टाइपिंग समस्या हल की जा रही है, तो अवलोकनों के सेट को अपेक्षाकृत कम संख्या में समूह क्षेत्रों में विभाजित किया जाता है (उदाहरण के लिए, अंतराल विविधता श्रृंखलाएक-आयामी अवलोकन के मामले में) ताकि ऐसे एक क्षेत्र के तत्व एक-दूसरे के जितना संभव हो उतना करीब हों।

एक अन्य समस्या का समाधान एक दूसरे से एक निश्चित दूरी पर स्थित स्पष्ट रूप से परिभाषित समूहों में अवलोकन परिणामों के प्राकृतिक स्तरीकरण को निर्धारित करना है।

यदि पहली टाइपिंग समस्या का हमेशा एक समाधान होता है, तो दूसरे मामले में यह पता चल सकता है कि अवलोकनों का सेट समूहों में प्राकृतिक स्तरीकरण को प्रकट नहीं करता है, अर्थात। एक क्लस्टर बनाता है.

हालाँकि कई क्लस्टर विश्लेषण विधियाँ काफी प्राथमिक हैं, लेकिन जिन कार्यों में उन्हें प्रस्तावित किया गया था उनमें से अधिकांश पिछले दशक के हैं। यह इस तथ्य से समझाया गया है कि प्रभावी समाधानक्लस्टर खोज कार्य जिनमें बड़ी संख्या में अंकगणित करने की आवश्यकता होती है तार्किक संचालन, कंप्यूटर प्रौद्योगिकी के उद्भव और विकास के साथ ही संभव हो सका।

क्लस्टर विश्लेषण समस्याओं में प्रारंभिक डेटा का प्रतिनिधित्व करने का सामान्य रूप एक मैट्रिक्स है

जिनमें से प्रत्येक पंक्ति माप परिणामों का प्रतिनिधित्व करती है केजांच की गई वस्तुओं में से एक में विचार किए गए संकेत। विशिष्ट स्थितियों में, ऑब्जेक्ट ग्रुपिंग और फीचर ग्रुपिंग दोनों रुचिकर हो सकते हैं। ऐसे मामलों में जहां इन दोनों कार्यों के बीच अंतर महत्वपूर्ण नहीं है, उदाहरण के लिए, कुछ एल्गोरिदम का वर्णन करते समय, हम इस अवधारणा में केवल "ऑब्जेक्ट" शब्द का उपयोग करेंगे, जिसमें "फ़ीचर" शब्द भी शामिल है।

मैट्रिक्स एक्सक्लस्टर विश्लेषण समस्याओं में डेटा प्रस्तुत करने का एकमात्र तरीका नहीं है। कभी-कभी प्रारंभिक जानकारी वर्ग मैट्रिक्स के रूप में दी जाती है

तत्व आर आईजेजो निकटता की डिग्री निर्धारित करता है मैं-वें पर आपत्ति जे-मु.

अधिकांश क्लस्टर विश्लेषण एल्गोरिदम पूरी तरह से दूरी (या निकटता) के मैट्रिक्स पर आधारित होते हैं या इसके व्यक्तिगत तत्वों की गणना की आवश्यकता होती है, इसलिए यदि डेटा फॉर्म में प्रस्तुत किया गया है एक्स,तब समूहों की खोज की समस्या को हल करने में पहला कदम वस्तुओं या सुविधाओं के बीच दूरी, या निकटता की गणना के लिए एक विधि का चुनाव होगा।

विशेषताओं के बीच निकटता निर्धारित करने का प्रश्न हल करना कुछ आसान है। एक नियम के रूप में, सुविधाओं का क्लस्टर विश्लेषण समान लक्ष्यों का पीछा करता है कारक विश्लेषण: परस्पर जुड़ी विशेषताओं के समूहों की पहचान जो अध्ययन की जा रही वस्तुओं के एक निश्चित पहलू को दर्शाते हैं। इस मामले में निकटता का माप भिन्न है सांख्यिकीय गुणांकसंचार.


सम्बंधित जानकारी.


कई संकेतकों के बीच निर्भरता की डिग्री निर्धारित करने के लिए, एकाधिक सहसंबंध गुणांक का उपयोग किया जाता है। फिर उन्हें एक अलग तालिका में संक्षेपित किया जाता है, जिसे सहसंबंध मैट्रिक्स कहा जाता है। ऐसे मैट्रिक्स की पंक्तियों और स्तंभों के नाम उन मापदंडों के नाम हैं जिनकी एक दूसरे पर निर्भरता स्थापित होती है। पंक्तियों और स्तंभों के प्रतिच्छेदन पर, संबंधित सहसंबंध गुणांक स्थित होते हैं। आइए जानें कि आप एक्सेल टूल का उपयोग करके समान गणना कैसे कर सकते हैं।

सहसंबंध गुणांक के आधार पर, विभिन्न संकेतकों के बीच संबंध के स्तर को निम्नानुसार निर्धारित करने की प्रथा है:

  • 0 - 0.3 - कोई कनेक्शन नहीं;
  • 0.3 - 0.5 - कमजोर कनेक्शन;
  • 0.5 - 0.7 - औसत कनेक्शन;
  • 0.7 - 0.9 - उच्च;
  • 0.9 – 1 – बहुत मजबूत.

अगर सहसंबंध गुणांकनकारात्मक, इसका मतलब है कि मापदंडों के बीच संबंध उलटा है।

एक्सेल में सहसंबंध मैट्रिक्स बनाने के लिए, आप पैकेज में शामिल एक टूल का उपयोग करते हैं "डेटा विश्लेषण". इसे ही कहते हैं - "सह - संबंध". आइए जानें कि इसका उपयोग एकाधिक सहसंबंध मैट्रिक्स की गणना के लिए कैसे किया जा सकता है।

चरण 1: विश्लेषण पैकेज सक्रिय करें

इसे तुरंत कहा जाना चाहिए कि डिफ़ॉल्ट पैकेज "डेटा विश्लेषण"अक्षम। इसलिए, सहसंबंध गुणांक की सीधे गणना की प्रक्रिया के साथ आगे बढ़ने से पहले, आपको इसे सक्रिय करने की आवश्यकता है। दुर्भाग्य से, हर उपयोगकर्ता नहीं जानता कि यह कैसे करना है। इसलिए, हम इस मुद्दे पर ध्यान देंगे।


निर्दिष्ट कार्रवाई के बाद, टूल पैकेज "डेटा विश्लेषण"सक्रिय हो जाएगा.

चरण 2: गुणांक गणना

अब आप एकाधिक सहसंबंध गुणांक की गणना के लिए सीधे आगे बढ़ सकते हैं। आइए इन कारकों के एकाधिक सहसंबंध गुणांक की गणना करने के लिए विभिन्न उद्यमों में श्रम उत्पादकता, पूंजी-श्रम अनुपात और ऊर्जा-श्रम अनुपात के संकेतकों की नीचे दी गई तालिका के उदाहरण का उपयोग करें।


चरण 3: प्राप्त परिणाम का विश्लेषण

अब आइए जानें कि टूल के साथ डेटा प्रोसेसिंग की प्रक्रिया में हमें जो परिणाम प्राप्त हुआ उसे कैसे समझा जाए "सह - संबंध"वी एक्सेल प्रोग्राम.

जैसा कि हम तालिका से देख सकते हैं, पूंजी-श्रम अनुपात का सहसंबंध गुणांक (कॉलम 2) और ऊर्जा उपलब्धता ( स्तम्भ 1) 0.92 है, जो एक बहुत मजबूत रिश्ते से मेल खाता है। श्रम उत्पादकता के बीच ( स्तम्भ 3) और ऊर्जा उपलब्धता ( स्तम्भ 1) यह सूचक 0.72 है, जो निर्भरता का एक उच्च स्तर है। श्रम उत्पादकता के बीच सहसंबंध गुणांक ( स्तम्भ 3) और पूंजी-श्रम अनुपात ( स्तम्भ 2) 0.88 के बराबर है, जो उच्च स्तर की निर्भरता से भी मेल खाता है। इस प्रकार, हम कह सकते हैं कि अध्ययन किए गए सभी कारकों के बीच संबंध काफी मजबूत है।

जैसा कि आप देख सकते हैं, package "डेटा विश्लेषण"एकाधिक सहसंबंध गुणांक निर्धारित करने के लिए एक्सेल एक बहुत ही सुविधाजनक और उपयोग में आसान उपकरण है। इसकी सहायता से आप दो कारकों के बीच सामान्य सहसंबंध की गणना भी कर सकते हैं।

दक्षिण के प्रदेशों के अनुसार संघीय जिलारूसी संघ 2011 के लिए डेटा प्रदान करता है

संघीय जिले के क्षेत्र

सकल क्षेत्रीय उत्पाद, अरब रूबल, Y

अचल संपत्तियों में निवेश, अरब रूबल, X1

1. प्रतिनिधि. एडिगेया

2. प्रतिनिधि. दागिस्तान

3. प्रतिनिधि. इन्गुशेतिया

4. काबर्डिनो-बाल्केरियन गणराज्य

5. प्रतिनिधि. कल्मिकिया

6. कराची-चर्केस गणराज्य

7. प्रतिनिधि. उत्तर ओसेशिया- अलान्या

8. क्रास्नोडार क्षेत्र)

9. स्टावरोपोल क्षेत्र

10. अस्त्रखान क्षेत्र।

11. वोल्गोग्राड क्षेत्र।

12. रोस्तोव क्षेत्र।

  • 1. युग्म सहसंबंध गुणांक के मैट्रिक्स की गणना करें; दर सांख्यिकीय महत्वसहसंबंध गुणांक।
  • 2. प्रभावी विशेषता और उससे सबसे निकट से संबंधित कारक के बीच सहसंबंध का एक क्षेत्र बनाएं।
  • 3. प्रत्येक कारक के लिए रैखिक जोड़ी प्रतिगमन के मापदंडों की गणना करें एक्स..
  • 4. निर्धारण के गुणांक, सन्निकटन की औसत त्रुटि और फिशर एफ परीक्षण के माध्यम से प्रत्येक मॉडल की गुणवत्ता का आकलन करें। सर्वोत्तम मॉडल चुनें.

इसके अधिकतम मूल्य का 80% होगा. ग्राफ़िक रूप से प्रस्तुत करें: वास्तविक और मॉडल मान, पूर्वानुमान बिंदु।

  • 6. चरण-दर-चरण एकाधिक प्रतिगमन (बहिष्करण विधि या समावेशन विधि) का उपयोग करके, महत्वपूर्ण कारकों के कारण अपार्टमेंट मूल्य निर्धारण का एक मॉडल बनाएं। प्रतिगमन मॉडल गुणांकों की आर्थिक व्याख्या दीजिए।
  • 7. निर्मित मॉडल की गुणवत्ता का मूल्यांकन करें। क्या एकल-कारक मॉडल की तुलना में मॉडल की गुणवत्ता में सुधार हुआ है? - और - में लोच गुणांक का उपयोग करके परिणाम पर महत्वपूर्ण कारकों के प्रभाव का आकलन करें? गुणांकों

इस समस्या को हल करते समय, एक्सेल डेटा विश्लेषण सेटिंग्स का उपयोग करके ग्राफ़ और आरेखों की गणना और निर्माण किया जाएगा।

1. युग्म सहसंबंध गुणांकों के मैट्रिक्स की गणना करें और सहसंबंध गुणांकों के सांख्यिकीय महत्व का मूल्यांकन करें

सहसंबंध संवाद बॉक्स में, इनपुट अंतराल फ़ील्ड में, स्रोत डेटा वाले कक्षों की श्रेणी दर्ज करें। चूँकि हमने कॉलम शीर्षकों का भी चयन किया है, हम पहली पंक्ति में लेबल चेकबॉक्स को चेक करते हैं।

हमें निम्नलिखित परिणाम मिले:

तालिका 1.1 जोड़ी सहसंबंध गुणांक का मैट्रिक्स

जोड़ीवार सहसंबंध गुणांक के मैट्रिक्स के विश्लेषण से पता चलता है कि आश्रित चर Y, यानी सकल क्षेत्रीय उत्पाद, का X1 (स्थिर पूंजी में निवेश) के साथ घनिष्ठ संबंध है। सहसंबंध गुणांक 0.936 है। इसका मतलब यह है कि आश्रित चर Y (सकल क्षेत्रीय उत्पाद) का 93.6% संकेतक X1 (स्थिर पूंजी में निवेश) पर निर्भर करता है।

सहसंबंध गुणांक का सांख्यिकीय महत्व छात्र के टी-टेस्ट का उपयोग करके निर्धारित किया जाएगा। हम तालिका मान की तुलना परिकलित मानों से करते हैं।

आइए STUDISCOVER फ़ंक्शन का उपयोग करके तालिका मान की गणना करें।

टी टेबल = 0.129 बजे आत्मविश्वास की संभावना 0.9 और स्वतंत्रता की डिग्री (एन-2) के बराबर।

फैक्टर X1 सांख्यिकीय रूप से महत्वपूर्ण है।

2. आइए प्रभावी विशेषता (सकल क्षेत्रीय उत्पाद) और उससे सबसे निकट से संबंधित कारक (स्थिर पूंजी में निवेश) के बीच सहसंबंध का एक क्षेत्र बनाएं।

ऐसा करने के लिए, हम एक्सेल स्कैटर प्लॉट टूल का उपयोग करेंगे।

परिणामस्वरूप, हमें सकल क्षेत्रीय उत्पाद, अरब रूबल की कीमत के लिए एक सहसंबंध क्षेत्र प्राप्त होता है। और अचल संपत्तियों में निवेश, अरब रूबल। (चित्र 1.1.).

चित्र 1.1

3. प्रत्येक कारक X के लिए रैखिक युग्म प्रतिगमन के मापदंडों की गणना करें

रैखिक जोड़ीवार प्रतिगमन के मापदंडों की गणना करने के लिए, हम डेटा विश्लेषण सेटिंग में शामिल प्रतिगमन उपकरण का उपयोग करेंगे।

प्रतिगमन संवाद बॉक्स में, इनपुट अंतराल Y फ़ील्ड में, उन कोशिकाओं की श्रेणी का पता दर्ज करें जो आश्रित चर का प्रतिनिधित्व करते हैं। क्षेत्र में

इनपुट अंतराल X हम उस श्रेणी का पता दर्ज करते हैं जिसमें स्वतंत्र चर के मान शामिल हैं। आइए हम कारक X के लिए युग्मित प्रतिगमन के मापदंडों की गणना करें।

X1 के लिए हमें तालिका 1.2 में प्रस्तुत निम्नलिखित डेटा प्राप्त हुआ:

तालिका 1.2

स्थिर पूंजी में निवेश पर सकल क्षेत्रीय उत्पाद की कीमत की निर्भरता के प्रतिगमन समीकरण का रूप है:

4. आइए निर्धारण के गुणांक, सन्निकटन की औसत त्रुटि और फिशर के एफ-परीक्षण के माध्यम से प्रत्येक मॉडल की गुणवत्ता का मूल्यांकन करें। आइए स्थापित करें कि कौन सा मॉडल सबसे अच्छा है।

हमने पैराग्राफ 3 में की गई गणनाओं के परिणामस्वरूप निर्धारण का गुणांक, सन्निकटन की औसत त्रुटि प्राप्त की। प्राप्त डेटा निम्नलिखित तालिकाओं में प्रस्तुत किए गए हैं:

X1 डेटा:

तालिका 1.3ए

तालिका 1.4बी

ए) निर्धारण का गुणांक यह निर्धारित करता है कि मॉडल में गुण Y की भिन्नता के किस अनुपात को ध्यान में रखा जाता है और यह उस पर कारक X के प्रभाव के कारण होता है। निर्धारण के गुणांक का मूल्य जितना अधिक होगा, के बीच संबंध उतना ही करीब होगा निर्माण में विशेषताएँ गणितीय मॉडल.

एक्सेल आर-स्क्वायर को दर्शाता है।

इस मानदंड के आधार पर, सबसे पर्याप्त मॉडल निश्चित पूंजी (X1) में निवेश पर सकल क्षेत्रीय उत्पाद की कीमत की निर्भरता का प्रतिगमन समीकरण है।

बी) हम सूत्र का उपयोग करके औसत सन्निकटन त्रुटि की गणना करते हैं:

जहां अंश वास्तविक मानों से परिकलित मानों के विचलन के वर्गों का योग है। तालिकाओं में यह एसएस कॉलम, शेष पंक्ति में स्थित है।

हम AVERAGE फ़ंक्शन का उपयोग करके एक्सेल में एक अपार्टमेंट की औसत कीमत की गणना करते हैं। = 24.18182 अरब रूबल।

आर्थिक गणना करते समय, मॉडल को पर्याप्त रूप से सटीक माना जाता है यदि औसत त्रुटिसन्निकटन 5% से कम है, यदि औसत सन्निकटन त्रुटि 15% से कम है तो मॉडल स्वीकार्य माना जाता है।

इस मानदंड के अनुसार, निश्चित पूंजी (X1) में निवेश पर सकल क्षेत्रीय उत्पाद की कीमत की निर्भरता के प्रतिगमन समीकरण के लिए गणितीय मॉडल सबसे पर्याप्त है।

सी) एफ-परीक्षण का उपयोग प्रतिगमन मॉडल के महत्व का परीक्षण करने के लिए किया जाता है। ऐसा करने के लिए, फिशर एफ परीक्षण के महत्वपूर्ण (सारणीबद्ध) मूल्यों की तुलना की जाती है।

परिकलित मान तालिका 1.4बी (अक्षर एफ द्वारा इंगित) में दिए गए हैं।

हम FDIST फ़ंक्शन का उपयोग करके Excel में फिशर F परीक्षण के सारणीबद्ध मान की गणना करेंगे। आइए प्रायिकता को 0.05 के बराबर लें। प्राप्त: = 4.75

प्रत्येक कारक के लिए फिशर के एफ परीक्षण के परिकलित मान तुलनीय हैं तालिका मान:

71.02 > = 4.75 मॉडल इस मानदंड के अनुसार पर्याप्त है।

तीनों मानदंडों के अनुसार डेटा का विश्लेषण करने के बाद, हम यह निष्कर्ष निकाल सकते हैं कि सबसे अच्छा गणितीय मॉडल सकल क्षेत्रीय उत्पाद कारक के लिए बनाया गया है, जिसे रैखिक समीकरण द्वारा वर्णित किया गया है

5. सकल क्षेत्रीय उत्पाद की कीमत की निर्भरता के चयनित मॉडल के लिए

यदि कारक का अनुमानित मूल्य उसके अधिकतम मूल्य का 80% है, तो हम महत्व स्तर पर संकेतक के औसत मूल्य की भविष्यवाणी करेंगे। आइए इसे ग्राफ़िक रूप से प्रस्तुत करें: वास्तविक और मॉडल मान, पूर्वानुमान बिंदु।

आइए शर्त के अनुसार एक्स के अनुमानित मूल्य की गणना करें, यह अधिकतम मूल्य का 80% होगा।

आइए MAX फ़ंक्शन का उपयोग करके Excel में X अधिकतम की गणना करें।

0,8 *52,8 = 42,24

आश्रित चर का पूर्वानुमानित अनुमान प्राप्त करने के लिए, हम स्वतंत्र चर के प्राप्त मूल्य को रैखिक समीकरण में प्रतिस्थापित करते हैं:

5.07+2.14*42.24 = 304.55 बिलियन रूबल।

आइए हम पूर्वानुमान का विश्वास अंतराल निर्धारित करें, जिसकी निम्नलिखित सीमाएँ होंगी:

की गणना करना विश्वास अंतरालअनुमानित मान के लिए, हम प्रतिगमन रेखा से विचलन की गणना करते हैं।

युग्मित प्रतिगमन मॉडल के लिए, विचलन मान की गणना की जाती है:

वे। तालिका 1.5ए से मानक त्रुटि मान।

(चूंकि स्वतंत्रता की डिग्री की संख्या एक के बराबर है, हर n-2 के बराबर होगा)। सहसंबंध जोड़ी प्रतिगमन पूर्वानुमान

गुणांक की गणना करने के लिए, हम एक्सेल फ़ंक्शन STUDISCOVER का उपयोग करेंगे, संभावना को 0.1 के बराबर लेंगे, और स्वतंत्रता की डिग्री की संख्या 38 लेंगे।

हम एक्सेल का उपयोग करके मूल्य की गणना करते हैं और 12294 प्राप्त करते हैं।


आइए अंतराल की ऊपरी और निचली सीमाएं निर्धारित करें।

  • 304,55+27,472= 332,022
  • 304,55-27,472= 277,078

इस प्रकार, पूर्वानुमान मूल्य = 304.55 हजार डॉलर 277.078 हजार डॉलर के बराबर निचली सीमा के बीच होगा। और ऊपरी सीमा, 332.022 बिलियन के बराबर। रगड़ना।

वास्तविक और मॉडल मान, पूर्वानुमान बिंदु चित्र 1.2 में ग्राफिक रूप से प्रस्तुत किए गए हैं।


चित्र 1.2

6. चरण-दर-चरण एकाधिक प्रतिगमन (उन्मूलन विधि) का उपयोग करके, हम महत्वपूर्ण कारकों के कारण सकल क्षेत्रीय उत्पाद की कीमत के गठन के लिए एक मॉडल बनाएंगे

निर्माण करने के लिए एकाधिक प्रतिगमनआइए सभी कारकों सहित एक्सेल के रिग्रेशन फ़ंक्शन का उपयोग करें। परिणामस्वरूप, हमें परिणाम तालिकाएँ प्राप्त होती हैं, जिनसे हमें विद्यार्थी के टी-टेस्ट की आवश्यकता होती है।

तालिका 1.8ए

तालिका 1.8बी

तालिका 1.8सी.

हमें एक मॉडल मिलता है जैसे:

क्योंकि< (4,75 < 71,024), уравнение регрессии следует признать адекватным.

आइए छात्र के टी-टेस्ट का सबसे छोटा निरपेक्ष मान चुनें, यह 8.427 के बराबर है, इसकी तुलना तालिका मान से करें, जिसे हम एक्सेल में गणना करते हैं, महत्व स्तर 0.10 के बराबर लेते हैं, स्वतंत्रता की डिग्री की संख्या एन-एम-1= 12-4=8: =1.8595

8.427>1.8595 के बाद से मॉडल को पर्याप्त माना जाना चाहिए।

7. मूल्यांकन हेतु महत्वपूर्ण कारकप्राप्त गणितीय मॉडल, लोच गुणांक, और - गुणांक की गणना करें

लोच गुणांक दर्शाता है कि कारक विशेषता में 1% परिवर्तन होने पर प्रभावी विशेषता कितने प्रतिशत बदल जाएगी:

ई एक्स4 = 2.137 * (10.69/24.182) = 0.94%

अर्थात्, अचल पूंजी में निवेश में 1% की वृद्धि के साथ, लागत औसतन 0.94% बढ़ जाती है।

गुणांक दर्शाता है कि मानक विचलन के किस भाग से एक मानक विचलन द्वारा स्वतंत्र चर में परिवर्तन के साथ आश्रित चर का औसत मूल्य बदलता है।

2,137* (14.736/33,632) = 0,936.

मानक विचलन डेटा वर्णनात्मक सांख्यिकी उपकरण का उपयोग करके प्राप्त तालिकाओं से लिया जाता है।

तालिका 1.11 वर्णनात्मक आँकड़े (वाई)

तालिका 1.12 वर्णनात्मक आँकड़े (X4)

गुणांक सभी कारकों के कुल प्रभाव में कारक के प्रभाव का हिस्सा निर्धारित करता है:

जोड़ी सहसंबंध गुणांक की गणना करने के लिए, हम डेटा विश्लेषण सेटिंग्स में सहसंबंध उपकरण का उपयोग करके एक्सेल में जोड़ी सहसंबंध गुणांक के मैट्रिक्स की गणना करते हैं।

तालिका 1.14

(0,93633*0,93626) / 0,87 = 1,00.

निष्कर्ष: प्राप्त गणनाओं से, हम यह निष्कर्ष निकाल सकते हैं कि प्रभावी विशेषता Y (सकल क्षेत्रीय उत्पाद) की कारक X1 (स्थिर पूंजी में निवेश) (100% तक) पर बड़ी निर्भरता है।

संदर्भ

  • 1. मैग्नस वाई.आर., कातिशेव पी.के., पेरेसेट्स्की ए.ए. अर्थमिति। शुरुआती कोर्स. ट्यूटोरियल. दूसरा संस्करण. - एम.: डेलो, 1998. - पी. 69 - 74.
  • 2. अर्थमिति पर कार्यशाला: पाठ्यपुस्तक / आई.आई. एलिसेवा, एस.वी. कुरीशेवा, एन.एम. गोर्डिन्को एट अल 2002. - पी. 49 - 105.
  • 3. डफ़र्टी के. अर्थमिति का परिचय: अनुवाद। अंग्रेज़ी से - एम.: इंफ्रा-एम, 1999. - XIV, पी. 262-285.
  • 4. अय्विज़्यान एस.ए., मिख्तिरयान वी.एस. अनुप्रयुक्त गणित और अर्थमिति के मूल सिद्धांत। -1998., पृ. 115-147.
  • 5. क्रेमर एन.एस.एच., पुटको बी.ए. अर्थमिति। -2007. 175-251 तक.
एक्स (1) एक्स (2) एक्स (3) एक्स (4) एक्स (5)
1.00 0.43 0.37 0.40 0.58 0.33
एक्स (1) 0.43 1.00 0.85 0.98 0.11 0.34
एक्स (2) 0.37 0.85 1.00 0.88 0.03 0.46
एक्स (3) 0.40 0.98 0.88 1.00 0.03 0.28
एक्स (4) 0.58 0.11 0.03 0.03 1.00 0.57
एक्स (5) 0.33 0.34 0.46 0.28 0.57 1.00

युग्मित सहसंबंध गुणांक के मैट्रिक्स के विश्लेषण से पता चलता है कि प्रभावी संकेतक संकेतक से सबसे निकट से संबंधित है एक्स(4) - प्रति 1 हेक्टेयर खपत उर्वरक की मात्रा ()।

साथ ही, गुण-तर्कों के बीच संबंध काफी घनिष्ठ है। इस प्रकार, पहिये वाले ट्रैक्टरों की संख्या के बीच व्यावहारिक रूप से कार्यात्मक संबंध है ( एक्स(1)) और सतही जुताई उपकरणों की संख्या .

बहुसंरेखता की उपस्थिति सहसंबंध गुणांक और द्वारा भी इंगित की जाती है। संकेतकों के बीच घनिष्ठ संबंध को ध्यान में रखते हुए एक्स (1) , एक्स(2) और एक्स(3), उनमें से केवल एक को उपज प्रतिगमन मॉडल में शामिल किया जा सकता है।

बहुसंरेखता के नकारात्मक प्रभाव को प्रदर्शित करने के लिए, सभी इनपुट संकेतकों सहित उपज के एक प्रतिगमन मॉडल पर विचार करें:

एफ ओब्स = 121.

समीकरण के गुणांकों के अनुमानों के मानक विचलन के सही अनुमानों के मान कोष्ठक में दर्शाए गए हैं .

निम्नलिखित पर्याप्तता पैरामीटर प्रतिगमन समीकरण के अंतर्गत प्रस्तुत किए गए हैं: निर्धारण के एकाधिक गुणांक; अवशिष्ट विचरण का सही अनुमान, सन्निकटन की औसत सापेक्ष त्रुटि और मानदंड एफ ओब्स = 121 का परिकलित मूल्य।

प्रतिगमन समीकरण महत्वपूर्ण है क्योंकि एफ ओब्स = 121 > एफ केपी = 2.85 तालिका से पाया गया एफ-ए=0.05 पर वितरण; एन 1 =6 और एन 2 =14.

इससे यह निष्कर्ष निकलता है कि Q¹0, अर्थात्। और समीकरण q के गुणांकों में से कम से कम एक जे (जे= 0, 1, 2, ..., 5) शून्य नहीं है।

व्यक्तिगत प्रतिगमन गुणांक H0 के महत्व के बारे में परिकल्पना का परीक्षण करने के लिए: q j = 0, जहां जे=1,2,3,4,5, तुलना करें महत्वपूर्ण मान टीकेपी = 2.14, तालिका से पाया गया टी-महत्व स्तर a=2 पर वितरण क्यू=0.05 और स्वतंत्रता की डिग्री की संख्या n=14, परिकलित मान के साथ। समीकरण से यह निष्कर्ष निकलता है कि प्रतिगमन गुणांक सांख्यिकीय रूप से केवल तभी महत्वपूर्ण होता है एक्स(4) ½ से टी 4 ½=2.90 > टीकेपी =2.14.



आर्थिक व्याख्या के लिए उत्तरदायी नहीं नकारात्मक संकेतप्रतिगमन गुणांक पर एक्स(1) और एक्स(5) . गुणांकों के नकारात्मक मूल्यों से यह पता चलता है कि पहिएदार ट्रैक्टरों के साथ कृषि की संतृप्ति में वृद्धि ( एक्स(1)) और पादप स्वास्थ्य उत्पाद ( एक्स(5)) उपज पर नकारात्मक प्रभाव पड़ता है। इसलिए, परिणामी प्रतिगमन समीकरण अस्वीकार्य है।

महत्वपूर्ण गुणांकों के साथ एक प्रतिगमन समीकरण प्राप्त करने के लिए, हम इसका उपयोग करते हैं चरण-दर-चरण एल्गोरिदम प्रतिगमन विश्लेषण. प्रारंभ में, हम चर के उन्मूलन के साथ चरण-दर-चरण एल्गोरिदम का उपयोग करते हैं।

आइए वेरिएबल को मॉडल से बाहर निकालें एक्स(1) , जो न्यूनतम से मेल खाता है निरपेक्ष मूल्यमूल्य ½ टी 1 ½=0.01. शेष चरों के लिए, हम फिर से प्रतिगमन समीकरण बनाते हैं:

परिणामी समीकरण महत्वपूर्ण है क्योंकि एफ देखा गया = 155 > एफ केपी = 2.90, महत्व स्तर पर पाया गया ए = 0.05 और तालिका के अनुसार स्वतंत्रता की डिग्री की संख्या एन 1 = 5 और एन 2 = 15 एफ-वितरण, यानी वेक्टर q¹0. हालाँकि, केवल प्रतिगमन गुणांक पर एक्स(4) . अनुमानित मूल्य ½ टीअन्य गुणांकों के लिए j ½ कम है टी kr = 2.131, तालिका से पाया गया टी-ए=2 पर वितरण क्यू=0.05 और n=15.

मॉडल से वेरिएबल को बाहर करके एक्स(3) , जो न्यूनतम मूल्य से मेल खाता है टी 3 =0.35 और हमें प्रतिगमन समीकरण मिलता है:

(2.9)

परिणामी समीकरण में, गुणांक पर एक्स(5) . बहिष्कृत करके एक्स(5) हमें प्रतिगमन समीकरण प्राप्त होता है:

(2.10)

हमें मिला महत्वपूर्ण समीकरणमहत्वपूर्ण और व्याख्या योग्य गुणांकों के साथ प्रतिगमन।

हालाँकि, परिणामी समीकरण हमारे उदाहरण में न केवल "अच्छा" है और न ही "सर्वोत्तम" उपज मॉडल है।

चलिए वो दिखाते हैं बहुसंरेखता स्थिति में, चर के समावेश के साथ एक चरणबद्ध एल्गोरिदम अधिक कुशल है।उपज मॉडल में पहला कदम परिवर्तनशील शामिल एक्स(4) , जिसके साथ उच्चतम सहसंबंध गुणांक है , चर द्वारा समझाया गया - आर(,एक्स(4))=0.58. दूसरे चरण में समीकरण सहित एक्स(4) चर एक्स(1)या एक्स(3), हम ऐसे मॉडल प्राप्त करेंगे, जो आर्थिक कारणों और सांख्यिकीय विशेषताओं के लिए, (2.10) से अधिक हैं:

(2.11)

(2.12)

समीकरण में शेष तीन चरों में से किसी को भी शामिल करने से इसके गुण खराब हो जाते हैं। उदाहरण के लिए, समीकरण (2.9) देखें।

इस प्रकार, हमारे पास तीन "अच्छे" उपज मॉडल हैं, जिनमें से हमें आर्थिक और सांख्यिकीय कारणों से एक को चुनने की आवश्यकता है।

सांख्यिकीय मानदंडों के अनुसार, मॉडल (2.11) सबसे पर्याप्त है। यह अवशिष्ट विचरण के न्यूनतम मान = 2.26 और सन्निकटन की औसत सापेक्ष त्रुटि से मेल खाता है और उच्चतम मूल्यऔर एफ ओब्स = 273.

कुछ सबसे ख़राब प्रदर्शनमॉडल (2.12) में पर्याप्तता है, और फिर मॉडल (2.10) है।

अब हम सर्वोत्तम मॉडल (2.11) और (2.12) चुनेंगे। ये मॉडल चर के संदर्भ में एक दूसरे से भिन्न हैं एक्स(1) और एक्स(3) . हालाँकि, उपज मॉडल में परिवर्तनशील एक्स(1) (प्रति 100 हेक्टेयर पहिये वाले ट्रैक्टरों की संख्या) परिवर्तनीय से अधिक बेहतर है एक्स(3) (प्रति 100 हेक्टेयर सतह जुताई उपकरणों की संख्या), जो कुछ हद तक गौण है (या इससे प्राप्त हुई है) एक्स (1)).

इस संबंध में आर्थिक कारणों से मॉडल (2.12) को प्राथमिकता दी जानी चाहिए। इस प्रकार, चर को शामिल करने के साथ चरणबद्ध प्रतिगमन विश्लेषण एल्गोरिदम को लागू करने और इस तथ्य को ध्यान में रखते हुए कि तीन संबंधित चर में से केवल एक को समीकरण में प्रवेश करना चाहिए ( एक्स (1) , एक्स(2)या एक्स(3)) अंतिम प्रतिगमन समीकरण चुनें:

समीकरण a=0.05 पर महत्वपूर्ण है, क्योंकि एफ ओब्स = 266 > एफ केपी = 3.20, तालिका से पाया गया एफ-वितरण ए= पर क्यू=0.05; एन 1 =3 और एन 2 =17. समीकरण ½ में सभी प्रतिगमन गुणांक भी महत्वपूर्ण हैं टी j½> टीकेपी(ए=2 क्यू=0.05; n=17)=2.11. प्रतिगमन गुणांक q 1 को आर्थिक कारणों से महत्वपूर्ण (q 1 ¹0) माना जाना चाहिए, जबकि टी 1 =2.09 केवल थोड़ा सा कम टीकेपी = 2.11.

प्रतिगमन समीकरण से यह पता चलता है कि प्रति 100 हेक्टेयर कृषि योग्य भूमि पर ट्रैक्टरों की संख्या में एक की वृद्धि (एक निश्चित मूल्य पर) एक्स(4)) अनाज की पैदावार में औसतन 0.345 सी/हेक्टेयर की वृद्धि होती है।

लोच गुणांक ई 1 »0.068 और ई 2 »0.161 की अनुमानित गणना से पता चलता है कि बढ़ते संकेतकों के साथ एक्स(1) और एक्स(4) 1% से, अनाज की उपज औसतन क्रमशः 0.068% और 0.161% बढ़ जाती है।

एकाधिक गुणांकनिर्धारण इंगित करता है कि उपज भिन्नता का केवल 46.9% मॉडल में शामिल संकेतकों द्वारा समझाया गया है ( एक्स(1) और एक्स(4)), यानी, ट्रैक्टर और उर्वरकों के साथ फसल उत्पादन की संतृप्ति। शेष भिन्नता बेहिसाब कारकों की कार्रवाई के कारण है ( एक्स (2) , एक्स (3) , एक्स(5), मौसम की स्थिति, आदि)। सन्निकटन की औसत सापेक्ष त्रुटि मॉडल की पर्याप्तता के साथ-साथ अवशिष्ट विचरण के मूल्य को दर्शाती है। प्रतिगमन समीकरण की व्याख्या करते समय, रुचि के मूल्य हैं सापेक्ष त्रुटियाँअनुमान . आइए हम याद करें कि - प्रभावी संकेतक का मॉडल मूल्य विचाराधीन क्षेत्रों की समग्रता के लिए औसत उपज मूल्य को दर्शाता है, बशर्ते कि व्याख्यात्मक चर के मान एक्स(1) और एक्स(4) समान स्तर पर स्थिर होते हैं, अर्थात् एक्स (1) = एक्स मैं(1) और एक्स (4) = xi(4) . फिर, d के मान के अनुसार मैंआप उपज के आधार पर क्षेत्रों की तुलना कर सकते हैं। वे क्षेत्र जिनसे d मान मेल खाते हैं मैं>0, औसत से अधिक उपज है, और डी मैं<0 - ниже среднего.

हमारे उदाहरण में, उपज के संदर्भ में, सबसे कुशल फसल उत्पादन डी के अनुरूप क्षेत्र में किया जाता है 7 =28%, जहां उपज क्षेत्रीय औसत से 28% अधिक है, और सबसे कम प्रभावी डी वाले क्षेत्र में है 20 =-27,3%.


कार्य और अभ्यास

2.1. सामान्य जनसंख्या से ( , एक्स (1) , ..., एक्स(पी)), कहाँ सशर्त गणितीय अपेक्षा और विचरण एस 2 के साथ एक सामान्य वितरण कानून है, जिसका एक यादृच्छिक नमूना है एन, और चलो ( आप मैं, एक्स मैं (1) , ..., एक्स मैं(पी)) - परिणाम मैंवें अवलोकन ( मैं=1, 2, ..., एन). निर्धारित करें: ए) वेक्टर के न्यूनतम वर्ग अनुमान की गणितीय अपेक्षा क्यू; बी) वेक्टर के न्यूनतम वर्ग अनुमान का सहप्रसरण मैट्रिक्स क्यू; ग) मूल्यांकन की गणितीय अपेक्षा।

2.2. समस्या 2.1 की शर्तों के अनुसार, प्रतिगमन के कारण वर्ग विचलन के योग की गणितीय अपेक्षा ज्ञात कीजिए, अर्थात। ईक्यू आर, कहाँ

.

2.3. समस्या 2.1 की शर्तों के अनुसार, प्रतिगमन रेखाओं के सापेक्ष अवशिष्ट भिन्नता के कारण होने वाले वर्ग विचलन के योग की गणितीय अपेक्षा निर्धारित करें, अर्थात। eq केओस्ट, कहाँ

2.4. साबित करें कि जब परिकल्पना H 0 पूरी होती है: q=0 आँकड़े

स्वतंत्रता की डिग्री n 1 =p+1 और n 2 =n-p-1 के साथ F-वितरण है।

2.5. साबित करें कि जब परिकल्पना H 0: q j =0 पूरी हो जाती है, तो आंकड़ों में स्वतंत्रता की डिग्री n=n-p-1 की संख्या के साथ t-वितरण होता है।

2.6. चारे की रोटी के सिकुड़न की निर्भरता पर डेटा (तालिका 2.3) के आधार पर ( ) भंडारण अवधि से ( एक्स) इस धारणा के तहत सशर्त अपेक्षा का एक बिंदु अनुमान ढूंढें कि सामान्य प्रतिगमन समीकरण रैखिक है।

तालिका 2.3.

आवश्यक: ए) इस धारणा के तहत अवशिष्ट विचरण एस 2 का अनुमान लगाएं कि सामान्य प्रतिगमन समीकरण का रूप है; बी) प्रतिगमन समीकरण के महत्व को a=0.05 पर जांचें, यानी। परिकल्पना एच 0: क्यू=0; सी) विश्वसनीयता जी=0.9 के साथ, पैरामीटर क्यू 0, क्यू 1 के अंतराल अनुमान निर्धारित करें; डी) विश्वसनीयता जी=0.95 के साथ, सशर्त गणितीय अपेक्षा के अंतराल अनुमान का निर्धारण करें एक्स 0=6; ई) बिंदु पर भविष्यवाणी का विश्वास अंतराल g=0.95 पर निर्धारित करें एक्स=12.

2.7. तालिका में दिए गए 5 महीनों के लिए स्टॉक की कीमतों की वृद्धि दर की गतिशीलता पर डेटा के आधार पर। 2.4.

तालिका 2.4.

महीने ( एक्स)
(%)

और यह धारणा कि सामान्य प्रतिगमन समीकरण का रूप है, यह आवश्यक है: ए) प्रतिगमन समीकरण के दोनों मापदंडों और अवशिष्ट विचरण एस 2 का अनुमान निर्धारित करें; बी) ए=0.01 पर प्रतिगमन गुणांक के महत्व की जांच करें, यानी। परिकल्पना एच 0: क्यू 1 =0;

सी) विश्वसनीयता जी=0.95 के साथ, पैरामीटर क्यू 0 और क्यू 1 के अंतराल अनुमान खोजें; डी) विश्वसनीयता जी=0.9 के साथ, सशर्त गणितीय अपेक्षा का एक अंतराल अनुमान स्थापित करें एक्स 0=4; ई) बिंदु पर भविष्यवाणी का विश्वास अंतराल g=0.9 पर निर्धारित करें एक्स=5.

2.8. युवा जानवरों के वजन बढ़ने की गतिशीलता के अध्ययन के परिणाम तालिका 2.5 में दिए गए हैं।

तालिका 2.5.

यह मानते हुए कि सामान्य प्रतिगमन समीकरण रैखिक है, यह आवश्यक है: ए) प्रतिगमन समीकरण के दोनों मापदंडों और अवशिष्ट विचरण एस 2 का अनुमान निर्धारित करें; बी) प्रतिगमन समीकरण के महत्व को a=0.05 पर जांचें, यानी। परिकल्पना एच 0: क्यू=0;

ग) विश्वसनीयता g=0.8 के साथ, पैरामीटर q 0 और q 1 के अंतराल अनुमान खोजें; डी) विश्वसनीयता जी=0.98 के साथ, सशर्त गणितीय अपेक्षा के अंतराल अनुमानों को निर्धारित और तुलना करें एक्स 0 =3 और एक्स 1 =6;

ई) बिंदु पर भविष्यवाणी का विश्वास अंतराल g=0.98 पर निर्धारित करें एक्स=8.

2.9. लागत ( ) प्रसार के आधार पर पुस्तक की एक प्रति ( एक्स) (हजार प्रतियां) प्रकाशन गृह द्वारा एकत्र किए गए डेटा की विशेषता है (तालिका 2.6)। विश्वसनीयता g=0.9 के साथ हाइपरबोलिक रिग्रेशन समीकरण के न्यूनतम वर्ग अनुमान और पैरामीटर निर्धारित करें, पैरामीटर q 0 और q 1 के लिए आत्मविश्वास अंतराल का निर्माण करें, साथ ही सशर्त अपेक्षा भी करें एक्स=10.

तालिका 2.6.

प्रपत्र के प्रतिगमन समीकरण के अनुमान और पैरामीटर निर्धारित करें, परिकल्पना H 0 का a = 0.05: q 1 = 0 पर परीक्षण करें और पैरामीटर q 0 और q 1 और सशर्त गणितीय अपेक्षा के लिए विश्वसनीयता g = 0.9 के साथ विश्वास अंतराल का निर्माण करें। एक्स=20.

2.11. तालिका में 2.8 निम्नलिखित व्यापक आर्थिक संकेतकों की विकास दर (%) पर डेटा प्रस्तुत करता है एन=1992 के लिए विश्व के 10 विकसित देश: जीएनपी - एक्स(1) , औद्योगिक उत्पादन - एक्स(2) , मूल्य सूचकांक - एक्स (3) .

तालिका 2.8.

देशों x और प्रतिगमन समीकरण के पैरामीटर, अवशिष्ट विचरण का अनुमान; बी) ए=0.05 पर प्रतिगमन गुणांक के महत्व की जांच करें, यानी। एच 0: क्यू 1 =0; ग) विश्वसनीयता g=0.9 के साथ, अंतराल अनुमान q 0 और q 1 खोजें; घ) बिंदु पर g=0.95 पर विश्वास अंतराल ज्ञात कीजिए एक्स 0 =एक्स मैं, कहाँ मैं=5; ई) प्रतिगमन समीकरणों की सांख्यिकीय विशेषताओं की तुलना करें: 1, 2 और 3।

2.12. समस्या 2.11 को ( पर) सूचक एक्स(1) , और व्याख्यात्मक के लिए ( एक्स) चर एक्स (3) .

1. अयवाज़यान एस.ए., मख़ितारियन वी.एस. व्यावहारिक आँकड़े और अर्थमिति के बुनियादी सिद्धांत: पाठ्यपुस्तक। एम., यूनिटी, 1998 (दूसरा संस्करण 2001);

2. अयवाज़यान एस.ए., मख़ितारियन वी.एस. समस्याओं और अभ्यासों में लागू आँकड़े: पाठ्यपुस्तक। एम. यूनिटी - दाना, 2001;

3. अयवज़्यान एस.ए., एन्युकोव आई.एस., मेशाल्किन एल.डी. एप्लाईड स्टैटस्टिक्स। निर्भरता अनुसंधान. एम., वित्त एवं सांख्यिकी, 1985, 487 पीपी.;

4. अयवज़्यान एस.ए., बुख़्स्ताबर वी.एम., एन्युकोव आई.एस., मेशाल्किन एल.डी. एप्लाईड स्टैटस्टिक्स। वर्गीकरण और आयाम में कमी. एम., वित्त एवं सांख्यिकी, 1989, 607 पीपी.;

5. जॉन्सटन जे. इकोनोमेट्रिक तरीके, एम.: सांख्यिकी, 1980, 446 पीपी.;

6. डबरोव ए.वी., मख़ितारियन वी.एस., ट्रोशिन एल.आई. बहुभिन्नरूपी सांख्यिकीय विधियाँ। एम., वित्त एवं सांख्यिकी, 2000;

7. मख़ितारियन वी.एस., ट्रोशिन एल.आई. सहसंबंध और प्रतिगमन विधियों का उपयोग करके निर्भरता का अध्ययन। एम., एमईएसआई, 1995, 120 पीपी.;

8. मख़ितारियन वी.एस., डबरोव ए.एम., ट्रोशिन एल.आई. अर्थशास्त्र में बहुभिन्नरूपी सांख्यिकीय पद्धतियाँ। एम., एमईएसआई, 1995, 149 पीपी.;

9. डबरोव ए.एम., मखितारियन वी.एस., ट्रोशिन एल.आई. व्यवसायियों और प्रबंधकों के लिए गणितीय आँकड़े। एम., एमईएसआई, 2000, 140 पीपी.;

10. लुकाशिन यू.आई. प्रतिगमन और अनुकूली पूर्वानुमान विधियाँ: पाठ्यपुस्तक, एम., एमईएसआई, 1997।

11. लुकाशिन यू.आई. अल्पकालिक पूर्वानुमान की अनुकूली विधियाँ। - एम., सांख्यिकी, 1979।


अनुप्रयोग


परिशिष्ट 1. स्वतंत्र कंप्यूटर अनुसंधान के लिए कार्यों के विकल्प।

वे कारक जो संरेख हैं...

समाधान:

दो चरों को स्पष्ट रूप से संरेख माना जाता है, अर्थात। यदि एक दूसरे के साथ रैखिक संबंध में हैं। हमारे मॉडल में, केवल कारकों के बीच युग्मित रैखिक प्रतिगमन का गुणांक 0.7 से अधिक है। , जिसका अर्थ है कि कारक संरेख हैं।

4. एकाधिक प्रतिगमन मॉडल में, कारकों के बीच युग्मित सहसंबंध गुणांक के मैट्रिक्स का निर्धारक शून्य के करीब है। इसका मतलब यह है कि कारक, और...

बहुसंरेखीय

स्वतंत्र

मात्रात्मक

समाधान:

कारकों की बहुसंरेखता का आकलन करने के लिए, कारकों के बीच युग्मित सहसंबंध गुणांक के मैट्रिक्स के निर्धारक का उपयोग किया जा सकता है। यदि कारक एक दूसरे के साथ सहसंबद्ध नहीं हैं, तो कारकों के बीच युग्मित सहसंबंध गुणांक का मैट्रिक्स इकाई होगा। चूँकि सभी गैर-विकर्ण तत्व शून्य के बराबर होगा.
, चूँकि = = और = = =0।
यदि कारकों के बीच पूर्ण रैखिक संबंध है और सभी युग्म सहसंबंध गुणांक एक के बराबर हैं, तो ऐसे मैट्रिक्स का निर्धारक शून्य के बराबर है।


इंटरफैक्टर सहसंबंध मैट्रिक्स का निर्धारक शून्य के जितना करीब होगा, कारकों की बहुसंरेखता उतनी ही मजबूत होगी और एकाधिक प्रतिगमन के परिणाम उतने ही अविश्वसनीय होंगे। और, इसके विपरीत, इंटरफैक्टर सहसंबंध मैट्रिक्स का निर्धारक एक के जितना करीब होगा, कारकों की बहुसंरेखता उतनी ही कम होगी।

5. फॉर्म के रैखिक एकाधिक प्रतिगमन समीकरण के अर्थमितीय मॉडल के लिए, युग्मित रैखिक सहसंबंध गुणांक का एक मैट्रिक्स ( - आश्रित चर; एक्स (1),एक्स (2), एक्स (3), एक्स (4)- स्वतंत्र प्रभावित करने वाली वस्तुएँ):


संरेख (निकटता से संबंधित) स्वतंत्र (व्याख्यात्मक) चर नहीं हैं

एक्स(2)और एक्स (3)

एक्स (1)और एक्स (3)

एक्स (1)और एक्स (4)

एक्स(2)और एक्स (4)

समाधान:

एकाधिक प्रतिगमन मॉडल का निर्माण करते समय, स्वतंत्र (व्याख्यात्मक) चर के बीच घनिष्ठ रैखिक संबंध के अस्तित्व की संभावना को बाहर करना आवश्यक है, जो बहुसंरेखता की समस्या को जन्म देता है। इस मामले में, स्वतंत्र (व्याख्यात्मक) चर की प्रत्येक जोड़ी के लिए रैखिक सहसंबंध गुणांक की जाँच की जाती है। ये मान युग्मित रैखिक सहसंबंध गुणांक के मैट्रिक्स में परिलक्षित होते हैं। ऐसा माना जाता है कि निरपेक्ष मान में 0.7 से अधिक व्याख्यात्मक चरों के बीच जोड़ीवार सहसंबंध गुणांक की उपस्थिति इन चरों के बीच घनिष्ठ संबंध (चर के साथ संबंध की निकटता) को दर्शाती है इस मामले में विचार नहीं किया गया)। ऐसे स्वतंत्र चर को संरेख कहा जाता है। यदि व्याख्यात्मक चरों के बीच जोड़ीवार सहसंबंध गुणांक का मान निरपेक्ष मान में 0.7 से अधिक नहीं है, तो ऐसे व्याख्यात्मक चर संरेख नहीं हैं। आइए युग्मित इंटरफैक्टर सहसंबंध गुणांक के मूल्यों पर विचार करें: के बीच एक्स (1)और एक्स(2)मान 0.45 है; बीच में एक्स (1)और एक्स (3)- 0.82 के बराबर; बीच में एक्स (1)और एक्स (4)- 0.94 के बराबर; बीच में एक्स(2)और एक्स (3)- 0.3 के बराबर; बीच में एक्स(2)और एक्स (4)- 0.7 के बराबर; बीच में एक्स (3)और एक्स (4)- 0.12 के बराबर है. इस प्रकार, का मान 0.7 से अधिक नहीं है। इसलिए, संरेख नहीं हैंकारकों एक्स (1)और एक्स(2), एक्स(2)और एक्स (3), एक्स (3)और एक्स (4). अंतिम सूचीबद्ध युग्मों में से, उत्तर विकल्पों में एक युग्म है एक्स(2)और एक्स (3)- यह सही जवाब है। अन्य जोड़ों के लिए: एक्स (1और एक्स (3), एक्स (1)और एक्स (4), एक्स(2)और एक्स (4)- युग्मित इंटरफैक्टर सहसंबंध गुणांक का मान 0.7 से अधिक है, और ये कारक संरेख हैं।

विषय 3: डमी वेरिएबल्स

1. अर्थमितीय प्रतिगमन मॉडल के निर्माण के लिए प्रारंभिक डेटा की एक तालिका दी गई है:

डमी चर नहीं हैं

कार्य अनुभव

श्रम उत्पादकता

शिक्षा का स्तर

कर्मचारी योग्यता स्तर

समाधान:

प्रतिगमन मॉडल का निर्माण करते समय, ऐसी स्थिति उत्पन्न हो सकती है जब समीकरण में मात्रात्मक चर के अलावा, ऐसे चर शामिल करना आवश्यक होता है जो कुछ विशेषता विशेषताओं (लिंग, शिक्षा, क्षेत्र, आदि) को दर्शाते हैं। इस प्रकार के गुणात्मक चर को "डमी" चर कहा जाता है। कार्य के विवरण में निर्दिष्ट मॉडल के निर्माण के लिए, डमी चर का उपयोग किया जाता है: कर्मचारी की शिक्षा का स्तर और कौशल का स्तर। अन्य चर नहीं हैंकाल्पनिक, प्रस्तावित विकल्पों में से ये सेवा की लंबाई और श्रम उत्पादकता हैं।

2. उपभोक्ता के आय स्तर और लिंग पर मांस की खपत की निर्भरता का अध्ययन करते समय, हम अनुशंसा कर सकते हैं...

एक डमी वैरिएबल का उपयोग करें - उपभोक्ता लिंग

जनसंख्या को दो भागों में विभाजित करें: महिला उपभोक्ताओं के लिए और पुरुष उपभोक्ताओं के लिए

एक डमी वैरिएबल का उपयोग करें - आय स्तर

उपभोक्ता के लिंग को विचार से बाहर रखें, क्योंकि इस कारक को मात्रात्मक रूप से नहीं मापा जा सकता है

समाधान:

प्रतिगमन मॉडल का निर्माण करते समय, ऐसी स्थिति उत्पन्न हो सकती है जब समीकरण में मात्रात्मक चर के अलावा, ऐसे चर शामिल करना आवश्यक होता है जो कुछ विशेषता विशेषताओं (लिंग, शिक्षा, क्षेत्र, आदि) को दर्शाते हैं। इस प्रकार के गुणात्मक चर को "डमी" चर कहा जाता है। वे अध्ययन के तहत सांख्यिकीय आबादी की विविधता को दर्शाते हैं और अवलोकन की ऐसी विषम वस्तुओं में निर्भरता के बेहतर मॉडलिंग के लिए उपयोग किए जाते हैं। विषम डेटा के लिए व्यक्तिगत निर्भरताओं का मॉडलिंग करते समय, आप विषम डेटा के पूरे संग्रह को कई अलग-अलग संग्रहों में विभाजित करने की विधि का भी उपयोग कर सकते हैं, जिनकी संख्या डमी चर के राज्यों की संख्या के बराबर होती है। इस प्रकार, सही उत्तर विकल्प हैं: "एक डमी चर का उपयोग करें - उपभोक्ता लिंग" और "जनसंख्या को दो भागों में विभाजित करें: महिला उपभोक्ताओं के लिए और पुरुष उपभोक्ताओं के लिए।"

3. हम एक अपार्टमेंट की कीमत की निर्भरता का अध्ययन करते हैं ( पर) उसके रहने के क्षेत्र से ( एक्स) और घर का प्रकार। मॉडल में डमी वैरिएबल शामिल हैं जो विचाराधीन घरों के प्रकारों को दर्शाते हैं: अखंड, पैनल, ईंट। प्रतिगमन समीकरण प्राप्त किया गया था: ,
कहाँ ,
ईंट और अखंड के लिए विशेष प्रतिगमन समीकरण हैं...

घर के प्रकार की ईंट के लिए

घर के प्रकार के लिए अखंड

घर के प्रकार की ईंट के लिए

घर के प्रकार के लिए अखंड

समाधान:

ईंट और अखंड घरों के लिए विशेष प्रतिगमन समीकरण का पता लगाना आवश्यक है। एक ईंट के घर के लिए, डमी चर के मान इस प्रकार हैं: , . समीकरण इस प्रकार बनेगा: या घर के प्रकार के लिए: ईंट।
एक अखंड घर के लिए, डमी चर के मान इस प्रकार हैं: , . समीकरण रूप ले लेगा
या अखंड घर के प्रकार के लिए.



साइट पर नया

>

सबसे लोकप्रिय