घर मुंह सहसंबंध गुणांक की विश्वसनीयता. परीक्षण: छात्र के एफ-परीक्षण का उपयोग करके प्रतिगमन और सहसंबंध गुणांक के महत्व का आकलन करना

सहसंबंध गुणांक की विश्वसनीयता. परीक्षण: छात्र के एफ-परीक्षण का उपयोग करके प्रतिगमन और सहसंबंध गुणांक के महत्व का आकलन करना

कुछ शोधकर्ता, सहसंबंध गुणांक के मूल्य की गणना करने के बाद, वहीं रुक जाते हैं। लेकिन सक्षम प्रयोगात्मक पद्धति के दृष्टिकोण से, इस गुणांक के महत्व का स्तर (यानी विश्वसनीयता की डिग्री) भी निर्धारित किया जाना चाहिए।

सहसंबंध गुणांक के महत्व स्तर की गणना महत्वपूर्ण मूल्यों की तालिका का उपयोग करके की जाती है। नीचे इस तालिका का एक अंश है, जो हमें प्राप्त गुणांक के महत्व के स्तर को निर्धारित करने की अनुमति देता है।

हम उस पंक्ति का चयन करते हैं जो नमूना आकार से मेल खाती है। हमारे मामले में, n = 10। हम इस पंक्ति में तालिका मान का चयन करते हैं जो अनुभवजन्य से थोड़ा कम है (या इसके बिल्कुल बराबर है, जो अत्यंत दुर्लभ है)। बोल्ड में वह संख्या 0.632 है। यह p = 0.05 के महत्व स्तर वाले स्तंभ को संदर्भित करता है। यानी, वास्तव में, अनुभवजन्य मान कॉलम पी = 0.05 और पी = 0.01 के बीच मध्यवर्ती है, इसलिए 0.05  पी  0.01। इस प्रकार, हम शून्य परिकल्पना को अस्वीकार करते हैं और निष्कर्ष निकालते हैं कि प्राप्त परिणाम (R xy = 0.758) p स्तर पर महत्वपूर्ण है< 0,05 (это уровень статистической значимости): R эмп >आर करोड़ (पी< 0,05) H 0 ,  Н 1 ! ст. зн.

रोजमर्रा की भाषा में, इसकी व्याख्या इस प्रकार की जा सकती है: हम उम्मीद कर सकते हैं कि कनेक्शन की यह ताकत 100 में से पांच मामलों की तुलना में नमूने में कम बार घटित होगी, यदि यह कनेक्शन संयोग का परिणाम है।

    1. प्रतिगमन विश्लेषण

एक्स(ऊंचाई)

वाई(वज़न)

एम एक्स = 166,6

एम = 58,3

एक्स = 6 , 54

= 8 , 34

प्रतिगमन विश्लेषण का उपयोग अंतराल पैमाने पर मापी गई दो मात्राओं के बीच संबंध का अध्ययन करने के लिए किया जाता है। इस प्रकार के विश्लेषण में एक प्रतिगमन समीकरण का निर्माण शामिल होता है जो आपको एक विशेषता की दूसरे पर निर्भरता का मात्रात्मक रूप से वर्णन करने की अनुमति देता है (पियर्सन का सहसंबंध गुणांक किसी रिश्ते की उपस्थिति या अनुपस्थिति को इंगित करता है, लेकिन इस रिश्ते का वर्णन नहीं करता है)। किसी एक विशेषता के यादृच्छिक मूल्य को जानने और इस समीकरण का उपयोग करके, शोधकर्ता, एक निश्चित डिग्री की संभावना के साथ, दूसरी विशेषता के संबंधित मूल्य की भविष्यवाणी कर सकता है। विशेषताओं की रैखिक निर्भरता निम्नलिखित प्रकार के समीकरण द्वारा वर्णित है:

वाई = ए +बी * एक्स ,

कहाँ ए -समीकरण का मुक्त पद एक बिंदु पर ग्राफ़ के उत्थान के बराबर होता है एक्स=0भुज अक्ष के सापेक्ष, बी - प्रतिगमन रेखा के ढलान का कोणीय गुणांक एब्सिस्सा अक्ष पर ग्राफ के झुकाव के कोण के स्पर्शरेखा के बराबर है (बशर्ते कि दोनों अक्षों पर मानों का पैमाना समान हो)।

अध्ययन के तहत विशेषताओं के मूल्यों को जानकर, आप निम्नलिखित सूत्रों का उपयोग करके मुक्त पद और प्रतिगमन गुणांक का मूल्य निर्धारित कर सकते हैं:

ए =एम बी * एम एक्स

हमारे मामले में:
;

ए = 58,3 – 0,97 * 166,6 = -103,3

इस प्रकार, वजन बनाम ऊंचाई का सूत्र इस प्रकार है: वाई = 0.969 * एक्स - 103.3

संबंधित ग्राफ़ नीचे दिखाया गया है।

यदि ऊंचाई और वजन के बीच संबंध का वर्णन करना आवश्यक है ( एक्ससे पर), फिर मान और बीभिन्न हो जाएं और सूत्रों को तदनुसार संशोधित किया जाना चाहिए:

एक्स= ए +बी एक्स * पर

ए =एम एक्स बी एक्स * एम

इस स्थिति में, ग्राफ़ का स्वरूप भी बदल जाता है।

प्रतिगमन गुणांक सहसंबंध गुणांक से निकटता से संबंधित है। उत्तरार्द्ध फ़ीचर प्रतिगमन गुणांक का ज्यामितीय माध्य है:

सहसंबंध गुणांक के वर्ग को निर्धारण गुणांक कहा जाता है। इसका मान चरों के पारस्परिक प्रभाव का प्रतिशत निर्धारित करता है। हमारे मामले में आर 2 = 0,76 2 = 0,58 . इसका मतलब यह है कि Y में कुल भिन्नता का 58% चर X के प्रभाव से समझाया गया है, शेष 42% समीकरण में ध्यान में नहीं रखे गए कारकों के प्रभाव के कारण है।

यह ध्यान दिया जाना चाहिए कि चर के बीच रैखिक संबंध की डिग्री का एक सच्चा संकेतक है सैद्धांतिक सहसंबंध गुणांक, जिसकी गणना संपूर्ण जनसंख्या (अर्थात सभी) के डेटा के आधार पर की जाती है संभावित मानसंकेतक):

कहाँ - सैद्धांतिक सहप्रसरण माप, जिसकी गणना एसवी के विचलन के उत्पादों की गणितीय अपेक्षा के रूप में की जाती है
और उनकी गणितीय अपेक्षाओं से.

एक नियम के रूप में, हम सैद्धांतिक सहसंबंध गुणांक की गणना नहीं कर सकते। हालाँकि, इस तथ्य से कि नमूनाकरण गुणांक शून्य के बराबर नहीं है
इसका तात्पर्य यह नहीं है कि सैद्धांतिक गुणांक भी है
(यानी संकेतक रैखिक रूप से स्वतंत्र हो सकते हैं)। वह। यादृच्छिक नमूनाकरण डेटा के आधार पर, यह नहीं कहा जा सकता कि संकेतकों के बीच कोई संबंध है।

नमूना सहसंबंध गुणांक सैद्धांतिक गुणांक का एक अनुमान है, क्योंकि इसकी गणना केवल परिवर्तनीय मानों के भाग के लिए की जाती है।

हमेशा मौजूद है सहसंबंध गुणांक त्रुटि. यह त्रुटि नमूना मात्रा के सहसंबंध गुणांक के बीच विसंगति है और जनसंख्या के लिए सहसंबंध गुणांक सूत्रों द्वारा निर्धारित किया जाता है:

पर
; और
पर
.

रैखिक सहसंबंध गुणांक के महत्व का परीक्षण करने का मतलब यह परीक्षण करना है कि हम नमूना डेटा पर कितना भरोसा कर सकते हैं।

इस प्रयोजन हेतु शून्य परिकल्पना का परीक्षण किया जाता है
कि सामान्य जनसंख्या के लिए सहसंबंध गुणांक का मान शून्य है, अर्थात जनसंख्या में कोई सहसंबंध नहीं है. एक वैकल्पिक परिकल्पना है
.

इस परिकल्पना का परीक्षण करने के लिए, हम गणना करते हैं - आँकड़े ( -छात्र का टी-टेस्ट:

.

जिसके साथ एक छात्र वितरण है
स्वतंत्रता की डिग्री 1.

महत्वपूर्ण मान छात्र वितरण तालिकाओं से निर्धारित किया जाता है
.

यदि गणना मानदंड मान
, तो शून्य परिकल्पना खारिज कर दी जाती है, अर्थात, परिकलित सहसंबंध गुणांक संभाव्यता के साथ शून्य से काफी भिन्न होता है
.

अगर
, तो शून्य परिकल्पना को अस्वीकार नहीं किया जा सकता। इस मामले में, यह संभव है कि सहसंबंध गुणांक का वास्तविक मान शून्य है, अर्थात। संकेतकों के बीच संबंध को सांख्यिकीय रूप से महत्वहीन माना जा सकता है।

उदाहरण 1. तालिका कुल आय पर 8 वर्षों का डेटा दिखाती है और अंतिम उपभोग व्यय .

दिए गए संकेतकों के बीच संबंधों की निकटता का अध्ययन करें और मापें।

विषय 4. युग्मित रैखिक प्रतिगमन। न्यूनतम वर्ग विधि

सहसंबंध गुणांक दो विशेषताओं के बीच संबंध की निकटता की डिग्री को इंगित करता है, लेकिन यह इस सवाल का जवाब नहीं देता है कि एक विशेषता में उसके आयाम की एक इकाई द्वारा परिवर्तन किसी अन्य विशेषता में परिवर्तन को कैसे प्रभावित करता है। इस प्रश्न का उत्तर देने के लिए, प्रतिगमन विश्लेषण विधियों का उपयोग किया जाता है।

प्रतिगमन विश्लेषणसेट रूपएक यादृच्छिक चर के बीच निर्भरता और परिवर्तनशील मान
, और मूल्य
सटीक रूप से निर्दिष्ट माने जाते हैं।

प्रतिगमन समीकरणचरों के बीच सांख्यिकीय संबंध के लिए एक सूत्र है।

यदि यह सूत्र रैखिक है, तो हम बात कर रहे हैं रेखीय प्रतिगमन।दो चरों के बीच सांख्यिकीय संबंध का सूत्र कहलाता है जोड़ीवार प्रतिगमन(कई चर - एकाधिक).

निर्भरता सूत्र का चुनाव कहलाता है विनिर्देशप्रतिगमन समीकरण. चयनित सूत्र के मापदंडों के मान का अनुमान लगाना कहलाता है पैरामीटरीकरण.

पैरामीटर मानों का अनुमान कैसे लगाएं और किए गए अनुमानों की विश्वसनीयता की जांच कैसे करें?

आइए ड्राइंग को देखें

    ग्राफ़ (ए) में संबंध एक्सऔर पररैखिक के करीब है, सीधी रेखा 1 यहां अवलोकन बिंदुओं के करीब है और बाद वाला अपेक्षाकृत छोटे यादृच्छिक प्रभावों के परिणामस्वरूप ही इससे विचलित होता है।

    ग्राफ़ (बी) मात्राओं के बीच वास्तविक संबंध दिखाता है एक्सऔर परएक गैर-रेखीय फ़ंक्शन 2 द्वारा वर्णित है, और इससे कोई फर्क नहीं पड़ता कि हम कौन सी सीधी रेखा खींचते हैं (उदाहरण के लिए, 1), इससे बिंदुओं का विचलन गैर-यादृच्छिक होगा।

    ग्राफ (सी) में चर के बीच संबंध एक्सऔर परगायब है, और किसी भी निर्भरता सूत्र के मानकीकरण के परिणाम असफल होंगे।

अर्थमितीय संबंध विश्लेषण के लिए प्रारंभिक बिंदु आमतौर पर अनुमान लगाना है रैखिक निर्भरताचर। आप हमेशा एक सीधी रेखा खींचने का प्रयास कर सकते हैं जो समग्रता में अवलोकन बिंदुओं के "निकटतम" होगी (उदाहरण के लिए, चित्र (सी) में सीधी रेखा 1 सीधी रेखा 2 से बेहतर होगी)।

सैद्धांतिक जोड़ीवार रैखिक प्रतिगमन समीकरणइसका रूप है:


,

कहाँ
कहा जाता है सैद्धांतिक पैरामीटर (सैद्धांतिक गुणांक) प्रतिगमन; -यादृच्छिक विचलन(आकस्मिक गलती).

सामान्य तौर पर, हम सैद्धांतिक मॉडल को इस प्रकार प्रस्तुत करेंगे:

.

सैद्धांतिक प्रतिगमन गुणांक के मूल्यों को निर्धारित करने के लिए, चर के सभी मूल्यों को जानना आवश्यक है एक्सऔर वाई, अर्थात। सभी सामान्य जनसंख्या, जो व्यावहारिक रूप से असंभव है।

कार्य इस प्रकार है: उपलब्ध अवलोकन संबंधी आंकड़ों के अनुसार
,
पैरामीटर मानों का अनुमान लगाना आवश्यक है
.

होने देना पैरामीटर अनुमान
,बीपैरामीटर अनुमान .

तब अनुमानित प्रतिगमन समीकरण है:
,

कहाँ
आश्रित चर के सैद्धांतिक मूल्य , - त्रुटि मान देखे गए . इस समीकरण को कहा जाता है अनुभवजन्य प्रतिगमन समीकरण. हम इसे फॉर्म में लिखेंगे
.

रैखिक प्रतिगमन मापदंडों का अनुमान लगाने का आधार है न्यूनतम वर्ग विधि (एमएनसी)रैखिक प्रतिगमन मापदंडों का अनुमान लगाने की एक विधि है जो वांछित रैखिक फ़ंक्शन से आश्रित चर के अवलोकनों के वर्ग विचलन के योग को कम करती है।

समारोह क्यूहै द्विघात फंक्शनदो पैरामीटर और बी. क्योंकि यह सतत, उत्तल और नीचे से घिरा हुआ है (
), इसलिए यह न्यूनतम तक पहुँच जाता है। न्यूनतम के अस्तित्व के लिए एक आवश्यक शर्त इसके आंशिक व्युत्पन्न के शून्य के बराबर होना है और बी:


.

सिस्टम के दोनों समीकरणों को विभाजित करना एन, हम पाते हैं:


या

अन्यथा आप लिख सकते हैं:

और - समान विशेषताओं के मूल्यों के मानक विचलन।

वह। प्रतिगमन रेखा औसत मान वाले बिंदु से होकर गुजरती है एक्सऔर पर
, ए प्रतिगमन गुणांक बी सहप्रसरण सूचकांक और गुणांक के समानुपाती होता है रैखिक सहसंबंध.

यदि प्रतिगमन के अलावा वाईपर एक्ससमान अनुभवजन्य मूल्यों के लिए, Y पर X का प्रतिगमन समीकरण (
, कहाँ
), फिर गुणांकों का गुणनफल
:

.

को प्रतिगमन गुणांक  यह एक मान है जो दर्शाता है कि आयाम की कितनी इकाइयों का मान बदलेगा मूल्य बदलते समय इसके आयाम की प्रति इकाई। गुणांक इसी प्रकार निर्धारित किया जाता है .

वैज्ञानिक अनुसंधान में, अक्सर परिणाम और कारक चर (फसल की उपज और वर्षा की मात्रा, लिंग और उम्र के अनुसार सजातीय समूहों में एक व्यक्ति की ऊंचाई और वजन, हृदय गति और शरीर का तापमान) के बीच संबंध खोजने की आवश्यकता होती है। , वगैरह।)।

दूसरे वे संकेत हैं जो उनसे जुड़े लोगों (पहले) में बदलाव में योगदान करते हैं।

सहसंबंध विश्लेषण की अवधारणा

उपरोक्त के आधार पर हम कह सकते हैं कि सहसंबंध विश्लेषण एक ऐसी विधि है जिसका उपयोग परिकल्पना का परीक्षण करने के लिए किया जाता है आंकड़ों की महत्तादो या दो से अधिक चर यदि शोधकर्ता उन्हें माप सकता है लेकिन उन्हें बदल नहीं सकता है।

विचाराधीन अवधारणा की अन्य परिभाषाएँ भी हैं। सहसंबंध विश्लेषण एक प्रसंस्करण विधि है जिसमें चर के बीच सहसंबंध गुणांक का अध्ययन करना शामिल है। इस मामले में, एक जोड़ी या विशेषताओं के कई जोड़े के बीच सहसंबंध गुणांक की तुलना उनके बीच सांख्यिकीय संबंध स्थापित करने के लिए की जाती है। सहसंबंध विश्लेषण एक सख्त कार्यात्मक प्रकृति की वैकल्पिक उपस्थिति के साथ यादृच्छिक चर के बीच सांख्यिकीय निर्भरता का अध्ययन करने की एक विधि है, जिसमें एक यादृच्छिक चर की गतिशीलता गतिशीलता की ओर ले जाती है गणितीय अपेक्षाएक और।

गलत सहसंबंध की अवधारणा

संचालन करते समय सहसंबंध विश्लेषणयह ध्यान में रखना आवश्यक है कि इसे विशेषताओं के किसी भी सेट के संबंध में किया जा सकता है, जो अक्सर एक-दूसरे के संबंध में बेतुका होता है। कभी-कभी उनका एक-दूसरे के साथ कोई कारणात्मक संबंध नहीं होता है।

इस मामले में, वे गलत सहसंबंध के बारे में बात करते हैं।

सहसंबंध विश्लेषण की समस्याएं

उपरोक्त परिभाषाओं के आधार पर, हम वर्णित विधि के निम्नलिखित कार्य तैयार कर सकते हैं: दूसरे का उपयोग करके मांगे गए चर में से एक के बारे में जानकारी प्राप्त करना; अध्ययन किए गए चरों के बीच संबंध की निकटता निर्धारित करें।

सहसंबंध विश्लेषण में अध्ययन की जा रही विशेषताओं के बीच संबंध निर्धारित करना शामिल है, और इसलिए सहसंबंध विश्लेषण के कार्यों को निम्नलिखित के साथ पूरक किया जा सकता है:

  • उन कारकों की पहचान जिनका परिणामी विशेषता पर सबसे अधिक प्रभाव पड़ता है;
  • कनेक्शन के पहले से अज्ञात कारणों की पहचान;
  • इसके पैरामीट्रिक विश्लेषण के साथ सहसंबंध मॉडल का निर्माण;
  • संचार मापदंडों के महत्व और उनके अंतराल मूल्यांकन का अध्ययन।

सहसंबंध विश्लेषण और प्रतिगमन के बीच संबंध

सहसंबंध विश्लेषण की विधि अक्सर अध्ययन की गई मात्राओं के बीच संबंध की निकटता का पता लगाने तक सीमित नहीं है। कभी-कभी इसे प्रतिगमन समीकरणों के संकलन द्वारा पूरक किया जाता है, जो एक ही नाम के विश्लेषण का उपयोग करके प्राप्त किए जाते हैं, और जो परिणामी और कारक (कारक) विशेषता (विशेषताओं) के बीच सहसंबंध निर्भरता का विवरण प्रस्तुत करते हैं। यह विधि, विचाराधीन विश्लेषण के साथ मिलकर, विधि का निर्माण करती है

विधि का उपयोग करने की शर्तें

प्रभावी कारक एक से कई कारकों पर निर्भर करते हैं। यदि प्रभावी और कारक संकेतकों (कारकों) के मूल्य के बारे में बड़ी संख्या में अवलोकन हैं, तो सहसंबंध विश्लेषण की विधि का उपयोग किया जा सकता है, जबकि अध्ययन के तहत कारक मात्रात्मक होने चाहिए और विशिष्ट स्रोतों में परिलक्षित होने चाहिए। पहले को सामान्य कानून द्वारा निर्धारित किया जा सकता है - इस मामले में, सहसंबंध विश्लेषण का परिणाम पियर्सन सहसंबंध गुणांक है, या, यदि विशेषताएँ इस कानून का पालन नहीं करती हैं, तो गुणांक का उपयोग किया जाता है रैंक सहसंबंधस्पीयरमैन.

सहसंबंध विश्लेषण कारकों के चयन के नियम

उपयोग करते समय यह विधिप्रदर्शन संकेतकों को प्रभावित करने वाले कारकों को निर्धारित करना आवश्यक है। उनका चयन इस तथ्य को ध्यान में रखते हुए किया जाता है कि संकेतकों के बीच कारण-और-प्रभाव संबंध होना चाहिए। एक मल्टीफैक्टर सहसंबंध मॉडल बनाने के मामले में, परिणामी संकेतक पर महत्वपूर्ण प्रभाव डालने वाले लोगों का चयन किया जाता है, जबकि सहसंबंध मॉडल में 0.85 से अधिक के युग्म सहसंबंध गुणांक वाले अन्योन्याश्रित कारकों को शामिल नहीं करना बेहतर होता है, साथ ही वे भी जिसके लिए परिणामी पैरामीटर के साथ संबंध रैखिक या कार्यात्मक चरित्र नहीं है।

परिणाम प्रदर्शित हो रहे हैं

सहसंबंध विश्लेषण के परिणाम पाठ और ग्राफिक रूपों में प्रस्तुत किए जा सकते हैं। पहले मामले में, उन्हें सहसंबंध गुणांक के रूप में प्रस्तुत किया जाता है, दूसरे में - एक बिखराव आरेख के रूप में।

मापदंडों के बीच सहसंबंध की अनुपस्थिति में, आरेख पर बिंदु अव्यवस्थित रूप से स्थित होते हैं, कनेक्शन की औसत डिग्री को क्रम की एक बड़ी डिग्री की विशेषता होती है और मध्यिका से चिह्नित निशानों की अधिक या कम समान दूरी की विशेषता होती है। एक मजबूत कनेक्शन सीधा होता है और r=1 पर डॉट प्लॉट एक सपाट रेखा होती है। विपरीत सहसंबंध ग्राफ़ की दिशा में ऊपरी बाएँ से निचले दाएँ तक भिन्न होता है, सीधा सहसंबंध - निचले बाएँ से ऊपरी दाएँ कोने तक होता है।

स्कैटर प्लॉट का 3डी प्रतिनिधित्व

पारंपरिक 2डी स्कैटर प्लॉट डिस्प्ले के अलावा, सहसंबंध विश्लेषण का 3डी ग्राफिकल प्रतिनिधित्व अब उपयोग किया जाता है।

स्कैटरप्लॉट मैट्रिक्स का भी उपयोग किया जाता है, जो सभी युग्मित प्लॉट्स को मैट्रिक्स प्रारूप में एक ही आकृति में प्रदर्शित करता है। n वेरिएबल्स के लिए, मैट्रिक्स में n पंक्तियाँ और n कॉलम होते हैं। आई-वें पंक्ति और जे-वें कॉलम के चौराहे पर स्थित चार्ट वेरिएबल Xi बनाम Xj का एक प्लॉट है। इस प्रकार, प्रत्येक पंक्ति और स्तंभ एक आयाम है, एक एकल कक्ष दो आयामों का स्कैटरप्लॉट प्रदर्शित करता है।

कनेक्शन की मजबूती का आकलन करना

सहसंबंध कनेक्शन की निकटता सहसंबंध गुणांक (आर) द्वारा निर्धारित की जाती है: मजबूत - आर = ±0.7 से ±1, मध्यम - आर = ±0.3 से ±0.699, कमजोर - आर = 0 से ±0.299। यह वर्गीकरण सख्त नहीं है. यह आंकड़ा थोड़ा अलग आरेख दिखाता है।

सहसंबंध विश्लेषण पद्धति का उपयोग करने का एक उदाहरण

ब्रिटेन में एक दिलचस्प अध्ययन किया गया। यह धूम्रपान और फेफड़ों के कैंसर के बीच संबंध के लिए समर्पित है, और सहसंबंध विश्लेषण के माध्यम से किया गया था। यह अवलोकन नीचे प्रस्तुत किया गया है।

सहसंबंध विश्लेषण के लिए प्रारंभिक डेटा

व्यावसायिक समूह

मृत्यु दर

किसान, वनवासी और मछुआरे

खनिक और खदान श्रमिक

गैस, कोक और रसायन के निर्माता

कांच और चीनी मिट्टी के निर्माता

भट्टियों, फोर्ज, फाउंड्री और रोलिंग मिलों के श्रमिक

इलेक्ट्रिकल और इलेक्ट्रॉनिक्स कर्मचारी

इंजीनियरिंग और संबंधित व्यवसाय

लकड़ी उद्योग

चर्मकार

कपड़ा श्रमिक

काम के कपड़े के निर्माता

भोजन, पेय और तंबाकू उद्योगों में श्रमिक

कागज और प्रिंट निर्माता

अन्य उत्पादों के निर्माता

बिल्डर्स

चित्रकार और सज्जाकार

स्थिर इंजन, क्रेन आदि के चालक।

ऐसे श्रमिक जो अन्यत्र शामिल नहीं हैं

परिवहन और संचार कर्मचारी

गोदाम कर्मचारी, स्टोरकीपर, पैकर्स और भरने वाली मशीन श्रमिक

कार्यालयीन कर्मचारी

सेलर्स

खेल और मनोरंजन कार्यकर्ता

प्रशासक और प्रबंधक

पेशेवर, तकनीशियन और कलाकार

हम सहसंबंध विश्लेषण शुरू करते हैं। स्पष्टता के लिए समाधान की शुरुआत इससे बेहतर है ग्राफ़िक विधि, जिसके लिए हम एक स्कैटर आरेख का निर्माण करेंगे।

यह सीधा संबंध दर्शाता है. हालाँकि, अकेले ग्राफिकल विधि के आधार पर कोई स्पष्ट निष्कर्ष निकालना मुश्किल है। इसलिए, हम सहसंबंध विश्लेषण करना जारी रखेंगे। सहसंबंध गुणांक की गणना का एक उदाहरण नीचे प्रस्तुत किया गया है।

सॉफ़्टवेयर का उपयोग करना (एमएस एक्सेल को एक उदाहरण के रूप में नीचे वर्णित किया जाएगा), हम सहसंबंध गुणांक निर्धारित करते हैं, जो 0.716 है, जिसका अर्थ है अध्ययन के तहत मापदंडों के बीच एक मजबूत संबंध। आइए संबंधित तालिका का उपयोग करके प्राप्त मूल्य की सांख्यिकीय विश्वसनीयता निर्धारित करें, जिसके लिए हमें 25 जोड़े मानों में से 2 घटाने की आवश्यकता है, परिणामस्वरूप हमें 23 मिलता है और तालिका में इस पंक्ति का उपयोग करके हम r को p = 0.01 के लिए महत्वपूर्ण पाते हैं (चूंकि ये चिकित्सा डेटा हैं, एक अधिक सख्त निर्भरता, अन्य मामलों में पी=0.05 पर्याप्त है), जो इस सहसंबंध विश्लेषण के लिए 0.51 है। उदाहरण से पता चला कि परिकलित r महत्वपूर्ण r से अधिक है, और सहसंबंध गुणांक का मान सांख्यिकीय रूप से विश्वसनीय माना जाता है।

सहसंबंध विश्लेषण करते समय सॉफ़्टवेयर का उपयोग करना

वर्णित प्रकार के सांख्यिकीय डेटा प्रोसेसिंग का उपयोग करके किया जा सकता है सॉफ़्टवेयर, विशेष रूप से, एमएस एक्सेल। सहसंबंध में फ़ंक्शंस का उपयोग करके निम्नलिखित मापदंडों की गणना करना शामिल है:

1. सहसंबंध गुणांक CORREL फ़ंक्शन (array1; array2) का उपयोग करके निर्धारित किया जाता है। Array1,2 - परिणामी और कारक चर के मानों के अंतराल का सेल।

रैखिक सहसंबंध गुणांक को पियर्सन सहसंबंध गुणांक भी कहा जाता है, और इसलिए, एक्सेल 2007 से शुरू करके, आप समान सरणियों के साथ फ़ंक्शन का उपयोग कर सकते हैं।

एक्सेल में सहसंबंध विश्लेषण का ग्राफिकल प्रदर्शन "स्कैटर प्लॉट" चयन के साथ "चार्ट" पैनल का उपयोग करके किया जाता है।

प्रारंभिक डेटा निर्दिष्ट करने के बाद, हमें एक ग्राफ़ मिलता है।

2. छात्र के टी-टेस्ट का उपयोग करके जोड़ीवार सहसंबंध गुणांक के महत्व का आकलन करना। टी-मानदंड के परिकलित मूल्य की तुलना इस सूचक के सारणीबद्ध (महत्वपूर्ण) मूल्य के साथ विचाराधीन पैरामीटर के मूल्यों की संबंधित तालिका से की जाती है, जो महत्व के निर्दिष्ट स्तर और स्वतंत्रता की डिग्री की संख्या को ध्यान में रखता है। यह अनुमान STUDISCOVER (प्रायिकता; डिग्री_ऑफ़_फ्रीडम) फ़ंक्शन का उपयोग करके किया जाता है।

3. युग्म सहसंबंध गुणांक का मैट्रिक्स। विश्लेषण डेटा विश्लेषण उपकरण का उपयोग करके किया जाता है, जिसमें सहसंबंध का चयन किया जाता है। युग्म सहसंबंध गुणांकों का सांख्यिकीय मूल्यांकन इसकी तुलना करके किया जाता है निरपेक्ष मूल्यसारणीबद्ध (महत्वपूर्ण) मान के साथ। जब गणना की गई जोड़ीदार सहसंबंध गुणांक महत्वपूर्ण एक से अधिक हो जाती है, तो हम संभाव्यता की दी गई डिग्री को ध्यान में रखते हुए कह सकते हैं कि रैखिक संबंध के महत्व के बारे में शून्य परिकल्पना को अस्वीकार नहीं किया गया है।

अंत में

वैज्ञानिक अनुसंधान में सहसंबंध विश्लेषण पद्धति का उपयोग हमें बीच संबंध निर्धारित करने की अनुमति देता है कई कारकऔर प्रदर्शन संकेतक। यह ध्यान में रखना आवश्यक है कि एक उच्च सहसंबंध गुणांक एक बेतुके जोड़े या डेटा के सेट से प्राप्त किया जा सकता है, और इसलिए इस प्रकारविश्लेषण डेटा के पर्याप्त बड़े सरणी पर किया जाना चाहिए।

आर का परिकलित मूल्य प्राप्त करने के बाद, एक निश्चित मूल्य की सांख्यिकीय विश्वसनीयता की पुष्टि करने के लिए इसकी तुलना महत्वपूर्ण आर से करने की सलाह दी जाती है। सहसंबंध विश्लेषण मैन्युअल रूप से सूत्रों का उपयोग करके, या सॉफ़्टवेयर का उपयोग करके, विशेष रूप से एमएस एक्सेल में किया जा सकता है। यहां आप सहसंबंध विश्लेषण के अध्ययन किए गए कारकों और परिणामी विशेषता के बीच संबंधों को दृश्य रूप से दर्शाने के उद्देश्य से एक स्कैटर आरेख भी बना सकते हैं।

चरण 3. डेटा के बीच संबंध ढूँढना

रैखिक सहसंबंध

घटनाओं के बीच संबंधों का अध्ययन करने के कार्य का अंतिम चरण सहसंबंध संकेतकों का उपयोग करके कनेक्शन की निकटता का आकलन करना है। यह चरण कारक और प्रदर्शन विशेषताओं के बीच निर्भरता की पहचान करने के लिए बहुत महत्वपूर्ण है, और परिणामस्वरूप, अध्ययन की जा रही घटना का निदान और पूर्वानुमान लगाने की संभावना के लिए।

निदान(ग्रीक निदान मान्यता से) - किसी वस्तु या घटना की स्थिति के सार और विशेषताओं का उसके व्यापक अध्ययन के आधार पर निर्धारण।

पूर्वानुमान(ग्रीक पूर्वानुमान दूरदर्शिता, भविष्यवाणी से) - भविष्य में किसी भी घटना की स्थिति के बारे में कोई विशिष्ट भविष्यवाणी, निर्णय (मौसम पूर्वानुमान, चुनाव परिणाम, आदि)। पूर्वानुमान अध्ययन के तहत प्रणाली, वस्तु या घटना की संभावित भविष्य की स्थिति और इस स्थिति को दर्शाने वाले संकेतकों के बारे में वैज्ञानिक रूप से आधारित परिकल्पना है। पूर्वानुमान - पूर्वानुमान विकास, विशेष वैज्ञानिक अनुसंधानकिसी भी घटना के विकास के लिए विशिष्ट संभावनाएँ।

आइए सहसंबंध की परिभाषा याद रखें:

सह - संबंध- यादृच्छिक चर के बीच निर्भरता, इस तथ्य में व्यक्त की जाती है कि एक मूल्य का वितरण दूसरे मूल्य के मूल्य पर निर्भर करता है।

न केवल मात्रात्मक, बल्कि गुणात्मक विशेषताओं के बीच भी सहसंबंध देखा जाता है। अस्तित्व विभिन्न तरीकेऔर संबंधों की निकटता का आकलन करने के लिए संकेतक। हम यहीं रुकेंगे रैखिक जोड़ी सहसंबंध गुणांक , जिसका उपयोग तब किया जाता है जब यादृच्छिक चर के बीच एक रैखिक संबंध होता है। व्यवहार में, अक्सर असमान आयामों के यादृच्छिक चर के बीच संबंध के स्तर को निर्धारित करने की आवश्यकता होती है, इसलिए इस संबंध की किसी प्रकार की आयामहीन विशेषता होना वांछनीय है। ऐसी विशेषता (कनेक्शन का माप) रैखिक सहसंबंध गुणांक है आर xy, जो सूत्र द्वारा निर्धारित किया जाता है

कहाँ , .

तथा को निरूपित करते हुए, हम सहसंबंध गुणांक की गणना के लिए निम्नलिखित अभिव्यक्ति प्राप्त कर सकते हैं

.

यदि हम अवधारणा का परिचय देते हैं सामान्यीकृत विचलन , जो मानक विचलन के अंशों में औसत से सहसंबद्ध मूल्यों के विचलन को व्यक्त करता है:



तब सहसंबंध गुणांक के लिए व्यंजक रूप लेगा

.

यदि आप प्रारंभिक के अंतिम मूल्यों के आधार पर सहसंबंध गुणांक की गणना करते हैं यादृच्छिक चरगणना तालिका से, सहसंबंध गुणांक की गणना सूत्र का उपयोग करके की जा सकती है

.

रैखिक सहसंबंध गुणांक के गुण:

1). सहसंबंध गुणांक एक आयामहीन मात्रा है।

2). |आर| £1 या .

3). , ए,बी= स्थिरांक, - यदि यादृच्छिक चर X और Y के सभी मानों को एक स्थिरांक से गुणा (या विभाजित) किया जाए तो सहसंबंध गुणांक का मान नहीं बदलेगा।

4). , ए,बी= स्थिरांक, - यदि यादृच्छिक चर X और Y के सभी मान एक स्थिरांक द्वारा बढ़ाए (या घटाए गए) हैं तो सहसंबंध गुणांक का मान नहीं बदलेगा।

5). सहसंबंध गुणांक और प्रतिगमन गुणांक के बीच एक संबंध है:

सहसंबंध गुणांक के मूल्यों की व्याख्या इस प्रकार की जा सकती है:

संचार की निकटता का आकलन करने के लिए मात्रात्मक मानदंड:

पूर्वानुमान संबंधी प्रयोजनों के लिए, |r| वाले मान > 0.7.

सहसंबंध गुणांक हमें यह निष्कर्ष निकालने की अनुमति देता है कि दो यादृच्छिक चर के बीच एक रैखिक संबंध है, लेकिन यह इंगित नहीं करता है कि कौन सा चर दूसरे में परिवर्तन का कारण बनता है। वास्तव में, दो यादृच्छिक चर के बीच संबंध स्वयं मूल्यों के बीच कारण-और-प्रभाव संबंध के बिना मौजूद हो सकता है, क्योंकि दोनों यादृच्छिक चर में परिवर्तन तीसरे के परिवर्तन (प्रभाव) के कारण हो सकता है।

सहसंबंध गुणांक आर xyविचाराधीन यादृच्छिक चर के संबंध में सममित है एक्सऔर वाई. इसका मतलब यह है कि सहसंबंध गुणांक निर्धारित करने के लिए यह पूरी तरह से उदासीन है कि कौन सी मात्रा स्वतंत्र है और कौन सी निर्भर है।

सहसंबंध गुणांक का महत्व

यहां तक ​​के लिए स्वतंत्र मात्राएँमाप परिणामों के यादृच्छिक बिखरने या यादृच्छिक चर के एक छोटे नमूने के कारण सहसंबंध गुणांक शून्य से भिन्न हो सकता है। इसलिए, सहसंबंध गुणांक के महत्व की जांच की जानी चाहिए।

रैखिक सहसंबंध गुणांक के महत्व की जाँच इसके आधार पर की जाती है विद्यार्थी का टी-टेस्ट :

.

अगर टी > टी करोड़(पी, एन-2), फिर रैखिक गुणांकसहसंबंध महत्वपूर्ण है, और इसलिए सांख्यिकीय संबंध भी महत्वपूर्ण है एक्सऔर वाई.

.

गणना में आसानी के लिए, सहसंबंध गुणांक की आत्मविश्वास सीमा के मूल्यों की तालिकाएँ बनाई गई हैं विभिन्न संख्याएँस्वतंत्रता की कोटियां एफ = एन-2 (दो-पूंछ परीक्षण) और विभिन्न महत्व स्तर = 0.1; 0.05; 0.01 और 0.001. यदि परिकलित सहसंबंध गुणांक दिए गए सहसंबंध गुणांक की विश्वास सीमा के मान से अधिक हो तो सहसंबंध को महत्वपूर्ण माना जाता है एफऔर एक।

बड़े लोगों के लिए एनऔर = 0.01 सहसंबंध गुणांक की विश्वास सीमा के मूल्य की गणना अनुमानित सूत्र का उपयोग करके की जा सकती है

.

परिचय। 2

1. छात्र के एफ-परीक्षण का उपयोग करके प्रतिगमन और सहसंबंध गुणांक के महत्व का आकलन करना। 3

2. छात्र के एफ-टेस्ट का उपयोग करके प्रतिगमन और सहसंबंध गुणांक के महत्व की गणना। 6

निष्कर्ष। 15

प्रतिगमन समीकरण के निर्माण के बाद, इसके महत्व की जांच करना आवश्यक है: विशेष मानदंडों का उपयोग करके, यह निर्धारित करें कि परिणामी निर्भरता है या नहीं समीकरण द्वारा व्यक्त किया गयाप्रतिगमन, यादृच्छिक, यानी क्या इसका उपयोग पूर्वानुमान उद्देश्यों के लिए और के लिए किया जा सकता है? कारक विश्लेषण. सांख्यिकी में, प्रतिगमन गुणांक के महत्व का कड़ाई से परीक्षण करने के लिए तरीके विकसित किए गए हैं भिन्नता का विश्लेषणऔर विशेष मानदंड की गणना (उदाहरण के लिए, एफ-मानदंड)। औसत सापेक्ष रैखिक विचलन (ई) की गणना करके एक ढीला परीक्षण किया जा सकता है औसत त्रुटिअनुमान:

आइए अब हम प्रतिगमन गुणांक bj के महत्व का आकलन करने और प्रतिगमन मॉडल Ru (J=l,2,..., p) के मापदंडों के लिए एक विश्वास अंतराल का निर्माण करने के लिए आगे बढ़ें।

ब्लॉक 5 - छात्र के ^-परीक्षण के मूल्य के आधार पर प्रतिगमन गुणांक के महत्व का आकलन। टा के परिकलित मानों की तुलना अनुमेय मान से की जाती है

ब्लॉक 5 - ^-मानदंड के मूल्य के आधार पर प्रतिगमन गुणांक के महत्व का आकलन। T0n के परिकलित मानों की तुलना अनुमेय मान 4,/ से की जाती है, जो किसी दी गई त्रुटि संभावना (ए) और स्वतंत्रता की डिग्री की संख्या (/) के लिए टी-वितरण तालिकाओं से निर्धारित होता है।

संपूर्ण मॉडल के महत्व की जांच करने के अलावा, छात्र/-परीक्षण का उपयोग करके प्रतिगमन गुणांक के महत्व का परीक्षण करना आवश्यक है। प्रतिगमन गुणांक br का न्यूनतम मान bifob- ^t स्थिति के अनुरूप होना चाहिए, जहां bi i-वें कारक विशेषता के लिए प्राकृतिक पैमाने पर प्रतिगमन समीकरण के गुणांक का मान है; आह. - प्रत्येक गुणांक का माध्य वर्ग त्रुटि। उनके महत्व में गुणांक डी की अतुलनीयता;

आगे सांख्यिकीय विश्लेषण प्रतिगमन गुणांक के महत्व का परीक्षण करने से संबंधित है। ऐसा करने के लिए, हम प्रतिगमन गुणांक के लिए ^-मानदंड का मान ज्ञात करते हैं। उनकी तुलना के परिणामस्वरूप, सबसे छोटा ^-मानदंड निर्धारित किया जाता है। वह कारक जिसका गुणांक सबसे छोटे ^-मानदंड से मेल खाता है, उसे आगे के विश्लेषण से बाहर रखा गया है।

प्रतिगमन और सहसंबंध गुणांक के सांख्यिकीय महत्व का आकलन करने के लिए, छात्र का टी-टेस्ट और विश्वास अंतरालप्रत्येक सूचक. संकेतकों की यादृच्छिक प्रकृति के बारे में एक परिकल्पना सामने रखी गई है, अर्थात। शून्य से उनके नगण्य अंतर के बारे में। छात्र के एफ-परीक्षण का उपयोग करके प्रतिगमन और सहसंबंध गुणांक के महत्व का आकलन यादृच्छिक त्रुटि के परिमाण के साथ उनके मूल्यों की तुलना करके किया जाता है:

छात्र/-परीक्षण का उपयोग करके शुद्ध प्रतिगमन गुणांक के महत्व का आकलन करने से मूल्य की गणना होती है

श्रम की गुणवत्ता विशिष्ट श्रम की एक विशेषता है, जो आर्थिक विकास के लिए इसकी जटिलता, तीव्रता (तीव्रता), स्थितियों और महत्व की डिग्री को दर्शाती है। के.टी. एक टैरिफ प्रणाली के माध्यम से मापा जाता है जो योग्यता के स्तर (काम की जटिलता), परिस्थितियों, श्रम की गंभीरता और इसकी तीव्रता के साथ-साथ विकास के लिए व्यक्तिगत उद्योगों और उत्पादन, क्षेत्रों, क्षेत्रों के महत्व के आधार पर मजदूरी को अलग करने की अनुमति देता है। देश की अर्थव्यवस्था. के.टी. में अभिव्यक्ति पाता है वेतनश्रमिक, आपूर्ति और मांग के प्रभाव में श्रम बाजार में विकास कर रहे हैं कार्यबल(विशिष्ट प्रकार के श्रम)। के.टी. - संरचना में जटिल

परियोजना के व्यक्तिगत आर्थिक, सामाजिक और पर्यावरणीय परिणामों के सापेक्ष महत्व के प्राप्त अंक, एक परियोजना के "सामाजिक और पर्यावरणीय-आर्थिक दक्षता के जटिल स्कोरिंग आयामहीन मानदंड" का उपयोग करके वैकल्पिक परियोजनाओं और उनके विकल्पों की तुलना करने के लिए एक आधार प्रदान करते हैं, गणना की गई (औसत महत्व स्कोर में) सूत्र का उपयोग कर

इंट्रा-उद्योग विनियमन किसी दिए गए उद्योग में श्रमिकों के लिए मजदूरी में अंतर सुनिश्चित करता है, जो किसी दिए गए उद्योग में व्यक्तिगत प्रकार के उत्पादन के महत्व, जटिलता और कामकाजी परिस्थितियों के साथ-साथ उपयोग किए गए पारिश्रमिक के रूपों पर निर्भर करता है।

व्यक्तिगत संकेतकों के महत्व को ध्यान में रखे बिना मानक उद्यम के संबंध में विश्लेषण किए गए उद्यम का परिणामी रेटिंग मूल्यांकन तुलनात्मक है। कई उद्यमों की रेटिंग की तुलना करते समय उच्चतम रेटिंगप्राप्त तुलनात्मक मूल्यांकन के न्यूनतम मूल्य वाला एक उद्यम है।

किसी उत्पाद की गुणवत्ता को उसकी उपयोगिता के माप के रूप में समझना व्यावहारिक रूप से मायने रखता है महत्वपूर्ण सवालइसके माप के बारे में. इसका समाधान किसी विशिष्ट आवश्यकता की पूर्ति में व्यक्तिगत गुणों के महत्व का अध्ययन करके प्राप्त किया जाता है। उत्पाद की खपत की स्थितियों के आधार पर एक ही संपत्ति का महत्व भी भिन्न हो सकता है। नतीजतन, उत्पाद की उपयोगिता अलग-अलग परिस्थितियाँइसके उपयोग अलग-अलग हैं.

कार्य का दूसरा चरण सांख्यिकीय आंकड़ों का अध्ययन करना और संकेतकों के संबंध और अंतःक्रिया की पहचान करना, व्यक्तिगत कारकों के महत्व और सामान्य संकेतकों में परिवर्तन के कारणों का निर्धारण करना है।

सभी विचारित संकेतकों को एक में इस तरह से संयोजित किया जाता है कि परिणाम उद्यम की गतिविधियों के सभी विश्लेषण किए गए पहलुओं का एक व्यापक मूल्यांकन होता है, इसकी गतिविधि की स्थितियों को ध्यान में रखते हुए, व्यक्तिगत संकेतकों के महत्व की डिग्री को ध्यान में रखते हुए विभिन्न प्रकार केनिवेशक:

प्रतिगमन गुणांक प्रदर्शन संकेतक पर कारकों के प्रभाव की तीव्रता को दर्शाते हैं। यदि कारक संकेतकों का प्रारंभिक मानकीकरण किया जाता है, तो b0 कुल में प्रभावी संकेतक के औसत मूल्य के बराबर है। गुणांक बी, बी2 ..... बीएल दिखाते हैं कि प्रभावी संकेतक का स्तर अपने औसत मूल्य से कितनी इकाइयों से विचलित होता है यदि कारक संकेतक का मान शून्य के बराबर औसत से एक के बराबर विचलन होता है मानक विचलन. इस प्रकार, प्रतिगमन गुणांक प्रदर्शन संकेतक के स्तर को बढ़ाने के लिए व्यक्तिगत कारकों के महत्व की डिग्री को दर्शाते हैं। प्रतिगमन गुणांक के विशिष्ट मान विधि के अनुसार अनुभवजन्य डेटा से निर्धारित किए जाते हैं कम से कम वर्गों(सामान्य समीकरणों की प्रणालियों को हल करने के परिणामस्वरूप)।

2. छात्र के एफ-टेस्ट का उपयोग करके प्रतिगमन और सहसंबंध गुणांक के महत्व की गणना

आइए बहुकारक संबंधों के रैखिक रूप को न केवल सबसे सरल मानें, बल्कि पीसी के लिए एप्लिकेशन सॉफ़्टवेयर पैकेजों द्वारा प्रदान किए गए रूप पर भी विचार करें। यदि किसी व्यक्तिगत कारक और परिणामी विशेषता के बीच संबंध रैखिक नहीं है, तो कारक विशेषता के मान को प्रतिस्थापित या परिवर्तित करके समीकरण को रैखिक बनाया जाता है।

सामान्य फ़ॉर्मबहुभिन्नरूपी प्रतिगमन समीकरण का रूप है:


जहाँ k कारक विशेषताओं की संख्या है।

समीकरण (8.32) के मापदंडों की गणना के लिए आवश्यक न्यूनतम वर्ग समीकरणों की प्रणाली को सरल बनाने के लिए, इन विशेषताओं के औसत मूल्यों से सभी विशेषताओं के व्यक्तिगत मूल्यों के विचलन को आमतौर पर पेश किया जाता है।

हमें न्यूनतम वर्गों के k समीकरणों की एक प्रणाली प्राप्त होती है:

इस प्रणाली को हल करते हुए, हम सशर्त रूप से शुद्ध प्रतिगमन गुणांक बी के मान प्राप्त करते हैं। समीकरण के मुक्त पद की गणना सूत्र द्वारा की जाती है


शब्द "सशर्त रूप से शुद्ध प्रतिगमन गुणांक" का अर्थ है कि प्रत्येक मान bj उसके औसत मूल्य से परिणामी विशेषता के कुल औसत विचलन को मापता है जब कोई दिया गया कारक xj उसके माप की एक इकाई द्वारा उसके औसत मूल्य से विचलन करता है और बशर्ते कि सभी प्रतिगमन समीकरण में शामिल अन्य कारक, औसत मूल्यों पर तय होते हैं, बदलते नहीं हैं, भिन्न नहीं होते हैं।

इस प्रकार, युग्मित प्रतिगमन गुणांक के विपरीत, सशर्त शुद्ध प्रतिगमन गुणांक अन्य कारकों की भिन्नता के साथ इस कारक की भिन्नता के संबंध से अलग होकर, एक कारक के प्रभाव को मापता है। यदि प्रतिगमन समीकरण में परिणामी विशेषता की भिन्नता को प्रभावित करने वाले सभी कारकों को शामिल करना संभव होता, तो बीजे के मान। कारकों के शुद्ध प्रभाव का माप माना जा सकता है। लेकिन चूंकि समीकरण में सभी कारकों को शामिल करना वास्तव में असंभव है, तो गुणांक बी.जे. समीकरण में शामिल नहीं किए गए कारकों के प्रभाव के मिश्रण से मुक्त नहीं।

प्रतिगमन समीकरण में सभी कारकों को तीन कारणों में से किसी एक या सभी को एक साथ शामिल करना असंभव है, क्योंकि:

1) कुछ कारक अज्ञात हो सकते हैं आधुनिक विज्ञान, किसी भी प्रक्रिया का ज्ञान हमेशा अधूरा होता है;

2) कुछ ज्ञात सैद्धांतिक कारकों के बारे में कोई जानकारी नहीं है या यह अविश्वसनीय है;

3) अध्ययन की जा रही जनसंख्या का आकार (नमूना) सीमित है, जिससे प्रतिगमन समीकरण में सीमित संख्या में कारकों को शामिल करना संभव हो जाता है।

सशर्त शुद्ध प्रतिगमन गुणांक बी.जे. माप की विभिन्न इकाइयों में व्यक्त नामित संख्याएँ हैं और इसलिए एक दूसरे के साथ अतुलनीय हैं। उन्हें तुलनीय सापेक्ष संकेतकों में परिवर्तित करने के लिए, जोड़ीवार सहसंबंध गुणांक प्राप्त करने के लिए उसी परिवर्तन का उपयोग किया जाता है। परिणामी मान को कहा जाता है मानकीकृत गुणांकप्रतिगमन या?-गुणांक.


कारक xj का गुणांक परिणामी विशेषता y की भिन्नता पर कारक xj की भिन्नता के प्रभाव का माप निर्धारित करता है, जो प्रतिगमन समीकरण में शामिल अन्य कारकों की सहवर्ती भिन्नता से अलग होता है।

सशर्त रूप से शुद्ध प्रतिगमन के गुणांक को कनेक्शन के सापेक्ष तुलनीय संकेतक, लोच गुणांक के रूप में व्यक्त करना उपयोगी है:

कारक xj का लोच गुणांक कहता है कि जब किसी दिए गए कारक का मान उसके औसत मान से 1% विचलित हो जाता है और समीकरण में शामिल अन्य कारकों के सहवर्ती विचलन से अलग हो जाता है, तो परिणामी विशेषता उसके औसत मान से ej प्रतिशत तक विचलित हो जाएगी वाई से अधिक बार, लोच गुणांक की व्याख्या और गतिशीलता के संदर्भ में की जाती है: कारक x में इसके औसत मूल्य के 1% की वृद्धि के साथ, परिणामी विशेषता इसके औसत मूल्य के प्रतिशत तक बढ़ जाएगी।

आइए एक उदाहरण के रूप में उन्हीं 16 फ़ार्मों का उपयोग करके बहुकारक प्रतिगमन समीकरण की गणना और व्याख्या पर विचार करें (तालिका 8.1)। परिणामी चिन्ह - स्तर सकल आयऔर इसे प्रभावित करने वाले तीन कारक तालिका में प्रस्तुत किए गए हैं। 8.7.

आइए हम एक बार फिर याद करें कि सहसंबंध के विश्वसनीय और पर्याप्त सटीक संकेतक प्राप्त करने के लिए एक बड़ी आबादी की आवश्यकता होती है।


तालिका 8.7

सकल आय का स्तर और उसके कारक

फार्म नंबर

सकल आय, रु./रा

श्रम लागत, मानव दिवस/हेक्टेयर x1

कृषि योग्य भूमि का हिस्सा,

प्रति 1 गाय दूध की उपज,

तालिका 8.8 प्रतिगमन समीकरण संकेतक

आश्रित चर: y

प्रतिगमन गुणांक

स्थिरांक-240.112905

एसटीडी. अनुमान की त्रुटि = 79.243276


समाधान पीसी के लिए "माइक्रोस्टेट" प्रोग्राम का उपयोग करके किया गया था। यहां प्रिंटआउट से तालिकाएं हैं: तालिका। 8.7 सभी विशेषताओं के औसत मान और मानक विचलन देता है। मेज़ 8.8 में प्रतिगमन गुणांक और उनका संभाव्य मूल्यांकन शामिल है:

पहला कॉलम "var" - चर, यानी कारक; दूसरा कॉलम "प्रतिगमन गुणांक" - सशर्त रूप से शुद्ध प्रतिगमन गुणांक बी.जे.; तीसरा कॉलम “एसटीडी. त्रुटि" - प्रतिगमन गुणांक अनुमान में औसत त्रुटियां; चौथा स्तंभ - भिन्नता की स्वतंत्रता के 12 डिग्री के साथ छात्र के टी-टेस्ट के मूल्य; पाँचवाँ स्तंभ "संभावना" - प्रतिगमन गुणांक के सापेक्ष शून्य परिकल्पना की संभावना;

छठा स्तंभ "आंशिक आर2" - निर्धारण के आंशिक गुणांक। कॉलम 3-6 में संकेतकों की गणना के लिए सामग्री और पद्धति पर अध्याय 8 में आगे चर्चा की गई है। "स्थिर" प्रतिगमन समीकरण ए का मुक्त शब्द है; "एसटीडी. अनुमान की त्रुटि।" - प्रतिगमन समीकरण का उपयोग करके प्रभावी विशेषता का अनुमान लगाने की माध्य वर्ग त्रुटि। समीकरण प्राप्त हुआ एकाधिक प्रतिगमन:

y = 2.26x1 - 4.31x2 + 0.166x3 - 240।

इसका मतलब है कि प्रति 1 हेक्टेयर कृषि भूमि पर सकल आय की मात्रा में औसतन 2.26 रूबल की वृद्धि हुई। श्रम लागत में 1 घंटा/हेक्टेयर की वृद्धि के साथ; औसतन 4.31 रूबल की कमी हुई। कृषि भूमि में कृषि योग्य भूमि की हिस्सेदारी में 1% की वृद्धि और 0.166 रूबल की वृद्धि के साथ। प्रति गाय दूध की उपज में 1 किलो की वृद्धि के साथ। मुक्त अवधि का नकारात्मक मूल्य काफी स्वाभाविक है, और, जैसा कि पैराग्राफ 8.2 में पहले ही उल्लेख किया गया है, प्रभावी संकेत यह है कि कारकों के शून्य मूल्यों तक पहुंचने से बहुत पहले सकल आय शून्य हो जाती है, जो उत्पादन में असंभव है।

x^ के लिए गुणांक का नकारात्मक मान अध्ययन के तहत खेतों की अर्थव्यवस्था में महत्वपूर्ण परेशानी का संकेत है, जहां फसल खेती लाभहीन है, और केवल पशुधन खेती लाभदायक है। खेती के तर्कसंगत तरीकों और सभी क्षेत्रों के उत्पादों के लिए सामान्य कीमतों (संतुलन या उनके करीब) के साथ, आय में कमी नहीं होनी चाहिए, बल्कि कृषि भूमि - कृषि योग्य भूमि के सबसे उपजाऊ हिस्से में वृद्धि के साथ वृद्धि होनी चाहिए।

तालिका की अंतिम दो पंक्तियों के डेटा के आधार पर। 8.7 और तालिका. 8.8 हम सूत्रों (8.34) और (8.35) के अनुसार पी-गुणांक और लोच गुणांक की गणना करते हैं।

आय के स्तर में भिन्नता और गतिशीलता में इसके संभावित परिवर्तन दोनों कारक x3 से सबसे अधिक प्रभावित होते हैं - गायों की उत्पादकता, और x2 द्वारा सबसे कमजोर - कृषि योग्य भूमि का हिस्सा। P2/ मानों का आगे भी उपयोग किया जाएगा (तालिका 8.9);

तालिका 8.9 आय स्तर पर कारकों का तुलनात्मक प्रभाव

कारक xj


तो, हमने पाया है कि कारक xj का ?-गुणांक इस कारक के लोच गुणांक से संबंधित है, क्योंकि कारक की भिन्नता का गुणांक परिणामी विशेषता की भिन्नता के गुणांक से संबंधित है। चूँकि, जैसा कि तालिका की अंतिम पंक्ति से देखा जा सकता है। 8.7, सभी कारकों की भिन्नता के गुणांक परिणामी विशेषता की भिन्नता के गुणांक से कम हैं; सभी?-गुणांक लोच गुणांक से कम हैं।

आइए एक उदाहरण के रूप में कारक -सी का उपयोग करके युग्मित और सशर्त रूप से शुद्ध प्रतिगमन गुणांक के बीच संबंध पर विचार करें। जोड़े रेखीय समीकरण x के साथ कनेक्शन y का रूप इस प्रकार है:

y = 3.886x1 – 243.2

X1 पर सशर्त रूप से शुद्ध प्रतिगमन गुणांक युग्मित का केवल 58% है। शेष 42% इस तथ्य के कारण है कि भिन्नता x1 के साथ कारक x2 x3 में भिन्नता होती है, जो बदले में परिणामी गुण को प्रभावित करती है। सभी विशेषताओं के कनेक्शन और उनके जोड़ीवार प्रतिगमन गुणांक कनेक्शन ग्राफ (चित्र 8.2) में प्रस्तुत किए गए हैं।


यदि हम y पर भिन्नता x1 के प्रत्यक्ष और अप्रत्यक्ष प्रभाव का अनुमान जोड़ते हैं, यानी सभी "पथों" (चित्र 8.2) के साथ युग्मित प्रतिगमन गुणांक का उत्पाद, तो हमें मिलता है: 2.26 + 12.55 0.166 + (-0.00128) (- 4.31) + (-0.00128) 17.00 0.166 = 4.344।

यह मान और भी अधिक है जोड़ी गुणांक Y के साथ कनेक्शन X1। नतीजतन, समीकरण में शामिल नहीं किए गए कारकों के माध्यम से भिन्नता x1 का अप्रत्यक्ष प्रभाव विपरीत है, कुल मिलाकर:

1 अयवाज़यान एस.ए., मख़ितारियन वी.एस. व्यावहारिक आँकड़े और अर्थमिति के बुनियादी सिद्धांत। विश्वविद्यालयों के लिए पाठ्यपुस्तक. - एम.: यूनिटी, 2008, - 311 पी।

2 जॉनसन जे. अर्थमितीय विधियाँ। - एम.: सांख्यिकी, 1980। - 282s.

3 डफ़र्टी के. अर्थमिति का परिचय। - एम.: इन्फ्रा-एम, 2004, - 354 पी।

4 ड्रेयर एन., स्मिथ जी., एप्लाइड प्रतिगमन विश्लेषण. - एम.: वित्त और सांख्यिकी, 2006, - 191 पी।

5 मैग्नस वाई.आर., कार्तीशेव पी.के., पेरेसेट्स्की ए.ए. अर्थमिति। प्रारंभिक पाठ्यक्रम.-एम.: डेलो, 2006, - 259 पी.

इकोनोमेट्रिक्स/एड पर 6 कार्यशाला। आई.आई. एलिसेवा - एम.: वित्त और सांख्यिकी, 2004, - 248 पी।

7 अर्थमिति/एड. आई.आई. एलिसेवा - एम.: वित्त और सांख्यिकी, 2004, - 541 पी।

8 क्रेमर एन., पुटको बी. इकोनोमेट्रिक्स - एम.: यूनिटी-दाना, 200, - 281 पी।


अयवाज़यान एस.ए., मख़ितारियन वी.एस. व्यावहारिक आँकड़े और अर्थमिति के बुनियादी सिद्धांत। विश्वविद्यालयों के लिए पाठ्यपुस्तक. - एम.: यूनिटी, 2008, - पी. 23.

क्रेमर एन., पुटको बी. इकोनोमेट्रिक्स.- एम.: यूनिटी-दाना, 200, - पी.64

ड्रेयर एन., स्मिथ जी., एप्लाइड रिग्रेशन विश्लेषण। - एम.: वित्त और सांख्यिकी, 2006, - पृष्ठ57।

अर्थमिति/एड पर कार्यशाला। आई.आई. एलिसेवा। - एम.: वित्त और सांख्यिकी, - 172।



साइट पर नया

>

सबसे लोकप्रिय