घर लेपित जीभ सहसंबंध गुणांक का उपयोग सांख्यिकीय महत्व का परीक्षण करने के लिए किया जाता है। परीक्षण: छात्र के एफ-परीक्षण का उपयोग करके प्रतिगमन और सहसंबंध गुणांक के महत्व का आकलन करना

सहसंबंध गुणांक का उपयोग सांख्यिकीय महत्व का परीक्षण करने के लिए किया जाता है। परीक्षण: छात्र के एफ-परीक्षण का उपयोग करके प्रतिगमन और सहसंबंध गुणांक के महत्व का आकलन करना

जैसा कि बार-बार उल्लेख किया गया है, अध्ययन के तहत चर के बीच सहसंबंध की उपस्थिति या अनुपस्थिति के बारे में एक सांख्यिकीय निष्कर्ष निकालने के लिए, नमूना सहसंबंध गुणांक के महत्व की जांच करना आवश्यक है। इस तथ्य के कारण कि सहसंबंध गुणांक सहित सांख्यिकीय विशेषताओं की विश्वसनीयता, नमूना आकार पर निर्भर करती है, ऐसी स्थिति उत्पन्न हो सकती है जब सहसंबंध गुणांक का मूल्य पूरी तरह से नमूने में यादृच्छिक उतार-चढ़ाव से निर्धारित होता है जिसके आधार पर इसकी गणना की जाती है। . यदि चरों के बीच कोई महत्वपूर्ण संबंध है, तो सहसंबंध गुणांक शून्य से काफी भिन्न होना चाहिए। यदि अध्ययन के अंतर्गत चरों के बीच कोई सहसंबंध नहीं है, तो जनसंख्या सहसंबंध गुणांक ρ शून्य के बराबर है। व्यावहारिक अनुसंधान में, एक नियम के रूप में, वे नमूना टिप्पणियों पर आधारित होते हैं। किसी भी सांख्यिकीय विशेषता की तरह, नमूना सहसंबंध गुणांक है अनियमित परिवर्तनशील वस्तु, यानी इसके मान एक ही नाम के जनसंख्या पैरामीटर (सहसंबंध गुणांक का सही मूल्य) के आसपास बेतरतीब ढंग से बिखरे हुए हैं। चरों के बीच सहसंबंध के अभाव में वाई और एक्सजनसंख्या में सहसंबंध गुणांक शून्य है। लेकिन प्रकीर्णन की यादृच्छिक प्रकृति के कारण, ऐसी स्थितियाँ मौलिक रूप से संभव हैं जब इस जनसंख्या के नमूनों से गणना किए गए कुछ सहसंबंध गुणांक शून्य से भिन्न होंगे।

क्या देखे गए अंतरों को नमूने में यादृच्छिक उतार-चढ़ाव के लिए जिम्मेदार ठहराया जा सकता है, या क्या वे उन स्थितियों में एक महत्वपूर्ण बदलाव को दर्शाते हैं जिनके तहत चर के बीच संबंध बने थे? यदि नमूना सहसंबंध गुणांक के मान संकेतक की यादृच्छिक प्रकृति के कारण बिखराव क्षेत्र में आते हैं, तो यह किसी रिश्ते की अनुपस्थिति का प्रमाण नहीं है। अधिकतम यही कहा जा सकता है कि अवलोकन संबंधी डेटा चरों के बीच किसी संबंध की अनुपस्थिति से इनकार नहीं करता है। लेकिन यदि नमूना सहसंबंध गुणांक का मान उल्लिखित बिखरने वाले क्षेत्र के बाहर है, तो वे निष्कर्ष निकालते हैं कि यह शून्य से काफी अलग है, और हम मान सकते हैं कि चर के बीच वाई और एक्सएक सांख्यिकीय रूप से महत्वपूर्ण संबंध है. विभिन्न आँकड़ों के वितरण के आधार पर इस समस्या को हल करने के लिए उपयोग किए जाने वाले मानदंड को महत्व मानदंड कहा जाता है।

महत्व परीक्षण प्रक्रिया शून्य परिकल्पना के निर्माण के साथ शुरू होती है एच0 . सामान्य शब्दों में, यह है कि नमूना पैरामीटर और जनसंख्या पैरामीटर के बीच कोई महत्वपूर्ण अंतर नहीं है। वैकल्पिक परिकल्पना एच1 बात यह है कि इन मापदंडों के बीच महत्वपूर्ण अंतर हैं। उदाहरण के लिए, जब किसी जनसंख्या में सहसंबंध का परीक्षण किया जाता है, तो शून्य परिकल्पना यह होती है कि वास्तविक सहसंबंध गुणांक शून्य है ( ह0: ρ = 0). यदि, परीक्षण के परिणामस्वरूप, यह पता चलता है कि शून्य परिकल्पना स्वीकार्य नहीं है, तो नमूना सहसंबंध गुणांक आरबहुत खूबशून्य से काफी भिन्न (शून्य परिकल्पना खारिज कर दी जाती है और विकल्प स्वीकार कर लिया जाता है)। एच1).दूसरे शब्दों में, यह धारणा कि जनसंख्या में यादृच्छिक चर असंबंधित हैं, निराधार मानी जानी चाहिए। इसके विपरीत, यदि महत्व परीक्षण के आधार पर शून्य परिकल्पना स्वीकार की जाती है, अर्थात। आरबहुत खूबयादृच्छिक प्रकीर्णन के अनुमेय क्षेत्र में है, तो जनसंख्या में असंबद्ध चर की धारणा को संदिग्ध मानने का कोई कारण नहीं है।

एक महत्व परीक्षण में, शोधकर्ता एक महत्व स्तर α निर्धारित करता है जो कुछ व्यावहारिक विश्वास प्रदान करता है कि गलत निष्कर्ष केवल बहुत ही दुर्लभ मामलों में निकाले जाएंगे। महत्व स्तर इस संभावना को व्यक्त करता है कि शून्य परिकल्पना ह0अस्वीकार कर दिया गया जबकि यह वास्तव में सत्य है। स्पष्ट रूप से, इस संभावना को यथासंभव छोटा चुनना समझदारी है।

नमूना विशेषता के वितरण को ज्ञात करें, जो जनसंख्या पैरामीटर का निष्पक्ष अनुमान है। चयनित महत्व स्तर α इस वितरण के वक्र के नीचे छायांकित क्षेत्रों से मेल खाता है (चित्र 24 देखें)। वितरण वक्र के नीचे अछायांकित क्षेत्र संभाव्यता निर्धारित करता है पी = 1 - α . छायांकित क्षेत्रों के नीचे एक्स-अक्ष पर खंडों की सीमाओं को महत्वपूर्ण मान कहा जाता है, और खंड स्वयं महत्वपूर्ण क्षेत्र, या परिकल्पना अस्वीकृति का क्षेत्र बनाते हैं।

परिकल्पना परीक्षण प्रक्रिया में, अवलोकनों के परिणामों से गणना की गई नमूना विशेषता की तुलना संबंधित महत्वपूर्ण मूल्य से की जाती है। इस मामले में, एक तरफा और दो तरफा महत्वपूर्ण क्षेत्रों के बीच अंतर करना चाहिए। महत्वपूर्ण क्षेत्र को निर्दिष्ट करने का रूप सांख्यिकीय अनुसंधान में समस्या के निरूपण पर निर्भर करता है। एक दो-तरफा महत्वपूर्ण क्षेत्र आवश्यक है, जब एक नमूना पैरामीटर और एक जनसंख्या पैरामीटर की तुलना करते समय, उनके बीच विसंगति के पूर्ण मूल्य का अनुमान लगाना आवश्यक होता है, अर्थात, अध्ययन किए गए मूल्यों के बीच सकारात्मक और नकारात्मक दोनों अंतर होते हैं दिलचस्पी। जब यह सुनिश्चित करना आवश्यक होता है कि एक मान, औसतन, दूसरे से सख्ती से अधिक या कम है, तो एक तरफा महत्वपूर्ण क्षेत्र (दाएं या बाएं तरफा) का उपयोग किया जाता है। यह बिल्कुल स्पष्ट है कि समान महत्वपूर्ण मान के लिए एक तरफा महत्वपूर्ण क्षेत्र का उपयोग करते समय महत्व का स्तर दो तरफा महत्वपूर्ण क्षेत्र का उपयोग करने से कम होता है। यदि नमूना विशेषता का वितरण सममित है,

चावल। 24. शून्य परिकल्पना H0 का परीक्षण

तब दो तरफा महत्वपूर्ण क्षेत्र का महत्व स्तर α के बराबर है, और एक तरफा - (चित्र 24 देखें)। आइए हम स्वयं को समस्या के सामान्य सूत्रीकरण तक ही सीमित रखें। सांख्यिकीय परिकल्पनाओं के परीक्षण के लिए सैद्धांतिक आधार पर अधिक विस्तृत जानकारी विशेष साहित्य में पाई जा सकती है। नीचे हम विभिन्न प्रक्रियाओं के निर्माण पर ध्यान दिए बिना केवल उनके महत्व मानदंड का संकेत देंगे।

जोड़ी सहसंबंध गुणांक के महत्व की जांच करके, अध्ययन के तहत घटनाओं के बीच सहसंबंध की उपस्थिति या अनुपस्थिति स्थापित की जाती है। कनेक्शन के अभाव में, जनसंख्या सहसंबंध गुणांक शून्य (ρ = 0) है। परीक्षण प्रक्रिया शून्य और वैकल्पिक परिकल्पनाओं के निर्माण से शुरू होती है:

ह0: नमूना सहसंबंध गुणांक के बीच अंतर आर और ρ = 0 महत्वहीन है,

एच 1: के बीच अंतर आरऔर ρ = 0 महत्वपूर्ण है, और इसलिए चर के बीच परऔर एक्सएक महत्वपूर्ण संबंध है. वैकल्पिक परिकल्पना का तात्पर्य है कि हमें दो-तरफा महत्वपूर्ण क्षेत्र का उपयोग करने की आवश्यकता है।

धारा 8.1 में पहले ही उल्लेख किया गया था कि नमूना सहसंबंध गुणांक, कुछ मान्यताओं के तहत, एक यादृच्छिक चर के साथ जुड़ा हुआ है टी, साथ छात्र वितरण का पालन करना एफ = एन- स्वतंत्रता की 2 डिग्री. नमूना परिणामों से सांख्यिकी की गणना की गई

किसी दिए गए महत्व स्तर α पर छात्र वितरण तालिका से निर्धारित महत्वपूर्ण मूल्य के साथ तुलना की जाती है औरएफ = एन- स्वतंत्रता की 2 डिग्री. मानदंड लागू करने का नियम इस प्रकार है: यदि | टी| >tf,ए, फिर महत्व स्तर α पर शून्य परिकल्पना अस्वीकृत, अर्थात चरों के बीच संबंध महत्वपूर्ण है; अगर | टी| ≤tf,ए, तो महत्व स्तर α पर शून्य परिकल्पना स्वीकार की जाती है। मूल्य विचलन आर ρ = 0 से यादृच्छिक भिन्नता को जिम्मेदार ठहराया जा सकता है। नमूना डेटा विचाराधीन परिकल्पना को बहुत संभव और प्रशंसनीय बताता है, यानी कनेक्शन की अनुपस्थिति की परिकल्पना आपत्तियां नहीं उठाती है।

किसी परिकल्पना के परीक्षण की प्रक्रिया यदि आँकड़ों के बजाय बहुत सरल हो जाती है टीसहसंबंध गुणांक के महत्वपूर्ण मूल्यों का उपयोग करें, जिसे (8.38) में प्रतिस्थापित करके छात्र वितरण की मात्राओं के माध्यम से निर्धारित किया जा सकता है। टी= tf, ए और आर= ρ एफ, ए:

(8.39)

महत्वपूर्ण मूल्यों की विस्तृत तालिकाएँ हैं, जिनका एक अंश इस पुस्तक के परिशिष्ट में दिया गया है (तालिका 6 देखें)। इस मामले में परिकल्पना का परीक्षण करने का नियम निम्नलिखित है: यदि आर> ρ एफ, और तब हम यह दावा कर सकते हैं कि चरों के बीच संबंध महत्वपूर्ण है। अगर आरआरएफ,ए, तो हम अवलोकन परिणामों को कनेक्शन की अनुपस्थिति की परिकल्पना के अनुरूप मानते हैं।

जैसा कि बार-बार उल्लेख किया गया है, अध्ययन के तहत चर के बीच सहसंबंध की उपस्थिति या अनुपस्थिति के बारे में एक सांख्यिकीय निष्कर्ष निकालने के लिए, नमूना सहसंबंध गुणांक के महत्व की जांच करना आवश्यक है। इस तथ्य के कारण कि सहसंबंध गुणांक सहित सांख्यिकीय विशेषताओं की विश्वसनीयता, नमूना आकार पर निर्भर करती है, ऐसी स्थिति उत्पन्न हो सकती है जब सहसंबंध गुणांक का मूल्य पूरी तरह से नमूने में यादृच्छिक उतार-चढ़ाव से निर्धारित होता है जिसके आधार पर इसकी गणना की जाती है। . यदि चरों के बीच कोई महत्वपूर्ण संबंध है, तो सहसंबंध गुणांक शून्य से काफी भिन्न होना चाहिए। यदि अध्ययनाधीन चरों के बीच कोई सहसंबंध नहीं है, तो जनसंख्या का सहसंबंध गुणांक शून्य के बराबर है। व्यावहारिक अनुसंधान में, एक नियम के रूप में, वे नमूना टिप्पणियों पर आधारित होते हैं। किसी भी सांख्यिकीय विशेषता की तरह, नमूना सहसंबंध गुणांक एक यादृच्छिक चर है, यानी इसके मान एक ही नाम के जनसंख्या पैरामीटर (सहसंबंध गुणांक का सही मूल्य) के आसपास यादृच्छिक रूप से बिखरे हुए हैं। यदि चरों के बीच कोई सहसंबंध नहीं है, तो जनसंख्या में उनका सहसंबंध गुणांक शून्य के बराबर है। लेकिन प्रकीर्णन की यादृच्छिक प्रकृति के कारण, ऐसी स्थितियाँ मौलिक रूप से संभव हैं जब इस जनसंख्या के नमूनों से गणना किए गए कुछ सहसंबंध गुणांक शून्य से भिन्न होंगे।

क्या देखे गए अंतरों को नमूने में यादृच्छिक उतार-चढ़ाव के लिए जिम्मेदार ठहराया जा सकता है, या क्या वे उन स्थितियों में एक महत्वपूर्ण बदलाव को दर्शाते हैं जिनके तहत चर के बीच संबंध बने थे? यदि नमूना सहसंबंध गुणांक के मान प्रकीर्णन क्षेत्र के अंतर्गत आते हैं,

सूचक की यादृच्छिक प्रकृति के कारण, यह किसी रिश्ते की अनुपस्थिति का प्रमाण नहीं है। अधिकतम यही कहा जा सकता है कि अवलोकन संबंधी डेटा चरों के बीच किसी संबंध की अनुपस्थिति से इनकार नहीं करता है। लेकिन यदि नमूना सहसंबंध गुणांक का मान उल्लिखित बिखरने वाले क्षेत्र के बाहर है, तो वे निष्कर्ष निकालते हैं कि यह शून्य से काफी अलग है, और हम मान सकते हैं कि चर के बीच एक सांख्यिकीय अंतर है सार्थक संबंध. विभिन्न आँकड़ों के वितरण के आधार पर इस समस्या को हल करने के लिए उपयोग किए जाने वाले मानदंड को महत्व मानदंड कहा जाता है।

महत्व परीक्षण प्रक्रिया शून्य परिकल्पना के निर्माण के साथ शुरू होती है। सामान्य तौर पर, यह है कि नमूना पैरामीटर और जनसंख्या पैरामीटर के बीच कोई महत्वपूर्ण अंतर नहीं है। एक वैकल्पिक परिकल्पना यह है कि इन मापदंडों के बीच महत्वपूर्ण अंतर हैं। उदाहरण के लिए, जब किसी जनसंख्या में सहसंबंध की उपस्थिति का परीक्षण किया जाता है, तो शून्य परिकल्पना यह होती है कि वास्तविक सहसंबंध गुणांक शून्य है। यदि परीक्षण के परिणाम में शून्य परिकल्पना अस्वीकार्य है, तो नमूना सहसंबंध गुणांक शून्य (शून्य) से काफी भिन्न है परिकल्पना को अस्वीकार कर दिया जाता है और विकल्प को स्वीकार कर लिया जाता है। दूसरे शब्दों में, यह धारणा कि जनसंख्या में यादृच्छिक चर असंबद्ध हैं, निराधार माना जाना चाहिए। और इसके विपरीत, यदि, महत्व मानदंड के आधार पर, शून्य परिकल्पना को स्वीकार कर लिया जाता है, अर्थात, यह झूठ है यादृच्छिक प्रकीर्णन के अनुमेय क्षेत्र में, तो जनसंख्या में असंबद्ध चर की धारणा को संदिग्ध मानने का कोई कारण नहीं है।

एक महत्व परीक्षण में, शोधकर्ता एक महत्व स्तर निर्धारित करता है जो कुछ व्यावहारिक विश्वास प्रदान करता है कि गलत निष्कर्ष केवल बहुत ही दुर्लभ मामलों में निकाले जाएंगे। महत्व स्तर इस संभावना को व्यक्त करता है कि शून्य परिकल्पना खारिज कर दी जाती है जबकि यह वास्तव में सत्य है। स्पष्ट रूप से, इस संभावना को यथासंभव छोटा चुनना समझदारी है।

नमूना विशेषता के वितरण को ज्ञात करें, जो जनसंख्या पैरामीटर का निष्पक्ष अनुमान है। चयनित महत्व स्तर इस वितरण के वक्र के नीचे छायांकित क्षेत्रों से मेल खाता है (चित्र 24 देखें)। वितरण वक्र के नीचे अछायांकित क्षेत्र संभाव्यता निर्धारित करता है। छायांकित क्षेत्रों के नीचे भुज अक्ष पर खंडों की सीमाओं को महत्वपूर्ण मान कहा जाता है, और खंड स्वयं महत्वपूर्ण क्षेत्र, या परिकल्पना अस्वीकृति का क्षेत्र बनाते हैं।

परिकल्पना परीक्षण प्रक्रिया में, अवलोकनों के परिणामों से गणना की गई नमूना विशेषता की तुलना संबंधित महत्वपूर्ण मूल्य से की जाती है। इस मामले में, एक तरफा और दो तरफा महत्वपूर्ण क्षेत्रों के बीच अंतर करना चाहिए। महत्वपूर्ण क्षेत्र को निर्दिष्ट करने का रूप समस्या के निरूपण पर निर्भर करता है सांख्यिकीय अनुसंधान. नमूना पैरामीटर और जनसंख्या पैरामीटर की तुलना करते समय दो-तरफा महत्वपूर्ण क्षेत्र की आवश्यकता होती है

उनके बीच विसंगति के पूर्ण मूल्य का अनुमान लगाना आवश्यक है, यानी, अध्ययन की गई मात्राओं के बीच सकारात्मक और नकारात्मक दोनों अंतर रुचि के हैं। जब यह सुनिश्चित करना आवश्यक होता है कि एक मान, औसतन, दूसरे से सख्ती से अधिक या कम है, तो एक तरफा महत्वपूर्ण क्षेत्र (दाएं या बाएं तरफा) का उपयोग किया जाता है। यह बिल्कुल स्पष्ट है कि समान महत्वपूर्ण मान के लिए एक तरफा महत्वपूर्ण क्षेत्र का उपयोग करते समय महत्व का स्तर दो तरफा महत्वपूर्ण क्षेत्र का उपयोग करने से कम होता है।

चावल। 24. शून्य परिकल्पना परीक्षण

यदि नमूना विशेषता का वितरण सममित है, तो दो तरफा महत्वपूर्ण क्षेत्र का महत्व स्तर a के बराबर है, और एक तरफा महत्वपूर्ण क्षेत्र y के बराबर है (चित्र 24 देखें)। आइए हम स्वयं को समस्या के सामान्य सूत्रीकरण तक ही सीमित रखें। परीक्षण के सैद्धांतिक औचित्य के बारे में अधिक विस्तार से सांख्यिकीय परिकल्पनाएँआप अंदर मिल सकते हैं विशिष्ट साहित्य. नीचे हम केवल इसके महत्व मानदंड का संकेत देंगे विभिन्न प्रक्रियाएँ, उनके निर्माण पर रोक लगाए बिना।

जोड़ी सहसंबंध गुणांक के महत्व की जांच करके, अध्ययन के तहत घटनाओं के बीच सहसंबंध की उपस्थिति या अनुपस्थिति स्थापित की जाती है। यदि कोई संबंध नहीं है, तो जनसंख्या का सहसंबंध गुणांक शून्य है। सत्यापन प्रक्रिया शून्य और वैकल्पिक परिकल्पनाओं के निर्माण के साथ शुरू होती है:

नमूना सहसंबंध गुणांक के बीच अंतर महत्वहीन है,

उनके बीच अंतर महत्वपूर्ण है, और इसलिए उनके चरों के बीच एक महत्वपूर्ण संबंध है। वैकल्पिक परिकल्पना का तात्पर्य है कि हमें दो-तरफा महत्वपूर्ण क्षेत्र का उपयोग करने की आवश्यकता है।

यह धारा 8.1 में पहले ही उल्लेख किया गया था कि नमूना सहसंबंध गुणांक, कुछ मान्यताओं के तहत, स्वतंत्रता की डिग्री के साथ छात्र वितरण के लिए एक यादृच्छिक चर विषय से जुड़ा हुआ है। नमूना परिणामों से सांख्यिकी की गणना की गई

किसी दिए गए महत्व स्तर ए और स्वतंत्रता की डिग्री पर छात्र वितरण तालिका से निर्धारित महत्वपूर्ण मूल्य के साथ तुलना की जाती है। मानदंड लागू करने का नियम इस प्रकार है: यदि शून्य परिकल्पना को महत्व स्तर ए पर खारिज कर दिया जाता है, यानी चर के बीच संबंध महत्वपूर्ण है; यदि तब महत्व स्तर a पर शून्य परिकल्पना स्वीकार कर ली जाती है। मूल्य के विचलन को यादृच्छिक भिन्नता के लिए जिम्मेदार ठहराया जा सकता है। नमूना डेटा विचाराधीन परिकल्पना को बहुत संभव और प्रशंसनीय बताता है, यानी कनेक्शन की अनुपस्थिति की परिकल्पना आपत्तियां नहीं उठाती है।

परिकल्पना परीक्षण प्रक्रिया बहुत सरल हो जाती है यदि, आँकड़ों के बजाय, हम सहसंबंध गुणांक के महत्वपूर्ण मूल्यों का उपयोग करते हैं, जिसे छात्र वितरण की मात्राओं के माध्यम से प्रतिस्थापित करके निर्धारित किया जा सकता है

महत्वपूर्ण मूल्यों की विस्तृत तालिकाएँ हैं, जिनका एक अंश इस पुस्तक के परिशिष्ट में दिया गया है (तालिका 6 देखें)। इस मामले में एक परिकल्पना का परीक्षण करने का नियम निम्नलिखित पर आधारित है: यदि हां, तो हम यह दावा कर सकते हैं कि चर के बीच संबंध महत्वपूर्ण है। यदि ऐसा है, तो हम अवलोकन परिणामों को कनेक्शन की अनुपस्थिति की परिकल्पना के अनुरूप मानते हैं।

आइए खंड 4.1 में दिए गए आंकड़ों के अनुसार काम के मशीनीकरण के स्तर से श्रम उत्पादकता की स्वतंत्रता के बारे में परिकल्पना का परीक्षण करें। पहले यह गणना की गई थी कि (8.38) से हम प्राप्त करते हैं

छात्र वितरण तालिका का उपयोग करके हम इस आँकड़े का महत्वपूर्ण मान पाते हैं: चूँकि हम शून्य परिकल्पना को अस्वीकार करते हैं, केवल 5% मामलों में त्रुटि करते हैं।

यदि हम संबंधित तालिका से प्राप्त सहसंबंध गुणांक के महत्वपूर्ण मान से तुलना करते हैं तो हमें वही परिणाम मिलेगा

जिसमें -स्वतंत्रता की डिग्री के साथ वितरण है। इसके बाद, महत्व की जांच करने की प्रक्रिया -मानदंड का उपयोग करके पिछले एक के समान ही की जाती है।

उदाहरण

घटना के आर्थिक विश्लेषण के आधार पर, हम सामान्य आबादी में श्रम उत्पादकता और काम के मशीनीकरण के स्तर के बीच एक मजबूत संबंध मानते हैं। उदाहरण के लिए, चलो. एक विकल्प के रूप में, इस मामले में हम इस परिकल्पना को सामने रख सकते हैं कि नमूना सहसंबंध गुणांक इस प्रकार, हमें एक तरफा महत्वपूर्ण क्षेत्र का उपयोग करना चाहिए। (8.40) से यह इस प्रकार है

हम प्राप्त मूल्य की तुलना महत्वपूर्ण मूल्य से करते हैं। इस प्रकार, 5% के महत्व स्तर पर, हम अध्ययन की गई विशेषताओं के बीच एक बहुत करीबी संबंध की उपस्थिति मान सकते हैं, यानी, प्रारंभिक डेटा इसे प्रशंसनीय मानना ​​​​संभव बनाता है

आंशिक सहसंबंध गुणांकों के महत्व की जाँच इसी प्रकार की जाती है। केवल स्वतंत्रता की डिग्री की संख्या बदलती है, जो व्याख्यात्मक चर की संख्या के बराबर हो जाती है। सांख्यिकी मूल्य की गणना सूत्र का उपयोग करके की जाती है

महत्व स्तर ए और स्वतंत्रता की डिग्री की संख्या पर वितरण तालिका से पाए गए महत्वपूर्ण मूल्य ए के साथ तुलना की जाती है। आंशिक सहसंबंध गुणांक के महत्व के बारे में परिकल्पना की स्वीकृति या अस्वीकृति ऊपर वर्णित उसी नियम के अनुसार की जाती है . (8.39) के अनुसार सहसंबंध गुणांक के महत्वपूर्ण मूल्यों के साथ-साथ फिशर परिवर्तन (8.40) का उपयोग करके भी महत्व परीक्षण किया जा सकता है।

उदाहरण

की जाँच करें सांख्यिकीय विश्वसनीयताआंशिक सहसंबंध गुणांक की गणना अनुभाग 4.5 में महत्व स्तर पर की गई है, आंशिक सहसंबंध गुणांक के साथ, संबंधित गणना और महत्वपूर्ण सांख्यिकी मान दिए गए हैं

इस तथ्य के कारण कि गुणांक के महत्व के बारे में परिकल्पना स्वीकार की जाती है, हम निष्कर्ष निकालते हैं: काम के मशीनीकरण के स्तर का श्रम उत्पादकता पर महत्वपूर्ण प्रभाव पड़ता है, श्रमिकों की औसत आयु (और अनुपालन का औसत प्रतिशत) के प्रभाव को छोड़कर मानक) शेष गुणांकों के शून्य से अंतर

आंशिक सहसंबंधों को नमूने में यादृच्छिक उतार-चढ़ाव के लिए जिम्मेदार ठहराया जा सकता है, और इसलिए उनसे हम प्रासंगिक चर के आंशिक प्रभावों के बारे में कुछ भी निश्चित नहीं कह सकते हैं।

गुणांक के महत्व के बारे में एकाधिक सहसंबंधगुणांक के महत्व की जाँच करने की प्रक्रिया के परिणाम के आधार पर निर्णय लिया जाता है एकाधिक दृढ़ संकल्प. हम अगले भाग में इस पर अधिक विस्तार से चर्चा करेंगे।

एक प्रश्न जो अक्सर दिलचस्पी का होता है वह है: क्या दो सहसंबंध गुणांक एक दूसरे से काफी भिन्न हैं? इस परिकल्पना का परीक्षण करते समय, यह माना जाता है कि सजातीय आबादी की समान विशेषताओं पर विचार किया जाता है; डेटा परिणामों का प्रतिनिधित्व करता है स्वतंत्र परीक्षण; एक ही प्रकार के सहसंबंध गुणांक का उपयोग किया जाता है, अर्थात, समान संख्या में चर को छोड़कर, या तो जोड़ीदार सहसंबंध गुणांक या आंशिक सहसंबंध गुणांक।

जिन दो नमूनों से सहसंबंध गुणांक की गणना की जाती है, उनकी मात्रा भिन्न हो सकती है। शून्य परिकल्पना: यानी, विचाराधीन दो आबादी के सहसंबंध गुणांक बराबर हैं। वैकल्पिक परिकल्पना: वैकल्पिक परिकल्पना का तात्पर्य है कि दो-तरफ़ा महत्वपूर्ण क्षेत्र का उपयोग किया जाना चाहिए। दूसरे शब्दों में, आपको जांचना चाहिए कि क्या अंतर शून्य से काफी भिन्न है। आइए उन आँकड़ों का उपयोग करें जिनका वितरण लगभग सामान्य है:

कहां - सहसंबंध गुणांक के परिवर्तनों के परिणाम - नमूना मात्रा। परीक्षण नियम: यदि तब परिकल्पना अस्वीकार कर दी जाती है; यदि तब परिकल्पना स्वीकृत हो जाती है।

यदि स्वीकार किया जाए तो मूल्य

पुनर्गणना के बाद (8.6) का उपयोग सहसंबंध गुणांक के सारांश अनुमान के रूप में कार्य करता है। इसके बाद, सांख्यिकी का उपयोग करके परिकल्पना का परीक्षण किया जा सकता है

सामान्य वितरण होना।

उदाहरण

यह स्थापित करना आवश्यक है कि क्या देश के विभिन्न क्षेत्रों में स्थित एक ही उद्योग के उद्यमों में श्रम उत्पादकता और काम के मशीनीकरण के स्तर के बीच संबंध की निकटता भिन्न है। आइए दो क्षेत्रों में स्थित उद्यमों की तुलना करें। मान लें कि उनमें से एक के लिए सहसंबंध गुणांक की गणना वॉल्यूम नमूने का उपयोग करके की जाती है (धारा 4.1 देखें)। अन्य क्षेत्र के लिए, वॉल्यूम नमूने का उपयोग करके गणना की गई

दोनों सहसंबंध गुणांकों को -मानों में परिवर्तित करने के बाद, हम (8.42) का उपयोग करके आँकड़ों X के मान की गणना करते हैं:

आँकड़ों का महत्वपूर्ण मान इस प्रकार है, परिकल्पना स्वीकार की जाती है, अर्थात, उपलब्ध नमूनों के आधार पर, हम सहसंबंध गुणांक के बीच एक महत्वपूर्ण अंतर स्थापित नहीं कर सकते हैं। इसके अलावा, दोनों सहसंबंध गुणांक महत्वपूर्ण हैं।

(8.43) और (8.6) का उपयोग करते हुए, हम दो क्षेत्रों के लिए सहसंबंध गुणांक का सारांश अनुमान प्राप्त करते हैं:

अंत में, आइए इस परिकल्पना की जाँच करें कि क्या सहसंबंध गुणांक का सारांश अनुमान आँकड़ों (8.44) का उपयोग करके शून्य से काफी भिन्न है:

चूंकि हम यह दावा कर सकते हैं कि सामान्य आबादी में श्रम उत्पादकता और काम के मशीनीकरण के स्तर के बीच एक महत्वपूर्ण संबंध है।

एक्स मानदंड का उपयोग विभिन्न पहलुओं में किया जा सकता है। इस प्रकार, क्षेत्रों के बजाय, विभिन्न उद्योगों पर विचार किया जा सकता है, उदाहरण के लिए, जब यह निर्धारित करना आवश्यक हो कि क्या बीच के अध्ययन किए गए कनेक्शन की ताकत में अंतर है आर्थिक संकेतकदो अलग-अलग उद्योगों से संबंधित उद्यम।

आइए हम दो वॉल्यूम नमूनों के आधार पर, दो उद्योगों (दो सामान्य आबादी) से संबंधित उद्यमों में श्रम उत्पादकता और काम के मशीनीकरण के स्तर के बीच घनिष्ठ संबंध को दर्शाने वाले सहसंबंध गुणांक की गणना करें। (8.42) से हम पाते हैं

चूँकि हम शून्य परिकल्पना को अस्वीकार करते हैं। नतीजतन, यह तर्क दिया जा सकता है कि विभिन्न उद्योगों से संबंधित उद्यमों में श्रम उत्पादकता और काम के मशीनीकरण के स्तर के बीच संबंधों की निकटता में महत्वपूर्ण अंतर हैं। हम इस उदाहरण को धारा 8.7 में जारी रखेंगे, जहां हम दो आबादी के लिए निर्मित प्रतिगमन रेखाओं की तुलना करेंगे।

दिए गए उदाहरणों का विश्लेषण करते हुए, हम आश्वस्त हैं कि तुलना किए गए सहसंबंध गुणांक के केवल पूर्ण अंतर पर विचार किया जा रहा है

(दोनों मामलों में नमूना आकार समान हैं) इस अंतर के महत्व की जांच किए बिना गलत निष्कर्ष निकलेंगे। यह सहसंबंध गुणांकों की तुलना करते समय सांख्यिकीय मानदंडों का उपयोग करने की आवश्यकता की पुष्टि करता है।

दो सहसंबंध गुणांकों की तुलना करने की प्रक्रिया को सामान्यीकृत किया जा सकता है बड़ी संख्याउपरोक्त शर्तों के अधीन गुणांक। चरों के बीच सहसंबंध गुणांकों की समानता की परिकल्पना इस प्रकार व्यक्त की गई है: इसका परीक्षण आयतन के नमूनों से गणना किए गए सहसंबंध गुणांकों के आधार पर किया जाता है सामान्य आबादी. सहसंबंध गुणांकों को -मानों में पुनर्गणना किया जाता है: चूंकि में सामान्य मामलाअज्ञात, हम इसका अनुमान सूत्र के माध्यम से पाते हैं, जो (8.43) का सामान्यीकरण है।

इस नोट का पूर्ण संस्करण (सूत्रों और तालिकाओं के साथ) इस पृष्ठ से पीडीएफ प्रारूप में डाउनलोड किया जा सकता है। पेज पर ही रखा गया टेक्स्ट है सारांशइस नोट की सामग्री और सबसे महत्वपूर्ण निष्कर्ष।

सांख्यिकी आशावादियों को समर्पित

सहसंबंध गुणांक (सीसी) यादृच्छिक चर के बीच संबंध को दर्शाने वाले सबसे सरल और सबसे लोकप्रिय आंकड़ों में से एक है। साथ ही, इसकी मदद से निकाले गए गलत और निरर्थक निष्कर्षों की संख्या में सीसी अग्रणी है। यह स्थिति सहसंबंध और सहसंबंध निर्भरता से संबंधित सामग्री प्रस्तुत करने की स्थापित प्रथा के कारण है।

बड़े, छोटे और "मध्यवर्ती" क्यूसी मान

सहसंबंध संबंध पर विचार करते समय, "मजबूत" (लगभग एकल) और "कमजोर" (लगभग शून्य) सहसंबंध की अवधारणा पर विस्तार से चर्चा की जाती है, लेकिन व्यवहार में न तो एक और न ही दूसरे का कभी सामना होता है। परिणामस्वरूप, व्यवहार में सामान्य "मध्यवर्ती" क्यूसी मूल्यों की उचित व्याख्या का प्रश्न अस्पष्ट बना हुआ है। सहसंबंध गुणांक बराबर 0.9 या 0.8 , एक शुरुआत में आशावाद को प्रेरित करता है, लेकिन निम्न मूल्य उसे भ्रमित करते हैं।

जैसे-जैसे अनुभव प्राप्त होता है, आशावाद बढ़ता है, और अब क्यूसी बराबर है 0.7 या 0.6 शोधकर्ता को प्रसन्न करता है और आशावाद को प्रेरित करता है 0.5 और 0.4 . यदि शोधकर्ता सांख्यिकीय परिकल्पनाओं के परीक्षण के तरीकों से परिचित है, तो "अच्छे" क्यूसी मूल्यों की सीमा कम हो जाती है 0.3 या 0.2 .

वास्तव में, कौन से CC मान पहले से ही "काफ़ी बड़े" माने जा सकते हैं और कौन से "बहुत छोटे" बने हुए हैं? इस प्रश्न के दो बिल्कुल विपरीत उत्तर हैं - आशावादी और निराशावादी। आइए पहले आशावादी (सबसे लोकप्रिय) उत्तर पर विचार करें।

सहसंबंध गुणांक का महत्व

यह उत्तर विकल्प हमें शास्त्रीय सांख्यिकी द्वारा दिया गया है और अवधारणा से संबंधित है आंकड़ों की महत्ता के.के. हम यहां केवल उस स्थिति पर विचार करेंगे जहां सकारात्मक सहसंबंध रुचिकर हो (नकारात्मक सहसंबंध का मामला पूरी तरह से समान है)। अधिक कठिन मामला, जब संकेत को ध्यान में रखे बिना केवल सहसंबंध की उपस्थिति की जाँच की जाती है, तो यह व्यवहार में अपेक्षाकृत दुर्लभ है।

यदि QC के लिए आरअसमानता संतुष्ट है आर > आर ई (एन), तो कहते हैं कि के.के आंकड़ों की दृष्टि से महत्वपूर्णमहत्व स्तर पर . यहाँ पुनः (एन)-- क्वांटाइल, जिसके संबंध में हमारी रुचि केवल इस तथ्य में होगी कि एक निश्चित महत्व स्तर पर इसका मान बढ़ती लंबाई के साथ शून्य हो जाता है एननमूने. यह पता चला है कि डेटा सरणी को बढ़ाकर, बहुत छोटे मूल्यों पर भी क्यूसी के सांख्यिकीय महत्व को प्राप्त करना संभव है। परिणामस्वरूप, यदि आपके पास पर्याप्त बड़ा नमूना है, तो उसे स्वीकार करना आकर्षक हो जाता है उदाहरण के लिए, CC बराबर के मामले में, 0.06 . हालाँकि, सामान्य ज्ञान यह तय करता है कि एक महत्वपूर्ण सहसंबंध की उपस्थिति के बारे में निष्कर्ष कब निकलेगा आर=0.06किसी भी नमूना आकार के लिए सत्य नहीं हो सकता। त्रुटि की प्रकृति को समझना बाकी है। ऐसा करने के लिए, आइए सांख्यिकीय महत्व की अवधारणा पर करीब से नज़र डालें।

हमेशा की तरह, सांख्यिकीय परिकल्पनाओं का परीक्षण करते समय, गणना का अर्थ शून्य परिकल्पना और वैकल्पिक परिकल्पना के चुनाव में निहित होता है। सीसी के महत्व की जाँच करते समय, धारणा को शून्य परिकल्पना के रूप में लिया जाता है (आर=0)वैकल्पिक परिकल्पना के अंतर्गत (आर > 0)(याद रखें कि हम यहां केवल उस स्थिति पर विचार कर रहे हैं जहां सकारात्मक सहसंबंध रुचिकर है)। स्वतंत्र रूप से चयन योग्य महत्व स्तर तथाकथित की संभावना निर्धारित करता है शून्य परिकल्पना सत्य होने पर टाइप I त्रुटियाँ ( आर=0), लेकिन सांख्यिकीय परीक्षण द्वारा खारिज कर दिया गया है (यानी परीक्षण गलती से एक महत्वपूर्ण सहसंबंध की उपस्थिति को पहचान लेता है)। महत्व स्तर का चयन करके, हम ऐसी त्रुटि की कम संभावना की गारंटी देते हैं, अर्थात। हम इस तथ्य से लगभग प्रतिरक्षित हैं कि स्वतंत्र नमूनों के लिए ( आर=0) ग़लती से सहसंबंध के अस्तित्व को पहचानना ( आर > 0). मोटे तौर पर, सहसंबंध गुणांक के महत्व का अर्थ केवल यह है कि यह संभवतः शून्य से भिन्न है.

यही कारण है कि नमूना आकार और क्यूसी मूल्य एक दूसरे को क्षतिपूर्ति करते हैं - बड़े नमूने बस अपने नमूना अनुमान के अनुसार एक छोटे क्यूसी को स्थानीयकृत करने में अधिक सटीकता प्राप्त करना संभव बनाते हैं।

यह स्पष्ट है कि महत्व की अवधारणा सीसी मूल्यों के संबंध में "बड़ी/छोटी" श्रेणियों को समझने के प्रारंभिक प्रश्न का उत्तर नहीं देती है। महत्व मानदंड द्वारा दिया गया उत्तर हमें सहसंबंध के गुणों के बारे में कुछ नहीं बताता है, लेकिन केवल हमें यह सत्यापित करने की अनुमति देता है कि उच्च संभावना के साथ असमानता संतुष्ट है आर > 0. साथ ही, CC मान में सहसंबंध कनेक्शन के गुणों के बारे में बहुत अधिक महत्वपूर्ण जानकारी होती है। दरअसल, समान रूप से महत्वपूर्ण सीसी के बराबर 0.1 और 0.9 , संबंधित सहसंबंध कनेक्शन की अभिव्यक्ति की डिग्री और सीसी के महत्व के बारे में कथन में काफी भिन्नता है आर = 0.06अभ्यास के लिए यह बिल्कुल बेकार है, क्योंकि किसी भी नमूना आकार के साथ यहां किसी सहसंबंध के बारे में बात करने की कोई आवश्यकता नहीं है।

अंत में, हम कह सकते हैं कि व्यवहार में, सहसंबंध संबंध का कोई भी गुण और यहां तक ​​कि उसका अस्तित्व भी सहसंबंध गुणांक के महत्व से मेल नहीं खाता है। व्यावहारिक दृष्टिकोण से, क्यूसी के महत्व का परीक्षण करते समय उपयोग की जाने वाली वैकल्पिक परिकल्पना का विकल्प ही त्रुटिपूर्ण है, क्योंकि मामले आर=0और आर>0छोटे स्तर पर आरव्यावहारिक दृष्टिकोण से वे अप्रभेद्य हैं।

दरअसल, कब से क्यूसी का महत्वअस्तित्व का अनुमान लगाएं महत्वपूर्ण सहसंबंध, शब्द "महत्व" की अर्थ संबंधी अस्पष्टता के आधार पर अवधारणाओं का पूरी तरह से बेशर्म प्रतिस्थापन करें। क्यूसी (एक स्पष्ट रूप से परिभाषित अवधारणा) का महत्व भ्रामक रूप से "महत्वपूर्ण सहसंबंध" में बदल दिया गया है, और यह वाक्यांश, जिसकी कोई सख्त परिभाषा नहीं है, को "उच्चारण सहसंबंध" के पर्याय के रूप में व्याख्या किया गया है।

विचरण विभाजन

आइए "छोटे" और "बड़े" सीसी मूल्यों के बारे में प्रश्न के एक और उत्तर पर विचार करें। यह उत्तर विकल्प क्यूसी के प्रतिगमन अर्थ को स्पष्ट करने से जुड़ा है और अभ्यास के लिए बहुत उपयोगी साबित होता है, हालांकि यह क्यूसी के महत्व के मानदंडों की तुलना में बहुत कम आशावादी है।

यह दिलचस्प है कि सीसी के प्रतिगमन अर्थ की चर्चा में अक्सर उपदेशात्मक (या बल्कि मनोवैज्ञानिक) प्रकृति की कठिनाइयों का सामना करना पड़ता है। आइए हम उन पर संक्षेप में टिप्पणी करें। सीसी के औपचारिक परिचय और "मजबूत" और "कमजोर" सहसंबंधों के अर्थ की व्याख्या के बाद, सहसंबंध और कारण-और-प्रभाव संबंधों के बीच संबंधों के दार्शनिक मुद्दों की चर्चा में उतरना आवश्यक माना जाता है। साथ ही, सहसंबंध संबंध को कारण-और-प्रभाव के रूप में व्याख्या करने के (काल्पनिक!) प्रयास को अस्वीकार करने के जोरदार प्रयास किए जा रहे हैं। इस पृष्ठभूमि में उपलब्धता के मुद्दे पर चर्चा कार्यात्मक निर्भरतासहसंबद्ध मात्राओं के बीच (प्रतिगमन सहित) निन्दापूर्ण प्रतीत होने लगता है। आख़िरकार, कार्यात्मक निर्भरता से कारण-और-प्रभाव संबंध तक केवल एक कदम है! परिणामस्वरूप, CC के प्रतिगमन अर्थ के प्रश्न को आम तौर पर टाल दिया जाता है, साथ ही रैखिक प्रतिगमन के सहसंबंध गुणों के प्रश्न को भी टाल दिया जाता है।

दरअसल, यहां सब कुछ सरल है। यदि सामान्यीकृत (अर्थात, शून्य अपेक्षा और इकाई विचरण वाले) यादृच्छिक चर के लिए एक्सऔर वाईएक रिश्ता है

वाई = ए + बीएक्स + एन,

कहाँ एन- शून्य अपेक्षा (एडिटिव शोर) के साथ कुछ यादृच्छिक चर, तो इसे सत्यापित करना आसान है ए = 0और बी = आर. यह यादृच्छिक चरों के बीच का संबंध है एक्सऔर वाईरेखीय समाश्रयण समीकरण कहा जाता है।

एक यादृच्छिक चर के विचरण की गणना वाईनिम्नलिखित अभिव्यक्ति प्राप्त करना आसान है:

डी[वाई] = बी 2 डी[एक्स] + डी[एन]।

अंतिम अभिव्यक्ति में, पहला पद यादृच्छिक चर के योगदान को निर्धारित करता है एक्सविचरण में वाई, और दूसरा पद शोर योगदान है एनविचरण में वाई. पैरामीटर के लिए उपरोक्त अभिव्यक्ति का उपयोग करना बी, यादृच्छिक चर के योगदान को व्यक्त करना आसान है एक्सऔर एनपरिमाण के माध्यम से आर =आर(याद रखें कि हम मात्राएँ गिन रहे हैं एक्सऔर वाईसामान्यीकृत, यानी डी[एक्स] = डी[वाई] = 1):

बी 2 डी[एक्स] = आर 2

डी[एन] = 1 - आर 2

प्राप्त सूत्रों को ध्यान में रखते हुए, यह अक्सर कहा जाता है कि यादृच्छिक चर के लिए एक्सऔर वाईसंबंधित प्रतिगमन समीकरण, परिमाण र 2एक यादृच्छिक चर के विचरण का अनुपात निर्धारित करता है वाई, यादृच्छिक चर में परिवर्तन द्वारा रैखिक रूप से निर्धारित किया जाता है एक्स. तो, यादृच्छिक चर का कुल विचरण वाईबिखर कर बिखर जाता है, रैखिक रूप से वातानुकूलितएक प्रतिगमन कनेक्शन की उपस्थिति और अवशिष्ट विचरण, योगात्मक शोर की उपस्थिति के कारण होता है।


द्वि-आयामी यादृच्छिक चर के स्कैटरप्लॉट पर विचार करें (एक्स, वाई). छोटे पर डी[एन]स्कैटरप्लॉट में गिरावट आती है रैखिक निर्भरतायादृच्छिक चर के बीच, योगात्मक शोर से थोड़ा विकृत (यानी स्कैटरप्लॉट पर बिंदु ज्यादातर सीधी रेखा के पास केंद्रित होंगे) एक्स=वाई). यह मामला मानों के लिए होता है आर, मापांक में एकता के करीब। सीसी मूल्य में कमी (पूर्ण मूल्य में) के साथ, शोर घटक का फैलाव एनमात्रा के फैलाव में उत्तरोत्तर अधिक योगदान देना शुरू कर देता है वाईऔर छोटे पर आरस्कैटरप्लॉट पूरी तरह से एक सीधी रेखा से अपनी समानता खो देता है। इस मामले में, हमारे पास बिंदुओं का एक बादल है जिसका प्रकीर्णन मुख्य रूप से शोर के कारण होता है। यह वह मामला है जिसे सीसी के महत्वपूर्ण, लेकिन निरपेक्ष मूल्य में छोटे मूल्यों पर महसूस किया जाता है। साफ है कि इस मामले में किसी सहसंबंध के बारे में बात करने की जरूरत नहीं है.

आइए अब देखें कि केके के "बड़े" और "छोटे" मूल्यों के बारे में प्रश्न का उत्तर केके की प्रतिगमन व्याख्या हमें क्या प्रदान करती है। सबसे पहले, इस बात पर जोर देना आवश्यक है कि फैलाव एक यादृच्छिक चर के मूल्यों के फैलाव का सबसे प्राकृतिक उपाय है। इस "स्वाभाविकता" की प्रकृति में स्वतंत्र यादृच्छिक चर के लिए विचरण की संवेदनशीलता शामिल है, लेकिन इस संपत्ति में बहुत विविध अभिव्यक्तियाँ हैं, जिसमें ऊपर दिखाए गए विचरण को रैखिक रूप से वातानुकूलित और अवशिष्ट विचरण में विभाजित करना शामिल है।

तो मूल्य र 2मात्रा के विचरण का अनुपात निर्धारित करता है वाई, एक यादृच्छिक चर के साथ प्रतिगमन संबंध की उपस्थिति से रैखिक रूप से निर्धारित होता है एक्स. यह प्रश्न कि रैखिक रूप से निर्धारित विचरण के किस अनुपात को एक स्पष्ट सहसंबंध की उपस्थिति का संकेत माना जा सकता है, शोधकर्ता के विवेक पर बना हुआ है। हालाँकि, यह स्पष्ट हो जाता है कि सहसंबंध गुणांक के छोटे मान ( आर< 0.3 ) रैखिक रूप से समझाए गए विचरण का इतना छोटा अनुपात प्रदान करें कि किसी भी स्पष्ट सहसंबंध के बारे में बात करने का कोई मतलब नहीं है। पर आर > 0.5हम मात्राओं और कब के बीच ध्यान देने योग्य सहसंबंध की उपस्थिति के बारे में बात कर सकते हैं आर > 0.7सहसंबंध को महत्वपूर्ण माना जा सकता है।


परिचय। 2

1. छात्र के एफ-परीक्षण का उपयोग करके प्रतिगमन और सहसंबंध गुणांक के महत्व का आकलन करना। 3

2. छात्र के एफ-टेस्ट का उपयोग करके प्रतिगमन और सहसंबंध गुणांक के महत्व की गणना। 6

निष्कर्ष। 15

प्रतिगमन समीकरण के निर्माण के बाद, इसके महत्व की जांच करना आवश्यक है: विशेष मानदंडों का उपयोग करके, यह निर्धारित करें कि परिणामी निर्भरता है या नहीं समीकरण द्वारा व्यक्त किया गयाप्रतिगमन, यादृच्छिक, यानी क्या इसका उपयोग पूर्वानुमान उद्देश्यों और कारक विश्लेषण के लिए किया जा सकता है? सांख्यिकी में, प्रतिगमन गुणांक के महत्व का कड़ाई से परीक्षण करने के लिए तरीके विकसित किए गए हैं भिन्नता का विश्लेषणऔर विशेष मानदंड की गणना (उदाहरण के लिए, एफ-मानदंड)। औसत सापेक्ष रैखिक विचलन (ई) की गणना करके एक ढीला परीक्षण किया जा सकता है, जिसे सन्निकटन की औसत त्रुटि कहा जाता है:

आइए अब हम प्रतिगमन गुणांक bj के महत्व का आकलन करने और प्रतिगमन मॉडल Ru (J=l,2,..., p) के मापदंडों के लिए एक विश्वास अंतराल का निर्माण करने के लिए आगे बढ़ें।

ब्लॉक 5 - छात्र के ^-परीक्षण के मूल्य के आधार पर प्रतिगमन गुणांक के महत्व का आकलन। टा के परिकलित मानों की तुलना अनुमेय मान से की जाती है

ब्लॉक 5 - ^-मानदंड के मूल्य के आधार पर प्रतिगमन गुणांक के महत्व का आकलन। T0n के परिकलित मानों की तुलना अनुमेय मान 4,/ से की जाती है, जो किसी दी गई त्रुटि संभावना (ए) और स्वतंत्रता की डिग्री की संख्या (/) के लिए टी-वितरण तालिकाओं से निर्धारित होता है।

संपूर्ण मॉडल के महत्व की जांच करने के अलावा, छात्र/-परीक्षण का उपयोग करके प्रतिगमन गुणांक के महत्व का परीक्षण करना आवश्यक है। प्रतिगमन गुणांक bg का न्यूनतम मान bifob- ^t स्थिति के अनुरूप होना चाहिए, जहां bi प्राकृतिक पैमाने पर प्रतिगमन समीकरण के गुणांक का मान है आई-सी फैक्टरसंकेत; आह. - प्रत्येक गुणांक का माध्य वर्ग त्रुटि। उनके महत्व में गुणांक डी की अतुलनीयता;

आगे सांख्यिकीय विश्लेषण प्रतिगमन गुणांक के महत्व का परीक्षण करने से संबंधित है। ऐसा करने के लिए, हम प्रतिगमन गुणांक के लिए ^-मानदंड का मान ज्ञात करते हैं। उनकी तुलना के परिणामस्वरूप, सबसे छोटा ^-मानदंड निर्धारित किया जाता है। वह कारक जिसका गुणांक सबसे छोटे ^-मानदंड से मेल खाता है, उसे आगे के विश्लेषण से बाहर रखा गया है।

प्रतिगमन और सहसंबंध गुणांक के सांख्यिकीय महत्व का आकलन करने के लिए, छात्र का टी-टेस्ट और विश्वास अंतरालप्रत्येक सूचक. संकेतकों की यादृच्छिक प्रकृति के बारे में एक परिकल्पना सामने रखी गई है, अर्थात। शून्य से उनके नगण्य अंतर के बारे में। छात्र के एफ-परीक्षण का उपयोग करके प्रतिगमन और सहसंबंध गुणांक के महत्व का आकलन यादृच्छिक त्रुटि के परिमाण के साथ उनके मूल्यों की तुलना करके किया जाता है:

छात्र/-परीक्षण का उपयोग करके शुद्ध प्रतिगमन गुणांक के महत्व का आकलन करने से मूल्य की गणना होती है

श्रम की गुणवत्ता विशिष्ट श्रम की एक विशेषता है, जो आर्थिक विकास के लिए इसकी जटिलता, तीव्रता (तीव्रता), स्थितियों और महत्व की डिग्री को दर्शाती है। के.टी. एक टैरिफ प्रणाली के माध्यम से मापा जाता है जो योग्यता के स्तर (काम की जटिलता), परिस्थितियों, श्रम की गंभीरता और इसकी तीव्रता के साथ-साथ विकास के लिए व्यक्तिगत उद्योगों और उत्पादन, क्षेत्रों, क्षेत्रों के महत्व के आधार पर मजदूरी को अलग करने की अनुमति देता है। देश की अर्थव्यवस्था. के.टी. में अभिव्यक्ति पाता है वेतनश्रमिक, आपूर्ति और मांग के प्रभाव में श्रम बाजार में विकास कर रहे हैं कार्यबल(विशिष्ट प्रकार के श्रम)। के.टी. - संरचना में जटिल

परियोजना के व्यक्तिगत आर्थिक, सामाजिक और पर्यावरणीय परिणामों के सापेक्ष महत्व के प्राप्त अंक, एक परियोजना के "सामाजिक और पर्यावरणीय-आर्थिक दक्षता के जटिल स्कोरिंग आयामहीन मानदंड" का उपयोग करके वैकल्पिक परियोजनाओं और उनके विकल्पों की तुलना करने के लिए एक आधार प्रदान करते हैं, गणना की गई (औसत महत्व स्कोर में) सूत्र का उपयोग कर

इंट्रा-उद्योग विनियमन किसी दिए गए उद्योग में श्रमिकों के लिए मजदूरी में अंतर सुनिश्चित करता है, जो किसी दिए गए उद्योग में व्यक्तिगत प्रकार के उत्पादन के महत्व, जटिलता और कामकाजी परिस्थितियों के साथ-साथ उपयोग किए गए पारिश्रमिक के रूपों पर निर्भर करता है।

व्यक्तिगत संकेतकों के महत्व को ध्यान में रखे बिना मानक उद्यम के संबंध में विश्लेषण किए गए उद्यम का परिणामी रेटिंग मूल्यांकन तुलनात्मक है। कई उद्यमों की रेटिंग की तुलना करते समय उच्चतम रेटिंगप्राप्त तुलनात्मक मूल्यांकन के न्यूनतम मूल्य वाला एक उद्यम है।

किसी उत्पाद की गुणवत्ता को उसकी उपयोगिता के माप के रूप में समझना व्यावहारिक रूप से मायने रखता है महत्वपूर्ण सवालइसके माप के बारे में. इसका समाधान किसी विशिष्ट आवश्यकता की पूर्ति में व्यक्तिगत गुणों के महत्व का अध्ययन करके प्राप्त किया जाता है। उत्पाद की खपत की स्थितियों के आधार पर एक ही संपत्ति का महत्व भी भिन्न हो सकता है। नतीजतन, उत्पाद की उपयोगिता अलग-अलग परिस्थितियाँइसके उपयोग अलग-अलग हैं.

कार्य का दूसरा चरण सांख्यिकीय आंकड़ों का अध्ययन करना और संकेतकों के संबंध और अंतःक्रिया की पहचान करना, व्यक्तिगत कारकों के महत्व और सामान्य संकेतकों में परिवर्तन के कारणों का निर्धारण करना है।

सभी विचारित संकेतकों को एक में इस तरह से संयोजित किया जाता है कि परिणाम उद्यम की गतिविधियों के सभी विश्लेषण किए गए पहलुओं का एक व्यापक मूल्यांकन होता है, इसकी गतिविधि की स्थितियों को ध्यान में रखते हुए, व्यक्तिगत संकेतकों के महत्व की डिग्री को ध्यान में रखते हुए विभिन्न प्रकार केनिवेशक:

प्रतिगमन गुणांक प्रदर्शन संकेतक पर कारकों के प्रभाव की तीव्रता को दर्शाते हैं। यदि कारक संकेतकों का प्रारंभिक मानकीकरण किया जाता है, तो b0 कुल में प्रभावी संकेतक के औसत मूल्य के बराबर है। गुणांक बी, बी2 ..... बीएल दिखाते हैं कि प्रभावी संकेतक का स्तर अपने औसत मूल्य से कितनी इकाइयों से विचलित होता है यदि कारक संकेतक का मान शून्य के बराबर औसत से एक के बराबर विचलन होता है मानक विचलन. इस प्रकार, प्रतिगमन गुणांक प्रदर्शन संकेतक के स्तर को बढ़ाने के लिए व्यक्तिगत कारकों के महत्व की डिग्री को दर्शाते हैं। प्रतिगमन गुणांक के विशिष्ट मान विधि के अनुसार अनुभवजन्य डेटा से निर्धारित किए जाते हैं कम से कम वर्गों(सामान्य समीकरणों की प्रणालियों को हल करने के परिणामस्वरूप)।

2. छात्र के एफ-टेस्ट का उपयोग करके प्रतिगमन और सहसंबंध गुणांक के महत्व की गणना

आइए बहुकारक संबंधों के रैखिक रूप को न केवल सबसे सरल मानें, बल्कि पीसी के लिए एप्लिकेशन सॉफ़्टवेयर पैकेजों द्वारा प्रदान किए गए रूप पर भी विचार करें। यदि किसी व्यक्तिगत कारक और परिणामी विशेषता के बीच संबंध रैखिक नहीं है, तो कारक विशेषता के मान को प्रतिस्थापित या परिवर्तित करके समीकरण को रैखिक बनाया जाता है।

सामान्य फ़ॉर्मबहुभिन्नरूपी प्रतिगमन समीकरण का रूप है:


जहाँ k कारक विशेषताओं की संख्या है।

समीकरण (8.32) के मापदंडों की गणना के लिए आवश्यक न्यूनतम वर्ग समीकरणों की प्रणाली को सरल बनाने के लिए, इन विशेषताओं के औसत मूल्यों से सभी विशेषताओं के व्यक्तिगत मूल्यों के विचलन को आमतौर पर पेश किया जाता है।

हमें न्यूनतम वर्गों के k समीकरणों की एक प्रणाली प्राप्त होती है:

इस प्रणाली को हल करते हुए, हम सशर्त रूप से शुद्ध प्रतिगमन गुणांक बी के मान प्राप्त करते हैं। समीकरण के मुक्त पद की गणना सूत्र द्वारा की जाती है


शब्द "सशर्त रूप से शुद्ध प्रतिगमन गुणांक" का अर्थ है कि प्रत्येक मान bj उसके औसत मूल्य से परिणामी विशेषता के कुल औसत विचलन को मापता है जब कोई दिया गया कारक xj उसके माप की एक इकाई द्वारा उसके औसत मूल्य से विचलन करता है और बशर्ते कि सभी प्रतिगमन समीकरण में शामिल अन्य कारक, औसत मूल्यों पर तय होते हैं, बदलते नहीं हैं, भिन्न नहीं होते हैं।

इस प्रकार, युग्मित प्रतिगमन गुणांक के विपरीत, सशर्त शुद्ध प्रतिगमन गुणांक अन्य कारकों की भिन्नता के साथ इस कारक की भिन्नता के संबंध से अलग होकर, एक कारक के प्रभाव को मापता है। यदि प्रतिगमन समीकरण में परिणामी विशेषता की भिन्नता को प्रभावित करने वाले सभी कारकों को शामिल करना संभव होता, तो बीजे के मान। कारकों के शुद्ध प्रभाव का माप माना जा सकता है। लेकिन चूंकि समीकरण में सभी कारकों को शामिल करना वास्तव में असंभव है, तो गुणांक बी.जे. समीकरण में शामिल नहीं किए गए कारकों के प्रभाव के मिश्रण से मुक्त नहीं।

प्रतिगमन समीकरण में सभी कारकों को तीन कारणों में से किसी एक या सभी को एक साथ शामिल करना असंभव है, क्योंकि:

1) कुछ कारक अज्ञात हो सकते हैं आधुनिक विज्ञान, किसी भी प्रक्रिया का ज्ञान हमेशा अधूरा होता है;

2) कुछ ज्ञात सैद्धांतिक कारकों के बारे में कोई जानकारी नहीं है या यह अविश्वसनीय है;

3) अध्ययन की जा रही जनसंख्या का आकार (नमूना) सीमित है, जिससे प्रतिगमन समीकरण में सीमित संख्या में कारकों को शामिल करना संभव हो जाता है।

सशर्त शुद्ध प्रतिगमन गुणांक बी.जे. माप की विभिन्न इकाइयों में व्यक्त नामित संख्याएँ हैं और इसलिए एक दूसरे के साथ अतुलनीय हैं। उन्हें तुलनीय सापेक्ष संकेतकों में परिवर्तित करने के लिए, जोड़ीवार सहसंबंध गुणांक प्राप्त करने के लिए उसी परिवर्तन का उपयोग किया जाता है। परिणामी मान को कहा जाता है मानकीकृत गुणांकप्रतिगमन या?-गुणांक.


कारक xj का गुणांक परिणामी विशेषता y की भिन्नता पर कारक xj की भिन्नता के प्रभाव का माप निर्धारित करता है, जो प्रतिगमन समीकरण में शामिल अन्य कारकों की सहवर्ती भिन्नता से अलग होता है।

सशर्त रूप से शुद्ध प्रतिगमन के गुणांक को कनेक्शन के सापेक्ष तुलनीय संकेतक, लोच गुणांक के रूप में व्यक्त करना उपयोगी है:

कारक xj का लोच गुणांक कहता है कि जब किसी दिए गए कारक का मान उसके औसत मान से 1% विचलित हो जाता है और समीकरण में शामिल अन्य कारकों के सहवर्ती विचलन से अलग हो जाता है, तो परिणामी विशेषता उसके औसत मान से ej प्रतिशत तक विचलित हो जाएगी वाई से अधिक बार, लोच गुणांक की व्याख्या और गतिशीलता के संदर्भ में की जाती है: कारक x में इसके औसत मूल्य के 1% की वृद्धि के साथ, परिणामी विशेषता ई से बढ़ जाएगी। इसके औसत मूल्य का प्रतिशत।

आइए एक उदाहरण के रूप में उन्हीं 16 फ़ार्मों का उपयोग करके बहुकारक प्रतिगमन समीकरण की गणना और व्याख्या पर विचार करें (तालिका 8.1)। परिणामी चिन्ह - स्तर सकल आयऔर इसे प्रभावित करने वाले तीन कारक तालिका में प्रस्तुत किए गए हैं। 8.7.

आइए हम एक बार फिर याद करें कि सहसंबंध के विश्वसनीय और पर्याप्त सटीक संकेतक प्राप्त करने के लिए एक बड़ी आबादी की आवश्यकता होती है।


तालिका 8.7

सकल आय का स्तर और उसके कारक

फार्म नंबर

सकल आय, रु./रा

श्रम लागत, मानव दिवस/हेक्टेयर x1

कृषि योग्य भूमि का हिस्सा,

प्रति 1 गाय दूध की उपज,


तालिका 8.8 प्रतिगमन समीकरण संकेतक


आश्रित चर: y

प्रतिगमन गुणांक

स्थिरांक-240.112905

एसटीडी. अनुमान की त्रुटि = 79.243276


समाधान पीसी के लिए "माइक्रोस्टेट" प्रोग्राम का उपयोग करके किया गया था। यहां प्रिंटआउट से तालिकाएं हैं: तालिका। 8.7 सभी विशेषताओं के औसत मान और मानक विचलन देता है। मेज़ 8.8 में प्रतिगमन गुणांक और उनका संभाव्य मूल्यांकन शामिल है:

पहला कॉलम "var" - चर, यानी कारक; दूसरा कॉलम "प्रतिगमन गुणांक" - सशर्त रूप से शुद्ध प्रतिगमन गुणांक बी.जे.; तीसरा कॉलम “एसटीडी. त्रुटि" - प्रतिगमन गुणांक अनुमान में औसत त्रुटियां; चौथा स्तंभ - भिन्नता की स्वतंत्रता के 12 डिग्री के साथ छात्र के टी-टेस्ट के मूल्य; पाँचवाँ स्तंभ "संभावना" - प्रतिगमन गुणांक के सापेक्ष शून्य परिकल्पना की संभावना;

छठा स्तंभ "आंशिक आर2" - निर्धारण के आंशिक गुणांक। कॉलम 3-6 में संकेतकों की गणना के लिए सामग्री और पद्धति पर आगे अध्याय 8 में चर्चा की गई है। "स्थिर" प्रतिगमन समीकरण का मुक्त शब्द है; "एसटीडी. अनुमान की त्रुटि।" - प्रतिगमन समीकरण का उपयोग करके प्रभावी विशेषता का अनुमान लगाने की माध्य वर्ग त्रुटि। समीकरण प्राप्त हुआ एकाधिक प्रतिगमन:


y = 2.26x1 - 4.31x2 + 0.166x3 - 240।


इसका मतलब है कि प्रति व्यक्ति सकल आय की मात्रा हेक्टेयर कृषि भूमि में औसतन 2.26 रूबल की वृद्धि हुई। श्रम लागत में 1 घंटा/हेक्टेयर की वृद्धि के साथ; औसतन 4.31 रूबल की कमी हुई। कृषि भूमि में कृषि योग्य भूमि की हिस्सेदारी में 1% की वृद्धि और 0.166 रूबल की वृद्धि के साथ। प्रति गाय दूध की पैदावार में 1 की वृद्धि के साथ किलोग्राम। मुक्त अवधि का नकारात्मक मूल्य काफी स्वाभाविक है, और, जैसा कि पैराग्राफ 8.2 में पहले ही उल्लेख किया गया है, प्रभावी संकेत यह है कि कारकों के शून्य मूल्यों तक पहुंचने से बहुत पहले सकल आय शून्य हो जाती है, जो उत्पादन में असंभव है।

x^ के लिए गुणांक का नकारात्मक मान अध्ययन के तहत खेतों की अर्थव्यवस्था में महत्वपूर्ण परेशानी का संकेत है, जहां फसल खेती लाभहीन है, और केवल पशुधन खेती लाभदायक है। खेती के तर्कसंगत तरीकों और सभी क्षेत्रों के उत्पादों के लिए सामान्य कीमतों (संतुलन या उनके करीब) के साथ, आय में कमी नहीं होनी चाहिए, बल्कि कृषि भूमि - कृषि योग्य भूमि के सबसे उपजाऊ हिस्से में वृद्धि के साथ वृद्धि होनी चाहिए।

तालिका की अंतिम दो पंक्तियों के डेटा के आधार पर। 8.7 और तालिका. 8.8 हम सूत्रों (8.34) और (8.35) के अनुसार पी-गुणांक और लोच गुणांक की गणना करते हैं।

आय के स्तर में भिन्नता और गतिशीलता में इसके संभावित परिवर्तन दोनों कारक x3 से सबसे अधिक प्रभावित होते हैं - गायों की उत्पादकता, और x2 द्वारा सबसे कमजोर - कृषि योग्य भूमि का हिस्सा। P2/ मानों का आगे भी उपयोग किया जाएगा (तालिका 8.9);


तालिका 8.9 आय स्तर पर कारकों का तुलनात्मक प्रभाव

कारक xj


तो, हमने पाया है कि कारक xj का ?-गुणांक इस कारक के लोच गुणांक से संबंधित है, क्योंकि कारक की भिन्नता का गुणांक परिणामी विशेषता की भिन्नता के गुणांक से संबंधित है। चूँकि, जैसा कि तालिका की अंतिम पंक्ति से देखा जा सकता है। 8.7, सभी कारकों की भिन्नता के गुणांक परिणामी विशेषता की भिन्नता के गुणांक से कम हैं; सभी?-गुणांक लोच गुणांक से कम हैं।

आइए एक उदाहरण के रूप में कारक -सी का उपयोग करके युग्मित और सशर्त रूप से शुद्ध प्रतिगमन गुणांक के बीच संबंध पर विचार करें। जोड़े रेखीय समीकरण x के साथ कनेक्शन y का रूप इस प्रकार है:


y = 3.886x1 – 243.2


X1 पर सशर्त रूप से शुद्ध प्रतिगमन गुणांक युग्मित का केवल 58% है। शेष 42% इस तथ्य के कारण है कि भिन्नता x1 के साथ कारक x2 x3 में भिन्नता होती है, जो बदले में परिणामी गुण को प्रभावित करती है। सभी विशेषताओं के कनेक्शन और उनके जोड़ीवार प्रतिगमन गुणांक कनेक्शन ग्राफ (चित्र 8.2) में प्रस्तुत किए गए हैं।

यदि हम y पर भिन्नता x1 के प्रत्यक्ष और अप्रत्यक्ष प्रभाव का अनुमान जोड़ते हैं, यानी सभी "पथों" (चित्र 8.2) के साथ युग्मित प्रतिगमन गुणांक का उत्पाद, तो हमें मिलता है: 2.26 + 12.55 0.166 + (-0.00128) (- 4.31) + (-0.00128) 17.00 0.166 = 4.344।

यह मान और भी अधिक है जोड़ी गुणांक Y के साथ कनेक्शन X1। नतीजतन, समीकरण में शामिल नहीं किए गए कारकों के माध्यम से भिन्नता x1 का अप्रत्यक्ष प्रभाव विपरीत है, कुल मिलाकर:


1 अयवाज़यान एस.ए., मख़ितारियन वी.एस. व्यावहारिक आँकड़े और अर्थमिति के बुनियादी सिद्धांत। विश्वविद्यालयों के लिए पाठ्यपुस्तक. - एम.: यूनिटी, 2008, - 311 पी।

2 जॉनसन जे. अर्थमितीय विधियाँ। - एम.: सांख्यिकी, 1980। - 282s.

3 डफ़र्टी के. अर्थमिति का परिचय। - एम.: इन्फ्रा-एम, 2004, - 354 पी।

4 ड्रेयर एन., स्मिथ जी., एप्लाइड रिग्रेशन विश्लेषण। - एम.: वित्त और सांख्यिकी, 2006, - 191 पी।

5 मैग्नस वाई.आर., कार्तीशेव पी.के., पेरेसेट्स्की ए.ए. अर्थमिति। प्रारंभिक पाठ्यक्रम.-एम.: डेलो, 2006, - 259 पी.

इकोनोमेट्रिक्स/एड पर 6 कार्यशाला। आई.आई. एलिसेवा। - एम.: वित्त और सांख्यिकी, 2004, - 248 पी।

7 अर्थमिति/एड. आई.आई. एलिसेवा। - एम.: वित्त और सांख्यिकी, 2004, - 541 पी।

8 क्रेमर एन., पुटको बी. इकोनोमेट्रिक्स। - एम.: यूनिटी-दाना, 200, - 281 पी।



ट्यूशन

किसी विषय का अध्ययन करने में सहायता चाहिए?

हमारे विशेषज्ञ आपकी रुचि वाले विषयों पर सलाह देंगे या ट्यूशन सेवाएँ प्रदान करेंगे।
अपने आवेदन जमा करेंपरामर्श प्राप्त करने की संभावना के बारे में जानने के लिए अभी विषय का संकेत दें।

पाठ्यक्रम कार्य

विषय: सहसंबंध विश्लेषण

परिचय

1. सहसंबंध विश्लेषण

1.1 सहसंबंध की अवधारणा

1.2 सामान्य वर्गीकरणसहसंबंध

1.3 सहसंबंध क्षेत्र और उनके निर्माण का उद्देश्य

1.4 चरण सहसंबंध विश्लेषण

1.5 सहसंबंध गुणांक

1.6 सामान्यीकृत ब्रवाइस-पियर्सन सहसंबंध गुणांक

1.7 गुणांक रैंक सहसंबंधभाला धारण करनेवाला सिपाही

1.8 सहसंबंध गुणांक के मूल गुण

1.9 सहसंबंध गुणांक के महत्व की जाँच करना

1.10 महत्वपूर्ण मूल्यजोड़ी सहसंबंध गुणांक

2. एक बहुक्रियात्मक प्रयोग की योजना बनाना

2.1 समस्या की स्थिति

2.2 योजना के केंद्र (मूल स्तर) और कारक भिन्नता के स्तर का निर्धारण

2.3 नियोजन मैट्रिक्स का निर्माण

2.4 विभिन्न श्रृंखलाओं में फैलाव की एकरूपता और माप की तुल्यता की जाँच करना

2.5 प्रतिगमन समीकरण गुणांक

2.6 प्रतिलिपि प्रस्तुत करने योग्यता विचरण

2.7 प्रतिगमन समीकरण गुणांकों के महत्व की जाँच करना

2.8 प्रतिगमन समीकरण की पर्याप्तता की जाँच करना

निष्कर्ष

ग्रन्थसूची

परिचय

प्रायोगिक योजना एक गणितीय और सांख्यिकीय अनुशासन है जो तर्कसंगत संगठन के तरीकों का अध्ययन करता है प्रायोगिक अनुसंधान- से इष्टतम विकल्पअध्ययन किए जा रहे कारकों और परिणामों के विश्लेषण के तरीकों के उद्देश्य के अनुसार वास्तविक प्रयोगात्मक योजना का निर्धारण करना। प्रायोगिक योजना की शुरुआत अंग्रेजी सांख्यिकीविद् आर. फिशर (1935) के कार्यों से हुई, जिन्होंने इस बात पर जोर दिया कि तर्कसंगत प्रयोगात्मक योजना माप परिणामों के इष्टतम प्रसंस्करण की तुलना में अनुमानों की सटीकता में कम महत्वपूर्ण लाभ प्रदान नहीं करती है। 20वीं सदी के 60 के दशक में था आधुनिक सिद्धांतप्रयोग की योजना बनाना. उनकी विधियाँ फ़ंक्शन सन्निकटन सिद्धांत और गणितीय प्रोग्रामिंग से निकटता से संबंधित हैं। इष्टतम योजनाओं का निर्माण किया गया और मॉडलों की एक विस्तृत श्रेणी के लिए उनकी संपत्तियों का अध्ययन किया गया।

प्रायोगिक योजना - एक प्रयोगात्मक योजना का चयन जो निर्दिष्ट आवश्यकताओं को पूरा करती है, एक प्रयोग रणनीति विकसित करने के उद्देश्य से कार्यों का एक सेट (प्राथमिक जानकारी प्राप्त करने से लेकर एक व्यावहारिक गणितीय मॉडल प्राप्त करने या निर्धारित करने तक) इष्टतम स्थितियाँ). यह एक प्रयोग का उद्देश्यपूर्ण नियंत्रण है, जिसे अध्ययन की जा रही घटना के तंत्र के अधूरे ज्ञान की शर्तों के तहत कार्यान्वित किया जाता है।

माप की प्रक्रिया में, बाद में डेटा प्रोसेसिंग के साथ-साथ गणितीय मॉडल के रूप में परिणामों की औपचारिकता, त्रुटियां उत्पन्न होती हैं और मूल डेटा में निहित कुछ जानकारी खो जाती है। प्रयोगात्मक नियोजन विधियों का उपयोग गणितीय मॉडल की त्रुटि निर्धारित करना और इसकी पर्याप्तता का न्याय करना संभव बनाता है। यदि मॉडल की सटीकता अपर्याप्त हो जाती है, तो प्रयोगात्मक योजना विधियों का उपयोग आधुनिकीकरण करना संभव बनाता है गणित का मॉडलपिछली जानकारी को खोए बिना और न्यूनतम लागत पर अतिरिक्त प्रयोगों के साथ।

किसी प्रयोग की योजना बनाने का उद्देश्य प्रयोगों के संचालन के लिए ऐसी स्थितियाँ और नियम खोजना है जिसके तहत कम से कम श्रम में किसी वस्तु के बारे में विश्वसनीय और भरोसेमंद जानकारी प्राप्त करना संभव हो, साथ ही इस जानकारी को एक संक्षिप्त और सुविधाजनक रूप में प्रस्तुत करना संभव हो। सटीकता के मात्रात्मक मूल्यांकन के साथ।

अध्ययन के विभिन्न चरणों में उपयोग की जाने वाली मुख्य नियोजन विधियाँ हैं:

एक स्क्रीनिंग प्रयोग की योजना बनाना, जिसका मुख्य अर्थ कारकों के पूरे सेट से महत्वपूर्ण कारकों के समूह का चयन करना है जो आगे विस्तृत अध्ययन के अधीन हैं;

एनोवा के लिए प्रायोगिक डिज़ाइन, अर्थात। गुणात्मक कारकों के साथ वस्तुओं के लिए योजनाएँ बनाना;

एक प्रतिगमन प्रयोग की योजना बनाना जो आपको प्राप्त करने की अनुमति देता है प्रतिगमन मॉडल(बहुपद और अन्य);

एक चरम प्रयोग की योजना बनाना जिसमें मुख्य कार्य अनुसंधान वस्तु का प्रयोगात्मक अनुकूलन है;

गतिशील प्रक्रियाओं आदि का अध्ययन करते समय योजना बनाना।

अनुशासन का अध्ययन करने का उद्देश्य नियोजन सिद्धांत और आधुनिक सूचना प्रौद्योगिकियों के तरीकों का उपयोग करके छात्रों को उनकी विशेषता में उत्पादन और तकनीकी गतिविधियों के लिए तैयार करना है।

अनुशासन के उद्देश्य: अध्ययन आधुनिक तरीकेवैज्ञानिक और औद्योगिक प्रयोगों की योजना बनाना, व्यवस्थित करना और उनका अनुकूलन करना, प्रयोगों का संचालन करना और प्राप्त परिणामों को संसाधित करना।

1. सहसंबंध विश्लेषण

1.1 सहसंबंध की अवधारणा

एक शोधकर्ता को अक्सर इस बात में दिलचस्पी होती है कि अध्ययन किए जा रहे एक या अधिक नमूनों में दो या दो से अधिक चर एक-दूसरे से कैसे संबंधित हैं। उदाहरण के लिए, क्या ऊंचाई किसी व्यक्ति के वजन को प्रभावित कर सकती है, या रक्तचाप उत्पाद की गुणवत्ता को प्रभावित कर सकता है?

चरों के बीच इस प्रकार की निर्भरता को सहसंबंध, या सहसंबंध कहा जाता है। सहसंबंध दो विशेषताओं में लगातार परिवर्तन है, जो इस तथ्य को दर्शाता है कि एक विशेषता की परिवर्तनशीलता दूसरे की परिवर्तनशीलता के अनुरूप है।

उदाहरण के लिए, यह ज्ञात है कि औसतन लोगों की ऊंचाई और उनके वजन के बीच अंतर होता है। सकारात्मक संबंध, और ऐसा कि जितनी अधिक ऊंचाई, उतना अधिक व्यक्ति का वजन। हालाँकि, अपेक्षाकृत होने पर इस नियम के अपवाद भी हैं छोटे लोगपास होना अधिक वजन, और, इसके विपरीत, उच्च वृद्धि वाले एस्थेनिक्स का वजन कम होता है। ऐसे अपवादों का कारण यह है कि प्रत्येक जैविक, शारीरिक या मनोवैज्ञानिक संकेतकई कारकों के प्रभाव से निर्धारित होता है: पर्यावरणीय, आनुवंशिक, सामाजिक, पर्यावरणीय, आदि।

सहसंबंध कनेक्शन संभाव्य परिवर्तन हैं जिनका अध्ययन केवल गणितीय आंकड़ों के तरीकों का उपयोग करके प्रतिनिधि नमूनों पर किया जा सकता है। दोनों शब्द - सहसंबंध लिंक और सहसंबंध निर्भरता - अक्सर एक दूसरे के स्थान पर उपयोग किए जाते हैं। निर्भरता का तात्पर्य प्रभाव, संबंध - कोई भी समन्वित परिवर्तन है जिसे सैकड़ों कारणों से समझाया जा सकता है। सहसंबंध कनेक्शन को कारण-और-प्रभाव संबंध के प्रमाण के रूप में नहीं माना जा सकता है; वे केवल यह संकेत देते हैं कि एक विशेषता में परिवर्तन आमतौर पर दूसरे में कुछ परिवर्तनों के साथ होते हैं।

सहसंबंध निर्भरता - ये वे परिवर्तन हैं जो एक विशेषता के मूल्यों को घटित होने की संभावना में पेश करते हैं विभिन्न अर्थएक और संकेत.

सहसंबंध विश्लेषण का कार्य अलग-अलग विशेषताओं के बीच संबंध की दिशा (सकारात्मक या नकारात्मक) और रूप (रैखिक, गैर-रैखिक) स्थापित करना, इसकी निकटता को मापना और अंत में, प्राप्त सहसंबंध गुणांक के महत्व के स्तर की जांच करना है।

सहसंबंध कनेक्शन रूप, दिशा और डिग्री (शक्ति) में भिन्न होते हैं .

सहसंबंध संबंध का रूप रैखिक या वक्ररेखीय हो सकता है। उदाहरण के लिए, सिम्युलेटर पर प्रशिक्षण सत्रों की संख्या और नियंत्रण सत्र में सही ढंग से हल की गई समस्याओं की संख्या के बीच संबंध सीधा हो सकता है। उदाहरण के लिए, प्रेरणा के स्तर और किसी कार्य की प्रभावशीलता के बीच संबंध वक्ररेखीय हो सकता है (चित्र 1)। जैसे-जैसे प्रेरणा बढ़ती है, पहले किसी कार्य को पूरा करने की प्रभावशीलता बढ़ती है, फिर प्रेरणा का इष्टतम स्तर प्राप्त होता है, जो कार्य को पूरा करने की अधिकतम प्रभावशीलता से मेल खाता है; प्रेरणा में और वृद्धि के साथ-साथ दक्षता में कमी आती है।

चित्र 1 - समस्या समाधान की प्रभावशीलता और प्रेरक प्रवृत्तियों की ताकत के बीच संबंध

दिशा में, सहसंबंध संबंध सकारात्मक ("प्रत्यक्ष") और नकारात्मक ("उलटा") हो सकता है। एक सकारात्मक रैखिक सहसंबंध के साथ, एक विशेषता के उच्च मान दूसरे के उच्च मूल्यों के अनुरूप होते हैं, और एक विशेषता के निम्न मान के अनुरूप होते हैं कम मूल्यदूसरा (चित्र 2)। नकारात्मक सहसंबंध के साथ, संबंध व्युत्क्रम होते हैं (चित्र 3)। एक सकारात्मक सहसंबंध के साथ, सहसंबंध गुणांक है सकारात्मक संकेत, एक नकारात्मक सहसंबंध के साथ - एक नकारात्मक संकेत।

चित्र 2 - सीधा सहसंबंध

चित्र 3 - व्युत्क्रम सहसंबंध


चित्र 4 - कोई सहसंबंध नहीं

सहसंबंध की डिग्री, शक्ति या निकटता सहसंबंध गुणांक के मूल्य से निर्धारित होती है। कनेक्शन की मजबूती उसकी दिशा पर निर्भर नहीं करती और इससे निर्धारित होती है निरपेक्ष मूल्यसहसंबंध गुणांक।

1.2 सहसंबंधों का सामान्य वर्गीकरण

सहसंबंध गुणांक के आधार पर, निम्नलिखित सहसंबंध प्रतिष्ठित हैं:

मजबूत, या सहसंबंध गुणांक r>0.70 के साथ बंद;

औसत (0.50 पर)

मध्यम (0.30 बजे)

कमजोर (0.20 पर)

बहुत कमजोर (आर पर)<0,19).

1.3 सहसंबंध क्षेत्र और उनके निर्माण का उद्देश्य

सहसंबंध का अध्ययन प्रयोगात्मक डेटा के आधार पर किया जाता है, जो दो विशेषताओं के मापा मान (x i, y i) हैं। यदि थोड़ा प्रयोगात्मक डेटा है, तो द्वि-आयामी अनुभवजन्य वितरण को x i और y i मानों की दोहरी श्रृंखला के रूप में दर्शाया जाता है। साथ ही, विशेषताओं के बीच सहसंबंध निर्भरता को विभिन्न तरीकों से वर्णित किया जा सकता है। किसी तर्क और फ़ंक्शन के बीच पत्राचार एक तालिका, सूत्र, ग्राफ़ आदि द्वारा दिया जा सकता है।

सहसंबंध विश्लेषण, अन्य सांख्यिकीय तरीकों की तरह, संभाव्य मॉडल के उपयोग पर आधारित है जो एक निश्चित सामान्य आबादी में अध्ययन के तहत विशेषताओं के व्यवहार का वर्णन करता है जिससे प्रयोगात्मक मान xi और y i प्राप्त होते हैं। मात्रात्मक विशेषताओं के बीच सहसंबंध का अध्ययन करते समय, जिसके मूल्यों को मीट्रिक पैमाने (मीटर, सेकंड, किलोग्राम, आदि) की इकाइयों में सटीक रूप से मापा जा सकता है, एक द्वि-आयामी सामान्य रूप से वितरित जनसंख्या मॉडल अक्सर अपनाया जाता है। ऐसा मॉडल आयताकार निर्देशांक की प्रणाली में बिंदुओं के ज्यामितीय स्थान के रूप में चर x i और y i के बीच संबंध को ग्राफिक रूप से प्रदर्शित करता है। इस आलेखीय संबंध को स्कैटरप्लॉट या सहसंबंध क्षेत्र भी कहा जाता है।
द्वि-आयामी सामान्य वितरण (सहसंबंध क्षेत्र) का यह मॉडल हमें सहसंबंध गुणांक की स्पष्ट चित्रमय व्याख्या देने की अनुमति देता है, क्योंकि कुल मिलाकर वितरण पाँच मापदंडों पर निर्भर करता है: μ x, μ y - औसत मान (गणितीय अपेक्षाएँ); σ x ,σ y - यादृच्छिक चर X और Y के मानक विचलन और p - सहसंबंध गुणांक, जो यादृच्छिक चर X और Y के बीच संबंध का एक माप है।
यदि p = 0, तो द्वि-आयामी सामान्य जनसंख्या से प्राप्त मान x i , y i वृत्त द्वारा सीमित क्षेत्र के भीतर निर्देशांक x, y में ग्राफ़ पर स्थित होते हैं (चित्र 5, a)। इस मामले में, यादृच्छिक चर X और Y के बीच कोई सहसंबंध नहीं है और उन्हें असंबद्ध कहा जाता है। द्वि-आयामी सामान्य वितरण के लिए, असंबद्धता का अर्थ एक साथ यादृच्छिक चर X और Y की स्वतंत्रता है।



साइट पर नया

>

सबसे लोकप्रिय