घर मुंह सहसंबंध गुणांक के महत्व की जांच कैसे करें। परीक्षण: छात्र के एफ-परीक्षण का उपयोग करके प्रतिगमन और सहसंबंध गुणांक के महत्व का आकलन करना

सहसंबंध गुणांक के महत्व की जांच कैसे करें। परीक्षण: छात्र के एफ-परीक्षण का उपयोग करके प्रतिगमन और सहसंबंध गुणांक के महत्व का आकलन करना

व्यायाम. क्षेत्र के क्षेत्रों के लिए, 199एक्स के लिए डेटा प्रदान किया गया है;
क्षेत्र क्रमांक एक सक्षम व्यक्ति का प्रतिदिन औसत प्रति व्यक्ति निर्वाह वेतन, रगड़ना, एक्स औसत दैनिक वेतन, रगड़, पर
1 78 133
2 82 148
3 87 134
4 79 154
5 89 162
6 106 195
7 67 139
8 88 158
9 73 152
10 87 162
11 76 159
12 115 173
आवश्यक:
1. x से y के युग्म प्रतिगमन के लिए एक रैखिक समीकरण बनाएं।
2. गणना करें रैखिक गुणांकजोड़ी सहसंबंध और औसत त्रुटिअनुमान.
3. प्रतिगमन और सहसंबंध मापदंडों के सांख्यिकीय महत्व का आकलन करें।
4. पूर्वानुमान चलाएँ वेतन y औसत प्रति व्यक्ति निर्वाह स्तर x के अनुमानित मूल्य के साथ औसत स्तर का 107% है।
5. पूर्वानुमान त्रुटि और उसके विश्वास अंतराल की गणना करके पूर्वानुमान की सटीकता का आकलन करें।

समाधानकैलकुलेटर का उपयोग करके खोजें।
प्रयोग ग्राफ़िक विधि .
इस पद्धति का उपयोग अध्ययन किए गए लोगों के बीच संबंध के रूप को स्पष्ट रूप से चित्रित करने के लिए किया जाता है आर्थिक संकेतक. ऐसा करने के लिए, एक आयताकार समन्वय प्रणाली में एक ग्राफ खींचा जाता है, परिणामी विशेषता Y के व्यक्तिगत मानों को कोर्डिनेट अक्ष के साथ प्लॉट किया जाता है, और कारक विशेषता X के व्यक्तिगत मानों को एब्सिस्सा अक्ष के साथ प्लॉट किया जाता है।
परिणामी एवं कारक विशेषताओं के बिंदुओं के समुच्चय को कहते हैं सहसंबंध क्षेत्र.
सहसंबंध क्षेत्र के आधार पर, हम (जनसंख्या के लिए) परिकल्पना कर सकते हैं कि X और Y के सभी संभावित मूल्यों के बीच संबंध रैखिक है।
रैखिक प्रतिगमन समीकरण y = bx + a + ε है
यहां ε एक यादृच्छिक त्रुटि (विचलन, गड़बड़ी) है।
यादृच्छिक त्रुटि के अस्तित्व के कारण:
1. प्रतिगमन मॉडल में महत्वपूर्ण व्याख्यात्मक चर शामिल करने में विफलता;
2. चरों का एकत्रीकरण। उदाहरण के लिए, कुल उपभोग फलन एक प्रयास है सामान्य अभिव्यक्तिव्यक्तिगत व्यय निर्णयों का एक सेट। यह केवल व्यक्तिगत रिश्तों का एक अनुमान है जिनके अलग-अलग पैरामीटर हैं।
3. मॉडल संरचना का गलत विवरण;
4. गलत कार्यात्मक विशिष्टता;
5. माप त्रुटियाँ.
चूंकि प्रत्येक विशिष्ट अवलोकन के लिए विचलन ε i यादृच्छिक हैं और नमूने में उनके मान अज्ञात हैं, तो:
1) अवलोकन x i और y i से केवल पैरामीटर α और β का अनुमान प्राप्त किया जा सकता है
2) प्रतिगमन मॉडल के पैरामीटर α और β का अनुमान क्रमशः ए और बी मान हैं, जो प्रकृति में यादृच्छिक हैं, क्योंकि एक यादृच्छिक नमूने के अनुरूप;
तब अनुमानित प्रतिगमन समीकरण (नमूना डेटा से निर्मित) का रूप y = bx + a + ε होगा, जहां e i त्रुटियों ε i के देखे गए मान (अनुमान) हैं, और a और b, क्रमशः, के अनुमान हैं प्रतिगमन मॉडल के पैरामीटर α और β जो पाए जाने चाहिए।
पैरामीटर α और β का अनुमान लगाने के लिए - न्यूनतम वर्ग विधि (न्यूनतम वर्ग विधि) का उपयोग किया जाता है।
सामान्य समीकरणों की प्रणाली.
हमारे डेटा के लिए, समीकरणों की प्रणाली का रूप है
पहले समीकरण से हम a को व्यक्त करते हैं और इसे दूसरे समीकरण में प्रतिस्थापित करते हैं
हमें b = 0.92, a = 76.98 मिलता है
प्रतिगमन समीकरण:
y = 0.92 x + 76.98

1. प्रतिगमन समीकरण पैरामीटर।
नमूना का मतलब है.



नमूना भिन्नताएँ:


मानक विचलन


सहसंबंध गुणांक
हम कनेक्शन निकटता के संकेतक की गणना करते हैं। यह सूचक नमूना रैखिक सहसंबंध गुणांक है, जिसकी गणना सूत्र द्वारा की जाती है:

रैखिक सहसंबंध गुणांक -1 से +1 तक मान लेता है।
विशेषताओं के बीच संबंध कमजोर और मजबूत (करीबी) हो सकते हैं। उनके मानदंडों का मूल्यांकन चैडॉक पैमाने के अनुसार किया जाता है:
0.1 < r xy < 0.3: слабая;
0.3 < r xy < 0.5: умеренная;
0.5 < r xy < 0.7: заметная;
0.7 < r xy < 0.9: высокая;
0.9 < r xy < 1: весьма высокая;
हमारे उदाहरण में, औसत दैनिक वेतन और औसत प्रति व्यक्ति जीवनयापन वेतन के बीच संबंध उच्च और प्रत्यक्ष है।
1.2. प्रतिगमन समीकरण(प्रतिगमन समीकरण का अनुमान)।

रैखिक प्रतिगमन समीकरण y = 0.92 x + 76.98 है
समीकरण गुणांक रैखिक प्रतिगमनआर्थिक अर्थ दिया जा सकता है.
गुणांक बी = 0.92 इसके माप की प्रति इकाई कारक x के मान में वृद्धि या कमी के साथ प्रभावी संकेतक (माप y की इकाइयों में) में औसत परिवर्तन दर्शाता है। इस उदाहरण में, 1 रगड़ की वृद्धि के साथ। प्रति व्यक्ति निर्वाह स्तर प्रति दिन, औसत दैनिक वेतन औसतन 0.92 बढ़ जाता है।
गुणांक a = 76.98 औपचारिक रूप से औसत दैनिक वेतन के अनुमानित स्तर को दर्शाता है, लेकिन केवल तभी जब x=0 नमूना मूल्यों के करीब हो।
प्रतिगमन समीकरण में उपयुक्त x मानों को प्रतिस्थापित करके, हम प्रत्येक अवलोकन के लिए प्रदर्शन संकेतक y(x) के संरेखित (अनुमानित) मान निर्धारित कर सकते हैं।
औसत दैनिक वेतन और औसत प्रति व्यक्ति निर्वाह न्यूनतम प्रति दिन के बीच संबंध प्रतिगमन गुणांक बी के संकेत द्वारा निर्धारित किया जाता है (यदि > 0 - सीधा संबंध, अन्यथा - उलटा)। हमारे उदाहरण में, कनेक्शन सीधा है.
लोच गुणांक.
यदि परिणामी संकेतक y और कारक विशेषता x की माप की इकाइयों में अंतर है, तो परिणामी विशेषता पर कारकों के प्रभाव का सीधे आकलन करने के लिए प्रतिगमन गुणांक (उदाहरण बी में) का उपयोग करना उचित नहीं है।
इन उद्देश्यों के लिए, लोच गुणांक और बीटा गुणांक की गणना की जाती है। लोच गुणांक सूत्र द्वारा पाया जाता है:


यह दर्शाता है कि कारक विशेषता x में 1% परिवर्तन होने पर प्रभावी विशेषता y औसतन कितने प्रतिशत बदलती है। यह कारकों के उतार-चढ़ाव की डिग्री को ध्यान में नहीं रखता है।
लोच गुणांक 1 से कम है। इसलिए, यदि प्रति दिन रहने की औसत प्रति व्यक्ति लागत 1% बदलती है, तो औसत दैनिक वेतन 1% से कम बदल जाएगा। दूसरे शब्दों में, औसत दैनिक वेतन Y पर औसत प्रति व्यक्ति निर्वाह स्तर X का प्रभाव महत्वपूर्ण नहीं है।
बीटा गुणांकउसके औसत के मूल्य के किस भाग से पता चलता है वर्ग विचलनपरिणामी विशेषता का औसत मूल्य तब बदल जाएगा जब कारक विशेषता एक स्थिर स्तर पर तय किए गए शेष स्वतंत्र चर के मूल्य के साथ अपने मानक विचलन के मूल्य से बदलती है:

वे। इस सूचक के मानक विचलन द्वारा x में वृद्धि से इस सूचक के औसत दैनिक वेतन Y में 0.721 मानक विचलन की वृद्धि होगी।
1.4. अनुमान लगाने में त्रुटि.
आइए पूर्ण सन्निकटन की त्रुटि का उपयोग करके प्रतिगमन समीकरण की गुणवत्ता का मूल्यांकन करें।


चूँकि त्रुटि 15% से कम है, इसलिए इस समीकरण का उपयोग प्रतिगमन के रूप में किया जा सकता है।
निर्धारण गुणांक.
(एकाधिक) सहसंबंध गुणांक के वर्ग को निर्धारण गुणांक कहा जाता है, जो कारक विशेषता में भिन्नता द्वारा समझाए गए परिणामी विशेषता में भिन्नता के अनुपात को दर्शाता है।
अक्सर, निर्धारण के गुणांक की व्याख्या करते समय, इसे प्रतिशत के रूप में व्यक्त किया जाता है।
आर2 = 0.722 = 0.5199
वे। 51.99% मामलों में, औसत प्रति व्यक्ति निर्वाह स्तर x में परिवर्तन से औसत दैनिक वेतन y में परिवर्तन होता है। दूसरे शब्दों में, प्रतिगमन समीकरण के चयन की सटीकता औसत है। औसत दैनिक वेतन Y में शेष 48.01% परिवर्तन को मॉडल में ध्यान में नहीं रखे गए कारकों द्वारा समझाया गया है।

एक्स एक्स 2 य 2 एक्स ओ वाई वाई(एक्स) (y i -y cp) 2 (y-y(x)) 2 (एक्स आई -एक्स सीपी) 2 |y - y x |:y
78 133 6084 17689 10374 148,77 517,56 248,7 57,51 0,1186
82 148 6724 21904 12136 152,45 60,06 19,82 12,84 0,0301
87 134 7569 17956 11658 157,05 473,06 531,48 2,01 0,172
79 154 6241 23716 12166 149,69 3,06 18,57 43,34 0,028
89 162 7921 26244 14418 158,89 39,06 9,64 11,67 0,0192
106 195 11236 38025 20670 174,54 1540,56 418,52 416,84 0,1049
67 139 4489 19321 9313 138,65 280,56 0,1258 345,34 0,0026
88 158 7744 24964 13904 157,97 5,06 0,0007 5,84 0,0002
73 152 5329 23104 11096 144,17 14,06 61,34 158,34 0,0515
87 162 7569 26244 14094 157,05 39,06 24,46 2,01 0,0305
76 159 5776 25281 12084 146,93 10,56 145,7 91,84 0,0759
115 173 13225 29929 19895 182,83 297,56 96,55 865,34 0,0568
1027 1869 89907 294377 161808 1869 3280,25 1574,92 2012,92 0,6902

2. प्रतिगमन समीकरण मापदंडों का अनुमान।
2.1. सहसंबंध गुणांक का महत्व.

महत्व स्तर α=0.05 और स्वतंत्रता की डिग्री k=10 के साथ विद्यार्थी की तालिका का उपयोग करते हुए, हम t मानदंड पाते हैं:
टी क्रिट = (10;0.05) = 1.812
जहाँ m = 1 व्याख्यात्मक चरों की संख्या है।
यदि t ने > t महत्वपूर्ण देखा है, तो सहसंबंध गुणांक का परिणामी मान महत्वपूर्ण माना जाता है (शून्य परिकल्पना जिसमें कहा गया है कि सहसंबंध गुणांक शून्य के बराबर है, खारिज कर दिया जाता है)।
चूँकि t obs > t आलोचना, हम इस परिकल्पना को अस्वीकार करते हैं कि सहसंबंध गुणांक 0 के बराबर है। दूसरे शब्दों में, सहसंबंध गुणांक सांख्यिकीय रूप से महत्वपूर्ण है।
युग्मित रैखिक प्रतिगमन में t 2 r = t 2 b और फिर प्रतिगमन और सहसंबंध गुणांक के महत्व के बारे में परिकल्पना का परीक्षण करना महत्व के बारे में परिकल्पना का परीक्षण करने के बराबर है रैखिक समीकरणप्रतिगमन.

2.3. प्रतिगमन गुणांक के अनुमान निर्धारित करने की सटीकता का विश्लेषण।
गड़बड़ी के फैलाव का एक निष्पक्ष अनुमान मूल्य है:


एस 2 वाई = 157.4922 - अस्पष्टीकृत विचरण (प्रतिगमन रेखा के चारों ओर आश्रित चर के प्रसार का एक माप)।

12.5496 - अनुमान की मानक त्रुटि (प्रतिगमन की मानक त्रुटि)।
एस ए - मानक विचलनयादृच्छिक चर ए.


एस बी - यादृच्छिक चर बी का मानक विचलन।


2.4. आश्रित चर के लिए विश्वास अंतराल.
निर्मित मॉडल के आधार पर आर्थिक पूर्वानुमान मानता है कि चर के बीच पहले से मौजूद संबंध लीड-टाइम अवधि के लिए बनाए रखे जाते हैं।
परिणामी विशेषता के आश्रित चर की भविष्यवाणी करने के लिए, मॉडल में शामिल सभी कारकों के अनुमानित मूल्यों को जानना आवश्यक है।
कारकों के अनुमानित मूल्यों को मॉडल में प्रतिस्थापित किया जाता है और अध्ययन किए जा रहे संकेतक के पूर्वानुमानित बिंदु अनुमान प्राप्त किए जाते हैं।
(ए + बीएक्स पी ± ε)
कहाँ

आइए उस अंतराल की सीमाओं की गणना करें जिसमें 95% केंद्रित होगा संभावित मानअसीमित संख्या में प्रेक्षणों के लिए Y और X p = 94

(76.98 + 0.92*94 ± 7.8288)
(155.67;171.33)
95% की संभावना के साथ यह गारंटी देना संभव है कि असीमित संख्या में अवलोकनों के लिए Y मान पाए गए अंतराल की सीमा से बाहर नहीं जाएगा।
2.5. रेखीय प्रतिगमन समीकरण के गुणांकों के संबंध में परिकल्पनाओं का परीक्षण करना।
1) टी-सांख्यिकी। विद्यार्थी का टी टेस्ट.
आइए महत्व स्तर α=0.05 पर व्यक्तिगत प्रतिगमन गुणांकों की शून्य (यदि विकल्प H 1 के बराबर नहीं है) की समानता के बारे में परिकल्पना H 0 की जाँच करें।
टी क्रिट = (10;0.05) = 1.812


3.2906 > 1.812 के बाद से, प्रतिगमन गुणांक बी के सांख्यिकीय महत्व की पुष्टि की जाती है (हम इस परिकल्पना को अस्वीकार करते हैं कि यह गुणांक शून्य के बराबर है)।


3.1793 > 1.812 के बाद से, प्रतिगमन गुणांक ए के सांख्यिकीय महत्व की पुष्टि की जाती है (हम इस परिकल्पना को अस्वीकार करते हैं कि यह गुणांक शून्य के बराबर है)।
प्रतिगमन समीकरण गुणांकों के लिए विश्वास अंतराल।
आइए परिभाषित करें आत्मविश्वास अंतरालप्रतिगमन गुणांक, जो 95% विश्वसनीयता के साथ इस प्रकार होंगे:
(बी - टी क्रिट एस बी ; बी + टी क्रिट एस बी)
(0.9204 - 1.812 0.2797; 0.9204 + 1.812 0.2797)
(0.4136;1.4273)

(ए - टी लैंग=एसवी>ए)
(76.9765 - 1.812 24.2116; 76.9765 + 1.812 24.2116)
(33.1051;120.8478)
95% की संभावना के साथ यह कहा जा सकता है कि इस पैरामीटर का मान पाए गए अंतराल में होगा।
2) एफ-सांख्यिकी। फिशर मानदंड.
प्रतिगमन मॉडल के महत्व का परीक्षण फिशर के एफ परीक्षण का उपयोग करके किया जाता है, जिसकी गणना मूल्य अध्ययन किए जा रहे संकेतक की टिप्पणियों की मूल श्रृंखला के विचरण के अनुपात और अवशिष्ट अनुक्रम के विचरण के निष्पक्ष अनुमान के रूप में पाया जाता है। इस मॉडल के लिए.
यदि k1=(m) और k2=(n-m-1) स्वतंत्रता की डिग्री के साथ परिकलित मान किसी दिए गए महत्व स्तर पर सारणीबद्ध मान से अधिक है, तो मॉडल को महत्वपूर्ण माना जाता है।

जहाँ m मॉडल में कारकों की संख्या है।
श्रेणी सांख्यिकीय महत्वयुग्मित रैखिक प्रतिगमन निम्नलिखित एल्गोरिदम का उपयोग करके किया जाता है:
1. एक शून्य परिकल्पना प्रस्तुत की गई है कि समग्र रूप से समीकरण सांख्यिकीय रूप से महत्वहीन है: एच 0: आर 2 = 0 महत्व स्तर α पर।
2. अगला, एफ-मानदंड का वास्तविक मूल्य निर्धारित करें:


जहाँ जोड़ीवार प्रतिगमन के लिए m=1 है।
3. तालिका मानकिसी दिए गए महत्व स्तर के लिए फिशर वितरण तालिकाओं से निर्धारित किया जाता है, जिसमें स्वतंत्रता की डिग्री की संख्या को ध्यान में रखा जाता है कुल राशिवर्ग (बड़ा विचरण) 1 है और रैखिक प्रतिगमन में वर्गों के अवशिष्ट योग (छोटे विचरण) की स्वतंत्रता की डिग्री की संख्या n-2 है।
4. यदि एफ-परीक्षण का वास्तविक मूल्य तालिका मूल्य से कम है, तो वे कहते हैं कि शून्य परिकल्पना को अस्वीकार करने का कोई कारण नहीं है।
अन्यथा, शून्य परिकल्पना खारिज कर दी जाती है और संभाव्यता (1-α) के साथ समग्र रूप से समीकरण के सांख्यिकीय महत्व के बारे में वैकल्पिक परिकल्पना स्वीकार कर ली जाती है।
स्वतंत्रता की डिग्री k1=1 और k2=10 के साथ मानदंड का तालिका मान, Fkp = 4.96
चूँकि F > Fkp का वास्तविक मान, निर्धारण का गुणांक सांख्यिकीय रूप से महत्वपूर्ण है (प्रतिगमन समीकरण का पाया गया अनुमान सांख्यिकीय रूप से विश्वसनीय है)।

चरण 3. डेटा के बीच संबंध ढूँढना

रैखिक सहसंबंध

घटनाओं के बीच संबंधों का अध्ययन करने के कार्य का अंतिम चरण संकेतकों के आधार पर कनेक्शन की निकटता का आकलन करना है सहसंबंध संबंध. यह चरण कारक और प्रदर्शन विशेषताओं के बीच निर्भरता की पहचान करने के लिए बहुत महत्वपूर्ण है, और परिणामस्वरूप, अध्ययन की जा रही घटना का निदान और पूर्वानुमान लगाने की संभावना के लिए।

निदान(ग्रीक निदान मान्यता से) - किसी भी वस्तु या घटना की स्थिति के सार और विशेषताओं का उसके व्यापक अध्ययन के आधार पर निर्धारण।

पूर्वानुमान(ग्रीक पूर्वानुमान दूरदर्शिता, भविष्यवाणी से) - भविष्य में किसी भी घटना की स्थिति के बारे में कोई विशिष्ट भविष्यवाणी, निर्णय (मौसम पूर्वानुमान, चुनाव परिणाम, आदि)। पूर्वानुमान अध्ययन के तहत प्रणाली, वस्तु या घटना की संभावित भविष्य की स्थिति और इस स्थिति को दर्शाने वाले संकेतकों के बारे में वैज्ञानिक रूप से आधारित परिकल्पना है। पूर्वानुमान - पूर्वानुमान विकास, विशेष वैज्ञानिक अनुसंधानकिसी भी घटना के विकास के लिए विशिष्ट संभावनाएँ।

आइए सहसंबंध की परिभाषा याद रखें:

सह - संबंध- यादृच्छिक चर के बीच निर्भरता, इस तथ्य में व्यक्त की जाती है कि एक मूल्य का वितरण दूसरे मूल्य के मूल्य पर निर्भर करता है।

न केवल मात्रात्मक, बल्कि गुणात्मक विशेषताओं के बीच भी सहसंबंध देखा जाता है। वहाँ हैं विभिन्न तरीकेऔर संबंधों की निकटता का आकलन करने के लिए संकेतक। हम यहीं रुकेंगे रैखिक जोड़ी सहसंबंध गुणांक , जिसका उपयोग तब किया जाता है जब यादृच्छिक चर के बीच एक रैखिक संबंध होता है। व्यवहार में, अक्सर असमान आयामों के यादृच्छिक चर के बीच संबंध के स्तर को निर्धारित करने की आवश्यकता होती है, इसलिए इस संबंध की किसी प्रकार की आयामहीन विशेषता होना वांछनीय है। ऐसी विशेषता (कनेक्शन का माप) गुणांक है रैखिक सहसंबंध आर xy, जो सूत्र द्वारा निर्धारित किया जाता है

कहाँ , .

तथा को निरूपित करते हुए, हम सहसंबंध गुणांक की गणना के लिए निम्नलिखित अभिव्यक्ति प्राप्त कर सकते हैं

.

यदि हम अवधारणा का परिचय देते हैं सामान्यीकृत विचलन , जो मानक विचलन के अंशों में औसत से सहसंबद्ध मूल्यों के विचलन को व्यक्त करता है:



तब सहसंबंध गुणांक के लिए व्यंजक रूप लेगा

.

यदि आप गणना तालिका से मूल यादृच्छिक चर के अंतिम मानों का उपयोग करके सहसंबंध गुणांक की गणना करते हैं, तो सहसंबंध गुणांक की गणना सूत्र का उपयोग करके की जा सकती है

.

रैखिक सहसंबंध गुणांक के गुण:

1). सहसंबंध गुणांक एक आयामहीन मात्रा है।

2). |आर| £1 या .

3). , ए,बी= स्थिरांक, - यदि यादृच्छिक चर X और Y के सभी मानों को एक स्थिरांक से गुणा (या विभाजित) किया जाए तो सहसंबंध गुणांक का मान नहीं बदलेगा।

4). , ए,बी= स्थिरांक, - यदि यादृच्छिक चर X और Y के सभी मान एक स्थिरांक द्वारा बढ़ाए (या घटाए गए) हैं तो सहसंबंध गुणांक का मान नहीं बदलेगा।

5). सहसंबंध गुणांक और प्रतिगमन गुणांक के बीच एक संबंध है:

सहसंबंध गुणांक के मूल्यों की व्याख्या इस प्रकार की जा सकती है:

संचार की निकटता का आकलन करने के लिए मात्रात्मक मानदंड:

पूर्वानुमान संबंधी प्रयोजनों के लिए, |r| वाले मान > 0.7.

सहसंबंध गुणांक हमें अस्तित्व का निष्कर्ष निकालने की अनुमति देता है रैखिक निर्भरतादो यादृच्छिक चर के बीच, लेकिन यह इंगित नहीं करता कि कौन सा चर दूसरे में परिवर्तन का कारण बनता है। वास्तव में, दो यादृच्छिक चर के बीच संबंध स्वयं मूल्यों के बीच कारण-और-प्रभाव संबंध के बिना मौजूद हो सकता है, क्योंकि दोनों यादृच्छिक चर में परिवर्तन तीसरे के परिवर्तन (प्रभाव) के कारण हो सकता है।

सहसंबंध गुणांक आर xyविचाराधीन यादृच्छिक चर के संबंध में सममित है एक्सऔर वाई. इसका मतलब यह है कि सहसंबंध गुणांक निर्धारित करने के लिए यह पूरी तरह से उदासीन है कि कौन सी मात्रा स्वतंत्र है और कौन सी निर्भर है।

सहसंबंध गुणांक का महत्व

यहां तक ​​के लिए स्वतंत्र मात्राएँमाप परिणामों के यादृच्छिक बिखरने या यादृच्छिक चर के एक छोटे नमूने के कारण सहसंबंध गुणांक शून्य से भिन्न हो सकता है। इसलिए, सहसंबंध गुणांक के महत्व की जांच की जानी चाहिए।

रैखिक सहसंबंध गुणांक के महत्व की जाँच इसके आधार पर की जाती है विद्यार्थी का टी-टेस्ट :

.

अगर टी > टी करोड़(पी,एन-2), तो रैखिक सहसंबंध गुणांक महत्वपूर्ण है, और इसलिए सांख्यिकीय संबंध भी महत्वपूर्ण है एक्सऔर वाई.

.

गणना में आसानी के लिए, सहसंबंध गुणांक की आत्मविश्वास सीमा के मूल्यों की तालिकाएँ बनाई गई हैं विभिन्न संख्याएँस्वतंत्रता की कोटियां एफ = एन-2 (दो-पूंछ परीक्षण) और विभिन्न महत्व स्तर = 0.1; 0.05; 0.01 और 0.001. यदि परिकलित सहसंबंध गुणांक दिए गए मानों के लिए सहसंबंध गुणांक की विश्वास सीमा के मान से अधिक हो तो सहसंबंध को महत्वपूर्ण माना जाता है। एफऔर एक।

बड़े लोगों के लिए एनऔर = 0.01 सहसंबंध गुणांक की विश्वास सीमा के मूल्य की गणना अनुमानित सूत्र का उपयोग करके की जा सकती है

.

जैसा कि बार-बार उल्लेख किया गया है, अध्ययन के तहत चर के बीच सहसंबंध की उपस्थिति या अनुपस्थिति के बारे में एक सांख्यिकीय निष्कर्ष निकालने के लिए, नमूना सहसंबंध गुणांक के महत्व की जांच करना आवश्यक है। इस तथ्य के कारण कि सहसंबंध गुणांक सहित सांख्यिकीय विशेषताओं की विश्वसनीयता, नमूना आकार पर निर्भर करती है, ऐसी स्थिति उत्पन्न हो सकती है जब सहसंबंध गुणांक का मूल्य पूरी तरह से नमूने में यादृच्छिक उतार-चढ़ाव से निर्धारित होता है जिसके आधार पर इसकी गणना की जाती है। . यदि चरों के बीच कोई महत्वपूर्ण संबंध है, तो सहसंबंध गुणांक शून्य से काफी भिन्न होना चाहिए। यदि अध्ययनाधीन चरों के बीच कोई सहसंबंध नहीं है, तो जनसंख्या का सहसंबंध गुणांक शून्य के बराबर है। व्यावहारिक अनुसंधान में, एक नियम के रूप में, वे नमूना टिप्पणियों पर आधारित होते हैं। किसी भी सांख्यिकीय विशेषता की तरह, नमूना सहसंबंध गुणांक है अनियमित परिवर्तनशील वस्तु, यानी इसके मान एक ही नाम के जनसंख्या पैरामीटर (सहसंबंध गुणांक का सही मूल्य) के आसपास बेतरतीब ढंग से बिखरे हुए हैं। यदि चरों के बीच कोई सहसंबंध नहीं है, तो जनसंख्या में उनका सहसंबंध गुणांक शून्य के बराबर है। लेकिन प्रकीर्णन की यादृच्छिक प्रकृति के कारण, ऐसी स्थितियाँ मौलिक रूप से संभव हैं जब इस जनसंख्या के नमूनों से गणना किए गए कुछ सहसंबंध गुणांक शून्य से भिन्न होंगे।

क्या देखे गए अंतरों को नमूने में यादृच्छिक उतार-चढ़ाव के लिए जिम्मेदार ठहराया जा सकता है, या क्या वे उन स्थितियों में एक महत्वपूर्ण बदलाव को दर्शाते हैं जिनके तहत चर के बीच संबंध बने थे? यदि नमूना सहसंबंध गुणांक के मान प्रकीर्णन क्षेत्र के अंतर्गत आते हैं,

सूचक की यादृच्छिक प्रकृति के कारण, यह किसी रिश्ते की अनुपस्थिति का प्रमाण नहीं है। अधिकतम यही कहा जा सकता है कि अवलोकन संबंधी डेटा चरों के बीच किसी संबंध की अनुपस्थिति से इनकार नहीं करता है। लेकिन यदि नमूना सहसंबंध गुणांक का मान उल्लिखित बिखरने वाले क्षेत्र के बाहर है, तो वे निष्कर्ष निकालते हैं कि यह शून्य से काफी अलग है, और हम मान सकते हैं कि चर के बीच एक सांख्यिकीय अंतर है सार्थक संबंध. विभिन्न आँकड़ों के वितरण के आधार पर इस समस्या को हल करने के लिए उपयोग किए जाने वाले मानदंड को महत्व मानदंड कहा जाता है।

महत्व परीक्षण प्रक्रिया शून्य परिकल्पना बी के निर्माण के साथ शुरू होती है सामान्य रूप से देखेंयह इस तथ्य में निहित है कि नमूना पैरामीटर और जनसंख्या पैरामीटर के बीच कोई महत्वपूर्ण अंतर नहीं है। एक वैकल्पिक परिकल्पना यह है कि इन मापदंडों के बीच महत्वपूर्ण अंतर हैं। उदाहरण के लिए, किसी जनसंख्या में सहसंबंध की उपस्थिति का परीक्षण करते समय, शून्य परिकल्पना यह है कि वास्तविक सहसंबंध गुणांक शून्य है। यदि परीक्षण के परिणाम से पता चलता है कि शून्य परिकल्पना स्वीकार्य नहीं है, तो नमूना सहसंबंध गुणांक काफी भिन्न है शून्य से (शून्य परिकल्पना खारिज कर दी जाती है और विकल्प स्वीकार कर लिया जाता है। दूसरे शब्दों में, यह धारणा कि जनसंख्या में यादृच्छिक चर असंबद्ध हैं, निराधार माना जाना चाहिए। और इसके विपरीत, यदि, महत्व मानदंड के आधार पर, शून्य परिकल्पना स्वीकार की जाती है , अर्थात, यह यादृच्छिक प्रकीर्णन के अनुमेय क्षेत्र में स्थित है, तो इस धारणा पर विचार करने का कोई कारण नहीं है कि जनसंख्या में चर असंबद्ध हैं, इसे संदिग्ध माना जाए।

एक महत्व परीक्षण में, शोधकर्ता एक महत्व स्तर निर्धारित करता है जो कुछ व्यावहारिक विश्वास प्रदान करता है कि गलत निष्कर्ष केवल बहुत ही दुर्लभ मामलों में निकाले जाएंगे। महत्व स्तर इस संभावना को व्यक्त करता है कि शून्य परिकल्पना खारिज कर दी जाती है जबकि यह वास्तव में सत्य है। स्पष्ट रूप से, इस संभावना को यथासंभव छोटा चुनना समझदारी है।

नमूना विशेषता के वितरण को ज्ञात करें, जो जनसंख्या पैरामीटर का निष्पक्ष अनुमान है। चयनित महत्व स्तर इस वितरण के वक्र के नीचे छायांकित क्षेत्रों से मेल खाता है (चित्र 24 देखें)। वितरण वक्र के नीचे अछायांकित क्षेत्र संभाव्यता निर्धारित करता है। छायांकित क्षेत्रों के नीचे भुज अक्ष पर खंडों की सीमाओं को महत्वपूर्ण मान कहा जाता है, और खंड स्वयं महत्वपूर्ण क्षेत्र, या परिकल्पना अस्वीकृति का क्षेत्र बनाते हैं।

परिकल्पना परीक्षण प्रक्रिया में, अवलोकनों के परिणामों से गणना की गई नमूना विशेषता की तुलना संबंधित महत्वपूर्ण मूल्य से की जाती है। इस मामले में, एकतरफ़ा और दोतरफ़ा महत्वपूर्ण क्षेत्रों के बीच अंतर करना चाहिए। महत्वपूर्ण क्षेत्र को निर्दिष्ट करने का रूप समस्या के निरूपण पर निर्भर करता है सांख्यिकीय अनुसंधान. नमूना पैरामीटर और जनसंख्या पैरामीटर की तुलना करते समय दो-तरफा महत्वपूर्ण क्षेत्र की आवश्यकता होती है

मूल्यांकन किये जाने की आवश्यकता है निरपेक्ष मूल्यउनके बीच विसंगतियां, यानी, अध्ययन की गई मात्राओं के बीच सकारात्मक और नकारात्मक दोनों अंतर रुचिकर हैं। जब यह सुनिश्चित करना आवश्यक होता है कि औसतन एक मान दूसरे से सख्ती से अधिक या कम है, तो एक तरफा महत्वपूर्ण क्षेत्र (दाएं या बाएं तरफा) का उपयोग किया जाता है। यह बिल्कुल स्पष्ट है कि समान महत्वपूर्ण मान के लिए एक तरफा महत्वपूर्ण क्षेत्र का उपयोग करते समय महत्व का स्तर दो तरफा महत्वपूर्ण क्षेत्र का उपयोग करने से कम होता है।

चावल। 24. शून्य परिकल्पना परीक्षण

यदि नमूना विशेषता का वितरण सममित है, तो दो तरफा महत्वपूर्ण क्षेत्र का महत्व स्तर a के बराबर है, और एक तरफा महत्वपूर्ण क्षेत्र y के बराबर है (चित्र 24 देखें)। आइए हम स्वयं को समस्या के सामान्य सूत्रीकरण तक ही सीमित रखें। परीक्षण के सैद्धांतिक औचित्य के बारे में अधिक विस्तार से सांख्यिकीय परिकल्पनाएँआप अंदर मिल सकते हैं विशिष्ट साहित्य. नीचे हम केवल इसके महत्व मानदंड का संकेत देंगे विभिन्न प्रक्रियाएँ, उनके निर्माण पर रोक लगाए बिना।

जोड़ी सहसंबंध गुणांक के महत्व की जांच करके, अध्ययन के तहत घटनाओं के बीच सहसंबंध की उपस्थिति या अनुपस्थिति स्थापित की जाती है। यदि कोई संबंध नहीं है, तो जनसंख्या का सहसंबंध गुणांक शून्य है। सत्यापन प्रक्रिया शून्य और वैकल्पिक परिकल्पनाओं के निर्माण से शुरू होती है:

नमूना सहसंबंध गुणांक के बीच अंतर महत्वहीन है,

उनके बीच अंतर महत्वपूर्ण है, और इसलिए उनके चरों के बीच एक महत्वपूर्ण संबंध है। वैकल्पिक परिकल्पना का तात्पर्य है कि हमें दो-तरफा महत्वपूर्ण क्षेत्र का उपयोग करने की आवश्यकता है।

यह धारा 8.1 में पहले ही उल्लेख किया गया था कि नमूना सहसंबंध गुणांक, कुछ परिसरों के तहत, स्वतंत्रता की डिग्री के साथ छात्र वितरण के लिए एक यादृच्छिक चर विषय से जुड़ा हुआ है। नमूना परिणामों से सांख्यिकी की गणना की गई

किसी दिए गए महत्व स्तर ए और स्वतंत्रता की डिग्री पर छात्र वितरण तालिका से निर्धारित महत्वपूर्ण मूल्य के साथ तुलना की जाती है। मानदंड लागू करने का नियम इस प्रकार है: यदि शून्य परिकल्पना को महत्व स्तर ए पर खारिज कर दिया जाता है, यानी चर के बीच संबंध महत्वपूर्ण है; यदि तब महत्व स्तर a पर शून्य परिकल्पना स्वीकार कर ली जाती है। मूल्य के विचलन को यादृच्छिक भिन्नता के लिए जिम्मेदार ठहराया जा सकता है। नमूना डेटा विचाराधीन परिकल्पना को बहुत संभव और प्रशंसनीय बताता है, यानी कनेक्शन की अनुपस्थिति की परिकल्पना आपत्तियां नहीं उठाती है।

परिकल्पना परीक्षण प्रक्रिया बहुत सरल हो जाती है यदि, आँकड़ों के बजाय, हम सहसंबंध गुणांक के महत्वपूर्ण मूल्यों का उपयोग करते हैं, जिसे छात्र वितरण की मात्राओं के माध्यम से प्रतिस्थापित करके निर्धारित किया जा सकता है

महत्वपूर्ण मूल्यों की विस्तृत तालिकाएँ हैं, जिनका एक अंश इस पुस्तक के परिशिष्ट में दिया गया है (तालिका 6 देखें)। इस मामले में एक परिकल्पना का परीक्षण करने का नियम निम्नलिखित पर आधारित है: यदि हां, तो हम यह दावा कर सकते हैं कि चर के बीच संबंध महत्वपूर्ण है। यदि ऐसा है, तो हम अवलोकन परिणामों को कनेक्शन की अनुपस्थिति की परिकल्पना के अनुरूप मानते हैं।

आइए खंड 4.1 में दिए गए आंकड़ों के अनुसार काम के मशीनीकरण के स्तर से श्रम उत्पादकता की स्वतंत्रता के बारे में परिकल्पना का परीक्षण करें। पहले यह गणना की गई थी कि (8.38) से हम प्राप्त करते हैं

छात्र वितरण तालिका का उपयोग करते हुए, हम इस आँकड़े का महत्वपूर्ण मान पाते हैं: चूँकि हम शून्य परिकल्पना को अस्वीकार करते हैं, जिससे केवल 5% मामलों में त्रुटि होती है।

यदि हम संबंधित तालिका से प्राप्त सहसंबंध गुणांक के महत्वपूर्ण मान से तुलना करते हैं तो हमें वही परिणाम मिलेगा

जिसमें -स्वतंत्रता की डिग्री के साथ वितरण है। इसके बाद, महत्व की जांच करने की प्रक्रिया -मानदंड का उपयोग करके पिछले एक के समान ही की जाती है।

उदाहरण

घटना के आर्थिक विश्लेषण के आधार पर, हम सामान्य आबादी में श्रम उत्पादकता और काम के मशीनीकरण के स्तर के बीच एक मजबूत संबंध मानते हैं। उदाहरण के लिए, चलो. एक विकल्प के रूप में, इस मामले में हम इस परिकल्पना को सामने रख सकते हैं कि नमूना सहसंबंध गुणांक इस प्रकार, हमें एक तरफा महत्वपूर्ण क्षेत्र का उपयोग करना चाहिए। (8.40) से यह इस प्रकार है

हम प्राप्त मूल्य की तुलना महत्वपूर्ण मूल्य से करते हैं। इस प्रकार, 5% के महत्व स्तर पर, हम अध्ययन की गई विशेषताओं के बीच एक बहुत करीबी संबंध की उपस्थिति मान सकते हैं, यानी, प्रारंभिक डेटा इसे प्रशंसनीय मानना ​​​​संभव बनाता है।

आंशिक सहसंबंध गुणांकों के महत्व की जाँच इसी प्रकार की जाती है। केवल स्वतंत्रता की डिग्री की संख्या बदलती है, जो व्याख्यात्मक चर की संख्या के बराबर हो जाती है। सांख्यिकी मूल्य की गणना सूत्र का उपयोग करके की जाती है

इसकी तुलना महत्व स्तर ए पर वितरण तालिका से पाए गए महत्वपूर्ण मान और स्वतंत्रता की डिग्री की संख्या के साथ की जाती है, आंशिक सहसंबंध गुणांक के महत्व के बारे में परिकल्पना की स्वीकृति या अस्वीकृति ऊपर वर्णित समान नियम के अनुसार की जाती है . (8.39) के अनुसार सहसंबंध गुणांक के महत्वपूर्ण मूल्यों के साथ-साथ फिशर परिवर्तन (8.40) का उपयोग करके भी महत्व परीक्षण किया जा सकता है।

उदाहरण

आइए धारा 4.5 में गणना किए गए आंशिक सहसंबंध गुणांक की सांख्यिकीय विश्वसनीयता को महत्व स्तर पर जांचें, आंशिक सहसंबंध गुणांक के साथ, संबंधित गणना और महत्वपूर्ण सांख्यिकीय मान दिए गए हैं

इस तथ्य के कारण कि गुणांक के महत्व के बारे में परिकल्पना स्वीकार की जाती है, हम निष्कर्ष निकालते हैं: काम के मशीनीकरण के स्तर का श्रम उत्पादकता पर महत्वपूर्ण प्रभाव पड़ता है, श्रमिकों की औसत आयु (और अनुपालन का औसत प्रतिशत) के प्रभाव को छोड़कर मानक) शेष गुणांकों के शून्य से अंतर

आंशिक सहसंबंधों को नमूने में यादृच्छिक उतार-चढ़ाव के लिए जिम्मेदार ठहराया जा सकता है, और इसलिए उनसे हम प्रासंगिक चर के आंशिक प्रभावों के बारे में कुछ भी निश्चित नहीं कह सकते हैं।

एकाधिक सहसंबंध गुणांक के महत्व को एकाधिक निर्धारण के गुणांक के महत्व की जांच करने की प्रक्रिया के परिणाम से आंका जाता है। हम अगले भाग में इस पर अधिक विस्तार से चर्चा करेंगे।

एक प्रश्न जो अक्सर दिलचस्पी का होता है वह है: क्या दो सहसंबंध गुणांक एक दूसरे से काफी भिन्न हैं? इस परिकल्पना का परीक्षण करते समय, यह माना जाता है कि सजातीय आबादी की समान विशेषताओं पर विचार किया जाता है; डेटा परिणामों का प्रतिनिधित्व करता है स्वतंत्र परीक्षण; एक ही प्रकार के सहसंबंध गुणांक का उपयोग किया जाता है, अर्थात, समान संख्या में चर को छोड़कर, या तो जोड़ीदार सहसंबंध गुणांक या आंशिक सहसंबंध गुणांक।

जिन दो नमूनों से सहसंबंध गुणांक की गणना की जाती है, उनकी मात्रा भिन्न हो सकती है। शून्य परिकल्पना: यानी, विचाराधीन दो आबादी के सहसंबंध गुणांक बराबर हैं। वैकल्पिक परिकल्पना: वैकल्पिक परिकल्पना का तात्पर्य है कि दो-तरफा महत्वपूर्ण क्षेत्र का उपयोग किया जाना चाहिए। दूसरे शब्दों में, आपको यह जांचना चाहिए कि क्या अंतर शून्य से काफी भिन्न है। आइए उन आँकड़ों का उपयोग करें जिनका वितरण लगभग सामान्य है:

कहां - सहसंबंध गुणांक के परिवर्तनों के परिणाम - नमूना मात्रा। परीक्षण नियम: यदि तब परिकल्पना अस्वीकार कर दी जाती है; यदि तब परिकल्पना स्वीकृत हो जाती है।

यदि स्वीकार किया जाए तो मूल्य

(8.6) का उपयोग करके पुनर्गणना के बाद सहसंबंध गुणांक के सारांश अनुमान के रूप में कार्य करता है, इसके बाद सांख्यिकी का उपयोग करके परिकल्पना का परीक्षण किया जा सकता है

सामान्य वितरण होना।

उदाहरण

यह स्थापित करना आवश्यक है कि क्या देश के विभिन्न क्षेत्रों में स्थित एक ही उद्योग के उद्यमों में श्रम उत्पादकता और काम के मशीनीकरण के स्तर के बीच संबंध की निकटता भिन्न है। आइए दो क्षेत्रों में स्थित उद्यमों की तुलना करें। मान लें कि उनमें से एक के लिए सहसंबंध गुणांक की गणना वॉल्यूम नमूने का उपयोग करके की जाती है (धारा 4.1 देखें)। अन्य क्षेत्र के लिए, वॉल्यूम नमूने का उपयोग करके गणना की गई

दोनों सहसंबंध गुणांकों को -मानों में परिवर्तित करने के बाद, हम (8.42) का उपयोग करके आँकड़ों X के मान की गणना करते हैं:

आँकड़ों का महत्वपूर्ण मान इस प्रकार है, परिकल्पना स्वीकार की जाती है, अर्थात, उपलब्ध नमूनों के आधार पर, हम सहसंबंध गुणांक के बीच एक महत्वपूर्ण अंतर स्थापित नहीं कर सकते हैं। इसके अलावा, दोनों सहसंबंध गुणांक महत्वपूर्ण हैं।

(8.43) और (8.6) का उपयोग करते हुए, हम दो क्षेत्रों के लिए सहसंबंध गुणांक का सारांश अनुमान प्राप्त करते हैं:

अंत में, आइए परिकल्पना की जाँच करें कि क्या सहसंबंध गुणांक का सारांश अनुमान आँकड़ों (8.44) का उपयोग करके शून्य से काफी भिन्न है:

चूंकि हम यह दावा कर सकते हैं कि सामान्य आबादी में श्रम उत्पादकता और काम के मशीनीकरण के स्तर के बीच एक महत्वपूर्ण संबंध है।

एक्स मानदंड का उपयोग विभिन्न पहलुओं में किया जा सकता है। इस प्रकार, क्षेत्रों के बजाय, विभिन्न उद्योगों पर विचार किया जा सकता है, उदाहरण के लिए, जब यह निर्धारित करना आवश्यक हो कि क्या दो अलग-अलग उद्योगों से संबंधित उद्यमों के आर्थिक संकेतकों के बीच अध्ययन किए गए संबंधों की ताकत में अंतर महत्वपूर्ण हैं।

आइए हम दो वॉल्यूम नमूनों के आधार पर, दो उद्योगों (दो सामान्य आबादी) से संबंधित उद्यमों में श्रम उत्पादकता और काम के मशीनीकरण के स्तर के बीच घनिष्ठ संबंध को दर्शाने वाले सहसंबंध गुणांक की गणना करें। (8.42) से हम पाते हैं

चूँकि हम शून्य परिकल्पना को अस्वीकार करते हैं। नतीजतन, यह तर्क दिया जा सकता है कि विभिन्न उद्योगों से संबंधित उद्यमों में श्रम उत्पादकता और काम के मशीनीकरण के स्तर के बीच संबंधों की निकटता में महत्वपूर्ण अंतर हैं। हम इस उदाहरण को धारा 8.7 में जारी रखेंगे, जहां हम दो आबादी के लिए निर्मित प्रतिगमन रेखाओं की तुलना करेंगे।

दिए गए उदाहरणों का विश्लेषण करते हुए, हम आश्वस्त हैं कि तुलना किए गए सहसंबंध गुणांक के केवल पूर्ण अंतर पर विचार किया जा रहा है

(दोनों मामलों में नमूना आकार समान हैं) इस अंतर के महत्व की जांच किए बिना गलत निष्कर्ष निकलेंगे। यह सहसंबंध गुणांकों की तुलना करते समय सांख्यिकीय मानदंडों का उपयोग करने की आवश्यकता की पुष्टि करता है।

दो सहसंबंध गुणांकों की तुलना करने की प्रक्रिया को सामान्यीकृत किया जा सकता है बड़ी संख्याउपरोक्त शर्तों के अधीन गुणांक। चरों के बीच सहसंबंध गुणांकों की समानता की परिकल्पना इस प्रकार व्यक्त की गई है: इसका परीक्षण आयतन के नमूनों से गणना किए गए सहसंबंध गुणांकों के आधार पर किया जाता है सामान्य आबादी. सहसंबंध गुणांकों को -मानों में पुनर्गणना किया जाता है: चूंकि में सामान्य मामलाअज्ञात, हम इसका अनुमान सूत्र के माध्यम से पाते हैं, जो (8.43) का सामान्यीकरण है।

पाठ्यक्रम कार्य

विषय: सहसंबंध विश्लेषण

परिचय

1. सहसंबंध विश्लेषण

1.1 सहसंबंध की अवधारणा

1.2 सहसंबंधों का सामान्य वर्गीकरण

1.3 सहसंबंध क्षेत्र और उनके निर्माण का उद्देश्य

1.4 चरण सहसंबंध विश्लेषण

1.5 सहसंबंध गुणांक

1.6 सामान्यीकृत ब्रवाइस-पियर्सन सहसंबंध गुणांक

1.7 गुणांक रैंक सहसंबंधभाला धारण करनेवाला सिपाही

1.8 सहसंबंध गुणांक के मूल गुण

1.9 सहसंबंध गुणांक के महत्व की जाँच करना

1.10 महत्वपूर्ण मूल्यजोड़ी सहसंबंध गुणांक

2. एक बहुक्रियात्मक प्रयोग की योजना बनाना

2.1 समस्या की स्थिति

2.2 योजना के केंद्र (मूल स्तर) और कारक भिन्नता के स्तर का निर्धारण

2.3 नियोजन मैट्रिक्स का निर्माण

2.4 विभिन्न श्रृंखलाओं में फैलाव की एकरूपता और माप की तुल्यता की जाँच करना

2.5 प्रतिगमन समीकरण गुणांक

2.6 प्रतिलिपि प्रस्तुत करने योग्यता विचरण

2.7 प्रतिगमन समीकरण गुणांकों के महत्व की जाँच करना

2.8 प्रतिगमन समीकरण की पर्याप्तता की जाँच करना

निष्कर्ष

संदर्भ

परिचय

प्रायोगिक योजना एक गणितीय और सांख्यिकीय अनुशासन है जो तर्कसंगत संगठन के तरीकों का अध्ययन करता है प्रायोगिक अनुसंधान- से इष्टतम विकल्पअध्ययन किए जा रहे कारकों और परिणामों के विश्लेषण के तरीकों के उद्देश्य के अनुसार वास्तविक प्रयोगात्मक योजना का निर्धारण करना। प्रायोगिक योजना अंग्रेजी सांख्यिकीविद् आर. फिशर (1935) के कार्यों से शुरू हुई, जिन्होंने इस बात पर जोर दिया कि तर्कसंगत प्रयोगात्मक योजना माप परिणामों के इष्टतम प्रसंस्करण की तुलना में अनुमानों की सटीकता में कोई कम महत्वपूर्ण लाभ प्रदान नहीं करती है। 20वीं सदी के 60 के दशक में था आधुनिक सिद्धांतप्रयोग की योजना बनाना. उनकी विधियाँ फ़ंक्शन सन्निकटन सिद्धांत और गणितीय प्रोग्रामिंग से निकटता से संबंधित हैं। इष्टतम योजनाओं का निर्माण किया गया और मॉडलों की एक विस्तृत श्रेणी के लिए उनकी संपत्तियों का अध्ययन किया गया।

प्रायोगिक योजना - एक प्रयोगात्मक योजना का चयन जो निर्दिष्ट आवश्यकताओं को पूरा करती है, एक प्रयोग रणनीति विकसित करने के उद्देश्य से कार्यों का एक सेट (प्राथमिक जानकारी प्राप्त करने से लेकर एक व्यावहारिक गणितीय मॉडल प्राप्त करने या निर्धारित करने तक) इष्टतम स्थितियाँ). यह एक प्रयोग का उद्देश्यपूर्ण नियंत्रण है, जिसे अध्ययन की जा रही घटना के तंत्र के अधूरे ज्ञान की शर्तों के तहत कार्यान्वित किया जाता है।

माप की प्रक्रिया में, बाद में डेटा प्रोसेसिंग के साथ-साथ गणितीय मॉडल के रूप में परिणामों की औपचारिकता, त्रुटियां उत्पन्न होती हैं और मूल डेटा में निहित कुछ जानकारी खो जाती है। प्रयोगात्मक नियोजन विधियों का उपयोग गणितीय मॉडल की त्रुटि निर्धारित करना और इसकी पर्याप्तता का न्याय करना संभव बनाता है। यदि मॉडल की सटीकता अपर्याप्त हो जाती है, तो प्रयोगात्मक योजना विधियों का उपयोग आधुनिकीकरण करना संभव बनाता है गणितीय मॉडलपिछली जानकारी को खोए बिना और न्यूनतम लागत पर अतिरिक्त प्रयोगों के साथ।

किसी प्रयोग की योजना बनाने का उद्देश्य प्रयोगों के संचालन के लिए ऐसी स्थितियाँ और नियम खोजना है जिसके तहत कम से कम श्रम में किसी वस्तु के बारे में विश्वसनीय और भरोसेमंद जानकारी प्राप्त करना संभव हो, साथ ही इस जानकारी को एक संक्षिप्त और सुविधाजनक रूप में प्रस्तुत करना संभव हो। सटीकता के मात्रात्मक मूल्यांकन के साथ।

अध्ययन के विभिन्न चरणों में उपयोग की जाने वाली मुख्य नियोजन विधियाँ हैं:

एक स्क्रीनिंग प्रयोग की योजना बनाना, जिसका मुख्य अर्थ कारकों के पूरे सेट से महत्वपूर्ण कारकों के समूह का चयन करना है जो आगे विस्तृत अध्ययन के अधीन हैं;

के लिए एक प्रयोग की योजना बना रहे हैं विचरण का विश्लेषण, यानी गुणात्मक कारकों के साथ वस्तुओं के लिए योजनाएँ बनाना;

एक प्रतिगमन प्रयोग की योजना बनाना जो आपको प्रतिगमन मॉडल (बहुपद और अन्य) प्राप्त करने की अनुमति देता है;

एक चरम प्रयोग की योजना बनाना जिसमें मुख्य कार्य अनुसंधान वस्तु का प्रयोगात्मक अनुकूलन है;

गतिशील प्रक्रियाओं आदि का अध्ययन करते समय योजना बनाना।

अनुशासन का अध्ययन करने का उद्देश्य योजना सिद्धांत और आधुनिक सूचना प्रौद्योगिकियों के तरीकों का उपयोग करके छात्रों को उनकी विशेषता में उत्पादन और तकनीकी गतिविधियों के लिए तैयार करना है।

अनुशासन के उद्देश्य: अध्ययन आधुनिक तरीकेवैज्ञानिक और औद्योगिक प्रयोगों की योजना बनाना, व्यवस्थित करना और उनका अनुकूलन करना, प्रयोगों का संचालन करना और प्राप्त परिणामों को संसाधित करना।

1. सहसंबंध विश्लेषण

1.1 सहसंबंध की अवधारणा

एक शोधकर्ता को अक्सर इस बात में दिलचस्पी होती है कि अध्ययन किए जा रहे एक या अधिक नमूनों में दो या दो से अधिक चर एक-दूसरे से कैसे संबंधित हैं। उदाहरण के लिए, क्या ऊंचाई किसी व्यक्ति के वजन को प्रभावित कर सकती है, या रक्तचाप उत्पाद की गुणवत्ता को प्रभावित कर सकता है?

चरों के बीच इस प्रकार की निर्भरता को सहसंबंध, या सहसंबंध कहा जाता है। सहसंबंध दो विशेषताओं में लगातार परिवर्तन है, जो इस तथ्य को दर्शाता है कि एक विशेषता की परिवर्तनशीलता दूसरे की परिवर्तनशीलता के अनुरूप है।

उदाहरण के लिए, यह ज्ञात है कि औसतन लोगों की ऊंचाई और उनके वजन के बीच एक सकारात्मक संबंध होता है, और ऊंचाई जितनी अधिक होगी, व्यक्ति का वजन उतना ही अधिक होगा। हालाँकि, अपेक्षाकृत होने पर इस नियम के अपवाद भी हैं छोटे लोगपास होना अधिक वजन, और, इसके विपरीत, उच्च वृद्धि वाले एस्थेनिक्स का वजन कम होता है। ऐसे अपवादों का कारण यह है कि प्रत्येक जैविक, शारीरिक या मनोवैज्ञानिक संकेतकई कारकों के प्रभाव से निर्धारित होता है: पर्यावरणीय, आनुवंशिक, सामाजिक, पर्यावरणीय, आदि।

सहसंबंध कनेक्शन संभाव्य परिवर्तन हैं जिनका अध्ययन केवल विधियों का उपयोग करके प्रतिनिधि नमूनों पर किया जा सकता है गणितीय सांख्यिकी. दोनों शब्द - सहसंबंध लिंक और सहसंबंध निर्भरता - अक्सर एक दूसरे के स्थान पर उपयोग किए जाते हैं। निर्भरता का तात्पर्य प्रभाव, संबंध - कोई भी समन्वित परिवर्तन है जिसे सैकड़ों कारणों से समझाया जा सकता है। सहसंबंधों को कारण-और-प्रभाव संबंध के प्रमाण के रूप में नहीं माना जा सकता है; वे केवल यह संकेत देते हैं कि एक विशेषता में परिवर्तन आमतौर पर दूसरे में कुछ परिवर्तनों के साथ होते हैं।

सहसंबंध निर्भरता - ये वे परिवर्तन हैं जो एक विशेषता के मूल्यों को घटित होने की संभावना में पेश करते हैं विभिन्न अर्थएक और संकेत.

सहसंबंध विश्लेषण का कार्य अलग-अलग विशेषताओं के बीच संबंध की दिशा (सकारात्मक या नकारात्मक) और रूप (रैखिक, गैर-रैखिक) स्थापित करना, इसकी मजबूती को मापना और अंत में, प्राप्त सहसंबंध गुणांक के महत्व के स्तर की जांच करना है।

सहसंबंध कनेक्शन रूप, दिशा और डिग्री (शक्ति) में भिन्न होते हैं .

सहसंबंध संबंध का रूप रैखिक या वक्ररेखीय हो सकता है। उदाहरण के लिए, सिम्युलेटर पर प्रशिक्षण सत्रों की संख्या और नियंत्रण सत्र में सही ढंग से हल की गई समस्याओं की संख्या के बीच संबंध सीधा हो सकता है। उदाहरण के लिए, प्रेरणा के स्तर और किसी कार्य की प्रभावशीलता के बीच संबंध वक्ररेखीय हो सकता है (चित्र 1)। जैसे-जैसे प्रेरणा बढ़ती है, पहले किसी कार्य को पूरा करने की प्रभावशीलता बढ़ती है, फिर प्रेरणा का इष्टतम स्तर प्राप्त होता है, जो कार्य को पूरा करने की अधिकतम प्रभावशीलता से मेल खाता है; प्रेरणा में और वृद्धि के साथ-साथ दक्षता में कमी आती है।

चित्र 1 - समस्या समाधान की प्रभावशीलता और प्रेरक प्रवृत्तियों की ताकत के बीच संबंध

दिशा में, सहसंबंध संबंध सकारात्मक ("प्रत्यक्ष") और नकारात्मक ("उलटा") हो सकता है। एक सकारात्मक रैखिक सहसंबंध के साथ, एक विशेषता के उच्च मान दूसरे के उच्च मूल्यों के अनुरूप होते हैं, और एक विशेषता के निम्न मान के अनुरूप होते हैं कम मूल्यदूसरा (चित्र 2)। नकारात्मक सहसंबंध के साथ, संबंध व्युत्क्रम होते हैं (चित्र 3)। एक सकारात्मक सहसंबंध के साथ, सहसंबंध गुणांक है सकारात्मक संकेत, एक नकारात्मक सहसंबंध के साथ - एक नकारात्मक संकेत।

चित्र 2 - सीधा सहसंबंध

चित्र 3 - व्युत्क्रम सहसंबंध


चित्र 4 - कोई सहसंबंध नहीं

सहसंबंध की डिग्री, शक्ति या निकटता सहसंबंध गुणांक के मूल्य से निर्धारित होती है। कनेक्शन की ताकत उसकी दिशा पर निर्भर नहीं करती है और सहसंबंध गुणांक के पूर्ण मूल्य से निर्धारित होती है।

1.2 सहसंबंधों का सामान्य वर्गीकरण

सहसंबंध गुणांक के आधार पर, निम्नलिखित सहसंबंध प्रतिष्ठित हैं:

मजबूत, या सहसंबंध गुणांक r>0.70 के साथ बंद;

औसत (0.50 पर)

मध्यम (0.30 बजे)

कमजोर (0.20 पर)

बहुत कमजोर (आर पर)<0,19).

1.3 सहसंबंध क्षेत्र और उनके निर्माण का उद्देश्य

सहसंबंध का अध्ययन प्रयोगात्मक डेटा के आधार पर किया जाता है, जो दो विशेषताओं के मापा मान (x i, y i) हैं। यदि थोड़ा प्रयोगात्मक डेटा है, तो द्वि-आयामी अनुभवजन्य वितरण को x i और y i मानों की दोहरी श्रृंखला के रूप में दर्शाया जाता है। साथ ही, विशेषताओं के बीच सहसंबंध निर्भरता को विभिन्न तरीकों से वर्णित किया जा सकता है। किसी तर्क और फ़ंक्शन के बीच पत्राचार एक तालिका, सूत्र, ग्राफ़ आदि द्वारा दिया जा सकता है।

सहसंबंध विश्लेषण, अन्य सांख्यिकीय तरीकों की तरह, संभाव्य मॉडल के उपयोग पर आधारित है जो एक निश्चित सामान्य आबादी में अध्ययन के तहत विशेषताओं के व्यवहार का वर्णन करता है जिससे प्रयोगात्मक मान xi और y i प्राप्त होते हैं। मात्रात्मक विशेषताओं के बीच सहसंबंध का अध्ययन करते समय, जिसके मूल्यों को मीट्रिक पैमाने (मीटर, सेकंड, किलोग्राम, आदि) की इकाइयों में सटीक रूप से मापा जा सकता है, एक द्वि-आयामी सामान्य रूप से वितरित जनसंख्या मॉडल अक्सर अपनाया जाता है। ऐसा मॉडल आयताकार निर्देशांक की प्रणाली में बिंदुओं के ज्यामितीय स्थान के रूप में चर x i और y i के बीच संबंध को ग्राफिक रूप से प्रदर्शित करता है। इस आलेखीय संबंध को स्कैटरप्लॉट या सहसंबंध क्षेत्र भी कहा जाता है।
द्वि-आयामी सामान्य वितरण (सहसंबंध क्षेत्र) का यह मॉडल हमें सहसंबंध गुणांक की स्पष्ट चित्रमय व्याख्या देने की अनुमति देता है, क्योंकि कुल मिलाकर वितरण पाँच मापदंडों पर निर्भर करता है: μ x, μ y - औसत मान (गणितीय अपेक्षाएँ); σ x ,σ y - यादृच्छिक चर X और Y के मानक विचलन और p - सहसंबंध गुणांक, जो यादृच्छिक चर X और Y के बीच संबंध का एक माप है।
यदि p = 0, तो द्वि-आयामी सामान्य जनसंख्या से प्राप्त मान x i , y i वृत्त द्वारा सीमित क्षेत्र के भीतर निर्देशांक x, y में ग्राफ़ पर स्थित होते हैं (चित्र 5, a)। इस मामले में, यादृच्छिक चर X और Y के बीच कोई सहसंबंध नहीं है और उन्हें असंबद्ध कहा जाता है। द्वि-आयामी सामान्य वितरण के लिए, असंबद्धता का अर्थ एक साथ यादृच्छिक चर X और Y की स्वतंत्रता है।

वैज्ञानिक अनुसंधान में, अक्सर परिणाम और कारक चर (फसल की उपज और वर्षा की मात्रा, लिंग और उम्र के अनुसार सजातीय समूहों में एक व्यक्ति की ऊंचाई और वजन, हृदय गति और शरीर का तापमान) के बीच संबंध खोजने की आवश्यकता होती है। , वगैरह।)।

दूसरे वे संकेत हैं जो उनसे जुड़े लोगों (पहले) में बदलाव में योगदान करते हैं।

सहसंबंध विश्लेषण की अवधारणा

उपरोक्त के आधार पर, हम कह सकते हैं कि सहसंबंध विश्लेषण एक ऐसी विधि है जिसका उपयोग दो या दो से अधिक चर के सांख्यिकीय महत्व के बारे में परिकल्पना का परीक्षण करने के लिए किया जाता है यदि शोधकर्ता उन्हें माप सकता है, लेकिन उन्हें बदल नहीं सकता है।

विचाराधीन अवधारणा की अन्य परिभाषाएँ भी हैं। सहसंबंध विश्लेषण एक प्रसंस्करण विधि है जिसमें चर के बीच सहसंबंध गुणांक का अध्ययन करना शामिल है। इस मामले में, एक जोड़ी या विशेषताओं के कई जोड़े के बीच सहसंबंध गुणांक की तुलना उनके बीच सांख्यिकीय संबंध स्थापित करने के लिए की जाती है। सहसंबंध विश्लेषण एक सख्त कार्यात्मक प्रकृति की वैकल्पिक उपस्थिति के साथ यादृच्छिक चर के बीच सांख्यिकीय निर्भरता का अध्ययन करने की एक विधि है, जिसमें एक यादृच्छिक चर की गतिशीलता दूसरे की गणितीय अपेक्षा की गतिशीलता की ओर ले जाती है।

गलत सहसंबंध की अवधारणा

सहसंबंध विश्लेषण करते समय, यह ध्यान रखना आवश्यक है कि इसे विशेषताओं के किसी भी सेट के संबंध में किया जा सकता है, जो अक्सर एक दूसरे के संबंध में बेतुका होता है। कभी-कभी उनका एक-दूसरे के साथ कोई कारणात्मक संबंध नहीं होता है।

इस मामले में, वे गलत सहसंबंध के बारे में बात करते हैं।

सहसंबंध विश्लेषण की समस्याएं

उपरोक्त परिभाषाओं के आधार पर, वर्णित विधि के निम्नलिखित कार्य तैयार किए जा सकते हैं: दूसरे का उपयोग करके मांगे गए चर में से एक के बारे में जानकारी प्राप्त करना; अध्ययन किए गए चरों के बीच संबंध की निकटता निर्धारित करें।

सहसंबंध विश्लेषण में अध्ययन की जा रही विशेषताओं के बीच संबंध निर्धारित करना शामिल है, और इसलिए सहसंबंध विश्लेषण के कार्यों को निम्नलिखित के साथ पूरक किया जा सकता है:

  • उन कारकों की पहचान जिनका परिणामी विशेषता पर सबसे अधिक प्रभाव पड़ता है;
  • कनेक्शन के पहले से अज्ञात कारणों की पहचान;
  • इसके पैरामीट्रिक विश्लेषण के साथ सहसंबंध मॉडल का निर्माण;
  • संचार मापदंडों के महत्व और उनके अंतराल मूल्यांकन का अध्ययन।

सहसंबंध विश्लेषण और प्रतिगमन के बीच संबंध

सहसंबंध विश्लेषण की विधि अक्सर अध्ययन की गई मात्राओं के बीच संबंध की निकटता का पता लगाने तक सीमित नहीं है। कभी-कभी इसे प्रतिगमन समीकरणों के संकलन द्वारा पूरक किया जाता है, जो एक ही नाम के विश्लेषण का उपयोग करके प्राप्त किए जाते हैं, और जो परिणामी और कारक (कारक) सुविधाओं के बीच सहसंबंध निर्भरता का विवरण दर्शाते हैं। यह विधि, विचाराधीन विश्लेषण के साथ मिलकर, विधि का निर्माण करती है

विधि का उपयोग करने की शर्तें

प्रभावी कारक एक से कई कारकों पर निर्भर करते हैं। यदि प्रभावी और कारक संकेतकों (कारकों) के मूल्य के बारे में बड़ी संख्या में अवलोकन हैं, तो सहसंबंध विश्लेषण की विधि का उपयोग किया जा सकता है, जबकि अध्ययन के तहत कारक मात्रात्मक होने चाहिए और विशिष्ट स्रोतों में परिलक्षित होने चाहिए। पहले को सामान्य कानून द्वारा निर्धारित किया जा सकता है - इस मामले में, सहसंबंध विश्लेषण का परिणाम पियर्सन सहसंबंध गुणांक है, या, यदि विशेषताएँ इस कानून का पालन नहीं करती हैं, तो स्पीयरमैन रैंक सहसंबंध गुणांक का उपयोग किया जाता है।

सहसंबंध विश्लेषण कारकों के चयन के नियम

इस पद्धति को लागू करते समय, प्रदर्शन संकेतकों को प्रभावित करने वाले कारकों को निर्धारित करना आवश्यक है। उनका चयन इस तथ्य को ध्यान में रखते हुए किया जाता है कि संकेतकों के बीच कारण-और-प्रभाव संबंध होना चाहिए। एक मल्टीफैक्टर सहसंबंध मॉडल बनाने के मामले में, परिणामी संकेतक पर महत्वपूर्ण प्रभाव डालने वाले लोगों का चयन किया जाता है, जबकि सहसंबंध मॉडल में 0.85 से अधिक के युग्म सहसंबंध गुणांक वाले अन्योन्याश्रित कारकों को शामिल नहीं करना बेहतर होता है, साथ ही वे भी जिसके लिए परिणामी पैरामीटर के साथ संबंध रैखिक या कार्यात्मक चरित्र नहीं है।

परिणाम प्रदर्शित हो रहे हैं

सहसंबंध विश्लेषण के परिणाम पाठ और ग्राफिक रूपों में प्रस्तुत किए जा सकते हैं। पहले मामले में, उन्हें सहसंबंध गुणांक के रूप में प्रस्तुत किया जाता है, दूसरे में - एक बिखराव आरेख के रूप में।

मापदंडों के बीच सहसंबंध की अनुपस्थिति में, आरेख पर बिंदु अव्यवस्थित रूप से स्थित होते हैं, कनेक्शन की औसत डिग्री को क्रम की एक बड़ी डिग्री की विशेषता होती है और मध्यिका से चिह्नित निशानों की अधिक या कम समान दूरी की विशेषता होती है। एक मजबूत कनेक्शन सीधा होता है और r=1 पर डॉट प्लॉट एक सपाट रेखा होती है। विपरीत सहसंबंध ग्राफ़ की दिशा में ऊपरी बाएँ से निचले दाएँ तक भिन्न होता है, जबकि सीधा सहसंबंध - निचले बाएँ से ऊपरी दाएँ कोने तक होता है।

स्कैटर प्लॉट का 3डी प्रतिनिधित्व

पारंपरिक 2डी स्कैटर प्लॉट डिस्प्ले के अलावा, सहसंबंध विश्लेषण का 3डी ग्राफिकल प्रतिनिधित्व अब उपयोग किया जाता है।

स्कैटरप्लॉट मैट्रिक्स का भी उपयोग किया जाता है, जो सभी युग्मित प्लॉट्स को मैट्रिक्स प्रारूप में एक ही आकृति में प्रदर्शित करता है। n वेरिएबल्स के लिए, मैट्रिक्स में n पंक्तियाँ और n कॉलम होते हैं। आई-वें पंक्ति और जे-वें कॉलम के चौराहे पर स्थित चार्ट वेरिएबल Xi बनाम Xj का एक प्लॉट है। इस प्रकार, प्रत्येक पंक्ति और स्तंभ एक आयाम है, एक एकल कक्ष दो आयामों का स्कैटरप्लॉट प्रदर्शित करता है।

कनेक्शन की मजबूती का आकलन करना

सहसंबंध कनेक्शन की निकटता सहसंबंध गुणांक (आर) द्वारा निर्धारित की जाती है: मजबूत - आर = ±0.7 से ±1, मध्यम - आर = ±0.3 से ±0.699, कमजोर - आर = 0 से ±0.299। यह वर्गीकरण सख्त नहीं है. यह आंकड़ा थोड़ा अलग आरेख दिखाता है।

सहसंबंध विश्लेषण पद्धति का उपयोग करने का एक उदाहरण

ब्रिटेन में एक दिलचस्प अध्ययन किया गया। यह धूम्रपान और फेफड़ों के कैंसर के बीच संबंध के लिए समर्पित है, और सहसंबंध विश्लेषण के माध्यम से किया गया था। यह अवलोकन नीचे प्रस्तुत किया गया है।

सहसंबंध विश्लेषण के लिए प्रारंभिक डेटा

व्यावसायिक समूह

मृत्यु दर

किसान, वनवासी और मछुआरे

खनिक और खदान श्रमिक

गैस, कोक और रसायन के निर्माता

कांच और चीनी मिट्टी के निर्माता

भट्टियों, फोर्ज, फाउंड्री और रोलिंग मिलों के श्रमिक

इलेक्ट्रिकल और इलेक्ट्रॉनिक्स कर्मचारी

इंजीनियरिंग और संबंधित व्यवसाय

लकड़ी उद्योग

चर्मकार

कपड़ा श्रमिक

काम के कपड़े के निर्माता

भोजन, पेय और तंबाकू उद्योगों में श्रमिक

कागज और प्रिंट निर्माता

अन्य उत्पादों के निर्माता

बिल्डर्स

चित्रकार और सज्जाकार

स्थिर इंजन, क्रेन आदि के चालक।

ऐसे श्रमिक जो अन्यत्र शामिल नहीं हैं

परिवहन और संचार कर्मचारी

गोदाम कर्मचारी, स्टोरकीपर, पैकर्स और भरने वाली मशीन श्रमिक

कार्यालयीन कर्मचारी

सेलर्स

खेल और मनोरंजन कार्यकर्ता

प्रशासक और प्रबंधक

पेशेवर, तकनीशियन और कलाकार

हम सहसंबंध विश्लेषण शुरू करते हैं। स्पष्टता के लिए, समाधान को ग्राफिकल विधि से शुरू करना बेहतर है, जिसके लिए हम एक स्कैटर आरेख का निर्माण करेंगे।

यह सीधा संबंध दर्शाता है. हालाँकि, अकेले ग्राफिकल विधि के आधार पर कोई स्पष्ट निष्कर्ष निकालना मुश्किल है। इसलिए, हम सहसंबंध विश्लेषण करना जारी रखेंगे। सहसंबंध गुणांक की गणना का एक उदाहरण नीचे प्रस्तुत किया गया है।

सॉफ़्टवेयर का उपयोग करना (एमएस एक्सेल को एक उदाहरण के रूप में नीचे वर्णित किया जाएगा), हम सहसंबंध गुणांक निर्धारित करते हैं, जो 0.716 है, जिसका अर्थ है अध्ययन के तहत मापदंडों के बीच एक मजबूत संबंध। आइए संबंधित तालिका का उपयोग करके प्राप्त मूल्य की सांख्यिकीय विश्वसनीयता निर्धारित करें, जिसके लिए हमें 25 जोड़े मानों में से 2 घटाने की आवश्यकता है, परिणामस्वरूप हमें 23 मिलता है और तालिका में इस पंक्ति का उपयोग करके हम r को p = 0.01 के लिए महत्वपूर्ण पाते हैं (चूंकि ये चिकित्सा डेटा हैं, एक अधिक सख्त निर्भरता, अन्य मामलों में पी=0.05 पर्याप्त है), जो इस सहसंबंध विश्लेषण के लिए 0.51 है। उदाहरण से पता चला कि परिकलित r महत्वपूर्ण r से अधिक है, और सहसंबंध गुणांक का मान सांख्यिकीय रूप से विश्वसनीय माना जाता है।

सहसंबंध विश्लेषण करते समय सॉफ़्टवेयर का उपयोग करना

वर्णित प्रकार की सांख्यिकीय डेटा प्रोसेसिंग सॉफ़्टवेयर, विशेष रूप से एमएस एक्सेल का उपयोग करके की जा सकती है। सहसंबंध में फ़ंक्शंस का उपयोग करके निम्नलिखित मापदंडों की गणना करना शामिल है:

1. सहसंबंध गुणांक CORREL फ़ंक्शन (array1; array2) का उपयोग करके निर्धारित किया जाता है। Array1,2 - परिणामी और कारक चर के मूल्यों के अंतराल का सेल।

रैखिक सहसंबंध गुणांक को पियर्सन सहसंबंध गुणांक भी कहा जाता है, और इसलिए, एक्सेल 2007 से शुरू करके, आप समान सरणियों के साथ फ़ंक्शन का उपयोग कर सकते हैं।

एक्सेल में सहसंबंध विश्लेषण का ग्राफिकल प्रदर्शन "स्कैटर प्लॉट" चयन के साथ "चार्ट" पैनल का उपयोग करके किया जाता है।

प्रारंभिक डेटा निर्दिष्ट करने के बाद, हमें एक ग्राफ़ मिलता है।

2. छात्र के टी-टेस्ट का उपयोग करके जोड़ीवार सहसंबंध गुणांक के महत्व का आकलन करना। टी-टेस्ट के परिकलित मूल्य की तुलना इस सूचक के सारणीबद्ध (महत्वपूर्ण) मूल्य के साथ विचाराधीन पैरामीटर के मूल्यों की संबंधित तालिका से की जाती है, जो महत्व के निर्दिष्ट स्तर और स्वतंत्रता की डिग्री की संख्या को ध्यान में रखता है। यह अनुमान STUDISCOVER (प्रायिकता; डिग्री_ऑफ़_फ्रीडम) फ़ंक्शन का उपयोग करके किया जाता है।

3. युग्म सहसंबंध गुणांक का मैट्रिक्स। विश्लेषण डेटा विश्लेषण उपकरण का उपयोग करके किया जाता है, जिसमें सहसंबंध का चयन किया जाता है। जोड़ी सहसंबंध गुणांक का सांख्यिकीय मूल्यांकन सारणीबद्ध (महत्वपूर्ण) मूल्य के साथ इसके पूर्ण मूल्य की तुलना करके किया जाता है। जब गणना की गई जोड़ीदार सहसंबंध गुणांक महत्वपूर्ण एक से अधिक हो जाती है, तो हम संभाव्यता की दी गई डिग्री को ध्यान में रखते हुए कह सकते हैं कि रैखिक संबंध के महत्व के बारे में शून्य परिकल्पना को अस्वीकार नहीं किया गया है।

निष्कर्ष के तौर पर

वैज्ञानिक अनुसंधान में सहसंबंध विश्लेषण पद्धति का उपयोग हमें विभिन्न कारकों और प्रदर्शन संकेतकों के बीच संबंध निर्धारित करने की अनुमति देता है। यह ध्यान में रखना आवश्यक है कि एक उच्च सहसंबंध गुणांक एक बेतुके जोड़े या डेटा के सेट से प्राप्त किया जा सकता है, और इसलिए इस प्रकार का विश्लेषण डेटा के पर्याप्त बड़े सरणी पर किया जाना चाहिए।

आर का परिकलित मूल्य प्राप्त करने के बाद, एक निश्चित मूल्य की सांख्यिकीय विश्वसनीयता की पुष्टि करने के लिए इसकी तुलना महत्वपूर्ण आर से करने की सलाह दी जाती है। सहसंबंध विश्लेषण मैन्युअल रूप से सूत्रों का उपयोग करके, या सॉफ़्टवेयर का उपयोग करके, विशेष रूप से एमएस एक्सेल में किया जा सकता है। यहां आप सहसंबंध विश्लेषण के अध्ययन किए गए कारकों और परिणामी विशेषता के बीच संबंधों को दृश्य रूप से दर्शाने के उद्देश्य से एक स्कैटर आरेख भी बना सकते हैं।



साइट पर नया

>

सबसे लोकप्रिय