घर मुँह से बदबू आना एकाधिक सहसंबंध गुणांक और एकाधिक निर्धारण गुणांक। एकाधिक रैखिक सहसंबंध

एकाधिक सहसंबंध गुणांक और एकाधिक निर्धारण गुणांक। एकाधिक रैखिक सहसंबंध

आइए पहले उन प्रत्येक प्रश्न का उत्तर खोजने का प्रयास करें जिन्हें हमने उस स्थिति में पहचाना है जहां हमारे कारण मॉडल में केवल शामिल हैं दो स्वतंत्र चर.

एकाधिक सहसंबंध आर और निर्धारण का गुणांक आर2

आश्रित चर के साथ सभी स्वतंत्र चर के समग्र संबंध का अनुमान लगाने के लिए, उपयोग करें एकाधिक गुणांकआर सहसंबंध. एकाधिक सहसंबंध गुणांक के बीच अंतर आर द्विचर सहसंबंध गुणांक से जी यह कि यह केवल सकारात्मक हो सकता है। दो स्वतंत्र चरों के लिए इसका अनुमान इस प्रकार लगाया जा सकता है:

एकाधिक सहसंबंध गुणांक को समीकरण (9.1) बनाने वाले आंशिक प्रतिगमन गुणांक का अनुमान लगाकर भी निर्धारित किया जा सकता है। दो चरों के लिए, यह समीकरण स्पष्ट रूप से निम्नलिखित रूप लेगा:

(9.2)

यदि हमारे स्वतंत्र चर मानक इकाइयों में परिवर्तित हो जाते हैं सामान्य वितरण, या Z-वितरण, समीकरण (9.2) स्पष्ट रूप से निम्नलिखित रूप लेगा:

(9.3)

समीकरण (9.3) में, गुणांक β प्रतिगमन गुणांक के मानकीकृत मूल्य को दर्शाता है में।

मानकीकृत प्रतिगमन गुणांक की गणना स्वयं निम्नलिखित सूत्रों का उपयोग करके की जा सकती है:

अब एकाधिक सहसंबंध गुणांक की गणना का सूत्र इस तरह दिखेगा:

सहसंबंध गुणांक का अनुमान लगाने का दूसरा तरीका आर द्विचर सहसंबंध गुणांक की गणना है आर आश्रित चर Y के मानों और समीकरण के आधार पर परिकलित संगत मानों के बीच रेखीय प्रतिगमन(9.2). दूसरे शब्दों में, मूल्य आर इसका मूल्यांकन इस प्रकार किया जा सकता है:

इस गुणांक के साथ, हम अनुमान लगा सकते हैं, जैसा कि साधारण प्रतिगमन के मामले में, मूल्य आर 2, जिसे आमतौर पर इस रूप में भी दर्शाया जाता है निर्धारण का गुणांक। जिस प्रकार दो चरों के बीच संबंध का आकलन करने की स्थिति में निर्धारण का गुणांक निर्धारित किया जाता है आर 2 दर्शाता है कि आश्रित चर का विचरण कितना प्रतिशत है वाई , अर्थात। , सभी स्वतंत्र चर के फैलाव से संबंधित हो जाता है - . दूसरे शब्दों में, निर्धारण गुणांक का आकलन निम्नानुसार किया जा सकता है:

हम आश्रित चर में अवशिष्ट विचरण के प्रतिशत का भी अनुमान लगा सकते हैं जो किसी भी स्वतंत्र चर से जुड़ा नहीं है 1 - आर 2. वर्गमूलइस मान से, यानी मात्रा, जैसे कि द्विचर सहसंबंध के मामले में, कहलाती है अलगाव गुणांक.

सहसंबंध भाग

निर्धारण का गुणांक आर चित्र 2 दिखाता है कि आश्रित चर में कितने प्रतिशत भिन्नता को कारण मॉडल में शामिल सभी स्वतंत्र चर में भिन्नता के लिए जिम्मेदार ठहराया जा सकता है। यह गुणांक जितना बड़ा होगा, हमारे द्वारा सामने रखा गया कारण मॉडल उतना ही अधिक महत्वपूर्ण होगा। यदि यह गुणांक बहुत बड़ा नहीं होता है, तो जिन चरों का हम अध्ययन कर रहे हैं उनका आश्रित चर के कुल विचरण में योगदान भी नगण्य हो जाता है। हालाँकि, व्यवहार में, न केवल सभी चरों के कुल योगदान का अनुमान लगाना आवश्यक है, बल्कि हम जिन स्वतंत्र चरों पर विचार कर रहे हैं उनमें से प्रत्येक के व्यक्तिगत योगदान का भी अनुमान लगाना आवश्यक है। इस तरह के योगदान को इस प्रकार परिभाषित किया जा सकता है सहसंबंध भाग.

जैसा कि हम जानते हैं, द्विचर सहसंबंध के मामले में, स्वतंत्र चर में भिन्नता के साथ जुड़े आश्रित चर में भिन्नता का प्रतिशत इस प्रकार दर्शाया जा सकता है आर 2. हालाँकि, कई स्वतंत्र चर के प्रभावों का अध्ययन करने के मामले में इस भिन्नता का एक हिस्सा एक साथ स्वतंत्र चर के भिन्नता के कारण होता है, जिसे हम नियंत्रण के रूप में उपयोग करते हैं। ये रिश्ते चित्र में स्पष्ट रूप से दिखाए गए हैं। 9.1.

चावल। 9.1. आश्रित के प्रसरण का अनुपात (वाई ) और दो स्वतंत्र (एक्स 1औरएक्स 2) में चर सहसंबंध विश्लेषणदो स्वतंत्र चर के साथ

जैसा कि चित्र में दिखाया गया है। 9.1, सभी भिन्नताएँ वाई , हमारे दो स्वतंत्र चरों से संबद्ध, लेबल वाले तीन भाग होते हैं ए, बी और साथ। पार्ट्स और बी प्रसरण वाई दो स्वतंत्र चरों के प्रसरणों से अलग-अलग संबंधित हैं - एक्स 1 और एक्स 2. एक ही समय में, भाग c का फैलाव आश्रित चर Y के फैलाव और हमारे दो चर के फैलाव दोनों को एक साथ जोड़ता है एक्स। इसलिए, चर के संबंध का मूल्यांकन करने के लिए एक्स 1 चर के साथ हाँ, जो चर के प्रभाव के कारण नहीं है एक्स 2 प्रति चर वाई , मात्रा से आवश्यक आर" 2 वर्गांकित सहसंबंध का मान घटाएँ वाई साथ एक्स 2:

(9.6)

इसी प्रकार, हम सहसंबंध Y के भाग का अनुमान लगा सकते हैं एक्स 2, जो इसके सहसंबंध के कारण नहीं है एक्स 1.

(9.7)

परिमाण एसआर समीकरण (9.6) और (9.7) में वह है जिसकी हम तलाश कर रहे हैं सहसंबंध भाग.

किसी भाग के सहसंबंध को सामान्य द्विचर सहसंबंध के संदर्भ में भी परिभाषित किया जा सकता है:

दूसरे तरीके से, आंशिक सहसंबंध को अर्ध-आंशिक सहसंबंध कहा जाता है। इस नाम का अर्थ है कि सहसंबंध की गणना करते समय, दूसरे स्वतंत्र चर का प्रभाव पहले स्वतंत्र चर के मूल्यों के संबंध में समाप्त हो जाता है, लेकिन आश्रित चर के संबंध में समाप्त नहीं होता है। प्रभाव एक्स 1 को मानों का उपयोग करके समायोजित किया जाता है एक्स 2, इसलिए सहसंबंध गुणांक की गणना नहीं की जाती है वाई और एक्स 1 और बीच में वाई और, और मूल्यों की गणना मूल्यों के आधार पर की जाती है एक्स 2 जैसा कि सरल रैखिक प्रतिगमन पर अध्याय में चर्चा की गई है (उपधारा 7.4.2 देखें)। इस प्रकार, निम्नलिखित संबंध वैध साबित होता है:

स्वतंत्र चर और आश्रित चर दोनों पर अन्य स्वतंत्र चर के प्रभाव की अनुपस्थिति में आश्रित चर के साथ एक स्वतंत्र चर के सहसंबंध का मूल्यांकन करने के लिए, प्रतिगमन विश्लेषण में आंशिक सहसंबंध की अवधारणा का उपयोग किया जाता है।

आंशिक सहसंबंध

निजी, या आंशिक, सह - संबंध गणितीय आँकड़ों में किसी दिए गए स्वतंत्र चर के विचरण से जुड़े आश्रित चर के विचरण के अनुपात के माध्यम से, इस आश्रित चर के संपूर्ण विचरण के संबंध में निर्धारित किया जाता है, इसके उस भाग की गणना नहीं की जाती है जो अन्य के विचरण से जुड़ा होता है। स्वतंत्र प्रभावित करने वाली वस्तुएँ। औपचारिक रूप से, दो स्वतंत्र चर के मामले में, इसे इस प्रकार व्यक्त किया जा सकता है:

आंशिक सहसंबंध स्वयं को महत्व देता है जनसंपर्क द्विचर सहसंबंध मूल्यों के आधार पर पाया जा सकता है:

इस प्रकार आंशिक सहसंबंध को आश्रित और स्वतंत्र चर दोनों के समायोजित मूल्यों के बीच सामान्य द्विचर सहसंबंध के रूप में परिभाषित किया जा सकता है। सुधार स्वयं स्वतंत्र चर के मूल्यों के अनुसार किया जाता है, जो नियंत्रण चर के रूप में कार्य करता है। दूसरे शब्दों में, आश्रित चर के बीच आंशिक सहसंबंध वाई और स्वतंत्र चर एक्स मुझे दूसरे स्वतंत्र चर के मूल्यों के आधार पर मूल्यों और पूर्वानुमानों के बीच सामान्य सहसंबंध के रूप में परिभाषित किया जा सकता है एक्स 2.

एकाधिक सहसंबंध गुणांकपरिणामी संकेतक (आश्रित चर) के बीच सांख्यिकीय संबंध की निकटता की डिग्री के माप के रूप में उपयोग किया जाता है और व्याख्यात्मक (स्वतंत्र) चर का एक सेट या, दूसरे शब्दों में, परिणाम पर कारकों के संयुक्त प्रभाव की निकटता का आकलन करता है।

एकाधिक सहसंबंध गुणांक की गणना कई सूत्रों 5 का उपयोग करके की जा सकती है, जिनमें शामिल हैं:

    जोड़ी सहसंबंध गुणांक के मैट्रिक्स का उपयोग करना

, (3.18)

कहाँ  आर- युग्म सहसंबंध गुणांक के मैट्रिक्स का निर्धारक ,
,

आर 11 - इंटरफैक्टर सहसंबंध मैट्रिक्स का निर्धारक
;

. (3.19)

ऐसे मॉडल के लिए जिसमें दो स्वतंत्र चर हैं, सूत्र (3.18) को सरल बनाया गया है

. (3.20)

बहु सहसंबंध गुणांक का वर्ग है निर्धारण का गुणांक आर 2. जोड़ीवार प्रतिगमन के साथ, आर 2 प्रतिगमन मॉडल की गुणवत्ता को इंगित करता है और परिणामी विशेषता की कुल भिन्नता के हिस्से को दर्शाता है प्रतिगमन फ़ंक्शन में परिवर्तन द्वारा समझाया गया एफ(एक्स) (2.4 देखें)। इसके अलावा, निर्धारण का गुणांक सूत्र का उपयोग करके पाया जा सकता है

. (3.21)

हालाँकि, उपयोग आर 2 मामले में एकाधिक प्रतिगमनपूरी तरह से सही नहीं है, क्योंकि मॉडल में रजिस्ट्रार जोड़ने पर निर्धारण का गुणांक बढ़ जाता है। ऐसा इसलिए है क्योंकि अतिरिक्त चर पेश किए जाने पर अवशिष्ट विचरण कम हो जाता है। और यदि कारकों की संख्या अवलोकनों की संख्या के करीब पहुंचती है, तो अवशिष्ट विचरण शून्य के बराबर होगा, और एकाधिक सहसंबंध गुणांक, और इसलिए निर्धारण का गुणांक, एक के करीब पहुंच जाएगा, हालांकि वास्तव में कारकों और परिणाम के बीच संबंध है और प्रतिगमन समीकरण की व्याख्यात्मक शक्ति बहुत कम हो सकती है।

इस बात का पर्याप्त मूल्यांकन प्राप्त करने के लिए कि परिणामी विशेषता की भिन्नता को कई कारक विशेषताओं की भिन्नता द्वारा कितनी अच्छी तरह समझाया गया है, वे इसका उपयोग करते हैं निर्धारण का समायोजित गुणांक

(3.22)

निर्धारण का समायोजित गुणांक सदैव कम होता है आर 2. इसके अलावा, इसके विपरीत आर 2, जो सदैव सकारात्मक होता है,
ऋणात्मक मान भी ले सकता है.

उदाहरण (उदाहरण 1 की निरंतरता). आइए सूत्र (3.20) के अनुसार एकाधिक सहसंबंध गुणांक की गणना करें:

एकाधिक सहसंबंध गुणांक का मान, 0.8601 के बराबर, परिवहन की लागत और कार्गो के वजन और जिस दूरी पर इसे ले जाया जाता है, के बीच एक मजबूत संबंध को इंगित करता है।

निर्धारण का गुणांक बराबर है: आर 2 =0,7399.

निर्धारण के समायोजित गुणांक की गणना सूत्र (3.22) का उपयोग करके की जाती है:

=0,7092.

ध्यान दें कि निर्धारण के समायोजित गुणांक का मान निर्धारण के गुणांक के मान से भिन्न होता है।

इस प्रकार, आश्रित चर (परिवहन लागत) में 70.9% भिन्नता को स्वतंत्र चर (कार्गो वजन और परिवहन दूरी) में भिन्नता द्वारा समझाया गया है। आश्रित चर में शेष 29.1% भिन्नता को मॉडल में ध्यान में नहीं रखे गए कारकों द्वारा समझाया गया है।

निर्धारण के समायोजित गुणांक का मूल्य काफी बड़ा है, इसलिए, हम मॉडल में परिवहन की लागत निर्धारित करने वाले सबसे महत्वपूर्ण कारकों को ध्यान में रखने में सक्षम थे। 

तीन चरों का एकाधिक सहसंबंध गुणांक एक विशेषता (डैश से पहले सूचकांक अक्षर) और दो अन्य विशेषताओं (डैश के बाद सूचकांक अक्षर) के संयोजन के बीच रैखिक संबंध की निकटता का एक संकेतक है:

; (12.7)

(12.8)

ये सूत्र एकाधिक सहसंबंध गुणांक की गणना करना आसान बनाते हैं ज्ञात मूल्यजोड़ी सहसंबंध गुणांक आर एक्सवाई, आर एक्सजेड और आर वाईजेड.

गुणक आरनकारात्मक नहीं है और हमेशा 0 से 1 के बीच होता है। जैसे-जैसे आप पास आते हैं आरएक के लिए, तीन विशेषताओं के बीच रैखिक संबंध की डिग्री बढ़ जाती है। एकाधिक सहसंबंध गुणांक के बीच, उदा. आर वाई-xz, और दो जोड़ी सहसंबंध गुणांक आर वाईएक्सऔर आर वाईजेडनिम्नलिखित संबंध है: प्रत्येक युग्मित गुणांक से अधिक नहीं हो सकता निरपेक्ष मूल्य आर वाई-xz.

वर्गांकित एकाधिक सहसंबंध गुणांक आर 2एकाधिक निर्धारण का गुणांक कहा जाता है। यह अध्ययन किए जा रहे कारकों के प्रभाव में आश्रित चर में भिन्नता के अनुपात को दर्शाता है।

बहु सहसंबंध के महत्व का आकलन किसके द्वारा किया जाता है?
एफ-मानदंड:

, (12.9)

एन- नमूने का आकार,

- संकेतों की संख्या; हमारे मामले में = 3.

सैद्धांतिक मूल्य एफ- मानदंड आवेदन तालिका से लिए गए हैं ν 1 = के-1 और ν 2 = एन-केस्वतंत्रता की डिग्री और स्वीकृत महत्व स्तर। शून्य परिकल्पना कि जनसंख्या में बहु सहसंबंध गुणांक शून्य के बराबर है ( एच0:आर= 0) यदि स्वीकार किया जाता है एफ तथ्य.< F табл . और यदि खारिज कर दिया जाता है एफ तथ्य. ≥ एफ टेबल.

काम का अंत -

यह विषय अनुभाग से संबंधित है:

गणित के आँकड़े

शैक्षणिक संस्थान.. गोमेल स्टेट यूनिवर्सिटी.. फ्रांसिस स्केरीना यू एम ज़ुचेंको के नाम पर रखा गया..

यदि आपको इस विषय पर अतिरिक्त सामग्री की आवश्यकता है, या आपको वह नहीं मिला जो आप खोज रहे थे, तो हम अपने कार्यों के डेटाबेस में खोज का उपयोग करने की सलाह देते हैं:

हम प्राप्त सामग्री का क्या करेंगे:

यदि यह सामग्री आपके लिए उपयोगी थी, तो आप इसे सोशल नेटवर्क पर अपने पेज पर सहेज सकते हैं:

इस अनुभाग के सभी विषय:

ट्यूटोरियल
विशेषज्ञता में अध्ययनरत विश्वविद्यालय के छात्रों के लिए 1-31 01 01 "जीव विज्ञान" गोमेल 2010

गणितीय सांख्यिकी का विषय एवं विधि
गणितीय सांख्यिकी का विषय जीव विज्ञान, अर्थशास्त्र, प्रौद्योगिकी और अन्य क्षेत्रों में बड़े पैमाने पर घटनाओं के गुणों का अध्ययन है। इन घटनाओं को आम तौर पर विविधता (भिन्नता) के कारण जटिल के रूप में प्रस्तुत किया जाता है

एक यादृच्छिक घटना की अवधारणा
सांख्यिकीय प्रेरण या सांख्यिकीय अनुमान, मुख्य के रूप में अवयवसामूहिक घटनाओं के अध्ययन की अपनी-अपनी पद्धतियाँ हैं विशिष्ट सुविधाएं. सांख्यिकीय निष्कर्ष संख्यात्मक से निकाले जाते हैं

एक यादृच्छिक घटना की संभावना
किसी यादृच्छिक घटना की एक संख्यात्मक विशेषता जिसमें यह गुण होता है कि परीक्षणों की किसी भी पर्याप्त बड़ी श्रृंखला के लिए घटना की आवृत्ति इस विशेषता से केवल थोड़ी सी भिन्न होती है, कहलाती है

संभावनाओं की गणना
अक्सर संभावनाओं को एक साथ जोड़ने और गुणा करने की आवश्यकता होती है। उदाहरण के लिए, आपको एक ही समय में 2 पासे घुमाने पर 5 अंक प्राप्त करने की संभावना निर्धारित करने की आवश्यकता है। आवश्यक राशि संभावित है

यादृच्छिक चर की अवधारणा
संभाव्यता की अवधारणा को परिभाषित करने और इसके मुख्य गुणों को स्पष्ट करने के बाद, आइए संभाव्यता सिद्धांत की सबसे महत्वपूर्ण अवधारणाओं में से एक - एक यादृच्छिक चर की अवधारणा - पर विचार करें। आइए हम इसे परिणाम के रूप में मान लें

असतत यादृच्छिक चर
एक यादृच्छिक चर असतत होता है यदि उसके संभावित मानों का सेट परिमित है, या कम से कम गणनीय है। मान लीजिए कि यादृच्छिक चर X मान X1 ले सकता है

निरंतर यादृच्छिक चर
पिछले उपधारा में चर्चा किए गए असतत यादृच्छिक चर के विपरीत, जनसंख्या संभावित माननिरंतर यादृच्छिक चर न केवल परिमित नहीं है, बल्कि परिमित भी नहीं हो सकता है

अपेक्षा और भिन्नता
अक्सर एक या दो संख्यात्मक संकेतकों का उपयोग करके यादृच्छिक चर के वितरण को चिह्नित करने की आवश्यकता होती है जो इस वितरण के सबसे आवश्यक गुणों को व्यक्त करते हैं। ऐसे के लिए

लम्हें
यादृच्छिक चर के वितरण के तथाकथित क्षणों का गणितीय आँकड़ों में बहुत महत्व है। गणितीय अपेक्षा में, यादृच्छिक चर के बड़े मूल्यों को पर्याप्त रूप से ध्यान में नहीं रखा जाता है।

द्विपद वितरण और संभाव्यता माप
इस विषय में हम असतत यादृच्छिक चर के वितरण के मुख्य प्रकारों पर विचार करेंगे। आइए मान लें कि एकल परीक्षण के दौरान कुछ यादृच्छिक घटना ए के घटित होने की संभावना बराबर है

आयताकार (समान) वितरण
आयताकार (समान) वितरण - सबसे सरल प्रकारनिरंतर वितरण. यदि एक यादृच्छिक चर X अंतराल (ए, बी) में कोई वास्तविक मान ले सकता है, जहां ए और बी वास्तविक हैं

सामान्य वितरण
सामान्य वितरण गणितीय आँकड़ों में एक मौलिक भूमिका निभाता है। यह ज़रा भी आकस्मिक नहीं है: वस्तुनिष्ठ वास्तविकता में, विभिन्न संकेत अक्सर पाए जाते हैं

लॉगनॉर्मल वितरण
एक यादृच्छिक चर Y में पैरामीटर μ और σ के साथ एक असामान्य वितरण होता है यदि एक यादृच्छिक चर X = lnY में समान पैरामीटर μ और & के साथ एक सामान्य वितरण होता है

औसत मान
सभी समूह गुणों में से, विशेषता के औसत मूल्य द्वारा मापा गया औसत स्तर, सबसे बड़ा सैद्धांतिक और व्यावहारिक महत्व है। किसी सुविधा का औसत मूल्य एक बहुत गहरी अवधारणा है,

औसत के सामान्य गुण
औसत मूल्यों के सही उपयोग के लिए, इन संकेतकों के गुणों को जानना आवश्यक है: औसत स्थान, अमूर्तता और कुल कार्रवाई की एकता। इसके संख्यात्मक मान के अनुसार

अंकगणित औसत
औसत मानों के सामान्य गुणों वाले अंकगणितीय माध्य की अपनी विशेषताएं होती हैं, जिन्हें निम्नलिखित सूत्रों द्वारा व्यक्त किया जा सकता है:

औसत रैंक (गैर-पैरामीट्रिक औसत)
औसत रैंक उन विशेषताओं के लिए निर्धारित की जाती है जिनके लिए मात्रात्मक माप विधियां अभी तक नहीं मिली हैं। ऐसे संकेतों की अभिव्यक्ति की डिग्री के अनुसार, वस्तुओं को रैंक किया जा सकता है, यानी स्थित किया जा सकता है

भारित अंकगणितीय औसत
आमतौर पर, अंकगणितीय औसत की गणना करने के लिए, विशेषता के सभी मानों को जोड़ा जाता है और परिणामी योग को विकल्पों की संख्या से विभाजित किया जाता है। इस मामले में, योग में शामिल प्रत्येक मान इसे पूर्ण रूप से बढ़ाता है

वर्ग मतलब
माध्य वर्ग की गणना सूत्र का उपयोग करके की जाती है: (6.5) यह योग के वर्गमूल के बराबर है

मंझला
माध्यिका एक विशिष्ट मान है जो पूरे समूह को दो समान भागों में विभाजित करता है: एक भाग का अभिलक्षणिक मान माध्यिका से कम होता है, और दूसरे का अधिक मान होता है। उदाहरण के लिए, यदि आपके पास है

जियोमेट्रिक माध्य
एन डेटा वाले समूह के लिए ज्यामितीय माध्य प्राप्त करने के लिए, आपको सभी विकल्पों को गुणा करना होगा और परिणामी उत्पाद से निकालना होगा nवाँ मूलडिग्री:

अनुकूल माध्य
हार्मोनिक माध्य की गणना सूत्र का उपयोग करके की जाती है। (6.14) पांच विकल्पों के लिए: 1, 4, 5, 5 बुधवार

स्वतंत्रता की कोटि की संख्या
स्वतंत्रता की कोटि की संख्या समूह में मुक्त किस्म के तत्वों की संख्या के बराबर होती है। यह विविधता प्रतिबंधों की संख्या के बिना सभी उपलब्ध शिक्षण तत्वों की संख्या के बराबर है। उदाहरण के लिए, अनुसंधान के लिए

भिन्नता का गुणांक
मानक विचलन- एक नामित मात्रा, अंकगणित माध्य के समान माप की इकाइयों में व्यक्त की गई। इसलिए, तुलना के लिए विभिन्न संकेत, से विभिन्न इकाइयों में व्यक्त किया गया

सीमाएँ और दायरा
विविधता की डिग्री का त्वरित और मोटे तौर पर आकलन करने के लिए, सबसे सरल संकेतकों का अक्सर उपयोग किया जाता है: लिम = (न्यूनतम ¸ अधिकतम) - सीमाएं, यानी सबसे छोटी और उच्चतम मूल्यसाइन, पी =

सामान्यीकृत विचलन
आमतौर पर, किसी गुण के विकास की डिग्री उसे मापकर निर्धारित की जाती है और एक निश्चित नामित संख्या द्वारा व्यक्त की जाती है: 3 किलो वजन, 15 सेमी लंबाई, मधुमक्खियों के पंखों पर 20 हुक, दूध में 4% वसा, 15 किलो कतरन

कुल समूह का औसत और सिग्मा
कभी-कभी कई वितरणों से बने सारांश वितरण के लिए माध्य और सिग्मा निर्धारित करना आवश्यक होता है। इस मामले में, वितरण स्वयं ज्ञात नहीं हैं, बल्कि केवल उनके औसत और सिग्मा हैं।

वितरण वक्र का तिरछापन (तिरछापन) और ढलान (कर्टोसिस)।
बड़े नमूनों (n > 100) के लिए, दो और आँकड़ों की गणना की जाती है। वक्र की तिरछापन को विषमता कहा जाता है:

विविधता शृंखला
जैसे-जैसे अध्ययन किए गए समूहों की संख्या बढ़ती है, विविधता में वह पैटर्न जो छोटे समूहों में अपनी अभिव्यक्ति के यादृच्छिक रूप से छिपा हुआ था, अधिक से अधिक स्पष्ट हो जाता है।

हिस्टोग्राम और भिन्नता वक्र
एक हिस्टोग्राम है विविधता श्रृंखला, एक आरेख के रूप में प्रस्तुत किया गया है जिसमें विभिन्न आवृत्ति मानों को सलाखों की विभिन्न ऊंचाइयों द्वारा दर्शाया जाता है। डेटा वितरण का हिस्टोग्राम पी में दिखाया गया है

वितरण में अंतर की विश्वसनीयता
एक सांख्यिकीय परिकल्पना डेटा के देखे गए नमूने के अंतर्निहित संभाव्यता वितरण के बारे में एक विशिष्ट धारणा है। इंतिहान सांख्यिकीय परिकल्पनास्वीकृति की एक प्रक्रिया है

तिरछापन और कुर्टोसिस के लिए मानदंड
पौधों, जानवरों और सूक्ष्मजीवों की कुछ विशेषताएं, वस्तुओं को समूहों में संयोजित करते समय, वितरण देती हैं जो सामान्य से काफी भिन्न होती हैं। ऐसे मामलों में जहां कोई

जनसंख्या और नमूना
एक निश्चित श्रेणी के व्यक्तियों के संपूर्ण समूह को सामान्य जनसंख्या कहा जाता है। आयतन जनसंख्याअध्ययन के उद्देश्यों द्वारा निर्धारित किया जाता है। यदि किसी जंगली प्रजाति का अध्ययन किया जा रहा है

प्रातिनिधिकता
चयनित वस्तुओं के समूह का प्रत्यक्ष अध्ययन, सबसे पहले, नमूने की प्राथमिक सामग्री और विशेषताएं प्रदान करता है। सभी नमूना डेटा और सारांश संकेतक प्रासंगिक हैं

प्रतिनिधित्व संबंधी त्रुटियाँ और अन्य शोध त्रुटियाँ
नमूना संकेतकों का उपयोग करके सामान्य मापदंडों के आकलन की अपनी विशेषताएं हैं। एक हिस्सा कभी भी पूरी तरह से समग्र की विशेषता नहीं बता सकता, इसलिए सामान्य आबादी की विशेषताएं

सीमाओं पर भरोसा रखें
सामान्य मापदंडों के संभावित मूल्यों को खोजने के लिए नमूना संकेतकों का उपयोग करने के लिए प्रतिनिधित्व त्रुटियों की भयावहता निर्धारित करना आवश्यक है। इस प्रक्रिया को ओ कहा जाता है

सामान्य मूल्यांकन प्रक्रिया
सामान्य पैरामीटर का आकलन करने के लिए आवश्यक तीन मात्राएँ - नमूना संकेतक (), विश्वसनीयता मानदंड

अंकगणित माध्य का अनुमान
औसत मूल्य के अनुमान का उद्देश्य वस्तुओं की अध्ययन की गई श्रेणी के लिए सामान्य औसत का मूल्य स्थापित करना है। इस प्रयोजन के लिए आवश्यक प्रतिनिधित्व त्रुटि सूत्र द्वारा निर्धारित की जाती है:

माध्य अंतर का अनुमान
कुछ अध्ययन दो मापों के अंतर को प्राथमिक डेटा के रूप में लेते हैं। यह वह स्थिति हो सकती है जब नमूने में प्रत्येक व्यक्ति का अध्ययन दो राज्यों - या में किया जाता है अलग-अलग उम्र में, या पी

माध्य अंतर का अविश्वसनीय और विश्वसनीय अनुमान
नमूना अध्ययन के ऐसे परिणाम जिनके लिए सामान्य पैरामीटर का कोई निश्चित अनुमान प्राप्त नहीं किया जा सकता है (या तो यह शून्य से अधिक है, या इससे कम है, या शून्य के बराबर है) अविश्वसनीय कहलाते हैं।

सामान्य साधनों के बीच अंतर का अनुमान
जैविक अनुसंधान में दो मात्राओं के बीच अंतर का विशेष महत्व है। अंतर से, विभिन्न आबादी, नस्लों, नस्लों, किस्मों, रेखाओं, परिवारों, प्रयोगात्मक और नियंत्रण समूहों (जीआर विधि) के बीच तुलना की जाती है

अंतर विश्वसनीयता मानदंड
इसके अतिरिक्त बडा महत्व, जो शोधकर्ताओं के लिए विश्वसनीय अंतर प्राप्त करने के लिए महत्वपूर्ण है, उन तरीकों में महारत हासिल करने की आवश्यकता है जो यह निर्धारित करना संभव बनाते हैं कि परिणाम विश्वसनीय है या नहीं, वास्तविक रूप से

गुणात्मक विशेषताओं के अध्ययन में प्रतिनिधित्वशीलता
गुणात्मक विशेषताओं में आमतौर पर अभिव्यक्ति के स्तर नहीं हो सकते हैं: वे प्रत्येक व्यक्ति में या तो मौजूद हैं या मौजूद नहीं हैं, उदाहरण के लिए, लिंग, मतदान, कुछ विशेषताओं की उपस्थिति या अनुपस्थिति, विकृति

शेयरों के अंतर की विश्वसनीयता
नमूना अनुपात में अंतर की विश्वसनीयता उसी तरह निर्धारित की जाती है जैसे साधनों में अंतर के लिए: (10.34)

सहसंबंध गुणांक
कई अध्ययनों में उनके अंतर्संबंधों में कई लक्षणों की जांच करने की आवश्यकता होती है। यदि आप दो विशेषताओं के संबंध में ऐसा अध्ययन करते हैं, तो आप देखेंगे कि एक विशेषता की परिवर्तनशीलता नहीं है

सहसंबंध गुणांक त्रुटि
किसी भी नमूना मूल्य की तरह, सहसंबंध गुणांक की अपनी प्रतिनिधित्व त्रुटि होती है, जिसकी गणना सूत्र का उपयोग करके बड़े नमूनों के लिए की जाती है:

नमूना सहसंबंध गुणांक की विश्वसनीयता
नमूना सहसंबंध गुणांक का मानदंड सूत्र द्वारा निर्धारित किया जाता है: (11.9) जहां:

सहसंबंध गुणांक की आत्मविश्वास सीमाएँ
सहसंबंध गुणांक के सामान्य मान की विश्वास सीमाएँ हैं सामान्य तरीके सेसूत्र के अनुसार:

दो सहसंबंध गुणांकों के बीच अंतर की विश्वसनीयता
सहसंबंध गुणांकों में अंतर की विश्वसनीयता उसी तरह निर्धारित की जाती है जैसे सामान्य सूत्र के अनुसार, साधनों में अंतर की विश्वसनीयता

सीधा प्रतिगमन समीकरण
एक सीधी-रेखा सहसंबंध इस मायने में भिन्न है कि कनेक्शन के इस रूप के साथ, पहली विशेषता में प्रत्येक समान परिवर्तन पूरी तरह से निश्चित होता है और दूसरी विशेषता में औसत परिवर्तन के समान भी होता है।

रेखीय प्रतिगमन समीकरण तत्वों में त्रुटियाँ
सरल रेखीय प्रतिगमन समीकरण में: y = a + bx, प्रतिनिधित्व की तीन त्रुटियाँ उत्पन्न होती हैं। 1 प्रतिगमन गुणांक त्रुटि:

आंशिक सहसंबंध गुणांक
आंशिक गुणांकसहसंबंध एक संकेतक है जो तीसरे के निरंतर मूल्य के साथ दो विशेषताओं के संयुग्मन की डिग्री को मापता है। गणित के आँकड़ेआपको सहसंबंध स्थापित करने की अनुमति देता है

रैखिक एकाधिक प्रतिगमन समीकरण
तीन चरों के बीच रैखिक संबंध के गणितीय समीकरण को गुणक कहा जाता है रेखीय समीकरणप्रतिगमन विमान. इसका निम्नलिखित सामान्य रूप है:

सहसंबंध संबंध
यदि अध्ययन के तहत घटनाओं के बीच संबंध रैखिक से काफी भिन्न होता है, जिसे ग्राफ़ से स्थापित करना आसान है, तो सहसंबंध गुणांक कनेक्शन के माप के रूप में अनुपयुक्त है। वह अनुपस्थिति को इंगित कर सकता है

सहसंबंध संबंध के गुण
सहसंबंध अनुपात किसी भी रूप में सहसंबंध की डिग्री को मापता है। इसके अलावा, सहसंबंध संबंध में कई अन्य गुण हैं जो सांख्यिकीय में बहुत रुचि रखते हैं

सहसंबंध संबंध की प्रतिनिधित्वात्मकता में त्रुटि
सहसंबंध संबंध की प्रतिनिधित्वात्मकता की त्रुटि के लिए एक सटीक सूत्र अभी तक विकसित नहीं किया गया है। आमतौर पर पाठ्यपुस्तकों में दिए गए फॉर्मूले के नुकसान होते हैं जिन्हें हमेशा नजरअंदाज नहीं किया जा सकता है। ये फार्मूला नहीं सिखाता

सहसंबंध रैखिकता मानदंड
एक सीधीरेखीय निर्भरता के सन्निकटन की डिग्री निर्धारित करने के लिए, एफ मानदंड का उपयोग किया जाता है, सूत्र द्वारा गणना की जाती है:

फैलाव परिसर
एक फैलाव कॉम्प्लेक्स अध्ययन में शामिल डेटा और प्रत्येक ग्रेडेशन (आंशिक औसत) और पूरे कॉम्प्लेक्स (समग्र औसत) के लिए डेटा के औसत के साथ ग्रेडेशन का एक सेट है।

सांख्यिकीय प्रभाव
सांख्यिकीय प्रभाव अध्ययन में व्यवस्थित कारक (इसके ग्रेडेशन) की विविधता के परिणामी गुण की विविधता में प्रतिबिंब है। नव कारक के प्रभाव का आकलन करना

तथ्यात्मक प्रभाव
तथ्यात्मक प्रभाव अध्ययन किए जा रहे कारकों का एक सरल या संयुक्त सांख्यिकीय प्रभाव है। एकल-कारक परिसरों में, कुछ संगठनात्मक स्तर पर एक कारक के सरल प्रभाव का अध्ययन किया जाता है

एक-कारक फैलाव परिसर
भिन्नता का विश्लेषणअंग्रेजी वैज्ञानिक आर. ए. फिशर द्वारा कृषि और जैविक अनुसंधान के अभ्यास में विकसित और पेश किया गया, जिन्होंने औसत वर्गों के अनुपात के वितरण के कानून की खोज की

बहुकारक फैलाव परिसर
के बारे में स्पष्ट विचार गणित का मॉडलविचरण का विश्लेषण आवश्यक कम्प्यूटेशनल संचालन की समझ को सुविधाजनक बनाता है, खासकर जब बहुभिन्नरूपी प्रयोगों से डेटा संसाधित किया जाता है जिसमें अधिक

परिवर्तनों
समुचित उपयोगप्रयोगात्मक सामग्री के प्रसंस्करण के लिए विचरण का विश्लेषण विभिन्न प्रकारों (नमूनों) में भिन्नता की एकरूपता मानता है, सामान्य या सामान्य वितरण के करीब

प्रभावों की ताकत के संकेतक
सबसे अधिक चयन करने के लिए जीव विज्ञान, कृषि और चिकित्सा में उनके परिणामों के आधार पर प्रभावों की ताकत का निर्धारण करना आवश्यक है प्रभावी साधनप्रभाव, भौतिक और रासायनिक एजेंटों की खुराक के लिए - सेंट।

प्रभाव की ताकत के मुख्य संकेतक की प्रतिनिधित्व में त्रुटि
प्रभाव की ताकत के मुख्य संकेतक के लिए सटीक त्रुटि सूत्र अभी तक नहीं मिला है। एक-कारक परिसरों में, जब प्रतिनिधित्व त्रुटि केवल एक तथ्यात्मक संकेतक के लिए निर्धारित की जाती है

प्रभाव संकेतकों के मूल्यों को सीमित करें
प्रभाव की ताकत का मुख्य संकेतक पदों की कुल राशि से एक पद के हिस्से के बराबर है। इसके अलावा, यह सूचक वर्ग के बराबरसहसंबंध संबंध. इन दो कारणों से, शक्ति सूचक

प्रभावों की विश्वसनीयता
में प्राप्त प्रभाव की शक्ति का मुख्य सूचक नमूना अध्ययन, विशेषता, सबसे पहले, प्रभाव की डिग्री जो वास्तव में अध्ययन की गई वस्तुओं के समूह में प्रकट हुई

विभेदक विश्लेषण
विभेदक विश्लेषण बहुभिन्नरूपी सांख्यिकीय विश्लेषण के तरीकों में से एक है। विभेदक विश्लेषण का उद्देश्य विभिन्न विशेषताओं (विशेषताएं, जोड़े) के माप के आधार पर है

समस्या कथन, समाधान के तरीके, सीमाएँ
मान लीजिए कि m विशेषताओं वाली n वस्तुएँ हैं। माप के परिणामस्वरूप, प्रत्येक वस्तु को एक वेक्टर x1 ... xm, m >1 द्वारा चित्रित किया जाता है। चुनौती तो यही है

धारणाएँ और सीमाएँ
यदि कई धारणाएँ पूरी होती हैं तो विभेदक विश्लेषण "कार्य" करता है। यह धारणा कि अवलोकन योग्य मात्राएँ - किसी वस्तु की मापनीय विशेषताएँ - का सामान्य वितरण होता है। यह

विभेदक विश्लेषण एल्गोरिदम
भेदभाव की समस्याओं के समाधान (विभेदक विश्लेषण) में संपूर्ण नमूना स्थान (विचाराधीन सभी बहुआयामी यादृच्छिक चर की प्राप्ति का सेट) को एक निश्चित संख्या में विभाजित करना शामिल है

क्लस्टर विश्लेषण
क्लस्टर विश्लेषण एक साथ लाता है विभिन्न प्रक्रियाएँ, वर्गीकरण के लिए उपयोग किया जाता है। इन प्रक्रियाओं को लागू करने के परिणामस्वरूप, वस्तुओं के प्रारंभिक सेट को समूहों या समूहों में विभाजित किया जाता है

क्लस्टर विश्लेषण के तरीके
व्यवहार में, समूहीकृत क्लस्टरिंग विधियाँ आमतौर पर लागू की जाती हैं। आमतौर पर, वर्गीकरण शुरू होने से पहले, डेटा को मानकीकृत किया जाता है (औसत को घटाया जाता है और वर्गमूल से विभाजित किया जाता है

क्लस्टर विश्लेषण एल्गोरिथ्म
क्लस्टर विश्लेषण वस्तुओं के बीच की दूरी की अवधारणा को परिभाषित करने और फिर उनसे समूहों की पहचान करने के आधार पर बहुआयामी अवलोकनों या वस्तुओं को वर्गीकृत करने के तरीकों का एक सेट है, और

7.1. रेखीय प्रतिगमन विश्लेषणविधि का उपयोग करके अवलोकनों के एक सेट के लिए एक ग्राफ का चयन करना शामिल है कम से कम वर्गों. प्रतिगमन विश्लेषण हमें कुछ के बीच एक कार्यात्मक संबंध स्थापित करने की अनुमति देता है अनियमित परिवर्तनशील वस्तु वाईऔर कुछ प्रभावित करने वाले वाईमान एक्स. इस निर्भरता को प्रतिगमन समीकरण कहा जाता है। सरल हैं ( y=m*x+b) और बहुवचन ( y=m 1 *x 1 +m 2 *x 2 +... + m k *x k +b) रैखिक और अरेखीय प्रकार का प्रतिगमन।
मात्राओं के बीच संबंध की डिग्री का आकलन करने के लिए इसका उपयोग किया जाता है पियर्सन आर एकाधिक सहसंबंध गुणांक(सहसंबंध अनुपात), जो 0 से 1 तक मान ले सकता है। आर=0 यदि मात्राओं के बीच कोई संबंध नहीं है, और आर=1 यदि मात्राओं के बीच कोई कार्यात्मक संबंध है। अधिकांश मामलों में, R 0 से 1 तक मध्यवर्ती मान लेता है आर 2बुलाया निर्धारण का गुणांक.
प्रतिगमन निर्भरता के निर्माण का कार्य गुणांकों के वेक्टर को खोजना है एमएकाधिक रेखीय प्रतिगमन मॉडल, जिसमें गुणांक आरअधिकतम मान लेता है.
महत्व का आकलन करने के लिए आरइसपर लागू होता है फिशर का एफ परीक्षण, सूत्र द्वारा गणना:

कहाँ एन- प्रयोगों की संख्या; – मॉडल गुणांकों की संख्या. अगर एफडेटा के लिए कुछ महत्वपूर्ण मान से अधिक है एनऔर और स्वीकार कर लिया आत्मविश्वास की संभावना, फिर मूल्य आरमहत्वपूर्ण माना जाता है.

7.2. औजार वापसीसे विश्लेषण पैकेजआपको निम्नलिखित डेटा की गणना करने की अनुमति देता है:

· कठिनाइयाँ रैखिक प्रकार्यप्रतिगमन– न्यूनतम वर्ग विधि; प्रतिगमन फ़ंक्शन का प्रकार स्रोत डेटा की संरचना द्वारा निर्धारित किया जाता है;

· निर्धारण का गुणांक और संबंधित मात्राएँ(मेज़ प्रतिगमन आँकड़े);

· प्रतिगमन के महत्व का परीक्षण करने के लिए विचरण तालिका और मानदंड आँकड़े(मेज़ भिन्नता का विश्लेषण);

· प्रत्येक प्रतिगमन गुणांक के लिए मानक विचलन और इसकी अन्य सांख्यिकीय विशेषताएं, आपको इस गुणांक के महत्व की जांच करने और इसके लिए आत्मविश्वास अंतराल बनाने की अनुमति देती हैं;

· प्रतिगमन फ़ंक्शन मान और अवशेष– चर के प्रारंभिक मूल्यों के बीच अंतर वाईऔर प्रतिगमन फ़ंक्शन के परिकलित मान (तालिका)। शेष राशि की निकासी);

· चर Y के मानों के अनुरूप संभावनाओं को आरोही क्रम में क्रमबद्ध किया गया है(मेज़ संभाव्यता आउटपुट).

7.3. के माध्यम से चयन उपकरण को कॉल करें डेटा > डेटा विश्लेषण > प्रतिगमन.

7.4. खेत मेँ इनपुट अंतराल Yआश्रित चर Y के मानों वाली श्रेणी का पता दर्ज करें। श्रेणी में एक कॉलम होना चाहिए।
खेत मेँ इनपुट अंतराल एक्सवेरिएबल X के मान वाली श्रेणी का पता दर्ज करें। श्रेणी में एक या अधिक कॉलम होने चाहिए, लेकिन 16 से अधिक कॉलम नहीं। यदि फ़ील्ड में निर्दिष्ट किया गया है इनपुट अंतराल Yऔर इनपुट अंतराल एक्सश्रेणियों में कॉलम हेडर शामिल हैं, तो आपको विकल्प बॉक्स को चेक करना होगा टैग- इन हेडर का उपयोग टूल द्वारा उत्पन्न आउटपुट तालिकाओं में किया जाएगा वापसी.
विकल्प चेकबॉक्स स्थिरांक - शून्ययदि प्रतिगमन समीकरण स्थिर है तो स्थापित किया जाना चाहिए बीशून्य के बराबर मजबूर किया जाता है.
विकल्प विश्वसनीयता का स्तरतब सेट किया जाता है जब 0.95 के अलावा किसी अन्य आत्मविश्वास स्तर के साथ प्रतिगमन गुणांक के लिए आत्मविश्वास अंतराल का निर्माण करना आवश्यक होता है, जिसका उपयोग डिफ़ॉल्ट रूप से किया जाता है। विकल्प बॉक्स को चेक करने के बाद विश्वसनीयता का स्तरएक इनपुट फ़ील्ड उपलब्ध हो जाती है जिसमें एक नया आत्मविश्वास स्तर मान दर्ज किया जाता है।
क्षेत्र में कूड़ाचार विकल्प हैं: कूड़ा, मानकीकृत शेष, बैलेंस चार्टऔर चयन कार्यक्रम. यदि उनमें से कम से कम एक स्थापित है, तो तालिका आउटपुट परिणामों में दिखाई देगी शेष राशि की निकासी, जिसमें प्रतिगमन फ़ंक्शन और अवशेषों के मान प्रदर्शित किए जाएंगे - चर Y के प्रारंभिक मान और प्रतिगमन फ़ंक्शन के परिकलित मानों के बीच अंतर। क्षेत्र में सामान्य संभावनाएक विकल्प है - ; इसकी स्थापना आउटपुट परिणामों में एक तालिका उत्पन्न करती है संभाव्यता आउटपुटऔर संबंधित ग्राफ़ के निर्माण की ओर ले जाता है।


7.5. चित्र के अनुसार पैरामीटर सेट करें. सुनिश्चित करें कि Y मान पहला चर (शीर्षक कक्ष सहित) है और X मान अन्य दो चर (शीर्षक कक्ष सहित) है। क्लिक ठीक है.

7.6. मेज पर प्रतिगमन आँकड़ेनिम्नलिखित डेटा प्रदान किया गया है.

बहुवचन आर– निर्धारण के गुणांक का मूल R 2 अगली पंक्ति में दिया गया है। इस सूचक का दूसरा नाम सहसंबंध सूचकांक, या एकाधिक सहसंबंध गुणांक है।

आर स्कवेयर– निर्धारण का गुणांक आर 2 ; अनुपात के रूप में गणना की गई वर्गों का प्रतिगमन योग(सेल सी12) को वर्गों का कुल योग(सेल C14).

सामान्यीकृत आर-वर्गसूत्र द्वारा गणना की गई

जहां n वेरिएबल Y के मानों की संख्या है, k वेरिएबल X के इनपुट अंतराल में कॉलम की संख्या है।

मानक त्रुटि- अवशिष्ट विचरण की जड़ (सेल डी13)।

टिप्पणियों– चर Y के मानों की संख्या.

7.7. में फैलाव तालिकाकॉलम में एसएसवर्गों का योग कॉलम में दिया गया है डीएफ- स्वतंत्रता की डिग्री की संख्या. कॉलम में एमएस– फैलाव. इन - लाइन वापसीकॉलम में एफप्रतिगमन के महत्व का परीक्षण करने के लिए मानदंड आँकड़ों के मूल्य की गणना की गई थी। इस मान की गणना प्रतिगमन विचरण और अवशिष्ट विचरण (कोशिका D12 और D13) के अनुपात के रूप में की जाती है। कॉलम में महत्व एफमानदंड आँकड़ों के प्राप्त मूल्य की संभावना की गणना की जाती है। यदि यह संभावना, उदाहरण के लिए, 0.05 (एक दिया गया महत्व स्तर) से कम है, तो प्रतिगमन के महत्व के बारे में परिकल्पना (यानी, यह परिकल्पना कि प्रतिगमन फ़ंक्शन के सभी गुणांक शून्य के बराबर हैं) को खारिज कर दिया जाता है और प्रतिगमन होता है महत्वपूर्ण माना जाता है. इस उदाहरण में, प्रतिगमन महत्वपूर्ण नहीं है.

7.8. निम्नलिखित तालिका में, कॉलम में कठिनाइयाँ, प्रतिगमन फ़ंक्शन के गुणांकों के परिकलित मान पंक्ति में रहते हुए लिखे गए हैं वाई-चौराहामुक्त पद का मान लिखा जाता है बी. कॉलम में मानक त्रुटिगुणांकों के मानक विचलन की गणना की गई।
कॉलम में टी आँकड़ागुणांक मानों का उनके मानक विचलनों से अनुपात दर्ज किया जाता है। ये प्रतिगमन गुणांक के महत्व के बारे में परिकल्पनाओं के परीक्षण के लिए मानदंड आँकड़ों के मूल्य हैं।
कॉलम में पी-मूल्यमानदंड आँकड़ों के मूल्यों के अनुरूप महत्व स्तरों की गणना की जाती है। यदि परिकलित महत्व स्तर निर्दिष्ट महत्व स्तर से कम है (उदाहरण के लिए, 0.05)। तब यह परिकल्पना स्वीकार की जाती है कि गुणांक शून्य से काफी भिन्न है; अन्यथा, यह परिकल्पना कि गुणांक शून्य से नगण्य रूप से भिन्न है, स्वीकार की जाती है। इस उदाहरण में, केवल गुणांक बीशून्य से काफी अलग, बाकी - नगण्य।
स्तंभों में निचला 95%और शीर्ष 95% 0.95 के आत्मविश्वास स्तर के साथ आत्मविश्वास अंतराल की सीमाएं दी गई हैं। इन सीमाओं की गणना सूत्रों का उपयोग करके की जाती है
निचला 95% = गुणांक - मानक त्रुटि * टी α;
ऊपरी 95% = गुणांक + मानक त्रुटि * टी α.
यहाँ टी α- आदेश की मात्रा α छात्र टी स्वतंत्रता की डिग्री (एन-के-1) के साथ वितरण करता है। में इस मामले में α = 0.95. स्तंभों में विश्वास अंतराल की सीमाओं की गणना उसी तरह की जाती है निचला 90.0%और शीर्ष 90.0%.

7.9. तालिका पर विचार करें शेष राशि की निकासीआउटपुट परिणामों से. यह तालिका आउटपुट परिणामों में तभी दिखाई देती है जब क्षेत्र में कम से कम एक विकल्प सेट किया गया हो कूड़ासंवाद बकस वापसी.

कॉलम में अवलोकनपरिवर्तनीय मानों की क्रम संख्याएँ दी गई हैं वाई.
कॉलम में अनुमानित वाईप्रतिगमन फ़ंक्शन y i = f(x i) के मानों की गणना चर के उन मानों के लिए की जाती है एक्स, जो मेल खाता है क्रम संख्या मैं कॉलम में अवलोकन.
कॉलम में कूड़ाअंतर (अवशेष) शामिल हैं ε i =Y-y i, और स्तंभ मानक शेष- सामान्यीकृत अवशेष, जिनकी गणना अनुपात ε i / s ε के रूप में की जाती है। जहां s ε अवशेषों का मानक विचलन है। मान s ε के वर्ग की गणना सूत्र का उपयोग करके की जाती है

अवशेषों का औसत कहां है. मान की गणना फैलाव तालिका से दो मानों के अनुपात के रूप में की जा सकती है: वर्ग अवशेषों का योग (सेल C13) और पंक्ति से स्वतंत्रता की डिग्री कुल(सेल बी14).

7.10. तालिका मानों द्वारा शेष राशि की निकासीदो प्रकार के ग्राफ बनाए जाते हैं: अवशिष्ट चार्टऔर चयन कार्यक्रम(यदि क्षेत्र में उपयुक्त विकल्प निर्धारित हैं कूड़ासंवाद बकस वापसी). वे प्रत्येक परिवर्तनशील घटक के लिए बनाए गए हैं एक्सअलग से।

पर संतुलन चार्टशेष राशि प्रदर्शित की जाती है, अर्थात मूल मूल्यों के बीच अंतर वाईऔर चर घटक के प्रत्येक मान के लिए प्रतिगमन फ़ंक्शन से गणना की जाती है एक्स.

पर चयन कार्यक्रमप्रत्येक चर घटक मान के लिए मूल Y मान और परिकलित प्रतिगमन फ़ंक्शन मान दोनों प्रदर्शित करता है एक्स.

7.11. आउटपुट परिणामों की अंतिम तालिका तालिका है संभाव्यता आउटपुट. यह डायलॉग बॉक्स में दिखाई देता है वापसीविकल्प स्थापित सामान्य संभाव्यता कथानक.
स्तंभ मान प्रतिशततानिम्नानुसार गणना की जाती है। चरण की गणना की जाती है एच = (1/एन)*100%, पहला मान है एच/2, बाद वाला बराबर है 100-घंटा/2. दूसरे मान से शुरू करके, प्रत्येक अगला मान पिछले मान के बराबर होता है, जिसमें एक चरण जोड़ा जाता है एच.
कॉलम में वाईपरिवर्तनीय मान दिए गए हैं वाई, आरोही क्रम में क्रमबद्ध। इस तालिका के आंकड़ों के आधार पर, तथाकथित सामान्य वितरण ग्राफ. यह आपको चरों के बीच संबंधों की रैखिकता की डिग्री का दृश्य रूप से आकलन करने की अनुमति देता है एक्सऔर वाई.


8. डी भिन्नता का विश्लेषण

8.1. विश्लेषण पैकेजविचरण के तीन प्रकार के विश्लेषण की अनुमति देता है। किसी विशिष्ट उपकरण का चुनाव अध्ययन किए जा रहे डेटा सेट में कारकों की संख्या और नमूनों की संख्या से निर्धारित होता है।
इस परिकल्पना का परीक्षण करने के लिए उपयोग किया जाता है कि एक ही जनसंख्या से संबंधित दो या दो से अधिक नमूनों के साधन समान हैं।
दोहराव के साथ दोतरफा एनोवाएक अधिक जटिल विकल्प है वस्तु के एक प्रकार विश्लेषण, जिसमें डेटा के प्रत्येक समूह के लिए एक से अधिक नमूने शामिल हैं।
दोहराव के बिना दोतरफा एनोवाविचरण का दो-तरफ़ा विश्लेषण है जिसमें प्रति समूह एक से अधिक नमूने शामिल नहीं होते हैं। इसका उपयोग इस परिकल्पना का परीक्षण करने के लिए किया जाता है कि दो या दो से अधिक नमूनों का माध्य समान है (नमूने एक ही जनसंख्या के हैं)।

8.2. एक तरफ़ा एनोवा

8.2.1. आइए विश्लेषण के लिए डेटा तैयार करें। एक नई शीट बनाएं और उसमें कॉलम कॉपी करें ए बी सी डी. पहली दो पंक्तियाँ हटाएँ. तैयार डेटा का उपयोग संचालन के लिए किया जा सकता है विचरण का एकतरफ़ा विश्लेषण।

8.2.2. के माध्यम से चयन उपकरण को कॉल करें डेटा > डेटा विश्लेषण > वन-वे एनोवा।चित्र के अनुसार भरें. क्लिक ठीक है.

8.2.3. तालिका पर विचार करें परिणाम: जाँच करना- दोहराव की संख्या, जोड़– पंक्ति द्वारा सूचक मानों का योग, फैलाव- सूचक का आंशिक विचरण.

8.2.4. मेज़ भिन्नता का विश्लेषण: पहला कॉलम विविधता का स्रोतफैलाव का नाम शामिल है, एसएस– वर्ग विचलन का योग, डीएफ- आज़ादी की श्रेणी, एमएस– औसत वर्ग, एफ परीक्षणवास्तविक एफ वितरण। पी-मूल्य- संभावना है कि समीकरण द्वारा पुनरुत्पादित प्रसरण, अवशेषों के प्रसरण के बराबर है। यह संभावना स्थापित करता है कि कारकों और परिणाम के बीच संबंध के प्राप्त मात्रात्मक निर्धारण को यादृच्छिक माना जा सकता है। एफ-महत्वपूर्णसैद्धांतिक F मान है, जिसकी तुलना बाद में वास्तविक F से की जाती है।

8.2.5. समानता की शून्य परिकल्पना गणितीय अपेक्षाएँअसमानता होने पर सभी नमूनों को स्वीकार किया जाता है एफ परीक्षण < एफ-महत्वपूर्ण. इस परिकल्पना को खारिज किया जाना चाहिए. इस मामले में, नमूनों का औसत मान काफी भिन्न होता है।

में प्रतिगमन सांख्यिकी एकाधिक सहसंबंध गुणांक दर्शाया गया है (बहुवचन आर)और दृढ़ संकल्प (आर-वर्ग) Y और कारक विशेषताओं की सरणी के बीच (जो सहसंबंध विश्लेषण में पहले प्राप्त मूल्यों से मेल खाता है)

मेज का मध्य भाग (भिन्नता का विश्लेषण)प्रतिगमन समीकरण के महत्व का परीक्षण करने के लिए आवश्यक है।

मेज के नीचे - सटीक

सामान्य प्रतिगमन गुणांकों का अंतिम अनुमान द्वि, उनके महत्व और अंतराल अनुमान का परीक्षण।

गुणांक बी (कॉलम) के वेक्टर का अनुमान कठिनाइयाँ):

तब प्रतिगमन समीकरण अनुमान का रूप है:

प्रतिगमन समीकरण और परिणामी प्रतिगमन गुणांक के महत्व की जांच करना आवश्यक है।

आइए b=0.05 स्तर पर प्रतिगमन समीकरण के महत्व की जाँच करें, अर्थात। परिकल्पना H0: в1=в2=в3=…=вk=0. ऐसा करने के लिए, एफ-सांख्यिकी के देखे गए मान की गणना की जाती है:

Excel इसे परिणामों में दिखाता है भिन्नता का विश्लेषण:

क्यूआर=527.4296; Qost=1109.8673 =>

कॉलम में एफमूल्य दर्शाया गया है एफनमूदार.

एफ-वितरण तालिकाओं से या अंतर्निहित सांख्यिकीय फ़ंक्शन का उपयोग करके एफखोज करनामहत्व स्तर b=0.05 और अंश n1=k=4 और हर n2=n-k-1=45 की स्वतंत्रता की डिग्री की संख्या के लिए हम F-सांख्यिकी का महत्वपूर्ण मान बराबर पाते हैं

एफसीआर = 2.578739184

चूंकि एफ-सांख्यिकी का मनाया गया मान इसके महत्वपूर्ण मान 8.1957 > 2.7587 से अधिक है, इसलिए गुणांक के वेक्टर की समानता के बारे में परिकल्पना 0.05 की त्रुटि संभावना के साथ खारिज कर दी जाती है। नतीजतन, वेक्टर b=(b1,b2,b3,b4)T का कम से कम एक तत्व शून्य से काफी अलग है।

आइए प्रतिगमन समीकरण के व्यक्तिगत गुणांकों के महत्व की जाँच करें, अर्थात। परिकल्पना .

प्रतिगमन गुणांक के महत्व का परीक्षण महत्व स्तर के लिए टी-सांख्यिकी के आधार पर किया जाता है।

टी-सांख्यिकी के देखे गए मान कॉलम में परिणाम तालिका में दर्शाए गए हैं टी-सांख्यिकी.

गुणांक (द्वि)

टी-सांख्यिकी (टीओबी)

वाई-चौराहा

वेरिएबल X5

वेरिएबल X7

वेरिएबल X10

वेरिएबल X15

उनकी तुलना महत्व स्तर b=0.05 और स्वतंत्रता की डिग्री n=n - k - 1 के लिए पाए गए महत्वपूर्ण मान tcr से की जानी चाहिए।

ऐसा करने के लिए, हम अंतर्निहित एक्सेल सांख्यिकीय फ़ंक्शन का उपयोग करते हैं स्टडीस्पोब्र,प्रस्तावित मेनू में प्रवेश करके संभावना b = 0.05 और स्वतंत्रता की डिग्री की संख्या n = n-k-1 = 50-4-1 = 45। (आप गणितीय आंकड़ों की तालिकाओं से टीसीआर का मान पा सकते हैं।

हमें टीसीआर = 2.014103359 मिलता है।

टी-सांख्यिकी का प्रेक्षित मान महत्वपूर्ण मान मॉड्यूल 2.0141>|-0.0872|, 2.0141>|0.2630|, 2.0141>|0.7300|, 2.0141>|-1.6629 | से कम है।

नतीजतन, यह परिकल्पना कि ये गुणांक शून्य के बराबर हैं, 0.05 की त्रुटि संभावना के साथ खारिज नहीं किया जाता है, अर्थात। संगत गुणांक महत्वहीन हैं।

प्रेक्षित t-सांख्यिकी का मान अधिक है महत्वपूर्ण मानमॉड्यूलो |3.7658|>2.0141, इसलिए, परिकल्पना H0 खारिज कर दी जाती है, यानी। - महत्वपूर्ण

प्रतिगमन गुणांक का महत्व परिणामी तालिका के निम्नलिखित स्तंभों द्वारा भी जांचा जाता है:

स्तंभ पी-अर्थ 5% की सीमा स्तर पर मॉडल मापदंडों के महत्व को दर्शाता है, अर्थात। यदि p≤0.05 है, तो संबंधित गुणांक महत्वपूर्ण माना जाता है, यदि p>0.05 है, तो महत्वहीन है।

और अंतिम कॉलम - कम 95%और ऊपरी 95%और निचला 98%और शीर्ष 98% -ये आर = 0.95 (हमेशा जारी) और आर = 0.98 (संबंधित अतिरिक्त विश्वसनीयता सेट होने पर जारी) के लिए निर्दिष्ट विश्वसनीयता स्तरों के साथ प्रतिगमन गुणांक के अंतराल अनुमान हैं।

यदि निचला और ऊपरी सीमाएक ही चिह्न है (शून्य शामिल नहीं है)। विश्वास अंतराल), तो संबंधित प्रतिगमन गुणांक को महत्वपूर्ण माना जाता है, अन्यथा - महत्वहीन

जैसा कि तालिका से देखा जा सकता है, गुणांक b3 के लिए p-मान p=0.0005<0,05 и доверительные интервалы не включают ноль, т.е. по всем проверочным критериям этот коэффициент является значимым.

महत्वहीन प्रतिगमनकर्ताओं के बहिष्कार के साथ चरणबद्ध प्रतिगमन विश्लेषण के एल्गोरिदम के अनुसार, अगले चरण में एक चर को विचार से बाहर करना आवश्यक है जिसमें एक महत्वहीन प्रतिगमन गुणांक है।

ऐसे मामले में जब प्रतिगमन मूल्यांकन के दौरान कई महत्वहीन गुणांक की पहचान की जाती है, प्रतिगमन समीकरण से बाहर रखा जाने वाला पहला प्रतिगामी है जिसके लिए टी-सांख्यिकी () पूर्ण मूल्य में न्यूनतम है। इस सिद्धांत के अनुसार, अगले चरण में चर X5 को बाहर करना आवश्यक है, जिसमें एक नगण्य प्रतिगमन गुणांक b2 है

प्रतिगमन विश्लेषण का द्वितीय चरण।

मॉडल में कारक विशेषताएं X7, X10, X15 शामिल हैं और X5 शामिल नहीं है।

परिणामों का निष्कर्ष

प्रतिगमन आँकड़े

बहुवचन आर

आर स्कवेयर

सामान्यीकृत आर-वर्ग

मानक त्रुटि

टिप्पणियों

भिन्नता का विश्लेषण

(स्वतंत्रता की डिग्री की संख्या n)

(वर्ग विचलनों का योग Q)

(माध्य वर्ग MS=SS/n)

(फ़ॉब्स = एमएसआर/एमएसरेस्ट)

महत्व एफ

वापसी

कठिनाइयाँ

मानक त्रुटि

टी-स्टा-टिस्टिक्स

पी-मूल्य

शीर्ष 95% (बिमैक्स)

निचला 98% (बिमिन)

वाई-चौराहा

वेरिएबल X7

वेरिएबल X10

वेरिएबल X15



साइट पर नया

>

सबसे लोकप्रिय