3. औसत की समानता के बारे में परिकल्पना की जाँच करना
इस प्रस्ताव का परीक्षण करने के लिए उपयोग किया जाता है कि नमूनों द्वारा दर्शाए गए दो संकेतकों का माध्य काफी भिन्न है। परीक्षण तीन प्रकार के होते हैं: एक संबंधित नमूनों के लिए, और दो असंबंधित नमूनों के लिए (समान और भिन्न भिन्नताओं के साथ)। यदि नमूने जुड़े नहीं हैं, तो किस मानदंड का उपयोग करना है यह निर्धारित करने के लिए पहले भिन्नताओं की समानता की परिकल्पना का परीक्षण किया जाना चाहिए। जैसे भिन्नताओं की तुलना करने के मामले में, समस्या को हल करने के 2 तरीके हैं, जिन पर हम एक उदाहरण का उपयोग करके विचार करेंगे।
उदाहरण 3. दो शहरों में माल की बिक्री की संख्या पर डेटा है। 0.01 के महत्व स्तर पर सांख्यिकीय परिकल्पना का परीक्षण करें कि शहरों में उत्पाद बिक्री की औसत संख्या भिन्न है।
23 | 25 | 23 | 22 | 23 | 24 | 28 | 16 | 18 | 23 | 29 | 26 | 31 | 19 |
22 | 28 | 26 | 26 | 35 | 20 | 27 | 28 | 28 | 26 | 22 | 29 |
हम डेटा विश्लेषण पैकेज का उपयोग करते हैं। मानदंड के प्रकार के आधार पर, तीन में से एक का चयन किया जाता है: "साधनों के लिए युग्मित दो-नमूना टी-परीक्षण" - जुड़े नमूनों के लिए, और "समान भिन्नताओं के साथ दो-नमूना टी-परीक्षण" या "दो-नमूना टी-परीक्षण के साथ अलग-अलग भिन्नताएँ" - डिस्कनेक्ट किए गए नमूनों के लिए। समान भिन्नताओं के साथ परीक्षण को कॉल करें, खुलने वाली विंडो में, "परिवर्तनीय अंतराल 1" और "परिवर्तनीय अंतराल 2" फ़ील्ड में, डेटा के लिंक दर्ज करें (क्रमशः A1-N1 और A2-L2); यदि डेटा लेबल हैं , फिर "लेबल" के बगल में स्थित बॉक्स को चेक करें "(वे हमारे पास नहीं हैं, इसलिए चेकबॉक्स चेक नहीं किया गया है)। इसके बाद, "अल्फा" फ़ील्ड में महत्व स्तर दर्ज करें - 0.01। "काल्पनिक माध्य अंतर" फ़ील्ड खाली छोड़ दिया गया है। "आउटपुट विकल्प" अनुभाग में, "आउटपुट अंतराल" के आगे एक चेकमार्क लगाएं और, शिलालेख के सामने दिखाई देने वाले क्षेत्र में कर्सर रखकर, सेल बी 7 में बाएं बटन पर क्लिक करें। परिणाम इस सेल से शुरू होने वाला आउटपुट होगा। "ओके" पर क्लिक करने पर, परिणामों की एक तालिका दिखाई देती है। कॉलम बी, सी और डी की चौड़ाई बढ़ाकर बॉर्डर को कॉलम बी और सी, सी और डी, डी और ई के बीच ले जाएं ताकि सभी लेबल फिट हो जाएं। प्रक्रिया नमूने की मुख्य विशेषताओं, टी-सांख्यिकी, को प्रदर्शित करती है महत्वपूर्ण मूल्यये आँकड़े और महत्वपूर्ण स्तरमहत्व "पी(टी<=t) одностороннее» и «Р(Т<=t) двухстороннее». Если по модулю t-статистика меньше критического, то средние показатели с заданной вероятностью равны. В нашем случае│-1,784242592│ < 2,492159469, следовательно, среднее число продаж значимо не отличается. Следует отметить, что если взять уровень значимости α=0,05, то результаты исследования будут совсем иными.
समान भिन्नताओं के साथ दो-नमूना टी-परीक्षण |
||
औसत | 23,57142857 | 26,41666667 |
फैलाव | 17,34065934 | 15,35606061 |
टिप्पणियों | 14 | 12 |
एकत्रित विचरण | 16,43105159 | |
काल्पनिक माध्य अंतर | 0 | |
डीएफ | 24 | |
टी आँकड़ा | -1,784242592 | |
पी(टी<=t) одностороннее | 0,043516846 | |
टी क्रिटिकल एकतरफा | 2,492159469 | |
पी(टी<=t) двухстороннее | 0,087033692 | |
टी क्रिटिकल टू-वे | 2,796939498 |
प्रयोगशाला कार्य क्रमांक 3
युग्मित रेखीय प्रतिगमन
लक्ष्य: कंप्यूटर का उपयोग करके युग्मित प्रतिगमन के रैखिक समीकरण के निर्माण के तरीकों में महारत हासिल करना, प्रतिगमन समीकरण की मुख्य विशेषताओं को प्राप्त करना और उनका विश्लेषण करना सीखना।
आइए एक उदाहरण का उपयोग करके प्रतिगमन समीकरण बनाने की पद्धति पर विचार करें।
उदाहरण। कारकों x i और y i के नमूने दिये गये हैं। इन नमूनों का उपयोग करके, रैखिक प्रतिगमन समीकरण ỹ = ax + b खोजें। युग्म सहसंबंध गुणांक ज्ञात कीजिए। महत्व स्तर a = 0.05 पर पर्याप्तता के लिए प्रतिगमन मॉडल की जाँच करें।
एक्स | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
वाई | 6,7 | 6,3 | 4,4 | 9,5 | 5,2 | 4,3 | 7,7 | 7,1 | 7,1 | 7,9 |
प्रतिगमन समीकरण के गुणांक a और b को खोजने के लिए, SLOPE और INTERCEPT फ़ंक्शंस, श्रेणियों "सांख्यिकीय" का उपयोग करें। हम A5 में हस्ताक्षर "a=" दर्ज करते हैं और निकटवर्ती सेल B5 में TILT फ़ंक्शन दर्ज करते हैं, कर्सर को "Iz_value_y" फ़ील्ड में रखते हैं और सेल B2-K2 को माउस से घेरकर उनके लिए एक लिंक सेट करते हैं। परिणाम 0.14303 है। आइए अब गुणांक b ज्ञात करें। हम A6 में हस्ताक्षर "b=" दर्ज करते हैं, और B6 में TILT फ़ंक्शन के समान पैरामीटर के साथ CUT फ़ंक्शन दर्ज करते हैं। परिणाम 5.976364 है। इसलिए, रैखिक प्रतिगमन समीकरण y=0.14303x+5.976364 है।
आइए प्रतिगमन समीकरण को आलेखित करें। ऐसा करने के लिए, तालिका की तीसरी पंक्ति में हम दिए गए बिंदुओं X (पहली पंक्ति) - y(x 1) पर फ़ंक्शन के मान दर्ज करते हैं। इन मानों को प्राप्त करने के लिए, सांख्यिकीय श्रेणी के TREND फ़ंक्शन का उपयोग करें। हम A3 में हस्ताक्षर "Y(X)" दर्ज करते हैं और, कर्सर को B3 में रखकर, TREND फ़ंक्शन को कॉल करते हैं। फ़ील्ड "From_value_y" और "From_value_x" में हम B2-K2 और B1-K1 का लिंक देते हैं। "New_value_x" फ़ील्ड में हम B1-K1 का लिंक भी दर्ज करते हैं। यदि प्रतिगमन समीकरण का रूप y=ax+b है, तो "स्थिर" फ़ील्ड में 1 दर्ज करें, और यदि y=ax है तो 0 दर्ज करें। हमारे मामले में, हम एक दर्ज करते हैं। TREND फ़ंक्शन एक सरणी है, इसलिए इसके सभी मान प्रदर्शित करने के लिए, क्षेत्र B3-K3 चुनें और F2 और Ctrl+Shift+Enter दबाएँ। परिणाम दिए गए बिंदुओं पर प्रतिगमन समीकरण का मान है। हम एक शेड्यूल बना रहे हैं. कर्सर को किसी भी मुक्त सेल में रखें, आरेख विज़ार्ड को कॉल करें, "शार्पन्ड" श्रेणी का चयन करें, ग्राफ़ का प्रकार - बिना बिंदुओं वाली रेखा (निचले दाएं कोने में), "अगला" पर क्लिक करें, बी 3-के 3 में लिंक दर्ज करें "नैदानिक" फ़ील्ड. "पंक्ति" टैब पर जाएं और "X मान" फ़ील्ड में B1-K1 का लिंक दर्ज करें, "समाप्त करें" पर क्लिक करें। परिणाम एक सीधी प्रतिगमन रेखा है। आइए देखें कि प्रयोगात्मक डेटा और प्रतिगमन समीकरणों के ग्राफ़ कैसे भिन्न होते हैं। ऐसा करने के लिए, कर्सर को किसी भी खाली सेल में रखें, चार्ट विज़ार्ड को कॉल करें, श्रेणी "ग्राफ़", ग्राफ़ प्रकार - बिंदुओं के साथ टूटी हुई रेखा (ऊपर बाईं ओर से दूसरी), "अगला" पर क्लिक करें, "रेंज" फ़ील्ड में एक दर्ज करें दूसरी और तीसरी पंक्ति B2- K3 से लिंक करें। "पंक्ति" टैब पर जाएं और "एक्स-अक्ष लेबल" फ़ील्ड में, बी1-के1 का लिंक दर्ज करें, "समाप्त करें" पर क्लिक करें। परिणाम दो पंक्तियाँ हैं (नीला - मूल, लाल - प्रतिगमन समीकरण)। यह देखा जा सकता है कि रेखाएँ एक दूसरे से बहुत कम भिन्न हैं।
ए= | 0,14303 |
बी= | 5,976364 |
सहसंबंध गुणांक r xy की गणना करने के लिए, PEARSON फ़ंक्शन का उपयोग करें। हम ग्राफ को रखते हैं ताकि वे पंक्ति 25 से ऊपर स्थित हों, और ए25 में हम हस्ताक्षर "सहसंबंध" बनाते हैं, बी25 में हम पियर्सन फ़ंक्शन को कॉल करते हैं, जिसके क्षेत्र में "एरे 2" हम स्रोत डेटा बी1 के लिए एक लिंक दर्ज करते हैं। -K1 और B2-K2. परिणाम 0.993821 है। निर्धारण का गुणांक R xy सहसंबंध गुणांक r xy का वर्ग है। A26 में हम "निर्धारण" पर हस्ताक्षर करते हैं, और B26 में हम सूत्र "=B25*B25" लिखते हैं। परिणाम 0.265207 है।
हालाँकि, एक्सेल में एक फ़ंक्शन है जो रैखिक प्रतिगमन की सभी बुनियादी विशेषताओं की गणना करता है। यह LINEST फ़ंक्शन है. कर्सर को B28 में रखें और LINEST फ़ंक्शन, श्रेणी "सांख्यिकीय" को कॉल करें। फ़ील्ड "From_value_y" और "From_value_x" में हम B2-K2 और B1-K1 का लिंक देते हैं। "स्थिर" फ़ील्ड का अर्थ TREND फ़ंक्शन के समान है; हमारे मामले में यह 1 के बराबर है। यदि आपको प्रतिगमन के बारे में संपूर्ण आँकड़े प्रदर्शित करने की आवश्यकता है तो "स्टेट" फ़ील्ड में 1 होना चाहिए। हमारे मामले में, हमने वहां एक रखा। फ़ंक्शन 2 कॉलम और 5 पंक्तियों की एक सरणी देता है। एंटर करने के बाद माउस से सेल B28-C32 चुनें और F2 और Ctrl+Shift+Enter दबाएँ। परिणाम मानों की एक तालिका है, जिसमें संख्याओं का निम्नलिखित अर्थ है:
गुणांक ए | गुणांक बी |
मानक त्रुटि एम ओ | मानक त्रुटि एम एच |
निर्धारण गुणांक आर xy | मानक विचलन |
एफ - आँकड़े | स्वतंत्रता की डिग्री n-2 |
वर्गों का प्रतिगमन योग एस एन 2 | वर्गों का अवशिष्ट योग S n 2 |
0,14303 | 5,976364 |
0,183849 | 0,981484 |
0,070335 | 1,669889 |
0,60525 | 8 |
1,687758 | 22,30824 |
परिणाम का विश्लेषण: पहली पंक्ति में - प्रतिगमन समीकरण के गुणांक, उनकी तुलना ढलान और अवरोधन के परिकलित कार्यों से करें। दूसरी पंक्ति गुणांकों की मानक त्रुटियाँ है। यदि उनमें से एक गुणांक से निरपेक्ष मान में अधिक है, तो गुणांक शून्य माना जाता है। निर्धारण का गुणांक कारकों के बीच संबंध की गुणवत्ता को दर्शाता है। 0.070335 का परिणामी मान कारकों के बीच एक बहुत अच्छे संबंध को इंगित करता है, एफ - सांख्यिकी प्रतिगमन मॉडल की पर्याप्तता के बारे में परिकल्पना का परीक्षण करती है। इस संख्या की तुलना महत्वपूर्ण मान से की जानी चाहिए, इसे प्राप्त करने के लिए हम E33 में हस्ताक्षर "F-क्रिटिकल" दर्ज करते हैं, और F33 में फ़ंक्शन FRIST, जिसके तर्क हम क्रमशः "0.05" (महत्व स्तर), "1" दर्ज करते हैं। (कारकों की संख्या X) और "8" (स्वतंत्रता की डिग्री)।
एफ-महत्वपूर्ण | 5,317655 |
यह देखा जा सकता है कि एफ-सांख्यिकी एफ-महत्वपूर्ण से कम है, जिसका अर्थ है कि प्रतिगमन मॉडल पर्याप्त नहीं है। अंतिम पंक्ति वर्गों का प्रतिगमन योग दर्शाती है और वर्गों का अवशिष्ट योग . यह महत्वपूर्ण है कि प्रतिगमन योग (प्रतिगमन द्वारा समझाया गया) अवशिष्ट से बहुत बड़ा है (प्रतिगमन द्वारा समझाया नहीं गया, यादृच्छिक कारकों के कारण)। हमारे मामले में, यह शर्त पूरी नहीं हुई है, जो खराब प्रतिगमन को इंगित करता है।
निष्कर्ष: अपने काम के दौरान, मैंने कंप्यूटर का उपयोग करके युग्म प्रतिगमन के एक रैखिक समीकरण के निर्माण के तरीकों में महारत हासिल की, प्रतिगमन समीकरण की मुख्य विशेषताओं को प्राप्त करना और उनका विश्लेषण करना सीखा।
प्रयोगशाला कार्य संख्या 4
अरेखीय प्रतिगमन
लक्ष्य: कंप्यूटर (आंतरिक रैखिक मॉडल) का उपयोग करके मुख्य प्रकार के गैर-रेखीय जोड़ी प्रतिगमन समीकरणों के निर्माण के तरीकों में महारत हासिल करना, प्रतिगमन समीकरणों के गुणवत्ता संकेतक प्राप्त करना और उनका विश्लेषण करना सीखना।
आइए उस मामले पर विचार करें जब डेटा परिवर्तन (आंतरिक रैखिक मॉडल) का उपयोग करके गैर-रेखीय मॉडल को रैखिक में कम किया जा सकता है।
उदाहरण। नमूना x n y n (f = 1,2,…,10) के लिए एक प्रतिगमन समीकरण y = f(x) बनाएं। f(x) के रूप में, चार प्रकार के कार्यों पर विचार करें - रैखिक, शक्ति, घातीय और हाइपरबोला:
y = कुल्हाड़ी + बी; y = कुल्हाड़ी बी; y = एई बीएक्स; वाई = ए/एक्स + बी.
उनके गुणांक ए और बी को ढूंढना आवश्यक है, और गुणवत्ता संकेतकों की तुलना करने के बाद, उस फ़ंक्शन का चयन करें जो निर्भरता का सबसे अच्छा वर्णन करता है।
लाभ वाई | 0,3 | 1,2 | 2,8 | 5,2 | 8,1 | 11,0 | 16,8 | 16,9 | 24,7 | 29,4 |
लाभ एक्स | 0,25 | 0,50 | 0,75 | 1,00 | 1,25 | 1,50 | 1,75 | 2,00 | 2,25 | 2,50 |
आइए हस्ताक्षर (कोशिका A1-K2) के साथ तालिका में डेटा दर्ज करें। आइए परिवर्तित डेटा दर्ज करने के लिए तालिका के नीचे तीन पंक्तियाँ खाली छोड़ दें, 1 से 5 तक की संख्याओं के साथ बाईं ग्रे सीमा पर स्वाइप करके पहली पाँच पंक्तियाँ चुनें और पृष्ठभूमि को रंगने के लिए एक रंग (हल्का - पीला या गुलाबी) चुनें कोशिकाएं. अगला, A6 से शुरू करके, हम रैखिक प्रतिगमन पैरामीटर प्रदर्शित करते हैं। ऐसा करने के लिए, सेल A6 में "रैखिक" लिखें और आसन्न सेल B6 में LINEST फ़ंक्शन दर्ज करें। "Izv_value_x" फ़ील्ड में हम B2-K2 और B1-K1 का लिंक देते हैं, अगले दो फ़ील्ड एक का मान लेते हैं। इसके बाद, नीचे के क्षेत्र को 5 पंक्तियों में और बाईं ओर 2 पंक्तियों में घेरें और F2 और Ctrl+Shift+Enter दबाएँ। परिणाम प्रतिगमन मापदंडों वाली एक तालिका है, जिसमें से पहले कॉलम में निर्धारण का गुणांक, ऊपर से तीसरा, सबसे अधिक रुचि का है। हमारे मामले में, यह R 1 = 0.951262 के बराबर है। एफ-मानदंड का मान, जो मॉडल एफ 1 = 156.1439 की पर्याप्तता की जांच करने की अनुमति देता है
(चौथी पंक्ति, पहला स्तंभ)। प्रतिगमन समीकरण है
y = 12.96 x +6.18 (गुणांक a और b सेल B6 और C6 में दिए गए हैं)।
रेखीय | 12,96 | -6,18 |
1,037152 | 1,60884 | |
0,951262 | 2,355101 | |
156,1439 | 8 | |
866,052 | 44,372 |
आइए हम अन्य प्रतिगमन के लिए समान विशेषताओं का निर्धारण करें और, निर्धारण के गुणांकों की तुलना करने के परिणामस्वरूप, हम सर्वोत्तम प्रतिगमन मॉडल पाएंगे। आइए अतिशयोक्तिपूर्ण प्रतिगमन पर विचार करें। इसे प्राप्त करने के लिए, हम डेटा को रूपांतरित करते हैं। तीसरी पंक्ति में, सेल A3 में हम हस्ताक्षर "1/x" दर्ज करते हैं और सेल B3 में हम सूत्र "=1/B2" दर्ज करते हैं। आइए इस सेल को क्षेत्र B3-K3 में स्वचालित रूप से भरें। आइए प्रतिगमन मॉडल की विशेषताएं प्राप्त करें। सेल A12 में हम हस्ताक्षर "हाइपरबोला" दर्ज करते हैं, और आसन्न LINEST फ़ंक्शन में। फ़ील्ड "From_value_y" और "From_value_x2" में हम B1-K1 का लिंक देते हैं और तर्क x - B3-K3 का परिवर्तित डेटा देते हैं, अगले दो फ़ील्ड एक का मान लेते हैं। इसके बाद, बाईं ओर 5 लाइनों और 2 लाइनों के नीचे के क्षेत्र पर गोला बनाएं और F2 और Ctrl+Shift+Enter दबाएँ। हमें प्रतिगमन मापदंडों की एक तालिका मिलती है। में निर्धारण का गुणांक इस मामले मेंआर 2 = 0.475661 के बराबर है, जो रैखिक प्रतिगमन की तुलना में बहुत खराब है। F-सांख्यिकी F2 = 7.257293 है। प्रतिगमन समीकरण y = -6.25453x 18.96772 है।
अतिशयोक्ति | -6,25453 | 18,96772 |
2,321705 | 3,655951 | |
0,475661 | 7,724727 | |
7,257293 | 8 | |
433,0528 | 477,3712 |
आइए घातीय प्रतिगमन पर विचार करें। इसे रैखिक बनाने के लिए, हम समीकरण प्राप्त करते हैं, जहां ỹ = ln y, ã = b, = ln a। यह देखा जा सकता है कि डेटा परिवर्तन करने की आवश्यकता है - y को ln y से बदलें। कर्सर को सेल A4 में रखें और शीर्षक "ln y" बनाएं। कर्सर को B4 में रखें और LN सूत्र (श्रेणी "गणितीय") दर्ज करें। एक तर्क के रूप में, हम B1 का संदर्भ देते हैं। ऑटोफ़िल का उपयोग करके, हम सूत्र को चौथी पंक्ति से लेकर कक्ष B4-K4 तक विस्तारित करते हैं। इसके बाद, सेल F6 में हम हस्ताक्षर "एक्सपोनेंट" सेट करते हैं और आसन्न G6 में हम LINEST फ़ंक्शन दर्ज करते हैं, जिसके तर्क रूपांतरित डेटा B4-K4 ("मापा_मूल्य_y" फ़ील्ड में) होंगे, और शेष फ़ील्ड हैं रैखिक प्रतिगमन (बी2-के2, ग्यारह) के मामले के समान। इसके बाद, सेल G6-H10 पर गोला बनाएं और F2 और Ctrl+Shift+Enter दबाएँ। परिणाम आर 3 = 0.89079, एफ 3 = 65.25304 है, जो एक बहुत अच्छे प्रतिगमन को इंगित करता है। प्रतिगमन समीकरण b = ã के गुणांक ज्ञात करने के लिए; कर्सर को J6 में रखें और शीर्षक “a=” बनाएं, और पड़ोसी K6 में सूत्र “=EXP(H6)” बनाएं, J7 में हम शीर्षक “b=” देते हैं, और K7 में सूत्र “=G6” बनाते हैं। प्रतिगमन समीकरण y = 0.511707· e 6.197909 x है।
प्रदर्शक | 1,824212 | -0,67 | ए= | 0,511707 | |
0,225827 | 0,350304 | बी= | 6,197909 | ||
0,89079 | 0,512793 | ||||
65,25304 | 8 | ||||
17,15871 | 2,103652 |
आइए शक्ति प्रतिगमन पर विचार करें। इसे रैखिक बनाने के लिए, हम समीकरण ỹ = ã प्राप्त करते हैं, जहां ỹ = ln y, = ln x, ã = b, = ln a। यह देखा जा सकता है कि डेटा को बदलना आवश्यक है - y को ln y से बदलें और x को ln x से बदलें। हमारे पास पहले से ही ln y वाली लाइन है। आइए x वेरिएबल्स को रूपांतरित करें। सेल A5 में हम हस्ताक्षर "ln x" लिखते हैं, और सेल B5 में हम सूत्र LN (श्रेणी "गणितीय") दर्ज करते हैं। एक तर्क के रूप में, हम B2 का संदर्भ देते हैं। ऑटोफ़िल का उपयोग करके, हम सूत्र को पांचवीं पंक्ति से लेकर कक्ष B5-K5 तक विस्तारित करते हैं। अगला, सेल F12 में हम हस्ताक्षर "पावर" सेट करते हैं और आसन्न G12 में हम LINEST फ़ंक्शन दर्ज करते हैं, जिसके तर्क परिवर्तित डेटा B4-K4 ("From_value_y" फ़ील्ड में), और B5-K5 (में) होंगे "From_value_x" फ़ील्ड), शेष फ़ील्ड एक हैं। इसके बाद, सेल G12-H16 को मुक्त करें और F2 और Ctrl+Shift+Enter दबाएँ। परिणाम R 4 = 0.997716, F 4 = 3494.117 है, जो अच्छे प्रतिगमन को इंगित करता है। प्रतिगमन समीकरण b = ã के गुणांक ज्ञात करने के लिए; J12 में कर्सर रखें और शीर्षक "a=" बनाएं, और पड़ोसी K12 में सूत्र "=EXP(H12)" बनाएं, J13 में हम शीर्षक "b=" देते हैं और K13 में सूत्र "=G12" बनाएं। प्रतिगमन समीकरण y = 4.90767/x+ 7.341268 है।
शक्ति | 1,993512 | 1,590799 | ए= | 4,90767 | |
0,033725 | 0,023823 | बी= | 7,341268 | ||
0,997716 | 0,074163 | ||||
3494,117 | 8 | ||||
19,21836 | 0,044002 |
आइए जाँच करें कि क्या सभी समीकरण डेटा का पर्याप्त रूप से वर्णन करते हैं। ऐसा करने के लिए, आपको प्रत्येक मानदंड के एफ-सांख्यिकी की तुलना महत्वपूर्ण मान से करनी होगी। इसे प्राप्त करने के लिए, हम A21 में हस्ताक्षर "F-क्रिटिकल" दर्ज करते हैं, और B21 में फ़ंक्शन FRIST, जिसके तर्क हम क्रमशः "0.05" (महत्व स्तर), "1" (कारकों X की संख्या) दर्ज करते हैं पंक्ति "महत्व स्तर 1") और "8" (स्वतंत्रता की डिग्री 2 = एन - 2)। परिणाम 5.317655 है। एफ - क्रिटिकल, एफ - सांख्यिकी से अधिक है, जिसका अर्थ है कि मॉडल पर्याप्त है। शेष प्रतिगमन भी पर्याप्त हैं। यह निर्धारित करने के लिए कि कौन सा मॉडल डेटा का सबसे अच्छा वर्णन करता है, हम प्रत्येक मॉडल आर 1, आर 2, आर 3, आर 4 के निर्धारण सूचकांकों की तुलना करते हैं। सबसे बड़ा R4 = 0.997716 है। इसका मतलब यह है कि प्रयोगात्मक डेटा को y = 4.90767/x + 7.341268 द्वारा बेहतर वर्णित किया गया है।
निष्कर्ष: अपने काम के दौरान, मैंने कंप्यूटर (आंतरिक रैखिक मॉडल) का उपयोग करके मुख्य प्रकार के गैर-रेखीय जोड़ीदार प्रतिगमन समीकरणों के निर्माण के तरीकों में महारत हासिल की, प्रतिगमन समीकरणों के गुणवत्ता संकेतक प्राप्त करना और उनका विश्लेषण करना सीखा।
वाई | 0,3 | 1,2 | 2,8 | 5,2 | 8,1 | 11 | 16,8 | 16,9 | 24,7 | 29,4 |
एक्स | 0,25 | 0,5 | 0,75 | 1 | 1,25 | 1,5 | 1,75 | 2 | 2,25 | 2,5 |
1/x | 4 | 2 | 1,333333 | 1 | 0,8 | 0,666667 | 0,571429 | 0,5 | 0,444444 | 0,4 |
एलएन वाई | -1,20397 | 0,182322 | 1,029619 | 1,648659 | 2,0918641 | 2,397895 | 2,821379 | 2,827314 | 3,206803 | 3,380995 |
एलएन एक्स | -1,38629 | -0,69315 | -0,28768 | 0 | 0,2231436 | 0,405465 | 0,559616 | 0,693147 | 0,81093 | 0,916291 |
रेखीय | 12,96 | -6,18 | प्रदर्शक | 1,824212 | -0,67 | ए= | 0,511707 | |||
1,037152 | 1,60884 | 0,225827 | 0,350304 | बी= | 6,197909 | |||||
0,951262 | 2,355101 | 0,89079 | 0,512793 | |||||||
156,1439 | 8 | 65,25304 | 8 | |||||||
866,052 | 44,372 | 17,15871 | 2,103652 | |||||||
अतिशयोक्ति | -6,25453 | 18,96772 | शक्ति | 1,993512 | 1,590799 | ए= | 4,90767 | |||
2,321705 | 3,655951 | 0,033725 | 0,023823 | बी= | 7,341268 | |||||
0,475661 | 7,724727 | 0,997716 | 0,074163 | |||||||
7,257293 | 8 | 3494,117 | 8 | |||||||
433,0528 | 477,3712 | 19,21836 | 0,044002 | |||||||
एफ - गंभीर | 5,317655 | |||||||||
प्रयोगशाला कार्य क्रमांक 5
बहुपद प्रतिगमन
उद्देश्य: प्रयोगात्मक डेटा का उपयोग करके, y = ax 2 + bx + c के रूप का एक प्रतिगमन समीकरण बनाएं।
प्रगति:
मिट्टी x i पर लागू खनिज उर्वरकों की मात्रा पर एक निश्चित फसल y i की उपज की निर्भरता पर विचार किया जाता है। यह माना जाता है कि यह निर्भरता द्विघात है। ỹ = ax 2 + bx + c के रूप का प्रतिगमन समीकरण खोजना आवश्यक है।
एक्स | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
य | 29,8 | 58,8 | 72,2 | 101,5 | 141 | 135,1 | 156,6 | 181,7 | 216,6 | 208,2 |
आइए इस डेटा को सेल A1-K2 में हस्ताक्षरों के साथ स्प्रेडशीट में दर्ज करें। आइए एक ग्राफ बनाएं. ऐसा करने के लिए, डेटा Y (सेल B2-K2) पर गोला बनाएं, चार्ट विज़ार्ड को कॉल करें, चार्ट प्रकार "ग्राफ़" चुनें, चार्ट प्रकार - डॉट्स वाला ग्राफ़ (ऊपर बाईं ओर से दूसरा), "अगला" पर क्लिक करें, पर जाएं "श्रृंखला" टैब और "एक्स-अक्ष लेबल" में बी2-के2 के लिए एक लिंक बनाएं, "समाप्त करें" पर क्लिक करें। ग्राफ़ को घात 2 y = ax 2 + bx + c के बहुपद द्वारा अनुमानित किया जा सकता है। गुणांक ए, बी, सी खोजने के लिए, आपको समीकरणों की प्रणाली को हल करने की आवश्यकता है:
आइए राशियों की गणना करें। ऐसा करने के लिए, सेल A3 में हस्ताक्षर "X^2" दर्ज करें, और सेल B3 में सूत्र "= B1*B1" दर्ज करें और इसे ऑटोफिल का उपयोग करके पूरी लाइन B3-K3 में स्थानांतरित करें। सेल A4 में हम हस्ताक्षर "X^3" दर्ज करते हैं, और B4 में सूत्र "=B1*B3" दर्ज करते हैं और ऑटोफिल इसे पूरी लाइन B4-K4 में स्थानांतरित कर देते हैं। सेल A5 में हम "X^4" दर्ज करते हैं, और B5 में सूत्र "=B4*B1" दर्ज करते हैं, लाइन को ऑटोफिल करते हैं। सेल A6 में हम "X*Y" दर्ज करते हैं, और B8 में सूत्र "=B2*B1" दर्ज करते हैं, लाइन को स्वत: भरते हैं। सेल A7 में हम "X^2*Y" दर्ज करते हैं, और B9 में सूत्र "=B3*B2" दर्ज करते हैं, लाइन को ऑटोफिल करते हैं। अब हम रकम गिनते हैं. हेडर पर क्लिक करके और एक रंग का चयन करके एक अलग रंग के साथ कॉलम एल का चयन करें। कर्सर को सेल L1 में रखें और पहली पंक्ति के योग की गणना करने के लिए ∑ आइकन के साथ ऑटोसम बटन पर क्लिक करें। ऑटोफ़िल का उपयोग करके, हम सूत्र को कक्ष L1-710 में स्थानांतरित करते हैं।
अब हम समीकरणों की प्रणाली को हल करते हैं। ऐसा करने के लिए, हम सिस्टम के मुख्य मैट्रिक्स का परिचय देते हैं। सेल A13 में हम हस्ताक्षर "A=" दर्ज करते हैं, और मैट्रिक्स सेल B13-D15 में हम तालिका में प्रतिबिंबित लिंक दर्ज करते हैं
बी | सी | डी | |
13 | =L5 | =एल4 | =एल3 |
14 | =एल3 | =एल2 | =एल1 |
15 | =एल2 | =एल1 | =9 |
हम समीकरणों की प्रणाली के दाएँ पक्ष का भी परिचय देते हैं। G13 में हम हस्ताक्षर "B=" दर्ज करते हैं, और H13-H15 में हम क्रमशः सेल "=L7", "=L6", "=L2" के लिंक दर्ज करते हैं। हम मैट्रिक्स विधि का उपयोग करके सिस्टम को हल करते हैं। उच्च गणित से यह ज्ञात होता है कि समाधान A-1 B के बराबर है। व्युत्क्रम मैट्रिक्स ज्ञात कीजिए। ऐसा करने के लिए, सेल J13 में हस्ताक्षर "A arr" दर्ज करें। और, कर्सर को K13 में रखकर, MOBR फॉर्मूला (श्रेणी "गणितीय") सेट करें। ऐरे तर्क के रूप में, हम कक्ष B13:D15 का संदर्भ प्रदान करते हैं। परिणाम भी 4x4 मैट्रिक्स होना चाहिए। इसे प्राप्त करने के लिए, सेल K13-M15 पर माउस से गोला बनाएं, उन्हें चुनें और F2 और Ctrl+Shift+Enter दबाएँ। परिणाम मैट्रिक्स A-1 है। आइए अब इस मैट्रिक्स और कॉलम बी (सेल H13-H15) का उत्पाद ढूंढें। हम सेल A18 में हस्ताक्षर "गुणांक" दर्ज करते हैं और B18 में हम मल्टीपल फ़ंक्शन (श्रेणी "गणितीय") सेट करते हैं। "ऐरे 1" फ़ंक्शन के तर्क मैट्रिक्स ए-1 (सेल्स के13-एम15) के लिए एक लिंक हैं, और "ऐरे 2" फ़ील्ड में हम कॉलम बी (सेल्स एच13-एच16) के लिए एक लिंक प्रदान करते हैं। इसके बाद, B18-B20 चुनें और F2 और Ctrl+Shift+Enter दबाएँ। परिणामी सरणी प्रतिगमन समीकरण ए, बी, सी के गुणांक है। परिणामस्वरूप, हमें फॉर्म का एक प्रतिगमन समीकरण प्राप्त होता है: y = 1.201082x 2 - 5.619177x + 78.48095।
आइए मूल डेटा और प्रतिगमन समीकरण के आधार पर प्राप्त डेटा के ग्राफ़ बनाएं। ऐसा करने के लिए, सेल A8 में हस्ताक्षर "रिग्रेशन" दर्ज करें और B8 में सूत्र "=$B$18*B3+$B$19*B1+$B$20" दर्ज करें। ऑटोफ़िल का उपयोग करके, हम सूत्र को कक्ष B8-K8 में स्थानांतरित करते हैं। ग्राफ़ बनाने के लिए, सेल B8-K8 का चयन करें और Ctrl कुंजी दबाए रखते हुए, सेल B2-M2 का भी चयन करें। चार्ट विज़ार्ड को कॉल करें, चार्ट प्रकार "ग्राफ़" चुनें, चार्ट प्रकार - बिंदुओं के साथ ग्राफ़ (ऊपर बाईं ओर से दूसरा), "अगला" पर क्लिक करें, "श्रृंखला" टैब पर जाएं और "एक्स-अक्ष लेबल" फ़ील्ड में बनाएं B2-M2 का लिंक, "तैयार" पर क्लिक करें। यह देखा जा सकता है कि वक्र लगभग मेल खाते हैं।
निष्कर्ष: कार्य की प्रक्रिया में, प्रयोगात्मक डेटा के आधार पर, मैंने फॉर्म y = ax 2 + bx + c का एक प्रतिगमन समीकरण बनाना सीखा।
एक्स | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | |||
य | 29,8 | 58,8 | 72,2 | 101,5 | 141 | 135,1 | 156,6 | 181,7 | 216,6 | 208,2 | |||
एक्स^2 | 0 | 1 | 4 | 9 | 16 | 25 | 36 | 49 | 64 | 81 | |||
एक्स^3 | 0 | 1 | 8 | 27 | 64 | 125 | 216 | 343 | 512 | 729 | |||
एक्स^4 | 0 | 1 | 16 | 81 | 256 | 625 | 1296 | 2401 | 4096 | 6561 | |||
एक्स*वाई | 0 | 58,8 | 144,4 | 304,5 | 564 | 675,5 | 939,6 | 1271,9 | 1732,8 | 1873,8 | |||
एक्स^2*वाई | 0 | 58,8 | 288,8 | 913,5 | 2256 | 3377,5 | 5637,6 | 8903,3 | 13862,4 | 16864,2 | |||
प्रतिगमन। | 78,48095 | 85,30121 | 94,52364 | 106,1482 | 120,175 | 136,6039 | 155,435 | 176,6682 | 200,3036 | 226,3412 | |||
ए= | 15333 | 2025 | 285 | बी= | 52162,1 | ए अर. | 0,003247 | -0,03247 | 0,059524 | ||||
2025 | 285 | 45 | 7565,3 | -0,03247 | 0,341342 | -0,67857 | |||||||
285 | 45 | 9 | 1301,5 | 0,059524 | -0,67857 | 1,619048 | |||||||
गुणक | 1,201082 | ए | |||||||||||
5,619177 |
5 नवंबर 2012 5 नवंबर 2012 5 नवंबर 2012 5 नवंबर 2012 व्याख्यान 6. दो नमूनों की तुलना 6-1। साधनों की समानता की परिकल्पना. युग्मित नमूने 6-2। साधनों में अंतर के लिए विश्वास अंतराल। युग्मित नमूने 6-3. प्रसरणों की समानता की परिकल्पना 6-4. शेयरों की समानता की परिकल्पना 6-5. अनुपातों में अंतर के लिए विश्वास अंतराल
2 इवानोव ओ.वी., 2005 इस व्याख्यान में... पिछले व्याख्यान में हमने दो सामान्य आबादी के औसत की समानता के बारे में परिकल्पना का परीक्षण किया और निर्माण किया विश्वास अंतरालस्वतंत्र नमूनों के मामले में साधनों के अंतर के लिए। अब हम साधनों की समानता की परिकल्पना के परीक्षण के लिए मानदंड पर विचार करेंगे और युग्मित (आश्रित) नमूनों के मामले में साधनों में अंतर के लिए एक विश्वास अंतराल का निर्माण करेंगे। फिर धारा 6-3 में भिन्नताओं की समानता की परिकल्पना का परीक्षण किया जाएगा, धारा 6-4 में - शेयरों की समानता की परिकल्पना का परीक्षण किया जाएगा। अंत में, हम अनुपातों में अंतर के लिए एक विश्वास अंतराल का निर्माण करते हैं।
5 नवंबर 2012 5 नवंबर 2012 5 नवंबर 2012 5 नवंबर 2012 साधनों की समानता की परिकल्पना। युग्मित नमूने समस्या का विवरण परिकल्पना और आँकड़े क्रियाओं का क्रम उदाहरण
4 इवानोव ओ.वी., 2005 युग्मित नमूने। समस्या का विवरण हमारे पास क्या है 1. दो सामान्य आबादी से प्राप्त दो सरल यादृच्छिक नमूने। नमूने युग्मित (आश्रित) हैं। 2. दोनों नमूनों का आकार n 30 है। यदि नहीं, तो दोनों नमूने सामान्य रूप से वितरित आबादी से लिए गए हैं। हम जो चाहते हैं वह दो आबादी के साधनों के बीच अंतर के बारे में परिकल्पना का परीक्षण करना है:
5 इवानोव ओ.वी., 2005 युग्मित नमूनों के लिए आँकड़े परिकल्पना का परीक्षण करने के लिए, आँकड़ों का उपयोग किया जाता है: एक जोड़ी में दो मानों के बीच अंतर कहाँ है - युग्मित अंतरों के लिए सामान्य औसत - युग्मित अंतरों के लिए नमूना औसत - मानक विचलननमूने के लिए अंतर - जोड़ियों की संख्या
6 इवानोव ओ.वी., 2005 उदाहरण। छात्रों का प्रशिक्षण 15 छात्रों के एक समूह ने प्रशिक्षण से पहले और बाद में एक परीक्षा दी। परीक्षण के परिणाम तालिका में हैं. आइए 0.05 के महत्व स्तर पर छात्रों की तैयारी पर प्रशिक्षण के प्रभाव की अनुपस्थिति के लिए युग्मित नमूनों की परिकल्पना का परीक्षण करें। समाधान। आइए अंतरों और उनके वर्गों की गणना करें। स्टूडेंट बिफोर आफ्टर Σ= 21 Σ= 145
7 इवानोव ओ.वी., 2005 समाधान चरण 1. मुख्य और वैकल्पिक परिकल्पनाएँ: चरण 2. महत्व स्तर =0.05 निर्धारित है। चरण 3. df = 15 - 1=14 के लिए तालिका का उपयोग करते हुए, हम महत्वपूर्ण मान t = 2.145 पाते हैं और महत्वपूर्ण क्षेत्र लिखते हैं: t > 2.145। 2.145।"> 2.145।"> 2.145।" title='7 इवानोव ओ.वी., 2005 समाधान चरण 1. मुख्य और वैकल्पिक परिकल्पना: चरण 2। महत्व स्तर = 0.05 निर्धारित है। चरण 3. डीएफ के लिए तालिका के अनुसार = 15 - 1=14 हम क्रांतिक मान t = 2.145 पाते हैं और क्रांतिक क्षेत्र लिखते हैं: t > 2.145।"> title="7 इवानोव ओ.वी., 2005 समाधान चरण 1. मुख्य और वैकल्पिक परिकल्पनाएँ: चरण 2. महत्व स्तर =0.05 निर्धारित है। चरण 3. df = 15 - 1=14 के लिए तालिका का उपयोग करते हुए, हम महत्वपूर्ण मान t = 2.145 पाते हैं और महत्वपूर्ण क्षेत्र लिखते हैं: t > 2.145।"> !}
9 इवानोव ओ.वी., 2005 समाधान सांख्यिकी मान लेता है: चरण 5. प्राप्त मूल्य की तुलना क्रांतिक क्षेत्र से करें। 1.889
5 नवंबर 2012 5 नवंबर 2012 5 नवंबर 2012 5 नवंबर 2012 साधनों में अंतर के लिए कॉन्फिडेंस अंतराल। युग्मित नमूने समस्या कथन आत्मविश्वास अंतराल के निर्माण की विधि उदाहरण
11 इवानोव ओ.वी., 2005 समस्या का विवरण हमारे पास क्या है हमारे पास दो सामान्य आबादी से आकार n के दो यादृच्छिक युग्मित (आश्रित) नमूने हैं। सामान्य आबादी में पैरामीटर 1, 1 और 2, 2 के साथ एक सामान्य वितरण कानून होता है या दोनों नमूनों की मात्रा 30 होती है। हम जो चाहते हैं वह दो सामान्य आबादी के लिए युग्मित अंतर के औसत मूल्य का अनुमान लगाना है। ऐसा करने के लिए, फॉर्म में औसत के लिए एक विश्वास अंतराल बनाएं:
5 नवंबर, 2012 5 नवंबर, 2012 5 नवंबर, 2012 5 नवंबर, 2012 भिन्नताओं की समानता की परिकल्पना, समस्या का विवरण, परिकल्पनाएं और आंकड़े, क्रियाओं का क्रम, उदाहरण
15 इवानोव ओ.वी., 2005 अध्ययन के दौरान... शोधकर्ता को इस धारणा की जांच करने की आवश्यकता हो सकती है कि अध्ययन की जा रही दो आबादी के भिन्नताएं बराबर हैं। उस मामले में जहां ये सामान्य आबादी है सामान्य वितरण, इसके लिए एक एफ-टेस्ट है, जिसे फिशर मानदंड भी कहा जाता है। स्टूडेंट के विपरीत, फिशर शराब की भट्टी में काम नहीं करता था।
16 इवानोव ओ.वी., 2005 समस्या का विवरण हमारे पास क्या है 1. दो सामान्य रूप से वितरित आबादी से प्राप्त दो सरल यादृच्छिक नमूने। 2. नमूने स्वतंत्र हैं. इसका मतलब यह है कि नमूना विषयों के बीच कोई संबंध नहीं है। हम जो चाहते हैं वह जनसंख्या भिन्नता की समानता की परिकल्पना का परीक्षण करना है:
23 इवानोव ओ.वी., 2005 उदाहरण एक चिकित्सा शोधकर्ता यह जांचना चाहता है कि धूम्रपान करने वाले और धूम्रपान न करने वाले रोगियों की हृदय गति (प्रति मिनट धड़कन की संख्या) के बीच अंतर है या नहीं। यादृच्छिक रूप से चयनित दो समूहों के परिणाम नीचे दिखाए गए हैं। α = 0.05 का उपयोग करके पता लगाएं कि डॉक्टर सही है या नहीं। धूम्रपान करने वाले धूम्रपान न करने वाले
24 इवानोव ओ.वी., 2005 समाधान चरण 1. मुख्य और वैकल्पिक परिकल्पनाएँ: चरण 2. महत्व स्तर =0.05 निर्धारित है। चरण 3. अंश 25 और हर 17 की स्वतंत्रता की डिग्री की संख्या के लिए तालिका का उपयोग करके, हम महत्वपूर्ण मान f = 2.19 और महत्वपूर्ण क्षेत्र पाते हैं: f > 2.19। चरण 4. नमूने का उपयोग करके, हम सांख्यिकी मूल्य की गणना करते हैं: 2.19. चरण 4. नमूने का उपयोग करके, हम सांख्यिकी मान की गणना करते हैं: ">
5 नवंबर 2012 5 नवंबर 2012 5 नवंबर 2012 5 नवंबर 2012 समान शेयरों की परिकल्पना समस्या का विवरण परिकल्पना और आंकड़े कार्यों का क्रम उदाहरण
27 इवानोव ओ.वी., 2005 प्रश्न समाजशास्त्र संकाय के 100 यादृच्छिक रूप से चयनित छात्रों में से 43 विशेष पाठ्यक्रमों में भाग लेते हैं। बेतरतीब ढंग से चुने गए 200 अर्थशास्त्र के छात्रों में से 90 विशेष पाठ्यक्रमों में भाग लेते हैं। क्या विशेष पाठ्यक्रमों में भाग लेने वाले छात्रों का अनुपात समाजशास्त्र और अर्थशास्त्र विभागों के बीच भिन्न है? यह कुछ खास अलग नहीं लगता. मैं इसकी जाँच कैसे कर सकता हूँ? विशेष पाठ्यक्रमों में भाग लेने वालों का हिस्सा विशेषता का हिस्सा है। 43 - "सफलताओं" की संख्या। 43/100 - सफलता का हिस्सा। शब्दावली बर्नौली की योजना के समान ही है।
28 इवानोव ओ.वी., 2005 समस्या का विवरण हमारे पास क्या है 1. दो सामान्य रूप से वितरित आबादी से प्राप्त दो सरल यादृच्छिक नमूने। नमूने स्वतंत्र हैं. 2. नमूनों के लिए, एनपी 5 और एनक्यू 5 पूरे हो गए हैं। इसका मतलब है कि नमूने के कम से कम 5 तत्वों में अध्ययन की गई विशेषता मान है, और कम से कम 5 में नहीं है। हम जो चाहते हैं वह दो सामान्य आबादी में किसी विशेषता के शेयरों की समानता के बारे में परिकल्पना का परीक्षण करना है:
31 इवानोव ओ.वी., 2005 उदाहरण। दो संकायों के विशेष पाठ्यक्रम समाजशास्त्र संकाय के 100 यादृच्छिक रूप से चयनित छात्रों में से 43 विशेष पाठ्यक्रमों में भाग लेते हैं। अर्थशास्त्र के 200 छात्रों में से 90 विशेष पाठ्यक्रमों में भाग लेते हैं। महत्व स्तर = 0.05 पर, इस परिकल्पना का परीक्षण करें कि इन दोनों संकायों में विशेष पाठ्यक्रमों में भाग लेने वाले छात्रों के अनुपात में कोई अंतर नहीं है। 33 इवानोव ओ.वी., 2005 समाधान चरण 1. मुख्य और वैकल्पिक परिकल्पनाएँ: चरण 2. महत्व स्तर =0.05 निर्धारित है। चरण 3. सामान्य वितरण तालिका का उपयोग करते हुए, हम महत्वपूर्ण मान z = - 1.96 और z = 1.96 पाते हैं, और महत्वपूर्ण क्षेत्र का निर्माण करते हैं: z 1.96। चरण 4. नमूने के आधार पर, हम आँकड़ों के मूल्य की गणना करते हैं।
34 इवानोव ओ.वी., 2005 समाधान चरण 5. प्राप्त मूल्य की तुलना क्रांतिक क्षेत्र से करें। परिणामी आँकड़ा मूल्य महत्वपूर्ण क्षेत्र में नहीं आता। चरण 6. निष्कर्ष तैयार करें। मुख्य परिकल्पना को अस्वीकार करने का कोई कारण नहीं है। विशेष पाठ्यक्रमों में भाग लेने वालों की हिस्सेदारी सांख्यिकीय रूप से बहुत भिन्न नहीं है।
5 नवंबर 2012 5 नवंबर 2012 5 नवंबर 2012 5 नवंबर 2012 अनुपात में अंतर के लिए कॉन्फिडेंस अंतराल समस्या का विवरण कॉन्फिडेंस इंटरवल बनाने की विधि उदाहरण
दो स्वतंत्र नमूनों x 1, x 2, ….., x n और y 1, y 2, …, y n पर विचार करें, जो सामान्य आबादी से समान भिन्नताओं के साथ निकाले गए हैं, क्रमशः नमूना आकार n और m के साथ, और औसत μ x, μ y और प्रसरण σ 2 अज्ञात हैं। मुख्य परिकल्पना H 0: μ x = μ y का प्रतिस्पर्धी H 1: μ x μ y के साथ परीक्षण करना आवश्यक है।
जैसा कि ज्ञात है, नमूना औसत में निम्नलिखित गुण होंगे: ~N(μ x, σ 2 /n), ~N(μ y, σ 2 /m)।
उनका अंतर औसत के साथ एक सामान्य मान है और भिन्नता, इसलिए
~ (23).
आइए एक क्षण के लिए मान लें कि मुख्य परिकल्पना H 0 सही है: μ x – μ y =0। तब और मान को उसके मानक विचलन से विभाजित करने पर, हमें मानक सामान्य sl प्राप्त होता है। आकार ~एन(0,1).
ऐसा पहले ही नोट कर लिया गया था परिमाण स्वतंत्रता की (एन-1)वीं डिग्री के साथ कानून के अनुसार वितरित, ए - कानून के अनुसार (एम-1) स्वतंत्रता की डिग्री के साथ। इन दोनों राशियों की स्वतंत्रता को ध्यान में रखते हुए, हम पाते हैं कि वे हैं कुल राशि स्वतंत्रता की n+m-2 डिग्री के साथ कानून के अनुसार वितरित।
चरण 7 को याद करते हुए, हम देखते हैं कि भिन्न ν=m+n-2 स्वतंत्रता की डिग्री के साथ t-वितरण (छात्र) का पालन करता है: Z=t। यह तथ्य तभी घटित होता है जब परिकल्पना H 0 सत्य हो।
ξ और Q को उनके भावों से प्रतिस्थापित करने पर, हमें Z के लिए एक विस्तारित सूत्र प्राप्त होता है:
(24)
अगला Z मान, जिसे मानदंड आँकड़े कहा जाता है, आपको क्रियाओं के निम्नलिखित अनुक्रम के साथ निर्णय लेने की अनुमति देता है:
1. क्षेत्र D=[-t β,ν , +t β,ν ] स्थापित किया गया है, जिसमें t ν वितरण वक्र (तालिका 10) के तहत β=1-α क्षेत्र शामिल हैं।
2. आँकड़ों Z के प्रयोगात्मक मान Z की गणना सूत्र (24) का उपयोग करके की जाती है, जिसके लिए विशिष्ट नमूनों के मान x 1 और y 1, साथ ही उनके नमूना साधन और, को X 1 और Y 1 के स्थान पर प्रतिस्थापित किया जाता है। .
3. यदि Z पर D है, तो परिकल्पना H 0 को प्रयोगात्मक डेटा का खंडन नहीं करने वाला माना जाता है और स्वीकार कर लिया जाता है।
यदि D पर Z हो तो परिकल्पना H1 स्वीकृत होती है।
यदि परिकल्पना H 0 सत्य है, तो Z शून्य माध्य के साथ ज्ञात t ν-वितरण का पालन करता है और उच्च संभावना के साथ β = 1-α परिकल्पना H 0 की स्वीकृति के D-क्षेत्र में आता है। जब अवलोकन किया जाता है, तो Z का प्रायोगिक मान D में आ जाता है। हम इसे परिकल्पना H 0 के पक्ष में प्रमाण मानते हैं।
जब Z 0 n, D के बाहर स्थित है (जैसा कि वे कहते हैं, क्रांतिक क्षेत्र K में स्थित है), जो कि स्वाभाविक है यदि परिकल्पना H 1 सत्य है, लेकिन असंभव है यदि H 0 सत्य है, तो हम केवल परिकल्पना H 0 को स्वीकार करके अस्वीकार कर सकते हैं एच 1 .
उदाहरण 31.
गैसोलीन के दो ग्रेड की तुलना की जाती है: ए और बी। समान शक्ति के 11 वाहनों पर, ग्रेड ए और बी गैसोलीन का एक बार गोलाकार चेसिस पर परीक्षण किया गया था। एक कार रास्ते में टूट गई और गैसोलीन बी पर इसका कोई डेटा नहीं है।
प्रति 100 किमी पर गैसोलीन की खपत
तालिका 12
मैं | ||||||||||||
एक्स मैं | 10,51 | 11,86 | 10,5 | 9,1 | 9,21 | 10,74 | 10,75 | 10,3 | 11,3 | 11,8 | 10,9 | एन=11 |
यू आई | 13,22 | 13,0 | 11,5 | 10,4 | 11,8 | 11,6 | 10,64 | 12,3 | 11,1 | 11,6 | - | एम=10 |
गैसोलीन ग्रेड ए और बी की खपत में अंतर अज्ञात है और इसे समान माना जाता है। क्या α=0.05 के महत्व स्तर पर, इस परिकल्पना को स्वीकार करना संभव है कि इस प्रकार के गैसोलीन की वास्तविक औसत लागत μ A और μ B समान हैं?
समाधान। परिकल्पना H 0 का परीक्षण: μ A -μ B = 0 एक प्रतिस्पर्धी के साथ। H 1:μ 1 μ 2 निम्नलिखित कार्य करें:
1. नमूना माध्य और वर्ग विचलनों का योग ज्ञात कीजिए Q.
;
;
2. Z सांख्यिकी के प्रयोगात्मक मूल्य की गणना करें
3. टी-वितरण की तालिका 10 से हम स्वतंत्रता की डिग्री की संख्या ν=m+n–2=19 और β=1–α=0.95 के लिए सीमा t β,ν पाते हैं। तालिका 10 में t 0.95.20 =2.09 और t 0.95.15 =2.13 है, लेकिन t 0.95.19 नहीं है। हम प्रक्षेप द्वारा t 0.95.19 =2.09+ =2.10 पाते हैं।
4. जांचें कि D या K दोनों में से किस क्षेत्र में ज़ोन नंबर शामिल है। जोन=-2.7 डी=[-2.10; -2.10].
चूँकि Z का प्रेक्षित मान क्रांतिक क्षेत्र, K = R\D में स्थित है, हम इसे त्याग देते हैं। एच0 और परिकल्पना एच1 को स्वीकार करें। इस मामले में उनका कहना है कि उनका अंतर महत्वपूर्ण है. यदि, इस उदाहरण की सभी शर्तों के तहत, केवल Q बदल गया होता, मान लीजिए, Q दोगुना हो गया होता, तो हमारा निष्कर्ष बदल जाता। Q को दोगुना करने से ज़ोन के मूल्य में एक कारक की कमी हो जाएगी, और फिर संख्या ज़ोन स्वीकार्य क्षेत्र D में आ जाएगी, ताकि परिकल्पना H 0 परीक्षण में खरी उतरे और स्वीकार की जाए। इस मामले में, और के बीच विसंगति को डेटा के प्राकृतिक बिखराव द्वारा समझाया जाएगा, न कि इस तथ्य से कि μ A μ B।
परिकल्पना परीक्षण का सिद्धांत बहुत व्यापक है; परिकल्पनाएँ वितरण कानून के प्रकार, नमूनों की एकरूपता, अगली मात्राओं की स्वतंत्रता आदि के बारे में हो सकती हैं।
मानदंड सी 2 (पियर्सन)
एक साधारण परिकल्पना के परीक्षण के लिए व्यवहार में सबसे आम मानदंड। वितरण कानून अज्ञात होने पर लागू होता है। एक यादृच्छिक चर X पर विचार करें जिस पर n स्वतंत्र परीक्षण. बोध x 1 , x 2 ,...,x n प्राप्त होता है। इस यादृच्छिक चर के वितरण नियम के बारे में परिकल्पना का परीक्षण करना आवश्यक है।
आइए एक साधारण परिकल्पना के मामले पर विचार करें। एक साधारण परिकल्पना सामान्य रूप से वितरित (ज्ञात) आबादी के साथ एक नमूने के फिट होने का परीक्षण करती है। हम नमूनों के अनुसार निर्माण करते हैं विविधता श्रृंखलाएक्स (1) , एक्स (2) , ..., एक्स (एन) . हम अंतराल को उपअंतराल में विभाजित करते हैं। माना कि ये अंतराल r हैं। तब हम इस संभावना का पता लगाएंगे कि परीक्षण के परिणामस्वरूप X, अंतराल Di, i=1 ,..., r में आ जाएगा यदि परीक्षण की जा रही परिकल्पना सत्य है।
कसौटी संभाव्यता घनत्व की सत्यता की नहीं, बल्कि संख्याओं की सत्यता की जाँच करती है
प्रत्येक अंतराल Di के साथ हम एक यादृच्छिक घटना A i को जोड़ते हैं - इस अंतराल में एक हिट (Di में इसके कार्यान्वयन परिणाम के X पर परीक्षण के परिणामस्वरूप एक हिट)। आइए यादृच्छिक चर का परिचय दें। m i आयोजित किए गए n में से परीक्षणों की संख्या है जिसमें घटना A i घटित हुई। एम आई को द्विपद नियम के अनुसार वितरित किया जाता है और यदि परिकल्पना सत्य है
डीएम आई =एनपी आई (1-पी आई)
मानदंड सी 2 का रूप है
पी 1 +पी 2 +...+पी आर =1
एम 1 +एम 2 +...+एम आर =एन
यदि परीक्षण की जा रही परिकल्पना सही है, तो m i एक ऐसी घटना के घटित होने की आवृत्ति का प्रतिनिधित्व करता है जिसमें प्रत्येक n परीक्षण में प्रायिकता pi है, इसलिए, हम m i को बिंदु npi पर केंद्रित द्विपद कानून के अधीन एक यादृच्छिक चर के रूप में मान सकते हैं। जब n बड़ा होता है, तो हम मान सकते हैं कि आवृत्ति समान मापदंडों के साथ सामान्य रूप से असममित रूप से वितरित की जाती है। यदि परिकल्पना सही है, तो हमें उम्मीद करनी चाहिए कि उन्हें सामान्य रूप से असमान रूप से वितरित किया जाएगा
रिश्ते से जुड़ा हुआ
नमूना डेटा m 1 +m 2 +...+m r और सैद्धांतिक np 1 +np 2 +...+np r के बीच विसंगति के माप के रूप में, मान पर विचार करें
सी 2 - स्पर्शोन्मुख रूप से सामान्य मात्राओं के वर्गों का योग रैखिक निर्भरता. हमने पहले इसी तरह के एक मामले का सामना किया है और जानते हैं कि एक रैखिक कनेक्शन की उपस्थिति से स्वतंत्रता की डिग्री की संख्या में एक की कमी आई है।
यदि परीक्षण की जा रही परिकल्पना सही है, तो मानदंड c 2 में एक वितरण होता है जो स्वतंत्रता की r-1 डिग्री के साथ c 2 के वितरण के लिए n®¥ के रूप में प्रवृत्त होता है।
आइए मान लें कि परिकल्पना झूठी है। तब योग शर्तों में वृद्धि की प्रवृत्ति होती है, अर्थात। यदि परिकल्पना गलत है, तो यह योग c 2 के बड़े मानों के एक निश्चित क्षेत्र में आ जाएगा। एक महत्वपूर्ण क्षेत्र के रूप में, हम मानदंड के सकारात्मक मूल्यों के क्षेत्र को लेते हैं
|
अज्ञात वितरण मापदंडों के मामले में, प्रत्येक पैरामीटर पियर्सन मानदंड के लिए स्वतंत्रता की डिग्री की संख्या को एक से कम कर देता है
8.1. आश्रित और स्वतंत्र नमूनों की अवधारणा।
किसी परिकल्पना के परीक्षण के लिए एक मानदंड का चयन करना
यह मुख्य रूप से इस बात से निर्धारित होता है कि विचाराधीन नमूने आश्रित हैं या स्वतंत्र। आइए हम संबंधित परिभाषाओं का परिचय दें।
हार।नमूने मंगाए गए हैं स्वतंत्र, यदि पहले नमूने में इकाइयों के चयन की प्रक्रिया किसी भी तरह से दूसरे नमूने में इकाइयों के चयन की प्रक्रिया से जुड़ी नहीं है।
दो स्वतंत्र नमूनों का एक उदाहरण एक ही उद्यम (एक ही उद्योग, आदि) में काम करने वाले पुरुषों और महिलाओं के ऊपर चर्चा किए गए नमूने होंगे।
ध्यान दें कि दो नमूनों की स्वतंत्रता का मतलब यह बिल्कुल नहीं है कि इन नमूनों की एक निश्चित प्रकार की समानता (उनकी एकरूपता) की कोई आवश्यकता नहीं है। इस प्रकार, पुरुषों और महिलाओं के आय स्तर का अध्ययन करते समय, हम ऐसी स्थिति की अनुमति देने की संभावना नहीं रखते हैं जहां पुरुषों को मास्को के व्यापारियों में से चुना जाता है, और महिलाओं को ऑस्ट्रेलिया के आदिवासियों में से चुना जाता है। महिलाओं को मस्कोवाइट और इसके अलावा, "बिजनेसवुमेन" भी होना चाहिए। लेकिन यहां हम नमूनों की निर्भरता के बारे में बात नहीं कर रहे हैं, बल्कि वस्तुओं की अध्ययन की गई आबादी की एकरूपता की आवश्यकता के बारे में बात कर रहे हैं, जिसे एकत्र करते समय और समाजशास्त्रीय डेटा का विश्लेषण करते समय संतुष्ट किया जाना चाहिए।
हार।नमूने मंगाए गए हैं आश्रित, या युग्मित,यदि एक नमूने की प्रत्येक इकाई दूसरे नमूने की एक विशिष्ट इकाई से "जुड़ी" है।
यदि हम आश्रित नमूनों का उदाहरण दें तो यह अंतिम परिभाषा संभवतः स्पष्ट हो जाएगी।
मान लीजिए कि हम यह पता लगाना चाहते हैं कि क्या पिता की सामाजिक स्थिति औसतन बेटे की सामाजिक स्थिति से कम है (हमारा मानना है कि हम इस जटिल और अस्पष्ट रूप से समझे जाने वाले मामले को माप सकते हैं) सामाजिक विशेषताएँव्यक्ति)। यह स्पष्ट प्रतीत होता है कि ऐसी स्थिति में उत्तरदाताओं (पिता, पुत्र) के जोड़े का चयन करना उचित है और मान लें कि पहले नमूने का प्रत्येक तत्व (पिता में से एक) दूसरे नमूने के एक निश्चित तत्व से "बंधा हुआ" है (उसका) बेटा)। ये दोनों नमूने आश्रित कहे जायेंगे।
8.2. स्वतंत्र नमूनों के लिए परिकल्पना परीक्षण
के लिए स्वतंत्रनमूने, मानदंड का चुनाव इस बात पर निर्भर करता है कि क्या हम अध्ययन किए जा रहे नमूनों के लिए विचाराधीन विशेषता के सामान्य भिन्नताओं एस 1 2 और एस 2 2 को जानते हैं। हम इस समस्या को हल करने पर विचार करेंगे, यह मानते हुए कि नमूना भिन्नताएं सामान्य भिन्नताओं से मेल खाती हैं। इस मामले में, मानदंड मान है:
उस स्थिति पर चर्चा करने से पहले जब सामान्य भिन्नताएं (या उनमें से कम से कम एक) हमारे लिए अज्ञात हैं, हम निम्नलिखित पर ध्यान देते हैं।
मानदंड (8.1) का उपयोग करने का तर्क उसी के समान है जिसका वर्णन हमने "ची-स्क्वायर" मानदंड (7.2) पर विचार करते समय किया था। केवल एक मूलभूत अंतर है. मानदंड (7.2) के अर्थ के बारे में बोलते हुए, हमने अपने से "खींचे गए" आकार n के नमूनों की अनंत संख्या पर विचार किया। जनसंख्या. यहां, मानदंड (8.1) के अर्थ का विश्लेषण करते हुए, हम एक अनंत संख्या पर विचार करने के लिए आगे बढ़ते हैं भापआकार n 1 और n 2 के नमूने। प्रत्येक जोड़ी के लिए, फॉर्म (8.1) के आंकड़ों की गणना की जाती है। ऐसे आँकड़ों के प्राप्त मूल्यों की समग्रता, हमारे अंकन के अनुसार, एक सामान्य वितरण से मेल खाती है (जैसा कि हम सहमत थे, अक्षर z का उपयोग ऐसे मानदंड को दर्शाने के लिए किया जाता है जिससे सामान्य वितरण मेल खाता है)।
इसलिए, यदि सामान्य भिन्नताएं हमारे लिए अज्ञात हैं, तो हमें इसके बजाय उनके नमूना अनुमान एस 1 2 और एस 2 2 का उपयोग करने के लिए मजबूर होना पड़ता है। हालाँकि, इस मामले में, सामान्य वितरण को छात्र वितरण द्वारा प्रतिस्थापित किया जाना चाहिए - z को t द्वारा प्रतिस्थापित किया जाना चाहिए (जैसा कि गणितीय अपेक्षा के लिए विश्वास अंतराल का निर्माण करते समय समान स्थिति में हुआ था)। हालाँकि, पर्याप्त रूप से बड़े नमूना आकार (एन 1, एन 2 ³ 30) के साथ, जैसा कि हम पहले से ही जानते हैं, छात्र वितरण व्यावहारिक रूप से सामान्य के साथ मेल खाता है। दूसरे शब्दों में, बड़े नमूनों के लिए हम मानदंड का उपयोग जारी रख सकते हैं:
स्थिति तब अधिक जटिल होती है जब भिन्नताएं अज्ञात होती हैं और कम से कम एक नमूने का आकार छोटा होता है। फिर एक और कारक खेल में आता है। मानदंड का प्रकार इस बात पर निर्भर करता है कि क्या हम दो विश्लेषण किए गए नमूनों में विचाराधीन विशेषता के अज्ञात भिन्नताओं को बराबर मान सकते हैं। यह जानने के लिए, हमें परिकल्पना का परीक्षण करना होगा:
एच 0: एस 1 2 = एस 2 2। (8.3)
इस परिकल्पना का परीक्षण करने के लिए कसौटी का प्रयोग किया जाता है
इस मानदंड के उपयोग की विशिष्टताओं के बारे में हम बात करेंगेनीचे, और अब हम एक मानदंड का चयन करने के लिए एल्गोरिदम पर चर्चा करना जारी रखेंगे जिसका उपयोग गणितीय अपेक्षाओं की समानता के बारे में परिकल्पना का परीक्षण करने के लिए किया जाता है।
यदि परिकल्पना (8.3) को अस्वीकार कर दिया जाता है, तो हमारे लिए रुचि का मानदंड इस प्रकार होता है:
(8.5)
(यानी, यह मानदंड (8.2) से भिन्न है, जिसका उपयोग बड़े नमूनों के लिए किया गया था, इसमें संबंधित आंकड़ों में सामान्य वितरण नहीं है, बल्कि एक छात्र वितरण है)। यदि परिकल्पना (8.3) स्वीकार कर ली जाती है, तो प्रयुक्त मानदंड का प्रकार बदल जाता है:
(8.6)
आइए संक्षेप में बताएं कि दो स्वतंत्र नमूनों के विश्लेषण के आधार पर सामान्य गणितीय अपेक्षाओं की समानता के बारे में परिकल्पना का परीक्षण करने के लिए एक मानदंड का चयन कैसे किया जाता है।
ज्ञात
अज्ञात
नमूना आकार बड़ा है
एच 0: एस 1 = एस 2 अस्वीकृत
स्वीकृत
8.3. आश्रित नमूनों के लिए परिकल्पना परीक्षण
आइए आश्रित नमूनों पर विचार करने के लिए आगे बढ़ें। चलो संख्याओं का क्रम
एक्स 1, एक्स 2, …, एक्स एन;
Y 1 , Y 2 , … , Y n –
ये दो आश्रित नमूनों के तत्वों के लिए यादृच्छिक माने गए मान हैं। आइए हम संकेतन का परिचय दें:
डी आई = एक्स आई - वाई आई , आई = 1, ..., एन।
के लिए आश्रितनमूना मानदंड जो आपको एक परिकल्पना का परीक्षण करने की अनुमति देता है
निम्नलिखित नुसार:
ध्यान दें कि s D के लिए अभी दी गई अभिव्यक्ति एक नई अभिव्यक्ति से अधिक कुछ नहीं है प्रसिद्ध सूत्र, मानक विचलन व्यक्त करना। इस मामले में हम D i के मानों के मानक विचलन के बारे में बात कर रहे हैं। एक समान सूत्र अक्सर अभ्यास में फैलाव की गणना की एक सरल (संबंधित अंकगणितीय माध्य से विचाराधीन मूल्य के मूल्यों के वर्ग विचलन के योग की "हेड-ऑन" गणना की तुलना में) विधि के रूप में उपयोग किया जाता है।
यदि हम उपरोक्त सूत्रों की तुलना उन सूत्रों से करते हैं जिनका उपयोग हमने विश्वास अंतराल के निर्माण के सिद्धांतों पर चर्चा करते समय किया था, तो यह नोटिस करना आसान है कि आश्रित नमूनों के मामले के लिए साधनों की समानता की परिकल्पना का परीक्षण अनिवार्य रूप से गणितीय अपेक्षा की समानता का परीक्षण करना है। मान D i से शून्य। परिमाण
D i के लिए मानक विचलन है। इसलिए, अभी वर्णित मानदंड t n -1 का मान अनिवार्य रूप से मानक विचलन के एक अंश के रूप में व्यक्त D i के मान के बराबर है। जैसा कि हमने ऊपर कहा (विश्वास अंतराल के निर्माण के तरीकों पर चर्चा करते समय), इस सूचक का उपयोग विचारित मूल्य डि की संभावना का न्याय करने के लिए किया जा सकता है। अंतर यह है कि ऊपर हम सामान्य रूप से वितरित एक साधारण अंकगणितीय माध्य के बारे में बात कर रहे थे, और यहां हम औसत अंतर के बारे में बात कर रहे हैं, ऐसे औसत में छात्र वितरण होता है। लेकिन शून्य से नमूना अंकगणित माध्य के विचलन की संभावना के बीच संबंध के बारे में तर्क (साथ)। गणितीय अपेक्षा, शून्य के बराबर) कितनी इकाइयों के साथ यह विचलन प्रभावी रहेगा।
उदाहरण। एक निश्चित अवधि के लिए शहर के सूक्ष्म जिलों में से एक में फार्मेसियों की आय 128 थी; 192; 223; 398; 205; 266; 219; 260; 264; 98 (पारंपरिक इकाइयाँ)। उसी समय पड़ोसी माइक्रोडिस्ट्रिक्ट में वे 286 के बराबर थे; 240; 263; 266; 484; 223; 335.
दोनों नमूनों के लिए, माध्य, संशोधित विचरण और मानक विचलन की गणना करें। भिन्नता की सीमा, औसत निरपेक्ष (रैखिक) विचलन, भिन्नता का गुणांक ज्ञात करें। रैखिक गुणांकविविधताएं, दोलन गुणांक।
यह मानते हुए कि यह यादृच्छिक मूल्यएक सामान्य वितरण है, सामान्य माध्य (दोनों मामलों में) के लिए विश्वास अंतराल निर्धारित करें।
फिशर मानदंड का उपयोग करते हुए, सामान्य भिन्नताओं की समानता की परिकल्पना की जाँच करें। विद्यार्थी परीक्षण का उपयोग करते हुए, सामान्य साधनों की समानता के बारे में परिकल्पना की जाँच करें (वैकल्पिक परिकल्पना उनकी असमानता के बारे में है)।
सभी गणनाओं में, महत्व स्तर α = 0.05 है।
हम भिन्नताओं की समानता की परिकल्पना का परीक्षण करने वाले कैलकुलेटर का उपयोग करके समाधान निकालते हैं।
1. पहले नमूने के लिए भिन्नता संकेतक खोजें.
एक्स | |एक्स - एक्स एवी | | (x - x औसत) 2 |
98 | 127.3 | 16205.29 |
128 | 97.3 | 9467.29 |
192 | 33.3 | 1108.89 |
205 | 20.3 | 412.09 |
219 | 6.3 | 39.69 |
223 | 2.3 | 5.29 |
260 | 34.7 | 1204.09 |
264 | 38.7 | 1497.69 |
266 | 40.7 | 1656.49 |
398 | 172.7 | 29825.29 |
2253 | 573.6 | 61422.1 |
.
भिन्नता सूचक.
.
आर = एक्स अधिकतम - एक्स मिनट
आर = 398 - 98 = 300
औसत रैखिक विचलन
श्रृंखला का प्रत्येक मान दूसरे से औसतन 57.36 भिन्न है
फैलाव
निष्पक्ष विचरण अनुमानक
.
श्रृंखला का प्रत्येक मान 225.3 के औसत मान से 78.37 के औसत से भिन्न है
.
.
भिन्नता का गुणांक
चूँकि v>30%, लेकिन v या
दोलन गुणांक
.
.
विद्यार्थी तालिका का उपयोग करके हम पाते हैं:
टी तालिका (एन-1;α/2) = टी तालिका (9;0.025) = 2.262
(225.3 - 59.09;225.3 + 59.09) = (166.21;284.39)
2. दूसरे नमूने के लिए भिन्नता संकेतक खोजें.
आइए पंक्ति को रैंक करें। ऐसा करने के लिए, हम इसके मानों को आरोही क्रम में क्रमबद्ध करते हैं।
संकेतकों की गणना के लिए तालिका।
एक्स | |एक्स - एक्स एवी | | (x - x औसत) 2 |
223 | 76.57 | 5863.18 |
240 | 59.57 | 3548.76 |
263 | 36.57 | 1337.47 |
266 | 33.57 | 1127.04 |
286 | 13.57 | 184.18 |
335 | 35.43 | 1255.18 |
484 | 184.43 | 34013.9 |
2097 | 439.71 | 47329.71 |
वितरण श्रृंखला का मूल्यांकन करने के लिए, हमें निम्नलिखित संकेतक मिलते हैं:
वितरण केंद्र संकेतक.
सरल अंकगणित औसत
भिन्नता सूचक.
पूर्ण विविधताएँ.
भिन्नता की सीमा प्राथमिक श्रृंखला विशेषता के अधिकतम और न्यूनतम मूल्यों के बीच का अंतर है।
आर = एक्स अधिकतम - एक्स मिनट
आर = 484 - 223 = 261
औसत रैखिक विचलन- अध्ययन के तहत जनसंख्या की सभी इकाइयों के अंतर को ध्यान में रखने के लिए गणना की गई।
श्रृंखला का प्रत्येक मान दूसरे से 62.82 के औसत से भिन्न है
फैलाव- इसके औसत मूल्य के आसपास फैलाव के माप को दर्शाता है (फैलाव का एक माप, यानी औसत से विचलन)।
निष्पक्ष विचरण अनुमानक- विचरण का सुसंगत अनुमान (संशोधित विचरण)।
मानक विचलन.
श्रृंखला का प्रत्येक मान 299.57 के औसत मान से 82.23 के औसत से भिन्न है
मानक विचलन का अनुमान.
सापेक्ष भिन्नता के उपाय.
भिन्नता के सापेक्ष संकेतकों में शामिल हैं: दोलन का गुणांक, भिन्नता का रैखिक गुणांक, सापेक्ष रैखिक विचलन।
भिन्नता का गुणांक- जनसंख्या मूल्यों के सापेक्ष फैलाव का एक माप: दर्शाता है कि इस मूल्य के औसत मूल्य का औसत फैलाव किस अनुपात में है।
चूँकि v ≤ 30%, जनसंख्या सजातीय है और भिन्नता कमज़ोर है। प्राप्त परिणामों पर भरोसा किया जा सकता है।
भिन्नता का रैखिक गुणांकया सापेक्ष रैखिक विचलन- औसत मूल्य से पूर्ण विचलन के संकेत के औसत मूल्य के अनुपात को दर्शाता है।
दोलन गुणांक- औसत के आसपास विशेषता के चरम मूल्यों के सापेक्ष उतार-चढ़ाव को दर्शाता है।
जनसंख्या केंद्र का अंतराल अनुमान.
सामान्य माध्य के लिए विश्वास अंतराल.
छात्र वितरण तालिका का उपयोग करके t kp मान निर्धारित करें
विद्यार्थी तालिका का उपयोग करके हम पाते हैं:
टी तालिका (एन-1;α/2) = टी तालिका (6;0.025) = 2.447
(299.57 - 82.14;299.57 + 82.14) = (217.43;381.71)
0.95 की संभावना के साथ, यह कहा जा सकता है कि बड़े नमूना आकार के साथ औसत मूल्य पाए गए अंतराल से बाहर नहीं आएगा।
हम भिन्नताओं की समानता की परिकल्पना का परीक्षण करते हैं:
एच 0: डी एक्स = डी वाई ;
एच 1: डी एक्स आइए फिशर मानदंड का प्रेक्षित मान ज्ञात करें:
चूँकि s y 2 > s x 2, तो s b 2 = s y 2, s m 2 = s x 2
स्वतंत्रता की कोटि की संख्या:
एफ 1 = एन वाई – 1 = 7 – 1 = 6
एफ 2 = एन एक्स – 1 = 10 – 1 = 9
α = 0.05 के महत्व स्तर पर फिशर-स्नेडेकोर वितरण के महत्वपूर्ण बिंदुओं की तालिका और स्वतंत्रता की डिग्री की दी गई संख्या का उपयोग करके, हम एफ करोड़ (6;9) = 3.37 पाते हैं
क्योंकि एफ अवलोकन। हम सामान्य साधनों की समानता के बारे में परिकल्पना का परीक्षण करते हैं:
आइए छात्र की कसौटी का प्रायोगिक मूल्य ज्ञात करें:
स्वतंत्रता की कोटि की संख्या f = n x + n y – 2 = 10 + 7 – 2 = 15
छात्र वितरण तालिका का उपयोग करके t kp मान निर्धारित करें
विद्यार्थी तालिका का उपयोग करके हम पाते हैं:
टी टेबल (एफ;α/2) = टी टेबल (15;0.025) = 2.131
α = 0.05 के महत्व स्तर और स्वतंत्रता की दी गई डिग्री की संख्या पर छात्र वितरण के महत्वपूर्ण बिंदुओं की तालिका का उपयोग करते हुए, हम tcr = 2.131 पाते हैं
क्योंकि टी अवलोकन.