घर हड्डी रोग गणितीय अपेक्षा, विचरण, संभाव्यता के लिए विश्वास अंतराल। समस्या समाधान

गणितीय अपेक्षा, विचरण, संभाव्यता के लिए विश्वास अंतराल। समस्या समाधान

सांख्यिकी में अनुमान दो प्रकार के होते हैं: बिंदु और अंतराल। बिंदु लागतएक अलग नमूना आँकड़ा दर्शाता है जिसका उपयोग किसी पैरामीटर का अनुमान लगाने के लिए किया जाता है जनसंख्या. उदाहरण के लिए, नमूना माध्य एक बिंदु अनुमान है गणितीय अपेक्षाजनसंख्या, और नमूना भिन्नता एस 2- जनसंख्या भिन्नता का बिंदु अनुमान σ 2. यह दिखाया गया है कि नमूना माध्य जनसंख्या की गणितीय अपेक्षा का एक निष्पक्ष अनुमान है। एक नमूना माध्य को निष्पक्ष कहा जाता है क्योंकि सभी नमूने का औसत (समान नमूना आकार के साथ) होता है एन) सामान्य जनसंख्या की गणितीय अपेक्षा के बराबर है।

नमूना विचरण के लिए एस 2जनसंख्या भिन्नता का एक निष्पक्ष अनुमान बन गया σ 2, नमूना विचरण के हर को बराबर सेट किया जाना चाहिए एन – 1 , लेकिन नहीं एन. दूसरे शब्दों में, जनसंख्या भिन्नता सभी संभावित नमूना भिन्नताओं का औसत है।

जनसंख्या मापदंडों का अनुमान लगाते समय, यह ध्यान में रखा जाना चाहिए कि नमूना आँकड़े जैसे , विशिष्ट नमूनों पर निर्भर करते हैं। इस तथ्य को ध्यान में रखना, प्राप्त करना अंतराल अनुमानसामान्य जनसंख्या की गणितीय अपेक्षा, नमूना साधनों के वितरण का विश्लेषण करें (अधिक जानकारी के लिए, देखें)। निर्मित अंतराल को एक निश्चित आत्मविश्वास स्तर की विशेषता होती है, जो इस संभावना को दर्शाता है कि वास्तविक जनसंख्या पैरामीटर का सही अनुमान लगाया गया है। किसी विशेषता के अनुपात का अनुमान लगाने के लिए समान आत्मविश्वास अंतराल का उपयोग किया जा सकता है आरऔर जनसंख्या का मुख्य वितरित जनसमूह।

नोट को प्रारूप में डाउनलोड करें, प्रारूप में उदाहरण

ज्ञात मानक विचलन के साथ जनसंख्या की गणितीय अपेक्षा के लिए एक विश्वास अंतराल का निर्माण करना

जनसंख्या में किसी विशेषता की हिस्सेदारी के लिए विश्वास अंतराल का निर्माण करना

यह खंड विश्वास अंतराल की अवधारणा को श्रेणीबद्ध डेटा तक विस्तारित करता है। इससे हमें जनसंख्या में विशेषता की हिस्सेदारी का अनुमान लगाने की अनुमति मिलती है आरनमूना शेयर का उपयोग करना आरएस= एक्स/एन. जैसा कि संकेत दिया गया है, यदि मात्राएँ एनआरऔर एन(1 - पी)संख्या 5 से अधिक होने पर, द्विपद वितरण को सामान्य के रूप में अनुमानित किया जा सकता है। इसलिए, जनसंख्या में किसी विशेषता के हिस्से का अनुमान लगाना आरएक ऐसे अंतराल का निर्माण करना संभव है जिसका आत्मविश्वास स्तर बराबर हो (1 - α)x100%.


कहाँ पीएस- विशेषता का नमूना अनुपात बराबर एक्स/एन, अर्थात। सफलताओं की संख्या को नमूना आकार से विभाजित किया गया, आर- सामान्य जनसंख्या में विशेषता का हिस्सा, जेड - महत्वपूर्ण मानमानकीकृत सामान्य वितरण, एन- नमूने का आकार।

उदाहरण 3.चलिए मान लेते हैं कि से सूचना प्रणालीएक नमूना निकाला जिसमें भरे गए 100 चालान शामिल थे पिछला महीना. मान लीजिए कि इनमें से 10 चालान त्रुटियों के साथ संकलित किए गए थे। इस प्रकार, आर= 10/100 = 0.1. 95% विश्वास स्तर महत्वपूर्ण मान Z = 1.96 से मेल खाता है।

इस प्रकार, 4.12% से 15.88% चालानों में त्रुटियाँ होने की संभावना 95% है।

किसी दिए गए नमूना आकार के लिए, जनसंख्या में विशेषता के अनुपात वाला आत्मविश्वास अंतराल निरंतर की तुलना में व्यापक दिखाई देता है अनियमित परिवर्तनशील वस्तु. ऐसा इसलिए है क्योंकि निरंतर यादृच्छिक चर के माप में श्रेणीबद्ध डेटा के माप की तुलना में अधिक जानकारी होती है। दूसरे शब्दों में, श्रेणीबद्ध डेटा जो केवल दो मान लेता है, उसमें उनके वितरण के मापदंडों का अनुमान लगाने के लिए अपर्याप्त जानकारी होती है।

मेंएक सीमित जनसंख्या से निकाले गए अनुमानों की गणना करना

गणितीय अपेक्षा का अनुमान.अंतिम जनसंख्या के लिए सुधार कारक ( पांचवें वेतन आयोग) का उपयोग किसी कारक द्वारा मानक त्रुटि को कम करने के लिए किया गया था। जनसंख्या पैरामीटर अनुमानों के लिए विश्वास अंतराल की गणना करते समय, एक सुधार कारक उन स्थितियों में लागू किया जाता है जहां नमूने वापस किए बिना खींचे जाते हैं। इस प्रकार, गणितीय अपेक्षा के लिए एक आत्मविश्वास अंतराल का आत्मविश्वास स्तर बराबर होता है (1 - α)x100%, सूत्र द्वारा गणना की जाती है:

उदाहरण 4.एक सीमित जनसंख्या के लिए सुधार कारक के उपयोग को स्पष्ट करने के लिए, आइए ऊपर उदाहरण 3 में चर्चा की गई चालान की औसत राशि के लिए विश्वास अंतराल की गणना करने की समस्या पर वापस आएं। मान लीजिए कि एक कंपनी प्रति माह 5,000 चालान जारी करती है, और एक्स=110.27 डॉलर, एस= $28.95, एन = 5000, एन = 100, α = 0.05, टी 99 = 1.9842. सूत्र (6) का उपयोग करके हम प्राप्त करते हैं:

किसी सुविधा की हिस्सेदारी का अनुमान.रिटर्न के बिना चुनते समय, आत्मविश्वास स्तर वाले गुण के अनुपात के लिए विश्वास अंतराल बराबर होता है (1 - α)x100%, सूत्र द्वारा गणना की जाती है:

विश्वास अंतरालऔर नैतिक मुद्दे

किसी जनसंख्या का नमूना लेते समय और सांख्यिकीय निष्कर्ष निकालते समय, अक्सर नैतिक मुद्दे उठते हैं। मुख्य बात यह है कि नमूना आँकड़ों के आत्मविश्वास अंतराल और बिंदु अनुमान कैसे सहमत होते हैं। प्रकाशन बिंदु अनुमानउचित विश्वास अंतराल (आमतौर पर 95% विश्वास स्तर पर) और नमूना आकार जिससे वे प्राप्त होते हैं, को निर्दिष्ट किए बिना गलतफहमी को जन्म दे सकता है। इससे उपयोगकर्ता को यह आभास हो सकता है कि बिंदु अनुमान बिल्कुल वही है जो उसे पूरी आबादी के गुणों की भविष्यवाणी करने के लिए चाहिए। इस प्रकार, यह समझना आवश्यक है कि किसी भी शोध में बिंदु अनुमान पर नहीं, बल्कि अंतराल अनुमान पर ध्यान केंद्रित किया जाना चाहिए। अलावा, विशेष ध्यानदी जानी चाहिए सही चुनावनमूना आकार.

अक्सर, सांख्यिकीय हेरफेर की वस्तुएँ निश्चित रूप से जनसंख्या के समाजशास्त्रीय सर्वेक्षणों के परिणाम होती हैं राजनीतिक समस्याओं. इस मामले में, सर्वेक्षण के परिणाम समाचार पत्रों के पहले पन्ने पर प्रकाशित होते हैं, और त्रुटि होती है नमूना सर्वेक्षणऔर सांख्यिकीय विश्लेषण की पद्धति बीच में कहीं छपी हुई है। प्राप्त बिंदु अनुमानों की वैधता साबित करने के लिए, नमूना आकार को इंगित करना आवश्यक है जिसके आधार पर उन्हें प्राप्त किया गया था, आत्मविश्वास अंतराल की सीमाएं और इसके महत्व का स्तर।

अगला नोट

लेविन एट अल पुस्तक से सामग्री का उपयोग प्रबंधकों के लिए किया जाता है। - एम.: विलियम्स, 2004. - पी. 448-462

केंद्रीय सीमा प्रमेयबताता है कि पर्याप्त बड़े नमूना आकार के साथ, साधनों के नमूना वितरण को सामान्य वितरण द्वारा अनुमानित किया जा सकता है। यह संपत्ति जनसंख्या के वितरण के प्रकार पर निर्भर नहीं करती है।

आरंभ करने के लिए, आइए निम्नलिखित परिभाषा को याद करें:

आइए निम्नलिखित स्थिति पर विचार करें। मान लीजिए कि जनसंख्या वेरिएंट में गणितीय अपेक्षा $a$ और मानक विचलन $\sigma$ के साथ एक सामान्य वितरण होता है। नमूना मतलब में इस मामले मेंइसे एक यादृच्छिक चर के रूप में माना जाएगा। जब मात्रा $X$ सामान्य रूप से वितरित की जाती है, तो नमूना माध्य भी सामान्य रूप से मापदंडों के साथ वितरित किया जाएगा

आइए हम एक विश्वास अंतराल खोजें जो $\गामा $ की विश्वसनीयता के साथ $a$ के मूल्य को कवर करता है।

ऐसा करने के लिए, हमें समानता की आवश्यकता है

इससे हमें मिलता है

यहां से हम फ़ंक्शन मानों $Ф\left(t\right)$ की तालिका से आसानी से $t$ ढूंढ सकते हैं और, परिणामस्वरूप, $\delta $ ढूंढ सकते हैं।

आइए फ़ंक्शन $Ф\left(t\right)$ के मानों की तालिका को याद करें:

चित्र 1. फ़ंक्शन मानों की तालिका $Ф\left(t\right).$

किसी अज्ञात $(\mathbf \sigma )$ के लिए गणितीय अपेक्षा का अनुमान लगाने के लिए आत्मविश्वास अभिन्न

इस मामले में, हम संशोधित विचरण मान $S^2$ का उपयोग करेंगे। उपरोक्त सूत्र में $\sigma $ को $S$ से बदलने पर, हमें मिलता है:

कॉन्फिडेंस अंतराल खोजने में समस्याओं का उदाहरण

उदाहरण 1

मान लें कि मात्रा $X$ का भिन्नता $\sigma =4$ के साथ एक सामान्य वितरण है। मान लीजिए कि नमूना आकार $n=64$ है और विश्वसनीयता $\गामा =0.95$ के बराबर है। इस वितरण की गणितीय अपेक्षा का अनुमान लगाने के लिए विश्वास अंतराल ज्ञात कीजिए।

हमें अंतराल ($\overline(x)-\delta ,\overline(x)+\delta)$ ज्ञात करना होगा।

जैसा कि हमने ऊपर देखा

\[\delta =\frac(\sigma t)(\sqrt(n))=\frac(4t)(\sqrt(64))=\frac(\t)(2)\]

पैरामीटर $t$ सूत्र से पाया जा सकता है

\[Ф\left(t\right)=\frac(\gamma )(2)=\frac(0.95)(2)=0.475\]

तालिका 1 से हमें पता चलता है कि $t=1.96$।

अक्सर मूल्यांकक को उस खंड के रियल एस्टेट बाजार का विश्लेषण करना होता है जिसमें मूल्यांकन की जा रही संपत्ति स्थित है। यदि बाजार विकसित है, तो प्रस्तुत वस्तुओं के पूरे सेट का विश्लेषण करना मुश्किल हो सकता है, इसलिए विश्लेषण के लिए वस्तुओं का एक नमूना उपयोग किया जाता है। यह नमूना हमेशा सजातीय नहीं बनता है; कभी-कभी इसे चरम बिंदुओं से साफ़ करना आवश्यक होता है - बहुत अधिक या बहुत कम बाज़ार ऑफ़र। इसी उद्देश्य से इसका प्रयोग किया जाता है विश्वास अंतराल. लक्ष्य ये अध्ययन- विश्वास अंतराल की गणना के लिए दो तरीकों का तुलनात्मक विश्लेषण करें और estimatica.pro सिस्टम में विभिन्न नमूनों के साथ काम करते समय इष्टतम गणना विकल्प का चयन करें।

कॉन्फिडेंस अंतराल एक नमूने के आधार पर गणना की गई विशेषता मानों का एक अंतराल है, जिसमें ज्ञात संभावना के साथ सामान्य जनसंख्या का अनुमानित पैरामीटर शामिल होता है।

विश्वास अंतराल की गणना करने का उद्देश्य नमूना डेटा के आधार पर ऐसे अंतराल का निर्माण करना है ताकि दी गई संभावना के साथ यह कहा जा सके कि अनुमानित पैरामीटर का मान इस अंतराल में है। दूसरे शब्दों में, विश्वास अंतराल में एक निश्चित संभावना के साथ अनुमानित मूल्य का अज्ञात मूल्य शामिल होता है। अंतराल जितना व्यापक होगा, अशुद्धि उतनी ही अधिक होगी।

कॉन्फिडेंस इंटरवल निर्धारित करने के लिए अलग-अलग तरीके हैं। इस लेख में हम 2 तरीकों पर गौर करेंगे:

  • माध्यिका और मानक विचलन के माध्यम से;
  • टी-सांख्यिकी (छात्र का गुणांक) के महत्वपूर्ण मूल्य के माध्यम से।

चरणों तुलनात्मक विश्लेषण विभिन्न तरीकेसीआई गणना:

1. एक डेटा नमूना तैयार करें;

2. हम इसे सांख्यिकीय तरीकों का उपयोग करके संसाधित करते हैं: हम औसत मूल्य, माध्यिका, विचरण, आदि की गणना करते हैं;

3. विश्वास अंतराल की गणना दो तरीकों से करें;

4. साफ किए गए नमूनों और परिणामी आत्मविश्वास अंतराल का विश्लेषण करें।

चरण 1. डेटा नमूनाकरण

नमूना estimatica.pro प्रणाली का उपयोग करके बनाया गया था। नमूने में "ख्रुश्चेव" प्रकार के लेआउट के साथ तीसरे मूल्य क्षेत्र में 1-कमरे वाले अपार्टमेंट की बिक्री के लिए 91 प्रस्ताव शामिल थे।

तालिका 1. प्रारंभिक नमूना

मूल्य 1 वर्ग मीटर, इकाइयाँ

चित्र .1। प्रारंभिक नमूना



चरण 2. प्रारंभिक नमूने का प्रसंस्करण

सांख्यिकीय विधियों का उपयोग करके किसी नमूने को संसाधित करने के लिए निम्नलिखित मानों की गणना की आवश्यकता होती है:

1. अंकगणितीय माध्य

2. माध्यिका नमूने को दर्शाने वाली एक संख्या है: नमूना तत्वों का बिल्कुल आधा हिस्सा माध्यिका से बड़ा है, अन्य आधा माध्यिका से कम है

(विषम संख्या में मान वाले नमूने के लिए)

3. रेंज - नमूने में अधिकतम और न्यूनतम मूल्यों के बीच का अंतर

4. वेरिएंस - डेटा की भिन्नता का अधिक सटीक अनुमान लगाने के लिए उपयोग किया जाता है

5. नमूना मानक विचलन (इसके बाद - एसडी) अंकगणित माध्य के आसपास समायोजन मूल्यों के फैलाव का सबसे आम संकेतक है।

6. भिन्नता का गुणांक - समायोजन मूल्यों के बिखरने की डिग्री को दर्शाता है

7. दोलन गुणांक - औसत के आसपास नमूने में चरम मूल्य मूल्यों के सापेक्ष उतार-चढ़ाव को दर्शाता है

तालिका 2. मूल नमूने के सांख्यिकीय संकेतक

भिन्नता का गुणांक, जो डेटा की एकरूपता को दर्शाता है, 12.29% है, लेकिन दोलन का गुणांक बहुत अधिक है। इस प्रकार, हम कह सकते हैं कि मूल नमूना सजातीय नहीं है, तो आइए विश्वास अंतराल की गणना के लिए आगे बढ़ें।

चरण 3. आत्मविश्वास अंतराल गणना

विधि 1. माध्यिका और मानक विचलन का उपयोग करके गणना।

विश्वास अंतराल निम्नानुसार निर्धारित किया जाता है: न्यूनतम मूल्य - मानक विचलन माध्यिका से घटाया जाता है; अधिकतम मान - मानक विचलन माध्यिका में जोड़ा जाता है।

इस प्रकार, आत्मविश्वास अंतराल (47179 सीयू; 60689 सीयू)

चावल। 2. विश्वास अंतराल के अंतर्गत आने वाले मान 1.



विधि 2. टी-सांख्यिकी (छात्र गुणांक) के महत्वपूर्ण मूल्य का उपयोग करके एक आत्मविश्वास अंतराल का निर्माण

एस.वी. ग्रिबोव्स्की पुस्तक में " गणितीय तरीकेसंपत्ति के मूल्य का अनुमान लगाना" छात्र गुणांक का उपयोग करके आत्मविश्वास अंतराल की गणना करने की एक विधि का वर्णन करता है। इस पद्धति का उपयोग करके गणना करते समय, अनुमानक को स्वयं महत्व स्तर ∝ निर्धारित करना होगा, जो संभावना निर्धारित करता है जिसके साथ विश्वास अंतराल का निर्माण किया जाएगा। आमतौर पर, 0.1 के महत्व स्तर का उपयोग किया जाता है; 0.05 और 0.01. वे पत्र-व्यवहार करते हैं आत्मविश्वास की संभावनाएँ 0.9; 0.95 और 0.99. इस पद्धति के साथ, गणितीय अपेक्षा और विचरण के वास्तविक मूल्यों को व्यावहारिक रूप से अज्ञात माना जाता है (जो व्यावहारिक अनुमान समस्याओं को हल करते समय लगभग हमेशा सत्य होता है)।

कॉन्फिडेंस इंटरवल फॉर्मूला:

एन - नमूना आकार;

महत्व स्तर ∝ के साथ टी-सांख्यिकी (छात्र वितरण) का महत्वपूर्ण मूल्य, स्वतंत्रता की डिग्री एन -1 की संख्या, जो विशेष सांख्यिकीय तालिकाओं से या एमएस एक्सेल (→ "सांख्यिकीय" → अध्ययनकर्ता) का उपयोग करके निर्धारित की जाती है;

∝ - महत्व स्तर, ∝=0.01 लें।

चावल। 2. विश्वास अंतराल के अंतर्गत आने वाले मान 2.

चरण 4. आत्मविश्वास अंतराल की गणना के लिए विभिन्न तरीकों का विश्लेषण

आत्मविश्वास अंतराल की गणना करने के दो तरीकों - माध्यिका और छात्र के गुणांक के माध्यम से - का नेतृत्व किया विभिन्न अर्थअंतराल. तदनुसार, हमें दो अलग-अलग साफ किए गए नमूने मिले।

तालिका 3. तीन नमूनों के आँकड़े।

अनुक्रमणिका

प्रारंभिक नमूना

1 विकल्प

विकल्प 2

औसत मूल्य

फैलाव

कोएफ़. बदलाव

कोएफ़. दोलनों

सेवानिवृत्त वस्तुओं की संख्या, पीसी।

की गई गणना के आधार पर, हम कह सकते हैं कि प्राप्त हुआ विभिन्न तरीकेविश्वास अंतराल के मान प्रतिच्छेद करते हैं, इसलिए आप मूल्यांकनकर्ता के विवेक पर किसी भी गणना पद्धति का उपयोग कर सकते हैं।

हालाँकि, हमारा मानना ​​​​है कि estimatica.pro प्रणाली में काम करते समय, बाजार विकास की डिग्री के आधार पर विश्वास अंतराल की गणना के लिए एक विधि चुनने की सलाह दी जाती है:

  • यदि बाजार अविकसित है, तो माध्यिका और मानक विचलन का उपयोग करके गणना पद्धति का उपयोग करें, क्योंकि इस मामले में सेवानिवृत्त वस्तुओं की संख्या कम है;
  • यदि बाजार विकसित हो गया है, तो टी-सांख्यिकी (छात्र गुणांक) के महत्वपूर्ण मूल्य के माध्यम से गणना लागू करें, क्योंकि एक बड़ा प्रारंभिक नमूना बनाना संभव है।

लेख तैयार करने में निम्नलिखित का उपयोग किया गया:

1. ग्रिबोव्स्की एस.वी., सिवेट्स एस.ए., लेविकिना आई.ए. संपत्ति के मूल्य का आकलन करने के लिए गणितीय तरीके। मॉस्को, 2014

2. सिस्टम डेटा estimatica.pro

कानून के अधीन सामान्य आबादी से एक नमूना लिया जाए सामान्यवितरण एक्सएन( एम; ). गणितीय सांख्यिकी की यह मूल धारणा केंद्रीय सीमा प्रमेय पर आधारित है। सामान्य मानक विचलन ज्ञात करें , लेकिन सैद्धांतिक वितरण की गणितीय अपेक्षा अज्ञात है एम(औसत मूल्य )।

इस मामले में, नमूना माध्य , प्रयोग के दौरान प्राप्त (धारा 3.4.2), भी एक यादृच्छिक चर होगा एम;
). फिर "सामान्यीकृत" विचलन
N(0;1) - एक मानक सामान्य यादृच्छिक चर है।

कार्य के लिए एक अंतराल अनुमान खोजना है एम. आइए इसके लिए दोतरफा विश्वास अंतराल का निर्माण करें एम ताकि सच्ची गणितीय अपेक्षा दी गई संभाव्यता (विश्वसनीयता) के साथ उसकी हो .

मान के लिए ऐसा अंतराल निर्धारित करें
- इसका अर्थ है इस मात्रा का अधिकतम मूल्य ज्ञात करना
और न्यूनतम
, जो महत्वपूर्ण क्षेत्र की सीमाएँ हैं:
.

क्योंकि यह संभावना बराबर है
, तो इस समीकरण की जड़
लाप्लास फ़ंक्शन तालिकाओं (तालिका 3, परिशिष्ट 1) का उपयोग करके पाया जा सकता है।

फिर संभाव्यता के साथ यह तर्क दिया जा सकता है कि यादृच्छिक चर
, अर्थात, वांछित सामान्य औसत अंतराल से संबंधित है
. (3.13)

आकार
(3.14)

बुलाया शुद्धताआकलन.

संख्या
मात्रात्मकसामान्य वितरण - संबंध 2Ф( को ध्यान में रखते हुए, लाप्लास फ़ंक्शन (तालिका 3, परिशिष्ट 1) के तर्क के रूप में पाया जा सकता है यू)=, अर्थात। एफ( यू)=
.

निर्दिष्ट विचलन मान के अनुसार उल्टा करें यह पता लगाया जा सकता है कि अज्ञात सामान्य माध्य किस प्रायिकता के साथ अंतराल से संबंधित है
. ऐसा करने के लिए आपको गणना करने की आवश्यकता है

. (3.15)

मान लीजिए कि बार-बार चयन विधि का उपयोग करके सामान्य जनसंख्या से एक यादृच्छिक नमूना निकाला जाता है। Eq से.
पाया जा सकता है न्यूनतमपुन: नमूनाकरण मात्रा एन, किसी दी गई विश्वसनीयता के साथ विश्वास अंतराल के लिए आवश्यक है पूर्व निर्धारित मूल्य से अधिक नहीं हुआ . आवश्यक नमूना आकार का अनुमान सूत्र का उपयोग करके लगाया जाता है:

. (3.16)

आइए ढूंढते हैं अनुमान सटीकता
:

1) जैसे-जैसे सैंपल का आकार बढ़ता है एनपरिमाण कम हो जाती है, और इसलिए अनुमान की सटीकता बढ़ती है.

2) सी बढ़ोतरीमूल्यांकन की विश्वसनीयता तर्क का मूल्य बढ़ जाता है यू(क्योंकि एफ(यू) नीरस रूप से बढ़ता है) और इसलिए बढ़ती है . इस मामले में, विश्वसनीयता में वृद्धि कम कर देता हैइसके मूल्यांकन की सटीकता .

मूल्यांकन
(3.17)

बुलाया क्लासिक(कहाँ टी- एक निश्चित पैरामीटर के आधार पर और एन), क्योंकि यह सबसे अधिक बार सामने आने वाले वितरण कानूनों की विशेषता बताता है।

3.5.3 अज्ञात मानक विचलन के साथ सामान्य वितरण की गणितीय अपेक्षा का अनुमान लगाने के लिए आत्मविश्वास अंतराल 

ज्ञात हो कि जनसंख्या सामान्य वितरण के नियम के अधीन है एक्सएन( एम;), जहां मूल्य वर्गमूल औसत का वर्गविचलन अज्ञात।

इस मामले में सामान्य माध्य का अनुमान लगाने के लिए विश्वास अंतराल का निर्माण करने के लिए आंकड़ों का उपयोग किया जाता है
, के साथ एक छात्र वितरण होना = एन-1 स्वतंत्रता की डिग्री. यह इस तथ्य से पता चलता है कि एन(0;1) (अनुभाग 3.5.2 देखें), और
(धारा 3.5.3 देखें) और छात्र वितरण की परिभाषा से (भाग 1.धारा 2.11.2)।

आइए हम छात्र वितरण के शास्त्रीय अनुमान की सटीकता का पता लगाएं: यानी। हम ढूंढ लेंगे टीसूत्र (3.17) से. चलो असमानता को पूरा करने की संभावना
विश्वसनीयता द्वारा दिया गया :

. (3.18)

क्योंकि टीSt( एन-1), यह स्पष्ट है कि टीपर निर्भर करता है और एन, इसलिए वे आमतौर पर लिखते हैं
.

(3.19)

कहाँ
-छात्र वितरण समारोह के साथ एनस्वतंत्रता की -1 डिग्री.

इस समीकरण को हल करने के लिए एम, हमें अंतराल मिलता है
जो विश्वसनीय रूप से अज्ञात पैरामीटर को कवर करता है एम.

परिमाण टी , एन-1, एक यादृच्छिक चर के विश्वास अंतराल को निर्धारित करने के लिए उपयोग किया जाता है टी(एन-1), विद्यार्थी के परीक्षण के अनुसार वितरित किया गया एन-1 डिग्री की स्वतंत्रता कहलाती है विद्यार्थी का गुणांक. इसे दिए गए मानों का उपयोग करके पाया जाना चाहिए एनऔर  "छात्र वितरण के महत्वपूर्ण बिंदु" तालिकाओं से। (तालिका 6, परिशिष्ट 1), जो समीकरण (3.19) के समाधान का प्रतिनिधित्व करता है।

परिणामस्वरूप, हमें निम्नलिखित अभिव्यक्ति प्राप्त होती है शुद्धता गणितीय अपेक्षा (सामान्य माध्य) का अनुमान लगाने के लिए विश्वास अंतराल, यदि विचरण अज्ञात है:

(3.20)

इस प्रकार, जनसंख्या की गणितीय अपेक्षा के लिए विश्वास अंतराल के निर्माण का एक सामान्य सूत्र है:

विश्वास अंतराल की सटीकता कहां है ज्ञात अथवा अज्ञात के आधार पर क्रमशः 3.16 सूत्रों के अनुसार विचरण पाया जाता है। और 3.20.

समस्या 10.कुछ परीक्षण किए गए, जिनके परिणाम तालिका में सूचीबद्ध हैं:

एक्स मैं

यह ज्ञात है कि वे सामान्य वितरण के नियम का पालन करते हैं
. रेटिंग ढूंढें एम*गणितीय अपेक्षा के लिए एम, इसके लिए 90% विश्वास अंतराल का निर्माण करें।

समाधान:

इसलिए, एम(2.53;5.47).

समस्या 11.समुद्र की गहराई एक उपकरण द्वारा मापी जाती है जिसकी व्यवस्थित त्रुटि 0 है, और यादृच्छिक त्रुटियों को मानक विचलन के साथ सामान्य कानून के अनुसार वितरित किया जाता है =15मी. 90% के आत्मविश्वास स्तर पर 5 मीटर से अधिक की त्रुटियों के साथ गहराई निर्धारित करने के लिए कितने स्वतंत्र माप किए जाने चाहिए?

समाधान:

हमारी समस्या की स्थितियों के अनुसार एक्सएन( एम; ), कहाँ =15मी, =5 मी, =0.9. आइए आयतन ज्ञात करें एन.

1) दी गई विश्वसनीयता = 0.9 के साथ, हम तालिका 3 (परिशिष्ट 1) से लाप्लास फ़ंक्शन का तर्क पाते हैं यू = 1.65.

2) निर्दिष्ट अनुमान सटीकता जानना =यू=5, आइए खोजें
. हमारे पास है

. इसलिए परीक्षणों की संख्या एन25.

समस्या 12.तापमान का नमूनाकरण टीजनवरी के पहले 6 दिनों के लिए तालिका में प्रस्तुत किया गया है:

गणितीय अपेक्षा के लिए विश्वास अंतराल ज्ञात कीजिए एमआत्मविश्वास की संभावना वाली जनसंख्या
और सामान्य का मूल्यांकन करें मानक विचलन एस.

समाधान:


और
.

2) निष्पक्ष अनुमान सूत्र का उपयोग करके इसे खोजें
:

=-175

=234.84

;
;

=-192

=116


.

3) चूंकि सामान्य विचरण अज्ञात है, लेकिन इसका अनुमान ज्ञात है, तो गणितीय अपेक्षा का अनुमान लगाएं एमहम छात्र वितरण (तालिका 6, परिशिष्ट 1) और सूत्र (3.20) का उपयोग करते हैं।

क्योंकि एन 1 =एन 2=6, फिर,
, एस 1 =6.85 हमारे पास है:
, इसलिए -29.2-4.1<एम 1 < -29.2+4.1.

इसलिए -33.3<एम 1 <-25.1.

इसी तरह हमारे पास है,
, एस 2 = 4.8, तो

–34.9< एम 2 < -29.1. Тогда доверительные интервалы примут вид: एम 1 (-33.3;-25.1) और एम 2 (-34.9;-29.1).

व्यावहारिक विज्ञान में, उदाहरण के लिए, निर्माण विषयों में, वस्तुओं की सटीकता का आकलन करने के लिए, आत्मविश्वास अंतराल तालिकाओं का उपयोग किया जाता है, जो प्रासंगिक संदर्भ साहित्य में दिए गए हैं।

आइए ज्ञात फैलाव मूल्य के मामले में वितरण के औसत मूल्य का अनुमान लगाने के लिए MS EXCEL में एक विश्वास अंतराल का निर्माण करें।

बेशक चुनाव विश्वास का स्तरपूरी तरह से समस्या के समाधान पर निर्भर करता है। इस प्रकार, हवाई जहाज की विश्वसनीयता में एक हवाई यात्री के विश्वास की डिग्री निस्संदेह एक विद्युत प्रकाश बल्ब की विश्वसनीयता में खरीदार के विश्वास की डिग्री से अधिक होनी चाहिए।

समस्या सूत्रीकरण

चलिए मान लेते हैं कि से जनसंख्यालिया जा चुका है नमूनाआकार एन. यह मान लिया है कि मानक विचलनयह वितरण ज्ञात है। इसके आधार पर यह जरूरी है नमूनेअज्ञात का मूल्यांकन करें वितरण माध्य(μ, ) और संगत रचना कीजिए दोहरा विश्वास अंतराल.

बिंदु लागत

जैसा कि ज्ञात है आंकड़े(आइए इसे निरूपित करें एक्स औसत) है माध्य का निष्पक्ष अनुमानयह जनसंख्याऔर इसका वितरण N(μ;σ 2 /n) है।

टिप्पणी: यदि आपको निर्माण करने की आवश्यकता है तो क्या करें? विश्वास अंतरालवितरण के मामले में क्या नहीं है सामान्य?इस मामले में, बचाव के लिए आता है, जो बताता है कि पर्याप्त बड़े आकार के साथ नमूने n वितरण से नहीं बनना सामान्य, आँकड़ों का नमूना वितरण X औसतइच्छा लगभगअनुरूप सामान्य वितरणपैरामीटर N(μ;σ 2 /n) के साथ।

इसलिए, बिंदु लागत औसत वितरण मूल्यहमारे पास है - यह नमूना माध्य, अर्थात। एक्स औसत. अब चलिए शुरू करते हैं विश्वास अंतराल।

एक विश्वास अंतराल का निर्माण

आमतौर पर, वितरण और उसके मापदंडों को जानकर, हम इस संभावना की गणना कर सकते हैं कि यादृच्छिक चर हमारे द्वारा निर्दिष्ट अंतराल से एक मान लेगा। अब आइए इसके विपरीत करें: उस अंतराल को ढूंढें जिसमें यादृच्छिक चर किसी दी गई संभावना के साथ गिर जाएगा। उदाहरण के लिए, गुणों से सामान्य वितरणयह ज्ञात है कि 95% की संभावना के साथ, एक यादृच्छिक चर वितरित किया जाता है सामान्य कानून, लगभग +/- 2 से की सीमा के भीतर आएगा औसत मूल्य(इसके बारे में लेख देखें)। यह अंतराल हमारे लिए एक प्रोटोटाइप के रूप में काम करेगा विश्वास अंतराल.

अब देखते हैं कि क्या हम वितरण जानते हैं , इस अंतराल की गणना करने के लिए? प्रश्न का उत्तर देने के लिए, हमें वितरण के आकार और उसके मापदंडों को इंगित करना होगा।

वितरण का स्वरूप हम जानते हैं - यह है सामान्य वितरण(याद रखें कि हम किस बारे में बात कर रहे हैं नमूने का वितरण आंकड़े एक्स औसत).

पैरामीटर μ हमारे लिए अज्ञात है (इसे केवल इसका उपयोग करके अनुमान लगाने की आवश्यकता है विश्वास अंतराल), लेकिन हमारे पास इसका एक अनुमान है एक्स औसत,के आधार पर गणना की गई नमूने,जिसका उपयोग किया जा सकता है.

दूसरा पैरामीटर - नमूना माध्य का मानक विचलन हम इसे ज्ञात मानेंगे, यह σ/√n के बराबर है।

क्योंकि हम μ नहीं जानते, तो हम अंतराल +/- 2 बनाएंगे मानक विचलनइससे नहीं औसत मूल्य, और इसके ज्ञात अनुमान से एक्स औसत. वे। गणना करते समय विश्वास अंतरालहम ऐसा नहीं मानेंगे एक्स औसत+/- 2 की सीमा के अंतर्गत आता है मानक विचलन 95% की संभावना के साथ μ से, और हम मान लेंगे कि अंतराल +/- 2 है मानक विचलनसे एक्स औसत 95% संभावना के साथ यह μ को कवर करेगा – सामान्य जनसंख्या का औसत,जिससे यह लिया गया है नमूना. ये दोनों कथन समतुल्य हैं, लेकिन दूसरा कथन हमें निर्माण करने की अनुमति देता है विश्वास अंतराल.

इसके अलावा, आइए अंतराल को स्पष्ट करें: एक यादृच्छिक चर वितरित किया गया सामान्य कानून, 95% संभावना के साथ अंतराल +/- 1.960 के भीतर आता है मानक विचलन,नहीं +/- 2 मानक विचलन. इसकी गणना सूत्र का उपयोग करके की जा सकती है =NORM.ST.REV((1+0.95)/2), सेमी। उदाहरण फ़ाइल शीट अंतराल.

अब हम एक संभाव्य कथन तैयार कर सकते हैं जो हमें बनाने में मदद करेगा विश्वास अंतराल:
"संभावना है कि आबादी मतलबसे स्थित है नमूना औसत 1,960 के भीतर" नमूना माध्य के मानक विचलन", 95% के बराबर"।

कथन में उल्लिखित संभाव्यता मान का एक विशेष नाम है , जिससे सम्बंधित हैएक सरल अभिव्यक्ति द्वारा महत्व स्तर α (अल्फा)। विश्वास स्तर =1 . हमारे मामले में महत्वपूर्ण स्तर α =1-0,95=0,05 .

अब, इस संभाव्य कथन के आधार पर, हम गणना के लिए एक अभिव्यक्ति लिखते हैं विश्वास अंतराल:

जहां Z α/2 मानक सामान्य वितरण(यादृच्छिक चर का यह मान जेड, क्या पी(जेड>=जेड α/2 )=α/2).

टिप्पणी: ऊपरी α/2-मात्राचौड़ाई को परिभाषित करता है विश्वास अंतरालवी मानक विचलन नमूना माध्य। ऊपरी α/2-मात्रा मानक सामान्य वितरणहमेशा 0 से अधिक, जो बहुत सुविधाजनक है।

हमारे मामले में, α=0.05 के साथ, ऊपरी α/2-मात्रा 1.960 के बराबर है। अन्य महत्व स्तरों के लिए α (10%; 1%) ऊपरी α/2-मात्रा जेड α/2 सूत्र =NORM.ST.REV(1-α/2) या, यदि ज्ञात हो, का उपयोग करके गणना की जा सकती है विश्वास स्तर, =NORM.ST.OBR((1+विश्वास स्तर)/2).

आमतौर पर निर्माण करते समय माध्य का अनुमान लगाने के लिए आत्मविश्वास अंतरालकेवल उपयोग ऊपरी α/2-मात्रात्मकऔर उपयोग न करें निचला α/2-मात्रात्मक. ऐसा इसलिए संभव है क्योंकि मानक सामान्य वितरण x अक्ष के बारे में सममित रूप से ( इसका वितरण घनत्वके बारे में सममित औसत, यानी 0). इसलिए गणना करने की कोई जरूरत नहीं है निचला α/2-मात्रा(इसे बस α कहा जाता है /2-मात्रात्मक), क्योंकि यह बराबर है ऊपरी α/2-मात्रात्मकऋण चिह्न के साथ.

आइए हम याद करें कि, मान x के वितरण के आकार के बावजूद, संगत यादृच्छिक चर एक्स औसतवितरित लगभग अच्छा N(μ;σ 2 /n) (इसके बारे में लेख देखें)। इसलिए, सामान्य तौर पर, उपरोक्त अभिव्यक्ति के लिए विश्वास अंतरालकेवल एक अनुमान है. यदि मान x को वितरित किया जाता है सामान्य कानून N(μ;σ 2 /n), फिर के लिए अभिव्यक्ति विश्वास अंतरालसही है।

MS EXCEL में कॉन्फिडेंस अंतराल गणना

आइए समस्या का समाधान करें.
इनपुट सिग्नल के लिए इलेक्ट्रॉनिक घटक का प्रतिक्रिया समय डिवाइस की एक महत्वपूर्ण विशेषता है। एक इंजीनियर 95% के आत्मविश्वास स्तर पर औसत प्रतिक्रिया समय के लिए एक विश्वास अंतराल का निर्माण करना चाहता है। पिछले अनुभव से, इंजीनियर जानता है कि प्रतिक्रिया समय का मानक विचलन 8 एमएस है। यह ज्ञात है कि प्रतिक्रिया समय का मूल्यांकन करने के लिए, इंजीनियर ने 25 माप किए, औसत मूल्य 78 एमएस था।

समाधान: एक इंजीनियर किसी इलेक्ट्रॉनिक उपकरण का प्रतिक्रिया समय जानना चाहता है, लेकिन वह समझता है कि प्रतिक्रिया समय एक निश्चित मान नहीं है, बल्कि एक यादृच्छिक चर है जिसका अपना वितरण होता है। इसलिए, वह जो सबसे अच्छी उम्मीद कर सकता है वह इस वितरण के मापदंडों और आकार को निर्धारित करना है।

दुर्भाग्य से, समस्या की स्थिति से हम प्रतिक्रिया समय वितरण के आकार को नहीं जानते हैं (ऐसा होना जरूरी नहीं है)। सामान्य). , यह वितरण भी अज्ञात है। वही तो जाना जाता है मानक विचलनσ=8. इसलिए, जबकि हम संभावनाओं की गणना और निर्माण नहीं कर सकते विश्वास अंतराल.

हालाँकि, इस तथ्य के बावजूद कि हम वितरण को नहीं जानते हैं समय अलग प्रतिक्रिया, हम उसके अनुसार जानते हैं सीपीटी, नमूने का वितरण औसत प्रतिक्रिया समयलगभग है सामान्य(हम मान लेंगे कि शर्तें सीपीटीकिया जाता है, क्योंकि आकार नमूनेकाफी बड़ा (n=25)) .

इसके अतिरिक्त, औसतयह वितरण बराबर है औसत मूल्यएकल प्रतिक्रिया का वितरण, अर्थात μ. ए मानक विचलनइस वितरण की गणना (σ/√n) सूत्र =8/ROOT(25) का उपयोग करके की जा सकती है।

यह भी ज्ञात हुआ कि इंजीनियर को प्राप्त हुआ बिंदु लागतपैरामीटर μ 78 एमएस (एक्स औसत) के बराबर। इसलिए, अब हम संभावनाओं की गणना कर सकते हैं, क्योंकि हम वितरण का स्वरूप जानते हैं ( सामान्य) और इसके पैरामीटर (X avg और σ/√n)।

इंजीनियर जानना चाहता है अपेक्षित मूल्यμ प्रतिक्रिया समय वितरण। जैसा कि ऊपर बताया गया है, यह μ के बराबर है औसत प्रतिक्रिया समय के नमूना वितरण की गणितीय अपेक्षा. अगर हम उपयोग करते हैं सामान्य वितरण N(X avg; σ/√n), तो वांछित μ लगभग 95% की संभावना के साथ +/-2*σ/√n की सीमा में होगा।

महत्वपूर्ण स्तर 1-0.95=0.05 के बराबर है।

अंत में, आइए बाएँ और दाएँ बॉर्डर खोजें विश्वास अंतराल.
बाईं सीमा: =78-NORM.ST.REV(1-0.05/2)*8/रूट(25) = 74,864
दाहिनी सीमा: =78+NORM.ST.INV(1-0.05/2)*8/रूट(25)=81.136

बाईं सीमा: =NORM.REV(0.05/2; 78; 8/रूट(25))
दाहिनी सीमा: =NORM.REV(1-0.05/2; 78; 8/रूट(25))

उत्तर: विश्वास अंतरालपर 95% आत्मविश्वास स्तर और σ=8मिसेके बराबर होती है 78+/-3.136 एमएस.

में सिग्मा शीट पर उदाहरण फ़ाइलज्ञात, गणना और निर्माण के लिए एक प्रपत्र बनाया दोहरा विश्वास अंतरालमनमानी के लिए नमूनेदिए गए σ और के साथ स्तर का महत्व.

कॉन्फिडेंस.नॉर्म() फ़ंक्शन

यदि मान नमूनेके दायरे में हैं बी20:बी79 , ए महत्वपूर्ण स्तर 0.05 के बराबर; फिर MS Excel सूत्र:
=औसत(बी20:बी79)-आत्मविश्वास.मानदंड(0.05;σ; गिनती(बी20:बी79))
बाईं सीमा वापस कर देंगे विश्वास अंतराल.

उसी सीमा की गणना सूत्र का उपयोग करके की जा सकती है:
=औसत(B20:B79)-NORM.ST.REV(1-0.05/2)*σ/रूट(COUNT(B20:B79))

टिप्पणी: CONFIDENCE.NORM() फ़ंक्शन MS EXCEL 2010 में दिखाई दिया। MS EXCEL के पुराने संस्करणों में, TRUST() फ़ंक्शन का उपयोग किया गया था।



साइट पर नया

>

सबसे लोकप्रिय