घर प्रोस्थेटिक्स और इम्प्लांटेशन कॉन्फिडेंस इंटरवल उदाहरण कैसे खोजें. विश्वास अंतराल

कॉन्फिडेंस इंटरवल उदाहरण कैसे खोजें. विश्वास अंतराल

विश्वास अंतराल– मूल्यों को सीमित करें सांख्यिकीय मूल्य, जो एक निश्चित आत्मविश्वास संभावना के साथ γ बड़ी मात्रा का नमूना लेने पर इस अंतराल में होगा। P(θ - ε) के रूप में दर्शाया जाता है। व्यवहार में, विश्वास संभावना γ को एकता के काफी करीब मूल्यों से चुना जाता है: γ = 0.9, γ = 0.95, γ = 0.99।

सेवा का उद्देश्य. इस सेवा का उपयोग करके, आप यह निर्धारित कर सकते हैं:

  • सामान्य माध्य के लिए विश्वास अंतराल, विचरण के लिए विश्वास अंतराल;
  • मानक विचलन के लिए विश्वास अंतराल, सामान्य शेयर के लिए विश्वास अंतराल;
परिणामी समाधान एक वर्ड फ़ाइल में सहेजा गया है (उदाहरण देखें)। प्रारंभिक डेटा कैसे भरें, इस पर एक वीडियो निर्देश नीचे दिया गया है।

उदाहरण क्रमांक 1. एक सामूहिक फार्म पर, 1000 भेड़ों के कुल झुंड में से, 100 भेड़ों को चयनात्मक नियंत्रण कतरन से गुजरना पड़ा। परिणामस्वरूप, प्रति भेड़ औसतन 4.2 किलोग्राम ऊन की कतरन स्थापित की गई। प्रति भेड़ औसत ऊन कतरन का निर्धारण करते समय नमूने की औसत वर्ग त्रुटि 0.99 की संभावना के साथ निर्धारित करें और यदि भिन्नता 2.5 है तो कतरनी मूल्य किस सीमा के भीतर निहित है। नमूना गैर-दोहरावदार है.
उदाहरण क्रमांक 2. मॉस्को उत्तरी सीमा शुल्क के पद पर आयातित उत्पादों के एक बैच से, उत्पाद "ए" के 20 नमूने यादृच्छिक दोहराया नमूने द्वारा लिए गए थे। परीक्षण के परिणामस्वरूप, नमूने में उत्पाद "ए" की औसत नमी सामग्री स्थापित की गई, जो 1% के मानक विचलन के साथ 6% के बराबर निकली।
आयातित उत्पादों के पूरे बैच में उत्पाद की औसत नमी सामग्री की सीमा 0.683 संभावना के साथ निर्धारित करें।
उदाहरण संख्या 3. 36 छात्रों के एक सर्वेक्षण से पता चला कि वे प्रति वर्ष औसतन कितनी पाठ्यपुस्तकें पढ़ते हैं शैक्षणिक वर्ष, 6 के बराबर निकला। यह मानते हुए कि प्रति सेमेस्टर एक छात्र द्वारा पढ़ी जाने वाली पाठ्यपुस्तकों की संख्या 6 के बराबर मानक विचलन के साथ एक सामान्य वितरण कानून है, खोजें: ए) 0.99 की विश्वसनीयता के साथ, गणितीय के लिए एक अंतराल अनुमान इसकी अपेक्षा अनियमित परिवर्तनशील वस्तु; बी) हम किस संभावना के साथ कह सकते हैं कि इस नमूने से गणना की गई प्रति सेमेस्टर एक छात्र द्वारा पढ़ी जाने वाली पाठ्यपुस्तकों की औसत संख्या गणितीय अपेक्षा से पूर्ण मूल्य में 2 से अधिक नहीं भटकेगी।

आत्मविश्वास अंतराल का वर्गीकरण

मूल्यांकन किए जा रहे पैरामीटर के प्रकार के अनुसार:

नमूना प्रकार के अनुसार:

  1. अनंत नमूने के लिए विश्वास अंतराल;
  2. अंतिम नमूने के लिए विश्वास अंतराल;
नमूने को पुनः नमूनाकरण कहा जाता है, यदि चयनित वस्तु अगले वस्तु को चुनने से पहले जनसंख्या में वापस कर दी जाती है। नमूने को गैर-दोहराना कहा जाता है, यदि चयनित वस्तु जनसंख्या में वापस नहीं आती है। व्यवहार में, हम आम तौर पर गैर-दोहराव वाले नमूनों से निपटते हैं।

यादृच्छिक नमूनाकरण के लिए औसत नमूनाकरण त्रुटि की गणना

नमूने से प्राप्त संकेतकों के मूल्यों और सामान्य जनसंख्या के संबंधित मापदंडों के बीच विसंगति को कहा जाता है प्रतिनिधित्व संबंधी त्रुटि.
सामान्य और नमूना आबादी के मुख्य मापदंडों के पदनाम।
औसत नमूनाकरण त्रुटि सूत्र
पुनः चयनचयन दोहराएँ
औसत के लिएशेयर के लिएऔसत के लिएशेयर के लिए
नमूनाकरण त्रुटि सीमा (Δ) के बीच संबंध कुछ संभाव्यता के साथ गारंटीकृत है Р(टी),और औसत त्रुटिनमूने का रूप है: या Δ = t·μ, जहां टी- आत्मविश्वास गुणांक, लाप्लास इंटीग्रल फ़ंक्शन की तालिका के अनुसार संभाव्यता स्तर पी (टी) के आधार पर निर्धारित किया जाता है।

विशुद्ध रूप से यादृच्छिक नमूनाकरण विधि का उपयोग करके नमूना आकार की गणना के लिए सूत्र

पिछले उपखंडों में हमने एक अज्ञात पैरामीटर के आकलन के मुद्दे पर विचार किया था एक नंबर। इसे "बिंदु" अनुमान कहा जाता है। कई कार्यों में, आपको न केवल पैरामीटर खोजने की आवश्यकता है उपयुक्त संख्यात्मक मान, बल्कि इसकी सटीकता और विश्वसनीयता का मूल्यांकन भी करना। आपको यह जानना होगा कि किसी पैरामीटर को बदलने से कौन सी त्रुटियाँ हो सकती हैं इसका बिंदु अनुमान और हम किस हद तक विश्वास के साथ यह उम्मीद कर सकते हैं कि ये त्रुटियाँ ज्ञात सीमाओं से अधिक नहीं होंगी?

इस प्रकार की समस्याएँ विशेष रूप से टिप्पणियों की एक छोटी संख्या के साथ प्रासंगिक होती हैं, जब बिंदु का अनुमान लगाया जाता है और मेंयह काफी हद तक यादृच्छिक है और a द्वारा a का अनुमानित प्रतिस्थापन गंभीर त्रुटियों का कारण बन सकता है।

अनुमान की सटीकता और विश्वसनीयता का अंदाज़ा देना ,

वी गणितीय सांख्यिकीवे तथाकथित आत्मविश्वास अंतराल और आत्मविश्वास संभावनाओं का उपयोग करते हैं।

पैरामीटर के लिए चलो अनुभव से प्राप्त निष्पक्ष अनुमान एक।हम इस मामले में संभावित त्रुटि का अनुमान लगाना चाहते हैं. आइए हम कुछ पर्याप्त रूप से बड़ी संभाव्यता p निर्दिष्ट करें (उदाहरण के लिए, p = 0.9, 0.95 या 0.99) ताकि संभाव्यता p वाली एक घटना को व्यावहारिक रूप से विश्वसनीय माना जा सके, और एक मान ज्ञात करें जिसके लिए

तब सीमा व्यावहारिक रूप से होती है संभावित मानप्रतिस्थापित करते समय होने वाली त्रुटि पर , ± s होगा; निरपेक्ष मान में बड़ी त्रुटियाँ केवल कम संभावना a = 1 - p के साथ दिखाई देंगी। आइए (14.3.1) को इस प्रकार पुनः लिखें:

समानता (14.3.2) का अर्थ है कि संभाव्यता पी के साथ पैरामीटर का अज्ञात मान अंतराल के अंतर्गत आता है

एक परिस्थिति पर गौर करना जरूरी है. पहले, हमने बार-बार किसी यादृच्छिक चर के किसी दिए गए गैर-यादृच्छिक अंतराल में गिरने की संभावना पर विचार किया है। यहां स्थिति भिन्न है: परिमाण यादृच्छिक नहीं है, लेकिन अंतराल/p यादृच्छिक है। x-अक्ष पर इसकी स्थिति यादृच्छिक है, जो इसके केंद्र द्वारा निर्धारित होती है ; सामान्य तौर पर, अंतराल 2s की लंबाई भी यादृच्छिक होती है, क्योंकि s के मान की गणना, एक नियम के रूप में, प्रयोगात्मक डेटा से की जाती है। इसलिए में इस मामले मेंपी मान की व्याख्या किसी बिंदु पर "हिट" करने की संभावना के रूप में नहीं करना बेहतर होगा अंतराल / पी में, और संभावना के रूप में कि एक यादृच्छिक अंतराल / पी बिंदु को कवर करेगा (चित्र 14.3.1)।

चावल। 14.3.1

प्रायिकता p को आमतौर पर कहा जाता है आत्मविश्वास की संभावना, और अंतराल / पी - विश्वास अंतराल।अंतराल सीमाएँ अगर। ए एक्स =ए-रेत ए 2 = ए +और बुलाए जाते हैं विश्वास की सीमाएँ.

आइए विश्वास अंतराल की अवधारणा को एक और व्याख्या दें: इसे पैरामीटर मानों के अंतराल के रूप में माना जा सकता है ए,प्रयोगात्मक डेटा के साथ संगत और उनका खंडन नहीं। वास्तव में, यदि हम प्रायिकता a = 1-p वाली किसी घटना पर व्यावहारिक रूप से असंभव विचार करने के लिए सहमत हैं, तो पैरामीटर a के वे मान जिनके लिए ए - ए> s को विरोधाभासी प्रयोगात्मक डेटा के रूप में पहचाना जाना चाहिए, और जिनके लिए |a - ए टी ना 2 .

पैरामीटर के लिए चलो एक निष्पक्ष अनुमान है एक।यदि हम मात्रा के वितरण का नियम जानते , विश्वास अंतराल खोजने का कार्य बहुत सरल होगा: यह एक मान खोजने के लिए पर्याप्त होगा जिसके लिए

कठिनाई यह है कि अनुमानों के वितरण का नियम मात्रा के वितरण नियम पर निर्भर करता है एक्सऔर, इसलिए, इसके अज्ञात मापदंडों पर (विशेष रूप से, पैरामीटर पर ही)। ए)।

इस कठिनाई से निजात पाने के लिए, आप निम्नलिखित मोटे तौर पर अनुमानित तकनीक का उपयोग कर सकते हैं: एस के लिए अभिव्यक्ति में अज्ञात मापदंडों को उनके बिंदु अनुमानों के साथ बदलें। अपेक्षाकृत बड़ी संख्या में प्रयोगों के साथ पी(लगभग 20...30) यह तकनीक आमतौर पर ऐसे परिणाम देती है जो सटीकता की दृष्टि से संतोषजनक होते हैं।

उदाहरण के तौर पर, गणितीय अपेक्षा के लिए विश्वास अंतराल की समस्या पर विचार करें।

इसका उत्पादन होने दीजिए पी एक्स,जिनकी विशेषताएँ हैं अपेक्षित मूल्य टीऔर विचरण डी- अज्ञात। इन मापदंडों के लिए निम्नलिखित अनुमान प्राप्त किए गए:

गणितीय अपेक्षा के लिए विश्वास संभाव्यता p के अनुरूप एक विश्वास अंतराल / p का निर्माण करना आवश्यक है टीमात्रा एक्स।

इस समस्या को हल करते समय हम इस तथ्य का उपयोग करेंगे कि मात्रा टीयोग का प्रतिनिधित्व करता है पीस्वतंत्र समान रूप से वितरित यादृच्छिक चर Xhऔर केंद्रीय सीमा प्रमेय के अनुसार, पर्याप्त रूप से बड़े के लिए पीइसका वितरण कानून सामान्य के करीब है। व्यवहार में, पदों की अपेक्षाकृत कम संख्या (लगभग 10...20) के साथ भी, योग के वितरण नियम को लगभग सामान्य माना जा सकता है। हम मान लेंगे कि मूल्य टीसामान्य कानून के अनुसार वितरित किया गया। इस नियम की विशेषताएँ - गणितीय अपेक्षा और विचरण - क्रमशः समान हैं टीऔर

(अध्याय 13 उपधारा 13.3 देखें)। आइए मान लें कि मान डीहम जानते हैं और जिसके लिए एक मूल्य ईपी ढूंढेंगे

अध्याय 6 के सूत्र (6.3.5) का उपयोग करके, हम सामान्य वितरण फ़ंक्शन के माध्यम से (14.3.5) के बाईं ओर संभावना व्यक्त करते हैं

अनुमान का मानक विचलन कहां है टी।

Eq से.

Sp का मान ज्ञात करें:

जहां arg Ф* (x) Ф* का व्युत्क्रम फलन है (एक्स),वे। जिस तर्क का मूल्य सामान्य कार्यवितरण बराबर है एक्स।

फैलाव डी,जिसके माध्यम से मात्रा व्यक्त की जाती है 1पी, हम ठीक-ठीक नहीं जानते; इसके अनुमानित मूल्य के रूप में, आप अनुमान का उपयोग कर सकते हैं डी(14.3.4) और लगभग लगाएं:

इस प्रकार, विश्वास अंतराल के निर्माण की समस्या लगभग हल हो गई है, जो इसके बराबर है:

जहां जीपी सूत्र (14.3.7) द्वारा निर्धारित किया जाता है।

एसपी की गणना करते समय फ़ंक्शन Ф* (एल) की तालिकाओं में रिवर्स इंटरपोलेशन से बचने के लिए, एक विशेष तालिका (तालिका 14.3.1) संकलित करना सुविधाजनक है, जो मात्रा के मान देता है

आर पर निर्भर करता है मान (पी सामान्य कानून के लिए मानक विचलन की संख्या निर्धारित करता है जिसे फैलाव के केंद्र से दाएं और बाएं ओर प्लॉट किया जाना चाहिए ताकि परिणामी क्षेत्र में आने की संभावना पी के बराबर हो।

मान 7पी का उपयोग करते हुए, विश्वास अंतराल को इस प्रकार व्यक्त किया जाता है:

तालिका 14.3.1

उदाहरण 1. मात्रा पर 20 प्रयोग किये गये एक्स;परिणाम तालिका में दिखाए गए हैं. 14.3.2.

तालिका 14.3.2

मात्रा की गणितीय अपेक्षा के लिए एक अनुमान लगाना आवश्यक है एक्सऔर विश्वास संभावना पी = 0.8 के अनुरूप एक विश्वास अंतराल का निर्माण करें।

समाधान।हमारे पास है:

l: = 10 को संदर्भ बिंदु के रूप में चुनते हुए, तीसरे सूत्र (14.2.14) का उपयोग करके हम निष्पक्ष अनुमान पाते हैं डी :

तालिका के अनुसार 14.3.1 हम पाते हैं

आत्मविश्वास की सीमाएँ:

विश्वास अंतराल:

पैरामीटर मान टी,इस अंतराल में पड़े डेटा तालिका में दिए गए प्रयोगात्मक डेटा के साथ संगत हैं। 14.3.2.

विचरण के लिए एक विश्वास अंतराल का निर्माण इसी तरह से किया जा सकता है।

इसका उत्पादन होने दीजिए पीयादृच्छिक चर पर स्वतंत्र प्रयोग एक्सए और फैलाव दोनों के लिए अज्ञात मापदंडों के साथ डीएक निष्पक्ष अनुमान प्राप्त हुआ:

विचरण के लिए लगभग एक विश्वास अंतराल का निर्माण करना आवश्यक है।

सूत्र (14.3.11) से स्पष्ट है कि मात्रा डीका प्रतिनिधित्व करता है

मात्रा पीप्रपत्र के यादृच्छिक चर. ये मूल्य नहीं हैं

स्वतंत्र, क्योंकि उनमें से किसी में भी मात्रा शामिल है टी,हर किसी पर निर्भर. हालाँकि, इसे बढ़ाकर दिखाया जा सकता है पीउनके योग का वितरण नियम भी सामान्य हो जाता है। लगभग पर पी= 20...30 इसे पहले से ही सामान्य माना जा सकता है।

आइए मान लें कि ऐसा है, और आइए इस कानून की विशेषताएं खोजें: गणितीय अपेक्षा और फैलाव। मूल्यांकन के बाद से डी- फिर निष्पक्ष एम[डी] = डी.

विचरण गणना डी डीअपेक्षाकृत जटिल गणनाओं से जुड़ा है, इसलिए हम इसकी अभिव्यक्ति बिना व्युत्पत्ति के प्रस्तुत करते हैं:

जहाँ q 4 चौथा है केन्द्र बिन्दुमात्रा एक्स।

इस अभिव्यक्ति का उपयोग करने के लिए, आपको मानों को प्रतिस्थापित करना होगा = 4 और डी(कम से कम करीबी वाले)। के बजाय डीआप उसके मूल्यांकन का उपयोग कर सकते हैं डी।सिद्धांत रूप में, चौथे केंद्रीय क्षण को एक अनुमान से भी बदला जा सकता है, उदाहरण के लिए, फॉर्म का मान:

लेकिन ऐसा प्रतिस्थापन बेहद कम सटीकता देगा, क्योंकि सामान्य तौर पर, सीमित संख्या में प्रयोगों के साथ, क्षण उच्च स्तरसे निर्धारित किया गया है बड़ी ग़लतियाँ. हालाँकि, व्यवहार में अक्सर ऐसा होता है कि मात्रा वितरण कानून का प्रकार एक्सपहले से ज्ञात: केवल इसके पैरामीटर अज्ञात हैं। फिर आप μ 4 को व्यक्त करने का प्रयास कर सकते हैं डी।

आइए सबसे आम मामला लें, जब मूल्य एक्ससामान्य कानून के अनुसार वितरित किया गया। फिर इसका चौथा केंद्रीय क्षण फैलाव के संदर्भ में व्यक्त किया जाता है (अध्याय 6, उपधारा 6.2 देखें);

और सूत्र (14.3.12) देता है या

(14.3.14) में अज्ञात को प्रतिस्थापित करना डीउसका मूल्यांकन डी, हम पाते हैं: कहाँ से

क्षण μ 4 के माध्यम से व्यक्त किया जा सकता है डीकुछ अन्य मामलों में भी, जब मूल्य का वितरण होता है एक्सयह सामान्य नहीं है, लेकिन इसका स्वरूप ज्ञात है। उदाहरण के लिए, कानून के लिए एकसमान घनत्व(अध्याय 5 देखें) हमारे पास है:

जहां (ए, पी) वह अंतराल है जिस पर कानून निर्दिष्ट है।

इस तरह,

सूत्र (14.3.12) का उपयोग करने पर हम पाते हैं: हम लगभग कहां पाते हैं

ऐसे मामलों में जहां मात्रा 26 के लिए वितरण कानून का प्रकार अज्ञात है, मूल्य ए/ का अनुमानित अनुमान लगाते समय अभी भी सूत्र (14.3.16) का उपयोग करने की सिफारिश की जाती है, जब तक कि इस कानून पर विश्वास करने के विशेष कारण न हों सामान्य से बहुत अलग है (ध्यान देने योग्य सकारात्मक या नकारात्मक कर्टोसिस है)।

यदि अनुमानित मान a/) एक या दूसरे तरीके से प्राप्त किया जाता है, तो हम विचरण के लिए एक विश्वास अंतराल का निर्माण उसी तरह कर सकते हैं जैसे हमने इसे गणितीय अपेक्षा के लिए बनाया था:

जहां दी गई प्रायिकता p के आधार पर मान तालिका के अनुसार पाया जाता है। 14.3.1.

उदाहरण 2. एक यादृच्छिक चर के विचरण के लिए लगभग 80% विश्वास अंतराल ज्ञात कीजिए एक्सउदाहरण 1 की शर्तों के तहत, यदि यह ज्ञात है कि मूल्य एक्ससामान्य के करीब कानून के अनुसार वितरित किया गया।

समाधान।मान तालिका के समान ही रहता है. 14.3.1:

सूत्र के अनुसार (14.3.16)

सूत्र (14.3.18) का उपयोग करके हम विश्वास अंतराल पाते हैं:

औसत मूल्यों का संगत अंतराल वर्ग विचलन: (0,21; 0,29).

14.4. सटीक निर्माण विधियाँ विश्वास अंतरालसामान्य कानून के अनुसार वितरित यादृच्छिक चर के मापदंडों के लिए

पिछले उपधारा में, हमने गणितीय अपेक्षा और विचरण के लिए विश्वास अंतराल के निर्माण के लिए मोटे तौर पर अनुमानित तरीकों की जांच की। यहां हम उसी समस्या को हल करने के सटीक तरीकों के बारे में जानकारी देंगे। हम इस बात पर जोर देते हैं कि आत्मविश्वास अंतराल को सटीक रूप से खोजने के लिए मात्रा के वितरण कानून के रूप को पहले से जानना नितांत आवश्यक है एक्स,जबकि अनुमानित विधियों के अनुप्रयोग के लिए यह आवश्यक नहीं है।

विचार सटीक तरीकेआत्मविश्वास अंतराल का निर्माण निम्नलिखित तक पहुंचता है। कोई भी आत्मविश्वास अंतराल कुछ असमानताओं को पूरा करने की संभावना व्यक्त करने वाली स्थिति से पाया जाता है, जिसमें वह अनुमान शामिल होता है जिसमें हम रुचि रखते हैं एक।मूल्यांकन वितरण का नियम वी सामान्य मामलाअज्ञात मात्रा मापदंडों पर निर्भर करता है एक्स।हालाँकि, कभी-कभी यादृच्छिक चर से असमानताओं को पार करना संभव होता है प्रेक्षित मूल्यों के किसी अन्य कार्य के लिए एक्स पी एक्स 2, ..., एक्स पी.जिसका वितरण कानून अज्ञात मापदंडों पर निर्भर नहीं करता है, बल्कि केवल प्रयोगों की संख्या और मात्रा के वितरण कानून के प्रकार पर निर्भर करता है एक्स।इस प्रकार के यादृच्छिक चर गणितीय आँकड़ों में महत्वपूर्ण भूमिका निभाते हैं; मात्रा के सामान्य वितरण के मामले में उनका सबसे अधिक विस्तार से अध्ययन किया गया है एक्स।

उदाहरण के लिए, यह सिद्ध हो चुका है कि मूल्य के सामान्य वितरण के साथ एक्सयादृच्छिक मूल्य

तथाकथित का पालन करता है छात्र वितरण कानूनसाथ पी- स्वतंत्रता की 1 डिग्री; इस नियम का घनत्व रूप है

जहां G(x) ज्ञात गामा फ़ंक्शन है:

यह भी सिद्ध हो चुका है कि यादृच्छिक चर

के साथ "%2 वितरण" है पी- स्वतंत्रता की 1 डिग्री (अध्याय 7 देखें), जिसका घनत्व सूत्र द्वारा व्यक्त किया गया है

वितरण (14.4.2) और (14.4.4) की व्युत्पत्तियों पर ध्यान दिए बिना, हम दिखाएंगे कि मापदंडों के लिए विश्वास अंतराल का निर्माण करते समय उन्हें कैसे लागू किया जा सकता है टाई डी.

इसका उत्पादन होने दीजिए पीयादृच्छिक चर पर स्वतंत्र प्रयोग एक्स,आम तौर पर अज्ञात मापदंडों के साथ वितरित किया जाता है को।इन मापदंडों के लिए, अनुमान प्राप्त किए गए थे

कॉन्फिडेंस प्रोबेबिलिटी पी के अनुरूप दोनों मापदंडों के लिए कॉन्फिडेंस अंतराल का निर्माण करना आवश्यक है।

आइए पहले गणितीय अपेक्षा के लिए एक विश्वास अंतराल बनाएं। इस अन्तराल को सन्दर्भ में सममित मानना ​​स्वाभाविक है टी; मान लीजिए कि sp अंतराल की आधी लंबाई को दर्शाता है। मान s p चुना जाना चाहिए ताकि शर्त पूरी हो

आइए यादृच्छिक चर से समानता (14.4.5) के बाईं ओर जाने का प्रयास करें टीएक यादृच्छिक चर के लिए टी,छात्र कानून के अनुसार वितरित किया गया। ऐसा करने के लिए, असमानता के दोनों पक्षों को गुणा करें |m-w?|

सकारात्मक मान से: या, संकेतन (14.4.1) का उपयोग करते हुए,

आइए एक ऐसी संख्या/p ढूंढें जिससे शर्त से/p का मान ज्ञात किया जा सके

सूत्र (14.4.2) से स्पष्ट है कि (1)- यहां तक ​​कि समारोह, तो (14.4.8) देता है

समानता (14.4.9) पी के आधार पर मूल्य / पी निर्धारित करती है। यदि आपके पास अभिन्न मूल्यों की एक तालिका है

तो /p का मान तालिका में रिवर्स इंटरपोलेशन द्वारा पाया जा सकता है। हालाँकि, पहले से /p मानों की तालिका बनाना अधिक सुविधाजनक है। ऐसी तालिका परिशिष्ट (तालिका 5) में दी गई है। यह तालिका आत्मविश्वास स्तर पी और स्वतंत्रता की डिग्री की संख्या के आधार पर मान दिखाती है पी- 1. तालिका से /p निर्धारित करके। 5 और मान रहे हैं

हम विश्वास अंतराल/पी की आधी चौड़ाई और स्वयं अंतराल ज्ञात करेंगे

उदाहरण 1. एक यादृच्छिक चर पर 5 स्वतंत्र प्रयोग किए गए एक्स,आम तौर पर अज्ञात मापदंडों के साथ वितरित किया जाता है टीऔर के बारे में। प्रयोगों के परिणाम तालिका में दिये गये हैं। 14.4.1.

तालिका 14.4.1

रेटिंग ढूंढें टीगणितीय अपेक्षा के लिए और इसके लिए 90% विश्वास अंतराल/पी का निर्माण करें (अर्थात, विश्वास संभावना पी = 0.9 के अनुरूप अंतराल)।

समाधान।हमारे पास है:

के लिए आवेदन की तालिका 5 के अनुसार पी - 1 = 4 और पी = 0.9 हम पाते हैं कहाँ

कॉन्फिडेंस इंटरवल होगा

उदाहरण 2. उपधारा 14.3 के उदाहरण 1 की शर्तों के लिए, मान मानते हुए एक्ससामान्य रूप से वितरित, सटीक विश्वास अंतराल ज्ञात कीजिए।

समाधान।परिशिष्ट की तालिका 5 के अनुसार हम पाते हैं कि कब पी - 1 = 19ir =

0.8/पी = 1.328; यहाँ से

उपधारा 14.3 (ई पी = 0.072) के उदाहरण 1 के समाधान से तुलना करने पर, हम आश्वस्त हैं कि विसंगति बहुत महत्वहीन है। यदि हम दशमलव के दूसरे स्थान तक सटीकता बनाए रखते हैं, तो सटीक और अनुमानित तरीकों से पाए गए विश्वास अंतराल मेल खाते हैं:

आइए विचरण के लिए एक विश्वास अंतराल के निर्माण की ओर आगे बढ़ें। निष्पक्ष विचरण अनुमानक पर विचार करें

और यादृच्छिक चर को व्यक्त करें डीपरिमाण के माध्यम से वी(14.4.3), वितरण x 2 (14.4.4) वाला:

मात्रा के वितरण के नियम को जानना वी,आप अंतराल /(1) पा सकते हैं जिसमें यह दी गई प्रायिकता पी के साथ आता है।

वितरण का नियम kn_x(v)परिमाण I 7 का रूप चित्र में दिखाया गया है। 14.4.1.

चावल। 14.4.1

सवाल उठता है: अंतराल/पी कैसे चुनें? यदि परिमाण के वितरण का नियम वीसममित था (सामान्य कानून या छात्र वितरण की तरह), गणितीय अपेक्षा के संबंध में अंतराल /पी सममित लेना स्वाभाविक होगा। इस मामले में कानून के पी_एक्स (वी)असममित. आइए हम अंतराल /पी चुनने के लिए सहमत हों ताकि मूल्य की संभावना हो वीदाएं और बाएं अंतराल से परे (चित्र 14.4.1 में छायांकित क्षेत्र) समान और बराबर थे

इस गुण के साथ एक अंतराल /पी बनाने के लिए, हम तालिका का उपयोग करते हैं। 4 अनुप्रयोग: इसमें संख्याएँ होती हैं य)ऐसा है कि

मूल्य के लिए वी,स्वतंत्रता की आर डिग्री के साथ x 2-वितरण होना। हमारे मामले में आर = एन- 1. चलो ठीक करें आर = एन- 1 और तालिका की संगत पंक्ति में खोजें। 4 दो अर्थ एक्स 2 -एक संभाव्यता के अनुरूप है और दूसरा - संभाव्यता आइए इन्हें निरूपित करें

मान दो परऔर एक्सएल?अंतराल है य 2,अपने बाएँ के साथ, और य~दाहिना छोर.

आइए अब हम अंतराल /पी से वांछित आत्मविश्वास अंतराल /| खोजें, सीमाओं डी के साथ फैलाव के लिए, और डी2,जो बिंदु को कवर करता है डीप्रायिकता पी के साथ:

आइए हम एक अंतराल / (, = (?> ь А) बनाएं जो बिंदु को कवर करता है डीयदि और केवल यदि मान वीअंतराल /r में पड़ता है। आइए दिखाते हैं वह अंतराल

इस शर्त को पूरा करता है. दरअसल, असमानताएं असमानताओं के समतुल्य हैं

और ये असमानताएँ प्रायिकता p से संतुष्ट हैं। इस प्रकार, विचरण के लिए विश्वास अंतराल पाया गया है और इसे सूत्र (14.4.13) द्वारा व्यक्त किया गया है।

उदाहरण 3. उपधारा 14.3 के उदाहरण 2 की शर्तों के तहत विचरण के लिए विश्वास अंतराल ज्ञात करें, यदि यह ज्ञात हो कि मान एक्ससामान्य रूप से वितरित।

समाधान।हमारे पास है . परिशिष्ट की तालिका 4 के अनुसार

हम पाते हैं आर = एन - 1 = 19

सूत्र (14.4.13) का उपयोग करके हम विचरण के लिए विश्वास अंतराल पाते हैं

मानक विचलन के लिए संगत अंतराल (0.21; 0.32) है। यह अंतराल अनुमानित विधि का उपयोग करके उपधारा 14.3 के उदाहरण 2 में प्राप्त अंतराल (0.21; 0.29) से थोड़ा ही अधिक है।

  • चित्र 14.3.1 एक विश्वास अंतराल को a के बारे में सममित मानता है। सामान्य तौर पर, जैसा कि हम बाद में देखेंगे, यह आवश्यक नहीं है।

आत्मविश्वास अंतराल का अनुमान

सीखने के मकसद

सांख्यिकी निम्नलिखित पर विचार करती है दो मुख्य कार्य:

    हमारे पास नमूना डेटा के आधार पर कुछ अनुमान हैं, और हम अनुमानित पैरामीटर का सही मूल्य कहां है, इसके बारे में कुछ संभाव्य कथन बनाना चाहते हैं।

    हमारे पास एक विशिष्ट परिकल्पना है जिसे नमूना डेटा का उपयोग करके परीक्षण करने की आवश्यकता है।

इस विषय में हम पहले कार्य पर विचार करते हैं। आइए हम कॉन्फिडेंस इंटरवल की परिभाषा का भी परिचय दें।

कॉन्फिडेंस इंटरवल एक ऐसा अंतराल है जो एक पैरामीटर के अनुमानित मूल्य के आसपास बनाया जाता है और दिखाता है कि अनुमानित पैरामीटर का सही मूल्य पूर्व निर्दिष्ट संभावना के साथ कहाँ स्थित है।

इस विषय पर सामग्री का अध्ययन करने के बाद, आप:

    जानें कि किसी अनुमान के लिए विश्वास अंतराल क्या है;

    सांख्यिकीय समस्याओं को वर्गीकृत करना सीखें;

    सांख्यिकीय फ़ार्मुलों और सॉफ़्टवेयर टूल का उपयोग करके आत्मविश्वास अंतराल बनाने की तकनीक में महारत हासिल करें;

    सांख्यिकीय अनुमानों की सटीकता के कुछ मापदंडों को प्राप्त करने के लिए आवश्यक नमूना आकार निर्धारित करना सीखें।

नमूना विशेषताओं का वितरण

टी वितरण

जैसा कि ऊपर चर्चा की गई है, यादृच्छिक चर का वितरण मानकीकृत के करीब है सामान्य वितरणपैरामीटर 0 और 1 के साथ। चूँकि हम σ का मान नहीं जानते हैं, इसलिए हम इसे s के कुछ अनुमान से बदल देते हैं। मात्रा का पहले से ही एक अलग वितरण है, अर्थात् या छात्र वितरण, जो पैरामीटर n -1 (स्वतंत्रता की डिग्री की संख्या) द्वारा निर्धारित किया जाता है। यह वितरण सामान्य वितरण के करीब है (जितना बड़ा n, वितरण उतना ही करीब)।

चित्र में. 95
स्वतंत्रता की 30 डिग्री के साथ छात्र वितरण प्रस्तुत किया गया है। जैसा कि आप देख सकते हैं, यह सामान्य वितरण के बहुत करीब है।

सामान्य वितरण NORMIDIST और NORMINV के साथ काम करने के कार्यों के समान, टी-वितरण के साथ काम करने के लिए कार्य हैं - STUDIST (TDIST) और स्टुड्रासोब्र (टीआईएनवी). इन फ़ंक्शंस का उपयोग करने का एक उदाहरण STUDRASP.XLS फ़ाइल (टेम्पलेट और समाधान) और चित्र में देखा जा सकता है। 96
.

अन्य विशेषताओं का वितरण

जैसा कि हम पहले से ही जानते हैं, गणितीय अपेक्षा का अनुमान लगाने की सटीकता निर्धारित करने के लिए, हमें टी-वितरण की आवश्यकता है। विचरण जैसे अन्य मापदंडों का अनुमान लगाने के लिए, विभिन्न वितरणों की आवश्यकता होती है। उनमें से दो एफ-वितरण और हैं x 2-वितरण.

माध्य के लिए विश्वास अंतराल

विश्वास अंतराल- यह एक अंतराल है जो पैरामीटर के अनुमानित मूल्य के आसपास बनाया गया है और दिखाता है कि अनुमानित पैरामीटर का सही मूल्य प्राथमिक निर्दिष्ट संभावना के साथ कहां स्थित है।

औसत मूल्य के लिए एक विश्वास अंतराल का निर्माण होता है इस अनुसार:

उदाहरण

फास्ट फूड रेस्तरां एक नए प्रकार के सैंडविच के साथ अपने वर्गीकरण का विस्तार करने की योजना बना रहा है। इसकी मांग का अनुमान लगाने के लिए, प्रबंधक उन लोगों में से 40 आगंतुकों को बेतरतीब ढंग से चुनने की योजना बना रहा है जिन्होंने इसे पहले ही आज़मा लिया है और उनसे 1 से 10 के पैमाने पर नए उत्पाद के प्रति उनके दृष्टिकोण को रेट करने के लिए कहा है। प्रबंधक अपेक्षित का अनुमान लगाना चाहता है नए उत्पाद को प्राप्त होने वाले अंकों की संख्या और इस अनुमान के लिए 95% विश्वास अंतराल का निर्माण करना। यह कैसे करना है? (फ़ाइल SANDWICH1.XLS (टेम्पलेट और समाधान) देखें)।

समाधान

इस समस्या को हल करने के लिए आप इसका उपयोग कर सकते हैं। परिणाम को आंकड़े में दर्शाया गया है। 97
.

कुल मूल्य के लिए विश्वास अंतराल

कभी-कभी, नमूना डेटा का उपयोग करके, गणितीय अपेक्षा का नहीं, बल्कि अनुमान लगाना आवश्यक होता है कुल राशिमूल्य. उदाहरण के लिए, एक ऑडिटर की स्थिति में, रुचि औसत खाता आकार का नहीं, बल्कि सभी खातों के योग का अनुमान लगाने में हो सकती है।

चलो एन - कुलतत्व, n नमूना आकार है, T 3 नमूने में मानों का योग है, T" संपूर्ण जनसंख्या के लिए योग का अनुमान है, फिर , और विश्वास अंतराल की गणना सूत्र द्वारा की जाती है, जहां s नमूने के लिए मानक विचलन का अनुमान है, और नमूने के लिए माध्य का अनुमान है।

उदाहरण

मान लीजिए कि एक कर एजेंसी 10,000 करदाताओं के लिए कुल कर रिफंड का अनुमान लगाना चाहती है। करदाता या तो रिफंड प्राप्त करता है या अतिरिक्त कर का भुगतान करता है। 500 लोगों का नमूना आकार मानते हुए, रिफंड राशि के लिए 95% विश्वास अंतराल खोजें (फ़ाइल AMOUNT OF REFUND.XLS (टेम्पलेट और समाधान) देखें)।

समाधान

स्टेटप्रो के पास इस मामले के लिए कोई विशेष प्रक्रिया नहीं है, हालांकि, यह ध्यान दिया जा सकता है कि उपरोक्त सूत्रों के आधार पर औसत के लिए सीमाओं से सीमाएं प्राप्त की जा सकती हैं (चित्र 98)
).

अनुपात के लिए विश्वास अंतराल

मान लीजिए p ग्राहकों के हिस्से की गणितीय अपेक्षा है, और मान लीजिए कि p b आकार n के नमूने से प्राप्त इस हिस्से का अनुमान है। इसे पर्याप्त रूप से बड़े पैमाने पर दिखाया जा सकता है मूल्यांकन वितरण गणितीय अपेक्षा पी और मानक विचलन के साथ सामान्य के करीब होगा . इस मामले में अनुमान की मानक त्रुटि को इस प्रकार व्यक्त किया गया है , और आत्मविश्वास अंतराल इस प्रकार है .

उदाहरण

फास्ट फूड रेस्तरां एक नए प्रकार के सैंडविच के साथ अपने वर्गीकरण का विस्तार करने की योजना बना रहा है। इसकी मांग का आकलन करने के लिए, प्रबंधक ने बेतरतीब ढंग से उन लोगों में से 40 आगंतुकों का चयन किया, जिन्होंने इसे पहले ही आज़मा लिया था और उनसे 1 से 10 के पैमाने पर नए उत्पाद के प्रति उनके दृष्टिकोण को रेट करने के लिए कहा। प्रबंधक अपेक्षित अनुपात का अनुमान लगाना चाहता है जो ग्राहक नए उत्पाद को कम से कम 6 अंक से अधिक रेटिंग देते हैं (उन्हें उम्मीद है कि ये ग्राहक नए उत्पाद के उपभोक्ता होंगे)।

समाधान

प्रारंभ में, हम विशेषता 1 के आधार पर एक नया कॉलम बनाते हैं यदि क्लाइंट की रेटिंग 6 अंक से अधिक थी और अन्यथा 0 (फ़ाइल SANDWICH2.XLS (टेम्पलेट और समाधान) देखें)।

विधि 1

1 की संख्या गिनकर, हम हिस्सेदारी का अनुमान लगाते हैं, और फिर सूत्रों का उपयोग करते हैं।

Zcr मान विशेष सामान्य वितरण तालिकाओं से लिया गया है (उदाहरण के लिए, 95% विश्वास अंतराल के लिए 1.96)।

95% अंतराल के निर्माण के लिए इस दृष्टिकोण और विशिष्ट डेटा का उपयोग करके, हम निम्नलिखित परिणाम प्राप्त करते हैं (चित्र 99)।
). महत्वपूर्ण मानपैरामीटर z cr 1.96 के बराबर है। अनुमान की मानक त्रुटि 0.077 है। विश्वास अंतराल की निचली सीमा 0.475 है। विश्वास अंतराल की ऊपरी सीमा 0.775 है। इस प्रकार, प्रबंधक को 95% विश्वास के साथ यह विश्वास करने का अधिकार है कि नए उत्पाद को 6 अंक या अधिक रेटिंग देने वाले ग्राहकों का प्रतिशत 47.5 और 77.5 के बीच होगा।

विधि 2

इस समस्या को मानक स्टेटप्रो टूल का उपयोग करके हल किया जा सकता है। ऐसा करने के लिए, यह नोट करना पर्याप्त है कि इस मामले में शेयर टाइप कॉलम के औसत मूल्य से मेल खाता है। आगे हम आवेदन करते हैं स्टेटप्रो/सांख्यिकीय अनुमान/एक-नमूना विश्लेषणटाइप कॉलम के लिए माध्य (गणितीय अपेक्षा का अनुमान) का आत्मविश्वास अंतराल बनाना। इस मामले में प्राप्त परिणाम पहली विधि (चित्र 99) के परिणामों के बहुत करीब होंगे।

मानक विचलन के लिए विश्वास अंतराल

s का उपयोग मानक विचलन के अनुमान के रूप में किया जाता है (सूत्र धारा 1 में दिया गया है)। अनुमान एस का घनत्व फ़ंक्शन ची-स्क्वायर फ़ंक्शन है, जिसमें टी-वितरण की तरह, स्वतंत्रता की एन-1 डिग्री है। इस वितरण के साथ काम करने के लिए CHIDIST और CHIINV विशेष कार्य हैं।

इस मामले में विश्वास अंतराल अब सममित नहीं होगा। एक पारंपरिक सीमा आरेख चित्र में दिखाया गया है। 100 .

उदाहरण

मशीन को 10 सेमी व्यास वाले भागों का उत्पादन करना चाहिए। हालांकि, विभिन्न परिस्थितियों के कारण त्रुटियां होती हैं। गुणवत्ता नियंत्रक दो परिस्थितियों को लेकर चिंतित है: पहला, औसत मान 10 सेमी होना चाहिए; दूसरे, इस मामले में भी, यदि विचलन बड़े हैं, तो कई भाग अस्वीकार कर दिए जाएंगे। हर दिन वह 50 भागों का एक नमूना बनाता है (फ़ाइल गुणवत्ता नियंत्रण.एक्सएलएस (टेम्पलेट और समाधान) देखें)। ऐसा नमूना क्या निष्कर्ष दे सकता है?

समाधान

आइए माध्य और मानक विचलन का उपयोग करके 95% विश्वास अंतराल का निर्माण करें स्टेटप्रो/सांख्यिकीय अनुमान/एक-नमूना विश्लेषण(चित्र 101
).

इसके बाद, व्यास के सामान्य वितरण की धारणा का उपयोग करते हुए, हम 0.065 का अधिकतम विचलन निर्धारित करते हुए, दोषपूर्ण उत्पादों के अनुपात की गणना करते हैं। प्रतिस्थापन तालिका (दो मापदंडों का मामला) की क्षमताओं का उपयोग करते हुए, हम औसत मूल्य और मानक विचलन (छवि 102) पर दोषों के अनुपात की निर्भरता की साजिश रचते हैं।
).

दो साधनों के बीच अंतर के लिए कॉन्फिडेंस अंतराल

यह सर्वाधिक में से एक है महत्वपूर्ण अनुप्रयोगसांख्यिकीय पद्धतियां। स्थितियों के उदाहरण.

    एक कपड़े की दुकान का प्रबंधक जानना चाहेगा कि औसत महिला ग्राहक औसत पुरुष ग्राहक की तुलना में स्टोर में कितना अधिक या कम खर्च करती है।

    दोनों एयरलाइंस समान मार्गों पर उड़ान भरती हैं। एक उपभोक्ता संगठन दोनों एयरलाइनों के लिए औसत अपेक्षित उड़ान विलंब समय के बीच अंतर की तुलना करना चाहेगा।

    कंपनी इसके लिए कूपन भेजती है व्यक्तिगत प्रजातिमाल एक शहर में होता है और दूसरे शहर में नहीं भेजा जाता। प्रबंधक अगले दो महीनों में इन उत्पादों की औसत खरीद मात्रा की तुलना करना चाहते हैं।

    एक कार डीलर अक्सर प्रस्तुतियों में विवाहित जोड़ों से डील करता है। प्रस्तुतिकरण पर उनकी व्यक्तिगत प्रतिक्रियाओं को समझने के लिए, जोड़ों से अक्सर अलग-अलग साक्षात्कार लिया जाता है। प्रबंधक पुरुषों और महिलाओं द्वारा दी गई रेटिंग में अंतर का मूल्यांकन करना चाहता है।

स्वतंत्र नमूनों का मामला

साधनों के बीच के अंतर में n 1 + n 2 - 2 डिग्री की स्वतंत्रता के साथ t-वितरण होगा। μ 1 - μ 2 के लिए विश्वास अंतराल संबंध द्वारा व्यक्त किया गया है:

इस समस्या को न केवल उपरोक्त सूत्रों का उपयोग करके, बल्कि मानक स्टेटप्रो टूल का उपयोग करके भी हल किया जा सकता है। ऐसा करने के लिए, इसका उपयोग करना पर्याप्त है

अनुपातों के बीच अंतर के लिए विश्वास अंतराल

आइए शेयरों की गणितीय अपेक्षा करें। आइए उनके नमूना अनुमान, क्रमशः आकार n 1 और n 2 के नमूनों से निर्मित हों। फिर अंतर का एक अनुमान है। इसलिए, इस अंतर का विश्वास अंतराल इस प्रकार व्यक्त किया गया है:

यहां z cr विशेष तालिकाओं का उपयोग करके सामान्य वितरण से प्राप्त एक मान है (उदाहरण के लिए, 95% विश्वास अंतराल के लिए 1.96)।

इस मामले में अनुमान की मानक त्रुटि संबंध द्वारा व्यक्त की गई है:

.

उदाहरण

बड़ी बिक्री की तैयारी कर रहे स्टोर ने निम्नलिखित कदम उठाए: विपणन अनुसंधान. 300 का चयन किया गया सर्वोत्तम खरीददार, जो बदले में यादृच्छिक रूप से प्रत्येक 150 सदस्यों के दो समूहों में विभाजित हो गए। सभी चयनित खरीदारों को बिक्री में भाग लेने के लिए निमंत्रण भेजा गया था, लेकिन केवल पहले समूह के सदस्यों को एक कूपन मिला जो उन्हें 5% छूट का हकदार बनाता था। बिक्री के दौरान, सभी 300 चयनित खरीदारों की खरीदारी दर्ज की गई। एक प्रबंधक परिणामों की व्याख्या कैसे कर सकता है और कूपन की प्रभावशीलता के बारे में निर्णय कैसे ले सकता है? (फ़ाइल COUPONS.XLS (टेम्पलेट और समाधान) देखें)।

समाधान

हमारे विशिष्ट मामले के लिए, डिस्काउंट कूपन प्राप्त करने वाले 150 ग्राहकों में से 55 ने बिक्री पर खरीदारी की, और जिन 150 को कूपन नहीं मिला, उनमें से केवल 35 ने खरीदारी की (चित्र 103)
). तब नमूना अनुपात का मान क्रमशः 0.3667 और 0.2333 है। और उनके बीच नमूना अंतर क्रमशः 0.1333 के बराबर है। 95% विश्वास अंतराल मानते हुए, हम सामान्य वितरण तालिका z cr = 1.96 से पाते हैं। नमूना अंतर की मानक त्रुटि की गणना 0.0524 है। हम अंततः पाते हैं कि 95% विश्वास अंतराल की निचली सीमा 0.0307 है, और ऊपरी सीमाक्रमशः 0.2359. प्राप्त परिणामों की व्याख्या इस तरह की जा सकती है कि डिस्काउंट कूपन प्राप्त करने वाले प्रत्येक 100 ग्राहकों के लिए, हम 3 से 23 नए ग्राहकों की उम्मीद कर सकते हैं। हालाँकि, हमें यह ध्यान में रखना चाहिए कि इस निष्कर्ष का अर्थ कूपन के उपयोग की प्रभावशीलता नहीं है (क्योंकि छूट प्रदान करके, हम लाभ खो देते हैं!)। आइए इसे विशिष्ट डेटा के साथ प्रदर्शित करें। चलिए ऐसा दिखावा करते हैं औसत आकारखरीद 400 रूबल के बराबर है, जिसमें से 50 रूबल। दुकान के लिए लाभ है. फिर जिन 100 ग्राहकों को कूपन नहीं मिला, उन पर अपेक्षित लाभ है:

50 0.2333 100 = 1166.50 रूबल।

कूपन प्राप्त करने वाले 100 ग्राहकों के लिए समान गणना इस प्रकार है:

30 0.3667 100 = 1100.10 रूबल।

औसत लाभ में 30 की कमी को इस तथ्य से समझाया गया है कि, छूट का उपयोग करते हुए, कूपन प्राप्त करने वाले ग्राहक औसतन 380 रूबल की खरीदारी करेंगे।

इस प्रकार, अंतिम निष्कर्ष इस विशेष स्थिति में ऐसे कूपन का उपयोग करने की अप्रभावीता को इंगित करता है।

टिप्पणी। इस समस्या को मानक स्टेटप्रो टूल का उपयोग करके हल किया जा सकता है। ऐसा करने के लिए, इसे कम करना पर्याप्त है इस कार्यविधि का उपयोग करके दो औसतों के बीच अंतर का अनुमान लगाने की समस्या का समाधान करें, और फिर उसे लागू करें स्टेटप्रो/सांख्यिकीय अनुमान/दो-नमूना विश्लेषणदो औसत मूल्यों के बीच अंतर के लिए एक विश्वास अंतराल का निर्माण करना।

कॉन्फिडेंस अंतराल लंबाई को नियंत्रित करना

विश्वास अंतराल की लंबाई निर्भर करती है निम्नलिखित शर्तें :

    डेटा सीधे (मानक विचलन);

    स्तर का महत्व;

    नमूने का आकार।

माध्य का अनुमान लगाने के लिए नमूना आकार

सबसे पहले, आइए सामान्य मामले में समस्या पर विचार करें। आइए हमें दिए गए विश्वास अंतराल की आधी लंबाई के मान को बी के रूप में निरूपित करें (चित्र 104)।
). हम जानते हैं कि कुछ यादृच्छिक चर X के माध्य मान के लिए विश्वास अंतराल को इस प्रकार व्यक्त किया जाता है , कहाँ . विश्वास:

और n को व्यक्त करने पर हमें प्राप्त होता है।

दुर्भाग्य से, सही मूल्यहम यादृच्छिक चर X के प्रसरण को नहीं जानते हैं। इसके अलावा, हम टीसीआर का मूल्य नहीं जानते हैं, क्योंकि यह स्वतंत्रता की डिग्री की संख्या के माध्यम से एन पर निर्भर करता है। इस स्थिति में, हम निम्नलिखित कार्य कर सकते हैं। भिन्नता के बजाय, हम अध्ययन के तहत यादृच्छिक चर के किसी भी उपलब्ध कार्यान्वयन के आधार पर भिन्नता के कुछ अनुमान का उपयोग करते हैं। t cr मान के बजाय, हम सामान्य वितरण के लिए z cr मान का उपयोग करते हैं। यह काफी स्वीकार्य है, क्योंकि सामान्य और टी-वितरण के लिए वितरण घनत्व फ़ंक्शन बहुत करीब हैं (छोटे एन के मामले को छोड़कर)। इस प्रकार, आवश्यक सूत्र रूप लेता है:

.

चूंकि सूत्र, आम तौर पर बोलते हुए, गैर-पूर्णांक परिणाम देता है, परिणाम की अधिकता के साथ पूर्णांक को वांछित नमूना आकार के रूप में लिया जाता है।

उदाहरण

फास्ट फूड रेस्तरां एक नए प्रकार के सैंडविच के साथ अपने वर्गीकरण का विस्तार करने की योजना बना रहा है। इसकी मांग का आकलन करने के लिए, प्रबंधक उन लोगों में से यादृच्छिक रूप से कई आगंतुकों का चयन करने की योजना बना रहा है जिन्होंने इसे पहले ही आज़मा लिया है और उनसे 1 से 10 के पैमाने पर नए उत्पाद के प्रति उनके दृष्टिकोण को रेट करने के लिए कहा है। प्रबंधक अनुमान लगाना चाहता है अंकों की अपेक्षित संख्या जो नए उत्पाद को प्राप्त होगी और इस अनुमान के लिए 95% विश्वास अंतराल का निर्माण करेगी। साथ ही वह चाहते हैं कि कॉन्फिडेंस इंटरवल की आधी चौड़ाई 0.3 से अधिक न हो। उसे साक्षात्कार के लिए कितने आगंतुकों की आवश्यकता है?

निम्नलिखित नुसार:

यहाँ आर ओटीएसअनुपात पी का एक अनुमान है, और बी विश्वास अंतराल की दी गई आधी लंबाई है। मान का उपयोग करके n का अधिक अनुमान प्राप्त किया जा सकता है आर ओटीएस= 0.5. इस मामले में, विश्वास अंतराल की लंबाई पी के किसी भी वास्तविक मूल्य के लिए निर्दिष्ट मान बी से अधिक नहीं होगी।

उदाहरण

पिछले उदाहरण से प्रबंधक को नए प्रकार के उत्पाद को पसंद करने वाले ग्राहकों की हिस्सेदारी का अनुमान लगाने की योजना बनाने दें। वह 90% विश्वास अंतराल का निर्माण करना चाहता है जिसकी आधी लंबाई 0.05 से अधिक न हो। यादृच्छिक नमूने में कितने ग्राहकों को शामिल किया जाना चाहिए?

समाधान

हमारे मामले में, z cr का मान = 1.645. इसलिए, आवश्यक मात्रा की गणना इस प्रकार की जाती है .

यदि प्रबंधक के पास यह विश्वास करने का कारण है कि वांछित पी-मान, उदाहरण के लिए, लगभग 0.3 है, तो इस मान को उपरोक्त सूत्र में प्रतिस्थापित करने पर, हमें एक छोटा यादृच्छिक नमूना मान मिलेगा, अर्थात् 228।

निर्धारण का सूत्र दो साधनों के बीच अंतर के मामले में यादृच्छिक नमूना आकारइस प्रकार लिखा गया है:

.

उदाहरण

कुछ कंप्यूटर कंपनी का ग्राहक सेवा केंद्र होता है। में हाल ही मेंसेवा की खराब गुणवत्ता के बारे में ग्राहकों की शिकायतों की संख्या में वृद्धि हुई है। में सर्विस सेंटरमुख्य रूप से दो प्रकार के कर्मचारी होते हैं: वे जिनके पास अधिक अनुभव नहीं है, लेकिन उन्होंने विशेष प्रारंभिक पाठ्यक्रम पूरा कर लिया है, और वे जिनके पास व्यापक व्यावहारिक अनुभव है, लेकिन उन्होंने विशेष पाठ्यक्रम पूरा नहीं किया है। कंपनी पिछले छह महीनों में ग्राहकों की शिकायतों का विश्लेषण करना चाहती है और कर्मचारियों के प्रत्येक दो समूहों के लिए शिकायतों की औसत संख्या की तुलना करना चाहती है। यह माना जाता है कि दोनों समूहों के नमूनों में संख्याएँ समान होंगी। 2 से अधिक की आधी लंबाई के साथ 95% अंतराल प्राप्त करने के लिए नमूने में कितने कर्मचारियों को शामिल किया जाना चाहिए?

समाधान

यहाँ σ ots इस धारणा के तहत दोनों यादृच्छिक चर के मानक विचलन का एक अनुमान है कि वे करीब हैं। इस प्रकार, हमारी समस्या में हमें किसी तरह यह अनुमान प्राप्त करने की आवश्यकता है। उदाहरण के लिए, यह इस प्रकार किया जा सकता है। पिछले छह महीनों में ग्राहकों की शिकायतों के डेटा को देखने के बाद, एक प्रबंधक देख सकता है कि प्रत्येक कर्मचारी को आम तौर पर 6 से 36 शिकायतें प्राप्त होती हैं। यह जानते हुए कि सामान्य वितरण के लिए लगभग सभी मान माध्य से तीन गुना से अधिक नहीं हटाए जाते हैं मानक विचलन, वह यथोचित विश्वास कर सकता है कि:

, जहाँ से σ ots = 5.

इस मान को सूत्र में प्रतिस्थापित करने पर, हमें प्राप्त होता है .

निर्धारण का सूत्र अनुपातों के बीच अंतर का अनुमान लगाने के मामले में यादृच्छिक नमूना आकारइसका रूप है:

उदाहरण

किसी कंपनी के पास समान उत्पाद बनाने वाली दो फ़ैक्टरियाँ हैं। एक कंपनी प्रबंधक दोनों कारखानों में दोषपूर्ण उत्पादों के प्रतिशत की तुलना करना चाहता है। उपलब्ध जानकारी के अनुसार, दोनों कारखानों में दोष दर 3 से 5% तक है। इसका उद्देश्य 0.005 (या 0.5%) से अधिक की आधी लंबाई के साथ 99% विश्वास अंतराल का निर्माण करना है। प्रत्येक कारखाने से कितने उत्पाद चुने जाने चाहिए?

समाधान

यहां पी 1ओटी और पी 2ओटी पहली और दूसरी फैक्ट्री में दो अज्ञात दोषों का अनुमान हैं। यदि हम p 1ots = p 2ots = 0.5 रखते हैं, तो हमें n के लिए एक अतिरंजित मान प्राप्त होता है। लेकिन चूंकि हमारे मामले में हमारे पास इन शेयरों के बारे में कुछ प्राथमिक जानकारी है, इसलिए हम इन शेयरों का ऊपरी अनुमान, अर्थात् 0.05 लेते हैं। हम पाते हैं

नमूना डेटा से कुछ जनसंख्या मापदंडों का अनुमान लगाते समय, न केवल देना उपयोगी होता है बिंदु लागतपैरामीटर, लेकिन एक विश्वास अंतराल भी इंगित करता है जो दिखाता है कि अनुमानित पैरामीटर का सटीक मान कहां हो सकता है।

इस अध्याय में, हम मात्रात्मक संबंधों से भी परिचित हुए जो हमें विभिन्न मापदंडों के लिए ऐसे अंतराल बनाने की अनुमति देते हैं; आत्मविश्वास अंतराल की लंबाई को नियंत्रित करने के तरीके सीखे।

यह भी ध्यान दें कि नमूना आकार का अनुमान लगाने की समस्या (प्रयोग की योजना बनाने की समस्या) को मानक स्टेटप्रो टूल का उपयोग करके हल किया जा सकता है, अर्थात् स्टेटप्रो/सांख्यिकीय अनुमान/नमूना आकार चयन.

"कैटरेन-स्टाइल" कॉन्स्टेंटिन क्रावचिक के चक्र का प्रकाशन जारी रखता है चिकित्सा आँकड़े. पिछले दो लेखों में, लेखक ने और जैसी अवधारणाओं की व्याख्या की है।

कॉन्स्टेंटिन क्रावचिक

गणितज्ञ-विश्लेषक. क्षेत्र में विशेषज्ञ सांख्यिकीय अनुसंधानचिकित्सा और मानविकी में

मास्को शहर

बहुत बार लेखों में नैदानिक ​​अनुसंधानआप एक रहस्यमय वाक्यांश देख सकते हैं: "आत्मविश्वास अंतराल" (95 % सीआई या 95 % सीआई - आत्मविश्वास अंतराल)। उदाहरण के लिए, लेख लिख सकता है: “मतभेदों के महत्व का आकलन करने के लिए, हमने प्रयोग किया विद्यार्थी का टी-टेस्ट 95 % विश्वास अंतराल की गणना के साथ।"

"95 % विश्वास अंतराल" का मूल्य क्या है और इसकी गणना क्यों करें?

कॉन्फिडेंस इंटरवल क्या है? - यह वह सीमा है जिसके भीतर सच्ची जनसंख्या का मतलब झूठ होता है। क्या कोई "असत्य" औसत हैं? एक अर्थ में, हाँ, वे करते हैं। हमने समझाया कि पूरी आबादी में रुचि के पैरामीटर को मापना असंभव है, इसलिए शोधकर्ता सीमित नमूने से संतुष्ट हैं। इस नमूने में (उदाहरण के लिए, शरीर के वजन के आधार पर) एक औसत मूल्य (एक निश्चित वजन) होता है, जिसके द्वारा हम पूरी आबादी में औसत मूल्य का आकलन करते हैं। हालाँकि, यह संभावना नहीं है कि किसी नमूने (विशेष रूप से छोटे) में औसत वजन सामान्य आबादी में औसत वजन के साथ मेल खाएगा। इसलिए, जनसंख्या के औसत मूल्यों की सीमा की गणना और उपयोग करना अधिक सही है।

उदाहरण के लिए, कल्पना करें कि हीमोग्लोबिन के लिए 95% आत्मविश्वास अंतराल (95% सीआई) 110 से 122 ग्राम/लीटर है। इसका मतलब यह है कि 95% संभावना है कि जनसंख्या में वास्तविक औसत हीमोग्लोबिन मान 110 और 122 ग्राम/लीटर के बीच होगा। दूसरे शब्दों में, हम नहीं जानते औसतसामान्य जनसंख्या में हीमोग्लोबिन, लेकिन हम 95 % संभावना के साथ इस विशेषता के लिए मूल्यों की एक श्रृंखला का संकेत दे सकते हैं।

कॉन्फिडेंस अंतराल विशेष रूप से समूहों के बीच साधनों में अंतर, या प्रभाव आकार, जैसा कि उन्हें कहा जाता है, के लिए प्रासंगिक हैं।

मान लीजिए कि हमने दो लौह तैयारियों की प्रभावशीलता की तुलना की: एक जो लंबे समय से बाजार में है और एक जो अभी पंजीकृत हुई है। चिकित्सा के पाठ्यक्रम के बाद, हमने रोगियों के अध्ययन किए गए समूहों में हीमोग्लोबिन एकाग्रता का आकलन किया, और सांख्यिकीय कार्यक्रम ने गणना की कि दोनों समूहों के औसत मूल्यों के बीच का अंतर, 95 % संभावना के साथ, 1.72 से लेकर 14.36 ग्राम/लीटर (तालिका 1)।

मेज़ 1. स्वतंत्र नमूनों का परीक्षण करें
(समूहों की तुलना हीमोग्लोबिन स्तर से की जाती है)

इसकी व्याख्या इस प्रकार की जानी चाहिए: सामान्य आबादी के कुछ रोगियों में जो लेते हैं नई दवा, हीमोग्लोबिन उन लोगों की तुलना में औसतन 1.72-14.36 ग्राम/लीटर अधिक होगा जिन्होंने पहले से ही ज्ञात दवा ली थी।

दूसरे शब्दों में, सामान्य आबादी में, समूहों के बीच औसत हीमोग्लोबिन मूल्यों में अंतर 95% संभावना के साथ इन सीमाओं के भीतर है। यह शोधकर्ता पर निर्भर करेगा कि वह यह तय करे कि यह बहुत है या थोड़ा। इन सबका मुद्दा यह है कि हम एक औसत मूल्य के साथ काम नहीं कर रहे हैं, बल्कि मूल्यों की एक श्रृंखला के साथ काम कर रहे हैं, इसलिए, हम समूहों के बीच एक पैरामीटर में अंतर का अधिक विश्वसनीय रूप से अनुमान लगाते हैं।

सांख्यिकीय पैकेजों में, शोधकर्ता के विवेक पर, आप आत्मविश्वास अंतराल की सीमाओं को स्वतंत्र रूप से संकीर्ण या विस्तारित कर सकते हैं। विश्वास अंतराल संभावनाओं को कम करके, हम साधनों की सीमा को सीमित करते हैं। उदाहरण के लिए, 90 % CI पर साधनों की सीमा (या साधनों में अंतर) 95 % से कम होगी।

इसके विपरीत, संभावना को 99 % तक बढ़ाने से मानों की सीमा का विस्तार होता है। समूहों की तुलना करते समय, सीआई की निचली सीमा शून्य अंक को पार कर सकती है। उदाहरण के लिए, यदि हमने कॉन्फिडेंस अंतराल की सीमाओं को 99 % तक विस्तारित किया, तो अंतराल की सीमाएं -1 से 16 ग्राम/लीटर तक थीं। इसका मतलब यह है कि सामान्य आबादी में ऐसे समूह होते हैं, जिनके बीच अध्ययन की जा रही विशेषता के बीच का अंतर 0 (एम = 0) के बराबर होता है।

कॉन्फिडेंस इंटरवल का उपयोग करके आप जांच कर सकते हैं सांख्यिकीय परिकल्पनाएँ. यदि विश्वास अंतराल शून्य मान को पार कर जाता है, तो शून्य परिकल्पना, जो मानती है कि समूह अध्ययन किए जा रहे पैरामीटर पर भिन्न नहीं हैं, सत्य है। उदाहरण ऊपर वर्णित है जहां हमने सीमाओं को 99 % तक विस्तारित किया है। सामान्य आबादी में कहीं-कहीं हमें ऐसे समूह मिले जो किसी भी तरह से भिन्न नहीं थे।

हीमोग्लोबिन में अंतर का 95% आत्मविश्वास अंतराल, (जी/एल)


यह आंकड़ा दो समूहों के बीच औसत हीमोग्लोबिन मूल्यों में अंतर के लिए 95% विश्वास अंतराल दिखाता है। रेखा शून्य चिह्न से होकर गुजरती है, इसलिए शून्य के माध्य में अंतर होता है, जो शून्य परिकल्पना की पुष्टि करता है कि समूहों में अंतर नहीं है। समूहों के बीच अंतर की सीमा -2 से 5 ग्राम/लीटर तक है। इसका मतलब है कि हीमोग्लोबिन या तो 2 ग्राम/लीटर तक घट सकता है या 5 ग्राम/लीटर तक बढ़ सकता है।

कॉन्फिडेंस इंटरवल बहुत है महत्वपूर्ण सूचक. इसके लिए धन्यवाद, आप देख सकते हैं कि समूहों में अंतर वास्तव में साधनों में अंतर के कारण था या बड़े नमूने के कारण, क्योंकि बड़े नमूने में अंतर खोजने की संभावना छोटे नमूने की तुलना में अधिक होती है।

व्यवहार में यह इस तरह दिख सकता है. हमने 1000 लोगों का एक नमूना लिया, हीमोग्लोबिन के स्तर को मापा और पाया कि साधनों में अंतर के लिए आत्मविश्वास अंतराल 1.2 से 1.5 ग्राम/लीटर तक था। इस मामले में सांख्यिकीय महत्व का स्तर पी

हम देखते हैं कि हीमोग्लोबिन सांद्रता में वृद्धि हुई है, लेकिन लगभग अगोचर रूप से, इसलिए, आंकड़ों की महत्तानमूना आकार के कारण सटीक रूप से दिखाई दिया।

कॉन्फिडेंस अंतराल की गणना न केवल साधनों के लिए की जा सकती है, बल्कि अनुपात (और जोखिम अनुपात) के लिए भी की जा सकती है। उदाहरण के लिए, हम उन रोगियों के अनुपात के विश्वास अंतराल में रुचि रखते हैं जिन्होंने एक विकसित दवा लेते समय छूट प्राप्त की। आइए मान लें कि अनुपात के लिए 95 % सीआई, यानी ऐसे रोगियों के अनुपात के लिए, 0.60–0.80 की सीमा में है। इस प्रकार, हम कह सकते हैं कि हमारी दवा है उपचारात्मक प्रभाव 60 से 80 % मामलों तक।

मान लीजिए कि हमारे पास कुछ विशेषताओं के सामान्य वितरण के साथ बड़ी संख्या में वस्तुएं हैं (उदाहरण के लिए, एक ही प्रकार की सब्जियों का एक पूरा गोदाम, जिसका आकार और वजन भिन्न होता है)। आप माल के पूरे बैच की औसत विशेषताएँ जानना चाहते हैं, लेकिन आपके पास प्रत्येक सब्जी को मापने और तौलने का न तो समय है और न ही इच्छा। आप समझते हैं कि यह आवश्यक नहीं है. लेकिन मौके पर जांच के लिए कितने टुकड़े ले जाने होंगे?

इस स्थिति के लिए उपयोगी कई सूत्र देने से पहले, आइए कुछ संकेतन को याद करें।

सबसे पहले, अगर हमने सब्जियों के पूरे गोदाम को मापा (तत्वों के इस सेट को सामान्य आबादी कहा जाता है), तो हमें पूरे बैच का औसत वजन हमारे लिए उपलब्ध सभी सटीकता के साथ पता चल जाएगा। चलिए इसे औसत कहते हैं एक्स औसत .जी एन . - सामान्य औसत। हम पहले से ही जानते हैं कि यदि इसका माध्य मान और विचलन ज्ञात हो तो क्या पूरी तरह से निर्धारित होता है . सच है, जबकि हम न तो एक्स औसत पीढ़ी हैं और न हीएस हम आम जनता को नहीं जानते. हम केवल एक निश्चित नमूना ले सकते हैं, हमारे लिए आवश्यक मानों को माप सकते हैं और इस नमूने के लिए औसत मान X औसत और मानक विचलन S दोनों की गणना कर सकते हैं।

यह ज्ञात है कि यदि हमारे नमूना जांच में बड़ी संख्या में तत्व होते हैं (आमतौर पर n 30 से अधिक होता है), और उन्हें लिया जाता है वास्तव में यादृच्छिक, फिर एस सामान्य जनसंख्या एस चयन से शायद ही भिन्न होगी..

इसके अलावा, सामान्य वितरण के मामले में हम निम्नलिखित सूत्रों का उपयोग कर सकते हैं:

95% की संभावना के साथ


99% की संभावना के साथ



में सामान्य रूप से देखेंसंभाव्यता पी (टी) के साथ


टी मान और संभाव्यता मान पी (टी) के बीच संबंध, जिसके साथ हम विश्वास अंतराल जानना चाहते हैं, निम्न तालिका से लिया जा सकता है:


इस प्रकार, हमने यह निर्धारित कर लिया है कि जनसंख्या का औसत मूल्य किस श्रेणी में है (दी गई संभावना के साथ)।

जब तक हमारे पास पर्याप्त बड़ा नमूना न हो, हम ऐसा नहीं कह सकते जनसंख्याहै s = एस चयन करें इसके अलावा, इस मामले में नमूने की सामान्य वितरण से निकटता समस्याग्रस्त है। इस मामले में, हम इसके बजाय S सेलेक्ट का भी उपयोग करते हैंसूत्र में है:




लेकिन एक निश्चित संभावना P(t) के लिए t का मान नमूना n में तत्वों की संख्या पर निर्भर करेगा। n जितना बड़ा होगा, परिणामी विश्वास अंतराल सूत्र (1) द्वारा दिए गए मान के उतना ही करीब होगा। इस मामले में t मान किसी अन्य तालिका (छात्र का t-परीक्षण) से लिया गया है, जिसे हम नीचे प्रस्तुत करते हैं:

संभाव्यता 0.95 और 0.99 के लिए विद्यार्थी का टी-परीक्षण मान


उदाहरण 3.कंपनी के कर्मचारियों में से 30 लोगों को यादृच्छिक रूप से चुना गया। नमूने के अनुसार, यह पता चला कि औसत वेतन (प्रति माह) 5 हजार रूबल के मानक विचलन के साथ 30 हजार रूबल है। 0.99 की प्रायिकता के साथ कंपनी में औसत वेतन निर्धारित करें।

समाधान:शर्त के अनुसार हमारे पास n = 30, X औसत है। =30000, एस=5000, पी = 0.99. आत्मविश्वास अंतराल खोजने के लिए, हम छात्र के टी परीक्षण के अनुरूप सूत्र का उपयोग करेंगे। n = 30 और P = 0.99 की तालिका से हम t = 2.756 पाते हैं, इसलिए,


वे। वांछित ट्रस्टीअंतराल 27484< Х ср.ген < 32516.

तो, 0.99 की संभावना के साथ हम कह सकते हैं कि अंतराल (27484; 32516) में कंपनी में औसत वेतन शामिल है।

हम आशा करते हैं कि आप इस विधि का उपयोग करेंगे और यह आवश्यक नहीं है कि हर बार आपके पास एक टेबल हो। एक्सेल में गणनाएँ स्वचालित रूप से की जा सकती हैं। एक्सेल फ़ाइल में रहते हुए, शीर्ष मेनू में एफएक्स बटन पर क्लिक करें। फिर, फ़ंक्शंस के बीच "सांख्यिकीय" प्रकार का चयन करें, और विंडो में प्रस्तावित सूची से - स्टूडेंट डिस्कवर। फिर, प्रॉम्प्ट पर, कर्सर को "संभावना" फ़ील्ड में रखकर, उलटा संभावना का मान दर्ज करें (यानी हमारे मामले में, 0.95 की संभावना के बजाय, आपको 0.05 की संभावना टाइप करने की आवश्यकता है)। जाहिरा तौर पर स्प्रेडशीटइस तरह से संकलित किया गया है कि परिणाम इस प्रश्न का उत्तर देता है कि हम किस संभावना के साथ गलती कर सकते हैं। इसी प्रकार, स्वतंत्रता की डिग्री फ़ील्ड में, अपने नमूने के लिए एक मान (n-1) दर्ज करें।



साइट पर नया

>

सबसे लोकप्रिय