घर मुंह स्टेटिस्टिका आत्मविश्वास अंतराल. विश्वास अंतराल

स्टेटिस्टिका आत्मविश्वास अंतराल. विश्वास अंतराल

इस लेख से आप सीखेंगे:

    क्या हुआ है विश्वास अंतराल?

    क्या बात है 3 सिग्मा नियम?

    आप इस ज्ञान को व्यवहार में कैसे लागू कर सकते हैं?

आजकल, उत्पादों, बिक्री दिशाओं, कर्मचारियों, गतिविधि के क्षेत्रों आदि के एक बड़े वर्गीकरण से जुड़ी जानकारी की अधिकता के कारण, मुख्य बात को उजागर करना कठिन हो सकता है, जो, सबसे पहले, ध्यान देने और प्रबंधित करने के प्रयास करने लायक है। परिभाषा विश्वास अंतरालऔर इसकी सीमाओं से परे जाकर वास्तविक मूल्यों का विश्लेषण - एक तकनीक जो आपको स्थितियों को उजागर करने में मदद मिलेगी, बदलते रुझानों को प्रभावित करना।आप सकारात्मक कारकों को विकसित करने और नकारात्मक कारकों के प्रभाव को कम करने में सक्षम होंगे। इस तकनीक का इस्तेमाल कई जानी-मानी वैश्विक कंपनियों में किया जाता है।

तथाकथित हैं " अलर्ट", कौन प्रबंधकों को सूचित करेंकि अगला मान एक निश्चित दिशा में है परे चला गया विश्वास अंतराल. इसका अर्थ क्या है? यह एक संकेत है कि कोई असामान्य घटना घटी है, जो इस दिशा में मौजूदा रुझान को बदल सकती है। यह एक संकेत हैउस के लिए पता लगाने के लिएस्थिति में और समझें कि किस चीज़ ने इसे प्रभावित किया।

उदाहरण के लिए, कई स्थितियों पर विचार करें. हमने 2011 के लिए 100 उत्पाद वस्तुओं के लिए महीने के हिसाब से और मार्च में वास्तविक बिक्री के पूर्वानुमान सीमा के साथ बिक्री पूर्वानुमान की गणना की:

  1. सूरजमुखी तेल के लिए, उन्होंने पूर्वानुमान की ऊपरी सीमा तोड़ दी और विश्वास अंतराल में नहीं आए।
  2. "सूखा खमीर" के लिए हमने पूर्वानुमान की निचली सीमा पार कर ली है।
  3. द्वारा " जई का दलिया"ऊपरी सीमा को तोड़ दिया।

अन्य उत्पादों के लिए, वास्तविक बिक्री दी गई पूर्वानुमान सीमा के भीतर थी। वे। उनकी बिक्री उम्मीदों के अनुरूप थी। इसलिए, हमने 3 उत्पादों की पहचान की जो सीमाओं से परे चले गए और यह पता लगाना शुरू किया कि किस चीज़ ने उन्हें सीमाओं से परे जाने के लिए प्रभावित किया:

  1. सूरजमुखी तेल के लिए, हमने एक नए वितरण नेटवर्क में प्रवेश किया, जिससे हमें अतिरिक्त बिक्री की मात्रा मिली, जिसके कारण हम ऊपरी सीमा से आगे निकल गए। इस उत्पाद के लिए, इस नेटवर्क के बिक्री पूर्वानुमान को ध्यान में रखते हुए, वर्ष के अंत तक पूर्वानुमान की पुनर्गणना करना उचित है।
  2. "ड्राई यीस्ट" के लिए कार सीमा शुल्क में फंस गई, और 5 दिनों के भीतर कमी हो गई, जिससे बिक्री में गिरावट आई और निचली सीमा से अधिक हो गई। यह पता लगाना सार्थक हो सकता है कि इसका कारण क्या है और इस स्थिति को दोबारा न दोहराने का प्रयास करें।
  3. ओटमील दलिया के लिए एक बिक्री प्रोत्साहन कार्यक्रम शुरू किया गया, जिससे बिक्री में उल्लेखनीय वृद्धि हुई और कंपनी पूर्वानुमान से आगे निकल गई।

हमने तीन कारकों की पहचान की है जो पूर्वानुमान सीमा से आगे जाने को प्रभावित करते हैं। जीवन में पूर्वानुमान और योजना की सटीकता बढ़ाने के लिए, ऐसे कारक जो इस तथ्य की ओर ले जाते हैं कि वास्तविक बिक्री पूर्वानुमान से आगे जा सकती है, उनके लिए अलग से पूर्वानुमान और योजनाएँ बनाना और उजागर करना उचित है। और फिर मुख्य बिक्री पूर्वानुमान पर उनके प्रभाव पर विचार करें। आप नियमित रूप से इन कारकों के प्रभाव का आकलन भी कर सकते हैं और स्थिति को बेहतरी के लिए बदल सकते हैं। नकारात्मक कारकों के प्रभाव को कम करके और सकारात्मक कारकों के प्रभाव को बढ़ाकर.

आत्मविश्वास अंतराल के साथ हम यह कर सकते हैं:

  1. दिशानिर्देश चुनें, जिन पर ध्यान देने योग्य है, क्योंकि इन दिशाओं में ऐसी घटनाएँ घटी हैं जो प्रभावित कर सकती हैं प्रवृत्ति में परिवर्तन.
  2. कारकों को पहचानें, जो वास्तव में स्थिति में बदलाव को प्रभावित करते हैं।
  3. स्वीकार करना सूचित निर्णय(उदाहरण के लिए, खरीदारी, योजना आदि के बारे में)।

अब आइए देखें कि कॉन्फिडेंस इंटरवल क्या है और एक उदाहरण का उपयोग करके एक्सेल में इसकी गणना कैसे करें।

कॉन्फिडेंस इंटरवल क्या है?

विश्वास अंतराल- ये पूर्वानुमान सीमाएँ (ऊपरी और निचली) हैं, जिनके भीतर दी गई प्रायिकता (सिग्मा) के साथवास्तविक मान दिखाई देंगे.

वे। हम पूर्वानुमान की गणना करते हैं - यह हमारा मुख्य दिशानिर्देश है, लेकिन हम समझते हैं कि वास्तविक मान हमारे पूर्वानुमान के 100% बराबर होने की संभावना नहीं है। और सवाल उठता है, किन सीमाओं के भीतरवास्तविक मूल्य गिर सकते हैं, यदि वर्तमान प्रवृत्ति जारी रहती है? और यह प्रश्न हमें उत्तर देने में मदद करेगा आत्मविश्वास अंतराल गणना, अर्थात। - पूर्वानुमान की ऊपरी और निचली सीमाएँ।

दी गई संभाव्यता सिग्मा क्या है?

गणना करते समयआत्मविश्वास अंतराल हम कर सकते हैं संभाव्यता निर्धारित करें एचआईटीएसवास्तविक मूल्य दी गई पूर्वानुमान सीमा के भीतर. इसे कैसे करना है? ऐसा करने के लिए, हम सिग्मा का मान निर्धारित करते हैं और, यदि सिग्मा इसके बराबर है:

    3 सिग्मा- फिर, विश्वास अंतराल में आने वाले अगले वास्तविक मूल्य की संभावना 99.7%, या 300 से 1 होगी, या सीमाओं से परे जाने की 0.3% संभावना है।

    2 सिग्मा- तो, ​​सीमाओं के भीतर अगले मान के गिरने की संभावना ≈ 95.5% है, यानी। संभावना लगभग 20 से 1 है, या अति हो जाने की 4.5% संभावना है।

    1 सिग्मा- तो संभावना ≈ 68.3% है, अर्थात। संभावनाएँ लगभग 2 से 1 हैं, या 31.7% संभावना है कि अगला मान विश्वास अंतराल से बाहर हो जाएगा।

हमने तैयार किया 3 सिग्मा नियम,जो ऐसा कहता है हिट संभावनाएक और यादृच्छिक मूल्य विश्वास अंतराल मेंकिसी दिए गए मान के साथ थ्री सिग्मा 99.7% है.

महान रूसी गणितज्ञ चेबीशेव ने प्रमेय सिद्ध किया कि तीन सिग्मा के दिए गए मान के साथ पूर्वानुमान सीमा से आगे जाने की 10% संभावना है। वे। 3-सिग्मा विश्वास अंतराल के भीतर आने की संभावना कम से कम 90% होगी, जबकि पूर्वानुमान और उसकी सीमाओं की "आंख से" गणना करने का प्रयास बहुत अधिक महत्वपूर्ण त्रुटियों से भरा है।

एक्सेल में स्वयं कॉन्फिडेंस अंतराल की गणना कैसे करें?

आइए एक उदाहरण का उपयोग करके एक्सेल में विश्वास अंतराल (यानी, पूर्वानुमान की ऊपरी और निचली सीमाएं) की गणना देखें। हमारे पास एक समय श्रृंखला है - 5 वर्षों के लिए महीने के हिसाब से बिक्री। संलग्न फाइल देख।

पूर्वानुमान सीमा की गणना करने के लिए, हम गणना करते हैं:

  1. बिक्री पूर्वानुमान().
  2. सिग्मा - मानक विचलनवास्तविक मूल्यों से पूर्वानुमान मॉडल।
  3. तीन सिग्मा.
  4. विश्वास अंतराल।

1. बिक्री पूर्वानुमान.

=(आरसी[-14] (समय श्रृंखला डेटा)- आरसी[-1] (मॉडल मान))^2(वर्ग)


3. प्रत्येक माह के लिए, आइए चरण 8 Sum((Xi-Ximod)^2) से विचलन मानों का योग करें, अर्थात। आइए प्रत्येक वर्ष के लिए जनवरी, फरवरी... का सारांश निकालें।

ऐसा करने के लिए, सूत्र =SUMIF() का उपयोग करें

SUMIF (चक्र के अंदर अवधि संख्याओं के साथ सरणी (1 से 12 तक के महीनों के लिए); चक्र में अवधि संख्या से लिंक; स्रोत डेटा और अवधि मानों के बीच अंतर के वर्गों के साथ एक सरणी से लिंक)


4. चक्र में 1 से 12 तक प्रत्येक अवधि के लिए मानक विचलन की गणना करें (चरण 10) संलग्न फाइल में).

ऐसा करने के लिए, हम चरण 9 में गणना किए गए मान से मूल निकालते हैं और इस चक्र में अवधियों की संख्या से विभाजित करते हैं माइनस 1 = SQRT((Sum(Xi-Ximod)^2/(n-1))

आइए Excel =ROOT(R8) में सूत्रों का उपयोग करें ((Sum(Xi-Ximod)^2 से लिंक)/(COUNTIF($O$8:$O$67 (चक्र संख्या के साथ सरणी से लिंक); O8 (एक विशिष्ट चक्र संख्या से लिंक करें जिसे हम सरणी में गिनते हैं))-1))

एक्सेल सूत्र = COUNTIF का उपयोग करनाहम संख्या n गिनते हैं


पूर्वानुमान मॉडल से वास्तविक डेटा के मानक विचलन की गणना करने के बाद, हमने प्रत्येक माह के लिए सिग्मा मान प्राप्त किया - चरण 10 संलग्न फाइल में ।

3. आइए 3 सिग्मा की गणना करें।

चरण 11 पर हम सिग्मा की संख्या निर्धारित करते हैं - हमारे उदाहरण में "3" (चरण 11 संलग्न फाइल में):

अभ्यास के लिए भी सुविधाजनक सिग्मा मान:

1.64 सिग्मा - सीमा पार करने की 10% संभावना (10 में 1 मौका);

1.96 सिग्मा - सीमा से परे जाने की 5% संभावना (20 में 1 मौका);

2.6 सिग्मा - सीमा से परे जाने की 1% संभावना (100 में 1 संभावना)।

5) तीन सिग्मा की गणना, इसके लिए हम प्रत्येक माह के लिए "सिग्मा" मान को "3" से गुणा करते हैं।

3. विश्वास अंतराल निर्धारित करें.

  1. ऊपरी सीमापूर्वानुमान- वृद्धि और मौसमी + (प्लस) 3 सिग्मा को ध्यान में रखते हुए बिक्री पूर्वानुमान;
  2. कम पूर्वानुमान सीमा- वृद्धि और मौसमी को ध्यान में रखते हुए बिक्री का पूर्वानुमान - (माइनस) 3 सिग्मा;

कॉन्फिडेंस इंटरवल की गणना की सुविधा के लिए एक लंबी अवधि(संलग्न फ़ाइल देखें) आइए एक्सेल सूत्र का उपयोग करें =Y8+VLOOKUP(W8,$U$8:$V$19,2,0), कहाँ

Y8- बिक्री पूर्वानुमान;

W8- उस महीने की संख्या जिसके लिए हम 3-सिग्मा मान लेंगे;

वे। ऊपरी पूर्वानुमान सीमा= "बिक्री पूर्वानुमान" + "3 सिग्मा" (उदाहरण में, VLOOKUP(माह संख्या; 3 सिग्मा मानों वाली तालिका; कॉलम जिसमें से हम संबंधित पंक्ति में माह संख्या के बराबर सिग्मा मान निकालते हैं; 0))।

कम पूर्वानुमान सीमा= "बिक्री पूर्वानुमान" शून्य से "3 सिग्मा"।

इसलिए, हमने एक्सेल में कॉन्फिडेंस इंटरवल की गणना की।

अब हमारे पास एक पूर्वानुमान और सीमाओं के साथ एक सीमा है जिसके भीतर वास्तविक मान किसी दिए गए सिग्मा संभावना के साथ गिरेंगे।

इस लेख में हमने देखा कि सिग्मा क्या है और तीन का नियमसिग्मा, आत्मविश्वास अंतराल का निर्धारण कैसे करें और आप अभ्यास में इस तकनीक का उपयोग क्यों कर सकते हैं।

हम आपके सटीक पूर्वानुमान और सफलता की कामना करते हैं!

कैसे Forecast4AC PRO आपकी मदद कर सकता हैविश्वास अंतराल की गणना करते समय?:

    Forecast4AC PRO स्वचालित रूप से एक साथ 1000 से अधिक समय श्रृंखला के लिए पूर्वानुमान की ऊपरी या निचली सीमा की गणना करेगा;

    एक कीस्ट्रोक के साथ चार्ट पर पूर्वानुमान, प्रवृत्ति और वास्तविक बिक्री की तुलना में पूर्वानुमान की सीमाओं का विश्लेषण करने की क्षमता;

Forcast4AC PRO प्रोग्राम में सिग्मा मान को 1 से 3 तक सेट करना संभव है।

हमसे जुड़ें!

डाउनलोड करना मुक्त एप्लिकेशन्सपूर्वानुमान और व्यापार विश्लेषण के लिए:


  • नोवो पूर्वानुमान लाइट- स्वचालित पूर्वानुमान गणनावी एक्सेल.
  • 4एनालिटिक्स - एबीसी-एक्सवाईजेड विश्लेषणऔर उत्सर्जन विश्लेषण एक्सेल.
  • क्लिक सेंसडेस्कटॉप और QlikViewव्यक्तिगत संस्करण - डेटा विश्लेषण और विज़ुअलाइज़ेशन के लिए बीआई सिस्टम।

सशुल्क समाधानों की क्षमताओं का परीक्षण करें:

  • नोवो फोरकास्ट प्रो- बड़े डेटा सेट के लिए एक्सेल में पूर्वानुमान।
विश्वास अंतराल– मूल्यों को सीमित करें सांख्यिकीय मूल्य, जो एक निश्चित आत्मविश्वास संभावना के साथ γ बड़ी मात्रा का नमूना लेने पर इस अंतराल में होगा। P(θ - ε) के रूप में दर्शाया जाता है। व्यवहार में, विश्वास संभावना γ को एकता के काफी करीब मूल्यों से चुना जाता है: γ = 0.9, γ = 0.95, γ = 0.99।

सेवा का उद्देश्य. इस सेवा का उपयोग करके, आप यह निर्धारित कर सकते हैं:

  • सामान्य माध्य के लिए विश्वास अंतराल, विचरण के लिए विश्वास अंतराल;
  • मानक विचलन के लिए विश्वास अंतराल, सामान्य शेयर के लिए विश्वास अंतराल;
परिणामी समाधान एक Word फ़ाइल में सहेजा गया है (उदाहरण देखें)। प्रारंभिक डेटा कैसे भरें, इस पर एक वीडियो निर्देश नीचे दिया गया है।

उदाहरण क्रमांक 1. एक सामूहिक फार्म पर, 1000 भेड़ों के कुल झुंड में से, 100 भेड़ों को चयनात्मक नियंत्रण कतरन से गुजरना पड़ा। परिणामस्वरूप, प्रति भेड़ औसतन 4.2 किलोग्राम ऊन की कतरन स्थापित की गई। प्रति भेड़ औसत ऊन कतरन का निर्धारण करते समय नमूने की माध्य वर्ग त्रुटि 0.99 की संभावना के साथ निर्धारित करें और यदि भिन्नता 2.5 है तो कतरनी मूल्य किस सीमा के भीतर निहित है। नमूना गैर-दोहरावदार है.
उदाहरण संख्या 2. मॉस्को उत्तरी सीमा शुल्क के पद पर आयातित उत्पादों के एक बैच से, उत्पाद "ए" के 20 नमूने यादृच्छिक दोहराया नमूने द्वारा लिए गए थे। परीक्षण के परिणामस्वरूप, नमूने में उत्पाद "ए" की औसत नमी सामग्री स्थापित की गई, जो 1% के मानक विचलन के साथ 6% के बराबर निकली।
आयातित उत्पादों के पूरे बैच में उत्पाद की औसत नमी सामग्री की सीमा 0.683 की संभावना के साथ निर्धारित करें।
उदाहरण संख्या 3. 36 छात्रों के एक सर्वेक्षण से पता चला कि वे प्रति वर्ष औसतन कितनी पाठ्यपुस्तकें पढ़ते हैं शैक्षणिक वर्ष, 6 के बराबर निकला। यह मानते हुए कि प्रति सेमेस्टर एक छात्र द्वारा पढ़ी जाने वाली पाठ्यपुस्तकों की संख्या 6 के बराबर मानक विचलन के साथ एक सामान्य वितरण कानून है, खोजें: ए) 0.99 की विश्वसनीयता के साथ, अंतराल अनुमान गणितीय अपेक्षायह अनियमित परिवर्तनशील वस्तु; बी) हम किस संभावना के साथ कह सकते हैं कि किसी दिए गए नमूने से गणना की गई प्रति सेमेस्टर एक छात्र द्वारा पढ़ी जाने वाली पाठ्यपुस्तकों की औसत संख्या गणितीय अपेक्षा से भिन्न होगी निरपेक्ष मूल्य 2 से अधिक नहीं.

आत्मविश्वास अंतराल का वर्गीकरण

मूल्यांकन किए जा रहे पैरामीटर के प्रकार के अनुसार:

नमूना प्रकार के अनुसार:

  1. अनंत नमूने के लिए विश्वास अंतराल;
  2. अंतिम नमूने के लिए विश्वास अंतराल;
नमूने को पुनः नमूनाकरण कहा जाता है, यदि चयनित वस्तु अगले वस्तु को चुनने से पहले जनसंख्या में वापस कर दी जाती है। नमूने को गैर-दोहराना कहा जाता है, यदि चयनित वस्तु जनसंख्या में वापस नहीं आती है। व्यवहार में, हम आम तौर पर गैर-दोहराव वाले नमूनों से निपटते हैं।

यादृच्छिक नमूनाकरण के लिए औसत नमूनाकरण त्रुटि की गणना

नमूने से प्राप्त संकेतकों के मूल्यों और संबंधित मापदंडों के बीच विसंगति जनसंख्याबुलाया प्रतिनिधित्व संबंधी त्रुटि.
सामान्य और नमूना आबादी के मुख्य मापदंडों के पदनाम।
औसत नमूनाकरण त्रुटि सूत्र
पुनः चयनचयन दोहराएँ
औसत के लिएशेयर के लिएऔसत के लिएशेयर के लिए
नमूना त्रुटि सीमा (Δ) के बीच संबंध कुछ संभावना के साथ गारंटीकृत है Р(टी),और औसत त्रुटिनमूने का रूप है: या Δ = t·μ, जहां टी- आत्मविश्वास गुणांक, लाप्लास इंटीग्रल फ़ंक्शन की तालिका के अनुसार संभाव्यता स्तर पी (टी) के आधार पर निर्धारित किया जाता है।

विशुद्ध रूप से यादृच्छिक नमूनाकरण विधि का उपयोग करके नमूना आकार की गणना के लिए सूत्र

गणितीय अपेक्षा के लिए विश्वास अंतराल - यह डेटा से गणना किया गया एक अंतराल है, जिसमें ज्ञात संभावना के साथ, सामान्य जनसंख्या की गणितीय अपेक्षा शामिल होती है। गणितीय अपेक्षा के लिए एक प्राकृतिक अनुमान उसके देखे गए मूल्यों का अंकगणितीय माध्य है। इसलिए, पूरे पाठ में हम "औसत" और "औसत मूल्य" शब्दों का उपयोग करेंगे। आत्मविश्वास अंतराल की गणना करने की समस्याओं में, सबसे अधिक बार एक उत्तर की आवश्यकता होती है जैसे "माध्य का विश्वास अंतराल [किसी विशेष समस्या में मूल्य] [छोटे मूल्य] से [बड़े मूल्य] तक होता है।" आत्मविश्वास अंतराल का उपयोग करके, आप न केवल औसत मूल्यों का मूल्यांकन कर सकते हैं, बल्कि सामान्य जनसंख्या की किसी विशेष विशेषता के अनुपात का भी मूल्यांकन कर सकते हैं। औसत, विचरण, मानक विचलनऔर जिन त्रुटियों के माध्यम से हम नई परिभाषाओं और सूत्रों तक पहुंचेंगे, उन पर पाठ में चर्चा की गई है नमूने और जनसंख्या के लक्षण .

माध्य के बिंदु और अंतराल अनुमान

यदि जनसंख्या के औसत मूल्य का अनुमान किसी संख्या (बिंदु) द्वारा लगाया जाता है, तो एक विशिष्ट औसत, जिसकी गणना टिप्पणियों के नमूने से की जाती है, को जनसंख्या के अज्ञात औसत मूल्य के अनुमान के रूप में लिया जाता है। इस मामले में, नमूना माध्य का मान - एक यादृच्छिक चर - सामान्य जनसंख्या के माध्य मान से मेल नहीं खाता है। इसलिए, नमूना माध्य इंगित करते समय, आपको साथ ही नमूना त्रुटि भी इंगित करनी होगी। नमूनाकरण त्रुटि का माप मानक त्रुटि है, जिसे माध्य के समान इकाइयों में व्यक्त किया जाता है। इसलिए, निम्नलिखित संकेतन का अक्सर उपयोग किया जाता है: .

यदि औसत का अनुमान एक निश्चित संभावना से जुड़ा होना चाहिए, तो जनसंख्या में रुचि के पैरामीटर का आकलन एक संख्या से नहीं, बल्कि एक अंतराल से किया जाना चाहिए। एक विश्वास अंतराल एक अंतराल है जिसमें, एक निश्चित संभावना के साथ पीअनुमानित जनसंख्या सूचक का मान ज्ञात किया जाता है। आत्मविश्वास अंतराल जिसमें यह संभावित है पी = 1 - α यादृच्छिक चर पाया जाता है, जिसकी गणना निम्नानुसार की जाती है:

,

α = 1 - पी, जो सांख्यिकी पर लगभग किसी भी पुस्तक के परिशिष्ट में पाया जा सकता है।

व्यवहार में, जनसंख्या माध्य और विचरण ज्ञात नहीं हैं, इसलिए जनसंख्या विचरण को नमूना विचरण से और जनसंख्या माध्य को नमूना माध्य से प्रतिस्थापित कर दिया जाता है। इस प्रकार, अधिकांश मामलों में विश्वास अंतराल की गणना निम्नानुसार की जाती है:

.

जनसंख्या माध्य का अनुमान लगाने के लिए आत्मविश्वास अंतराल सूत्र का उपयोग किया जा सकता है

  • जनसंख्या का मानक विचलन ज्ञात है;
  • या जनसंख्या का मानक विचलन अज्ञात है, लेकिन नमूना आकार 30 से अधिक है।

नमूना माध्य जनसंख्या माध्य का निष्पक्ष अनुमान है। बदले में, नमूना विचरण जनसंख्या भिन्नता का निष्पक्ष अनुमान नहीं है। नमूना विचरण सूत्र, नमूना आकार में जनसंख्या विचरण का निष्पक्ष अनुमान प्राप्त करने के लिए एनद्वारा प्रतिस्थापित किया जाना चाहिए एन-1.

उदाहरण 1।एक निश्चित शहर में यादृच्छिक रूप से चयनित 100 कैफे से जानकारी एकत्र की गई कि उनमें कर्मचारियों की औसत संख्या 4.6 के मानक विचलन के साथ 10.5 है। कैफे कर्मचारियों की संख्या के लिए 95% विश्वास अंतराल निर्धारित करें।

कहाँ - महत्वपूर्ण मानमानक सामान्य वितरणमहत्व स्तर के लिए α = 0,05 .

इस प्रकार, कैफे कर्मचारियों की औसत संख्या के लिए 95% विश्वास अंतराल 9.6 से 11.4 तक था।

उदाहरण 2. 64 अवलोकनों की जनसंख्या से एक यादृच्छिक नमूने के लिए, निम्नलिखित कुल मूल्यों की गणना की गई:

प्रेक्षणों में मूल्यों का योग,

माध्य से मानों के वर्ग विचलन का योग .

गणितीय अपेक्षा के लिए 95% विश्वास अंतराल की गणना करें।

आइए मानक विचलन की गणना करें:

,

आइए औसत मूल्य की गणना करें:

.

हम आत्मविश्वास अंतराल के लिए अभिव्यक्ति में मानों को प्रतिस्थापित करते हैं:

महत्व स्तर के लिए मानक सामान्य वितरण का महत्वपूर्ण मूल्य कहां है α = 0,05 .

हम पाते हैं:

इस प्रकार, इस नमूने की गणितीय अपेक्षा के लिए 95% विश्वास अंतराल 7.484 से 11.266 तक था।

उदाहरण 3. 100 अवलोकनों के यादृच्छिक जनसंख्या नमूने के लिए, परिकलित माध्य 15.2 है और मानक विचलन 3.2 है। अपेक्षित मूल्य के लिए 95% विश्वास अंतराल की गणना करें, फिर 99% विश्वास अंतराल की। यदि नमूना शक्ति और इसकी भिन्नता अपरिवर्तित रहती है और आत्मविश्वास गुणांक बढ़ता है, तो क्या आत्मविश्वास अंतराल संकीर्ण या चौड़ा होगा?

हम इन मानों को विश्वास अंतराल के लिए अभिव्यक्ति में प्रतिस्थापित करते हैं:

महत्व स्तर के लिए मानक सामान्य वितरण का महत्वपूर्ण मूल्य कहां है α = 0,05 .

हम पाते हैं:

.

इस प्रकार, इस नमूने के माध्य के लिए 95% विश्वास अंतराल 14.57 से 15.82 तक था।

हम फिर से इन मानों को विश्वास अंतराल के लिए अभिव्यक्ति में प्रतिस्थापित करते हैं:

महत्व स्तर के लिए मानक सामान्य वितरण का महत्वपूर्ण मूल्य कहां है α = 0,01 .

हम पाते हैं:

.

इस प्रकार, इस नमूने के माध्य के लिए 99% विश्वास अंतराल 14.37 से 16.02 तक था।

जैसा कि हम देखते हैं, जैसे-जैसे विश्वास गुणांक बढ़ता है, मानक सामान्य वितरण का महत्वपूर्ण मूल्य भी बढ़ता है, और परिणामस्वरूप, अंतराल के शुरुआती और समाप्ति बिंदु माध्य से आगे स्थित होते हैं, और इस प्रकार गणितीय अपेक्षा के लिए विश्वास अंतराल बढ़ता है .

विशिष्ट गुरुत्व के बिंदु और अंतराल अनुमान

कुछ नमूना विशेषता के हिस्से की व्याख्या इस प्रकार की जा सकती है बिंदु लागत विशिष्ट गुरुत्व पीसामान्य जनसंख्या में वही विशेषता. यदि इस मान को संभाव्यता के साथ संबद्ध करने की आवश्यकता है, तो विशिष्ट गुरुत्व के विश्वास अंतराल की गणना की जानी चाहिए पीसंभाव्यता के साथ जनसंख्या में विशेषता पी = 1 - α :

.

उदाहरण 4.किसी शहर में दो उम्मीदवार हैं और बीमेयर के लिए दौड़ रहे हैं. 200 शहर निवासियों का यादृच्छिक सर्वेक्षण किया गया, जिनमें से 46% ने जवाब दिया कि वे उम्मीदवार को वोट देंगे , 26% - उम्मीदवार के लिए बीऔर 28% को नहीं पता कि वे किसे वोट देंगे। उम्मीदवार का समर्थन करने वाले शहर निवासियों के अनुपात के लिए 95% विश्वास अंतराल निर्धारित करें .

कोई भी नमूना केवल सामान्य जनसंख्या का एक अनुमानित विचार देता है, और सभी नमूना सांख्यिकीय विशेषताएँ (माध्य, मोड, विचरण...) कुछ सन्निकटन हैं या कहें कि सामान्य मापदंडों का एक अनुमान है, जिसकी ज्यादातर मामलों में गणना करना संभव नहीं है। सामान्य आबादी की दुर्गमता के लिए (चित्र 20)।

चित्र 20. नमूनाकरण त्रुटि

लेकिन आप उस अंतराल को निर्दिष्ट कर सकते हैं जिसमें, एक निश्चित डिग्री की संभावना के साथ, सांख्यिकीय विशेषता का सही (सामान्य) मान निहित है। इस अंतराल को कहा जाता है डी आत्मविश्वास अंतराल (सीआई)।

तो 95% की संभावना के साथ सामान्य औसत मूल्य भीतर निहित है

से, (20)

कहाँ टी तालिका मानछात्र का टी टेस्ट α =0.05 और एफ= एन-1

इस मामले में, 99% सीआई भी पाया जा सकता है टी के लिए चयनित α =0,01.

कॉन्फिडेंस इंटरवल का व्यावहारिक महत्व क्या है?

    एक विस्तृत आत्मविश्वास अंतराल इंगित करता है कि नमूना माध्य जनसंख्या माध्य को सटीक रूप से प्रतिबिंबित नहीं करता है। यह आमतौर पर अपर्याप्त नमूना आकार, या इसकी विविधता के कारण होता है, अर्थात। बड़ा फैलाव. वे दोनों देते हैं बड़ी गलतीऔसत और, तदनुसार, एक व्यापक सीआई। और यही अनुसंधान योजना चरण पर लौटने का आधार है।

    सीआई की ऊपरी और निचली सीमाएं यह अनुमान प्रदान करती हैं कि परिणाम चिकित्सकीय रूप से महत्वपूर्ण होंगे या नहीं

आइए समूह गुणों के अध्ययन के परिणामों के सांख्यिकीय और नैदानिक ​​​​महत्व के प्रश्न पर कुछ विस्तार से ध्यान दें। आइए याद रखें कि सांख्यिकी का कार्य नमूना डेटा के आधार पर सामान्य आबादी में कम से कम कुछ अंतरों का पता लगाना है। चिकित्सकों के लिए चुनौती अंतर का पता लगाना है (सिर्फ कोई नहीं) जो निदान या उपचार में सहायता करेगा। और सांख्यिकीय निष्कर्ष हमेशा नैदानिक ​​निष्कर्षों का आधार नहीं होते हैं। इस प्रकार, हीमोग्लोबिन में 3 ग्राम/लीटर की सांख्यिकीय रूप से महत्वपूर्ण कमी चिंता का कारण नहीं है। और, इसके विपरीत, यदि मानव शरीर में कोई समस्या पूरी आबादी के स्तर पर व्यापक नहीं है, तो यह इस समस्या से न निपटने का कोई कारण नहीं है।

आइए इस स्थिति पर नजर डालें उदाहरण.

शोधकर्ताओं ने सोचा कि क्या जो लड़के किसी प्रकार की संक्रामक बीमारी से पीड़ित हैं, वे विकास में अपने साथियों से पीछे रह जाते हैं। इसी उद्देश्य से इसे अंजाम दिया गया नमूना सर्वेक्षणजिसमें इस बीमारी से पीड़ित 10 लड़कों ने हिस्सा लिया। परिणाम तालिका 23 में प्रस्तुत किए गए हैं।

तालिका 23. सांख्यिकीय प्रसंस्करण के परिणाम

निचली सीमा

ऊपरी सीमा

मानक (सेमी)

औसत

इन गणनाओं से यह निष्कर्ष निकलता है कि नमूना औसत ऊंचाई 10 वर्ष के लड़के जिन्हें कुछ कष्ट हुआ संक्रमण, सामान्य के करीब (132.5 सेमी)। हालाँकि, आत्मविश्वास अंतराल की निचली सीमा (126.6 सेमी) इंगित करती है कि 95% संभावना है कि इन बच्चों की वास्तविक औसत ऊंचाई "छोटी ऊंचाई" की अवधारणा से मेल खाती है, अर्थात। ये बच्चे अविकसित हैं।

इस उदाहरण में, विश्वास अंतराल गणना के परिणाम चिकित्सकीय रूप से महत्वपूर्ण हैं।

अक्सर मूल्यांकक को उस खंड के रियल एस्टेट बाजार का विश्लेषण करना होता है जिसमें मूल्यांकन की जा रही संपत्ति स्थित है। यदि बाजार विकसित है, तो प्रस्तुत वस्तुओं के पूरे सेट का विश्लेषण करना मुश्किल हो सकता है, इसलिए विश्लेषण के लिए वस्तुओं का एक नमूना उपयोग किया जाता है। यह नमूना हमेशा सजातीय नहीं बनता है; कभी-कभी इसे चरम बिंदुओं से साफ़ करना आवश्यक होता है - बहुत अधिक या बहुत कम बाज़ार ऑफ़र। इसी उद्देश्य से इसका प्रयोग किया जाता है विश्वास अंतराल. लक्ष्य ये अध्ययन- विश्वास अंतराल की गणना के लिए दो तरीकों का तुलनात्मक विश्लेषण करें और estimatica.pro सिस्टम में विभिन्न नमूनों के साथ काम करते समय इष्टतम गणना विकल्प का चयन करें।

कॉन्फिडेंस अंतराल एक नमूने के आधार पर गणना की गई विशेषता मानों का एक अंतराल है, जिसमें ज्ञात संभावना के साथ सामान्य जनसंख्या का अनुमानित पैरामीटर शामिल होता है।

विश्वास अंतराल की गणना करने का उद्देश्य नमूना डेटा के आधार पर ऐसे अंतराल का निर्माण करना है ताकि दी गई संभावना के साथ यह कहा जा सके कि अनुमानित पैरामीटर का मान इस अंतराल में है। दूसरे शब्दों में, विश्वास अंतराल में एक निश्चित संभावना होती है अज्ञात मूल्यअनुमानित मूल्य। अंतराल जितना व्यापक होगा, अशुद्धि उतनी ही अधिक होगी।

कॉन्फिडेंस इंटरवल निर्धारित करने के लिए अलग-अलग तरीके हैं। इस लेख में हम 2 तरीकों पर गौर करेंगे:

  • माध्यिका और मानक विचलन के माध्यम से;
  • टी-सांख्यिकी (छात्र का गुणांक) के महत्वपूर्ण मूल्य के माध्यम से।

चरणों तुलनात्मक विश्लेषण विभिन्न तरीकेसीआई गणना:

1. एक डेटा नमूना तैयार करें;

2. हम इसे सांख्यिकीय तरीकों का उपयोग करके संसाधित करते हैं: हम औसत मूल्य, माध्यिका, विचरण, आदि की गणना करते हैं;

3. विश्वास अंतराल की गणना दो तरीकों से करें;

4. साफ किए गए नमूनों और परिणामी आत्मविश्वास अंतराल का विश्लेषण करें।

चरण 1. डेटा नमूनाकरण

नमूना estimatica.pro प्रणाली का उपयोग करके बनाया गया था। नमूने में "ख्रुश्चेव" प्रकार के लेआउट के साथ तीसरे मूल्य क्षेत्र में 1-कमरे वाले अपार्टमेंट की बिक्री के लिए 91 प्रस्ताव शामिल थे।

तालिका 1. प्रारंभिक नमूना

मूल्य 1 वर्ग मीटर, इकाइयाँ

चित्र .1। प्रारंभिक नमूना



चरण 2. प्रारंभिक नमूने का प्रसंस्करण

सांख्यिकीय विधियों का उपयोग करके किसी नमूने को संसाधित करने के लिए निम्नलिखित मानों की गणना की आवश्यकता होती है:

1. अंकगणितीय माध्य

2. माध्यिका - नमूने को दर्शाने वाली एक संख्या: नमूना तत्वों का बिल्कुल आधा हिस्सा माध्यिका से बड़ा है, अन्य आधा माध्यिका से कम है

(विषम संख्या में मान वाले नमूने के लिए)

3. रेंज - नमूने में अधिकतम और न्यूनतम मूल्यों के बीच का अंतर

4. वेरिएंस - डेटा की भिन्नता का अधिक सटीक अनुमान लगाने के लिए उपयोग किया जाता है

5. नमूना मानक विचलन (इसके बाद - एसडी) अंकगणित माध्य के आसपास समायोजन मूल्यों के फैलाव का सबसे आम संकेतक है।

6. भिन्नता का गुणांक - समायोजन मूल्यों के बिखरने की डिग्री को दर्शाता है

7. दोलन गुणांक - औसत के आसपास नमूने में चरम मूल्य मूल्यों के सापेक्ष उतार-चढ़ाव को दर्शाता है

तालिका 2. मूल नमूने के सांख्यिकीय संकेतक

भिन्नता का गुणांक, जो डेटा की एकरूपता को दर्शाता है, 12.29% है, लेकिन दोलन का गुणांक बहुत अधिक है। इस प्रकार, हम कह सकते हैं कि मूल नमूना सजातीय नहीं है, तो आइए विश्वास अंतराल की गणना के लिए आगे बढ़ें।

चरण 3. आत्मविश्वास अंतराल गणना

विधि 1. माध्यिका और मानक विचलन का उपयोग करके गणना।

विश्वास अंतराल निम्नानुसार निर्धारित किया जाता है: न्यूनतम मूल्य - मानक विचलन माध्यिका से घटाया जाता है; अधिकतम मान - मानक विचलन को माध्यिका में जोड़ा जाता है।

इस प्रकार, आत्मविश्वास अंतराल (47179 सीयू; 60689 सीयू)

चावल। 2. विश्वास अंतराल के अंतर्गत आने वाले मान 1.



विधि 2. टी-सांख्यिकी (छात्र गुणांक) के महत्वपूर्ण मूल्य का उपयोग करके एक आत्मविश्वास अंतराल का निर्माण

एस.वी. ग्रिबोव्स्की पुस्तक में " गणितीय तरीकेसंपत्ति के मूल्य का अनुमान लगाना" छात्र गुणांक का उपयोग करके आत्मविश्वास अंतराल की गणना करने की एक विधि का वर्णन करता है। इस पद्धति का उपयोग करके गणना करते समय, अनुमानक को स्वयं महत्व स्तर ∝ निर्धारित करना होगा, जो संभावना निर्धारित करता है जिसके साथ विश्वास अंतराल का निर्माण किया जाएगा। आमतौर पर, 0.1 के महत्व स्तर का उपयोग किया जाता है; 0.05 और 0.01. वे 0.9 की आत्मविश्वास संभावनाओं के अनुरूप हैं; 0.95 और 0.99. इस पद्धति के साथ, गणितीय अपेक्षा और विचरण के वास्तविक मूल्यों को व्यावहारिक रूप से अज्ञात माना जाता है (जो व्यावहारिक अनुमान समस्याओं को हल करते समय लगभग हमेशा सत्य होता है)।

कॉन्फिडेंस इंटरवल फॉर्मूला:

एन - नमूना आकार;

महत्व स्तर ∝ के साथ टी-सांख्यिकी (छात्र वितरण) का महत्वपूर्ण मूल्य, स्वतंत्रता की डिग्री एन -1 की संख्या, जो विशेष सांख्यिकीय तालिकाओं से या एमएस एक्सेल (→ "सांख्यिकीय" → STUDRIST) का उपयोग करके निर्धारित की जाती है;

∝ - महत्व स्तर, ∝=0.01 लें।

चावल। 2. विश्वास अंतराल के अंतर्गत आने वाले मान 2.

चरण 4. आत्मविश्वास अंतराल की गणना के लिए विभिन्न तरीकों का विश्लेषण

आत्मविश्वास अंतराल की गणना करने के दो तरीकों - माध्यिका और छात्र के गुणांक के माध्यम से - का नेतृत्व किया विभिन्न अर्थअंतराल. तदनुसार, हमें दो अलग-अलग साफ किए गए नमूने मिले।

तालिका 3. तीन नमूनों के आँकड़े।

अनुक्रमणिका

प्रारंभिक नमूना

1 विकल्प

विकल्प 2

औसत मूल्य

फैलाव

कोएफ़. बदलाव

कोएफ़. दोलनों

सेवानिवृत्त वस्तुओं की संख्या, पीसी।

की गई गणना के आधार पर, हम कह सकते हैं कि प्राप्त हुआ विभिन्न तरीकेविश्वास अंतराल के मान प्रतिच्छेद करते हैं, इसलिए आप मूल्यांकनकर्ता के विवेक पर किसी भी गणना पद्धति का उपयोग कर सकते हैं।

हालाँकि, हमारा मानना ​​​​है कि estimatica.pro प्रणाली में काम करते समय, बाजार विकास की डिग्री के आधार पर विश्वास अंतराल की गणना के लिए एक विधि चुनने की सलाह दी जाती है:

  • यदि बाजार अविकसित है, तो माध्यिका और मानक विचलन का उपयोग करके गणना पद्धति का उपयोग करें, क्योंकि इस मामले में सेवानिवृत्त वस्तुओं की संख्या कम है;
  • यदि बाजार विकसित हो गया है, तो टी-सांख्यिकी (छात्र गुणांक) के महत्वपूर्ण मूल्य के माध्यम से गणना लागू करें, क्योंकि एक बड़ा प्रारंभिक नमूना बनाना संभव है।

लेख तैयार करने में निम्नलिखित का उपयोग किया गया:

1. ग्रिबोव्स्की एस.वी., सिवेट्स एस.ए., लेविकिना आई.ए. संपत्ति के मूल्य का आकलन करने के लिए गणितीय तरीके। मॉस्को, 2014

2. सिस्टम डेटा estimatica.pro



साइट पर नया

>

सबसे लोकप्रिय