घर लेपित जीभ यदि भिन्नता शृंखला का स्वरूप है। भिन्नता और भिन्नता श्रृंखला, भिन्नता का दायरा

यदि भिन्नता शृंखला का स्वरूप है। भिन्नता और भिन्नता श्रृंखला, भिन्नता का दायरा

परिवर्तन संबंधीमात्रात्मक आधार पर निर्मित वितरण श्रृंखला कहलाती है। जनसंख्या की व्यक्तिगत इकाइयों में मात्रात्मक विशेषताओं के मूल्य स्थिर नहीं हैं और कमोबेश एक दूसरे से भिन्न होते हैं।

उतार-चढ़ाव- जनसंख्या की इकाइयों के बीच किसी विशेषता के मूल्य में उतार-चढ़ाव, परिवर्तनशीलता। अलग संख्यात्मक मानअध्ययनाधीन जनसंख्या में पाई जाने वाली विशेषताओं को कहा जाता है विकल्पमूल्य. के लिए अपर्याप्त औसत मूल्य पूर्ण विशेषताएँजनसंख्या हमें औसत मूल्यों को संकेतकों के साथ पूरक करने के लिए मजबूर करती है जो हमें अध्ययन की जा रही विशेषता की परिवर्तनशीलता (भिन्नता) को मापकर इन औसतों की विशिष्टता का आकलन करने की अनुमति देती है।

भिन्नता की उपस्थिति विशेषता के स्तर के निर्माण पर बड़ी संख्या में कारकों के प्रभाव के कारण होती है। ये कारक असमान शक्ति के साथ और अलग-अलग दिशाओं में कार्य करते हैं। भिन्नता सूचकांकों का उपयोग विशेषता परिवर्तनशीलता के माप का वर्णन करने के लिए किया जाता है।

कार्य सांख्यिकीय अध्ययनविविधताएँ:

  • 1) जनसंख्या की व्यक्तिगत इकाइयों में विशेषताओं की भिन्नता की प्रकृति और डिग्री का अध्ययन;
  • 2) जनसंख्या की कुछ विशेषताओं की भिन्नता में व्यक्तिगत कारकों या उनके समूहों की भूमिका का निर्धारण।

सांख्यिकी में प्रयुक्त विशेष विधियाँसंकेतकों की एक प्रणाली के उपयोग के आधार पर भिन्नता का अध्ययन, साथजिसके द्वारा भिन्नता मापी जाती है।

विविधताओं का अध्ययन किया गया है महत्वपूर्ण. नमूनाकरण, सहसंबंध और संचालन करते समय विविधताओं को मापना आवश्यक है भिन्नता का विश्लेषणवगैरह। एर्मोलेव ओ.यू. मनोवैज्ञानिकों के लिए गणितीय आँकड़े: पाठ्यपुस्तक [पाठ]/ ओ.यू. एर्मोलेव। - एम.: मॉस्को साइकोलॉजिकल एंड सोशल इंस्टीट्यूट का फ्लिंट पब्लिशिंग हाउस, 2012। - 335 पी।

भिन्नता की डिग्री से कोई जनसंख्या की एकरूपता, विशेषताओं के व्यक्तिगत मूल्यों की स्थिरता और औसत की विशिष्टता का न्याय कर सकता है। उनके आधार पर, नमूना अवलोकन की सटीकता का आकलन करने के लिए विशेषताओं और संकेतकों के बीच संबंधों की निकटता के संकेतक विकसित किए जाते हैं।

स्थान में भिन्नता और समय में भिन्नता के बीच अंतर किया जाता है।

अंतरिक्ष में भिन्नता को व्यक्तिगत क्षेत्रों का प्रतिनिधित्व करने वाली जनसंख्या इकाइयों के बीच विशेषता मूल्यों के उतार-चढ़ाव के रूप में समझा जाता है। समय के साथ परिवर्तन का अर्थ है किसी विशेषता के मूल्यों में परिवर्तन अलग-अलग अवधिसमय।

वितरण पंक्तियों में भिन्नता का अध्ययन करने के लिए, विशेषता मानों के सभी प्रकारों को आरोही या अवरोही क्रम में व्यवस्थित किया जाता है। इस प्रक्रिया को श्रृंखला रैंकिंग कहा जाता है।

सबसे सरल संकेतविविधताएँ हैं न्यूनतम और अधिकतम- सबसे कम और उच्चतम मूल्यसमुच्चय में संकेत. फीचर मानों के अलग-अलग वेरिएंट की पुनरावृत्ति की संख्या को पुनरावृत्ति आवृत्ति (फाई) कहा जाता है। आवृत्तियों को आवृत्तियों से बदलना सुविधाजनक है - वाई। आवृत्ति आवृत्ति का एक सापेक्ष संकेतक है, जिसे एक इकाई या प्रतिशत के अंशों में व्यक्त किया जा सकता है और आपको भिन्नता श्रृंखला की तुलना करने की अनुमति देता है भिन्न संख्याअवलोकन. सूत्र द्वारा व्यक्त:

जहां एक्समैक्स, एक्समिन कुल में विशेषता के अधिकतम और न्यूनतम मूल्य हैं; n - समूहों की संख्या.

किसी विशेषता की भिन्नता को मापने के लिए, विभिन्न निरपेक्ष और सापेक्ष संकेतकों का उपयोग किया जाता है। भिन्नता के पूर्ण संकेतकों में भिन्नता की सीमा, औसत रैखिक विचलन, फैलाव और मानक विचलन शामिल हैं। दोलन के सापेक्ष संकेतकों में दोलन का गुणांक, सापेक्ष रैखिक विचलन और भिन्नता का गुणांक शामिल है।

उदाहरण ढूँढना विविधता श्रृंखला

व्यायाम।इस नमूने के लिए:

  • ए) विविधता श्रृंखला खोजें;
  • बी) वितरण फ़ंक्शन का निर्माण करें;

सं.=42. नमूना तत्व:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

समाधान।

  • क) एक क्रमबद्ध विविधता श्रृंखला का निर्माण:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • बी) एक अलग भिन्नता श्रृंखला का निर्माण।

आइए स्टर्गेस सूत्र का उपयोग करके विविधता श्रृंखला में समूहों की संख्या की गणना करें:

आइए समूहों की संख्या 7 के बराबर लें।

समूहों की संख्या जानने के बाद, हम अंतराल के आकार की गणना करते हैं:

तालिका निर्माण की सुविधा के लिए हम समूहों की संख्या 8 के बराबर लेंगे, अंतराल 1 होगा।

चावल। 1 एक निश्चित अवधि के लिए किसी स्टोर द्वारा माल की बिक्री की मात्रा

भिन्नता निर्धारित करती हैएक ही अवधि (समय बिंदु) पर किसी दी गई जनसंख्या की विभिन्न इकाइयों के बीच एक विशेषता के मूल्यों में अंतर। विविधताओं के कारण हैं अलग-अलग स्थितियाँसमग्रता की विभिन्न इकाइयों का अस्तित्व। उदाहरण के लिए, जुड़वाँ बच्चे भी अपने जीवन के दौरान ऊंचाई, वजन के साथ-साथ शिक्षा के स्तर, आय, बच्चों की संख्या आदि जैसी विशेषताओं में अंतर प्राप्त करते हैं।

भिन्नता इस तथ्य के परिणामस्वरूप उत्पन्न होती है कि विशेषता के मूल्य स्वयं विभिन्न स्थितियों के कुल प्रभाव के तहत बनते हैं, जो प्रत्येक व्यक्तिगत मामले में अलग-अलग तरीकों से संयुक्त होते हैं। इस प्रकार, किसी भी विकल्प का मूल्य वस्तुनिष्ठ होता है।

विविधता विशेषता हैव्यक्तिगत सामाजिक विशेषताओं के कानूनी रूप से स्थापित मानक अर्थों को छोड़कर, बिना किसी अपवाद के प्रकृति और समाज की सभी घटनाओं के लिए। आंकड़ों में विभिन्नता के अध्ययन हुए हैं बड़ा मूल्यवान, अध्ययन की जा रही घटना के सार को समझने में मदद करें। भिन्नता का पता लगाना, उसके कारणों का पता लगाना, व्यक्तिगत कारकों के प्रभाव की पहचान करना महत्वपूर्ण सूचनावैज्ञानिक रूप से आधारित प्रबंधन निर्णयों के कार्यान्वयन के लिए।

औसत मूल्य जनसंख्या की विशेषता का एक सामान्यीकृत विवरण देता है, लेकिन यह इसकी संरचना को प्रकट नहीं करता है। औसत मूल्य यह नहीं दिखाता है कि औसत विशेषता के वेरिएंट इसके चारों ओर कैसे स्थित हैं, चाहे वे औसत के करीब वितरित हों या इससे विचलित हों। दो आबादी में औसत समान हो सकता है, लेकिन एक संस्करण में सभी व्यक्तिगत मूल्य इससे नगण्य रूप से भिन्न होते हैं, और दूसरे में, ये अंतर बड़े होते हैं, अर्थात। पहले मामले में विशेषता की भिन्नता छोटी है, और दूसरे में यह बड़ी है; औसत मूल्य के महत्व को दर्शाने के लिए यह बहुत महत्वपूर्ण है।

किसी संगठन के प्रमुख, एक प्रबंधक, या एक शोधकर्ता के लिए भिन्नता का अध्ययन करने और इसे प्रबंधित करने के लिए, सांख्यिकी ने भिन्नता (संकेतकों की एक प्रणाली) का अध्ययन करने के लिए विशेष तरीके विकसित किए हैं। इनकी सहायता से विभिन्नता का पता लगाया जाता है तथा उसके गुणों का वर्णन किया जाता है। भिन्नता सूचकों में शामिल हैं : भिन्नता की सीमा, औसत रैखिक विचलन, भिन्नता का गुणांक।

विविधता श्रृंखला और उसके रूप

विविधता शृंखला- यह जनसंख्या की इकाइयों का एक क्रमबद्ध वितरण है, जो अक्सर किसी विशेषता के बढ़ते (कम अक्सर घटते) मूल्यों के अनुसार होता है और विशेषता के एक विशेष मूल्य के साथ इकाइयों की संख्या की गणना करता है। जब जनसंख्या इकाइयों की संख्या अधिक होती है, तो क्रमबद्ध श्रृंखला बोझिल हो जाती है, इसका निर्माण होता है लंबे समय तक. ऐसी स्थिति में, अध्ययन की जा रही विशेषता के मूल्यों के अनुसार जनसंख्या इकाइयों को समूहीकृत करके एक भिन्नता श्रृंखला का निर्माण किया जाता है।

निम्नलिखित हैं विविधता श्रृंखला प्रपत्र :

  1. रैंक श्रृंखलाअध्ययन की जा रही विशेषता के आरोही (अवरोही) क्रम में जनसंख्या की व्यक्तिगत इकाइयों की एक सूची का प्रतिनिधित्व करता है।
  2. असतत भिन्नता श्रृंखला - यह एक तालिका है जिसमें दो पंक्तियाँ या ग्राफ़ शामिल हैं: अलग-अलग विशेषता x के विशिष्ट मान और दिए गए मान f के साथ जनसंख्या की इकाइयों की संख्या - आवृत्ति विशेषता। इसका निर्माण तब किया जाता है जब विशेषता सबसे बड़ी संख्या में मान लेती है।
  3. अंतराल श्रृंखला.

भिन्नता की सीमा निर्धारित की जाती हैविशेषता के अधिकतम और न्यूनतम मूल्यों (वेरिएंट) के बीच अंतर के पूर्ण मूल्य के रूप में:

भिन्नता की सीमा प्रदर्शित होती है केवल विशेषता का अत्यधिक विचलन और श्रृंखला में सभी विकल्पों के व्यक्तिगत विचलन को प्रतिबिंबित नहीं करता है। यह अलग-अलग विशेषताओं में परिवर्तन की सीमाओं को दर्शाता है और दो चरम विकल्पों के उतार-चढ़ाव पर निर्भर है और भिन्नता श्रृंखला में आवृत्तियों से बिल्कुल संबंधित नहीं है, अर्थात, वितरण की प्रकृति से, जो इस मान को एक यादृच्छिक चरित्र देता है। भिन्नता का विश्लेषण करने के लिए, आपको एक संकेतक की आवश्यकता होती है जो भिन्नता विशेषता में सभी उतार-चढ़ाव को दर्शाता है और देता है सामान्य विशेषताएँ. इस प्रकार का सबसे सरल सूचक औसत रैखिक विचलन है।

सांख्यिकीय वितरण श्रृंखला- यह एक निश्चित भिन्न विशेषता के अनुसार समूहों में जनसंख्या इकाइयों का एक क्रमबद्ध वितरण है।
वितरण श्रृंखला के गठन में अंतर्निहित विशेषता के आधार पर, हैं गुणात्मक और परिवर्तनशील वितरण श्रृंखला.

एक सामान्य विशेषता की उपस्थिति एक सांख्यिकीय जनसंख्या के गठन का आधार है, जो विवरण या माप के परिणामों का प्रतिनिधित्व करती है सामान्य सुविधाएंअनुसंधान वस्तुएँ.

सांख्यिकी में अध्ययन का विषय बदलती (बदलती) विशेषताएँ या सांख्यिकीय विशेषताएँ हैं।

सांख्यिकीय विशेषताओं के प्रकार.

वितरण श्रृंखला को गुणवाचक कहा जाता हैगुणवत्ता मानदंडों के अनुसार बनाया गया। ठहराव– यह एक चिन्ह है जिसका एक नाम है (उदाहरण के लिए, पेशा: दर्जिन, शिक्षक, आदि)।
वितरण श्रृंखला आमतौर पर तालिकाओं के रूप में प्रस्तुत की जाती है। तालिका में 2.8 विशेषता वितरण श्रृंखला दिखाता है।
तालिका 2.8 - प्रजातियों का वितरण कानूनी सहयोगरूसी संघ के किसी एक क्षेत्र के नागरिकों को वकीलों द्वारा प्रदान की जाने वाली सेवाएँ।

विविधता शृंखला- ये विशेषता (या मूल्यों के अंतराल) और उनकी आवृत्तियों के मूल्य हैं।
विविधता श्रृंखला वितरण श्रृंखला है, मात्रात्मक आधार पर बनाया गया। किसी भी भिन्नता श्रृंखला में दो तत्व होते हैं: विकल्प और आवृत्तियाँ।
वेरिएंट को किसी विशेषता के व्यक्तिगत मान माना जाता है जो वह भिन्नता श्रृंखला में लेता है।
फ़्रीक्वेंसी अलग-अलग वेरिएंट या भिन्नता श्रृंखला के प्रत्येक समूह की संख्या है, अर्थात। ये संख्याएँ दर्शाती हैं कि वितरण श्रृंखला में कुछ विकल्प कितनी बार आते हैं। सभी आवृत्तियों का योग संपूर्ण जनसंख्या का आकार, उसका आयतन निर्धारित करता है।
आवृत्तियाँ वे आवृत्तियाँ हैं जिन्हें एक इकाई के अंशों या कुल के प्रतिशत के रूप में व्यक्त किया जाता है। तदनुसार, आवृत्तियों का योग 1 या 100% के बराबर है। भिन्नता श्रृंखला वास्तविक डेटा के आधार पर वितरण कानून के स्वरूप का अनुमान लगाने की अनुमति देती है।

गुण की प्रकृति के आधार पर भिन्नता होती है असतत और अंतराल भिन्नता श्रृंखला.
असतत भिन्नता श्रृंखला का एक उदाहरण तालिका में दिया गया है। 2.9.
तालिका 2.9 - 1989 में रूसी संघ में व्यक्तिगत अपार्टमेंट में कब्जे वाले कमरों की संख्या के आधार पर परिवारों का वितरण।

तालिका का पहला कॉलम असतत भिन्नता श्रृंखला के लिए विकल्प प्रस्तुत करता है, दूसरे कॉलम में विविधता श्रृंखला की आवृत्तियां होती हैं, और तीसरे में आवृत्ति संकेतक होते हैं।

विविधता शृंखला

में जनसंख्याएक निश्चित मात्रात्मक विशेषता की जांच की जा रही है। इसमें से आयतन का एक नमूना यादृच्छिक रूप से निकाला जाता है एन, अर्थात् नमूना तत्वों की संख्या बराबर है एन. सांख्यिकीय प्रसंस्करण के पहले चरण में, लेकरनमूने, यानी संख्या क्रम एक्स 1 , एक्स 2 , …, एक्स एनआरोही। प्रत्येक अवलोकित मूल्य एक्स मैंबुलाया विकल्प. आवृत्ति एम मैंमान के अवलोकनों की संख्या है एक्स मैंनमूने में. सापेक्ष आवृत्ति (आवृत्ति) डब्ल्यू मैंआवृत्ति अनुपात है एम मैंनमूना आकार के लिए एन: .
भिन्नता श्रृंखला का अध्ययन करते समय, संचित आवृत्ति और संचित आवृत्ति की अवधारणाओं का भी उपयोग किया जाता है। होने देना एक्सकुछ संख्या. फिर विकल्पों की संख्या , जिनकी वैल्यू कम है एक्स, को संचित आवृत्ति कहा जाता है: x i के लिए एनसंचित आवृत्ति w i max कहलाती है।
किसी विशेषता को पृथक् रूप से परिवर्तनीय कहा जाता है यदि उसके व्यक्तिगत मान (वेरिएंट) एक निश्चित परिमित मान (आमतौर पर एक पूर्णांक) द्वारा एक दूसरे से भिन्न होते हैं। ऐसी विशेषता की भिन्नता श्रृंखला को असतत भिन्नता श्रृंखला कहा जाता है।

तालिका 1. असतत भिन्नता आवृत्ति श्रृंखला का सामान्य दृश्य

चारित्रिक मूल्यएक्स मैं एक्स 1 एक्स 2 एक्स एन
आवृत्तियोंएम मैं मी 1 मी 2 एम एन

किसी विशेषता को निरंतर परिवर्तनशील कहा जाता है यदि उसके मान एक दूसरे से मनमाने ढंग से छोटी मात्रा में भिन्न होते हैं, अर्थात। एक चिन्ह एक निश्चित अंतराल में कोई भी मान ले सकता है। ऐसी विशेषता के लिए निरंतर भिन्नता श्रृंखला को अंतराल कहा जाता है।

तालिका 2. आवृत्तियों की अंतराल भिन्नता श्रृंखला का सामान्य दृश्य

तालिका 3. विविधता श्रृंखला की ग्राफिक छवियां

पंक्तिबहुभुज या हिस्टोग्रामअनुभवजन्य वितरण समारोह
अलग
मध्यान्तर
अवलोकनों के परिणामों की समीक्षा करके, यह निर्धारित किया जाता है कि प्रत्येक विशिष्ट अंतराल में कितने भिन्न मान आते हैं। यह माना जाता है कि प्रत्येक अंतराल इसके किसी एक छोर से संबंधित होता है: या तो सभी मामलों में बाएं (अधिक बार) या सभी मामलों में दाएं, और आवृत्तियों या आवृत्तियों निर्दिष्ट सीमाओं के भीतर निहित विकल्पों की संख्या दिखाती हैं। मतभेद ए आई - ए आई +1आंशिक अंतराल कहलाते हैं। बाद की गणनाओं को सरल बनाने के लिए, अंतराल भिन्नता श्रृंखला को सशर्त रूप से अलग से प्रतिस्थापित किया जा सकता है। इस मामले में, औसत मूल्य मैं-अंतराल को एक विकल्प के रूप में लिया जाता है एक्स मैं, और संगत अंतराल आवृत्ति एम मैं– इस अंतराल की आवृत्ति के लिए.
भिन्नता श्रृंखला के चित्रमय प्रतिनिधित्व के लिए, बहुभुज, हिस्टोग्राम, संचयी वक्र और अनुभवजन्य वितरण फ़ंक्शन का सबसे अधिक उपयोग किया जाता है।

तालिका में 2.3 (अप्रैल 1994 में औसत प्रति व्यक्ति आय के आधार पर रूसी जनसंख्या का समूहन) प्रस्तुत किया गया है अंतराल भिन्नता श्रृंखला.
ग्राफिकल छवि का उपयोग करके वितरण श्रृंखला का विश्लेषण करना सुविधाजनक है, जो किसी को वितरण के आकार का न्याय करने की अनुमति देता है। भिन्नता श्रृंखला की आवृत्तियों में परिवर्तन की प्रकृति का एक दृश्य प्रतिनिधित्व दिया गया है बहुभुज और हिस्टोग्राम.
बहुभुज का उपयोग असतत भिन्नता श्रृंखला को चित्रित करते समय किया जाता है.
आइए, उदाहरण के लिए, अपार्टमेंट के प्रकार के आधार पर आवास स्टॉक के वितरण को ग्राफिक रूप से चित्रित करें (तालिका 2.10)।
तालिका 2.10 - अपार्टमेंट के प्रकार (सशर्त आंकड़े) द्वारा शहरी क्षेत्र के आवास स्टॉक का वितरण।


चावल। आवास वितरण क्षेत्र


न केवल आवृत्ति मान, बल्कि भिन्नता श्रृंखला की आवृत्तियों को भी कोर्डिनेट अक्षों पर प्लॉट किया जा सकता है।
हिस्टोग्राम का उपयोग अंतराल भिन्नता श्रृंखला को दर्शाने के लिए किया जाता है. हिस्टोग्राम का निर्माण करते समय, अंतराल के मूल्यों को एब्सिस्सा अक्ष पर प्लॉट किया जाता है, और आवृत्तियों को संबंधित अंतराल पर बने आयतों द्वारा दर्शाया जाता है। समान अंतराल के मामले में स्तंभों की ऊंचाई आवृत्तियों के समानुपाती होनी चाहिए। हिस्टोग्राम एक ग्राफ है जिसमें एक श्रृंखला को एक दूसरे से सटे सलाखों के रूप में दर्शाया गया है।
आइए हम तालिका में दी गई अंतराल वितरण श्रृंखला को ग्राफ़िक रूप से चित्रित करें। 2.11.
तालिका 2.11 - प्रति व्यक्ति रहने की जगह के आकार के आधार पर परिवारों का वितरण (सशर्त आंकड़े)।
एन पी/पी प्रति व्यक्ति रहने की जगह के आकार के अनुसार परिवारों के समूह रहने की जगह के दिए गए आकार वाले परिवारों की संख्या परिवारों की संचयी संख्या
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
कुल 115 ----


चावल। 2.2. प्रति व्यक्ति रहने की जगह के आकार के आधार पर परिवारों के वितरण का हिस्टोग्राम


संचित श्रृंखला (तालिका 2.11) के डेटा का उपयोग करके, हम निर्माण करते हैं संचयी वितरण.


चावल। 2.3. प्रति व्यक्ति रहने की जगह के आकार के आधार पर परिवारों का संचयी वितरण


संचयी रूप में भिन्नता श्रृंखला का प्रतिनिधित्व विशेष रूप से भिन्नता श्रृंखला के लिए प्रभावी होता है जिनकी आवृत्तियों को श्रृंखला आवृत्तियों के योग के अंश या प्रतिशत के रूप में व्यक्त किया जाता है।
यदि हम किसी भिन्नता श्रृंखला को संचयी रूप में ग्राफ़िक रूप से चित्रित करते समय अक्षों को बदलते हैं, तो हमें मिलता है ओगिवा. चित्र में. 2.4 तालिका में डेटा के आधार पर निर्मित एक तोरण दिखाता है। 2.11.
आयतों की भुजाओं के मध्यबिंदु ज्ञात करके और फिर इन बिंदुओं को सीधी रेखाओं से जोड़कर एक हिस्टोग्राम को एक वितरण बहुभुज में परिवर्तित किया जा सकता है। परिणामी वितरण बहुभुज चित्र में दिखाया गया है। 2.2 बिंदीदार रेखा के साथ।
असमान अंतरालों के साथ भिन्नता श्रृंखला के वितरण का एक हिस्टोग्राम बनाते समय, यह आवृत्तियों को नहीं है जो कोर्डिनेट अक्ष के साथ प्लॉट किए जाते हैं, बल्कि संबंधित अंतराल में विशेषता के वितरण का घनत्व होता है।
वितरण घनत्व प्रति इकाई अंतराल चौड़ाई की गणना की गई आवृत्ति है, अर्थात। प्रत्येक समूह में अंतराल मान की प्रति इकाई कितनी इकाइयाँ हैं। वितरण घनत्व की गणना का एक उदाहरण तालिका में प्रस्तुत किया गया है। 2.12.
तालिका 2.12 - कर्मचारियों की संख्या के आधार पर उद्यमों का वितरण (सशर्त आंकड़े)
एन पी/पी कर्मचारियों, लोगों की संख्या के आधार पर उद्यमों के समूह। उद्यमों की संख्या अंतराल आकार, लोग. वितरण घनत्व
1 2 3=1/2
1 20 तक 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
कुल 147 ---- ----

भिन्नता श्रृंखला को ग्राफ़िक रूप से दर्शाने के लिए भी इसका उपयोग किया जा सकता है संचयी वक्र. संचयी (योग वक्र) का उपयोग करके, संचित आवृत्तियों की एक श्रृंखला को दर्शाया गया है। संचयी आवृत्तियाँ समूहों में आवृत्तियों को क्रमिक रूप से जोड़कर निर्धारित की जाती हैं और दर्शाती हैं कि जनसंख्या में कितनी इकाइयों के गुण मान विचाराधीन मूल्य से अधिक नहीं हैं।


चावल। 2.4. प्रति व्यक्ति रहने की जगह के आकार के आधार पर परिवारों का वितरण

अंतराल भिन्नता श्रृंखला के संचयी का निर्माण करते समय, श्रृंखला के वेरिएंट को एब्सिस्सा अक्ष के साथ प्लॉट किया जाता है, और संचित आवृत्तियों को ऑर्डिनेट अक्ष के साथ प्लॉट किया जाता है।

सांख्यिकीय विश्लेषण में एक विशेष स्थान अध्ययन की जा रही विशेषता या घटना के औसत स्तर के निर्धारण का है। किसी गुण का औसत स्तर औसत मानों द्वारा मापा जाता है।

औसत मूल्य अध्ययन की जा रही विशेषता के सामान्य मात्रात्मक स्तर को दर्शाता है और सांख्यिकीय आबादी की एक समूह संपत्ति है। यह समतल करता है, एक दिशा या किसी अन्य में व्यक्तिगत अवलोकनों के यादृच्छिक विचलन को कमजोर करता है और अध्ययन की जा रही विशेषता की मुख्य, विशिष्ट संपत्ति पर प्रकाश डालता है।

औसत का व्यापक रूप से उपयोग किया जाता है:

1. जनसंख्या की स्वास्थ्य स्थिति का आकलन करने के लिए: शारीरिक विकास की विशेषताएं (ऊंचाई, वजन, छाती की परिधि, आदि), विभिन्न बीमारियों की व्यापकता और अवधि की पहचान करना, जनसांख्यिकीय संकेतकों का विश्लेषण करना (जनसंख्या की महत्वपूर्ण गतिविधि, औसत जीवन प्रत्याशा, जनसंख्या प्रजनन, औसत जनसंख्या और आदि)।

2. चिकित्सा संस्थानों, चिकित्सा कर्मियों की गतिविधियों का अध्ययन करना और उनके काम की गुणवत्ता का आकलन करना, विभिन्न प्रकार की चिकित्सा देखभाल के लिए जनसंख्या की जरूरतों की योजना बनाना और निर्धारित करना (प्रति वर्ष प्रति निवासी अनुरोधों या यात्राओं की औसत संख्या, रहने की औसत लंबाई) अस्पताल में मरीज, मरीज की जांच की औसत अवधि, डॉक्टरों, बिस्तरों आदि की औसत उपलब्धता)।

3. स्वच्छता और महामारी विज्ञान की स्थिति (कार्यशाला में औसत वायु धूल सामग्री, प्रति व्यक्ति औसत क्षेत्र, प्रोटीन, वसा और कार्बोहाइड्रेट की औसत खपत, आदि) को चिह्नित करना।

4. सामान्य और रोग संबंधी स्थितियों में चिकित्सा और शारीरिक संकेतक निर्धारित करने के लिए, प्रयोगशाला डेटा संसाधित करते समय, सामाजिक, स्वच्छ, नैदानिक ​​और प्रयोगात्मक अध्ययनों में नमूना अध्ययन के परिणामों की विश्वसनीयता स्थापित करने के लिए।

औसत मूल्यों की गणना भिन्नता श्रृंखला के आधार पर की जाती है। विविधता शृंखलाएक गुणात्मक रूप से सजातीय सांख्यिकीय जनसंख्या है, जिसकी व्यक्तिगत इकाइयाँ अध्ययन की जा रही विशेषता या घटना के मात्रात्मक अंतर को दर्शाती हैं।

मात्रात्मक भिन्नता दो प्रकार की हो सकती है: असंतत (अलग) और निरंतर।

एक असंतत (असतत) विशेषता को केवल एक पूर्णांक के रूप में व्यक्त किया जाता है और इसमें कोई मध्यवर्ती मान नहीं हो सकता है (उदाहरण के लिए, विज़िट की संख्या, साइट की जनसंख्या, परिवार में बच्चों की संख्या, बीमारी की गंभीरता अंकों में) , वगैरह।)।

एक निरंतर संकेत कुछ सीमाओं के भीतर किसी भी मान को ले सकता है, जिसमें आंशिक भी शामिल है, और केवल लगभग व्यक्त किया जाता है (उदाहरण के लिए, वजन - वयस्कों के लिए यह किलोग्राम तक सीमित हो सकता है, और नवजात शिशुओं के लिए - ग्राम; ऊंचाई, रक्तचाप, समय) एक मरीज़ को देखने में बिताया, और आदि)।



भिन्नता श्रृंखला में शामिल प्रत्येक व्यक्तिगत विशेषता या घटना के डिजिटल मूल्य को एक प्रकार कहा जाता है और इसे अक्षर द्वारा निर्दिष्ट किया जाता है वी . उदाहरण के लिए, गणितीय साहित्य में अन्य संकेतन भी पाए जाते हैं एक्स या वाई

एक विविधता श्रृंखला, जहां प्रत्येक विकल्प को एक बार इंगित किया जाता है, सरल कहलाती है।ऐसी श्रृंखलाओं का उपयोग कंप्यूटर डेटा प्रोसेसिंग के मामले में अधिकांश सांख्यिकीय समस्याओं में किया जाता है।

जैसे-जैसे अवलोकनों की संख्या बढ़ती है, भिन्न-भिन्न मानों की पुनरावृत्ति होने लगती है। इस मामले में, यह बनाया गया है समूहीकृत विविधता श्रृंखला, जहां दोहराव की संख्या इंगित की जाती है (आवृत्ति, अक्षर द्वारा निरूपित) आर »).

रैंक भिन्नता श्रृंखलाइसमें आरोही या अवरोही क्रम में व्यवस्थित विकल्प शामिल हैं। सरल और समूहीकृत दोनों श्रृंखलाओं को रैंकिंग के साथ संकलित किया जा सकता है।

अंतराल भिन्नता श्रृंखलाबहुत बड़ी संख्या में अवलोकन इकाइयों (1000 से अधिक) के साथ, कंप्यूटर के उपयोग के बिना की जाने वाली बाद की गणनाओं को सरल बनाने के लिए संकलित किया गया।

निरंतर परिवर्तन श्रृंखलाइसमें विकल्प मान शामिल हैं, जो कोई भी मान हो सकते हैं।

यदि किसी भिन्नता श्रृंखला में किसी विशेषता (वेरिएंट) के मान अलग-अलग विशिष्ट संख्याओं के रूप में दिए गए हों, तो ऐसी श्रृंखला कहलाती है अलग.

भिन्नता श्रृंखला में परिलक्षित विशेषता के मूल्यों की सामान्य विशेषताएँ औसत मूल्य हैं। उनमें से, सबसे अधिक उपयोग किया जाता है: अंकगणितीय माध्य एम,पहनावा एमओऔर मध्यिका मुझे।इनमें से प्रत्येक विशेषता अद्वितीय है। वे एक-दूसरे की जगह नहीं ले सकते हैं और केवल एक साथ मिलकर वे भिन्नता श्रृंखला की विशेषताओं को पूरी तरह से और संक्षिप्त रूप में प्रस्तुत करते हैं।

पहनावा (मो) सबसे अधिक बार आने वाले विकल्पों का मान बताएं।

मंझला (मुझे) - यह क्रमबद्ध भिन्नता श्रृंखला को आधे में विभाजित करने वाले विकल्प का मूल्य है (माध्यिका के प्रत्येक पक्ष पर विकल्प का आधा हिस्सा होता है)। दुर्लभ मामलों में, जब एक सममित भिन्नता श्रृंखला होती है, तो मोड और माध्य एक दूसरे के बराबर होते हैं और अंकगणित माध्य के मूल्य के साथ मेल खाते हैं।

विकल्प मानों की सबसे विशिष्ट विशेषता है अंकगणित औसतकीमत( एम ). गणितीय साहित्य में इसे दर्शाया गया है .

अंकगणित औसत (एम, ) अध्ययन की जा रही घटना की एक निश्चित विशेषता की एक सामान्य मात्रात्मक विशेषता है, जो गुणात्मक रूप से सजातीय सांख्यिकीय आबादी का गठन करती है। सरल और भारित अंकगणितीय औसत हैं। सरल अंकगणितीय माध्य की गणना एक साधारण भिन्नता श्रृंखला के लिए सभी विकल्पों का योग करके और इस योग को इस भिन्नता श्रृंखला में शामिल विकल्पों की कुल संख्या से विभाजित करके की जाती है। गणना सूत्र के अनुसार की जाती है:

,

कहाँ: एम - सरल अंकगणित माध्य;

Σ वी - राशि विकल्प;

एन- अवलोकनों की संख्या.

समूहीकृत भिन्नता श्रृंखला में, भारित अंकगणितीय माध्य निर्धारित किया जाता है। इसकी गणना का सूत्र:

,

कहाँ: एम - अंकगणितीय भारित औसत;

Σ वीपी - उनकी आवृत्तियों द्वारा वेरिएंट के उत्पादों का योग;

एन- अवलोकनों की संख्या.

बड़ी संख्या में अवलोकनों के साथ, मैन्युअल गणना के मामले में, क्षणों की विधि का उपयोग किया जा सकता है।

अंकगणित माध्य में निम्नलिखित गुण होते हैं:

· औसत से विचलन का योग ( Σ डी ) शून्य के बराबर है (तालिका 15 देखें);

· जब सभी विकल्पों को एक ही गुणनखंड (भाजक) से गुणा (विभाजित) किया जाता है, तो अंकगणितीय माध्य को उसी गुणनखंड (भाजक) से गुणा (विभाजित) किया जाता है;

· यदि आप सभी विकल्पों में समान संख्या जोड़ते (घटाते) हैं, तो अंकगणितीय माध्य उसी संख्या से बढ़ता (घटता) है।

जिस श्रृंखला से उनकी गणना की जाती है, उसकी परिवर्तनशीलता को ध्यान में रखे बिना, अंकगणितीय औसत, भिन्नता श्रृंखला के गुणों को पूरी तरह से प्रतिबिंबित नहीं कर सकते हैं, खासकर जब अन्य औसतों के साथ तुलना आवश्यक हो। जो औसत मूल्य के करीब हैं उन्हें बिखरने की अलग-अलग डिग्री वाली श्रृंखला से प्राप्त किया जा सकता है। व्यक्तिगत विकल्प अपनी मात्रात्मक विशेषताओं के संदर्भ में एक-दूसरे के जितने करीब होंगे, उतना ही कम होगा फैलाव (दोलन, परिवर्तनशीलता)श्रृंखला, इसका औसत जितना अधिक विशिष्ट होगा।

मुख्य पैरामीटर जो हमें किसी विशेषता की परिवर्तनशीलता का आकलन करने की अनुमति देते हैं:

· दायरा;

· आयाम;

· मानक विचलन;

· भिन्नता का गुणांक.

किसी विशेषता की परिवर्तनशीलता का अनुमान भिन्नता श्रृंखला की सीमा और आयाम से लगाया जा सकता है। सीमा श्रृंखला में अधिकतम (वी अधिकतम) और न्यूनतम (वी मिनट) विकल्पों को इंगित करती है। आयाम (A m) इन विकल्पों के बीच का अंतर है: A m = V अधिकतम - V मिनट।

भिन्नता श्रृंखला की परिवर्तनशीलता का मुख्य, आम तौर पर स्वीकृत माप है फैलाव (डी ). लेकिन सबसे अधिक इस्तेमाल किया जाने वाला फैलाव के आधार पर गणना किया जाने वाला एक अधिक सुविधाजनक पैरामीटर है - मानक विचलन ( σ ). यह विचलन के परिमाण को ध्यान में रखता है ( डी ) प्रत्येक भिन्नता श्रृंखला का उसके अंकगणितीय माध्य से ( डी=वी - एम ).

चूँकि औसत से विचलन सकारात्मक और नकारात्मक हो सकते हैं, जब योग किया जाता है तो वे मान "0" (एस) देते हैं घ=0). इससे बचने के लिए, विचलन मान ( डी) को दूसरी घात तक बढ़ाया जाता है और औसत किया जाता है। इस प्रकार, एक भिन्नता श्रृंखला का फैलाव अंकगणितीय माध्य से एक प्रकार के विचलन का माध्य वर्ग है और सूत्र द्वारा गणना की जाती है:

.

यह परिवर्तनशीलता की सबसे महत्वपूर्ण विशेषता है और इसका उपयोग कई सांख्यिकीय मानदंडों की गणना करने के लिए किया जाता है।

चूंकि फैलाव को विचलन के वर्ग के रूप में व्यक्त किया जाता है, इसलिए इसका मान अंकगणितीय माध्य के साथ तुलना में उपयोग नहीं किया जा सकता है। इन उद्देश्यों के लिए इसका उपयोग किया जाता है मानक विचलन, जिसे "सिग्मा" चिह्न द्वारा निर्दिष्ट किया जाता है ( σ ). यह अंकगणितीय माध्य मान से भिन्नता श्रृंखला के सभी प्रकारों के औसत विचलन को औसत मान के समान इकाइयों में दर्शाता है, ताकि उनका एक साथ उपयोग किया जा सके।

मानक विचलन सूत्र द्वारा निर्धारित किया जाता है:

निर्दिष्ट सूत्र तब लागू किया जाता है जब प्रेक्षणों की संख्या ( एन ) 30 से अधिक। कम संख्या के साथ एन मानक विचलन मान में गणितीय ऑफसेट से जुड़ी एक त्रुटि होगी ( एन - 1). इस संबंध में, मानक विचलन की गणना के सूत्र में इस तरह के पूर्वाग्रह को ध्यान में रखकर अधिक सटीक परिणाम प्राप्त किया जा सकता है:

मानक विचलन (एस ) एक यादृच्छिक चर के मानक विचलन का एक अनुमान है एक्सइसके विचरण के निष्पक्ष अनुमान के आधार पर इसकी गणितीय अपेक्षा के सापेक्ष।

मूल्यों के साथ एन > 30 मानक विचलन ( σ ) और मानक विचलन ( एस ) एक ही हो जाएगा ( σ =एस ). इसलिए, अधिकांश व्यावहारिक मैनुअल में इन मानदंडों के अलग-अलग अर्थ माने जाते हैं।एक कार्यक्रम में एक्सेल गणनामानक विचलन फ़ंक्शन =STDEV(रेंज) का उपयोग करके किया जा सकता है। और मानक विचलन की गणना करने के लिए, आपको एक उपयुक्त सूत्र बनाने की आवश्यकता है।

माध्य वर्ग या मानक विचलन आपको यह निर्धारित करने की अनुमति देता है कि किसी विशेषता का मान औसत मान से कितना भिन्न हो सकता है। मान लीजिए कि गर्मियों में समान औसत दैनिक तापमान वाले दो शहर हैं। इनमें से एक शहर तट पर और दूसरा महाद्वीप पर स्थित है। यह ज्ञात है कि तट पर स्थित शहरों में दिन के तापमान में अंतर अंतर्देशीय शहरों की तुलना में कम होता है। इसलिए, तटीय शहर के लिए दिन के तापमान का मानक विचलन दूसरे शहर की तुलना में कम होगा। व्यवहार में, इसका मतलब है कि प्रत्येक का औसत वायु तापमान विशिष्ट दिनमहाद्वीप पर स्थित एक शहर में, तट पर स्थित एक शहर की तुलना में औसत से अधिक भिन्न होगा। इसके अलावा, मानक विचलन आपको संभाव्यता के आवश्यक स्तर के साथ औसत से संभावित तापमान विचलन का मूल्यांकन करने की अनुमति देता है।

संभाव्यता सिद्धांत के अनुसार, सामान्य वितरण कानून का पालन करने वाली घटनाओं में, अंकगणित माध्य, मानक विचलन और विकल्पों के मूल्यों के बीच एक सख्त संबंध होता है ( तीन सिग्मा नियम). उदाहरण के लिए, किसी भिन्न विशेषता के 68.3% मान M ± 1 के भीतर हैं σ , 95.5% - एम ± 2 के भीतर σ और 99.7% - एम ± 3 के भीतर σ .

मानक विचलन का मूल्य हमें भिन्नता श्रृंखला और अध्ययन समूह की एकरूपता की प्रकृति का न्याय करने की अनुमति देता है। यदि मानक विचलन का मान छोटा है, तो यह अध्ययन की जा रही घटना की काफी उच्च एकरूपता को इंगित करता है। इस मामले में अंकगणितीय माध्य को किसी दी गई भिन्नता श्रृंखला के लिए काफी विशिष्ट माना जाना चाहिए। हालाँकि, बहुत छोटा सिग्मा मान किसी को अवलोकनों के कृत्रिम चयन के बारे में सोचने पर मजबूर करता है। बहुत बड़े सिग्मा के साथ, अंकगणित माध्य कुछ हद तक भिन्नता श्रृंखला की विशेषता बताता है, जो अध्ययन की जा रही विशेषता या घटना की महत्वपूर्ण परिवर्तनशीलता या अध्ययन के तहत समूह की विविधता को इंगित करता है। हालाँकि, मानक विचलन के मान की तुलना केवल समान आयाम की विशेषताओं के लिए ही संभव है। वास्तव में, यदि हम नवजात बच्चों और वयस्कों के वजन की विविधता की तुलना करते हैं, तो हमें वयस्कों में हमेशा उच्च सिग्मा मान मिलेंगे।

विभिन्न आयामों की विशेषताओं की परिवर्तनशीलता की तुलना का उपयोग करके किया जा सकता है गुणांक का परिवर्तन. यह विविधता को माध्य के प्रतिशत के रूप में व्यक्त करता है, जिससे तुलना की अनुमति मिलती है विभिन्न संकेत. चिकित्सा साहित्य में भिन्नता के गुणांक को "चिह्न" द्वारा दर्शाया गया है साथ ", और गणितीय में" वी"और सूत्र द्वारा गणना की गई:

.

10% से कम भिन्नता के गुणांक के मान छोटे बिखरने का संकेत देते हैं, 10 से 20% तक - औसत के बारे में, 20% से अधिक - अंकगणित माध्य के आसपास मजबूत बिखरने के बारे में।

अंकगणितीय औसत की गणना आमतौर पर डेटा के आधार पर की जाती है नमूना जनसंख्या. बार-बार अध्ययन करने पर, यादृच्छिक घटनाओं के प्रभाव में, अंकगणितीय माध्य बदल सकता है। यह इस तथ्य के कारण है कि, एक नियम के रूप में, अवलोकन की संभावित इकाइयों का केवल एक हिस्सा, यानी नमूना आबादी का अध्ययन किया जाता है। अध्ययन की जा रही घटना का प्रतिनिधित्व करने वाली सभी संभावित इकाइयों के बारे में जानकारी पूरी आबादी का अध्ययन करके प्राप्त की जा सकती है, जो हमेशा संभव नहीं है। साथ ही, प्रयोगात्मक डेटा को सामान्य बनाने के उद्देश्य से, सामान्य जनसंख्या में औसत का मूल्य रुचिकर है। इसलिए, अध्ययन की जा रही घटना के बारे में एक सामान्य निष्कर्ष तैयार करने के लिए, नमूना आबादी के आधार पर प्राप्त परिणामों को सांख्यिकीय तरीकों का उपयोग करके सामान्य आबादी में स्थानांतरित किया जाना चाहिए।

नमूना अध्ययन और सामान्य जनसंख्या के बीच समझौते की डिग्री निर्धारित करने के लिए, नमूना अवलोकन के दौरान अनिवार्य रूप से उत्पन्न होने वाली त्रुटि की भयावहता का अनुमान लगाना आवश्यक है। इस त्रुटि को "" कहा जाता है प्रतिनिधित्व की त्रुटि"या" अंकगणितीय माध्य की औसत त्रुटि। यह वास्तव में नमूने से प्राप्त औसत के बीच का अंतर है सांख्यिकीय अवलोकन, और समान मूल्य जो एक ही वस्तु के निरंतर अध्ययन के दौरान प्राप्त किए जाएंगे, अर्थात। सामान्य जनसंख्या का अध्ययन करते समय। चूँकि नमूना माध्य एक यादृच्छिक चर है, इसलिए ऐसा पूर्वानुमान शोधकर्ता को स्वीकार्य संभाव्यता के स्तर के साथ किया जाता है। में चिकित्सा अनुसंधानयह कम से कम 95% है।

प्रतिनिधित्व संबंधी त्रुटि को पंजीकरण त्रुटियों या ध्यान त्रुटियों (स्लिप्स, गलत अनुमान, टाइपो इत्यादि) के साथ भ्रमित नहीं किया जा सकता है, जिसे प्रयोग के दौरान उपयोग किए जाने वाले पर्याप्त तरीकों और उपकरणों द्वारा कम किया जाना चाहिए।

प्रतिनिधित्व त्रुटि का परिमाण नमूना आकार और विशेषता की परिवर्तनशीलता दोनों पर निर्भर करता है। कैसे बड़ी संख्याअवलोकन, नमूना जनसंख्या के जितना करीब होगा और त्रुटि उतनी ही कम होगी। चिह्न जितना अधिक परिवर्तनशील होगा, सांख्यिकीय त्रुटि उतनी ही अधिक होगी।

व्यवहार में, भिन्नता श्रृंखला में प्रतिनिधित्व त्रुटि निर्धारित करने के लिए, निम्नलिखित सूत्र का उपयोग किया जाता है:

,

कहाँ: एम - प्रतिनिधित्व की त्रुटि;

σ - मानक विचलन;

एन- नमूने में अवलोकनों की संख्या.

सूत्र से यह स्पष्ट है कि आकार औसत त्रुटिमानक विचलन के सीधे आनुपातिक है, अर्थात, अध्ययन की जा रही विशेषता की परिवर्तनशीलता, और अवलोकनों की संख्या के वर्गमूल के व्युत्क्रमानुपाती है।

सापेक्ष मूल्यों की गणना के आधार पर सांख्यिकीय विश्लेषण करते समय, भिन्नता श्रृंखला का निर्माण आवश्यक नहीं है। इस मामले में, सापेक्ष संकेतकों के लिए औसत त्रुटि का निर्धारण एक सरल सूत्र का उपयोग करके किया जा सकता है:

,

कहाँ: आर- सापेक्ष संकेतक का मूल्य, प्रतिशत, पीपीएम, आदि के रूप में व्यक्त किया गया;

क्यू- पी का व्युत्क्रम और (1-पी), (100-पी), (1000-पी), आदि के रूप में व्यक्त किया जाता है, यह उस आधार पर निर्भर करता है जिसके आधार पर संकेतक की गणना की जाती है;

एन- नमूना जनसंख्या में अवलोकनों की संख्या।

हालाँकि, सापेक्ष मूल्यों के लिए प्रतिनिधित्व त्रुटि की गणना के लिए निर्दिष्ट सूत्र केवल तभी लागू किया जा सकता है जब संकेतक का मूल्य उसके आधार से कम हो। गहन संकेतकों की गणना के कई मामलों में, यह शर्त पूरी नहीं होती है, और संकेतक को 100% या 1000% से अधिक की संख्या के रूप में व्यक्त किया जा सकता है। ऐसी स्थिति में, एक भिन्नता श्रृंखला का निर्माण किया जाता है और मानक विचलन के आधार पर औसत मूल्यों के सूत्र का उपयोग करके प्रतिनिधित्व त्रुटि की गणना की जाती है।

जनसंख्या में अंकगणितीय माध्य के मूल्य का पूर्वानुमान दो मूल्यों को इंगित करके किया जाता है - न्यूनतम और अधिकतम। ये चरम मूल्य संभावित विचलन, जिसके भीतर जनसंख्या के वांछित औसत मूल्य में उतार-चढ़ाव हो सकता है, कहलाते हैं सीमाओं पर भरोसा रखें».

संभाव्यता सिद्धांत के सिद्धांतों ने साबित कर दिया है कि 99.7% की संभावना के साथ एक विशेषता के सामान्य वितरण के साथ, औसत के विचलन का चरम मूल्य प्रतिनिधित्व त्रुटि के तीन गुना के मूल्य से अधिक नहीं होगा ( एम ± 3 एम ); 95.5% में - औसत मूल्य की औसत त्रुटि के दोगुने से अधिक नहीं ( एम ± 2 एम ); 68.3% में - एक से अधिक औसत त्रुटि नहीं ( एम ± 1 एम ) (चित्र 9)।

पी%

चावल। 9. संभाव्यता घनत्व सामान्य वितरण.

ध्यान दें कि उपरोक्त कथन केवल उस सुविधा के लिए सत्य है जो सामान्य गाऊसी वितरण कानून का पालन करती है।

चिकित्सा के क्षेत्र सहित अधिकांश प्रायोगिक अध्ययन माप से जुड़े होते हैं, जिनके परिणाम किसी दिए गए अंतराल में लगभग कोई भी मूल्य ले सकते हैं, इसलिए, एक नियम के रूप में, उन्हें निरंतर यादृच्छिक चर के एक मॉडल द्वारा वर्णित किया जाता है। इस संबंध में, अधिकांश सांख्यिकीय विधियां निरंतर वितरण पर विचार करती हैं। इनमें से एक वितरण, जिसकी मौलिक भूमिका है गणितीय सांख्यिकी, है सामान्य, या गाऊसी, वितरण.

ऐसा कई कारणों से है.

1. सबसे पहले, कई प्रयोगात्मक अवलोकनों को सामान्य वितरण का उपयोग करके सफलतापूर्वक वर्णित किया जा सकता है। यह तुरंत ध्यान दिया जाना चाहिए कि अनुभवजन्य डेटा का कोई वितरण नहीं है जो सामान्य रूप से वितरित होने के बाद से बिल्कुल सामान्य होगा यादृच्छिक मूल्यसे की सीमा में है, जो व्यवहार में कभी नहीं होता है। हालाँकि, सामान्य वितरण अक्सर एक सन्निकटन के रूप में अच्छा काम करता है।

चाहे वजन, ऊंचाई और मानव शरीर के अन्य शारीरिक मापदंडों का माप किया जाए - हर जगह परिणाम बहुत बड़ी संख्या में यादृच्छिक कारकों से प्रभावित होते हैं ( प्राकृतिक कारणोंऔर माप त्रुटियाँ)। इसके अलावा, एक नियम के रूप में, इनमें से प्रत्येक कारक का प्रभाव महत्वहीन है। अनुभव से पता चलता है कि ऐसे मामलों में परिणाम लगभग सामान्य रूप से वितरित होंगे।

2. यादृच्छिक नमूने से जुड़े कई वितरण बाद की मात्रा बढ़ने पर सामान्य हो जाते हैं।

3. सामान्य वितरण अन्य सतत वितरणों (उदाहरण के लिए, तिरछा) के सन्निकटन के रूप में उपयुक्त है।

4. सामान्य वितरण में कई अनुकूल संख्याएँ होती हैं गणितीय गुण, जिसने बड़े पैमाने पर इसे प्रदान किया व्यापक अनुप्रयोगसांख्यिकी में.

साथ ही, यह ध्यान दिया जाना चाहिए कि चिकित्सा डेटा में कई प्रयोगात्मक वितरण हैं जिन्हें सामान्य वितरण मॉडल द्वारा वर्णित नहीं किया जा सकता है। इस उद्देश्य के लिए, सांख्यिकी ने ऐसी विधियाँ विकसित की हैं जिन्हें आमतौर पर "नॉनपैरामेट्रिक" कहा जाता है।

किसी विशेष प्रयोग से डेटा संसाधित करने के लिए उपयुक्त सांख्यिकीय पद्धति का चुनाव इस आधार पर किया जाना चाहिए कि प्राप्त डेटा सामान्य वितरण कानून से संबंधित है या नहीं। सामान्य वितरण कानून के लिए एक संकेत के अधीनता के लिए परिकल्पना का परीक्षण एक आवृत्ति वितरण हिस्टोग्राम (ग्राफ), साथ ही कई सांख्यिकीय मानदंडों का उपयोग करके किया जाता है। उनमें से:

विषमता मानदंड ( बी );

कर्टोसिस के परीक्षण के लिए मानदंड ( जी );

शापिरो-विल्क्स परीक्षण ( डब्ल्यू ) .

प्रत्येक पैरामीटर के लिए डेटा वितरण की प्रकृति का विश्लेषण (जिसे वितरण की सामान्यता के लिए परीक्षण भी कहा जाता है) किया जाता है। आत्मविश्वास से यह निर्णय लेने के लिए कि क्या किसी पैरामीटर का वितरण सामान्य कानून के अनुरूप है, पर्याप्त बड़ी संख्या में अवलोकन इकाइयों (कम से कम 30 मान) की आवश्यकता होती है।

सामान्य वितरण के लिए, तिरछापन और कर्टोसिस मानदंड 0 मान लेते हैं। यदि वितरण को दाईं ओर स्थानांतरित किया जाता है बी > 0 (सकारात्मक विषमता), साथ में बी < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона जी =0. पर जी > 0 यदि वितरण वक्र तीव्र होता है जी < 0 пик более сглаженный, чем функция нормального распределения.

शापिरो-विल्क्स परीक्षण का उपयोग करके सामान्यता की जांच करने के लिए, आपको सांख्यिकीय तालिकाओं का उपयोग करके इस मानदंड का मान ज्ञात करना होगा आवश्यक स्तरमहत्व और अवलोकन इकाइयों की संख्या (स्वतंत्रता की डिग्री) पर निर्भर करता है। परिशिष्ट 1. सामान्यता परिकल्पना को इस मानदंड के छोटे मूल्यों पर, एक नियम के रूप में, खारिज कर दिया जाता है डब्ल्यू <0,8.

समूहीकरण विधि आपको मापने की भी अनुमति देती है उतार-चढ़ाव(परिवर्तनशीलता, उतार-चढ़ाव) संकेतों की। जब किसी जनसंख्या में इकाइयों की संख्या अपेक्षाकृत कम होती है, तो जनसंख्या को बनाने वाली इकाइयों की क्रमबद्ध संख्या के आधार पर भिन्नता को मापा जाता है। शृंखला कहलाती है रैंक किया गया,यदि इकाइयों को विशेषता के आरोही (अवरोही) क्रम में व्यवस्थित किया गया है।

हालाँकि, जब भिन्नता की तुलनात्मक विशेषता की आवश्यकता होती है तो रैंक की गई श्रृंखलाएँ काफी संकेतक होती हैं। इसके अलावा, कई मामलों में हमें बड़ी संख्या में इकाइयों वाली सांख्यिकीय आबादी से निपटना पड़ता है, जिन्हें एक विशिष्ट श्रृंखला के रूप में प्रस्तुत करना व्यावहारिक रूप से कठिन होता है। इस संबंध में, सांख्यिकीय डेटा के साथ प्रारंभिक सामान्य परिचित के लिए और विशेष रूप से विशेषताओं में भिन्नता के अध्ययन की सुविधा के लिए, अध्ययन के तहत घटनाओं और प्रक्रियाओं को आमतौर पर समूहों में जोड़ा जाता है, और समूहीकरण के परिणाम समूह तालिकाओं के रूप में प्रस्तुत किए जाते हैं।

यदि किसी समूह तालिका में केवल दो कॉलम हैं - चयनित विशेषता (विकल्प) और समूहों की संख्या (आवृत्ति या आवृत्ति) के अनुसार समूह, तो इसे कहा जाता है निकट वितरण.

वितरण सीमा -एक विशेषता के आधार पर सबसे सरल प्रकार का संरचनात्मक समूहन, एक समूह तालिका में प्रदर्शित किया जाता है जिसमें विशेषता के वेरिएंट और आवृत्तियों वाले दो कॉलम होते हैं। कई मामलों में, ऐसे संरचनात्मक समूहन के साथ, अर्थात्। वितरण श्रृंखला के संकलन के साथ ही प्रारम्भिक सांख्यिकीय सामग्री का अध्ययन प्रारम्भ हो जाता है।

वितरण श्रृंखला के रूप में एक संरचनात्मक समूह को वास्तविक संरचनात्मक समूह में बदला जा सकता है यदि चयनित समूहों को न केवल आवृत्तियों द्वारा, बल्कि अन्य सांख्यिकीय संकेतकों द्वारा भी चित्रित किया जाता है। वितरण श्रृंखला का मुख्य उद्देश्य विशेषताओं की भिन्नता का अध्ययन करना है। वितरण श्रृंखला का सिद्धांत गणितीय सांख्यिकी द्वारा विस्तार से विकसित किया गया है।

वितरण श्रृंखला को विभाजित किया गया है ठहराव(विशेषताओं के अनुसार समूहीकरण, उदाहरण के लिए, जनसंख्या को लिंग, राष्ट्रीयता, वैवाहिक स्थिति आदि के आधार पर विभाजित करना) और परिवर्तन संबंधी(मात्रात्मक विशेषताओं के आधार पर समूहीकरण)।

विविधता शृंखलाएक समूह तालिका है जिसमें दो कॉलम होते हैं: एक मात्रात्मक विशेषता के अनुसार इकाइयों का समूहन और प्रत्येक समूह में इकाइयों की संख्या। भिन्नता श्रृंखला में अंतराल आमतौर पर समान और बंद होते हैं। भिन्नता श्रृंखला औसत प्रति व्यक्ति मौद्रिक आय (तालिका 3.10) द्वारा रूसी आबादी का निम्नलिखित समूह है।

तालिका 3.10

2004-2009 में औसत प्रति व्यक्ति आय के आधार पर रूस की जनसंख्या का वितरण।

औसत प्रति व्यक्ति नकद आय के आधार पर जनसंख्या समूह, रूबल/माह

समूह में जनसंख्या, कुल का %

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

25,000.0 से अधिक

पूरी आबादी

भिन्नता श्रृंखला, बदले में, असतत और अंतराल में विभाजित होती है। अलगविविधता श्रृंखला अलग-अलग विशेषताओं के वेरिएंट को जोड़ती है जो संकीर्ण सीमाओं के भीतर भिन्न होती हैं। असतत भिन्नता श्रृंखला का एक उदाहरण रूसी परिवारों का उनके बच्चों की संख्या के आधार पर वितरण है।

मध्यान्तरभिन्नता श्रृंखला या तो निरंतर विशेषताओं या विस्तृत श्रृंखला में भिन्न भिन्न विशेषताओं के वेरिएंट को जोड़ती है। अंतराल औसत प्रति व्यक्ति मौद्रिक आय के आधार पर रूसी जनसंख्या के वितरण की भिन्नता श्रृंखला है।

व्यवहार में असतत भिन्नता श्रृंखला का प्रयोग बहुत बार नहीं किया जाता है। इस बीच, उन्हें संकलित करना मुश्किल नहीं है, क्योंकि समूहों की संरचना उन विशिष्ट प्रकारों द्वारा निर्धारित की जाती है जो अध्ययन किए गए समूहीकरण विशेषताओं में वास्तव में हैं।

अंतराल भिन्नता श्रृंखला अधिक व्यापक हैं। उन्हें संकलित करते समय, समूहों की संख्या के साथ-साथ स्थापित किए जाने वाले अंतराल के आकार के बारे में एक कठिन प्रश्न उठता है।

इस मुद्दे को हल करने के सिद्धांत सांख्यिकीय समूहों के निर्माण की पद्धति पर अध्याय में निर्धारित किए गए हैं (पैराग्राफ 3.3 देखें)।

विविधता श्रृंखला विविध जानकारी को एक संक्षिप्त रूप में संक्षिप्त या संपीड़ित करने का एक साधन है; उनसे भिन्नता की प्रकृति के बारे में काफी स्पष्ट निर्णय लिया जा सकता है, और अध्ययन के तहत सेट में शामिल घटनाओं की विशेषताओं में अंतर का अध्ययन किया जा सकता है। लेकिन भिन्नता श्रृंखला का सबसे महत्वपूर्ण महत्व यह है कि उनके आधार पर भिन्नता की विशेष सामान्यीकरण विशेषताओं की गणना की जाती है (अध्याय 7 देखें)।



साइट पर नया

>

सबसे लोकप्रिय