घर लेपित जीभ विविधता श्रृंखला में निम्न शामिल हैं: भिन्नता श्रृंखला की परिभाषा

विविधता श्रृंखला में निम्न शामिल हैं: भिन्नता श्रृंखला की परिभाषा

इस अध्याय में महारत हासिल करने के परिणामस्वरूप, छात्र को यह करना होगा: जानना

  • भिन्नता के संकेतक और उनका संबंध;
  • विशेषताओं के वितरण के बुनियादी नियम;
  • सहमति मानदंड का सार; करने में सक्षम हों
  • भिन्नता और उपयुक्तता मानदंड के सूचकांकों की गणना करें;
  • वितरण विशेषताएँ निर्धारित करें;
  • सांख्यिकीय वितरण श्रृंखला की बुनियादी संख्यात्मक विशेषताओं का मूल्यांकन कर सकेंगे;

अपना

  • वितरण श्रृंखला के सांख्यिकीय विश्लेषण के तरीके;
  • मूल बातें भिन्नता का विश्लेषण;
  • वितरण के बुनियादी कानूनों के अनुपालन के लिए सांख्यिकीय वितरण श्रृंखला की जाँच करने की तकनीक।

भिन्नता सूचक

पर सांख्यिकीय अनुसंधानविभिन्न सांख्यिकीय समुच्चय की विशेषताएँ, व्यक्ति की विशेषताओं में भिन्नता का अध्ययन सांख्यिकीय इकाइयाँजनसंख्या, साथ ही इकाइयों के वितरण की प्रकृति यह विशेषता. उतार-चढ़ाव -ये अध्ययन की जा रही जनसंख्या की इकाइयों के बीच एक विशेषता के व्यक्तिगत मूल्यों में अंतर हैं। विविधता का अध्ययन अत्यंत व्यावहारिक महत्व का है। भिन्नता की डिग्री के आधार पर, कोई किसी विशेषता की भिन्नता की सीमा, किसी दिए गए विशेषता के लिए जनसंख्या की एकरूपता, औसत की विशिष्टता और भिन्नता निर्धारित करने वाले कारकों के संबंध का न्याय कर सकता है। भिन्नता संकेतकों का उपयोग सांख्यिकीय आबादी को चिह्नित करने और व्यवस्थित करने के लिए किया जाता है।

सांख्यिकीय वितरण श्रृंखला के रूप में प्रस्तुत सांख्यिकीय अवलोकन सामग्रियों के सारांश और समूहीकरण के परिणाम, समूहीकरण (भिन्न) मानदंडों के अनुसार समूहों में अध्ययन के तहत जनसंख्या की इकाइयों के क्रमबद्ध वितरण का प्रतिनिधित्व करते हैं। यदि किसी गुणात्मक विशेषता को समूहीकरण के आधार के रूप में लिया जाए तो ऐसी वितरण श्रृंखला कहलाती है ठहराव(पेशे, लिंग, रंग, आदि के आधार पर वितरण)। यदि किसी वितरण श्रृंखला का निर्माण मात्रात्मक आधार पर किया जाता है, तो ऐसी श्रृंखला कहलाती है परिवर्तन संबंधी(ऊंचाई, वजन, वेतन, आदि के आधार पर वितरण)। विविधता श्रृंखला का निर्माण करने का अर्थ है विशिष्ट मूल्यों द्वारा जनसंख्या इकाइयों के मात्रात्मक वितरण को व्यवस्थित करना, इन मूल्यों (आवृत्ति) के साथ जनसंख्या इकाइयों की संख्या की गणना करना, और परिणामों को एक तालिका में व्यवस्थित करना।

किसी प्रकार की आवृत्ति के स्थान पर प्रेक्षणों की कुल मात्रा में उसके अनुपात का उपयोग करना संभव है, जिसे आवृत्ति (सापेक्ष आवृत्ति) कहा जाता है।

ये दो प्रकार के होते हैं विविधता श्रृंखला: असतत और अंतराल. पृथक शृंखला- यह एक भिन्नता शृंखला है, जिसका निर्माण असंतत परिवर्तन (असतत विशेषताएँ) वाली विशेषताओं पर आधारित है। उत्तरार्द्ध में उद्यम में कर्मचारियों की संख्या, टैरिफ श्रेणी, परिवार में बच्चों की संख्या आदि शामिल हैं। एक अलग भिन्नता श्रृंखला एक तालिका का प्रतिनिधित्व करती है जिसमें दो कॉलम होते हैं। पहला कॉलम विशेषता के विशिष्ट मान को इंगित करता है, और दूसरा कॉलम विशेषता के विशिष्ट मान के साथ जनसंख्या में इकाइयों की संख्या को इंगित करता है। यदि किसी विशेषता में निरंतर परिवर्तन होता है (आय की मात्रा, सेवा की लंबाई, उद्यम की अचल संपत्तियों की लागत, आदि, जो कुछ सीमाओं के भीतर कोई भी मान ले सकती है), तो इस विशेषता के लिए निर्माण करना संभव है अंतराल भिन्नता श्रृंखला.अंतराल भिन्नता श्रृंखला का निर्माण करते समय, तालिका में दो कॉलम भी होते हैं। पहला अंतराल "से - से" (विकल्प) में विशेषता के मूल्य को इंगित करता है, दूसरा अंतराल (आवृत्ति) में शामिल इकाइयों की संख्या को इंगित करता है। आवृत्ति (पुनरावृत्ति आवृत्ति) - विशेषता मानों के एक विशेष प्रकार की पुनरावृत्ति की संख्या। अंतराल बंद या खुले हो सकते हैं। बंद अंतराल दोनों तरफ सीमित हैं, यानी। निचली ("से") और ऊपरी ("से") सीमा दोनों होती हैं। खुले अंतरालों की एक सीमा होती है: या तो ऊपरी या निचली। यदि विकल्पों को आरोही या अवरोही क्रम में व्यवस्थित किया जाता है, तो पंक्तियाँ कहलाती हैं रैंक किया गया।

भिन्नता श्रृंखला के लिए, दो प्रकार की आवृत्ति प्रतिक्रिया विकल्प हैं: संचित आवृत्ति और संचित आवृत्ति। संचित आवृत्ति से पता चलता है कि कितने अवलोकनों में विशेषता के मूल्य ने दिए गए मान से कम मान लिया। संचित आवृत्ति किसी दिए गए समूह के लिए किसी विशेषता के आवृत्ति मानों को पिछले समूहों की सभी आवृत्तियों के साथ जोड़कर निर्धारित की जाती है। संचित आवृत्ति की विशेषता है विशिष्ट गुरुत्वअवलोकन की इकाइयाँ जिनमें विशेषता मान डेटा समूह की ऊपरी सीमा से अधिक नहीं होते हैं। इस प्रकार, संचित आवृत्ति समग्रता में विकल्पों के अनुपात को दर्शाती है जिसका मूल्य दिए गए से अधिक नहीं है। आवृत्ति, आवृत्ति, निरपेक्ष और सापेक्ष घनत्व, संचित आवृत्ति और आवृत्ति प्रकार के परिमाण की विशेषताएं हैं।

जनसंख्या की सांख्यिकीय इकाइयों की विशेषताओं के साथ-साथ वितरण की प्रकृति में भिन्नता का अध्ययन भिन्नता श्रृंखला के संकेतकों और विशेषताओं का उपयोग करके किया जाता है, जिसमें श्रृंखला का औसत स्तर, औसत रैखिक विचलन, मानक विचलन, फैलाव शामिल हैं। , दोलन, भिन्नता, विषमता, कर्टोसिस, आदि के गुणांक।

वितरण केंद्र को चिह्नित करने के लिए औसत मूल्यों का उपयोग किया जाता है। औसत एक सामान्यीकृत सांख्यिकीय विशेषता है जिसमें अध्ययन की जा रही आबादी के सदस्यों की विशेषता के विशिष्ट स्तर को निर्धारित किया जाता है। हालाँकि, विभिन्न वितरण पैटर्न के साथ अंकगणितीय साधनों के संयोग के मामले हो सकते हैं, इसलिए, भिन्नता श्रृंखला की सांख्यिकीय विशेषताओं के रूप में, तथाकथित संरचनात्मक साधनों की गणना की जाती है - मोड, माध्यिका, साथ ही मात्राएँ, जो वितरण श्रृंखला को समान भागों में विभाजित करती हैं भाग (चतुर्थक, दशमांश, शतमक, आदि)।

पहनावा -यह एक विशेषता का मूल्य है जो वितरण श्रृंखला में इसके अन्य मूल्यों की तुलना में अधिक बार होता है। असतत श्रृंखला के लिए, यह उच्चतम आवृत्ति वाला विकल्प है। अंतराल भिन्नता श्रृंखला में, मोड निर्धारित करने के लिए, पहले उस अंतराल को निर्धारित करना आवश्यक है जिसमें यह स्थित है, तथाकथित मोडल अंतराल। के साथ विविधता श्रृंखला में समान अंतराल परमोडल अंतराल असमान अंतराल के साथ श्रृंखला में उच्चतम आवृत्ति द्वारा निर्धारित किया जाता है - लेकिन उच्चतम वितरण घनत्व। फिर समान अंतराल पर पंक्तियों में मोड निर्धारित करने के लिए सूत्र का उपयोग किया जाता है

जहां मो फैशन मूल्य है; xMo - मोडल अंतराल की निचली सीमा; एच-मोडल अंतराल चौड़ाई; / मो - मोडल अंतराल की आवृत्ति; / मो जे प्रीमोडल अंतराल की आवृत्ति है; / Mo+1 पोस्ट-मोडल अंतराल की आवृत्ति है, और इस गणना सूत्र में असमान अंतराल वाली श्रृंखला के लिए, आवृत्तियों / Mo, / Mo, / Mo के बजाय, वितरण घनत्व का उपयोग किया जाना चाहिए दिमाग 0 _| , दिमाग 0> यूएमओ+"

यदि एकल मोड है, तो यादृच्छिक चर की संभाव्यता वितरण को यूनिमॉडल कहा जाता है; यदि एक से अधिक मोड हैं, तो इसे मल्टीमॉडल (पॉलीमॉडल, मल्टीमॉडल) कहा जाता है, दो मोड के मामले में - बिमोडल। एक नियम के रूप में, बहुविधता इंगित करती है कि अध्ययन के तहत वितरण कानून का पालन नहीं करता है सामान्य वितरण. एक नियम के रूप में, सजातीय आबादी को एकल-शीर्ष वितरण की विशेषता होती है। मल्टीवर्टेक्स अध्ययन की जा रही जनसंख्या की विविधता को भी इंगित करता है। दो या दो से अधिक शीर्षों की उपस्थिति अधिक सजातीय समूहों की पहचान करने के लिए डेटा को पुन: समूहित करना आवश्यक बनाती है।

अंतराल भिन्नता श्रृंखला में, मोड को हिस्टोग्राम का उपयोग करके ग्राफ़िक रूप से निर्धारित किया जा सकता है। ऐसा करने के लिए, हिस्टोग्राम के उच्चतम स्तंभ के शीर्ष बिंदुओं से दो आसन्न स्तंभों के शीर्ष बिंदुओं तक दो प्रतिच्छेदी रेखाएँ खींचें। फिर, उनके चौराहे के बिंदु से, भुज अक्ष पर एक लंब उतारा जाता है। लम्ब के अनुरूप x-अक्ष पर फ़ीचर का मान मोड है। कई मामलों में, जब किसी जनसंख्या को सामान्यीकृत संकेतक के रूप में चिह्नित किया जाता है, तो अंकगणितीय माध्य के बजाय मोड को प्राथमिकता दी जाती है।

माध्यिका -यह केंद्रीय महत्वविशेषता, यह रैंक वितरण श्रृंखला के केंद्रीय सदस्य के पास है। असतत श्रृंखला में, माध्यिका का मान ज्ञात करने के लिए पहले उसका निर्धारण करें क्रम संख्या. ऐसा करने के लिए, यदि इकाइयों की संख्या विषम है, तो सभी आवृत्तियों के योग में एक जोड़ा जाता है, और संख्या को दो से विभाजित किया जाता है। यदि किसी पंक्ति में सम संख्या में इकाइयाँ हैं, तो दो मध्य इकाइयाँ होंगी, इसलिए इस मामले में मध्य को दो मध्य इकाइयों के मानों के औसत के रूप में परिभाषित किया गया है। इस प्रकार, असतत भिन्नता श्रृंखला में माध्यिका वह मान है जो श्रृंखला को समान संख्या में विकल्पों वाले दो भागों में विभाजित करता है।

अंतराल श्रृंखला में, माध्यिका की क्रम संख्या निर्धारित करने के बाद, संचित आवृत्तियों (आवृत्तियों) का उपयोग करके माध्यिका अंतराल पाया जाता है, और फिर माध्यिका की गणना के लिए सूत्र का उपयोग करके, माध्यिका का मान स्वयं निर्धारित किया जाता है:

जहां मी माध्यिका मान है; x मैं -माध्यिका अंतराल की निचली सीमा; एच-माध्यिका अंतराल की चौड़ाई; - वितरण श्रृंखला की आवृत्तियों का योग; /डी - पूर्व-मध्य अंतराल की संचित आवृत्ति; / मी - माध्यिका अंतराल की आवृत्ति।

माध्यिका को क्यूम्युलेट का उपयोग करके ग्राफ़िक रूप से पाया जा सकता है। ऐसा करने के लिए, संचयी की संचित आवृत्तियों (आवृत्तियों) के पैमाने पर, माध्यिका की क्रमिक संख्या के अनुरूप बिंदु से, भुज अक्ष के समानांतर एक सीधी रेखा खींची जाती है जब तक कि वह संचयी के साथ प्रतिच्छेद न कर ले। इसके बाद, क्यूम्युलेट के साथ संकेतित रेखा के चौराहे के बिंदु से, एक लंबवत को एब्सिस्सा अक्ष पर उतारा जाता है। खींची गई कोटि (लंबवत) के अनुरूप x-अक्ष पर विशेषता का मान माध्यिका है।

माध्यिका की विशेषता निम्नलिखित गुणों से होती है।

  • 1. यह उन विशेषता मानों पर निर्भर नहीं है जो इसके दोनों ओर स्थित हैं।
  • 2. इसमें न्यूनतमता का गुण है, जिसका अर्थ है कि माध्यिका से विशेषता मानों के पूर्ण विचलन का योग किसी अन्य मान से विशेषता मानों के विचलन की तुलना में न्यूनतम मान का प्रतिनिधित्व करता है।
  • 3. ज्ञात माध्यिकाओं के साथ दो वितरणों को जोड़ते समय, नए वितरण के माध्यिका के मान का पहले से अनुमान लगाना असंभव है।

माध्यिका के इन गुणों का व्यापक रूप से बिंदु स्थानों को डिजाइन करने में उपयोग किया जाता है। कतार- स्कूल, क्लीनिक, गैस स्टेशन, जल बिंदु, आदि। उदाहरण के लिए, यदि शहर के एक निश्चित ब्लॉक में एक क्लिनिक बनाने की योजना बनाई गई है, तो इसे ब्लॉक में एक ऐसे बिंदु पर स्थापित करना अधिक समीचीन होगा जो ब्लॉक की लंबाई नहीं, बल्कि निवासियों की संख्या को आधा कर दे।

मोड, माध्यिका और अंकगणितीय माध्य का अनुपात समुच्चय में विशेषता के वितरण की प्रकृति को इंगित करता है और हमें वितरण की समरूपता का आकलन करने की अनुमति देता है। अगर x मी तो श्रृंखला की दाहिनी ओर की विषमता है। सामान्य वितरण के साथ एक्स -मैं- मो.

के. पियर्सन आधारित संरेखण विभिन्न प्रकार केवक्रों ने निर्धारित किया कि मध्यम असममित वितरण के लिए अंकगणितीय माध्य, माध्यिका और मोड के बीच निम्नलिखित अनुमानित संबंध मान्य हैं:

जहां मी माध्यिका मान है; मो - फैशन का अर्थ; x अंकगणित - अंकगणितीय माध्य का मान।

यदि भिन्नता श्रृंखला की संरचना का अधिक विस्तार से अध्ययन करने की आवश्यकता है, तो माध्यिका के समान विशेषता मानों की गणना करें। ऐसे विशिष्ट मान सभी वितरण इकाइयों को समान संख्याओं में विभाजित करते हैं; उन्हें क्वांटाइल या ग्रेडिएंट कहा जाता है। मात्राओं को चतुर्थक, दशमांश, प्रतिशतक आदि में विभाजित किया गया है।

चतुर्थक जनसंख्या को चार बराबर भागों में विभाजित करते हैं। पहले चतुर्थक की गणना पहले चतुर्थक की गणना के लिए सूत्र का उपयोग करके माध्यिका के समान की जाती है, पहले से पहला त्रैमासिक अंतराल निर्धारित किया जाता है:

जहां क्यूई प्रथम चतुर्थक का मान है; xQ^-प्रथम चतुर्थक सीमा की निचली सीमा; एच- पहली तिमाही के अंतराल की चौड़ाई; /, - अंतराल श्रृंखला की आवृत्तियाँ;

प्रथम चतुर्थक अंतराल से पहले के अंतराल में संचयी आवृत्ति; Jq (- प्रथम चतुर्थक अंतराल की आवृत्ति।

प्रथम चतुर्थक से पता चलता है कि जनसंख्या इकाइयों का 25% इसके मूल्य से कम है, और 75% अधिक है। दूसरा चतुर्थक माध्यिका के बराबर है, अर्थात। प्रश्न 2 =मुझे।

सादृश्य से, तीसरे चतुर्थक की गणना की जाती है, पहले तीसरा त्रैमासिक अंतराल पाया जाता है:

तीसरी चतुर्थक सीमा की निचली सीमा कहाँ है; एच- तीसरे चतुर्थक अंतराल की चौड़ाई; /, - अंतराल श्रृंखला की आवृत्तियाँ; /एक्स" -पूर्ववर्ती अंतराल में संचित आवृत्ति

जी

तृतीय चतुर्थक अंतराल; Jq तीसरे चतुर्थक अंतराल की आवृत्ति है।

तीसरे चतुर्थक से पता चलता है कि 75% जनसंख्या इकाइयाँ इसके मूल्य से कम हैं, और 25% अधिक हैं।

तीसरे और पहले चतुर्थक के बीच का अंतर अंतरचतुर्थक सीमा है:

जहां Aq अंतरचतुर्थक श्रेणी का मान है; प्रश्न 3 -तृतीय चतुर्थक मान; Q, प्रथम चतुर्थक का मान है।

दशमांश जनसंख्या को 10 बराबर भागों में विभाजित करते हैं। एक दशमलव एक वितरण श्रृंखला में एक विशेषता का मान है जो जनसंख्या आकार के दसवें हिस्से से मेल खाता है। चतुर्थक के अनुरूप, पहला दशमलव दर्शाता है कि जनसंख्या इकाइयों का 10% उसके मूल्य से कम है, और 90% अधिक है, और नौवें दशमलव से पता चलता है कि जनसंख्या इकाइयों का 90% उसके मूल्य से कम है, और 10% हैं अधिक. नौवें और पहले दशमलव का अनुपात, अर्थात्। 10% सर्वाधिक संपन्न और 10% सबसे कम संपन्न आबादी के आय स्तर के अनुपात को मापने के लिए आय विभेदन के अध्ययन में दशमलव गुणांक का व्यापक रूप से उपयोग किया जाता है। प्रतिशतक रैंक वाली जनसंख्या को 100 बराबर भागों में विभाजित करते हैं। प्रतिशतक की गणना, अर्थ और अनुप्रयोग दशमलव के समान है।

चतुर्थक, दशमांश और अन्य संरचनात्मक विशेषताएंक्यूम्युलेट्स का उपयोग करके माध्यिका के अनुरूप रेखांकन द्वारा निर्धारित किया जा सकता है।

भिन्नता के आकार को मापने के लिए, निम्नलिखित संकेतकों का उपयोग किया जाता है: भिन्नता की सीमा, औसत रैखिक विचलन, मानक विचलन, फैलाव। भिन्नता सीमा का परिमाण पूरी तरह से श्रृंखला के चरम सदस्यों के वितरण की यादृच्छिकता पर निर्भर करता है। यह संकेतक उन मामलों में रुचिकर है जहां यह जानना महत्वपूर्ण है कि किसी विशेषता के मूल्यों में उतार-चढ़ाव का आयाम क्या है:

कहाँ आर-भिन्नता की सीमा का मूल्य; x अधिकतम - विशेषता का अधिकतम मान; एक्स टीटी -विशेषता का न्यूनतम मान.

भिन्नता की सीमा की गणना करते समय, श्रृंखला के अधिकांश सदस्यों के मूल्य को ध्यान में नहीं रखा जाता है, जबकि भिन्नता श्रृंखला के प्रत्येक सदस्य के मूल्य से जुड़ी होती है। संकेतक जो किसी विशेषता के व्यक्तिगत मूल्यों के उनके औसत मूल्य से विचलन से प्राप्त औसत होते हैं, उनमें यह खामी नहीं होती है: औसत रैखिक विचलन और मानक विचलन। औसत से व्यक्तिगत विचलन और किसी विशेष लक्षण की परिवर्तनशीलता के बीच सीधा संबंध है। उतार-चढ़ाव जितना मजबूत होगा, उतना ही अधिक होगा पूर्ण आयामऔसत से विचलन.

औसत रैखिक विचलन का अंकगणितीय माध्य है सम्पूर्ण मूल्यउनके औसत मूल्य से व्यक्तिगत विकल्पों का विचलन।

असमूहीकृत डेटा के लिए औसत रैखिक विचलन

जहां /pr औसत रैखिक विचलन का मान है; x, - विशेषता का मान है; एक्स - पी -जनसंख्या में इकाइयों की संख्या.

समूहीकृत श्रृंखला का औसत रैखिक विचलन

जहाँ / vz - औसत रैखिक विचलन का मान; x, विशेषता का मान है; एक्स -अध्ययन की जा रही जनसंख्या के लिए विशेषता का औसत मूल्य; / - एक अलग समूह में जनसंख्या इकाइयों की संख्या।

में विचलन के संकेत इस मामले मेंनजरअंदाज कर दिया जाता है, अन्यथा सभी विचलनों का योग शून्य के बराबर होगा। विश्लेषण किए गए डेटा के समूहीकरण के आधार पर औसत रैखिक विचलन की गणना विभिन्न सूत्रों का उपयोग करके की जाती है: समूहीकृत और असमूहीकृत डेटा के लिए। औसत रैखिक विचलन, इसकी सशर्तता के कारण, भिन्नता के अन्य संकेतकों से अलग, व्यवहार में अपेक्षाकृत कम ही उपयोग किया जाता है (विशेष रूप से, वितरण की एकरूपता के लिए संविदात्मक दायित्वों की पूर्ति को चिह्नित करने के लिए; टर्नओवर विश्लेषण में) विदेश व्यापार, श्रमिकों की संरचना, उत्पादन की लय, उत्पादों की गुणवत्ता को ध्यान में रखते हुए तकनीकी विशेषताएंउत्पादन, आदि)।

मानक विचलन यह दर्शाता है कि अध्ययन की जा रही विशेषता के व्यक्तिगत मूल्य जनसंख्या के औसत मूल्य से कितना विचलन करते हैं, और अध्ययन की जा रही विशेषता के माप की इकाइयों में व्यक्त किया जाता है। मानक विचलन, भिन्नता के मुख्य उपायों में से एक होने के नाते, एक सजातीय आबादी में किसी विशेषता की भिन्नता की सीमा का आकलन करने, सामान्य वितरण वक्र के समन्वय मूल्यों को निर्धारित करने के साथ-साथ संबंधित गणनाओं में व्यापक रूप से उपयोग किया जाता है। नमूना अवलोकन का संगठन और नमूना विशेषताओं की सटीकता स्थापित करना। अवर्गीकृत डेटा के मानक विचलन की गणना निम्नलिखित एल्गोरिदम का उपयोग करके की जाती है: माध्य से प्रत्येक विचलन का वर्ग किया जाता है, सभी वर्गों का योग किया जाता है, जिसके बाद वर्गों के योग को श्रृंखला के शब्दों की संख्या से विभाजित किया जाता है और वर्गमूल निकाला जाता है। भागफल:

जहां IIP मानक विचलन का मान है; Xj-मान बताइए; एक्स- अध्ययन की जा रही जनसंख्या के लिए विशेषता का औसत मूल्य; पी -जनसंख्या में इकाइयों की संख्या.

समूहीकृत विश्लेषण किए गए डेटा के लिए, डेटा के मानक विचलन की गणना भारित सूत्र का उपयोग करके की जाती है

कहाँ - मानक विचलन मान; Xj-मान बताइए; एक्स -अध्ययन की जा रही जनसंख्या के लिए विशेषता का औसत मूल्य; एफ एक्स -किसी विशेष समूह में जनसंख्या इकाइयों की संख्या।

दोनों स्थितियों में मूल के नीचे के भाव को विचरण कहा जाता है। इस प्रकार, फैलाव की गणना उनके औसत मूल्य से विशेषता मूल्यों के विचलन के औसत वर्ग के रूप में की जाती है। अभारित (सरल) विशेषता मानों के लिए, विचरण निम्नानुसार निर्धारित किया जाता है:

भारित विशेषता मानों के लिए

विचरण की गणना के लिए एक विशेष सरलीकृत विधि भी है: सामान्य तौर पर

अभारित (सरल) विशेषता मानों के लिए भारित विशेषता मानों के लिए
शून्य-आधारित विधि का उपयोग करना

जहां 2 फैलाव मान है; x, - विशेषता का मान है; एक्स -विशेषता का औसत मूल्य, एच-समूह अंतराल मान, टी 1 -वजन (ए =

सांख्यिकी में फैलाव की एक स्वतंत्र अभिव्यक्ति होती है और यह संख्या को संदर्भित करता है सबसे महत्वपूर्ण संकेतकविविधताएँ। इसे अध्ययन की जा रही विशेषता के माप की इकाइयों के वर्ग के अनुरूप इकाइयों में मापा जाता है।

फैलाव में निम्नलिखित गुण होते हैं।

  • 1. एक स्थिर मान का प्रसरण शून्य है।
  • 2. किसी विशेषता के सभी मानों को समान मान A से कम करने से विचरण का मान नहीं बदलता है। इसका मतलब यह है कि विचलन के औसत वर्ग की गणना किसी विशेषता के दिए गए मानों से नहीं, बल्कि कुछ स्थिर संख्या से उनके विचलन से की जा सकती है।
  • 3. किसी भी विशेषता मान को कम करना समय से फैलाव कम हो जाता है 2 बार, और मानक विचलन अंदर है समय, यानी विशेषता के सभी मानों को कुछ स्थिर संख्या (मान लीजिए, श्रृंखला अंतराल के मूल्य से) से विभाजित किया जा सकता है, मानक विचलन की गणना की जा सकती है, और फिर एक स्थिर संख्या से गुणा किया जा सकता है।
  • 4. यदि हम किसी मान से विचलन का औसत वर्ग निकालते हैं औरअंकगणितीय माध्य से एक डिग्री या दूसरे तक भिन्न, तो यह हमेशा अंकगणितीय माध्य से गणना किए गए विचलन के औसत वर्ग से अधिक होगा। विचलनों का औसत वर्ग एक निश्चित मात्रा से अधिक होगा - औसत और इस पारंपरिक रूप से लिए गए मान के बीच के अंतर के वर्ग से।

एक वैकल्पिक विशेषता की भिन्नता में जनसंख्या की इकाइयों में अध्ययन की गई संपत्ति की उपस्थिति या अनुपस्थिति शामिल है। मात्रात्मक रूप से, एक वैकल्पिक विशेषता की भिन्नता दो मानों द्वारा व्यक्त की जाती है: अध्ययन की गई संपत्ति की एक इकाई की उपस्थिति को एक (1) द्वारा दर्शाया जाता है, और इसकी अनुपस्थिति को शून्य (0) द्वारा दर्शाया जाता है। जिन इकाइयों के पास अध्ययनाधीन संपत्ति है उनका अनुपात पी द्वारा दर्शाया जाता है, और जिन इकाइयों के पास यह संपत्ति नहीं है उनका अनुपात पी द्वारा दर्शाया जाता है जी।इस प्रकार, एक वैकल्पिक विशेषता का विचरण इस संपत्ति को रखने वाली इकाइयों के अनुपात (पी) और इस संपत्ति को न रखने वाली इकाइयों के अनुपात के उत्पाद के बराबर है। (जी)।जनसंख्या की सबसे बड़ी भिन्नता उन मामलों में प्राप्त होती है जहां जनसंख्या का एक हिस्सा, जो जनसंख्या की कुल मात्रा का 50% होता है, में एक विशेषता होती है, और जनसंख्या का दूसरा हिस्सा, जो 50% के बराबर होता है, में यह विशेषता नहीं होती है, और फैलाव 0.25 के अधिकतम मान तक पहुँच जाता है, अर्थात। पी = 0.5, जी= 1 - पी = 1 - 0.5 = 0.5 और ओ 2 = 0.5 0.5 = 0.25। इस सूचक की निचली सीमा शून्य है, जो उस स्थिति से मेल खाती है जिसमें कुल में कोई भिन्नता नहीं है। किसी वैकल्पिक विशेषता के विचरण का व्यावहारिक अनुप्रयोग निर्माण करना है विश्वास अंतरालनमूना अवलोकन करते समय।

कैसे कम मूल्यविचरण और मानक विचलन, जनसंख्या जितनी अधिक सजातीय होगी और औसत उतना ही अधिक विशिष्ट होगा। सांख्यिकी के अभ्यास में, अक्सर विविधताओं की तुलना करने की आवश्यकता होती है विभिन्न संकेत. उदाहरण के लिए, श्रमिकों की आयु और उनकी योग्यता, सेवा की अवधि और वेतन, लागत और लाभ, सेवा की अवधि और श्रम उत्पादकता आदि में भिन्नता की तुलना करना दिलचस्प है। ऐसी तुलनाओं के लिए, विशेषताओं की पूर्ण परिवर्तनशीलता के संकेतक अनुपयुक्त हैं: वर्षों में व्यक्त कार्य अनुभव की परिवर्तनशीलता की तुलना रूबल में व्यक्त मजदूरी की भिन्नता के साथ करना असंभव है। ऐसी तुलना करने के लिए, साथ ही विभिन्न अंकगणितीय औसत के साथ कई आबादी में एक ही विशेषता की परिवर्तनशीलता की तुलना करने के लिए, भिन्नता संकेतक का उपयोग किया जाता है - दोलन गुणांक, रैखिक गुणांकविविधताएं और भिन्नता का गुणांक, जो दर्शाता है कि औसत के आसपास चरम मूल्यों में किस हद तक उतार-चढ़ाव होता है।

दोलन गुणांक:

कहाँ वी आर -दोलन गुणांक मान; आर- भिन्नता की सीमा का मूल्य; एक्स -

भिन्नता का रैखिक गुणांक"।

कहाँ वीजे-भिन्नता के रैखिक गुणांक का मान; मैं -औसत रैखिक विचलन का मान; एक्स -अध्ययन की जा रही जनसंख्या के लिए विशेषता का औसत मूल्य।

भिन्नता का गुणांक:

कहाँ वी ए -भिन्नता मूल्य का गुणांक; ए मानक विचलन का मान है; एक्स -अध्ययन की जा रही जनसंख्या के लिए विशेषता का औसत मूल्य।

दोलन का गुणांक अध्ययन की जा रही विशेषता के औसत मूल्य के लिए भिन्नता की सीमा का प्रतिशत अनुपात है, और भिन्नता का रैखिक गुणांक अध्ययन की जा रही विशेषता के औसत मूल्य के लिए औसत रैखिक विचलन का अनुपात है, जिसे एक के रूप में व्यक्त किया जाता है प्रतिशत. भिन्नता का गुणांक अध्ययन की जा रही विशेषता के औसत मूल्य के मानक विचलन का प्रतिशत है। एक सापेक्ष मूल्य के रूप में, प्रतिशत के रूप में व्यक्त, भिन्नता के गुणांक का उपयोग विभिन्न विशेषताओं की भिन्नता की डिग्री की तुलना करने के लिए किया जाता है। भिन्नता के गुणांक का उपयोग करके, सांख्यिकीय जनसंख्या की एकरूपता का आकलन किया जाता है। यदि भिन्नता का गुणांक 33% से कम है, तो अध्ययन के तहत जनसंख्या सजातीय है और भिन्नता कमजोर है। यदि भिन्नता का गुणांक 33% से अधिक है, तो अध्ययन के तहत जनसंख्या विषम है, भिन्नता मजबूत है, और औसत मूल्य असामान्य है और इस जनसंख्या के सामान्य संकेतक के रूप में उपयोग नहीं किया जा सकता है। इसके अलावा, विभिन्न आबादी में एक विशेषता की परिवर्तनशीलता की तुलना करने के लिए भिन्नता के गुणांक का उपयोग किया जाता है। उदाहरण के लिए, दो उद्यमों में श्रमिकों की सेवा अवधि में भिन्नता का आकलन करना। गुणांक मान जितना अधिक होगा, विशेषता की भिन्नता उतनी ही अधिक महत्वपूर्ण होगी।

परिकलित चतुर्थक के आधार पर, सूत्र का उपयोग करके त्रैमासिक भिन्नता के सापेक्ष संकेतक की गणना करना भी संभव है

कहां प्र 2 और

अंतरचतुर्थक सीमा सूत्र द्वारा निर्धारित की जाती है

चरम मूल्यों के उपयोग से जुड़े नुकसान से बचने के लिए भिन्नता की सीमा के बजाय चतुर्थक विचलन का उपयोग किया जाता है:

असमान अंतराल भिन्नता श्रृंखला के लिए, वितरण घनत्व की भी गणना की जाती है। इसे अंतराल के मान से विभाजित संबंधित आवृत्ति या आवृत्ति के भागफल के रूप में परिभाषित किया गया है। असमान अंतराल श्रृंखला में, निरपेक्ष और सापेक्ष वितरण घनत्व का उपयोग किया जाता है। पूर्ण वितरण घनत्व अंतराल की प्रति इकाई लंबाई की आवृत्ति है। सापेक्ष वितरण घनत्व - प्रति इकाई अंतराल लंबाई आवृत्ति।

उपरोक्त सभी वितरण श्रृंखला के लिए सत्य है जिसका वितरण कानून सामान्य वितरण कानून द्वारा अच्छी तरह वर्णित है या उसके करीब है।

विविधता श्रृंखला की अवधारणा.सांख्यिकीय अवलोकन सामग्री को व्यवस्थित करने में पहला कदम उन इकाइयों की संख्या की गणना करना है जिनमें एक विशेष विशेषता है। इकाइयों को उनकी मात्रात्मक विशेषता के आरोही या अवरोही क्रम में व्यवस्थित करके और विशेषता के विशिष्ट मूल्य के साथ इकाइयों की संख्या की गणना करके, हम एक भिन्नता श्रृंखला प्राप्त करते हैं। एक भिन्नता श्रृंखला कुछ मात्रात्मक विशेषता के अनुसार एक निश्चित सांख्यिकीय जनसंख्या की इकाइयों के वितरण की विशेषता बताती है।

विविधता श्रृंखला में दो कॉलम होते हैं, बाएं कॉलम में अलग-अलग विशेषताओं के मान होते हैं, जिन्हें वेरिएंट कहा जाता है और (x) दर्शाया जाता है, और दाएं कॉलम में निरपेक्ष संख्याएं होती हैं जो दर्शाती हैं कि प्रत्येक वेरिएंट कितनी बार आता है। इस कॉलम के संकेतकों को आवृत्तियाँ कहा जाता है और इन्हें (f) निर्दिष्ट किया जाता है।

विविधता श्रृंखला को तालिका 5.1 के रूप में योजनाबद्ध रूप से प्रस्तुत किया जा सकता है:

तालिका 5.1

विविधता श्रृंखला का प्रकार

विकल्प (एक्स)

आवृत्तियाँ (एफ)

सही कॉलम में, सापेक्ष संकेतकों का भी उपयोग किया जा सकता है, जो आवृत्तियों के कुल योग में व्यक्तिगत विकल्पों की आवृत्ति के हिस्से को दर्शाते हैं। इन सापेक्ष संकेतकों को आवृत्तियाँ कहा जाता है और इन्हें पारंपरिक रूप से निरूपित किया जाता है, अर्थात। . सभी आवृत्तियों का योग एक के बराबर है। आवृत्तियों को प्रतिशत के रूप में भी व्यक्त किया जा सकता है, और तब उनका योग 100% के बराबर होगा।

अलग-अलग संकेत हो सकते हैं अलग चरित्र. कुछ विशेषताओं के वेरिएंट पूर्णांकों में व्यक्त किए जाते हैं, उदाहरण के लिए, एक अपार्टमेंट में कमरों की संख्या, प्रकाशित पुस्तकों की संख्या, आदि। इन संकेतों को असंतत या असतत कहा जाता है। अन्य विशेषताओं के वेरिएंट कुछ सीमाओं के भीतर कोई भी मान ले सकते हैं, जैसे, उदाहरण के लिए, नियोजित कार्यों का कार्यान्वयन, वेतनआदि। इन चिह्नों को सतत कहा जाता है।

असतत भिन्नता श्रृंखला.यदि भिन्नता शृंखला के प्रकारों को रूप में व्यक्त किया जाता है पृथक मात्राएँ, तो ऐसी भिन्नता श्रृंखला को असतत कहा जाता है उपस्थितितालिका में प्रस्तुत किया गया है। 5.2:

तालिका 5.2

परीक्षा ग्रेड के अनुसार छात्रों का वितरण

रेटिंग (x)

छात्रों की संख्या (एफ)

कुल के % में ()

असतत श्रृंखला में वितरण की प्रकृति को वितरण बहुभुज के रूप में रेखांकन द्वारा दर्शाया गया है, चित्र 5.1।

चावल। 5.1. परीक्षा में प्राप्त ग्रेड के अनुसार छात्रों का वितरण।

अंतराल भिन्नता श्रृंखला.निरंतर विशेषताओं के लिए, भिन्नता श्रृंखला का निर्माण अंतराल वाले के रूप में किया जाता है, अर्थात। उनमें विशेषता के मान "से और तक" अंतराल के रूप में व्यक्त किए जाते हैं। इस स्थिति में, ऐसे अंतराल में विशेषता के न्यूनतम मान को अंतराल की निचली सीमा कहा जाता है, और अधिकतम को कहा जाता है ऊपरी सीमामध्यान्तर।

अंतराल भिन्नता श्रृंखला का निर्माण असंतत विशेषताओं (अलग-अलग) और बड़ी रेंज में भिन्नता दोनों के लिए किया जाता है। अंतराल पंक्तियाँ समान या असमान अंतराल वाली हो सकती हैं। आर्थिक व्यवहार में, अधिकांश असमान अंतरालों का उपयोग किया जाता है, जो उत्तरोत्तर बढ़ते या घटते हैं। यह आवश्यकता विशेष रूप से उन मामलों में उत्पन्न होती है जहां किसी विशेषता का उतार-चढ़ाव असमान रूप से और बड़ी सीमा के भीतर होता है।

आइए समान अंतराल वाली तालिका में अंतराल श्रृंखला के प्रकार पर विचार करें। 5.3:

तालिका 5.3

उत्पादन द्वारा श्रमिकों का वितरण

आउटपुट, टी.आर. (एक्स)

श्रमिकों की संख्या (एफ)

संचयी आवृत्ति (f´)

अंतराल वितरण श्रृंखला को ग्राफ़िक रूप से हिस्टोग्राम, चित्र 5.2 के रूप में दर्शाया गया है।

चित्र.5.2. उत्पादन द्वारा श्रमिकों का वितरण

संचित (संचयी) आवृत्ति.व्यवहार में, वितरण श्रृंखला को रूपांतरित करने की आवश्यकता है संचयी श्रृंखला,संचित आवृत्तियों के अनुसार निर्मित। उनकी सहायता से, आप संरचनात्मक औसत निर्धारित कर सकते हैं जो वितरण श्रृंखला डेटा के विश्लेषण की सुविधा प्रदान करते हैं।

संचयी आवृत्तियों को वितरण श्रृंखला के बाद के समूहों के इन संकेतकों को पहले समूह की आवृत्तियों (या आवृत्तियों) में क्रमिक रूप से जोड़कर निर्धारित किया जाता है। वितरण श्रृंखला को चित्रित करने के लिए क्यूम्युलेट्स और तोरण का उपयोग किया जाता है। उनका निर्माण करने के लिए, असतत विशेषता (या अंतराल के अंत) के मूल्यों को भुज अक्ष पर चिह्नित किया जाता है, और आवृत्तियों के संचयी योग (संचयी) को कोर्डिनेट अक्ष पर चिह्नित किया जाता है, चित्र 5.3।

चावल। 5.3. उत्पादन के आधार पर श्रमिकों का संचयी वितरण

यदि आवृत्तियों और विकल्पों के पैमाने उलट दिए जाते हैं, यानी। भुज अक्ष संचित आवृत्तियों को दर्शाता है, और कोटि अक्ष वेरिएंट के मूल्यों को दर्शाता है, फिर समूह से समूह में आवृत्तियों में परिवर्तन को दर्शाने वाले वक्र को वितरण तोरण कहा जाएगा, चित्र 5.4।

चावल। 5.4. उत्पादन द्वारा श्रमिकों के वितरण का ओगिवा

समान अंतराल वाली विविधता श्रृंखला सबसे महत्वपूर्ण आवश्यकताओं में से एक प्रदान करती है सांख्यिकीय श्रृंखलावितरण, समय और स्थान में उनकी तुलनीयता सुनिश्चित करना।

वितरण घनत्व.हालाँकि, नामित श्रृंखला में व्यक्तिगत असमान अंतरालों की आवृत्तियाँ सीधे तुलनीय नहीं हैं। ऐसे मामलों में, आवश्यक तुलनीयता सुनिश्चित करने के लिए, वितरण घनत्व की गणना की जाती है, अर्थात। निर्धारित करें कि प्रत्येक समूह में अंतराल मान की प्रति इकाई कितनी इकाइयाँ हैं।

असमान अंतरालों के साथ भिन्नता श्रृंखला के वितरण का एक ग्राफ बनाते समय, आयतों की ऊंचाई आवृत्तियों के अनुपात में नहीं, बल्कि संबंधित में अध्ययन की जा रही विशेषता के मूल्यों के वितरण के घनत्व संकेतकों के अनुपात में निर्धारित की जाती है। अंतराल.

एक भिन्नता श्रृंखला तैयार करना और उसका चित्रमय प्रतिनिधित्व प्रारंभिक डेटा को संसाधित करने में पहला कदम है और अध्ययन की जा रही आबादी के विश्लेषण में पहला चरण है। अगला कदमभिन्नता श्रृंखला के विश्लेषण में मुख्य सामान्य संकेतकों का निर्धारण होता है, जिन्हें श्रृंखला की विशेषताएँ कहा जाता है। इन विशेषताओं से जनसंख्या इकाइयों के बीच विशेषता के औसत मूल्य का अंदाजा होना चाहिए।

औसत मूल्य. औसत मूल्य अध्ययन के तहत जनसंख्या में अध्ययन की जा रही विशेषता का एक सामान्यीकृत लक्षण है, जो स्थान और समय की विशिष्ट परिस्थितियों में जनसंख्या की प्रति इकाई इसके विशिष्ट स्तर को दर्शाता है।

औसत मूल्य को हमेशा नामित किया जाता है और इसका आयाम जनसंख्या की व्यक्तिगत इकाइयों की विशेषता के समान होता है।

औसत मूल्यों की गणना करने से पहले, गुणात्मक रूप से सजातीय समूहों की पहचान करते हुए, अध्ययन के तहत जनसंख्या की इकाइयों को समूहित करना आवश्यक है।

संपूर्ण जनसंख्या के लिए गणना किए गए औसत को समग्र औसत कहा जाता है, और प्रत्येक समूह के लिए - समूह औसत।

औसत दो प्रकार के होते हैं: घात (अंकगणितीय माध्य, हार्मोनिक माध्य, ज्यामितीय माध्य, द्विघात माध्य); संरचनात्मक (मोड, माध्यिका, चतुर्थक, दशमलव)।

गणना के लिए औसत का चुनाव उद्देश्य पर निर्भर करता है।

पावर औसत के प्रकार और उनकी गणना के तरीके।सांख्यिकीय प्रसंस्करण के अभ्यास में एकत्रित सामग्रीउठना विभिन्न कार्य, जिन्हें हल करने के लिए अलग-अलग औसत की आवश्यकता होती है।

गणितीय आँकड़े शक्ति औसत सूत्रों से विभिन्न औसत प्राप्त करते हैं:

औसत मूल्य कहां है; एक्स - व्यक्तिगत विकल्प (फीचर मान); z - घातांक (z = 1 - अंकगणितीय माध्य के साथ, z = 0 ज्यामितीय माध्य, z = - 1 - हार्मोनिक माध्य, z = 2 - वर्ग माध्य)।

हालाँकि, प्रत्येक व्यक्तिगत मामले में किस प्रकार का औसत लागू किया जाना चाहिए इसका प्रश्न हल किया गया है विशिष्ट विश्लेषणजनसंख्या का अध्ययन किया जा रहा है।

सांख्यिकी में औसत का सबसे सामान्य प्रकार है अंकगणित औसत. इसकी गणना उन मामलों में की जाती है जहां औसत विशेषता की मात्रा अध्ययन की जा रही सांख्यिकीय आबादी की व्यक्तिगत इकाइयों के लिए इसके मूल्यों के योग के रूप में बनाई जाती है।

स्रोत डेटा की प्रकृति के आधार पर, अंकगणितीय माध्य विभिन्न तरीकों से निर्धारित किया जाता है:

यदि डेटा असमूहीकृत है, तो गणना सरल औसत सूत्र का उपयोग करके की जाती है

अंकगणित माध्य की गणना असतत श्रृंखला सूत्र 3.4 के अनुसार होता है।

अंतराल श्रृंखला में अंकगणितीय माध्य की गणना।अंतराल भिन्नता श्रृंखला में, जहां प्रत्येक समूह में एक विशेषता का मान पारंपरिक रूप से अंतराल के मध्य के रूप में लिया जाता है, अंकगणितीय माध्य अवर्गीकृत डेटा से गणना किए गए माध्य से भिन्न हो सकता है। इसके अलावा, समूहों में अंतराल जितना बड़ा होगा, समूहीकृत डेटा से गणना किए गए औसत से असमूहीकृत डेटा से गणना किए गए औसत से संभावित विचलन उतना ही अधिक होगा।

अंतराल भिन्नता श्रृंखला पर औसत की गणना करते समय, आवश्यक गणना करने के लिए, व्यक्ति अंतराल से उनके मध्यबिंदु की ओर बढ़ता है। और फिर भारित अंकगणितीय औसत सूत्र का उपयोग करके औसत की गणना की जाती है।

अंकगणित माध्य के गुण.अंकगणितीय माध्य में कुछ गुण हैं जो गणना को सरल बनाना संभव बनाते हैं; आइए उन पर विचार करें।

1. अचर संख्याओं का अंकगणितीय माध्य इस अचर संख्या के बराबर होता है।

यदि एक्स = ए. तब .

2. यदि सभी विकल्पों का भार आनुपातिक रूप से बदल दिया जाए, अर्थात। समान संख्या में वृद्धि या कमी होने पर नई श्रृंखला का अंकगणितीय माध्य नहीं बदलेगा।

यदि सभी भार f को k गुना कम कर दिया जाए, तो .

3. औसत से अलग-अलग विकल्पों के सकारात्मक और नकारात्मक विचलन का योग, वजन से गुणा किया गया, शून्य के बराबर है, यानी।

तो अगर। यहाँ से।

यदि सभी विकल्पों में किसी संख्या को घटाया या बढ़ाया जाए, तो नई श्रृंखला का अंकगणितीय माध्य उसी मात्रा से घटेगा या बढ़ेगा।

आइए सभी विकल्पों को कम करें एक्सपर , अर्थात। एक्स´ = एक्सएक।

तब

मूल श्रृंखला का अंकगणितीय माध्य विकल्पों में से पहले घटाई गई संख्या को घटे हुए माध्य में जोड़कर प्राप्त किया जा सकता है , अर्थात। .

5. यदि सभी विकल्प कम या ज्यादा कर दिए जाएं गुना, तो नई श्रृंखला का अंकगणितीय माध्य उसी मात्रा में घटेगा या बढ़ेगा, अर्थात। वी एक बार।

फिर रहने दो .

इसलिए, यानी मूल श्रृंखला का औसत प्राप्त करने के लिए, नई श्रृंखला का अंकगणितीय औसत (कम विकल्पों के साथ) बढ़ाया जाना चाहिए एक बार।

अनुकूल माध्य।हार्मोनिक माध्य अंकगणितीय माध्य का व्युत्क्रम है। इसका उपयोग तब किया जाता है जब सांख्यिकीय जानकारी में जनसंख्या के अलग-अलग प्रकारों के लिए आवृत्तियाँ शामिल नहीं होती हैं, बल्कि उन्हें उनके उत्पाद (एम = एक्सएफ) के रूप में प्रस्तुत किया जाता है। हार्मोनिक माध्य की गणना सूत्र 3.5 का उपयोग करके की जाएगी

हार्मोनिक माध्य का व्यावहारिक अनुप्रयोग कुछ सूचकांकों, विशेष रूप से, मूल्य सूचकांक की गणना करना है।

जियोमेट्रिक माध्य।ज्यामितीय माध्य का उपयोग करते समय, किसी विशेषता के व्यक्तिगत मान, एक नियम के रूप में, गतिशीलता के सापेक्ष मूल्य होते हैं, जो गतिशीलता की श्रृंखला में प्रत्येक स्तर के पिछले स्तर के अनुपात के रूप में, श्रृंखला मूल्यों के रूप में निर्मित होते हैं। इस प्रकार औसत औसत विकास दर को दर्शाता है।

औसत ज्यामितीय मात्राइसका उपयोग किसी विशेषता के अधिकतम और न्यूनतम मूल्यों से समदूरस्थ मान निर्धारित करने के लिए भी किया जाता है। उदाहरण के लिए, बीमा कंपनीऑटो बीमा सेवाओं के प्रावधान के लिए अनुबंध समाप्त करता है। विशिष्ट बीमित घटना पर निर्भर करता है बीमा भुगतानप्रति वर्ष $10,000 से $100,000 तक हो सकता है। बीमा भुगतान की औसत राशि USD होगी।

ज्यामितीय माध्य एक मात्रा है जिसका उपयोग अनुपातों के औसत या वितरण श्रृंखला में किया जाता है, जिसे इस रूप में दर्शाया जाता है ज्यामितीय अनुक्रम, जब z = 0. इस औसत का उपयोग तब सुविधाजनक होता है जब पूर्ण अंतर पर नहीं, बल्कि दो संख्याओं के अनुपात पर ध्यान दिया जाता है।

गणना के सूत्र इस प्रकार हैं

विशेषता के वेरिएंट का औसत कहां किया जा रहा है; - विकल्पों का उत्पाद; एफ- विकल्पों की आवृत्ति.

ज्यामितीय माध्य का उपयोग औसत वार्षिक वृद्धि दर की गणना में किया जाता है।

वर्ग मतलब।माध्य वर्ग सूत्र का उपयोग वितरण श्रृंखला में अंकगणितीय माध्य के आसपास किसी विशेषता के व्यक्तिगत मूल्यों के उतार-चढ़ाव की डिग्री को मापने के लिए किया जाता है। इस प्रकार, भिन्नता संकेतकों की गणना करते समय, औसत की गणना अंकगणितीय माध्य से किसी विशेषता के व्यक्तिगत मूल्यों के वर्ग विचलन से की जाती है।

मूल माध्य वर्ग मान की गणना सूत्र का उपयोग करके की जाती है

आर्थिक अनुसंधान में, संशोधित माध्य वर्ग का व्यापक रूप से किसी विशेषता की भिन्नता के संकेतक, जैसे फैलाव और मानक विचलन की गणना में उपयोग किया जाता है।

बहुमत नियम।घात औसत के बीच निम्नलिखित संबंध है - घातांक जितना बड़ा होगा, औसत का मान उतना अधिक होगा, तालिका 5.4:

तालिका 5.4

औसत के बीच संबंध

z मान

औसत के बीच संबंध

इस संबंध को बहुमत नियम कहा जाता है।

संरचनात्मक औसत.जनसंख्या की संरचना को चिह्नित करने के लिए विशेष संकेतकों का उपयोग किया जाता है, जिन्हें संरचनात्मक औसत कहा जा सकता है। इन संकेतकों में मोड, माध्यिका, चतुर्थक और दशमलव शामिल हैं।

पहनावा।मोड (Mo) जनसंख्या इकाइयों के बीच किसी विशेषता का सबसे अधिक बार होने वाला मान है। मोड उस विशेषता का मान है जो सैद्धांतिक वितरण वक्र के अधिकतम बिंदु से मेल खाता है।

उपभोक्ता मांग का अध्ययन करते समय (व्यापक मांग वाले कपड़ों और जूतों के आकार का निर्धारण करते समय), और कीमतों को रिकॉर्ड करते समय व्यावसायिक व्यवहार में फैशन का व्यापक रूप से उपयोग किया जाता है। कुल मिलाकर कई मॉड हो सकते हैं.

असतत श्रृंखला में मोड की गणना.असतत श्रृंखला में, मोड उच्चतम आवृत्ति वाला संस्करण है। आइए एक अलग श्रृंखला में एक मोड खोजने पर विचार करें।

एक अंतराल श्रृंखला में मोड की गणना.अंतराल भिन्नता श्रृंखला में, मोड को लगभग मोडल अंतराल का केंद्रीय संस्करण माना जाता है, अर्थात। वह अंतराल जिसकी आवृत्ति (फ़्रीक्वेंसी) सबसे अधिक हो। अंतराल के भीतर, आपको उस विशेषता का मान ज्ञात करना होगा जो कि मोड है। अंतराल श्रृंखला के लिए, मोड सूत्र द्वारा निर्धारित किया जाएगा

मोडल अंतराल की निचली सीमा कहाँ है; - मोडल अंतराल का मान; - मोडल अंतराल के अनुरूप आवृत्ति; - मोडल अंतराल से पहले की आवृत्ति; - मोडल एक के बाद अंतराल की आवृत्ति।

माध्यिका।माध्यिका () रैंक श्रृंखला की मध्य इकाई की विशेषता का मान है। रैंक श्रृंखला एक श्रृंखला है जिसमें विशेषता मान आरोही या अवरोही क्रम में लिखे जाते हैं। या माध्य एक ऐसा मान है जो क्रमबद्ध भिन्नता श्रृंखला की संख्या को दो बराबर भागों में विभाजित करता है: एक भाग में भिन्न विशेषता का मान होता है जो औसत विकल्प से कम होता है, और दूसरे भाग में वह मान होता है जो अधिक होता है।

माध्यिका ज्ञात करने के लिए, पहले इसकी क्रमसूचक संख्या ज्ञात करें। ऐसा करने के लिए, यदि इकाइयों की संख्या विषम है, तो सभी आवृत्तियों के योग में एक जोड़ा जाता है और सभी को दो से विभाजित किया जाता है। इकाइयों की सम संख्या के साथ, माध्यिका को एक इकाई की विशेषता के मूल्य के रूप में पाया जाता है, जिसकी क्रम संख्या दो से विभाजित आवृत्तियों के कुल योग से निर्धारित होती है। माध्यिका की क्रम संख्या को जानकर, संचित आवृत्तियों का उपयोग करके इसका मान ज्ञात करना आसान है।

एक पृथक श्रृंखला में माध्यिका की गणना.नमूना सर्वेक्षण के अनुसार, बच्चों की संख्या के आधार पर परिवारों के वितरण पर डेटा प्राप्त किया गया, तालिका। 5.5. माध्यिका निर्धारित करने के लिए, हम पहले इसकी क्रमिक संख्या निर्धारित करते हैं

इन परिवारों में बच्चों की संख्या 2 के बराबर है, इसलिए = 2. इस प्रकार, 50% परिवारों में बच्चों की संख्या 2 से अधिक नहीं है.

- माध्यिका अंतराल से पहले संचित आवृत्ति;

एक ओर, यह एक बहुत ही सकारात्मक संपत्ति है क्योंकि इस मामले में, अध्ययन के तहत जनसंख्या की सभी इकाइयों को प्रभावित करने वाले सभी कारणों के प्रभाव को ध्यान में रखा जाता है। दूसरी ओर, स्रोत डेटा में संयोग से शामिल एक भी अवलोकन विचाराधीन जनसंख्या में अध्ययन किए जा रहे लक्षण के विकास के स्तर के विचार को महत्वपूर्ण रूप से विकृत कर सकता है (विशेषकर लघु श्रृंखला में)।

चतुर्थक और दशमांश.भिन्नता श्रृंखला में माध्यिका खोजने के अनुरूप, आप रैंक श्रृंखला की किसी भी इकाई के लिए एक विशेषता का मूल्य पा सकते हैं। तो, विशेष रूप से, आप किसी श्रृंखला को 4 बराबर भागों, 10 आदि में विभाजित करने वाली इकाइयों के लिए विशेषता का मूल्य पा सकते हैं।

चतुर्थक.वे विकल्प जो क्रमबद्ध श्रृंखला को चार बराबर भागों में विभाजित करते हैं, चतुर्थक कहलाते हैं।

इस मामले में, वे भेद करते हैं: निचला (या पहला) चतुर्थक (Q1) - रैंक श्रृंखला की एक इकाई के लिए विशेषता का मूल्य, जनसंख्या को ¼ से ¾ के अनुपात में विभाजित करता है और ऊपरी (या तीसरा) चतुर्थक ( Q3) - रैंक श्रृंखला की इकाई के लिए विशेषता का मूल्य, जनसंख्या को ¾ से ¼ के अनुपात में विभाजित करना।

- चतुर्थक अंतराल की आवृत्तियाँ (निचली और ऊपरी)

Q1 और Q3 वाले अंतराल संचित आवृत्तियों (या आवृत्तियों) द्वारा निर्धारित होते हैं।

दशमांश।चतुर्थक के अलावा, दशमलव की गणना की जाती है - विकल्प जो क्रमबद्ध श्रृंखला को 10 बराबर भागों में विभाजित करते हैं।

उन्हें डी द्वारा नामित किया गया है, पहला दशमलव डी1 श्रृंखला को 1/10 और 9/10 के अनुपात में विभाजित करता है, दूसरा डी2 - 2/10 और 8/10, आदि के अनुपात में। उनकी गणना माध्यिका और चतुर्थक जैसी ही योजना के अनुसार की जाती है।

माध्यिका, चतुर्थक और दशमलव दोनों तथाकथित क्रमिक आँकड़ों से संबंधित हैं, जिन्हें एक विकल्प के रूप में समझा जाता है जो रैंक की गई श्रृंखला में एक निश्चित क्रमिक स्थान रखता है।

​ विविधता श्रृंखला - एक श्रृंखला जिसमें तुलना की जाती है (वृद्धि या कमी की डिग्री के अनुसार) विकल्पऔर संगत आवृत्तियों

​विकल्प किसी विशेषता की व्यक्तिगत मात्रात्मक अभिव्यक्ति हैं। एक लैटिन अक्षर से संकेत मिलता है वी . "वैरिएंट" शब्द की शास्त्रीय समझ यह मानती है कि पुनरावृत्ति की संख्या को ध्यान में रखे बिना, किसी विशेषता के प्रत्येक अद्वितीय मूल्य को वेरिएंट कहा जाता है।

उदाहरण के लिए, दस रोगियों में मापे गए सिस्टोलिक रक्तचाप संकेतकों की भिन्नता श्रृंखला में:

110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

केवल 6 मान उपलब्ध हैं:

110, 120, 130, 140, 160, 170.

​फ़्रीक्वेंसी एक संख्या है जो दर्शाती है कि कोई विकल्प कितनी बार दोहराया गया है। एक लैटिन अक्षर द्वारा निरूपित पी . सभी आवृत्तियों का योग (जो, निश्चित रूप से, अध्ययन किए गए सभी की संख्या के बराबर है) को इस प्रकार दर्शाया गया है एन.

    हमारे उदाहरण में, आवृत्तियाँ निम्नलिखित मान लेंगी:
  • विकल्प 110 के लिए आवृत्ति पी = 1 (मूल्य 110 एक रोगी में होता है),
  • विकल्प 120 के लिए आवृत्ति पी = 2 (मूल्य 120 दो रोगियों में होता है),
  • विकल्प 130 के लिए आवृत्ति पी = 3 (मूल्य 130 तीन रोगियों में होता है),
  • विकल्प 140 के लिए आवृत्ति पी = 2 (मूल्य 140 दो रोगियों में होता है),
  • विकल्प 160 के लिए आवृत्ति पी = 1 (मूल्य 160 एक रोगी में होता है),
  • विकल्प 170 के लिए आवृत्ति पी = 1 (मूल्य 170 एक रोगी में होता है),

विविधता श्रृंखला के प्रकार:

  1. सरल- यह एक श्रृंखला है जिसमें प्रत्येक विकल्प केवल एक बार आता है (सभी आवृत्तियाँ 1 के बराबर हैं);
  2. निलंबित- एक श्रृंखला जिसमें एक या अधिक विकल्प एक से अधिक बार दिखाई देते हैं।

विविधता श्रृंखला का उपयोग संख्याओं की बड़ी श्रृंखलाओं का वर्णन करने के लिए किया जाता है; यह इस रूप में है कि अधिकांश चिकित्सा अध्ययनों के एकत्रित डेटा को शुरू में प्रस्तुत किया जाता है। भिन्नता श्रृंखला को चिह्नित करने के लिए, विशेष संकेतकों की गणना की जाती है, जिसमें औसत मूल्य, परिवर्तनशीलता के संकेतक (तथाकथित फैलाव), और नमूना डेटा की प्रतिनिधित्वशीलता के संकेतक शामिल हैं।

भिन्नता श्रृंखला संकेतक

1) अंकगणितीय माध्य एक सामान्य संकेतक है जो अध्ययन की जा रही विशेषता के आकार को दर्शाता है। अंकगणितीय माध्य को इस प्रकार दर्शाया जाता है एम , औसत का सबसे सामान्य प्रकार है। अंकगणित माध्य की गणना सभी अवलोकन इकाइयों के संकेतक मूल्यों के योग और अध्ययन किए गए सभी विषयों की संख्या के अनुपात के रूप में की जाती है। अंकगणितीय माध्य की गणना करने की विधि सरल और भारित भिन्नता श्रृंखला के लिए भिन्न होती है।

गणना के लिए सूत्र सरल अंकगणितीय औसत:

गणना के लिए सूत्र भारित अंकगणितीय औसत:

एम = Σ(वी * पी)/ एन

​ 2) मोड विविधता श्रृंखला का एक और औसत मूल्य है, जो सबसे अधिक बार दोहराए गए विकल्प के अनुरूप है। या, इसे दूसरे तरीके से कहें तो, यह वह विकल्प है जो उच्चतम आवृत्ति से मेल खाता है। इस रूप में घोषित किया गया एमओ . मोड की गणना केवल भारित श्रृंखला के लिए की जाती है, क्योंकि in सरल पंक्तियाँकोई भी विकल्प दोहराया नहीं गया है और सभी आवृत्तियाँ एक के बराबर हैं।

उदाहरण के लिए, हृदय गति मानों की भिन्नता श्रृंखला में:

80, 84, 84, 86, 86, 86, 90, 94;

मोड मान 86 है, चूँकि यह विकल्प 3 बार आता है, इसलिए इसकी आवृत्ति उच्चतम है।

3) माध्यिका - भिन्नता श्रृंखला को आधे में विभाजित करने वाले विकल्प का मान: इसके दोनों तरफ समान संख्या में विकल्प होते हैं। माध्यिका, अंकगणितीय माध्य और बहुलक की तरह, औसत मूल्यों को संदर्भित करती है। इस रूप में घोषित किया गया मुझे

4) मानक विचलन (समानार्थी शब्द: मानक विचलन, सिग्मा विचलन, सिग्मा) - भिन्नता श्रृंखला की परिवर्तनशीलता का एक माप। यह एक अभिन्न संकेतक है जो औसत से विचलन के सभी मामलों को जोड़ता है। वास्तव में, यह इस प्रश्न का उत्तर देता है: अंकगणितीय माध्य से भिन्नताएँ कितनी दूर तक और कितनी बार फैलती हैं। एक यूनानी अक्षर द्वारा निरूपित σ ("सिग्मा").

यदि जनसंख्या का आकार 30 इकाइयों से अधिक है, तो मानक विचलन की गणना निम्न सूत्र का उपयोग करके की जाती है:

छोटी आबादी के लिए - 30 अवलोकन इकाइयाँ या उससे कम - मानक विचलन की गणना एक अलग सूत्र का उपयोग करके की जाती है:

विविधता श्रृंखला: परिभाषा, प्रकार, मुख्य विशेषताएं। गणना विधि
चिकित्सा और सांख्यिकीय अनुसंधान में मोड, माध्यिका, अंकगणितीय माध्य
(सशर्त उदाहरण के साथ दिखाएँ)।

भिन्नता श्रृंखला अध्ययन की जा रही विशेषता के संख्यात्मक मूल्यों की एक श्रृंखला है, जो परिमाण में एक दूसरे से भिन्न होती है और एक निश्चित क्रम में (आरोही या अवरोही क्रम में) व्यवस्थित होती है। किसी श्रृंखला के प्रत्येक संख्यात्मक मान को एक प्रकार (V) कहा जाता है, और किसी दिए गए श्रृंखला में एक विशेष प्रकार कितनी बार होता है, यह दर्शाने वाली संख्याओं को आवृत्ति (p) कहा जाता है।

भिन्नता श्रृंखला बनाने वाले अवलोकन मामलों की कुल संख्या को अक्षर n द्वारा दर्शाया गया है। अध्ययन किये जा रहे लक्षणों के अर्थ में अंतर को भिन्नता कहा जाता है। यदि किसी भिन्न विशेषता में कोई मात्रात्मक माप नहीं है, तो भिन्नता को गुणात्मक कहा जाता है, और वितरण श्रृंखला को गुणात्मक कहा जाता है (उदाहरण के लिए, रोग परिणाम, स्वास्थ्य स्थिति आदि द्वारा वितरण)।

यदि किसी भिन्न विशेषता की मात्रात्मक अभिव्यक्ति होती है, तो ऐसी भिन्नता को मात्रात्मक कहा जाता है, और वितरण श्रृंखला को परिवर्तनशील कहा जाता है।

भिन्नता श्रृंखला को मात्रात्मक विशेषता की प्रकृति के आधार पर असंतत और निरंतर में विभाजित किया गया है; सरल और भारित - प्रकार की घटना की आवृत्ति के आधार पर।

एक साधारण विविधता श्रृंखला में, प्रत्येक विकल्प केवल एक बार (p=1) आता है, एक भारित श्रृंखला में, एक ही विकल्प कई बार आता है (p>1)। ऐसी श्रृंखला के उदाहरणों पर पाठ में आगे चर्चा की जाएगी। यदि मात्रात्मक विशेषता निरंतर है, अर्थात। पूर्णांक राशियों के बीच मध्यवर्ती भिन्नात्मक मात्राएँ होती हैं; भिन्नता श्रृंखला को सतत कहा जाता है।

उदाहरण के लिए: 10.0 - 11.9

14.0 - 15.9, आदि।

यदि मात्रात्मक विशेषता असंतत है, अर्थात इसके व्यक्तिगत मान (वेरिएंट) एक पूर्णांक द्वारा एक दूसरे से भिन्न होते हैं और मध्यवर्ती भिन्नात्मक मान नहीं होते हैं; भिन्नता श्रृंखला को असंतत या असतत कहा जाता है।

पिछले उदाहरण से हृदय गति डेटा का उपयोग करना

21 छात्रों के लिए, हम एक विविधता श्रृंखला (तालिका 1) बनाएंगे।

तालिका नंबर एक

हृदय गति द्वारा मेडिकल छात्रों का वितरण (बीपीएम)

इस प्रकार, विविधता श्रृंखला का निर्माण करने का अर्थ है उपलब्ध संख्यात्मक मान(विकल्प) व्यवस्थित करें, व्यवस्थित करें, अर्थात। उन्हें उनकी संगत आवृत्तियों के साथ एक निश्चित क्रम में (आरोही या अवरोही क्रम में) व्यवस्थित करें। विचाराधीन उदाहरण में, विकल्पों को आरोही क्रम में व्यवस्थित किया गया है और पूर्णांक असंतत (अलग) संख्याओं के रूप में व्यक्त किया गया है, प्रत्येक विकल्प कई बार आता है, अर्थात। हम एक भारित, असंतत या असतत भिन्नता श्रृंखला के साथ काम कर रहे हैं।

एक नियम के रूप में, यदि हम जिस सांख्यिकीय जनसंख्या का अध्ययन कर रहे हैं उसमें अवलोकनों की संख्या 30 से अधिक नहीं है, तो अध्ययन की जा रही विशेषता के सभी मूल्यों को आरोही भिन्नता श्रृंखला में व्यवस्थित करना पर्याप्त है, जैसा कि तालिका में है। 1, या अवरोही क्रम।

बड़ी संख्या में अवलोकनों (एन>30) के साथ, घटित होने वाले वेरिएंट की संख्या बहुत बड़ी हो सकती है; इस मामले में, एक अंतराल या समूहीकृत भिन्नता श्रृंखला संकलित की जाती है, जिसमें बाद के प्रसंस्करण को सरल बनाने और वितरण की प्रकृति को स्पष्ट करने के लिए, वेरिएंट को समूहों में संयोजित किया गया है।

आमतौर पर समूह विकल्पों की संख्या 8 से 15 तक होती है।

उनमें से कम से कम 5 होने चाहिए, क्योंकि... अन्यथा यह बहुत अधिक कठोर, अत्यधिक इज़ाफ़ा होगा, जो भिन्नता की समग्र तस्वीर को विकृत कर देगा और औसत मूल्यों की सटीकता को बहुत प्रभावित करेगा। जब समूह वेरिएंट की संख्या 20-25 से अधिक होती है, तो औसत मूल्यों की गणना की सटीकता बढ़ जाती है, लेकिन विशेषता की भिन्नता की विशेषताएं काफी विकृत हो जाती हैं और गणितीय प्रसंस्करण अधिक जटिल हो जाता है।

समूहीकृत शृंखला संकलित करते समय इसे ध्यान में रखना आवश्यक है

- विकल्प समूहों को एक निश्चित क्रम (आरोही या अवरोही) में व्यवस्थित किया जाना चाहिए;

- विकल्प समूहों में अंतराल समान होना चाहिए;

− अंतराल सीमाओं के मान मेल नहीं खाने चाहिए, क्योंकि यह स्पष्ट नहीं होगा कि अलग-अलग वेरिएंट को किन समूहों में वर्गीकृत किया जाए;

- अंतराल सीमा निर्धारित करते समय एकत्रित सामग्री की गुणात्मक विशेषताओं को ध्यान में रखना आवश्यक है (उदाहरण के लिए, वयस्कों के वजन का अध्ययन करते समय, 3-4 किलोग्राम का अंतराल स्वीकार्य है, और जीवन के पहले महीनों में बच्चों के लिए यह 100 ग्राम से अधिक नहीं होना चाहिए)

आइए परीक्षा से पहले 55 मेडिकल छात्रों के लिए पल्स रेट (बीट्स प्रति मिनट) पर डेटा को दर्शाने वाली एक समूहीकृत (अंतराल) श्रृंखला बनाएं: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

एक समूहीकृत श्रृंखला बनाने के लिए आपको चाहिए:

1. अंतराल का आकार निर्धारित करें;

2. विविधता श्रृंखला के समूहों के मध्य, आरंभ और अंत का निर्धारण करें।

● अंतराल (i) का आकार अनुमानित समूहों (r) की संख्या से निर्धारित होता है, जिसकी संख्या एक विशेष तालिका के अनुसार अवलोकनों (n) की संख्या के आधार पर निर्धारित की जाती है।

अवलोकनों की संख्या के आधार पर समूहों की संख्या:

हमारे मामले में, 55 छात्रों के लिए, आप 8 से 10 समूह बना सकते हैं।

अंतराल (i) का मान निम्नलिखित सूत्र द्वारा निर्धारित किया जाता है -

मैं = वी अधिकतम-वी मिनट/आर

हमारे उदाहरण में, अंतराल का मान 82-58/8=3 है।

यदि अंतराल मान है एक भिन्नात्मक संख्या, परिणाम को पूर्ण संख्या में पूर्णांकित किया जाना चाहिए।

औसत कई प्रकार के होते हैं:

● अंकगणित माध्य,

● ज्यामितीय माध्य,

● हार्मोनिक माध्य,

● मूल माध्य वर्ग,

● औसत प्रगतिशील,

● माध्यिका

में चिकित्सा आँकड़ेअंकगणितीय औसत का सबसे अधिक उपयोग किया जाता है।

अंकगणित माध्य (एम) एक सामान्यीकरण मूल्य है जो यह निर्धारित करता है कि संपूर्ण जनसंख्या के लिए क्या विशिष्ट है। एम की गणना के लिए मुख्य विधियाँ हैं: अंकगणितीय माध्य विधि और क्षणों की विधि (सशर्त विचलन)।

अंकगणितीय माध्य विधि का उपयोग सरल अंकगणितीय माध्य और भारित अंकगणितीय माध्य की गणना के लिए किया जाता है। अंकगणितीय माध्य की गणना के लिए विधि का चुनाव भिन्नता श्रृंखला के प्रकार पर निर्भर करता है। एक साधारण भिन्नता श्रृंखला के मामले में, जिसमें प्रत्येक विकल्प केवल एक बार होता है, अंकगणितीय माध्य सरल सूत्र द्वारा निर्धारित किया जाता है:

कहां: एम - अंकगणितीय माध्य मान;

वी - अलग-अलग विशेषता (वेरिएंट) का मूल्य;

Σ - क्रिया को इंगित करता है - योग;

n - अवलोकनों की कुल संख्या।

सरल अंकगणितीय औसत की गणना का एक उदाहरण. 35 वर्ष की आयु के 9 पुरुषों में श्वसन दर (प्रति मिनट सांस लेने की संख्या): 20, 22, 19, 15, 16, 21, 17, 23, 18।

35 वर्ष की आयु के पुरुषों में श्वसन दर का औसत स्तर निर्धारित करने के लिए, यह आवश्यक है:

1. सभी विकल्पों को आरोही या अवरोही क्रम में व्यवस्थित करते हुए एक विविधता श्रृंखला बनाएं। हमने एक सरल विविधता श्रृंखला प्राप्त की है, क्योंकि विकल्प मान केवल एक बार आते हैं।

एम = ∑V/n = 171/9 = 19 सांस प्रति मिनट

निष्कर्ष। 35 वर्ष की आयु वाले पुरुषों में श्वसन दर औसतन 19 होती है साँस लेने की गतिविधियाँएक मिनट में।

यदि किसी वैरिएंट के अलग-अलग मानों को दोहराया जाता है, तो प्रत्येक वैरिएंट को एक पंक्ति में लिखने की कोई आवश्यकता नहीं है; यह वैरिएंट (V) के घटित होने वाले आकारों को सूचीबद्ध करने के लिए पर्याप्त है और इसके आगे उनकी पुनरावृत्ति की संख्या को इंगित करता है (p) ). ऐसी भिन्नता श्रृंखला, जिसमें विकल्पों को उनके अनुरूप आवृत्तियों की संख्या के आधार पर तौला जाता है, भारित भिन्नता श्रृंखला कहलाती है, और परिकलित औसत मान भारित अंकगणितीय माध्य होता है।

भारित अंकगणितीय माध्य सूत्र द्वारा निर्धारित किया जाता है: M= ∑Vp/n

जहाँ n प्रेक्षणों की संख्या है, योग के बराबरआवृत्तियाँ - Σr.

अंकगणितीय भारित औसत की गणना का एक उदाहरण.

चालू वर्ष की पहली तिमाही के दौरान स्थानीय डॉक्टर द्वारा इलाज किए गए तीव्र श्वसन रोग (एआरआई) वाले 35 रोगियों में विकलांगता की अवधि (दिनों में) थी: 6, 7, 5, 3, 9, 8, 7, 5, 6 , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 दिन ।

तीव्र श्वसन संक्रमण वाले रोगियों में विकलांगता की औसत अवधि निर्धारित करने की विधि इस प्रकार है:

1. आइए एक भारित भिन्नता श्रृंखला का निर्माण करें, क्योंकि विकल्प के व्यक्तिगत मान कई बार दोहराए जाते हैं। ऐसा करने के लिए, आप सभी विकल्पों को उनकी संगत आवृत्तियों के साथ आरोही या अवरोही क्रम में व्यवस्थित कर सकते हैं।

हमारे मामले में, विकल्प आरोही क्रम में व्यवस्थित हैं

2. सूत्र का उपयोग करके अंकगणितीय भारित औसत की गणना करें: एम = ∑Vp/n = 233/35 = 6.7 दिन

विकलांगता की अवधि के अनुसार तीव्र श्वसन संक्रमण वाले रोगियों का वितरण:

विकलांगता की अवधि (V) रोगियों की संख्या (पी) वीपी
∑p = n = 35 ∑Vp = 233

निष्कर्ष। तीव्र श्वसन रोगों वाले रोगियों में विकलांगता की अवधि औसतन 6.7 दिन थी।

विविधता श्रृंखला में मोड (मो) सबसे आम विकल्प है। तालिका में प्रस्तुत वितरण के लिए, मोड 10 के बराबर विकल्प से मेल खाता है; यह दूसरों की तुलना में अधिक बार होता है - 6 बार।

अस्पताल के बिस्तर पर रहने की अवधि के अनुसार रोगियों का वितरण (दिनों में)

वी
पी

कभी-कभी किसी मोड का सटीक परिमाण निर्धारित करना मुश्किल होता है क्योंकि अध्ययन किए जा रहे डेटा में कई "सबसे सामान्य" अवलोकन हो सकते हैं।

माध्यिका (मी) एक गैर-पैरामीट्रिक संकेतक है जो भिन्नता श्रृंखला को दो बराबर हिस्सों में विभाजित करता है: माध्यिका के दोनों किनारों पर समान संख्या में वेरिएंट स्थित होते हैं।

उदाहरण के लिए, तालिका में दिखाए गए वितरण के लिए, माध्यिका 10 है, क्योंकि इस मान के दोनों ओर 14 विकल्प हैं, अर्थात्। 10वें नंबर पर काबिज हैं केंद्रीय स्थितिइस श्रृंखला में इसका माध्यिका है।

यह देखते हुए कि इस उदाहरण में प्रेक्षणों की संख्या सम (n=34) है, माध्यिका को निम्नानुसार निर्धारित किया जा सकता है:

मी = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

इसका मतलब यह है कि श्रृंखला का मध्य सत्रहवें विकल्प पर पड़ता है, जो 10 के बराबर माध्यिका से मेल खाता है। तालिका में प्रस्तुत वितरण के लिए, अंकगणितीय माध्य इसके बराबर है:

एम = ∑Vp/n = 334/34 = 10.1

तो, तालिका से 34 अवलोकनों के लिए। 8, हमें मिला: Mo=10, Me=10, अंकगणितीय माध्य (M) 10.1 है। हमारे उदाहरण में, तीनों संकेतक एक-दूसरे के बराबर या करीब निकले, हालांकि वे पूरी तरह से अलग हैं।

अंकगणितीय माध्य सभी प्रभावों का परिणामी योग है; बिना किसी अपवाद के सभी विकल्प, चरम विकल्पों सहित, जो अक्सर किसी दिए गए घटना या आबादी के लिए असामान्य होते हैं, इसके गठन में भाग लेते हैं।

अंकगणित माध्य के विपरीत, मोड और माध्यिका, अलग-अलग विशेषता के सभी व्यक्तिगत मूल्यों (चरम वेरिएंट के मूल्य और श्रृंखला के फैलाव की डिग्री) के मूल्य पर निर्भर नहीं करते हैं। अंकगणित माध्य अवलोकनों के संपूर्ण द्रव्यमान की विशेषता बताता है, मोड और माध्य बड़े पैमाने की विशेषता बताते हैं

सांख्यिकीय विश्लेषण में एक विशेष स्थान अध्ययन की जा रही विशेषता या घटना के औसत स्तर के निर्धारण का है। किसी गुण का औसत स्तर औसत मानों द्वारा मापा जाता है।

औसत मूल्य अध्ययन की जा रही विशेषता के सामान्य मात्रात्मक स्तर को दर्शाता है और सांख्यिकीय आबादी की एक समूह संपत्ति है। यह समतल करता है, एक दिशा या किसी अन्य में व्यक्तिगत अवलोकनों के यादृच्छिक विचलन को कमजोर करता है और अध्ययन की जा रही विशेषता की मुख्य, विशिष्ट संपत्ति को उजागर करता है।

औसत का व्यापक रूप से उपयोग किया जाता है:

1. जनसंख्या की स्वास्थ्य स्थिति का आकलन करने के लिए: शारीरिक विकास की विशेषताएं (ऊंचाई, वजन, परिधि छातीआदि), व्यापकता और अवधि की पहचान करना विभिन्न रोग, विश्लेषण जनसांख्यिकीय संकेतक(प्राकृतिक जनसंख्या आंदोलन, औसत जीवन प्रत्याशा, जनसंख्या प्रजनन, औसत जनसंख्या आकार, आदि)।

2. चिकित्सा संस्थानों की गतिविधियों का अध्ययन करना, चिकित्सा कर्मिऔर उनके काम की गुणवत्ता का आकलन करना, योजना बनाना और जनसंख्या की जरूरतों का निर्धारण करना विभिन्न प्रकार के चिकित्सा देखभाल(प्रति वर्ष प्रति निवासी अनुरोधों या यात्राओं की औसत संख्या, औसत अवधिरोगी का अस्पताल में रहना, औसत अवधिरोगी की जांच, डॉक्टरों, बिस्तरों आदि की औसत उपलब्धता)।

3. स्वच्छता और महामारी विज्ञान की स्थिति (कार्यशाला में औसत वायु धूल सामग्री, प्रति व्यक्ति औसत क्षेत्र, प्रोटीन, वसा और कार्बोहाइड्रेट की औसत खपत, आदि) को चिह्नित करने के लिए।

4. प्रयोगशाला डेटा संसाधित करते समय, परिणामों की विश्वसनीयता स्थापित करने के लिए, सामान्य और रोग संबंधी स्थितियों में चिकित्सा और शारीरिक संकेतक निर्धारित करना नमूना सर्वेक्षणसामाजिक और स्वच्छ, नैदानिक, प्रायोगिक अध्ययन में।

औसत मूल्यों की गणना भिन्नता श्रृंखला के आधार पर की जाती है। विविधता शृंखलाएक गुणात्मक रूप से सजातीय सांख्यिकीय सेट है, जिसकी व्यक्तिगत इकाइयाँ अध्ययन की जा रही विशेषता या घटना के मात्रात्मक अंतर को दर्शाती हैं।

मात्रात्मक भिन्नता दो प्रकार की हो सकती है: असंतत (अलग) और निरंतर।

एक असंतत (असतत) विशेषता को केवल एक पूर्णांक के रूप में व्यक्त किया जाता है और इसमें कोई मध्यवर्ती मान नहीं हो सकता है (उदाहरण के लिए, विज़िट की संख्या, साइट की जनसंख्या, परिवार में बच्चों की संख्या, बीमारी की गंभीरता अंकों में) , वगैरह।)।

एक निरंतर विशेषता कुछ सीमाओं के भीतर किसी भी मान को ले सकती है, जिसमें भिन्नात्मक भी शामिल है, और केवल लगभग व्यक्त किया जाता है (उदाहरण के लिए, वजन - वयस्कों के लिए यह किलोग्राम तक सीमित हो सकता है, और नवजात शिशुओं के लिए - ग्राम; ऊंचाई, धमनी दबाव, रोगी को देखने में बिताया गया समय, आदि)।



भिन्नता श्रृंखला में शामिल प्रत्येक व्यक्तिगत विशेषता या घटना के डिजिटल मूल्य को एक प्रकार कहा जाता है और इसे अक्षर द्वारा निर्दिष्ट किया जाता है वी . उदाहरण के लिए, गणितीय साहित्य में अन्य संकेतन भी पाए जाते हैं एक्स या वाई

एक विविधता श्रृंखला, जहां प्रत्येक विकल्प को एक बार इंगित किया जाता है, सरल कहलाती है।ऐसी श्रृंखलाओं का उपयोग कंप्यूटर डेटा प्रोसेसिंग के मामले में अधिकांश सांख्यिकीय समस्याओं में किया जाता है।

जैसे-जैसे अवलोकनों की संख्या बढ़ती है, भिन्न-भिन्न मानों की पुनरावृत्ति होने लगती है। इस मामले में, यह बनाया गया है समूहीकृत विविधता श्रृंखला, जहां दोहराव की संख्या इंगित की जाती है (आवृत्ति, अक्षर द्वारा निरूपित) आर »).

रैंक भिन्नता श्रृंखलाइसमें आरोही या अवरोही क्रम में व्यवस्थित विकल्प शामिल हैं। सरल और समूहीकृत दोनों श्रृंखलाओं को रैंकिंग के साथ संकलित किया जा सकता है।

अंतराल भिन्नता श्रृंखलाबहुत बड़ी संख्या में अवलोकन इकाइयों (1000 से अधिक) के साथ, कंप्यूटर के उपयोग के बिना की जाने वाली बाद की गणनाओं को सरल बनाने के लिए संकलित किया गया।

निरंतर परिवर्तन श्रृंखलाइसमें विकल्प मान शामिल हैं, जो कोई भी मान हो सकते हैं।

यदि किसी भिन्नता श्रृंखला में किसी विशेषता (वेरिएंट) के मान अलग-अलग विशिष्ट संख्याओं के रूप में दिए गए हों, तो ऐसी श्रृंखला कहलाती है अलग.

सामान्य विशेषताएँभिन्नता श्रृंखला में परिलक्षित विशेषता के मान औसत मान हैं। उनमें से, सबसे अधिक उपयोग किया जाता है: अंकगणितीय माध्य एम,पहनावा एमओऔर मध्यिका मुझे।इनमें से प्रत्येक विशेषता अद्वितीय है। वे एक-दूसरे की जगह नहीं ले सकते हैं और केवल एक साथ मिलकर वे भिन्नता श्रृंखला की विशेषताओं को पूरी तरह से और संक्षिप्त रूप में प्रस्तुत करते हैं।

पहनावा (मो) सबसे अधिक बार आने वाले विकल्पों का मान बताएं।

मंझला (मुझे) - यह क्रमबद्ध भिन्नता श्रृंखला को आधे में विभाजित करने वाले विकल्प का मूल्य है (माध्यिका के प्रत्येक पक्ष पर विकल्प का आधा हिस्सा होता है)। दुर्लभ मामलों में, जब एक सममित भिन्नता श्रृंखला होती है, तो मोड और माध्य एक दूसरे के बराबर होते हैं और अंकगणित माध्य के मूल्य के साथ मेल खाते हैं।

अधिकांश विशिष्ट विशेषतामूल्य विकल्प है अंकगणित औसतकीमत( एम ). गणितीय साहित्य में इसे दर्शाया गया है .

अंकगणित औसत (एम, ) अध्ययन की जा रही घटना की एक निश्चित विशेषता की एक सामान्य मात्रात्मक विशेषता है, जो गुणात्मक रूप से सजातीय सांख्यिकीय आबादी का गठन करती है। सरल और भारित अंकगणितीय औसत हैं। सरल अंकगणितीय माध्य की गणना एक साधारण भिन्नता श्रृंखला के लिए सभी विकल्पों का योग करके और इस योग को विभाजित करके की जाती है कुलइस विविधता श्रृंखला में विकल्प शामिल है। गणना सूत्र के अनुसार की जाती है:

,

कहाँ: एम - सरल अंकगणित माध्य;

Σ वी - राशि विकल्प;

एन- अवलोकनों की संख्या.

समूहीकृत भिन्नता श्रृंखला में, भारित अंकगणितीय माध्य निर्धारित किया जाता है। इसकी गणना का सूत्र:

,

कहाँ: एम - अंकगणितीय भारित औसत;

Σ वीपी - उनकी आवृत्तियों द्वारा वेरिएंट के उत्पादों का योग;

एन- अवलोकनों की संख्या.

बड़ी संख्या में अवलोकनों के साथ, मैन्युअल गणना के मामले में, क्षणों की विधि का उपयोग किया जा सकता है।

अंकगणित माध्य में निम्नलिखित गुण होते हैं:

· औसत से विचलन का योग ( Σ डी ) शून्य के बराबर है (तालिका 15 देखें);

· जब सभी विकल्पों को एक ही गुणनखंड (भाजक) से गुणा (विभाजित) किया जाता है, तो अंकगणितीय माध्य को उसी गुणनखंड (भाजक) से गुणा (विभाजित) किया जाता है;

· यदि आप सभी विकल्पों में समान संख्या जोड़ते (घटाते) हैं, तो अंकगणितीय माध्य उसी संख्या से बढ़ता (घटता) है।

जिस श्रृंखला से उनकी गणना की जाती है, उसकी परिवर्तनशीलता को ध्यान में रखे बिना, अंकगणितीय औसत, भिन्नता श्रृंखला के गुणों को पूरी तरह से प्रतिबिंबित नहीं कर सकते हैं, खासकर जब अन्य औसतों के साथ तुलना आवश्यक हो। मूल्य के करीब औसत श्रृंखला से प्राप्त किया जा सकता है बदलती डिग्रीबिखराव. व्यक्तिगत विकल्प अपनी मात्रात्मक विशेषताओं के संदर्भ में एक-दूसरे के जितने करीब होंगे, उतना ही कम होगा फैलाव (दोलन, परिवर्तनशीलता)श्रृंखला, इसका औसत जितना अधिक विशिष्ट होगा।

मुख्य पैरामीटर जो हमें किसी विशेषता की परिवर्तनशीलता का आकलन करने की अनुमति देते हैं:

· दायरा;

· आयाम;

· मानक विचलन;

· भिन्नता का गुणांक.

किसी विशेषता की परिवर्तनशीलता का अनुमान भिन्नता श्रृंखला की सीमा और आयाम से लगाया जा सकता है। सीमा श्रृंखला में अधिकतम (वी अधिकतम) और न्यूनतम (वी मिनट) विकल्पों को इंगित करती है। आयाम (A m) इन विकल्पों के बीच का अंतर है: A m = V अधिकतम - V मिनट।

भिन्नता श्रृंखला की परिवर्तनशीलता का मुख्य, आम तौर पर स्वीकृत माप है फैलाव (डी ). लेकिन सबसे अधिक इस्तेमाल किया जाने वाला फैलाव के आधार पर गणना किया जाने वाला एक अधिक सुविधाजनक पैरामीटर है - मानक विचलन ( σ ). यह विचलन के परिमाण को ध्यान में रखता है ( डी ) प्रत्येक भिन्नता श्रृंखला का उसके अंकगणितीय माध्य से ( डी=वी - एम ).

चूँकि औसत से विचलन सकारात्मक और नकारात्मक हो सकते हैं, जब योग किया जाता है तो वे मान "0" (एस) देते हैं घ=0). इससे बचने के लिए, विचलन मान ( डी) को दूसरी घात तक बढ़ाया जाता है और औसत किया जाता है। इस प्रकार, एक भिन्नता श्रृंखला का फैलाव अंकगणितीय माध्य से एक प्रकार के विचलन का माध्य वर्ग है और सूत्र द्वारा गणना की जाती है:

.

वह होती है सबसे महत्वपूर्ण विशेषतापरिवर्तनशीलता और कई सांख्यिकीय परीक्षणों की गणना के लिए उपयोग किया जाता है।

चूंकि फैलाव को विचलन के वर्ग के रूप में व्यक्त किया जाता है, इसलिए इसका मान अंकगणितीय माध्य के साथ तुलना में उपयोग नहीं किया जा सकता है। इन उद्देश्यों के लिए इसका उपयोग किया जाता है मानक विचलन, जिसे "सिग्मा" चिह्न द्वारा निर्दिष्ट किया जाता है ( σ ). यह अंकगणितीय माध्य मान से भिन्नता श्रृंखला के सभी प्रकारों के औसत विचलन को औसत मान के समान इकाइयों में दर्शाता है, ताकि उनका एक साथ उपयोग किया जा सके।

मानक विचलन सूत्र द्वारा निर्धारित किया जाता है:

निर्दिष्ट सूत्र तब लागू किया जाता है जब प्रेक्षणों की संख्या ( एन ) 30 से अधिक। कम संख्या के साथ एन मानक विचलन मान में गणितीय ऑफसेट से जुड़ी एक त्रुटि होगी ( एन - 1). इस संबंध में, मानक विचलन की गणना के सूत्र में इस तरह के पूर्वाग्रह को ध्यान में रखकर अधिक सटीक परिणाम प्राप्त किया जा सकता है:

मानक विचलन (एस ) एक यादृच्छिक चर के मानक विचलन का एक अनुमान है एक्सउसके संबंध में गणितीय अपेक्षाइसके विचरण के निष्पक्ष अनुमान के आधार पर।

मूल्यों के साथ एन > 30 मानक विचलन ( σ ) और मानक विचलन ( एस ) एक ही हो जाएगा ( σ =एस ). इसलिए, अधिकांश व्यावहारिक मैनुअल में इन मानदंडों के अलग-अलग अर्थ माने जाते हैं।में एक्सेल प्रोग्राममानक विचलन की गणना फ़ंक्शन =STDEV(रेंज) के साथ की जा सकती है। और मानक विचलन की गणना करने के लिए, आपको एक उपयुक्त सूत्र बनाने की आवश्यकता है।

माध्य वर्ग या मानक विचलन आपको यह निर्धारित करने की अनुमति देता है कि किसी विशेषता का मान औसत मान से कितना भिन्न हो सकता है। मान लीजिए कि गर्मियों में समान औसत दैनिक तापमान वाले दो शहर हैं। इनमें से एक शहर तट पर और दूसरा महाद्वीप पर स्थित है। यह ज्ञात है कि तट पर स्थित शहरों में दिन के तापमान में अंतर अंतर्देशीय शहरों की तुलना में कम होता है। इसलिए, तटीय शहर के लिए दिन के तापमान का मानक विचलन दूसरे शहर की तुलना में कम होगा। व्यवहार में, इसका मतलब है कि प्रत्येक का औसत वायु तापमान विशिष्ट दिनमहाद्वीप पर स्थित एक शहर में, तट पर स्थित एक शहर की तुलना में औसत से अधिक भिन्न होगा। इसके अलावा, मानक विचलन आपको संभाव्यता के आवश्यक स्तर के साथ औसत से संभावित तापमान विचलन का मूल्यांकन करने की अनुमति देता है।

संभाव्यता सिद्धांत के अनुसार, सामान्य वितरण कानून का पालन करने वाली घटनाओं में, अंकगणित माध्य, मानक विचलन और विकल्पों के मूल्यों के बीच एक सख्त संबंध होता है ( तीन सिग्मा नियम). उदाहरण के लिए, किसी भिन्न विशेषता के 68.3% मान M ± 1 के भीतर हैं σ , 95.5% - एम ± 2 के भीतर σ और 99.7% - एम ± 3 के भीतर σ .

मानक विचलन का मूल्य हमें भिन्नता श्रृंखला और अध्ययन समूह की एकरूपता की प्रकृति का न्याय करने की अनुमति देता है। यदि मानक विचलन का मान छोटा है, तो यह अध्ययन की जा रही घटना की काफी उच्च एकरूपता को इंगित करता है। इस मामले में अंकगणितीय माध्य को किसी दी गई भिन्नता श्रृंखला के लिए काफी विशिष्ट माना जाना चाहिए। हालाँकि, बहुत छोटा सिग्मा मान किसी को अवलोकनों के कृत्रिम चयन के बारे में सोचने पर मजबूर करता है। बहुत बड़े सिग्मा के साथ, अंकगणित माध्य कुछ हद तक भिन्नता श्रृंखला की विशेषता बताता है, जो अध्ययन की जा रही विशेषता या घटना की महत्वपूर्ण परिवर्तनशीलता या अध्ययन के तहत समूह की विविधता को इंगित करता है। हालाँकि, मानक विचलन के मान की तुलना केवल समान आयाम की विशेषताओं के लिए ही संभव है। वास्तव में, यदि हम नवजात बच्चों और वयस्कों के वजन की विविधता की तुलना करते हैं, तो हमें वयस्कों में हमेशा उच्च सिग्मा मान मिलेंगे।

विभिन्न आयामों की विशेषताओं की परिवर्तनशीलता की तुलना का उपयोग करके किया जा सकता है गुणांक का परिवर्तन. यह विविधता को माध्य के प्रतिशत के रूप में व्यक्त करता है, जिससे विभिन्न लक्षणों के बीच तुलना की अनुमति मिलती है। चिकित्सा साहित्य में भिन्नता के गुणांक को "चिह्न" द्वारा दर्शाया गया है साथ ", और गणितीय में" वी"और सूत्र द्वारा गणना की गई:

.

10% से कम भिन्नता के गुणांक के मान छोटे बिखरने का संकेत देते हैं, 10 से 20% तक - औसत के बारे में, 20% से अधिक - अंकगणित माध्य के आसपास मजबूत बिखरने के बारे में।

अंकगणितीय माध्य की गणना आमतौर पर नमूना आबादी के डेटा के आधार पर की जाती है। बार-बार अध्ययन करने पर, यादृच्छिक घटनाओं के प्रभाव में, अंकगणितीय माध्य बदल सकता है। यह इस तथ्य के कारण है कि, एक नियम के रूप में, अवलोकन की संभावित इकाइयों का केवल एक हिस्सा, यानी नमूना आबादी का अध्ययन किया जाता है। अध्ययन की जा रही घटना का प्रतिनिधित्व करने वाली सभी संभावित इकाइयों के बारे में जानकारी संपूर्ण का अध्ययन करके प्राप्त की जा सकती है जनसंख्या, जो हमेशा संभव नहीं है. साथ ही, प्रयोगात्मक डेटा को सामान्य बनाने के उद्देश्य से, सामान्य जनसंख्या में औसत का मूल्य रुचिकर है। इसलिए, अध्ययन की जा रही घटना के बारे में एक सामान्य निष्कर्ष तैयार करने के लिए, नमूना आबादी के आधार पर प्राप्त परिणामों को सांख्यिकीय तरीकों का उपयोग करके सामान्य आबादी में स्थानांतरित किया जाना चाहिए।

नमूना अध्ययन और सामान्य जनसंख्या के बीच समझौते की डिग्री निर्धारित करने के लिए, नमूना अवलोकन के दौरान अनिवार्य रूप से उत्पन्न होने वाली त्रुटि की भयावहता का अनुमान लगाना आवश्यक है। इस त्रुटि को "" कहा जाता है प्रतिनिधित्व की त्रुटि"या" अंकगणितीय माध्य की औसत त्रुटि। यह वास्तव में नमूने से प्राप्त औसत के बीच का अंतर है सांख्यिकीय अवलोकन, और समान मूल्य जो एक ही वस्तु के निरंतर अध्ययन के दौरान प्राप्त किए जाएंगे, अर्थात। सामान्य जनसंख्या का अध्ययन करते समय। चूँकि नमूना माध्य एक यादृच्छिक चर है, इसलिए ऐसा पूर्वानुमान शोधकर्ता को स्वीकार्य संभाव्यता के स्तर के साथ किया जाता है। में चिकित्सा अनुसंधानयह कम से कम 95% है।

प्रतिनिधित्व संबंधी त्रुटि को पंजीकरण त्रुटियों या ध्यान त्रुटियों (स्लिप्स, गलत अनुमान, टाइपो इत्यादि) के साथ भ्रमित नहीं किया जा सकता है, जिसे प्रयोग के दौरान उपयोग किए जाने वाले पर्याप्त तरीकों और उपकरणों द्वारा कम किया जाना चाहिए।

प्रतिनिधित्व त्रुटि का परिमाण नमूना आकार और विशेषता की परिवर्तनशीलता दोनों पर निर्भर करता है। कैसे बड़ी संख्याअवलोकन, नमूना जनसंख्या के जितना करीब होगा और त्रुटि उतनी ही कम होगी। चिह्न जितना अधिक परिवर्तनशील होगा, सांख्यिकीय त्रुटि उतनी ही अधिक होगी।

व्यवहार में, भिन्नता श्रृंखला में प्रतिनिधित्व त्रुटि निर्धारित करने के लिए, निम्नलिखित सूत्र का उपयोग किया जाता है:

,

कहाँ: एम - प्रतिनिधित्व की त्रुटि;

σ - मानक विचलन;

एन- नमूने में अवलोकनों की संख्या.

सूत्र से यह स्पष्ट है कि आकार औसत त्रुटिमानक विचलन के सीधे आनुपातिक है, अर्थात, अध्ययन की जा रही विशेषता की परिवर्तनशीलता, और अवलोकनों की संख्या के वर्गमूल के व्युत्क्रमानुपाती है।

सापेक्ष मूल्यों की गणना के आधार पर सांख्यिकीय विश्लेषण करते समय, भिन्नता श्रृंखला का निर्माण आवश्यक नहीं है। इस मामले में, सापेक्ष संकेतकों के लिए औसत त्रुटि का निर्धारण एक सरल सूत्र का उपयोग करके किया जा सकता है:

,

कहाँ: आर- सापेक्ष संकेतक का मूल्य, प्रतिशत, पीपीएम, आदि के रूप में व्यक्त किया गया;

क्यू- पी का व्युत्क्रम और (1-पी), (100-पी), (1000-पी), आदि के रूप में व्यक्त किया जाता है, यह उस आधार पर निर्भर करता है जिसके आधार पर संकेतक की गणना की जाती है;

एन- नमूना जनसंख्या में अवलोकनों की संख्या।

हालाँकि, सापेक्ष मूल्यों के लिए प्रतिनिधित्व त्रुटि की गणना के लिए निर्दिष्ट सूत्र केवल तभी लागू किया जा सकता है जब संकेतक का मूल्य उसके आधार से कम हो। गहन संकेतकों की गणना के कई मामलों में, यह शर्त पूरी नहीं होती है, और संकेतक को 100% या 1000% से अधिक की संख्या के रूप में व्यक्त किया जा सकता है। ऐसी स्थिति में, एक भिन्नता श्रृंखला का निर्माण किया जाता है और मानक विचलन के आधार पर औसत मूल्यों के सूत्र का उपयोग करके प्रतिनिधित्व त्रुटि की गणना की जाती है।

जनसंख्या में अंकगणितीय माध्य के मूल्य का पूर्वानुमान दो मूल्यों को इंगित करके किया जाता है - न्यूनतम और अधिकतम। ये चरम मूल्य संभावित विचलन, जिसके भीतर जनसंख्या के वांछित औसत मूल्य में उतार-चढ़ाव हो सकता है, कहलाते हैं सीमाओं पर भरोसा रखें».

संभाव्यता सिद्धांत के सिद्धांतों ने साबित कर दिया है कि 99.7% की संभावना के साथ एक विशेषता के सामान्य वितरण के साथ, औसत के विचलन का चरम मूल्य प्रतिनिधित्व त्रुटि के तीन गुना के मूल्य से अधिक नहीं होगा ( एम ± 3 एम ); 95.5% में - औसत मूल्य की औसत त्रुटि के दोगुने से अधिक नहीं ( एम ± 2 एम ); 68.3% में - एक से अधिक औसत त्रुटि नहीं ( एम ± 1 एम ) (चित्र 9)।

पी%

चावल। 9. सामान्य वितरण की संभाव्यता घनत्व।

ध्यान दें कि उपरोक्त कथन केवल उस सुविधा के लिए सत्य है जो सामान्य गाऊसी वितरण कानून का पालन करती है।

बहुमत प्रायोगिक अनुसंधानचिकित्सा के क्षेत्र सहित, माप से जुड़ा हुआ है, जिसके परिणाम किसी दिए गए अंतराल में लगभग कोई भी मूल्य ले सकते हैं, इसलिए, एक नियम के रूप में, उन्हें निरंतर यादृच्छिक चर के एक मॉडल द्वारा वर्णित किया जाता है। इस संबंध में, अधिकांश सांख्यिकीय विधियां निरंतर वितरण पर विचार करती हैं। इनमें से एक वितरण, जिसकी मौलिक भूमिका है गणितीय सांख्यिकी, है सामान्य, या गाऊसी, वितरण.

ऐसा कई कारणों से है.

1. सबसे पहले, कई प्रयोगात्मक अवलोकनों को सामान्य वितरण का उपयोग करके सफलतापूर्वक वर्णित किया जा सकता है। यह तुरंत ध्यान दिया जाना चाहिए कि अनुभवजन्य डेटा का कोई वितरण नहीं है जो सामान्य रूप से वितरित होने के बाद से बिल्कुल सामान्य होगा यादृच्छिक मूल्यसे की सीमा में है, जो व्यवहार में कभी नहीं होता है। हालाँकि, सामान्य वितरण अक्सर एक सन्निकटन के रूप में अच्छा काम करता है।

चाहे वजन, ऊंचाई और मानव शरीर के अन्य शारीरिक मापदंडों का माप किया जाए - हर जगह परिणाम बहुत बड़ी संख्या में यादृच्छिक कारकों से प्रभावित होते हैं ( प्राकृतिक कारणोंऔर माप त्रुटियाँ)। इसके अलावा, एक नियम के रूप में, इनमें से प्रत्येक कारक का प्रभाव महत्वहीन है। अनुभव से पता चलता है कि ऐसे मामलों में परिणाम लगभग सामान्य रूप से वितरित होंगे।

2. यादृच्छिक नमूने से जुड़े कई वितरण बाद की मात्रा बढ़ने पर सामान्य हो जाते हैं।

3. सामान्य वितरण अन्य सतत वितरणों (उदाहरण के लिए, तिरछा) के सन्निकटन के रूप में उपयुक्त है।

4. सामान्य वितरण में कई अनुकूल संख्याएँ होती हैं गणितीय गुण, जिसने बड़े पैमाने पर इसे प्रदान किया व्यापक अनुप्रयोगसांख्यिकी में.

साथ ही, यह ध्यान दिया जाना चाहिए कि चिकित्सा डेटा में कई प्रयोगात्मक वितरण हैं जिन्हें सामान्य वितरण मॉडल द्वारा वर्णित नहीं किया जा सकता है। इस उद्देश्य के लिए, सांख्यिकी ने ऐसी विधियाँ विकसित की हैं जिन्हें आमतौर पर "नॉनपैरामेट्रिक" कहा जाता है।

किसी विशेष प्रयोग से डेटा संसाधित करने के लिए उपयुक्त सांख्यिकीय पद्धति का चुनाव इस आधार पर किया जाना चाहिए कि प्राप्त डेटा सामान्य वितरण कानून से संबंधित है या नहीं। सामान्य वितरण कानून के लिए एक संकेत के अधीनता के लिए परिकल्पना का परीक्षण एक आवृत्ति वितरण हिस्टोग्राम (ग्राफ), साथ ही कई सांख्यिकीय मानदंडों का उपयोग करके किया जाता है। उनमें से:

विषमता मानदंड ( बी );

कर्टोसिस के परीक्षण के लिए मानदंड ( जी );

शापिरो-विल्क्स परीक्षण ( डब्ल्यू ) .

प्रत्येक पैरामीटर के लिए डेटा वितरण की प्रकृति का विश्लेषण (जिसे वितरण की सामान्यता के लिए परीक्षण भी कहा जाता है) किया जाता है। आत्मविश्वास से यह निर्णय लेने के लिए कि क्या किसी पैरामीटर का वितरण सामान्य कानून से मेल खाता है, पर्याप्त बड़ी संख्या में अवलोकन इकाइयों (कम से कम 30 मान) की आवश्यकता होती है।

सामान्य वितरण के लिए, तिरछापन और कर्टोसिस मानदंड 0 का मान लेते हैं। यदि वितरण को दाईं ओर स्थानांतरित किया जाता है बी > 0 (सकारात्मक विषमता), साथ में बी < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона जी =0. पर जी > 0 यदि वितरण वक्र तीव्र होता है जी < 0 пик более сглаженный, чем функция нормального распределения.

शापिरो-विल्क्स परीक्षण का उपयोग करके सामान्यता की जांच करने के लिए, आपको सांख्यिकीय तालिकाओं का उपयोग करके इस मानदंड का मान ज्ञात करना होगा आवश्यक स्तरमहत्व और अवलोकन इकाइयों की संख्या (स्वतंत्रता की डिग्री) पर निर्भर करता है। परिशिष्ट 1. सामान्यता परिकल्पना को इस मानदंड के छोटे मूल्यों पर, एक नियम के रूप में, खारिज कर दिया जाता है डब्ल्यू <0,8.



साइट पर नया

>

सबसे लोकप्रिय