घर बाल चिकित्सा दंत चिकित्सा विचरण का विश्लेषण. एक तरफ़ा एनोवा

विचरण का विश्लेषण. एक तरफ़ा एनोवा

) का उद्देश्य विशेष रूप से दो आबादी की तुलना करना है। हालाँकि, इसे अक्सर बड़ी संख्या में समूहों की जोड़ीवार तुलना के लिए गलत तरीके से उपयोग किया जाता है (चित्र 1), जो तथाकथित का कारण बनता है। एकाधिक तुलना प्रभाव(अंग्रेज़ी) एकाधिक तुलनाएँ;ग्लैंज़ 1999, पृ. 101-104). हम इस प्रभाव और इससे निपटने के तरीके के बारे में बाद में बात करेंगे। उसी पोस्ट में मैं सिद्धांतों का वर्णन करूंगा विचरण का एकतरफ़ा विश्लेषण, बस इसके लिए इरादा है एक साथदो या दो से अधिक समूहों के साधनों की तुलना करना। विचरण विश्लेषण के सिद्धांत एकविश्लेषण हेएफ वा riance, एनोवा) का विकास 1920 के दशक में किया गया था। सर रोनाल्ड आयल्मर फिशर रोनाल्ड आयल्मर फिशर) - "एक प्रतिभाशाली व्यक्ति जिसने लगभग अकेले ही आधुनिक सांख्यिकी की नींव रखी" (हल्द 1998).

सवाल उठ सकता है: तुलना के लिए इस पद्धति का उपयोग क्यों किया गया औसतमूल्यों को कहा जाता है फैलानेवालाविश्लेषण? बात यह है कि औसत मूल्यों के बीच अंतर स्थापित करते समय, हम वास्तव में विश्लेषण की गई आबादी के भिन्नताओं की तुलना कर रहे हैं। हालाँकि, सबसे पहले चीज़ें...

समस्या का विधान

नीचे दिया गया उदाहरण पुस्तक से लिया गया है मेनडोनाल्ड & ब्राउन(2010)। टमाटर के वजन (पूरे पौधे; वजन, किलो में) पर आंकड़े हैं, जो तीन अलग-अलग प्रयोगात्मक स्थितियों (टीआरटी, से) के तहत 2 महीने तक उगाए गए थे इलाज) - पानी (पानी) पर, उर्वरक (पोषक तत्व) के अतिरिक्त वातावरण में, साथ ही उर्वरक और शाकनाशी 2,4-डी (पोषक तत्व+24डी) के अतिरिक्त वातावरण में:

# डेटा के साथ एक तालिका बनाएं:टमाटर<- data.frame (weight= c (1.5 , 1.9 , 1.3 , 1.5 , 2.4 , 1.5 , # water 1.5 , 1.2 , 1.2 , 2.1 , 2.9 , 1.6 , # nutrient 1.9 , 1.6 , 0.8 , 1.15 , 0.9 , 1.6 ) , # nutrient+24D trt = rep (c ("Water" , "Nutrient" , "Nutrient+24D" ) , c (6 , 6 , 6 ) ) ) # आइये परिणाम पर नजर डालते हैं:वजन भार टीआरटी 1 1.50 पानी 2 1.90 पानी 3 1.30 पानी 4 1.50 पानी 5 2.40 पानी 6 1.50 पानी 7 1.50 पोषक तत्व 8 1.20 पोषक तत्व 9 1.20 पोषक तत्व 10 2.10 पोषक तत्व 11 2.90 पोषक तत्व 12 1.60 पोषक तत्व 13 1.9 0 पोषक तत्व+24डी 14 1.60 पोषक तत्व+24डी 15 0.80 पोषक तत्व+24डी 16 1.15 पोषक तत्व+24डी 17 0.90 पोषक तत्व+24डी 18 1.60 पोषक तत्व+24डी


चर trt तीन स्तरों वाला एक कारक है। भविष्य में प्रायोगिक स्थितियों की अधिक स्पष्ट तुलना के लिए, हम "जल" स्तर को आधार स्तर बनाएंगे। संदर्भ), यानी वह स्तर जिससे R अन्य सभी स्तरों की तुलना करेगा। यह relevel() फ़ंक्शन का उपयोग करके किया जा सकता है:


उपलब्ध डेटा के गुणों को बेहतर ढंग से समझने के लिए, आइए समूह साधनों के बीच देखे गए अंतरों का उपयोग करके इसकी कल्पना करें, जो महत्वहीन हैं और यादृच्छिक कारकों के प्रभाव के कारण होते हैं (यानी, वास्तव में, सभी प्राप्त पौधों के वजन माप एक सामान्य रूप से वितरित आबादी से आते हैं):

आइए हम एक बार फिर इस बात पर जोर दें कि विचाराधीन उदाहरण मामले से मेल खाता है एकल कारकविचरण का विश्लेषण: एक कारक के प्रभाव का अध्ययन किया जाता है - हमारे लिए रुचि के प्रतिक्रिया चर पर बढ़ती स्थितियां (तीन स्तरों के साथ - पानी, पोषक तत्व और पोषक तत्व + 24डी) - पौधे का वजन।

दुर्भाग्य से, एक शोधकर्ता को लगभग कभी भी पूरी आबादी का अध्ययन करने का अवसर नहीं मिलता है। तो फिर हमें कैसे पता चलेगा कि उपरोक्त शून्य परिकल्पना केवल नमूना डेटा के साथ सत्य है? हम इस प्रश्न को अलग ढंग से तैयार कर सकते हैं: एकल सामान्य रूप से वितरित जनसंख्या से यादृच्छिक नमूने खींचकर समूह के बीच देखे गए अंतर प्राप्त करने की संभावना क्या है? इस प्रश्न का उत्तर देने के लिए, हमें एक सांख्यिकीय मानदंड की आवश्यकता है जो तुलनात्मक समूहों के बीच अंतर के परिमाण को मात्रात्मक रूप से चित्रित करेगा।

भिन्नता का विश्लेषण, विशेषताओं के मूल्यों में अंतर (विविधता) के निर्धारण के आधार पर, यादृच्छिक रूप से चुने गए विभिन्न समूहों में कारक और प्रदर्शन विशेषताओं के बीच संबंध का आकलन करने के लिए एक सांख्यिकीय विधि है। विचरण का विश्लेषण अंकगणित माध्य से अध्ययन के तहत जनसंख्या की सभी इकाइयों के विचलन के विश्लेषण पर आधारित है। विचलन के माप के रूप में, फैलाव (बी) लिया जाता है - विचलन का औसत वर्ग। किसी कारक विशेषता (कारक) के प्रभाव से होने वाले विचलन की तुलना यादृच्छिक परिस्थितियों के कारण होने वाले विचलन के परिमाण से की जाती है। यदि किसी कारक विशेषता के कारण होने वाले विचलन यादृच्छिक विचलन से अधिक महत्वपूर्ण हैं, तो कारक का परिणामी विशेषता पर महत्वपूर्ण प्रभाव माना जाता है।

फैलाव की गणना करने के लिए, अंकगणितीय माध्य से प्रत्येक विकल्प के विचलन मान (विशेषता के प्रत्येक पंजीकृत संख्यात्मक मान) का वर्ग किया जाता है। इससे नकारात्मक संकेतों से छुटकारा मिलता है। फिर इन विचलनों (मतभेदों) को संक्षेप में प्रस्तुत किया जाता है और अवलोकनों की संख्या से विभाजित किया जाता है, अर्थात। औसत विचलन. इस प्रकार, विचरण मान प्राप्त होते हैं।

विचरण के विश्लेषण के उपयोग के लिए एक महत्वपूर्ण पद्धतिगत महत्व नमूने का सही चयन है। लक्ष्य और उद्देश्यों के आधार पर, नमूना समूहों को एक दूसरे से स्वतंत्र रूप से यादृच्छिक रूप से बनाया जा सकता है (कुछ संकेतक का अध्ययन करने के लिए नियंत्रण और प्रयोगात्मक समूह, उदाहरण के लिए, स्ट्रोक के विकास पर उच्च रक्तचाप का प्रभाव)। ऐसे नमूनों को स्वतंत्र कहा जाता है।

अक्सर, जोखिम के पहले और बाद में कारकों के संपर्क के परिणामों का अध्ययन एक ही नमूना समूह (उदाहरण के लिए, एक ही रोगी) में किया जाता है (उपचार, रोकथाम, पुनर्वास उपायों को आश्रित कहा जाता है);

विचरण का विश्लेषण, जो एक कारक के प्रभाव का परीक्षण करता है, एक-कारक विश्लेषण (यूनीवेरिएट विश्लेषण) कहलाता है। एक से अधिक कारकों के प्रभाव का अध्ययन करते समय बहुक्रियात्मक विधि का उपयोग किया जाता है। विचरण का विश्लेषण(बहुभिन्नरूपी विश्लेषण)।

कारक विशेषताएँ वे विशेषताएँ हैं जो अध्ययन की जा रही घटना को प्रभावित करती हैं।

प्रभावी विशेषताएँ वे विशेषताएँ हैं जो कारक विशेषताओं के प्रभाव में बदलती हैं।

विचरण विश्लेषण का उपयोग करने की शर्तें:

अध्ययन का उद्देश्य परिणाम पर एक (3 तक) कारकों के प्रभाव की ताकत का निर्धारण करना या विभिन्न कारकों (लिंग और आयु, शारीरिक गतिविधि और पोषण, आदि) के संयुक्त प्रभाव की ताकत का निर्धारण करना है।

अध्ययन किए जा रहे कारक एक-दूसरे से स्वतंत्र (असंबद्ध) होने चाहिए। उदाहरण के लिए, कार्य अनुभव और बच्चों की उम्र, ऊंचाई और वजन आदि के संयुक्त प्रभाव का अध्ययन करना असंभव है। जनसंख्या की रुग्णता पर.

अध्ययन के लिए समूहों का चयन यादृच्छिक रूप से (यादृच्छिक चयन) किया जाता है। विकल्पों के चयन में यादृच्छिकता के सिद्धांत के कार्यान्वयन के साथ एक फैलाव परिसर के संगठन को यादृच्छिककरण (अंग्रेजी से अनुवादित - यादृच्छिक) कहा जाता है, अर्थात। यादृच्छिक रूप से चुना गया.

मात्रात्मक और गुणात्मक (गुणात्मक) दोनों विशेषताओं का उपयोग किया जा सकता है।

विचरण का एक-तरफ़ा विश्लेषण करते समय, इसकी अनुशंसा की जाती है (उपयोग के लिए एक आवश्यक शर्त):

1. विश्लेषण किए गए समूहों के वितरण की सामान्यता या सामान्य वितरण के साथ सामान्य आबादी के लिए नमूना समूहों का पत्राचार।

2. समूहों में प्रेक्षणों के वितरण की स्वतंत्रता (संबंधितता नहीं)।

3. प्रेक्षणों की आवृत्ति (पुनरावृत्ति) की उपलब्धता।

सबसे पहले, एक अशक्त परिकल्पना तैयार की जाती है, अर्थात यह माना जाता है कि अध्ययन के तहत कारकों का परिणामी विशेषता के मूल्यों पर कोई प्रभाव नहीं पड़ता है और प्राप्त अंतर यादृच्छिक होते हैं।

फिर हम यह निर्धारित करते हैं कि देखे गए (या मजबूत) अंतर प्राप्त करने की संभावना क्या है, बशर्ते कि शून्य परिकल्पना सत्य हो।

यदि यह संभावना छोटी है, तो हम शून्य परिकल्पना को अस्वीकार करते हैं और निष्कर्ष निकालते हैं कि अध्ययन के परिणाम सांख्यिकीय रूप से महत्वपूर्ण हैं। इसका मतलब यह नहीं है कि अध्ययन किए जा रहे कारकों का प्रभाव सिद्ध हो गया है (यह सबसे पहले, अनुसंधान योजना का प्रश्न है), लेकिन यह अभी भी संभावना नहीं है कि परिणाम संयोग के कारण है।

यदि विचरण विश्लेषण लागू करने की सभी शर्तें पूरी की जाती हैं, तो कुल विचरण का अपघटन गणितीय रूप से इस तरह दिखता है:

विस्तार. = डीफैक्ट + डी बाकी.,

विस्तार. - देखे गए मानों (वैरिएंट) का कुल फैलाव, सामान्य औसत से वेरिएंट के फैलाव द्वारा विशेषता। इस भिन्नता को निर्धारित करने वाले सभी कारकों के प्रभाव में किसी विशेषता की भिन्नता को उसकी संपूर्णता में मापता है। समग्र विविधता में अंतरसमूह और अंतःसमूह विविधता शामिल है;

डीतथ्य - फैक्टोरियल (इंटरग्रुप) फैलाव, प्रत्येक समूह में साधनों के अंतर की विशेषता है और अध्ययन के तहत कारक के प्रभाव पर निर्भर करता है, जिसके द्वारा प्रत्येक समूह को विभेदित किया जाता है। उदाहरण के लिए, उन समूहों में जो निमोनिया के नैदानिक ​​​​पाठ्यक्रम के एटियोलॉजिकल कारक में भिन्न होते हैं, बिस्तर पर बिताए गए दिन का औसत स्तर समान नहीं होता है - अंतरसमूह विविधता देखी जाती है।

डी आराम. - अवशिष्ट (अंतर-समूह) विचरण, जो समूहों के भीतर संस्करण के फैलाव की विशेषता बताता है। यादृच्छिक भिन्नता को दर्शाता है, अर्थात भिन्नता का वह भाग जो अनिर्दिष्ट कारकों के प्रभाव में होता है और गुण पर निर्भर नहीं होता - वह कारक जो समूह का आधार बनता है। अध्ययन किए गए गुण की भिन्नता कुछ बेहिसाब यादृच्छिक कारकों के प्रभाव की ताकत पर निर्भर करती है, दोनों संगठित (शोधकर्ता द्वारा निर्धारित) और यादृच्छिक (अज्ञात) कारक।

इसलिए, कुल भिन्नता (विचरण) में संगठित (दिए गए) कारकों के कारण होने वाली भिन्नता शामिल होती है, जिन्हें तथ्यात्मक भिन्नता और असंगठित कारक कहा जाता है, अर्थात। अवशिष्ट भिन्नता (यादृच्छिक, अज्ञात)।

नमूना आकार n के लिए, नमूना विचरण की गणना नमूना माध्य से वर्ग विचलन के योग को n-1 (नमूना आकार शून्य से एक) से विभाजित करके की जाती है। इस प्रकार, एक निश्चित नमूना आकार n के लिए, विचरण वर्गों (विचलन) के योग का एक कार्य है, जिसे संक्षिप्तता के लिए, एसएस (अंग्रेजी योग के वर्गों से) दर्शाया गया है। निम्नलिखित में, हम अक्सर नमूना शब्द को छोड़ देते हैं, यह अच्छी तरह से जानते हुए कि हम नमूना भिन्नता या भिन्नता के अनुमान पर विचार कर रहे हैं। विचरण का विश्लेषण विचरण को भागों या घटकों में विभाजित करने पर आधारित है। निम्नलिखित डेटा सेट पर विचार करें:

दोनों समूहों के साधन काफी भिन्न हैं (क्रमशः 2 और 6)। प्रत्येक समूह के भीतर वर्ग विचलनों का योग 2 है। उन्हें जोड़ने पर, हमें 4 मिलता है। यदि हम अब समूह सदस्यता को ध्यान में रखे बिना इन गणनाओं को दोहराते हैं, अर्थात, यदि हम इन दो नमूनों के समग्र औसत के आधार पर एसएस की गणना करते हैं, तो हम 28 का मान प्राप्त करें। दूसरे शब्दों में, समूह के भीतर परिवर्तनशीलता के आधार पर विचरण (योग वर्ग) का परिणाम समग्र परिवर्तनशीलता (समग्र माध्य के सापेक्ष) के आधार पर गणना की गई तुलना में बहुत कम होता है। इसका कारण स्पष्ट रूप से साधनों के बीच एक महत्वपूर्ण अंतर है, और साधनों के बीच यह अंतर वर्गों के योग के बीच मौजूदा अंतर को स्पष्ट करता है।

एसएस एस.टी.एस.टी. एमएस एफ पी
प्रभाव 24.0 24.0 24.0 .008
गलती 4.0 1.0

जैसा कि तालिका से देखा जा सकता है, कुल राशिवर्ग एसएस = 28 को घटकों में विभाजित किया गया है: इंट्राग्रुप परिवर्तनशीलता के कारण वर्गों का योग (2+2=4; तालिका की दूसरी पंक्ति देखें) और समूहों के बीच औसत मूल्यों में अंतर के कारण वर्गों का योग (28) -(2+2)=24; पहली तालिका पंक्ति देखें)। ध्यान दें कि इस तालिका में एमएस स्वतंत्रता की डिग्री (डी.एफ.) की संख्या से विभाजित एसएस के बराबर औसत वर्ग है।

उपरोक्त सरल उदाहरण में, आप स्वतंत्र नमूनों के लिए तुरंत टी-परीक्षण की गणना कर सकते हैं। प्राप्त परिणाम स्वाभाविक रूप से विचरण के विश्लेषण के परिणामों से मेल खाएंगे।

हालाँकि, ऐसी स्थितियाँ जहाँ एक निश्चित घटना को पूरी तरह से एक चर द्वारा वर्णित किया जाता है, अत्यंत दुर्लभ हैं। उदाहरण के लिए, यदि हम यह सीखने की कोशिश कर रहे हैं कि बड़े टमाटर कैसे उगाए जाएं, तो हमें पौधे की आनुवंशिक संरचना, मिट्टी के प्रकार, प्रकाश, तापमान आदि से संबंधित कारकों पर विचार करना चाहिए। इस प्रकार, एक विशिष्ट प्रयोग करते समय, किसी को बड़ी संख्या में कारकों से निपटना पड़ता है। टी परीक्षणों की एक श्रृंखला का उपयोग करके विभिन्न कारक स्तरों पर दो नमूनों की बार-बार तुलना करने के लिए एनोवा का उपयोग करना बेहतर है, इसका मुख्य कारण यह है कि एनोवा काफी अधिक कुशल है और, छोटे नमूनों के लिए, अधिक जानकारीपूर्ण है।

मान लीजिए कि ऊपर चर्चा किए गए दो-नमूना विश्लेषण उदाहरण में, हम एक और कारक जोड़ते हैं, उदाहरण के लिए, लिंग। मान लीजिए कि अब प्रत्येक समूह में 3 पुरुष और 3 महिलाएँ हैं। इस प्रयोग की योजना को एक तालिका के रूप में प्रस्तुत किया जा सकता है:

गणना करने से पहले, आप देख सकते हैं कि इस उदाहरण में कुल विचरण के कम से कम तीन स्रोत हैं:

1) यादृच्छिक त्रुटि (इंट्राग्रुप विचरण),

2) प्रायोगिक समूह से संबंधित परिवर्तनशीलता

3) अवलोकन की वस्तुओं के लिंग के कारण परिवर्तनशीलता।

ध्यान दें कि परिवर्तनशीलता का एक और संभावित स्रोत है - कारकों की परस्पर क्रिया, जिस पर हम बाद में चर्चा करेंगे)। यदि हम विश्लेषण में लिंग को एक कारक के रूप में शामिल नहीं करते हैं और नियमित टी-परीक्षण की गणना नहीं करते हैं तो क्या होगा? यदि हम लिंग को अनदेखा करते हुए वर्गों के योग की गणना करते हैं (अर्थात, समूह के भीतर भिन्नता की गणना करते समय विभिन्न लिंगों की वस्तुओं को एक समूह में संयोजित करना और प्रत्येक समूह के लिए एसएस = 10 के बराबर वर्गों का योग प्राप्त करना और वर्गों का कुल योग एसएस = 10+10 = 20), तो हम लिंग के आधार पर उपसमूहों में अतिरिक्त विभाजन के साथ अधिक सटीक विश्लेषण की तुलना में समूह के भीतर भिन्नता का एक बड़ा मूल्य प्राप्त करेंगे (इस मामले में, समूह के भीतर का मतलब 2 के बराबर होगा, और समूह के भीतर का कुल योग) वर्गों का योग SS = 2+2+2+2 = 8) के बराबर होगा।

तो, एक अतिरिक्त कारक की शुरूआत के साथ: लिंग, अवशिष्ट भिन्नता कम हो गई। ऐसा इसलिए है क्योंकि पुरुषों के लिए माध्य महिलाओं के माध्य से छोटा है, और जब लिंग पर ध्यान नहीं दिया जाता है तो साधनों में यह अंतर समूह के भीतर समग्र परिवर्तनशीलता को बढ़ाता है। त्रुटि विचरण को नियंत्रित करने से परीक्षण की संवेदनशीलता (शक्ति) बढ़ जाती है।

यह उदाहरण सामान्य दो-नमूना टी-परीक्षण की तुलना में विचरण के विश्लेषण का एक और लाभ दिखाता है। विचरण का विश्लेषण आपको अन्य कारकों के मूल्यों को नियंत्रित करके प्रत्येक कारक का अध्ययन करने की अनुमति देता है। वास्तव में, यह इसकी अधिक सांख्यिकीय शक्ति का मुख्य कारण है (सार्थक परिणाम प्राप्त करने के लिए छोटे नमूना आकार की आवश्यकता होती है)। इस कारण से, छोटे नमूनों पर भी भिन्नता का विश्लेषण, एक साधारण टी-परीक्षण की तुलना में सांख्यिकीय रूप से अधिक महत्वपूर्ण परिणाम उत्पन्न करता है।

व्यायाम । प्रथम वर्ष के छात्रों का उन गतिविधियों की पहचान करने के लिए सर्वेक्षण किया गया जिनके लिए वे अपना खाली समय समर्पित करते हैं। जांचें कि क्या छात्रों की मौखिक और गैर-मौखिक प्राथमिकताओं का वितरण भिन्न है।

समाधानकैलकुलेटर का उपयोग करके किया गया।
समूह औसत ढूँढना:

एनपी 1पी 2
1 12 17
2 18 19
3 23 25
4 10 7
5 15 17
x औसत 15.6 17

आइए p को निरूपित करें - कारक के स्तरों की संख्या (p=2)। प्रत्येक स्तर पर आयामों की संख्या समान और q=5 के बराबर है।
अंतिम पंक्ति में प्रत्येक कारक स्तर के लिए समूह साधन शामिल हैं।
समग्र औसत समूह औसत के अंकगणितीय माध्य के रूप में प्राप्त किया जा सकता है:
(1)
समग्र औसत के सापेक्ष विफलता के प्रतिशत के समूह औसत का प्रसार विचाराधीन कारक के स्तर में परिवर्तन और यादृच्छिक कारकों दोनों से प्रभावित होता है।
इस कारक के प्रभाव को ध्यान में रखने के लिए, कुल नमूना विचरण को दो भागों में विभाजित किया गया है, जिनमें से पहले को कारक एस 2 एफ कहा जाता है, और दूसरे को अवशिष्ट एस 2 बाकी कहा जाता है।
इन घटकों को ध्यान में रखने के लिए, पहले समग्र औसत से वर्ग विचलन के कुल योग की गणना की जाती है:

और समग्र औसत से समूह औसत के वर्ग विचलन का कारक योग, जो इस कारक के प्रभाव को दर्शाता है:

अंतिम अभिव्यक्ति किसी दिए गए कारक के लिए कुल समूह माध्य के साथ अभिव्यक्ति आर में प्रत्येक विकल्प को प्रतिस्थापित करके प्राप्त की जाती है।
वर्ग विचलनों का अवशिष्ट योग अंतर के रूप में प्राप्त किया जाता है:
आर बाकी = आर कुल - आर एफ
कुल नमूना विचरण निर्धारित करने के लिए, R कुल को माप pq की संख्या से विभाजित करना आवश्यक है:

और निष्पक्ष कुल नमूना विचरण प्राप्त करने के लिए, इस अभिव्यक्ति को pq/(pq-1) से गुणा किया जाना चाहिए:

तदनुसार, एक निष्पक्ष कारक नमूना विचरण के लिए:

जहां पी-1 निष्पक्ष कारक नमूना विचरण की स्वतंत्रता की डिग्री की संख्या है।
विचाराधीन पैरामीटर में परिवर्तन पर किसी कारक के प्रभाव का आकलन करने के लिए, मान की गणना की जाती है:

चूंकि दो नमूना भिन्नताओं एस 2 एफ और एस 2 बाकी का अनुपात फिशर-स्नेडेकोर कानून के अनुसार वितरित किया जाता है, एफ ओब्स के परिणामी मूल्य की तुलना वितरण फ़ंक्शन के मूल्य से की जाती है

चयनित महत्व स्तर ए के अनुरूप महत्वपूर्ण बिंदु एफसीआर पर।
यदि आप ध्यान दें, तो कारक का एक महत्वपूर्ण प्रभाव होता है और इसे ध्यान में रखा जाना चाहिए, अन्यथा इसका एक महत्वहीन प्रभाव होता है जिसे उपेक्षित किया जा सकता है।
रोब और आरएफ की गणना के लिए निम्नलिखित सूत्रों का भी उपयोग किया जा सकता है:
(4)
(5)
हम सूत्र (1) का उपयोग करके सामान्य औसत ज्ञात करते हैं:
सूत्र (4) का उपयोग करके Rtot की गणना करने के लिए, हम 2 वर्गों की एक तालिका बनाते हैं: विकल्प:
एनपी 2 1पी 2 2
1 144 289
2 324 361
3 529 625
4 100 49
5 225 289
1322 1613

समग्र औसत की गणना सूत्र (1) का उपयोग करके की जाती है:

रोट = 1322 + 1613 - 5 2 16.3 2 = 278.1
हम सूत्र (5) का उपयोग करके आर एफ पाते हैं:
आर एफ = 5(15.6 2 + 17 2) - 2 16.3 2 = 4.9
हमें R विश्राम मिलता है: R विश्राम = R कुल - R f = 278.1 - 4.9 = 273.2
हम कारक और अवशिष्ट भिन्नताएँ निर्धारित करते हैं:


यदि औसत मान अनियमित परिवर्तनशील वस्तु, व्यक्तिगत नमूनों के लिए गणना समान है, तो कारक और अवशिष्ट भिन्नता के अनुमान सामान्य भिन्नता के निष्पक्ष अनुमान हैं और महत्वहीन रूप से भिन्न हैं।
फिर फिशर मानदंड का उपयोग करके इन भिन्नताओं के अनुमानों की तुलना से पता चलेगा कि कारक और अवशिष्ट भिन्नताओं की समानता के बारे में शून्य परिकल्पना को अस्वीकार करने का कोई कारण नहीं है।
कारक फैलाव अनुमान अवशिष्ट फैलाव अनुमान से कम है, इसलिए हम तुरंत समानता की शून्य परिकल्पना की वैधता पर जोर दे सकते हैं गणितीय अपेक्षाएँपरतों का नमूना लेकर।
दूसरे शब्दों में, इस उदाहरण में, कारक Ф का यादृच्छिक चर पर कोई महत्वपूर्ण प्रभाव नहीं पड़ता है।
आइए शून्य परिकल्पना H 0 की जाँच करें: x के माध्य मानों की समानता।
एफ ओब्स खोजें।

महत्व स्तर α=0.05, स्वतंत्रता संख्या 1 और 8 की डिग्री के लिए, हम फिशर-स्नेडेकोर वितरण तालिका से एफसीआर पाते हैं।
एफ करोड़ (0.05; 1; 8) = 5.32
इस तथ्य के कारण कि एफ ने अवलोकन किया< f кр, нулевую гипотезу о существенном влиянии фактора на результаты экспериментов отклоняем.
दूसरे शब्दों में, छात्रों की मौखिक और गैर-मौखिक प्राथमिकताओं का वितरण भिन्न होता है।

व्यायाम. फेसिंग टाइल्स के उत्पादन के लिए संयंत्र में चार लाइनें हैं। प्रत्येक पंक्ति से, एक शिफ्ट के दौरान 10 टाइलों को यादृच्छिक रूप से चुना गया और उनकी मोटाई (मिमी) मापी गई। नाममात्र आकार से विचलन तालिका में दिए गए हैं। = 0.05 के महत्व स्तर पर यह स्थापित करना आवश्यक है कि उत्पादन लाइन (कारक ए) पर उच्च गुणवत्ता वाली टाइलों के उत्पादन की निर्भरता है।

व्यायाम. = 0.05 के महत्व स्तर पर, कोटिंग के सेवा जीवन पर पेंट के रंग के प्रभाव की जांच करें।

उदाहरण क्रमांक 1. 13 परीक्षण किए गए, जिनमें से 4 पहले कारक स्तर पर, 4 दूसरे पर, 3 तीसरे पर और 2 चौथे पर थे। 0.05 के महत्व स्तर पर विचरण विधि के विश्लेषण का उपयोग करते हुए, समूह साधनों की समानता के बारे में शून्य परिकल्पना का परीक्षण करें। यह माना जाता है कि नमूने समान भिन्नताओं वाली सामान्य आबादी से लिए गए हैं। परीक्षण के परिणाम तालिका में दिखाए गए हैं।

समाधान:
समूह औसत ढूँढना:

एनपी 1पी 2पी 3पी 4
1 1.38 1.41 1.32 1.31
2 1.38 1.42 1.33 1.33
3 1.42 1.44 1.34 -
4 1.42 1.45 - -
5.6 5.72 3.99 2.64
x औसत 1.4 1.43 1.33 1.32

आइए p को निरूपित करें - कारक के स्तरों की संख्या (p=4)। प्रत्येक स्तर पर आयामों की संख्या है: 4,4,3,2
अंतिम पंक्ति में प्रत्येक कारक स्तर के लिए समूह साधन शामिल हैं।
कुल औसत की गणना सूत्र का उपयोग करके की जाती है:

सूत्र (4) का उपयोग करके स्टोटल की गणना करने के लिए, हम 2 वर्गों की एक तालिका बनाते हैं: विकल्प:

एनपी 2 1पी 2 2पी 2 3पी 2 4
1 1.9 1.99 1.74 1.72
2 1.9 2.02 1.77 1.77
3 2.02 2.07 1.8 -
4 2.02 2.1 - -
7.84 8.18 5.31 3.49

वर्ग विचलनों का कुल योग सूत्र का उपयोग करके पाया जाता है:


हम सूत्र का उपयोग करके एस एफ पाते हैं:


हमें S विश्राम मिलता है: S विश्राम = S कुल - S f = 0.0293 - 0.0263 = 0.003
हम कारक फैलाव निर्धारित करते हैं:

और अवशिष्ट विचरण:

यदि व्यक्तिगत नमूनों के लिए गणना किए गए यादृच्छिक चर के औसत मान समान हैं, तो कारक और अवशिष्ट भिन्नता के अनुमान सामान्य भिन्नता के निष्पक्ष अनुमान हैं और महत्वपूर्ण रूप से भिन्न नहीं होते हैं।
फिर फिशर मानदंड का उपयोग करके इन भिन्नताओं के अनुमानों की तुलना से पता चलेगा कि कारक और अवशिष्ट भिन्नताओं की समानता के बारे में शून्य परिकल्पना को अस्वीकार करने का कोई कारण नहीं है।
कारक फैलाव का अनुमान अवशिष्ट फैलाव के अनुमान से अधिक है, इसलिए हम तुरंत यह दावा कर सकते हैं कि नमूना परतों में गणितीय अपेक्षाओं की समानता के बारे में शून्य परिकल्पना सत्य नहीं है।
दूसरे शब्दों में, इस उदाहरण में, कारक Ф का यादृच्छिक चर पर महत्वपूर्ण प्रभाव पड़ता है।
आइए शून्य परिकल्पना H 0 की जाँच करें: x के माध्य मानों की समानता।
एफ ओब्स खोजें।

महत्व स्तर α=0.05, स्वतंत्रता की डिग्री संख्या 3 और 12 के लिए, हम फिशर-स्नेडेकोर वितरण तालिका से एफसीआर पाते हैं।
एफ करोड़ (0.05; 3; 12) = 3.49
इस तथ्य के कारण कि f ने > f cr देखा, हम प्रयोगों के परिणामों पर कारक के महत्वपूर्ण प्रभाव के बारे में शून्य परिकल्पना को स्वीकार करते हैं (हम समूह साधनों की समानता के बारे में शून्य परिकल्पना को अस्वीकार करते हैं)। दूसरे शब्दों में, समूह के अर्थ समग्र रूप से काफी भिन्न होते हैं।

उदाहरण क्रमांक 2. स्कूल में 5 छठी कक्षाएँ हैं। मनोवैज्ञानिक को यह निर्धारित करने का काम सौंपा गया है कि कक्षाओं में स्थितिजन्य चिंता का औसत स्तर समान है या नहीं। इसी उद्देश्य से इन्हें तालिका में दिया गया है। महत्व स्तर α=0.05 की जाँच करें, यह धारणा कि कक्षाओं में औसत स्थितिजन्य चिंता भिन्न नहीं होती है।

उदाहरण संख्या 3. एक्स के मूल्य का अध्ययन करने के लिए, कारक एफ के पांच स्तरों में से प्रत्येक पर 4 परीक्षण किए गए। परीक्षण के परिणाम तालिका में दिखाए गए हैं। पता लगाएँ कि क्या X के मान पर कारक F का प्रभाव महत्वपूर्ण है। α = 0.05 लें। यह माना जाता है कि नमूने समान भिन्नताओं वाली सामान्य आबादी से लिए गए हैं।

उदाहरण संख्या 4. आइए मान लें कि 10 छात्रों के तीन समूहों ने शैक्षणिक प्रयोग में भाग लिया। समूहों में लागू किया गया विभिन्न तरीकेप्रशिक्षण: पहले में - पारंपरिक (एफ 1), दूसरे में - कंप्यूटर प्रौद्योगिकी पर आधारित (एफ 2), तीसरे में - एक विधि जो व्यापक रूप से कार्यों का उपयोग करती है स्वतंत्र कार्य(एफ 3). ज्ञान का मूल्यांकन दस-बिंदु प्रणाली का उपयोग करके किया गया था।
प्राप्त परीक्षा डेटा को संसाधित करना और यह निष्कर्ष निकालना आवश्यक है कि क्या शिक्षण पद्धति का प्रभाव महत्वपूर्ण है, α = 0.05 को महत्व स्तर के रूप में लेते हुए।
परीक्षा परिणाम तालिका में दिए गए हैं, एफ जे कारक एक्स आईजे का स्तर है - एफ जे विधि का उपयोग करके आई-वें छात्र का मूल्यांकन।

कारक स्तर

उदाहरण क्रमांक 5. फसलों की प्रतिस्पर्धी किस्म के परीक्षण के परिणाम दिखाए गए हैं (उपज प्रति हेक्टेयर सेंटीमीटर में)। प्रत्येक किस्म का परीक्षण चार भूखंडों में किया गया। भिन्नता के विश्लेषण का उपयोग करके, उपज पर विविधता के प्रभाव का अध्ययन करें। कारक के प्रभाव का महत्व (कुल भिन्नता में अंतरसमूह भिन्नता का हिस्सा) और प्रयोगात्मक परिणामों के महत्व को 0.05 के महत्व स्तर पर स्थापित करें।
विविधता परीक्षण भूखंडों में उत्पादकता

विविधता प्रतिकृतियों द्वारा उत्पादकता सी. हा से
1 2 3 4
1
2
3
42,4
52,5
52,3
37,4
50,1
53,0
40,7
53,8
51,4
38,2
50,7
53,6

विचरण का विश्लेषण

1. विचरण के विश्लेषण की अवधारणा

विचरण का विश्लेषणकिसी भी नियंत्रित परिवर्तनशील कारकों के प्रभाव में किसी गुण की परिवर्तनशीलता का विश्लेषण है। विदेशी साहित्य में, विचरण के विश्लेषण को अक्सर एनोवा के रूप में जाना जाता है, जिसका अनुवाद परिवर्तनशीलता के विश्लेषण (एनालिसिस ऑफ वेरिएंस) के रूप में किया जाता है।

एनोवा समस्याकिसी गुण की सामान्य परिवर्तनशीलता से भिन्न प्रकार की परिवर्तनशीलता को अलग करना शामिल है:

ए) अध्ययन के तहत प्रत्येक स्वतंत्र चर की कार्रवाई के कारण परिवर्तनशीलता;

बी) अध्ययन किए जा रहे स्वतंत्र चरों की परस्पर क्रिया के कारण परिवर्तनशीलता;

ग) अन्य सभी अज्ञात चरों के कारण यादृच्छिक परिवर्तनशीलता।

अध्ययन के तहत चर की कार्रवाई और उनकी बातचीत के कारण परिवर्तनशीलता यादृच्छिक परिवर्तनशीलता के साथ सहसंबद्ध है। इस संबंध का एक संकेतक फिशर का एफ परीक्षण है।

एफ मानदंड की गणना के सूत्र में भिन्नताओं का अनुमान शामिल है, यानी, विशेषता के वितरण पैरामीटर, इसलिए एफ मानदंड एक पैरामीट्रिक मानदंड है।

किसी गुण की परिवर्तनशीलता अध्ययनाधीन चरों (कारकों) या उनकी अंतःक्रिया के कारण जितनी अधिक होगी, उतनी ही अधिक होगी अनुभवजन्य मानदंड मान.

शून्य विचरण के विश्लेषण में परिकल्पना बताएगी कि अध्ययन की गई प्रभावी विशेषता के औसत मूल्य सभी ग्रेडेशन में समान हैं।

विकल्प परिकल्पना बताएगी कि अध्ययन के तहत कारक के विभिन्न ग्रेडेशन में परिणामी विशेषता के औसत मूल्य अलग-अलग हैं।

विचरण का विश्लेषण हमें किसी विशेषता में परिवर्तन बताने की अनुमति देता है, लेकिन संकेत नहीं देता है दिशाये परिवर्तन.

आइए विचरण विश्लेषण पर अपना विचार सबसे सरल मामले से शुरू करें, जब हम केवल की क्रिया का अध्ययन करते हैं एकपरिवर्तनीय (एक कारक)।

2. असंबंधित नमूनों के लिए विचरण का एकतरफा विश्लेषण

2.1. विधि का उद्देश्य

विचरण के एक-कारक विश्लेषण की विधि का उपयोग उन मामलों में किया जाता है जहां किसी कारक की बदलती परिस्थितियों या उन्नयन के प्रभाव में एक प्रभावी विशेषता में परिवर्तन का अध्ययन किया जाता है। विधि के इस संस्करण में, कारक के प्रत्येक ग्रेडेशन का प्रभाव होता है अलगविषयों के नमूने. कारक के कम से कम तीन ग्रेडेशन होने चाहिए। (दो ग्रेडेशन हो सकते हैं, लेकिन इस मामले में हम नॉनलाइनियर निर्भरता स्थापित नहीं कर पाएंगे और सरल निर्भरता का उपयोग करना अधिक उचित लगता है)।

इस प्रकार के विश्लेषण का एक गैर-पैरामीट्रिक संस्करण क्रुस्कल-वालिस एच परीक्षण है।

परिकल्पना

एच 0: कारक ग्रेड (विभिन्न स्थितियों) के बीच अंतर प्रत्येक समूह के भीतर यादृच्छिक अंतर से अधिक नहीं है।

एच 1: कारक ग्रेड (विभिन्न स्थितियों) के बीच अंतर प्रत्येक समूह के भीतर यादृच्छिक अंतर से अधिक है।

2.2. असंबंधित नमूनों के लिए भिन्नता के एक-तरफ़ा विश्लेषण की सीमाएँ

1. विचरण के एक-तरफ़ा विश्लेषण के लिए कारक के कम से कम तीन ग्रेडेशन और प्रत्येक ग्रेडेशन में कम से कम दो विषयों की आवश्यकता होती है।

2. परिणामी विशेषता को अध्ययन के तहत नमूने में सामान्य रूप से वितरित किया जाना चाहिए।

सच है, आमतौर पर यह संकेत नहीं दिया जाता है कि क्या हम संपूर्ण सर्वेक्षण किए गए नमूने में विशेषता के वितरण के बारे में बात कर रहे हैं या उसके उस हिस्से में जो फैलाव परिसर बनाता है।

3. उदाहरण का उपयोग करके असंबद्ध नमूनों के लिए भिन्नता के एक-तरफ़ा विश्लेषण की विधि का उपयोग करके किसी समस्या को हल करने का एक उदाहरण:

छह विषयों के तीन अलग-अलग समूहों को दस-दस शब्दों की सूचियाँ दी गईं। पहले समूह को शब्द कम गति पर प्रस्तुत किए गए - प्रति 5 सेकंड में 1 शब्द, दूसरे समूह को औसत गति पर - 1 शब्द प्रति 2 सेकंड, और तीसरे समूह को उच्च गति पर - 1 शब्द प्रति सेकंड। अनुमान लगाया गया था कि पुनरुत्पादन प्रदर्शन शब्द प्रस्तुति की गति पर निर्भर करेगा। परिणाम तालिका में प्रस्तुत किए गए हैं। 1.

पुनरुत्पादित शब्दों की संख्या तालिका नंबर एक

विषय क्रमांक

धीमी गति

औसत गति

उच्च गति

कुल राशि

एच 0: शब्द उत्पादन अवधि में अंतर बीच मेंसमूह यादृच्छिक मतभेदों से अधिक स्पष्ट नहीं हैं अंदरप्रत्येक समूह.

एच1: शब्द उत्पादन मात्रा में अंतर बीच मेंसमूह यादृच्छिक मतभेदों की तुलना में अधिक स्पष्ट हैं अंदरप्रत्येक समूह. तालिका में प्रस्तुत प्रयोगात्मक मूल्यों का उपयोग करना। 1, हम कुछ मान स्थापित करेंगे जो एफ मानदंड की गणना के लिए आवश्यक होंगे।

विचरण के एक-तरफ़ा विश्लेषण के लिए मुख्य मात्राओं की गणना तालिका में प्रस्तुत की गई है:

तालिका 2

टेबल तीन

असंबद्ध नमूनों के लिए विचरण के एक-तरफ़ा विश्लेषण में संचालन का अनुक्रम

अक्सर इस और बाद की तालिकाओं में पाया जाता है, पदनाम एसएस "वर्गों के योग" का संक्षिप्त रूप है। इस संक्षिप्त नाम का प्रयोग अक्सर अनुवादित स्रोतों में किया जाता है।

एसएस तथ्यअध्ययन के तहत कारक की कार्रवाई के कारण विशेषता की परिवर्तनशीलता का मतलब है;

एसएस आम तौर पर- विशेषता की सामान्य परिवर्तनशीलता;

एस सी.ए.-बेहिसाब कारकों के कारण परिवर्तनशीलता, "यादृच्छिक" या "अवशिष्ट" परिवर्तनशीलता।

एमएस- "माध्य वर्ग", या वर्गों के योग की गणितीय अपेक्षा, संबंधित एसएस का औसत मूल्य।

डीएफ - स्वतंत्रता की डिग्री की संख्या, जिसे गैर-पैरामीट्रिक मानदंडों पर विचार करते समय, हम ग्रीक अक्षर द्वारा निरूपित करते हैं वी.

निष्कर्ष: एच 0 को अस्वीकार कर दिया गया है। एच 1 स्वीकृत है. समूहों के बीच शब्द स्मरण में अंतर प्रत्येक समूह के भीतर यादृच्छिक अंतर से अधिक था (α=0.05)। इसलिए, शब्दों की प्रस्तुति की गति उनके पुनरुत्पादन की मात्रा को प्रभावित करती है।

एक्सेल में समस्या को हल करने का एक उदाहरण नीचे प्रस्तुत किया गया है:

आरंभिक डेटा:

कमांड का उपयोग करते हुए: टूल्स->डेटा विश्लेषण->वन-वे एनोवा, हमें निम्नलिखित परिणाम मिलते हैं:

इस नोट में सांख्यिकी के उपयोग को एक क्रॉस-कटिंग उदाहरण के साथ चित्रित किया जाएगा। मान लीजिए कि आप परफेक्ट पैराशूट में प्रोडक्शन मैनेजर हैं। पैराशूट चार अलग-अलग आपूर्तिकर्ताओं द्वारा आपूर्ति किए गए सिंथेटिक फाइबर से बने होते हैं। पैराशूट की मुख्य विशेषताओं में से एक इसकी ताकत है। आपको यह सुनिश्चित करना होगा कि आपूर्ति किए गए सभी फाइबर समान ताकत के हों। इस प्रश्न का उत्तर देने के लिए, सिंथेटिक फाइबर से बुने गए पैराशूट की ताकत को मापने के लिए एक प्रयोगात्मक डिजाइन तैयार किया जाना चाहिए। विभिन्न आपूर्तिकर्ता. इस प्रयोग से प्राप्त जानकारी यह निर्धारित करेगी कि कौन सा आपूर्तिकर्ता सबसे टिकाऊ पैराशूट प्रदान करता है।

कई अनुप्रयोगों में ऐसे प्रयोग शामिल होते हैं जो एक ही कारक के कई समूहों या स्तरों पर विचार करते हैं। कुछ कारक, जैसे सिरेमिक फायरिंग तापमान, के कई संख्यात्मक स्तर हो सकते हैं (अर्थात 300°, 350°, 400° और 450°)। अन्य कारक, जैसे सुपरमार्केट में वस्तुओं का स्थान, के श्रेणीबद्ध स्तर हो सकते हैं (उदाहरण के लिए, पहला आपूर्तिकर्ता, दूसरा आपूर्तिकर्ता, तीसरा आपूर्तिकर्ता, चौथा आपूर्तिकर्ता)। एकल-कारक प्रयोग जिसमें प्रायोगिक इकाइयों को यादृच्छिक रूप से समूहों या कारक स्तरों को सौंपा जाता है, पूर्णतः यादृच्छिक कहलाते हैं।

प्रयोगएफ-कई गणितीय अपेक्षाओं के बीच अंतर का आकलन करने के लिए मानदंड

यदि समूहों में किसी कारक की संख्यात्मक माप निरंतर और कुछ हैं अतिरिक्त शर्तों, कई समूहों की गणितीय अपेक्षाओं की तुलना करने के लिए, विचरण का विश्लेषण (एनोवा - एकविश्लेषण हेएफ वारियांस)। पूरी तरह से यादृच्छिक डिज़ाइन का उपयोग करके विचरण के विश्लेषण को एक-तरफ़ा एनोवा प्रक्रिया कहा जाता है। कुछ मायनों में, विचरण का विश्लेषण शब्द एक मिथ्या नाम है क्योंकि यह भिन्नताओं के बजाय समूहों के अपेक्षित मूल्यों के बीच अंतर की तुलना करता है। हालाँकि, गणितीय अपेक्षाओं की तुलना सटीक रूप से डेटा भिन्नता के विश्लेषण के आधार पर की जाती है। एनोवा प्रक्रिया में, माप परिणामों में कुल भिन्नता को समूहों के बीच और भीतर-समूहों में विभाजित किया जाता है (चित्र 1)। समूह के भीतर भिन्नता को प्रयोगात्मक त्रुटि द्वारा समझाया गया है, और समूह के बीच भिन्नता को प्रयोगात्मक स्थितियों के प्रभावों द्वारा समझाया गया है। प्रतीक साथसमूहों की संख्या को दर्शाता है.

चावल। 1. पूरी तरह से यादृच्छिक प्रयोग में भिन्नता का विभाजन

नोट को प्रारूप में डाउनलोड करें, प्रारूप में उदाहरण

चलिए मान लेते हैं साथस्वतंत्र से निकाले गए समूह सामान्य आबादी, सामान्य वितरण और समान विचरण होना। शून्य परिकल्पना यह है कि जनसंख्या की गणितीय अपेक्षाएँ समान हैं: एच 0: μ 1 = μ 2 = ... = μ s. वैकल्पिक परिकल्पना बताती है कि सभी गणितीय अपेक्षाएँ समान नहीं हैं: एच 1: सभी μ j समान नहीं हैं जे= 1, 2, …, एस)।

चित्र में. चित्र 2 पांच तुलनात्मक समूहों की गणितीय अपेक्षाओं के बारे में सच्ची शून्य परिकल्पना प्रस्तुत करता है, बशर्ते कि आबादी का सामान्य वितरण और समान विचरण हो। पांच सामान्य आबादी से जुड़ी विभिन्न स्तरों परकारक समान हैं. परिणामस्वरूप, समान गणितीय अपेक्षा, भिन्नता और आकार रखते हुए, वे एक-दूसरे पर आरोपित हो जाते हैं।

चावल। 2. पांच सामान्य आबादी की गणितीय अपेक्षा समान है: μ 1 = μ 2 = μ 3 = μ 4 = μ 5

दूसरी ओर, मान लीजिए कि वास्तव में शून्य परिकल्पना झूठी है, चौथे स्तर पर उच्चतम अपेक्षित मूल्य है, पहले स्तर पर थोड़ा कम अपेक्षित मूल्य है, और शेष स्तरों में समान और उससे भी कम अपेक्षित मूल्य हैं ( चित्र तीन)। ध्यान दें कि, अपेक्षित मूल्यों के अपवाद के साथ, सभी पांच आबादी समान हैं (अर्थात, उनकी परिवर्तनशीलता और आकार समान है)।

चावल। 3. प्रायोगिक स्थितियों का प्रभाव देखा जाता है: μ 4 > μ 1 > μ 2 = μ 3 = μ 5

कई सामान्य आबादी की गणितीय अपेक्षाओं की समानता के बारे में परिकल्पना का परीक्षण करते समय, कुल भिन्नता को दो भागों में विभाजित किया जाता है: अंतरसमूह भिन्नता, समूहों के बीच अंतर के कारण, और इंट्राग्रुप भिन्नता, एक ही समूह से संबंधित तत्वों के बीच अंतर के कारण। कुल भिन्नता वर्गों के कुल योग (एसएसटी - कुल वर्गों का योग) द्वारा व्यक्त की जाती है। चूँकि शून्य परिकल्पना सभी की गणितीय अपेक्षाएँ है साथसमूह एक-दूसरे के बराबर हैं, कुल भिन्नता व्यक्तिगत अवलोकनों और सभी नमूनों के लिए गणना किए गए समग्र औसत (औसत का औसत) के बीच वर्ग अंतर के योग के बराबर है। पूर्ण विविधता:

कहाँ - सामान्य औसत, एक्स आईजे - मैं-ई अवलोकन में जे-समूह या स्तर, एन जे- में टिप्पणियों की संख्या जेवें समूह, एन - कुल मात्रासभी समूहों में अवलोकन (अर्थात्) एन = एन 1 + एन 2 + … + एन सी), साथ- अध्ययन किए गए समूहों या स्तरों की संख्या।

समूह के बीच भिन्नता, जिसे आमतौर पर बीच-समूह के वर्गों का योग कहा जाता है (एसएसए - समूहों के बीच वर्गों का योग), प्रत्येक समूह के नमूना माध्य के बीच अंतर के वर्गों के योग के बराबर है जेऔर कुल मिलाकर औसत , संबंधित समूह के आयतन से गुणा किया जाता है एन जे:

कहाँ साथ- अध्ययन किए गए समूहों या स्तरों की संख्या, एन जे- में टिप्पणियों की संख्या जेवें समूह, जे- औसत मूल्य जेवें समूह, - कुल मिलाकर औसत.

समूह के भीतर भिन्नता, जिसे आम तौर पर समूहों के भीतर वर्गों का योग कहा जाता है (एसएसडब्ल्यू - समूहों के साथ वर्गों का योग), प्रत्येक समूह के तत्वों और इस समूह के नमूना माध्य के बीच अंतर के वर्गों के योग के बराबर है जे:

कहाँ एक्सआईजे - मैंवां तत्व जेवें समूह, जे- औसत मूल्य जेवें समूह.

चूँकि उनकी तुलना की जाती है साथकारक स्तर, वर्गों का अंतरसमूह योग है एस - 1स्वतंत्रता की कोटियां। की प्रत्येक साथस्तर है एन जे – 1 स्वतंत्रता की डिग्री, इसलिए वर्गों का इंट्राग्रुप योग है एन- साथस्वतंत्रता की डिग्री, और

इसके अलावा, वर्गों का कुल योग है एन – 1 प्रत्येक अवलोकन के बाद से स्वतंत्रता की डिग्री एक्सआईजेसभी पर गणना किए गए कुल औसत से तुलना की जाती है एनअवलोकन. यदि इनमें से प्रत्येक योग को स्वतंत्रता की डिग्री की संगत संख्या से विभाजित किया जाता है, तो तीन प्रकार के फैलाव उत्पन्न होते हैं: अंतरसमूह(बीच का माध्य वर्ग - एमएसए), इंट्राग्रुप(अंदर का माध्य वर्ग - MSW) और भरा हुआ(कुल माध्य वर्ग - एमएसटी):

इस तथ्य के बावजूद कि विचरण के विश्लेषण का मुख्य उद्देश्य गणितीय अपेक्षाओं की तुलना करना है साथप्रायोगिक स्थितियों के प्रभाव की पहचान करने के लिए समूह का नाम इस तथ्य के कारण है कि मुख्य उपकरण भिन्नताओं का विश्लेषण है अलग - अलग प्रकार. यदि शून्य परिकल्पना सत्य है, और गणितीय अपेक्षाओं के बीच साथसमूहों में कोई महत्वपूर्ण अंतर नहीं है, सभी तीन भिन्नताएं - एमएसए, एमएसडब्ल्यू और एमएसटी - भिन्नता अनुमान हैं σ 2विश्लेषण किए गए डेटा में निहित है। इस प्रकार, शून्य परिकल्पना का परीक्षण करना एच 0: μ 1 = μ 2 = ... = μ sऔर वैकल्पिक परिकल्पना एच 1: सभी μ j समान नहीं हैं जे = 1, 2, …, साथ), आँकड़ों की गणना करना आवश्यक है एफ-मानदंड, जो दो भिन्नताओं, एमएसए और एमएसडब्ल्यू का अनुपात है। परीक्षा एफ-विचरण के एकतरफ़ा विश्लेषण में आँकड़े

आंकड़े एफ-मानदंड के अधीन एफ-वितरण के साथ एस - 1अंश में स्वतंत्रता की डिग्री एम.एस.ए.और एन - एसहर में स्वतंत्रता की डिग्री एम.एस.डब्ल्यू.. किसी दिए गए महत्व स्तर α के लिए, गणना करने पर शून्य परिकल्पना खारिज कर दी जाती है एफ एफयू, अंतर्निहित एफ-वितरण के साथ एस - 1 एन - एसहर में स्वतंत्रता की डिग्री. अतः, आकृति में दर्शाए गए अनुसार। 4, निर्णायक नियमइस प्रकार तैयार किया गया: शून्य परिकल्पना एच 0यदि अस्वीकार कर दिया गया एफ>एफयू; अन्यथा इसे अस्वीकार नहीं किया जाता है.

चावल। 4. किसी परिकल्पना का परीक्षण करते समय विचरण के विश्लेषण का महत्वपूर्ण क्षेत्र एच 0

यदि शून्य परिकल्पना एच 0सत्य है, परिकलित एफ-सांख्यिकी 1 के करीब है, क्योंकि इसके अंश और हर एक ही मात्रा के अनुमान हैं - विश्लेषित डेटा में निहित फैलाव σ 2। यदि शून्य परिकल्पना एच 0गलत है (और विभिन्न समूहों की गणितीय अपेक्षाओं के बीच एक महत्वपूर्ण अंतर है), गणना की गई एफ-सांख्यिकी एक से बहुत बड़ी होगी क्योंकि इसका अंश, एमएसए, डेटा की प्राकृतिक परिवर्तनशीलता के अलावा, प्रयोगात्मक स्थितियों के प्रभाव या समूहों के बीच अंतर का अनुमान लगाता है, जबकि हर एमएसडब्ल्यू केवल डेटा की प्राकृतिक परिवर्तनशीलता का अनुमान लगाता है। . इस प्रकार, एनोवा प्रक्रिया है एफ-मानदंड जिसमें, दिए गए महत्व स्तर α पर, गणना करने पर शून्य परिकल्पना खारिज कर दी जाती है एफ-आँकड़े ऊपरी महत्वपूर्ण मूल्य से अधिक हैं एफयू, अंतर्निहित एफ-वितरण के साथ एस - 1अंश में स्वतंत्रता की डिग्री और एन - एसहर में स्वतंत्रता की डिग्री, जैसा कि चित्र में दिखाया गया है। 4.

विचरण के एक-तरफ़ा विश्लेषण को स्पष्ट करने के लिए, आइए नोट की शुरुआत में उल्लिखित परिदृश्य पर वापस जाएँ। प्रयोग का उद्देश्य यह निर्धारित करना है कि क्या विभिन्न आपूर्तिकर्ताओं से प्राप्त सिंथेटिक फाइबर से बुने गए पैराशूट की ताकत समान है। प्रत्येक समूह में पाँच पैराशूट होते हैं। समूहों को विभाजित किया गया है आपूर्तिकर्ताओं को - आपूर्तिकर्ता 1, आपूर्तिकर्ता 2, आपूर्तिकर्ता 3 और आपूर्तिकर्ता 4। पैराशूट की ताकत को एक विशेष उपकरण का उपयोग करके मापा जाता है जो कपड़े को दोनों तरफ से फाड़ने का परीक्षण करता है। पैराशूट को तोड़ने के लिए आवश्यक बल को एक विशेष पैमाने पर मापा जाता है। तोड़ने वाला बल जितना अधिक होगा, पैराशूट उतना ही मजबूत होगा। एक्सेल आपको विश्लेषण करने की अनुमति देता है एफ-एक क्लिक में आँकड़े। मेनू के माध्यम से जाओ डेटाडेटा विश्लेषण, और पंक्ति का चयन करें एक तरफ़ा एनोवा, खुलने वाली विंडो को भरें (चित्र 5)। प्रायोगिक परिणाम (ब्रेकिंग स्ट्रेंथ), कुछ वर्णनात्मक आँकड़े और विचरण के एक-तरफ़ा विश्लेषण के परिणाम चित्र में प्रस्तुत किए गए हैं। 6.

चावल। 5. खिड़की वेरिएंस विश्लेषण पैकेज का एक-तरफ़ा विश्लेषणएक्सेल

चावल। 6. विभिन्न आपूर्तिकर्ताओं से प्राप्त सिंथेटिक फाइबर से बुने हुए पैराशूट के शक्ति संकेतक, वर्णनात्मक आँकड़े और विचरण के एक-तरफ़ा विश्लेषण के परिणाम

चित्र 6 के विश्लेषण से पता चलता है कि नमूना साधनों के बीच कुछ अंतर है। पहले आपूर्तिकर्ता से प्राप्त फाइबर की औसत ताकत 19.52 है, दूसरे से - 24.26, तीसरे से - 22.84 और चौथे से - 21.16। क्या यह अंतर सांख्यिकीय रूप से महत्वपूर्ण है? टूटना बल का वितरण स्कैटर प्लॉट (चित्र 7) में प्रदर्शित किया गया है। यह स्पष्ट रूप से समूहों के बीच और भीतर दोनों में अंतर दिखाता है। यदि प्रत्येक समूह आकार में बड़ा होता, तो उनका विश्लेषण करने के लिए तना-और-पत्ती आरेख, बॉक्स प्लॉट या बेल प्लॉट का उपयोग किया जा सकता था।

चावल। 7. चार आपूर्तिकर्ताओं से प्राप्त सिंथेटिक फाइबर से बुने गए पैराशूट के लिए शक्ति फैलाव का आरेख।

शून्य परिकल्पना बताती है कि औसत शक्ति स्कोर के बीच कोई महत्वपूर्ण अंतर नहीं है: एच 0: μ 1 = μ 2 = μ 3 = μ 4. एक वैकल्पिक परिकल्पना यह है कि कम से कम एक आपूर्तिकर्ता ऐसा है जिसकी औसत फाइबर ताकत दूसरों से भिन्न है: एच 1: सभी μ j समान नहीं हैं ( जे = 1, 2, …, साथ).

कुल मिलाकर औसत (चित्र 6 देखें) = औसत(डी12:डी15) = 21.945; निर्धारित करने के लिए, आप सभी 20 मूल संख्याओं का औसत भी निकाल सकते हैं: = औसत(ए3:डी7)। विचरण मानों की गणना की जाती है विश्लेषण पैकेजऔर प्लेट में प्रतिबिंबित होते हैं विचरण का विश्लेषण(चित्र 6 देखें): एसएसए = 63.286, एसएसडब्ल्यू = 97.504, एसएसटी = 160.790 (कॉलम देखें) एसएसटेबल विचरण का विश्लेषणचित्र 6). औसत की गणना वर्गों के इन योगों को स्वतंत्रता की डिग्री की उचित संख्या से विभाजित करके की जाती है। तब से साथ= 4, ए एन= 20, हमें स्वतंत्रता की कोटि के निम्नलिखित मान प्राप्त होते हैं; एसएसए के लिए: एस - 1=3; एसएसडब्ल्यू के लिए: एन सी= 16; एसएसटी के लिए: एन - 1= 19 (कॉलम देखें डीएफ). इस प्रकार: एमएसए = एसएसए / ( एस - 1)= 21.095; एमएसडब्ल्यू = एसएसडब्ल्यू /( एन सी) = 6.094; एमएसटी = एसएसटी /( एन - 1) = 8.463 (कॉलम देखें एमएस). एफ-सांख्यिकी = एमएसए/एमएसडब्ल्यू = 3.462 (कॉलम देखें)। एफ).

ऊपरी महत्वपूर्ण मूल्य एफयू, की विशेषता एफ-वितरण, सूत्र द्वारा निर्धारित =F.OBR(0.95;3;16) = 3.239. फ़ंक्शन पैरामीटर =F.OBR(): α = 0.05, अंश के पास स्वतंत्रता की तीन डिग्री है, और हर के पास 16 है। इस प्रकार, गणना की गई एफ-3.462 के बराबर आँकड़ा ऊपरी महत्वपूर्ण मान से अधिक है एफयू= 3.239, शून्य परिकल्पना अस्वीकृत की जाती है (चित्र 8)।

चावल। 8. 0.05 के महत्व स्तर पर विचरण के विश्लेषण का महत्वपूर्ण क्षेत्र यदि अंश में स्वतंत्रता की तीन डिग्री है और हर -16 है

आर-मूल्य, यानी संभावना है कि यदि शून्य परिकल्पना सत्य है एफ-आंकड़े 3.46 से कम नहीं, 0.041 या 4.1% के बराबर (कॉलम देखें) पी-मूल्यटेबल विचरण का विश्लेषणचित्र 6). चूंकि यह मान महत्व स्तर α = 5% से अधिक नहीं है, इसलिए शून्य परिकल्पना खारिज कर दी जाती है। इसके अतिरिक्त, आर-मूल्य इंगित करता है कि सामान्य आबादी की गणितीय अपेक्षाओं के बीच इस तरह के या अधिक अंतर का पता लगाने की संभावना, बशर्ते कि वे वास्तव में समान हों, 4.1% के बराबर है।

इसलिए। चारों नमूना माध्यों में अंतर है। शून्य परिकल्पना यह थी कि चार आबादी की सभी गणितीय अपेक्षाएँ समान हैं। इन शर्तों के तहत, सभी पैराशूटों की ताकत की कुल परिवर्तनशीलता (यानी कुल एसएसटी भिन्नता) की माप की गणना प्रत्येक अवलोकन के बीच वर्ग अंतर को जोड़कर की जाती है। एक्स आईजेऔर कुल मिलाकर औसत . फिर कुल भिन्नता को दो घटकों में विभाजित किया गया (चित्र 1 देखें)। पहला घटक एसएसए में समूह के बीच भिन्नता थी और दूसरा एसएसडब्ल्यू में समूह के भीतर भिन्नता थी।

डेटा में परिवर्तनशीलता क्या बताती है? दूसरे शब्दों में, सभी अवलोकन एक जैसे क्यों नहीं हैं? एक कारण यह है कि अलग-अलग कंपनियां अलग-अलग ताकत के फाइबर की आपूर्ति करती हैं। यह आंशिक रूप से बताता है कि समूहों की अलग-अलग गणितीय अपेक्षाएँ क्यों हैं: प्रयोगात्मक स्थितियों का प्रभाव जितना मजबूत होगा, समूहों की गणितीय अपेक्षाओं के बीच अंतर उतना ही अधिक होगा। डेटा परिवर्तनशीलता का एक अन्य कारण किसी भी प्रक्रिया की प्राकृतिक परिवर्तनशीलता है इस मामले में- पैराशूट का उत्पादन. भले ही सभी फाइबर एक ही आपूर्तिकर्ता से खरीदे गए हों, उनकी ताकत समान नहीं होगी, अन्य सभी चीजें समान होंगी। चूँकि यह प्रभाव प्रत्येक समूह के भीतर होता है, इसलिए इसे समूह के भीतर भिन्नता कहा जाता है।

नमूना साधनों के बीच अंतर को अंतरसमूह भिन्नता एसएसए कहा जाता है। जैसा कि पहले ही संकेत दिया गया है, समूह के भीतर भिन्नता का हिस्सा डेटा की संबद्धता द्वारा समझाया गया है विभिन्न समूह. हालाँकि, भले ही समूह बिल्कुल एक जैसे हों (यानी, शून्य परिकल्पना सत्य थी), समूह के बीच भिन्नता अभी भी मौजूद होगी। इसका कारण पैराशूट निर्माण प्रक्रिया की प्राकृतिक परिवर्तनशीलता है। क्योंकि नमूने अलग-अलग हैं, उनके नमूना साधन एक-दूसरे से भिन्न हैं। इसलिए, यदि शून्य परिकल्पना सत्य है, तो समूह के बीच और भीतर की परिवर्तनशीलता दोनों जनसंख्या परिवर्तनशीलता के अनुमान का प्रतिनिधित्व करती हैं। यदि शून्य परिकल्पना गलत है, तो समूहों के बीच की परिकल्पना बड़ी होगी। यही वह तथ्य है जो इसका आधार है एफ-कई समूहों की गणितीय अपेक्षाओं के बीच अंतर की तुलना करने के लिए मानदंड।

एक-तरफ़ा एनोवा का प्रदर्शन करने और फर्मों के बीच महत्वपूर्ण अंतर खोजने के बाद, यह अज्ञात रहता है कि कौन सा आपूर्तिकर्ता दूसरों से काफी अलग है। हम केवल इतना जानते हैं कि सामान्य आबादी की गणितीय अपेक्षाएँ समान नहीं हैं। दूसरे शब्दों में, कम से कम एक गणितीय अपेक्षा दूसरों से काफी भिन्न है। यह निर्धारित करने के लिए कि कौन सा आपूर्तिकर्ता दूसरों से अलग है, आप इसका उपयोग कर सकते हैं तुकी प्रक्रिया, आपूर्तिकर्ताओं के बीच जोड़ीवार तुलना का उपयोग करना। यह प्रक्रिया जॉन टुकी द्वारा विकसित की गई थी। इसके बाद, उन्होंने और के. क्रेमर ने उन स्थितियों के लिए इस प्रक्रिया को स्वतंत्र रूप से संशोधित किया जिनमें नमूना आकार एक दूसरे से भिन्न होते हैं।

एकाधिक तुलना: तुकी-क्रेमर प्रक्रिया

हमारे परिदृश्य में, पैराशूट की ताकत की तुलना करने के लिए विचरण के एक-तरफ़ा विश्लेषण का उपयोग किया गया था। चार समूहों की गणितीय अपेक्षाओं के बीच महत्वपूर्ण अंतर पाए जाने के बाद, यह निर्धारित करना आवश्यक है कि कौन से समूह एक दूसरे से भिन्न हैं। हालाँकि इस समस्या को हल करने के कई तरीके हैं, हम केवल तुकी-क्रेमर एकाधिक तुलना प्रक्रिया का वर्णन करेंगे। यह विधि पोस्ट हॉक तुलना प्रक्रियाओं का एक उदाहरण है क्योंकि परीक्षण की जा रही परिकल्पना डेटा विश्लेषण के बाद तैयार की जाती है। तुकी-क्रेमर प्रक्रिया समूहों के सभी जोड़ियों की एक साथ तुलना करने की अनुमति देती है। पहले चरण में, अंतर की गणना की जाती है एक्सजे -एक्सजे, कहाँ जे ≠जे, गणितीय अपेक्षाओं के बीच एस(एस - 1)/2समूह. क्रिटिकल रेंजतुकी-क्रेमर प्रक्रिया की गणना सूत्र द्वारा की जाती है:

कहाँ क्यू यू- छात्रीकृत श्रेणी वितरण का ऊपरी महत्वपूर्ण मूल्य, जो है साथअंश में स्वतंत्रता की डिग्री और एन - साथहर में स्वतंत्रता की डिग्री.

यदि नमूना आकार समान नहीं हैं, तो गणितीय अपेक्षाओं की प्रत्येक जोड़ी के लिए महत्वपूर्ण सीमा की गणना अलग से की जाती है। अंतिम चरण में, प्रत्येक एस(एस - 1)/2गणितीय अपेक्षाओं के जोड़े की तुलना संबंधित महत्वपूर्ण सीमा से की जाती है। यदि अंतर मापांक | हो तो एक जोड़ी के तत्वों को काफी भिन्न माना जाता है एक्सजे -एक्सजे| उनके बीच महत्वपूर्ण सीमा से अधिक है।

आइए पैराशूट की ताकत की समस्या पर तुकी-क्रेमर प्रक्रिया लागू करें। चूंकि पैराशूट कंपनी के चार आपूर्तिकर्ता हैं, इसलिए जांच के लिए आपूर्तिकर्ताओं के 4(4 - 1)/2 = 6 जोड़े हैं (चित्र 9)।

चावल। 9. नमूना साधनों की जोड़ीवार तुलना

चूँकि सभी समूहों का आयतन समान है (अर्थात् सभी)। एन जे = एन जे), यह केवल एक महत्वपूर्ण सीमा की गणना करने के लिए पर्याप्त है। ऐसा करने के लिए, तालिका के अनुसार एनोवा(चित्र 6) हम MSW = 6.094 का मान निर्धारित करते हैं। तब हम मूल्य ज्ञात करते हैं क्यू यूα = 0.05 पर, साथ= 4 (अंश में स्वतंत्रता की डिग्री की संख्या) और एन- साथ= 20 – 4 = 16 (हर में स्वतंत्रता की डिग्री की संख्या)। दुर्भाग्य से, मुझे एक्सेल में संबंधित फ़ंक्शन नहीं मिला, इसलिए मैंने तालिका का उपयोग किया (चित्र 10)।

चावल। 10. महत्वपूर्ण मानविद्यार्थीकृत दायरा क्यू यू

हम पाते हैं:

चूँकि केवल 4.74 > 4.47 (चित्र 9 की निचली तालिका देखें), पहले और दूसरे आपूर्तिकर्ता के बीच सांख्यिकीय रूप से महत्वपूर्ण अंतर मौजूद है। अन्य सभी जोड़ियों के पास नमूना साधन हैं जो हमें उनके मतभेदों के बारे में बात करने की अनुमति नहीं देते हैं। नतीजतन, पहले आपूर्तिकर्ता से खरीदे गए फाइबर से बुने गए पैराशूट की औसत ताकत दूसरे की तुलना में काफी कम है।

विचरण के एक-तरफ़ा विश्लेषण के लिए आवश्यक शर्तें

पैराशूट की ताकत की समस्या को हल करते समय, हमने यह जांच नहीं की कि क्या जिन परिस्थितियों में एक-कारक का उपयोग करना संभव है एफ-मानदंड. आप कैसे जानेंगे कि आप एक-कारक का उपयोग कर सकते हैं? एफविशिष्ट प्रयोगात्मक डेटा का विश्लेषण करते समय मानदंड? एकल कारक एफ-मानदंड केवल तभी लागू किया जा सकता है जब तीन बुनियादी धारणाएं पूरी हों: प्रयोगात्मक डेटा यादृच्छिक और स्वतंत्र होना चाहिए, सामान्य वितरण होना चाहिए, और उनके भिन्नताएं बराबर होनी चाहिए।

पहला अनुमान - यादृच्छिकता और डेटा स्वतंत्रता- हमेशा निष्पादित किया जाना चाहिए, क्योंकि किसी भी प्रयोग की शुद्धता पसंद की यादृच्छिकता और/या यादृच्छिकीकरण प्रक्रिया पर निर्भर करती है। परिणामों में पक्षपात से बचने के लिए यह आवश्यक है कि डेटा निकाला जाए साथसामान्य आबादी बेतरतीब ढंग से और एक दूसरे से स्वतंत्र रूप से। इसी तरह, डेटा को यादृच्छिक रूप से वितरित किया जाना चाहिए साथजिस कारक में हम रुचि रखते हैं उसके स्तर (प्रायोगिक समूह)। इन शर्तों का उल्लंघन विचरण के विश्लेषण के परिणामों को गंभीर रूप से विकृत कर सकता है।

दूसरा अनुमान - साधारण अवस्था- इसका मतलब है कि डेटा सामान्य रूप से वितरित आबादी से निकाला गया है। से संबंधित टी-मानदंड, विचरण का एकतरफ़ा विश्लेषण के आधार पर एफ-मानदंड इस शर्त के उल्लंघन के प्रति अपेक्षाकृत कम संवेदनशील है। यदि वितरण सामान्य से बहुत अधिक विचलन नहीं करता है, तो महत्व स्तर एफ-मानदंड थोड़ा बदलता है, खासकर यदि नमूना आकार काफी बड़ा हो। यदि वितरण की सामान्यता की शर्त का गम्भीर उल्लंघन हो तो इसे लागू किया जाना चाहिए।

तीसरा अनुमान - विचरण की एकरूपता- इसका मतलब है कि प्रत्येक जनसंख्या के प्रसरण एक दूसरे के बराबर हैं (यानी σ 1 2 = σ 2 2 = ... = σ j 2)। यह धारणा किसी को यह निर्णय लेने की अनुमति देती है कि समूह के भीतर भिन्नताओं को अलग करना है या पूल करना है। यदि समूह का आकार समान है, तो विचरण की एकरूपता की स्थिति का उपयोग करके प्राप्त निष्कर्षों पर बहुत कम प्रभाव पड़ता है एफ-मानदंड। हालाँकि, यदि नमूना आकार असमान हैं, तो भिन्नता की समानता की स्थिति का उल्लंघन भिन्नता के विश्लेषण के परिणामों को गंभीर रूप से विकृत कर सकता है। इसलिए, यह सुनिश्चित करने का प्रयास किया जाना चाहिए कि नमूना आकार समान हों। विचरण की एकरूपता की धारणा की जाँच करने के तरीकों में से एक मानदंड है लेवेनेनीचे वर्णित है.

यदि, तीनों शर्तों में से, केवल विचरण की एकरूपता की शर्त का उल्लंघन किया जाता है, तो एक प्रक्रिया समान होती है टी-अलग-अलग विचरण का उपयोग करते हुए मानदंड (अधिक जानकारी के लिए, देखें)। हालाँकि, अगर के बारे में धारणाएँ सामान्य वितरणऔर एक ही समय में विचरण की एकरूपता का उल्लंघन होता है, तो डेटा को सामान्य बनाना और भिन्नताओं के बीच अंतर को कम करना या एक गैरपैरामीट्रिक प्रक्रिया लागू करना आवश्यक है।

विचरण की एकरूपता के परीक्षण के लिए लेवेने का परीक्षण

इस तथ्य के बावजूद कि एफ-मानदंड समूहों में भिन्नताओं की समानता की स्थिति के उल्लंघन के प्रति अपेक्षाकृत प्रतिरोधी है; इस धारणा का घोर उल्लंघन मानदंड के महत्व और शक्ति के स्तर को महत्वपूर्ण रूप से प्रभावित करता है; शायद सबसे शक्तिशाली में से एक है कसौटी लेवेने. भिन्नताओं की समानता की जाँच करना साथसामान्य आबादी, हम निम्नलिखित परिकल्पनाओं का परीक्षण करेंगे:

Н 0: σ 1 2 = σ 2 2 = … = σजे 2

एच 1: सभी नहीं σ जे 2वही हैं ( जे = 1, 2, …, साथ)

संशोधित लेवेने का परीक्षण इस प्रस्ताव पर आधारित है कि यदि विभिन्न समूहों में परिवर्तनशीलता समान है, तो भिन्नता के विश्लेषण का उपयोग भिन्नताओं की समानता की शून्य परिकल्पना का परीक्षण करने के लिए किया जा सकता है। सम्पूर्ण मूल्यअवलोकनों और समूह मध्यस्थों के बीच अंतर. इसलिए, आपको पहले प्रत्येक समूह में अवलोकनों और माध्यिकाओं के बीच अंतर के निरपेक्ष मूल्यों की गणना करनी चाहिए, और फिर अंतरों के परिणामी निरपेक्ष मूल्यों पर विचरण का एक-तरफ़ा विश्लेषण करना चाहिए। लेवेने की कसौटी को स्पष्ट करने के लिए, आइए नोट की शुरुआत में उल्लिखित परिदृश्य पर वापस लौटें। चित्र में प्रस्तुत डेटा का उपयोग करना। 6, हम एक समान विश्लेषण करेंगे, लेकिन प्रत्येक नमूने के लिए प्रारंभिक डेटा और माध्यकों में अंतर के मॉड्यूल के संबंध में अलग से (चित्र 11)।



साइट पर नया

>

सबसे लोकप्रिय