घर मुंह विचरण के विश्लेषण के तरीके. एक तरफ़ा एनोवा

विचरण के विश्लेषण के तरीके. एक तरफ़ा एनोवा

5.1. क्या हुआ है भिन्नता का विश्लेषण?

फैलाव विश्लेषण 20वीं सदी के 20 के दशक में अंग्रेजी गणितज्ञ और आनुवंशिकीविद् रोनाल्ड फिशर द्वारा विकसित किया गया था। वैज्ञानिकों के बीच एक सर्वेक्षण के अनुसार, जिसमें पता चला कि 20वीं शताब्दी के जीव विज्ञान पर सबसे अधिक प्रभाव किसका था, यह सर फिशर थे जिन्होंने चैंपियनशिप प्राप्त की थी (उनकी सेवाओं के लिए उन्हें नाइटहुड से सम्मानित किया गया था - ग्रेट ब्रिटेन में सर्वोच्च सम्मान में से एक) ; इस संबंध में, फिशर की तुलना 19वीं सदी के जीव विज्ञान पर सबसे अधिक प्रभाव डालने वाले चार्ल्स डार्विन से की जा सकती है।

विचरण का विश्लेषण अब सांख्यिकी की एक अलग शाखा है। यह फिशर द्वारा खोजे गए तथ्य पर आधारित है कि अध्ययन की गई मात्रा की परिवर्तनशीलता के माप को इस मात्रा और यादृच्छिक विचलन को प्रभावित करने वाले कारकों के अनुरूप भागों में विघटित किया जा सकता है।

विचरण के विश्लेषण के सार को समझने के लिए, हम एक ही प्रकार की गणना दो बार करेंगे: "मैन्युअल रूप से" (कैलकुलेटर के साथ) और स्टेटिस्टिका प्रोग्राम का उपयोग करके। अपने कार्य को सरल बनाने के लिए, हम हरे मेंढकों की विविधता के वास्तविक विवरण के परिणामों के साथ काम नहीं करेंगे, बल्कि एक काल्पनिक उदाहरण के साथ काम करेंगे जो मनुष्यों में मादा और नर की तुलना से संबंधित है। 12 वयस्कों की ऊंचाई की विविधता पर विचार करें: 7 महिलाएं और 5 पुरुष।

तालिका 5.1.1. वन-वे एनोवा के लिए उदाहरण: 12 लोगों के लिंग और ऊंचाई पर डेटा

आइए भिन्नता का एक-तरफ़ा विश्लेषण करें: तुलना करें कि क्या विशिष्ट समूह में पुरुषों और महिलाओं की ऊंचाई में सांख्यिकीय रूप से महत्वपूर्ण अंतर है या नहीं।

5.2. सामान्य वितरण के लिए परीक्षण करें

आगे का तर्क इस तथ्य पर आधारित है कि विचाराधीन नमूने में वितरण सामान्य या सामान्य के करीब है। यदि वितरण सामान्य से दूर है, तो फैलाव (विचरण) इसकी परिवर्तनशीलता का पर्याप्त माप नहीं है। हालाँकि, विचरण का विश्लेषण सामान्यता से वितरण विचलन के प्रति अपेक्षाकृत प्रतिरोधी है।

इन आंकड़ों का सामान्यता परीक्षण दो अलग-अलग तरीकों से किया जा सकता है। पहला: सांख्यिकी/बुनियादी सांख्यिकी/सारणी/वर्णनात्मक सांख्यिकी/सामान्यता टैब। टैब मेंसाधारण अवस्था आप चुन सकते हैं कि किस सामान्यता परीक्षण का उपयोग करना है। जब आप फ़्रीक्वेंसी टेबल बटन पर क्लिक करते हैं, तो एक फ़्रीक्वेंसी तालिका दिखाई देगी, और हिस्टोग्राम बटन एक हिस्टोग्राम प्रदर्शित करेगा। तालिका और हिस्टोग्राम विभिन्न परीक्षणों के परिणाम दिखाएंगे।

दूसरी विधि हिस्टोग्राम बनाते समय उपयुक्त क्षमताओं के उपयोग से जुड़ी है। हिस्टोग्राम (ग्राफ़ / हिस्टोग्राम...) के निर्माण के लिए संवाद में, उन्नत टैब का चयन करें। सबसे नीचे एक सांख्यिकी ब्लॉक है. आइए इस पर शापिरो-विल्क अंकित करेंटी एस्ट और कोलमोगोरोव-स्मिरनोव परीक्षण, जैसा कि चित्र में दिखाया गया है।

चावल। 5.2.1. हिस्टोग्राम बिल्डिंग डायलॉग में वितरण की सामान्यता के लिए सांख्यिकीय परीक्षण

जैसा कि हिस्टोग्राम से देखा जा सकता है, हमारे नमूने में वृद्धि का वितरण सामान्य से भिन्न है (बीच में एक "विफलता" है)।


चावल। 5.2.2. हिस्टोग्राम पिछले चित्र में निर्दिष्ट मापदंडों के साथ बनाया गया है

ग्राफ़ शीर्षक में तीसरी पंक्ति सामान्य वितरण के मापदंडों को इंगित करती है जिसके लिए मनाया गया वितरण निकटतम निकला। कुल माध्य 173 है और समग्र मानक विचलन 10.4 है। ग्राफ़ में नीचे दिया गया इनसेट सामान्यता परीक्षणों के परिणाम दिखाता है। डी कोलमोगोरोव-स्मिरनोव परीक्षण है, और एसडब्ल्यू-डब्ल्यू शापिरो-विल्क परीक्षण है। जैसा कि देखा जा सकता है, उपयोग किए गए सभी परीक्षणों के लिए, सामान्य वितरण से ऊंचाई वितरण में अंतर सांख्यिकीय रूप से महत्वहीन निकला ( पी सभी मामलों में 0.05 से अधिक)।

इसलिए, औपचारिक रूप से बोलते हुए, वितरण के सामान्य होने के परीक्षणों ने हमें धारणा के आधार पर पैरामीट्रिक विधि का उपयोग करने से "मना" नहीं किया। सामान्य वितरण. जैसा कि पहले ही उल्लेख किया गया है, विचरण का विश्लेषण सामान्यता से विचलन के प्रति अपेक्षाकृत प्रतिरोधी है, इसलिए हम अभी भी इसका उपयोग करेंगे।

5.3. विचरण का एकतरफ़ा विश्लेषण: मैन्युअल गणना

दिए गए उदाहरण में लोगों की ऊंचाई की परिवर्तनशीलता को दर्शाने के लिए, आइए वर्ग विचलन के योग की गणना करें (अंग्रेजी में इसे इस प्रकार दर्शाया गया है) एसएस , वर्गों का योग या ) औसत से व्यक्तिगत मान: . उपरोक्त उदाहरण में ऊँचाई का औसत मान 173 सेंटीमीटर है। इस पर आधारित,

एसएस = (186–173) 2 + (169–173) 2 + (166–173) 2 + (188–173) 2 + (172–173) 2 + (179–173) 2 + (165–173) 2 + (174–173) 2 + (163–173) 2 + (162–173) 2 + (162–173) 2 + (190–173) 2 ;

एसएस = 132 + 42 + 72 + 152 + 12 + 62 + 82 + 12 + 102 + 112 + 112 + 172;

एसएस = 169 + 16 + 49 + 225 + 1 + 36 + 64 + 1 + 100 + 121 + 121 + 289 = 1192.

परिणामी मान (1192) संपूर्ण डेटा सेट की परिवर्तनशीलता का एक माप है। हालाँकि, उनमें दो समूह शामिल हैं, जिनमें से प्रत्येक का अपना औसत हो सकता है। दिए गए डेटा में औसत ऊंचाईमहिलाएं - 168 सेमी, और पुरुष - 180 सेमी।

आइए महिलाओं के लिए वर्ग विचलन के योग की गणना करें:

एसएस एफ = (169–168) 2 + (166–168) 2 + (172–168) 2 + (179–168) 2 + (163–168) 2 + (162–168) 2 ;

एसएस एफ = 12 + 22 + 42 + 112 + 32 + 52 + 62 = 1 + 4 + 16 + 121 + 9 + 25 + 36 = 212.

हम पुरुषों के लिए वर्ग विचलन के योग की भी गणना करते हैं:

एसएस एम = (186–180) 2 + (188–180) 2 + (174–180) 2 + (162–180) 2 + (190–180) 2 ;

एसएस एम = 62 + 82 + 62 + 182 + 102 = 36 + 64 + 36 + 324 + 100 = 560.

विचरण विश्लेषण के तर्क के अनुसार अध्ययनाधीन मूल्य किस पर निर्भर करता है?

दो परिकलित मान, एसएस एफ और एसएस एम , इंट्राग्रुप भिन्नता को चिह्नित करें, जिसे भिन्नता विश्लेषण में आमतौर पर "त्रुटि" कहा जाता है। इस नाम की उत्पत्ति निम्नलिखित तर्क से जुड़ी है।

इस उदाहरण में किसी व्यक्ति की ऊंचाई क्या निर्धारित करती है? सबसे पहले, सामान्य रूप से लोगों की औसत ऊंचाई पर, चाहे उनका लिंग कुछ भी हो। दूसरा - फर्श से. यदि एक लिंग (पुरुष) के लोग दूसरे (महिला) की तुलना में लम्बे हैं, तो इसे कुछ मूल्य के "सार्वभौमिक" औसत, लिंग प्रभाव के अतिरिक्त के रूप में दर्शाया जा सकता है। अंततः, एक ही लिंग के लोगों की लंबाई व्यक्तिगत भिन्नताओं के कारण भिन्न होती है। एक मॉडल में जो ऊंचाई को मानव औसत और लिंग के समायोजन के योग के रूप में वर्णित करता है, व्यक्तिगत अंतर अस्पष्ट हैं और इसे "त्रुटि" माना जा सकता है।

तो, विचरण के विश्लेषण के तर्क के अनुसार, अध्ययन के तहत मूल्य निम्नानुसार निर्धारित किया जाता है: , कहाँ एक्स आईजे - अध्ययन किए गए कारक के जे-वें मूल्य पर अध्ययन की गई मात्रा का i-वां मूल्य; - सामान्य औसत; एफ.जे - अध्ययन किए जा रहे कारक के जे-वें मान का प्रभाव; - "त्रुटि", उस वस्तु की वैयक्तिकता का योगदान जिससे मूल्य संदर्भित होता हैएक्स आईजे .

वर्गों का अंतरसमूह योग

इसलिए, एसएस त्रुटियाँ = एसएस एफ + एसएस एम = 212 + 560 = 772. इस मान के साथ हमने इंट्राग्रुप परिवर्तनशीलता (जब लिंग के आधार पर समूहों को अलग किया जाता है) का वर्णन किया। लेकिन परिवर्तनशीलता का एक दूसरा भाग भी है - अंतरसमूह परिवर्तनशीलता, जिसे हम अंतरसमूह परिवर्तनशीलता कहेंगेएसएस प्रभाव (चूंकि हम विचाराधीन वस्तुओं की समग्रता को महिलाओं और पुरुषों में विभाजित करने के प्रभाव के बारे में बात कर रहे हैं)।

प्रत्येक समूह का माध्य समग्र माध्य से भिन्न होता है। परिवर्तनशीलता के समग्र माप में इस अंतर के योगदान की गणना करते समय, हमें समूह और समग्र औसत के बीच के अंतर को प्रत्येक समूह में वस्तुओं की संख्या से गुणा करना होगा।

एसएस प्रभाव = = 7×(168-173) 2 + 5×(180-173) 2 = 7×52 + 5×72 = 7×25 + 5×49 = 175 + 245 = 420.

यहां फिशर द्वारा खोजे गए वर्गों के योग की स्थिरता का सिद्धांत स्वयं प्रकट हुआ: एसएस = प्रभाव एसएस + त्रुटि एसएस , अर्थात। इस उदाहरण के लिए, 1192 = 440 + 722.

औसत वर्ग

हमारे उदाहरण में वर्गों के अंतरसमूह और अंतरसमूह योग की तुलना करने पर, हम देख सकते हैं कि पहला दो समूहों की भिन्नता से जुड़ा है, और दूसरा 2 समूहों में 12 मानों से जुड़ा है। स्वतंत्रता की डिग्री की संख्या ( डीएफ ) कुछ पैरामीटर के लिए समूह में वस्तुओं की संख्या और इन मात्राओं को जोड़ने वाली निर्भरताओं (समीकरणों) की संख्या के बीच अंतर के रूप में परिभाषित किया जा सकता है।

हमारे उदाहरण में डीएफ प्रभाव = 2–1 = 1, ए डीएफ त्रुटियाँ = 12–2 = 10.

हम वर्गों के योग को उनकी स्वतंत्रता की डिग्री की संख्या से विभाजित कर सकते हैं, जिससे हमें औसत वर्ग प्राप्त होता है ( एमएस , वर्गों का मतलब)। ऐसा करने पर हम उसे स्थापित कर सकते हैं एमएस - विविधताओं से अधिक कुछ नहीं ("भिन्नता", वर्गों के योग को स्वतंत्रता की डिग्री की संख्या से विभाजित करने का परिणाम)। इस खोज के बाद हम एनोवा टेबल की संरचना को समझ सकते हैं। हमारे उदाहरण के लिए, यह इस तरह दिखेगा.

प्रभाव

गलती

एमएस प्रभाव और एमएस त्रुटियाँ इंटरग्रुप और इंट्राग्रुप विचरण के अनुमान हैं, और इसलिए, उनकी तुलना मानदंड के अनुसार की जा सकती हैएफ (स्नेडेकोर का मानदंड, जिसका नाम फिशर के नाम पर रखा गया है), विविधताओं की तुलना करने के लिए डिज़ाइन किया गया है। यह मानदंड केवल बड़े बदलाव को छोटे से विभाजित करने का भागफल है। हमारे मामले में यह 420 / 77.2 = 5.440 है।

तालिकाओं का उपयोग करके फिशर परीक्षण का सांख्यिकीय महत्व निर्धारित करना

यदि हमें तालिकाओं का उपयोग करके मैन्युअल रूप से प्रभाव का सांख्यिकीय महत्व निर्धारित करना था, तो हमें परिणामी मानदंड मान की तुलना करने की आवश्यकता होगी एफ स्वतंत्रता की दी गई डिग्री के लिए सांख्यिकीय महत्व के एक निश्चित स्तर के अनुरूप एक महत्वपूर्ण मूल्य के साथ।


चावल। 5.3.1. महत्वपूर्ण मानदंड मानों वाली तालिका का टुकड़ा एफ

जैसा कि आप देख सकते हैं, सांख्यिकीय महत्व के स्तर p=0.05 के लिए मानदंड का महत्वपूर्ण मान हैएफ 4.96 है. इसका मतलब यह है कि हमारे उदाहरण में अध्ययन किए गए लिंग का प्रभाव 0.05 के सांख्यिकीय महत्व स्तर पर दर्ज किया गया था।

प्राप्त परिणाम की व्याख्या इस प्रकार की जा सकती है। शून्य परिकल्पना की संभावना, जिसके अनुसार महिलाओं और पुरुषों की औसत ऊंचाई समान है, और उनकी ऊंचाई में दर्ज अंतर नमूनों के चयन में यादृच्छिकता के कारण है, 5% से कम है। इसका मतलब यह है कि हमें वैकल्पिक परिकल्पना चुननी चाहिए, जो यह है कि महिलाओं और पुरुषों की औसत ऊंचाई अलग-अलग है।

5.4. विचरण का एकतरफ़ा विश्लेषण (एनोवा) स्टेटिस्टिका पैकेज में

ऐसे मामलों में जहां गणना मैन्युअल रूप से नहीं की जाती है, बल्कि उपयुक्त प्रोग्राम (उदाहरण के लिए, स्टेटिस्टिका पैकेज) का उपयोग करके की जाती है, मान पी स्वचालित रूप से निर्धारित. आप सत्यापित कर सकते हैं कि यह महत्वपूर्ण मान से थोड़ा अधिक है।

विचरण विश्लेषण के सबसे सरल संस्करण का उपयोग करके चर्चा के तहत उदाहरण का विश्लेषण करने के लिए, आपको संबंधित डेटा के साथ फ़ाइल के लिए सांख्यिकी / एनोवा प्रक्रिया चलाने की आवश्यकता है और विश्लेषण विंडो के प्रकार और त्वरित चश्मा संवाद में वन-वे एनोवा विकल्प का चयन करना होगा। विशिष्टता विधि विंडो में विकल्प।


चावल। 5.4.1. डायलॉग जनरल एनोवा/मनोवा (विचरण का विश्लेषण)

खुलने वाली त्वरित संवाद विंडो में, वेरिएबल फ़ील्ड में, आपको उन कॉलमों को निर्दिष्ट करना होगा जिनमें वह डेटा शामिल है जिसकी परिवर्तनशीलता का हम अध्ययन कर रहे हैं (आश्रित चर सूची; हमारे मामले में, ग्रोथ कॉलम), साथ ही मानों वाला एक कॉलम ​​जो अध्ययन किए जा रहे मूल्य को समूहों में विभाजित करता है (श्रेणीबद्ध भविष्यवक्ता (कारक); हमारे मामले में, सेक्स कॉलम)। विश्लेषण के इस संस्करण में, बहुभिन्नरूपी विश्लेषण के विपरीत, केवल एक कारक पर विचार किया जा सकता है।


चावल। 5.4.2. डायलॉग वन-वे एनोवा (विचरण का एकतरफा विश्लेषण)

फैक्टर कोड विंडो में, आपको विचाराधीन कारक के उन मूल्यों को इंगित करना चाहिए जिन्हें इस विश्लेषण के दौरान संसाधित करने की आवश्यकता है। सभी उपलब्ध मान ज़ूम बटन का उपयोग करके देखे जा सकते हैं; यदि, जैसा कि हमारे उदाहरण में है, आपको कारक के सभी मूल्यों पर विचार करने की आवश्यकता है (और हमारे उदाहरण में लिंग के लिए केवल दो हैं), तो आप सभी बटन पर क्लिक कर सकते हैं। जब संसाधित किए जाने वाले कॉलम और कारक कोड निर्दिष्ट किए जाते हैं, तो आप ओके पर क्लिक कर सकते हैं और विंडो पर जा सकते हैं त्वरित विश्लेषणपरिणाम: एनोवा परिणाम 1, त्वरित टैब में।

चावल। 5.4.3. एनोवा परिणाम विंडो का त्वरित टैब

सभी प्रभाव/ग्राफ़ बटन आपको यह देखने की अनुमति देता है कि दो समूहों के साधनों की तुलना कैसे की जाती है। ग्राफ़ के ऊपर स्वतंत्रता की डिग्री की संख्या, साथ ही प्रश्न में कारक के लिए एफ और पी मान दर्शाए गए हैं।


चावल। 5.4.4. एनोवा परिणामों का चित्रमय प्रदर्शन

सभी प्रभाव बटन आपको ऊपर वर्णित (कुछ महत्वपूर्ण अंतरों के साथ) के समान भिन्नता तालिका का विश्लेषण प्राप्त करने की अनुमति देता है।


चावल। 5.4.5. विचरण के विश्लेषण के परिणामों के साथ तालिका (“मैन्युअल रूप से प्राप्त” समान तालिका के साथ तुलना करें)

तालिका की निचली पंक्ति वर्गों का योग, स्वतंत्रता की डिग्री की संख्या और त्रुटि के लिए औसत वर्ग (समूह के भीतर परिवर्तनशीलता) दर्शाती है। उपरोक्त पंक्ति में अध्ययनाधीन कारक के लिए समान संकेतक हैं (में इस मामले में- साइन सेक्स), साथ ही मानदंड एफ (प्रभाव के माध्य वर्गों का त्रुटि के माध्य वर्गों से अनुपात), और इसके सांख्यिकीय महत्व का स्तर। यह तथ्य कि विचाराधीन कारक का प्रभाव सांख्यिकीय रूप से महत्वपूर्ण निकला, लाल रंग द्वारा दिखाया गया है।

और पहली पंक्ति "इंटरसेप्ट" संकेतक पर डेटा दिखाती है। यह तालिका पंक्ति छठे या बाद के संस्करण में स्टेटिस्टिका से जुड़ने वाले उपयोगकर्ताओं के लिए एक पहेली प्रस्तुत करती है। इंटरसेप्ट मान संभवतः सभी डेटा मानों के वर्गों के योग के अपघटन से संबंधित है (यानी 1862 + 1692 ... = 360340)। इसके लिए दर्शाया गया एफ मानदंड मान विभाजित करके प्राप्त किया गया था एमएस इंटरसेप्ट/एमएस त्रुटि = 353220 / 77.2 = 4575.389 और, स्वाभाविक रूप से, बहुत कुछ देता है कम मूल्य पी . यह दिलचस्प है कि स्टेटिस्टिका-5 में इस मान की बिल्कुल भी गणना नहीं की गई थी, और पैकेज के बाद के संस्करणों का उपयोग करने के लिए मैनुअल इसके परिचय पर किसी भी तरह से टिप्पणी नहीं करते हैं। स्टेटिस्टिका-6 और उसके बाद का उपयोग करने वाला एक जीवविज्ञानी संभवतः सबसे अच्छी बात यह कर सकता है कि एनोवा तालिका में इंटरसेप्ट पंक्ति को अनदेखा कर दिया जाए।

5.5. एनोवा और स्टूडेंट और फिशर का टी-टेस्ट: कौन सा बेहतर है?

जैसा कि आपने देखा होगा, जिस डेटा की तुलना हमने विचरण के एक-तरफ़ा विश्लेषण का उपयोग करके की है, हम छात्र और फिशर परीक्षणों का उपयोग करके भी जांच कर सकते हैं। आइए इन दोनों तरीकों की तुलना करें। ऐसा करने के लिए, आइए इन मानदंडों का उपयोग करके पुरुषों और महिलाओं के बीच ऊंचाई में अंतर की गणना करें। ऐसा करने के लिए, हमें समूहों द्वारा स्वतंत्र, सांख्यिकी/बुनियादी सांख्यिकी/टी-परीक्षण पथ का अनुसरण करना होगा। स्वाभाविक रूप से, आश्रित चर वृद्धि चर हैं, और समूहीकरण चर लिंग चर है।


चावल। 5.5.1. छात्र और फिशर परीक्षणों का उपयोग करके एनोवा का उपयोग करके संसाधित डेटा की तुलना

जैसा कि आप देख सकते हैं, परिणाम एनोवा का उपयोग करने जैसा ही है। पी = दोनों मामलों में 0.041874, जैसा चित्र में दिखाया गया है। 5.4.5, और चित्र में दिखाया गया है। 5.5.2 (इसे स्वयं देखें!)।


चावल। 5.5.2. विश्लेषण के परिणाम (परिणामों की तालिका का विस्तृत विवरण - छात्र के परीक्षण के लिए समर्पित पैराग्राफ में)

इस बात पर जोर देना महत्वपूर्ण है कि यद्यपि छात्र और फिशर परीक्षणों के अनुसार विचाराधीन विश्लेषण में गणितीय दृष्टिकोण से एफ मानदंड एनोवा के समान है (और विचरण अनुपात को व्यक्त करता है), प्रस्तुत विश्लेषण परिणामों में इसका अर्थ है अंतिम तालिका बिल्कुल अलग है. छात्र और फिशर के परीक्षणों द्वारा तुलना करते समय, नमूना साधनों की तुलना छात्र के परीक्षण द्वारा की जाती है, और उनकी परिवर्तनशीलता की तुलना फिशर के परीक्षण द्वारा की जाती है। विश्लेषण के परिणाम भिन्नता को नहीं, बल्कि उसकी भिन्नता को प्रदर्शित करते हैं वर्गमूल- मानक विचलन।

इसके विपरीत, एनोवा नमूनों में माध्य की तुलना करने के लिए फिशर के परीक्षण का उपयोग करता है (जैसा कि हमने चर्चा की, यह वर्गों के योग को विभाजित करके और बीच और भीतर-विषय परिवर्तनशीलता के अनुरूप वर्गों के औसत योग की तुलना करके किया जाता है)।

हालाँकि, उपरोक्त अंतर परिणामों की प्रस्तुति से संबंधित है। सांख्यिकीय अनुसंधानइसके सार की तुलना में. जैसा कि ग्लैंट्ज़ (1999, पृष्ठ 99) बताते हैं, उदाहरण के लिए, छात्र के टी परीक्षण का उपयोग करने वाले समूहों की तुलना को इस प्रकार देखा जा सकता है विशेष मामलादो नमूनों के लिए भिन्नता का विश्लेषण।

तो, छात्र और फिशर के परीक्षणों का उपयोग करके नमूनों की तुलना में एक बात है महत्वपूर्ण लाभविचरण के विश्लेषण से पहले: इसमें नमूनों की तुलना उनकी परिवर्तनशीलता के संदर्भ में की जा सकती है। लेकिन विचरण के विश्लेषण के लाभ अभी भी अधिक महत्वपूर्ण हैं। इनमें शामिल हैं, उदाहरण के लिए, एक साथ कई नमूनों की तुलना करने की क्षमता।

विचरण का विश्लेषण एक सांख्यिकीय पद्धति है जिसे किसी प्रयोग के परिणाम पर विभिन्न कारकों के प्रभाव का आकलन करने के साथ-साथ इसी तरह के प्रयोगों की बाद की योजना के लिए डिज़ाइन किया गया है।

प्रारंभ में (1918), विचरण का विश्लेषण अंग्रेजी गणितज्ञ और सांख्यिकीविद् आर.ए. द्वारा विकसित किया गया था। फिशर को कृषि फसलों की विभिन्न किस्मों की अधिकतम उपज प्राप्त करने के लिए स्थितियों की पहचान करने के लिए कृषि संबंधी प्रयोगों के परिणामों को संसाधित करना था।

एक प्रयोग स्थापित करते समय, निम्नलिखित शर्तों को पूरा किया जाना चाहिए:

    प्रयोग के प्रत्येक प्रकार को कई अवलोकन इकाइयों (जानवरों के समूह, क्षेत्र अनुभाग, आदि) पर किया जाना चाहिए।

    प्रयोगात्मक वेरिएंट के बीच अवलोकन इकाइयों का वितरण यादृच्छिक होना चाहिए न कि जानबूझकर।

एनोवा उपयोग करता है एफ-मानदंड(आर.ए. फिशर मानदंड), दो भिन्नताओं के अनुपात का प्रतिनिधित्व करता है:

जहां डी तथ्य, डी अवशिष्ट - फैक्टोरियल (इंटरग्रुप) और अवशिष्ट (इंट्राग्रुप) क्रमशः स्वतंत्रता की डिग्री के अनुसार भिन्नताएं हैं।

कारक और अवशिष्ट प्रसरण जनसंख्या विचरण के अनुमान हैं, जिनकी गणना नमूना डेटा से की जाती है, जिसमें भिन्नता की स्वतंत्रता की डिग्री की संख्या को ध्यान में रखा जाता है।

कारक (अंतरसमूह) फैलाव अध्ययन किए जा रहे कारक के प्रभाव के तहत प्रभावी विशेषता की भिन्नता की व्याख्या करता है।

अवशिष्ट (समूह के भीतर) विचरण अन्य कारकों के प्रभाव (अध्ययन किए जा रहे कारक के प्रभाव को छोड़कर) के कारण प्रभावी विशेषता में भिन्नता की व्याख्या करता है।

संक्षेप में, कारक और अवशिष्ट प्रसरण, परिणामी कारक पर सभी कारक विशेषताओं के प्रभाव को व्यक्त करते हुए, कुल विचरण देते हैं।

विचरण का विश्लेषण करने की प्रक्रिया:

1. प्रायोगिक डेटा को एक गणना तालिका में दर्ज किया जाता है और अध्ययन की जा रही आबादी के प्रत्येक समूह में मात्रा और औसत मूल्य निर्धारित किया जाता है, साथ ही संपूर्ण आबादी के लिए कुल राशि और औसत मूल्य (तालिका 1) निर्धारित किया जाता है।

तालिका नंबर एक

i-वें इकाई के लिए परिणामी विशेषता का मान

जे-वें समूह में, एक्स आईजे

प्रेक्षणों की संख्या, एफ जे

औसत (समूह और कुल), x j

x 11, x 12, …, x 1 एन

x 21, x 22, …, x 2 एन

एक्स एम 1, एक्स एम 2, ..., एक्स एमएन

प्रेक्षणों की कुल संख्या एनअवलोकनों की संख्या के योग के रूप में गणना की गई एफ जेप्रत्येक समूह में:

यदि सभी समूहों में तत्वों की संख्या समान है, तो कुल औसत समूह माध्य से एक साधारण अंकगणितीय माध्य के रूप में पाया जाता है:

यदि समूहों में तत्वों की संख्या भिन्न है, तो समग्र औसत भारित अंकगणित माध्य सूत्र का उपयोग करके गणना की गई:

2. कुल विचरण निर्धारित होता है डी आम तौर परपरिणामी विशेषता के व्यक्तिगत मूल्यों के वर्ग विचलन के योग के रूप में कुल औसत से :

3. फैक्टोरियल (इंटरग्रुप) विचरण की गणना की जाती है डी तथ्यसमूह माध्य के वर्ग विचलनों के योग के रूप में कुल औसत से , अवलोकनों की संख्या से गुणा किया गया:

4. अवशिष्ट (इंट्राग्रुप) विचरण का मान निर्धारित किया जाता है डी ओस्टकुल के बीच अंतर के रूप में डी आम तौर परऔर भाज्य डी तथ्यभिन्नताएँ:

5. कारक की स्वतंत्रता की कोटियों की संख्या की गणना करें
समूहों की संख्या के बीच अंतर के रूप में भिन्नता एमऔर इकाई:

6. अवशिष्ट फैलाव के लिए स्वतंत्रता की डिग्री की संख्या निर्धारित की जाती है
किसी विशेषता के व्यक्तिगत मूल्यों की संख्या के बीच अंतर के रूप में एनऔर समूहों की संख्या एम:

7. स्वतंत्रता की एक डिग्री के अनुसार कारक फैलाव के मूल्य की गणना की जाती है डी तथ्यकारक विचरण अनुपात के रूप में डी तथ्यकारक फैलाव की स्वतंत्रता की डिग्री की संख्या तक
:

8. स्वतंत्रता की एक डिग्री के अनुसार अवशिष्ट फैलाव का मान निर्धारित किया जाता है डी ओस्टअवशिष्ट विचरण अनुपात के रूप में डी ओस्टअवशिष्ट फैलाव की स्वतंत्रता की डिग्री की संख्या तक
:

9. एफ-मानदंड का परिकलित मान निर्धारित किया जाता है एफ-गणनास्वतंत्रता की प्रति डिग्री कारक भिन्नता के अनुपात के रूप में डी तथ्यस्वतंत्रता की प्रति डिग्री अवशिष्ट भिन्नता के लिए डी ओस्ट :

10. फिशर एफ परीक्षण तालिका का उपयोग करते हुए, अध्ययन में अपनाए गए महत्व के स्तर को ध्यान में रखते हुए, साथ ही कारक और अवशिष्ट भिन्नताओं के लिए स्वतंत्रता की डिग्री को ध्यान में रखते हुए, सैद्धांतिक मूल्य पाया जाता है एफ मेज़ .

5% महत्व स्तर 95% संभाव्यता स्तर से मेल खाता है, और 1% महत्व स्तर 99% संभाव्यता स्तर से मेल खाता है। ज्यादातर मामलों में, 5% महत्व स्तर का उपयोग किया जाता है।

सैद्धांतिक मूल्य एफ मेज़किसी दिए गए स्तर पर महत्व एक पंक्ति और एक स्तंभ के प्रतिच्छेदन पर तालिकाओं से निर्धारित होता है, जो भिन्नताओं की स्वतंत्रता की दो डिग्री के अनुरूप होता है:

पंक्ति द्वारा - अवशिष्ट;

स्तंभ द्वारा - भाज्य.

11. गणना परिणाम एक तालिका (तालिका 2) में प्रस्तुत किए गए हैं।

सभी लोग स्वभावतः ज्ञान के लिए प्रयास करते हैं। (अरस्तू। तत्वमीमांसा)

भिन्नता का विश्लेषण

परिचयात्मक सिंहावलोकन

इस अनुभाग में, हम एनोवा की बुनियादी विधियों, मान्यताओं और शब्दावली की समीक्षा करेंगे।

ध्यान दें कि अंग्रेजी भाषा के साहित्य में, भिन्नता के विश्लेषण को आमतौर पर भिन्नता का विश्लेषण कहा जाता है। इसलिए, संक्षिप्तता के लिए, नीचे हम कभी-कभी इस शब्द का उपयोग करेंगे एनोवा (एकविश्लेषण हेएफ वाराशन) साधारण एनोवा और शब्द के लिए मनोवाविचरण के बहुभिन्नरूपी विश्लेषण के लिए। इस अनुभाग में हम विचरण के विश्लेषण के मुख्य विचारों की क्रमिक समीक्षा करेंगे ( एनोवा), सहप्रसरण का विश्लेषण ( एंकोवा), विचरण का बहुभिन्नरूपी विश्लेषण ( मनोवा) और सहप्रसरण का बहुभिन्नरूपी विश्लेषण ( मनकोवा). कंट्रास्ट विश्लेषण और पोस्ट हॉक परीक्षणों की खूबियों की संक्षिप्त चर्चा के बाद, आइए उन धारणाओं पर नजर डालें जिन पर एनोवा विधियां आधारित हैं। इस खंड के अंत में, पारंपरिक अविभाज्य दृष्टिकोण की तुलना में बार-बार माप विश्लेषण के लिए बहुभिन्नरूपी दृष्टिकोण के फायदे बताए गए हैं।

प्रमुख विचार

विचरण के विश्लेषण का उद्देश्य.विचरण के विश्लेषण का मुख्य उद्देश्य साधनों के बीच अंतर के महत्व की जांच करना है। अध्याय (अध्याय 8) सांख्यिकीय महत्व के अध्ययन का संक्षिप्त परिचय प्रदान करता है। यदि आप केवल दो नमूनों के माध्य की तुलना कर रहे हैं, तो विचरण का विश्लेषण सामान्य विश्लेषण के समान परिणाम देगा। टी- स्वतंत्र नमूनों के लिए परीक्षण (यदि वस्तुओं या अवलोकनों के दो स्वतंत्र समूहों की तुलना की जाती है) या टी- आश्रित नमूनों के लिए मानदंड (यदि दो चर की तुलना वस्तुओं या अवलोकनों के एक ही सेट पर की जाती है)। यदि आप इन मानदंडों से परिचित नहीं हैं, तो हम अनुशंसा करते हैं कि आप परिचयात्मक अध्याय अवलोकन देखें (अध्याय 9).

नाम कहां से आया भिन्नता का विश्लेषण? यह अजीब लग सकता है कि साधनों की तुलना करने की प्रक्रिया को विचरण का विश्लेषण कहा जाता है। वास्तव में, ऐसा इसलिए है क्योंकि जब हम साधनों के बीच अंतर के सांख्यिकीय महत्व की जांच करते हैं, तो हम वास्तव में भिन्नताओं का विश्लेषण कर रहे होते हैं।

वर्गों के योग का विभाजन

नमूना आकार n के लिए, नमूना विचरण की गणना नमूना माध्य से वर्ग विचलन के योग को n-1 (नमूना आकार शून्य से एक) से विभाजित करके की जाती है। इस प्रकार, एक निश्चित नमूना आकार n के लिए, विचरण वर्गों (विचलन) के योग का एक कार्य है, जिसे संक्षिप्तता के लिए दर्शाया गया है, एसएस(अंग्रेजी से वर्गों का योग - वर्गों का योग)। विचरण विश्लेषण का आधार विचरण को भागों में अलग करना (या विभाजित करना) है। निम्नलिखित डेटा सेट पर विचार करें:

दोनों समूहों के साधन काफी भिन्न हैं (क्रमशः 2 और 6)। वर्ग विचलनों का योग अंदरप्रत्येक समूह 2 के बराबर है। उन्हें जोड़ने पर, हमें 4 मिलता है। यदि हम अब इन गणनाओं को दोहराते हैं के सिवासमूह सदस्यता, अर्थात, यदि हम गणना करें एसएसदो नमूनों के समग्र माध्य के आधार पर, हमें 28 मिलते हैं। दूसरे शब्दों में, समूह के भीतर परिवर्तनशीलता के आधार पर विचरण (वर्गों का योग) का परिणाम समग्र परिवर्तनशीलता (के सापेक्ष) के आधार पर गणना करने की तुलना में बहुत कम होता है। समग्र माध्य). इसका कारण स्पष्ट रूप से साधनों के बीच एक महत्वपूर्ण अंतर है, और साधनों के बीच यह अंतर वर्गों के योग के बीच मौजूदा अंतर को स्पष्ट करता है। वास्तव में, यदि आप दिए गए डेटा का विश्लेषण करने के लिए मॉड्यूल का उपयोग करते हैं भिन्नता का विश्लेषण, निम्नलिखित परिणाम प्राप्त होंगे:

जैसा कि तालिका से देखा जा सकता है, वर्गों का कुल योग एसएस=28 को दिए गए वर्गों के योग से विभाजित किया जाता है इंट्राग्रुपपरिवर्तनशीलता ( 2+2=4 ; तालिका की दूसरी पंक्ति देखें) और माध्य मानों में अंतर के कारण वर्गों का योग। (28-(2+2)=24; तालिका की पहली पंक्ति देखें)।

एसएस त्रुटियाँ औरएसएस प्रभाव।समूह के भीतर परिवर्तनशीलता ( एसएस) को आमतौर पर फैलाव कहा जाता है त्रुटियाँ.इसका मतलब यह है कि जब कोई प्रयोग किया जाता है तो आमतौर पर इसकी भविष्यवाणी या व्याख्या नहीं की जा सकती है। दूसरी ओर, एसएस प्रभाव(या समूह के बीच परिवर्तनशीलता) को अध्ययन समूहों के साधनों के बीच अंतर द्वारा समझाया जा सकता है। दूसरे शब्दों में, एक निश्चित समूह से संबंधित बताते हैंअंतरसमूह परिवर्तनशीलता, क्योंकि हम जानते हैं कि इन समूहों के अलग-अलग साधन हैं।

महत्व की जाँच.अध्याय में सांख्यिकीय महत्व परीक्षण के मूल विचारों पर चर्चा की गई है सांख्यिकी की बुनियादी अवधारणाएँ(अध्याय 8). यह अध्याय उन कारणों की भी व्याख्या करता है कि क्यों कई परीक्षण स्पष्ट और अस्पष्टीकृत विचरण के अनुपात का उपयोग करते हैं। इस प्रयोग का एक उदाहरण स्वयं विचरण का विश्लेषण है। विचरण के विश्लेषण में महत्व का परीक्षण समूह-समूह विचरण (जिसे कहा जाता है) के कारण विचरण की तुलना करने पर आधारित है माध्य वर्ग प्रभावया एमएसप्रभाव) और समूह के भीतर भिन्नता के कारण भिन्नता (कहा जाता है)। औसत वर्ग त्रुटिया एमएसगलती). यदि शून्य परिकल्पना (दो आबादी में साधनों की समानता) सत्य है, तो किसी को यादृच्छिक भिन्नता के कारण नमूना साधनों में अपेक्षाकृत कम अंतर की उम्मीद होगी। इसलिए, शून्य परिकल्पना के तहत, समूह के भीतर भिन्नता व्यावहारिक रूप से समूह सदस्यता को ध्यान में रखे बिना गणना की गई कुल भिन्नता के साथ मेल खाएगी। समूह के भीतर परिणामी भिन्नताओं की तुलना का उपयोग करके की जा सकती है एफ- परीक्षण जो जाँचता है कि क्या विचरण अनुपात 1 से काफी अधिक है। ऊपर चर्चा किए गए उदाहरण में एफ- मानदंड दर्शाता है कि साधनों के बीच का अंतर सांख्यिकीय रूप से महत्वपूर्ण है।

विचरण के विश्लेषण का मूल तर्क.संक्षेप में कहें तो, एनोवा का उद्देश्य साधनों (समूहों या चरों के लिए) के बीच अंतर के सांख्यिकीय महत्व का परीक्षण करना है। यह जाँच विचरण के विश्लेषण का उपयोग करके की जाती है, अर्थात। कुल विचरण (भिन्नता) को भागों में विभाजित करके, जिनमें से एक यादृच्छिक त्रुटि (अर्थात इंट्राग्रुप परिवर्तनशीलता) के कारण होता है, और दूसरा माध्य मानों में अंतर से जुड़ा होता है। अंतिम विचरण घटक का उपयोग साधनों के बीच अंतर के सांख्यिकीय महत्व का विश्लेषण करने के लिए किया जाता है। यदि अंतर महत्वपूर्ण है, तो शून्य परिकल्पना को अस्वीकार कर दिया जाता है और वैकल्पिक परिकल्पना को स्वीकार कर लिया जाता है कि साधनों के बीच अंतर है।

आश्रित और स्वतंत्र चर.वे चर जिनका मान किसी प्रयोग के दौरान माप द्वारा निर्धारित किया जाता है (उदाहरण के लिए, एक परीक्षण स्कोर) कहलाते हैं आश्रितचर। वे चर जिन्हें किसी प्रयोग में नियंत्रित किया जा सकता है (उदाहरण के लिए, शिक्षण विधियों या अवलोकनों को समूहों में विभाजित करने के अन्य मानदंड) कहलाते हैं कारकोंया स्वतंत्रचर। इन अवधारणाओं का अध्याय में अधिक विस्तार से वर्णन किया गया है सांख्यिकी की बुनियादी अवधारणाएँ(अध्याय 8).

विचरण का बहुभिन्नरूपी विश्लेषण

ऊपरोक्त में सरल उदाहरणआप उपयुक्त मॉड्यूल विकल्प का उपयोग करके स्वतंत्र नमूनों के लिए तुरंत टी-परीक्षण की गणना कर सकते हैं बुनियादी आँकड़े और तालिकाएँ।प्राप्त परिणाम स्वाभाविक रूप से विचरण के विश्लेषण के परिणामों से मेल खाएंगे। हालाँकि, एनोवा में लचीली और शक्तिशाली तकनीकें शामिल हैं जिनका उपयोग अधिक जटिल अध्ययनों के लिए किया जा सकता है।

कई कारक।दुनिया प्रकृति में जटिल और बहुआयामी है। ऐसी स्थितियाँ जब एक निश्चित घटना को एक चर द्वारा पूरी तरह से वर्णित किया जाता है तो अत्यंत दुर्लभ होती हैं। उदाहरण के लिए, यदि हम यह सीखने की कोशिश कर रहे हैं कि बड़े टमाटर कैसे उगाए जाएं, तो हमें पौधे की आनुवंशिक संरचना, मिट्टी के प्रकार, प्रकाश, तापमान आदि से संबंधित कारकों पर विचार करना चाहिए। इस प्रकार, एक विशिष्ट प्रयोग करते समय, किसी को बड़ी संख्या में कारकों से निपटना पड़ता है। मुख्य कारण यह है कि विभिन्न कारक स्तरों पर दो नमूनों की बार-बार तुलना करने के बजाय एनोवा का उपयोग करना बेहतर है टी- मानदंड यह है कि विचरण का विश्लेषण अधिक है असरदारऔर, छोटे नमूनों के लिए, अधिक जानकारीपूर्ण।

कारक प्रबंधन.मान लीजिए कि ऊपर चर्चा किए गए दो-नमूना विश्लेषण उदाहरण में, हम एक और कारक जोड़ते हैं, उदाहरण के लिए ज़मीन- लिंग. माना कि प्रत्येक समूह में 3 पुरुष और 3 महिलाएँ हैं। इस प्रयोग का डिज़ाइन 2 बाय 2 तालिका के रूप में प्रस्तुत किया जा सकता है:

प्रयोग। समूह 1 प्रयोग। समूह 2
पुरुषों2 6
3 7
1 5
औसत2 6
औरत4 8
5 9
3 7
औसत4 8

गणना करने से पहले, आप देख सकते हैं कि इस उदाहरण में कुल विचरण के कम से कम तीन स्रोत हैं:

(1) यादृच्छिक त्रुटि (समूह भिन्नता के भीतर),

(2) प्रायोगिक समूह सदस्यता से जुड़ी परिवर्तनशीलता, और

(3) अवलोकन की वस्तुओं के लिंग के कारण परिवर्तनशीलता।

(ध्यान दें कि परिवर्तनशीलता का एक और संभावित स्रोत है - कारकों की परस्पर क्रिया, जिस पर हम बाद में चर्चा करेंगे)। अगर हम शामिल नहीं करेंगे तो क्या होगा ज़मीनलिंगविश्लेषण में एक कारक के रूप में और सामान्य गणना करें टी-मानदंड? यदि हम वर्गों के योग की गणना करते हैं, तो अनदेखा करें ज़मीन -लिंग(यानी, समूह के भीतर भिन्नता की गणना करते समय विभिन्न लिंगों की वस्तुओं को एक समूह में संयोजित करना, जिससे प्रत्येक समूह के लिए वर्गों का योग बराबर प्राप्त होता है एसएस=10, और वर्गों का कुल योग एसएस= 10+10 = 20), तो हम उपसमूहों में अतिरिक्त विभाजन के साथ अधिक सटीक विश्लेषण की तुलना में इंट्राग्रुप विचरण का एक बड़ा मूल्य प्राप्त करते हैं। आधा- लिंग(इस मामले में, समूह के भीतर का मतलब 2 के बराबर होगा, और समूह के भीतर वर्गों का कुल योग बराबर होगा एसएस = 2+2+2+2 = 8). यह अंतर इस तथ्य के कारण है कि औसत मूल्य पुरुषों - पुरुषोंके औसत से कम औरत -महिला, और जब लिंग पर ध्यान नहीं दिया जाता है तो साधनों में यह अंतर समूह के भीतर समग्र परिवर्तनशीलता को बढ़ाता है। त्रुटि विचरण को नियंत्रित करने से परीक्षण की संवेदनशीलता (शक्ति) बढ़ जाती है।

यह उदाहरण पारंपरिक की तुलना में विचरण विश्लेषण का एक और लाभ दिखाता है टी- दो नमूनों के लिए मानदंड। विचरण का विश्लेषण आपको शेष कारकों के मूल्यों को नियंत्रित करके प्रत्येक कारक का अध्ययन करने की अनुमति देता है। वास्तव में, यह इसकी अधिक सांख्यिकीय शक्ति का मुख्य कारण है (सार्थक परिणाम प्राप्त करने के लिए छोटे नमूना आकार की आवश्यकता होती है)। इस कारण से, छोटे नमूनों पर भी भिन्नता का विश्लेषण, सांख्यिकीय रूप से अधिक देता है महत्वपूर्ण परिणामसरल से अधिक टी- कसौटी.

इंटरेक्शन प्रभाव

पारंपरिक की तुलना में विचरण के विश्लेषण का उपयोग करने का एक और फायदा है टी- मानदंड: विचरण का विश्लेषण हमें पता लगाने की अनुमति देता है इंटरैक्शनकारकों के बीच और इसलिए अधिक जटिल मॉडल के अध्ययन की अनुमति देता है। स्पष्ट करने के लिए, एक और उदाहरण पर विचार करें।

मुख्य प्रभाव, जोड़ीवार (दो-कारक) इंटरैक्शन।मान लीजिए कि छात्रों के दो समूह हैं, और मनोवैज्ञानिक रूप से पहले समूह के छात्र निर्धारित कार्यों को पूरा करने के लिए दृढ़ हैं और दूसरे समूह के छात्रों की तुलना में अधिक उद्देश्यपूर्ण हैं, जिसमें आलसी छात्र शामिल हैं। आइए प्रत्येक समूह को बेतरतीब ढंग से आधे में विभाजित करें और प्रत्येक समूह के एक आधे हिस्से को एक कठिन कार्य दें और दूसरे आधे को एक आसान कार्य दें। फिर हम मापेंगे कि छात्र इन कार्यों पर कितनी मेहनत करते हैं। इस (काल्पनिक) अध्ययन का औसत तालिका में दिखाया गया है:

इन परिणामों से क्या निष्कर्ष निकाला जा सकता है? क्या हम यह निष्कर्ष निकाल सकते हैं कि: (1) छात्र किसी जटिल कार्य पर अधिक तीव्रता से काम करते हैं; (2) क्या प्रेरित छात्र आलसी छात्रों की तुलना में अधिक मेहनत करते हैं? इनमें से कोई भी कथन तालिका में दिखाए गए साधनों की व्यवस्थित प्रकृति का सार नहीं दर्शाता है। परिणामों का विश्लेषण करते हुए यह कहना अधिक सही होगा कि केवल प्रेरित छात्र ही कठिन कार्यों पर अधिक मेहनत करते हैं, जबकि केवल आलसी छात्र ही आसान कार्यों पर अधिक मेहनत करते हैं। दूसरे शब्दों में, छात्रों का चरित्र और कार्य की कठिनाई बातचीतखर्च किए गए प्रयास पर एक दूसरे को प्रभावित करें। यह एक उदाहरण है जोड़ी बातचीतविद्यार्थियों के चरित्र और कार्य की कठिनाई के बीच। ध्यान दें कि कथन 1 और 2 वर्णन करते हैं मुख्य प्रभाव.

उच्च-क्रम की अंतःक्रियाएँ।जबकि जोड़ीदार अंतःक्रियाओं को समझाना अभी भी अपेक्षाकृत आसान है, उच्च-क्रम की अंतःक्रियाओं को समझाना अधिक कठिन है। आइए कल्पना करें कि ऊपर दिए गए उदाहरण में, एक और कारक पेश किया गया है ज़मीन -लिंगऔर हमें औसत की निम्नलिखित तालिका मिली:

अब प्राप्त परिणामों से क्या निष्कर्ष निकाला जा सकता है? माध्य कथानक जटिल प्रभावों की व्याख्या करना आसान बनाते हैं। एनोवा मॉड्यूल आपको माउस के लगभग एक क्लिक से ये ग्राफ़ बनाने की अनुमति देता है।

नीचे दिए गए ग्राफ़ में छवि अध्ययन किए जा रहे तीन-कारक इंटरैक्शन का प्रतिनिधित्व करती है।

ग्राफ़ को देखकर, हम बता सकते हैं कि महिलाओं के लिए व्यक्तित्व और परीक्षण की कठिनाई के बीच परस्पर क्रिया होती है: प्रेरित महिलाएं आसान काम की तुलना में कठिन काम पर अधिक मेहनत करती हैं। पुरुषों के लिए, वही अंतःक्रिया उलट जाती है। यह देखा जा सकता है कि कारकों के बीच परस्पर क्रिया का विवरण अधिक भ्रमित करने वाला हो जाता है।

इंटरैक्शन का वर्णन करने का एक सामान्य तरीका.में सामान्य मामलाकारकों के बीच परस्पर क्रिया को एक प्रभाव में दूसरे के प्रभाव में परिवर्तन के रूप में वर्णित किया गया है। ऊपर चर्चा किए गए उदाहरण में, दो-कारक बातचीत को छात्र के चरित्र का वर्णन करने वाले कारक के प्रभाव में कार्य की कठिनाई को दर्शाने वाले कारक के मुख्य प्रभाव में बदलाव के रूप में वर्णित किया जा सकता है। पिछले पैराग्राफ के तीन कारकों की परस्पर क्रिया के लिए, हम कह सकते हैं कि दो कारकों (कार्य की कठिनाई और छात्र का चरित्र) की परस्पर क्रिया प्रभाव में बदल जाती है लिंगलिंग. यदि चार कारकों की परस्पर क्रिया का अध्ययन किया जाए, तो हम कह सकते हैं कि तीनों कारकों की परस्पर क्रिया चौथे कारक के प्रभाव में बदल जाती है, अर्थात। चौथे कारक के विभिन्न स्तरों पर विभिन्न प्रकार की अंतःक्रियाएँ होती हैं। यह पता चला है कि कई क्षेत्रों में पांच या उससे भी अधिक कारकों की परस्पर क्रिया असामान्य नहीं है।

जटिल योजनाएँ

समूह के बीच और समूह के भीतर डिज़ाइन (बार-बार माप डिज़ाइन)

दो की तुलना करते समय विभिन्न समूहआमतौर पर उपयोग किया जाता है टी- स्वतंत्र नमूनों के लिए मानदंड (मॉड्यूल से)। बुनियादी आँकड़े और तालिकाएँ). जब दो चरों की तुलना वस्तुओं (अवलोकनों) के एक ही सेट पर की जाती है, तो इसका उपयोग किया जाता है टी-आश्रित नमूनों के लिए मानदंड। विचरण के विश्लेषण के लिए यह भी महत्वपूर्ण है कि नमूने आश्रित हैं या नहीं। यदि एक ही चर के बार-बार माप होते हैं (साथ) अलग-अलग स्थितियाँया अलग-अलग समय पर) समान वस्तुओं के लिए, फिर वे उपस्थिति के बारे में बात करते हैं बार-बार उपाय कारक(यह भी कहा जाता है इंट्राग्रुप फैक्टर,चूंकि वर्गों के भीतर-समूह योग की गणना इसके महत्व का आकलन करने के लिए की जाती है)। यदि वस्तुओं के विभिन्न समूहों की तुलना की जाती है (उदाहरण के लिए, पुरुष और महिलाएं, बैक्टीरिया के तीन उपभेद, आदि), तो समूहों के बीच अंतर का वर्णन किया गया है अंतरसमूह कारक.वर्णित दो प्रकार के कारकों के लिए महत्व मानदंड की गणना करने की विधियाँ अलग-अलग हैं, लेकिन उनके सामान्य तर्क और व्याख्याएँ समान हैं।

अंतर- और अंतर-समूह योजनाएँ।कई मामलों में, प्रयोग के लिए डिज़ाइन में विषयों के बीच के कारक और बार-बार माप के कारक दोनों को शामिल करने की आवश्यकता होती है। उदाहरण के लिए, महिला और पुरुष छात्रों के गणित कौशल को मापा जाता है (जहाँ ज़मीन -लिंग-इंटरग्रुप फ़ैक्टर) सेमेस्टर की शुरुआत और अंत में। प्रत्येक छात्र के कौशल के दो माप एक समूह-समूह कारक (बार-बार माप कारक) बनाते हैं। विषयों के बीच मुख्य प्रभावों और अंतःक्रियाओं की व्याख्या और बार-बार मापे जाने वाले कारकों की व्याख्या सुसंगत है, और दोनों प्रकार के कारक स्पष्ट रूप से एक-दूसरे के साथ बातचीत कर सकते हैं (उदाहरण के लिए, महिलाएं एक सेमेस्टर के दौरान कौशल हासिल करती हैं, जबकि पुरुष उन्हें खो देते हैं)।

अपूर्ण (नेस्टेड) ​​योजनाएँ

कई मामलों में अंतःक्रिया प्रभाव को नजरअंदाज किया जा सकता है। यह या तो तब होता है जब यह ज्ञात होता है कि जनसंख्या में कोई अंतःक्रियात्मक प्रभाव नहीं है, या जब पूर्ण कार्यान्वयन होता है कारख़ाने कायोजना असंभव है. उदाहरण के लिए, ईंधन की खपत पर चार ईंधन योजकों के प्रभाव का अध्ययन किया जा रहा है। चार कारों और चार ड्राइवरों का चयन किया जाता है। भरा हुआ कारख़ाने काप्रयोग के लिए आवश्यक है कि प्रत्येक संयोजन: एडिटिव, ड्राइवर, कार - कम से कम एक बार दिखाई दे। इसके लिए कम से कम 4 x 4 x 4 = 64 समूहों के परीक्षणों की आवश्यकता होती है, जिसमें बहुत अधिक समय लगता है। इसके अतिरिक्त, ड्राइवर और ईंधन योज्य के बीच कोई बातचीत होने की संभावना नहीं है। इसे ध्यान में रखते हुए आप प्लान का इस्तेमाल कर सकते हैं लैटिन वर्ग,जिसमें केवल 16 परीक्षण समूह शामिल हैं (चार योजक ए, बी, सी और डी अक्षरों द्वारा निर्दिष्ट हैं):

प्रायोगिक डिज़ाइन पर अधिकांश पुस्तकों में लैटिन वर्गों का वर्णन किया गया है (उदाहरण के लिए, हेज़, 1988; लिंडमैन, 1974; मिलिकेन और जॉनसन, 1984; विनर, 1962) और यहां विस्तार से चर्चा नहीं की जाएगी। ध्यान दें कि लैटिन वर्ग हैं नहींएनभरा हुआऐसे डिज़ाइन जिनमें कारक स्तरों के सभी संयोजन शामिल नहीं हैं। उदाहरण के लिए, ड्राइवर 1 कार 1 को केवल एडिटिव ए के साथ चलाता है, ड्राइवर 3 कार 1 को केवल एडिटिव सी के साथ चलाता है। कारक स्तर योजक (ए, बी, सी और डी) तालिका कोशिकाओं में नेस्टेड हैं ऑटोमोबाइलएक्स चालक -घोंसले में अंडे की तरह. यह स्मरणीय नियमप्रकृति को समझने के लिए उपयोगी नेस्टेड या नेस्टेडयोजनाएं. मापांक भिन्नता का विश्लेषणप्रदान सरल तरीकेइस प्रकार की योजनाओं का विश्लेषण.

सहप्रसरण विश्लेषण

मुख्य विचार

अध्याय में प्रमुख विचारकारक नियंत्रण का विचार और कैसे योगात्मक कारकों को शामिल करने से वर्ग त्रुटियों का योग कम हो जाता है और डिजाइन की सांख्यिकीय शक्ति बढ़ जाती है, इस पर संक्षेप में चर्चा की गई। यह सब मूल्यों के निरंतर सेट के साथ चर तक बढ़ाया जा सकता है। जब ऐसे निरंतर चर को किसी डिज़ाइन में कारकों के रूप में शामिल किया जाता है, तो उन्हें कहा जाता है सहसंयोजक.

निश्चित सहसंयोजक

मान लीजिए कि हम छात्रों के दो समूहों के गणित कौशल की तुलना कर रहे हैं जिन्हें दो अलग-अलग पाठ्यपुस्तकों का उपयोग करके पढ़ाया गया था। आइए यह भी मान लें कि प्रत्येक छात्र के लिए बुद्धिमत्ता भागफल (आईक्यू) डेटा उपलब्ध है। आप मान सकते हैं कि IQ गणित कौशल से संबंधित है और उस जानकारी का उपयोग करें। छात्रों के दो समूहों में से प्रत्येक के लिए, आईक्यू और गणित कौशल के बीच सहसंबंध गुणांक की गणना की जा सकती है। इस सहसंबंध गुणांक का उपयोग करके, समूहों में विचरण के अनुपात को अलग करना संभव है जिसे IQ के प्रभाव और विचरण के अस्पष्टीकृत अनुपात द्वारा समझाया गया है (यह भी देखें) सांख्यिकी की बुनियादी अवधारणाएँ(अध्याय 8) और बुनियादी आँकड़े और तालिकाएँ(अध्याय 9)). विचरण के शेष भाग का उपयोग विश्लेषण में त्रुटि विचरण के रूप में किया जाता है। यदि IQ और गणित कौशल के बीच सहसंबंध है, तो त्रुटि भिन्नता को काफी कम किया जा सकता है एसएस/(एन-1) .

सहसंयोजकों का प्रभावएफ- कसौटी. एफ-मानदंड समूहों में औसत मूल्यों में अंतर के सांख्यिकीय महत्व का मूल्यांकन करता है, और अंतरसमूह विचरण के अनुपात की गणना की जाती है ( एमएसप्रभाव) त्रुटि भिन्नता के लिए ( एमएसगलती) . अगर एमएसगलतीघट जाती है, उदाहरण के लिए, IQ कारक को ध्यान में रखते समय, मान एफबढ़ती है।

बहुत सारे सहसंयोजक.एकल सहसंयोजक (आईक्यू) के लिए ऊपर प्रयुक्त तर्क को आसानी से एकाधिक सहसंयोजकों तक बढ़ाया जा सकता है। उदाहरण के लिए, आईक्यू के अलावा, आप प्रेरणा, स्थानिक सोच आदि के माप को शामिल कर सकते हैं। सामान्य सहसंबंध गुणांक के स्थान पर इसका उपयोग किया जाता है एकाधिक गुणांकसहसंबंध.

जब मूल्यएफ -मानदंड घट जाता है.कभी-कभी प्रायोगिक डिज़ाइन में सहसंयोजकों को शामिल करने से महत्व कम हो जाता है एफ-मानदंड . यह आमतौर पर इंगित करता है कि सहसंयोजक न केवल आश्रित चर (जैसे, गणित कौशल) के साथ, बल्कि कारकों (जैसे, विभिन्न पाठ्यपुस्तकों) के साथ भी सहसंबद्ध हैं। मान लीजिए कि दो अलग-अलग पाठ्यपुस्तकों का उपयोग करके छात्रों के दो समूहों को पढ़ाने के लगभग एक वर्ष के बाद, आईक्यू को सेमेस्टर के अंत में मापा जाता है। हालाँकि छात्रों को यादृच्छिक रूप से समूहों को सौंपा गया था, यह हो सकता है कि पाठ्यपुस्तक में अंतर इतना अधिक हो कि IQ और गणित कौशल दोनों समूहों के बीच बहुत भिन्न होंगे। इस मामले में, सहसंयोजक न केवल त्रुटि भिन्नता को कम करते हैं बल्कि समूह-समूह भिन्नता को भी कम करते हैं। दूसरे शब्दों में, समूहों में आईक्यू में अंतर को नियंत्रित करने के बाद, गणित कौशल में अंतर अब महत्वपूर्ण नहीं रह गया है। आप इसे अलग ढंग से कह सकते हैं. IQ के प्रभाव को "खारिज" करने के बाद, गणितीय कौशल के विकास पर पाठ्यपुस्तक के प्रभाव को अनजाने में बाहर रखा गया है।

समायोजित औसत.जब कोई सहसंयोजक विषयों के बीच के कारक को प्रभावित करता है, तो व्यक्ति को गणना करनी चाहिए समायोजित साधन, अर्थात। वे साधन जो सभी सहसंयोजक अनुमानों को हटाने के बाद प्राप्त किए जाते हैं।

सहसंयोजकों और कारकों के बीच परस्पर क्रिया।जिस तरह कारकों के बीच बातचीत की जांच की जाती है, उसी तरह सहसंयोजकों के बीच और कारकों के समूहों के बीच बातचीत की जांच की जा सकती है। मान लीजिए कि पाठ्यपुस्तकों में से एक विशेष रूप से स्मार्ट छात्रों के लिए उपयुक्त है। दूसरी पाठ्यपुस्तक होशियार छात्रों के लिए उबाऊ है, और वही पाठ्यपुस्तक कम होशियार छात्रों के लिए कठिन है। परिणामस्वरूप, पहले समूह में आईक्यू और सीखने के परिणाम के बीच एक सकारात्मक सहसंबंध है (होशियार छात्र, बेहतर परिणाम) और दूसरे समूह में शून्य या मामूली नकारात्मक सहसंबंध है (छात्र जितना होशियार होगा, उसके गणितीय कौशल हासिल करने की संभावना उतनी ही कम होगी) दूसरी पाठ्यपुस्तक से)। कुछ अध्ययन इस स्थिति पर सहप्रसरण विश्लेषण की मान्यताओं के उल्लंघन के उदाहरण के रूप में चर्चा करते हैं। हालाँकि, क्योंकि एनोवा मॉड्यूल सहप्रसरण के विश्लेषण के सबसे सामान्य तरीकों का उपयोग करता है, विशेष रूप से, कारकों और सहसंयोजकों के बीच बातचीत के सांख्यिकीय महत्व का मूल्यांकन करना संभव है।

परिवर्तनशील सहसंयोजक

जबकि निश्चित सहसंयोजकों की चर्चा पाठ्यपुस्तकों में अक्सर की जाती है, परिवर्तनीय सहसंयोजकों का उल्लेख बहुत कम बार किया जाता है। आमतौर पर, बार-बार माप के साथ प्रयोग करते समय, हम समय के विभिन्न बिंदुओं पर समान मात्रा के माप में अंतर में रुचि रखते हैं। अर्थात्, हम इन मतभेदों के महत्व में रुचि रखते हैं। यदि सहसंयोजकों को आश्रित चर के माप के साथ एक साथ मापा जाता है, तो सहसंयोजक और आश्रित चर के बीच सहसंबंध की गणना की जा सकती है।

उदाहरण के लिए, सेमेस्टर की शुरुआत और अंत में गणित की रुचि और गणित कौशल का पता लगाया जा सकता है। यह परीक्षण करना दिलचस्प होगा कि क्या गणित में रुचि में परिवर्तन गणित कौशल में परिवर्तन से संबंधित हैं।

मापांक भिन्नता का विश्लेषणवी सांख्यिकीजहां संभव हो, डिज़ाइन में सहसंयोजकों में परिवर्तन के सांख्यिकीय महत्व का स्वचालित रूप से आकलन करता है।

बहुभिन्नरूपी डिज़ाइन: विचरण और सहप्रसरण का बहुभिन्नरूपी विश्लेषण

अंतरसमूह योजनाएँ

पहले चर्चा किए गए सभी उदाहरणों में केवल एक आश्रित चर शामिल था। जब एक ही समय में कई आश्रित चर होते हैं, तो केवल गणना की जटिलता बढ़ जाती है, लेकिन सामग्री और बुनियादी सिद्धांत नहीं बदलते हैं।

उदाहरण के लिए, दो अलग-अलग पाठ्यपुस्तकों पर एक अध्ययन किया जाता है। साथ ही छात्रों की भौतिकी और गणित की पढ़ाई में सफलता का अध्ययन किया जाता है। इस मामले में, दो आश्रित चर हैं और आपको यह पता लगाना होगा कि दो अलग-अलग पाठ्यपुस्तकें उन्हें एक साथ कैसे प्रभावित करती हैं। ऐसा करने के लिए, आप विचरण के बहुभिन्नरूपी विश्लेषण (MANOVA) का उपयोग कर सकते हैं। एक-आयामी के बजाय एफकसौटी, बहुआयामी का प्रयोग किया जाता है एफपरीक्षण (विल्क्स एल परीक्षण), त्रुटि सहप्रसरण मैट्रिक्स और अंतरसमूह सहप्रसरण मैट्रिक्स की तुलना पर आधारित है।

यदि आश्रित चर एक-दूसरे के साथ सहसंबद्ध हैं, तो महत्व मानदंड की गणना करते समय इस सहसंबंध को ध्यान में रखा जाना चाहिए। जाहिर है, यदि एक ही माप दो बार दोहराया जाए, तो कुछ भी नया प्राप्त नहीं किया जा सकता है। यदि इसके साथ सहसंबद्ध माप को मौजूदा माप में जोड़ा जाता है, तो कुछ नई जानकारी, लेकिन नए वेरिएबल में अनावश्यक जानकारी शामिल है, जो वेरिएबल्स के बीच सहप्रसरण में परिलक्षित होती है।

परिणामों की व्याख्या।यदि समग्र बहुभिन्नरूपी परीक्षण महत्वपूर्ण है, तो हम यह निष्कर्ष निकाल सकते हैं कि संबंधित प्रभाव (जैसे, पाठ्यपुस्तक प्रकार) महत्वपूर्ण है। हालाँकि, निम्नलिखित प्रश्न उठते हैं। क्या पाठ्यपुस्तक का प्रकार केवल गणित कौशल, केवल शारीरिक कौशल या दोनों कौशल में सुधार को प्रभावित करता है? वास्तव में, एक महत्वपूर्ण बहुभिन्नरूपी परीक्षण प्राप्त करने के बाद, व्यक्तिगत मुख्य प्रभाव या अंतःक्रिया के लिए एक अविभाज्य परीक्षण की जांच की जाती है। एफकसौटी. दूसरे शब्दों में, बहुभिन्नरूपी परीक्षण के महत्व में योगदान देने वाले आश्रित चर की अलग से जांच की जाती है।

बार-बार माप डिजाइन

यदि छात्रों के गणित और भौतिकी कौशल को सेमेस्टर की शुरुआत और अंत में मापा जाता है, तो ये दोहराए गए उपाय हैं। ऐसी योजनाओं में महत्व की कसौटी का अध्ययन करना है तार्किक विकासएक आयामी मामला. ध्यान दें कि विचरण तकनीकों के बहुभिन्नरूपी विश्लेषण का उपयोग आमतौर पर दो से अधिक स्तरों वाले अविभाज्य दोहराए गए माप कारकों के महत्व की जांच करने के लिए भी किया जाता है। संबंधित अनुप्रयोगों पर इस भाग में बाद में चर्चा की जाएगी।

परिवर्तनीय मानों का योग और विचरण का बहुभिन्नरूपी विश्लेषण

यहां तक ​​कि विचरण के एकविभिन्न और बहुभिन्नरूपी विश्लेषण के अनुभवी उपयोगकर्ताओं को भी अक्सर विचरण के बहुभिन्नरूपी विश्लेषण को लागू करते समय अलग-अलग परिणाम प्राप्त करना मुश्किल लगता है, उदाहरण के लिए, तीन चर के लिए, और जब इन तीन चर के योग पर विचरण के एकविभिन्न विश्लेषण को लागू करते हैं, जैसे कि यह एक एकल चर थे.

विचार योगचर का अर्थ यह है कि प्रत्येक चर में कुछ वास्तविक चर होते हैं, जिनका अध्ययन किया जा रहा है, साथ ही एक यादृच्छिक माप त्रुटि भी होती है। इसलिए, चर के मानों का औसत निकालते समय, माप त्रुटि सभी मापों के लिए 0 के करीब होगी और औसत मान अधिक विश्वसनीय होंगे। वास्तव में, इस मामले में, चरों के योग पर एनोवा लागू करना उचित है और है भी शक्तिशाली विधि. हालाँकि, यदि आश्रित चर प्रकृति में बहुआयामी हैं, तो चर के मूल्यों का योग अनुचित है।

उदाहरण के लिए, मान लें कि आश्रित चर में चार संकेतक शामिल हैं समाज में सफलता. प्रत्येक संकेतक मानव गतिविधि के एक पूरी तरह से स्वतंत्र पहलू की विशेषता बताता है (उदाहरण के लिए, व्यावसायिक सफलता, व्यवसाय में सफलता, पारिवारिक कल्याण, आदि)। इन चरों को जोड़ना सेब और संतरे को जोड़ने जैसा है। इन चरों का योग एक उपयुक्त एकआयामी माप नहीं होगा। इसलिए, ऐसे डेटा को बहुआयामी संकेतक के रूप में माना जाना चाहिए विचरण का बहुभिन्नरूपी विश्लेषण.

कंट्रास्ट विश्लेषण और पोस्ट हॉक परीक्षण

औसत के अलग-अलग सेटों की तुलना क्यों की जाती है?

आमतौर पर, प्रयोगात्मक डेटा के बारे में परिकल्पनाएं केवल मुख्य प्रभावों या इंटरैक्शन के संदर्भ में नहीं बनाई जाती हैं। एक उदाहरण यह परिकल्पना होगी: एक निश्चित पाठ्यपुस्तक केवल पुरुष छात्रों में गणित कौशल में सुधार करती है, जबकि एक अन्य पाठ्यपुस्तक दोनों लिंगों के लिए लगभग समान रूप से प्रभावी है, लेकिन पुरुषों के लिए अभी भी कम प्रभावी है। यह अनुमान लगाया जा सकता है कि पाठ्यपुस्तक की प्रभावशीलता छात्र लिंग के साथ परस्पर क्रिया करती है। हालाँकि, यह पूर्वानुमान भी लागू होता है प्रकृतिइंटरैक्शन. एक पुस्तक का उपयोग करने वाले छात्रों के लिए लिंग के बीच एक महत्वपूर्ण अंतर अपेक्षित है और दूसरी पुस्तक का उपयोग करने वाले छात्रों के लिए लिंग के आधार पर वस्तुतः स्वतंत्र परिणाम अपेक्षित हैं। इस प्रकार की परिकल्पना की जांच आमतौर पर कंट्रास्ट विश्लेषण का उपयोग करके की जाती है।

विरोधाभासों का विश्लेषण

संक्षेप में, कंट्रास्ट विश्लेषण किसी को जटिल प्रभावों के कुछ रैखिक संयोजनों के सांख्यिकीय महत्व का मूल्यांकन करने की अनुमति देता है। कंट्रास्ट विश्लेषण किसी भी जटिल एनोवा योजना का मुख्य और अनिवार्य तत्व है। मापांक भिन्नता का विश्लेषणइसमें विभिन्न प्रकार की कंट्रास्ट विश्लेषण क्षमताएं हैं जो आपको किसी भी प्रकार की तुलना के साधनों को अलग करने और उनका विश्लेषण करने की अनुमति देती हैं।

वापसतुलना

कभी-कभी, किसी प्रयोग को संसाधित करने के परिणामस्वरूप, एक अप्रत्याशित प्रभाव की खोज की जाती है। हालांकि ज्यादातर मामलों में एक रचनात्मक शोधकर्ता किसी भी परिणाम की व्याख्या करने में सक्षम होगा, लेकिन यह भविष्यवाणी के लिए आगे के विश्लेषण और अनुमान की अनुमति नहीं देता है। यह समस्या उनमें से एक है एक पश्च मानदंड, अर्थात्, मानदंड जो उपयोग नहीं करते हैं संभवतःपरिकल्पनाएँ स्पष्ट करने के लिए, निम्नलिखित प्रयोग पर विचार करें। आइए मान लें कि 100 कार्ड हैं जिनमें 1 से 10 तक संख्याएं हैं। इन सभी कार्डों को एक टोपी में रखकर, हम यादृच्छिक रूप से 20 बार 5 कार्डों का चयन करते हैं, और प्रत्येक नमूने के लिए औसत मूल्य (कार्ड पर लिखी संख्याओं का औसत) की गणना करते हैं। क्या हम उम्मीद कर सकते हैं कि दो नमूने ऐसे होंगे जिनके साधन काफी भिन्न होंगे? यह बहुत प्रशंसनीय है! अधिकतम और न्यूनतम माध्य वाले दो नमूनों का चयन करके, आप साधनों में अंतर प्राप्त कर सकते हैं जो कि साधनों में अंतर से बहुत अलग है, उदाहरण के लिए, पहले दो नमूनों में। उदाहरण के लिए, कंट्रास्ट विश्लेषण का उपयोग करके इस अंतर का पता लगाया जा सकता है। विवरण में जाए बिना, कई तथाकथित हैं वापसमानदंड जो बिल्कुल पहले परिदृश्य पर आधारित हैं (20 नमूनों से चरम साधन लेते हुए), यानी ये मानदंड डिजाइन में सभी साधनों की तुलना करने के लिए सबसे अलग साधन चुनने पर आधारित हैं। इन मानदंडों का उपयोग यह सुनिश्चित करने के लिए किया जाता है कि कोई कृत्रिम प्रभाव पूरी तरह से संयोग से प्राप्त नहीं होता है, उदाहरण के लिए, जब कोई साधन न हो तो उनके बीच महत्वपूर्ण अंतर का पता लगाना। मापांक भिन्नता का विश्लेषणऐसे मानदंडों की एक विस्तृत श्रृंखला प्रदान करता है। जब कई समूहों से जुड़े किसी प्रयोग में अप्रत्याशित परिणाम सामने आते हैं वापसप्राप्त परिणामों के सांख्यिकीय महत्व की जांच के लिए प्रक्रियाएं।

I, II, III और IV प्रकार के वर्गों का योग

बहुभिन्नरूपी प्रतिगमन और विचरण का विश्लेषण

बहुभिन्नरूपी प्रतिगमन विधि और विचरण के विश्लेषण (विचरण का विश्लेषण) के बीच घनिष्ठ संबंध है। दोनों विधियों में एक रैखिक मॉडल का अध्ययन किया जाता है। संक्षेप में, लगभग सभी प्रायोगिक डिज़ाइनों की जांच बहुभिन्नरूपी प्रतिगमन का उपयोग करके की जा सकती है। निम्नलिखित सरल अंतरसमूह 2 x 2 डिज़ाइन पर विचार करें।

डी.वी. बी एक्सबी
3 1 1 1
4 1 1 1
4 1 -1 -1
5 1 -1 -1
6 -1 1 -1
6 -1 1 -1
3 -1 -1 1
2 -1 -1 1

कॉलम ए और बी में कारक ए और बी के स्तर को दर्शाने वाले कोड होते हैं, कॉलम एक्सबी में दो कॉलम ए और बी का उत्पाद होता है। हम बहुभिन्नरूपी प्रतिगमन का उपयोग करके इस डेटा का विश्लेषण कर सकते हैं। चर डी.वी.एक आश्रित चर के रूप में परिभाषित, से चर पहले एक्सबीस्वतंत्र चर के रूप में। प्रतिगमन गुणांक के लिए महत्व का अध्ययन कारकों के मुख्य प्रभावों के महत्व के विचरण के विश्लेषण में गणना के साथ मेल खाएगा और बीऔर अंतःक्रिया प्रभाव एक्सबी.

असंतुलित एवं संतुलित योजनाएँ

सभी चरों के लिए सहसंबंध मैट्रिक्स की गणना करते समय, जैसे कि ऊपर दर्शाया गया डेटा, आप देखेंगे कि कारकों का मुख्य प्रभाव और बीऔर अंतःक्रिया प्रभाव एक्सबीअसंबंधित. प्रभावों के इस गुण को ऑर्थोगोनैलिटी भी कहा जाता है। वे प्रभाव कहते हैं और बी - ओर्थोगोनलया स्वतंत्रएक दूसरे से। यदि किसी योजना में सभी प्रभाव एक-दूसरे के लिए ऑर्थोगोनल हैं, जैसा कि ऊपर दिए गए उदाहरण में है, तो योजना को कहा जाता है बैलेंस्ड.

संतुलित योजनाएँ " अच्छी संपत्ति" ऐसी योजनाओं के विश्लेषण की गणना बहुत सरल है। सभी गणनाएँ प्रभावों और आश्रित चरों के बीच सहसंबंध की गणना करने तक सीमित हैं। चूंकि प्रभाव ऑर्थोगोनल हैं, आंशिक सहसंबंध (पूर्ण रूप में)। बहुआयामीप्रतिगमन) की गणना नहीं की जाती है। हालाँकि, में वास्तविक जीवनयोजनाएँ हमेशा संतुलित नहीं होतीं।

आइए कोशिकाओं में असमान संख्या में अवलोकनों वाले वास्तविक डेटा पर विचार करें।

फैक्टर ए कारक बी
बी 1 बी2
ए 1 3 4, 5
ए2 6, 6, 7 2

यदि हम इस डेटा को ऊपर बताए अनुसार कोड करते हैं और सभी चर के लिए सहसंबंध मैट्रिक्स की गणना करते हैं, तो हम पाते हैं कि डिज़ाइन कारक एक दूसरे के साथ सहसंबद्ध हैं। किसी योजना में कारक अब ऑर्थोगोनल नहीं रह जाते हैं और ऐसी योजनाएं कहलाती हैं असंतुलित.ध्यान दें कि विचाराधीन उदाहरण में, कारकों के बीच सहसंबंध पूरी तरह से डेटा मैट्रिक्स के कॉलम में 1 और -1 की आवृत्तियों में अंतर के कारण है। दूसरे शब्दों में, असमान सेल वॉल्यूम (अधिक सटीक रूप से, अनुपातहीन वॉल्यूम) वाले प्रयोगात्मक डिज़ाइन असंतुलित होंगे, जिसका अर्थ है कि मुख्य प्रभाव और इंटरैक्शन भ्रमित हो जाएंगे। इस मामले में, प्रभावों के सांख्यिकीय महत्व की गणना करने के लिए पूर्ण बहुभिन्नरूपी प्रतिगमन की गणना की जानी चाहिए। यहां कई रणनीतियां हैं.

I, II, III और IV प्रकार के वर्गों का योग

वर्गों का योग प्रकारमैंऔरतृतीय. बहुभिन्नरूपी मॉडल में प्रत्येक कारक के महत्व की जांच करने के लिए, प्रत्येक कारक के आंशिक सहसंबंध की गणना की जा सकती है, बशर्ते कि मॉडल में अन्य सभी कारकों का पहले से ही हिसाब हो। आप चरण-दर-चरण तरीके से मॉडल में कारकों को भी दर्ज कर सकते हैं, मॉडल में पहले से दर्ज सभी कारकों को कैप्चर कर सकते हैं और अन्य सभी कारकों को अनदेखा कर सकते हैं। सामान्य तौर पर, यही अंतर है प्रकार तृतीयऔर प्रकारमैंवर्गों का योग (यह शब्दावली एसएएस में पेश की गई थी, उदाहरण के लिए, एसएएस, 1982 देखें; विस्तृत चर्चा सियरल, 1987, पृष्ठ 461; वुडवर्ड, बोनेट, और ब्रेख्त, 1990, पृष्ठ 216; या मिलिकेन में भी पाई जा सकती है। और जॉनसन, 1984, पृ.

वर्गों का योग प्रकारद्वितीय.अगली "मध्यवर्ती" मॉडल निर्माण रणनीति में शामिल हैं: एकल मुख्य प्रभाव के महत्व की जांच करते समय सभी मुख्य प्रभावों को नियंत्रित करना; व्यक्तिगत जोड़ीवार अंतःक्रिया के महत्व की जांच करते समय सभी मुख्य प्रभावों और सभी जोड़ीवार अंतःक्रियाओं को नियंत्रित करने में; सभी जोड़ीवार अंतःक्रियाओं और तीन कारकों की सभी अंतःक्रियाओं के सभी मुख्य प्रभावों को नियंत्रित करने में; तीन कारकों आदि की व्यक्तिगत अंतःक्रिया का अध्ययन करते समय। इस प्रकार परिकलित प्रभावों के वर्गों के योग को कहा जाता है प्रकारद्वितीयवर्गों का योग। इसलिए, प्रकारद्वितीयवर्गों का योग समान क्रम और निचले क्रम के सभी प्रभावों को नियंत्रित करता है, जबकि सभी उच्च क्रम के प्रभावों को अनदेखा करता है।

वर्गों का योग प्रकारचतुर्थ. अंत में, लुप्त कोशिकाओं (अधूरी योजनाओं) वाली कुछ विशेष योजनाओं के लिए, तथाकथित की गणना करना संभव है प्रकार चतुर्थवर्गों का योग। अपूर्ण डिज़ाइन (लापता कोशिकाओं वाले डिज़ाइन) के संबंध में इस पद्धति पर बाद में चर्चा की जाएगी।

प्रकार I, II और III के वर्गों की परिकल्पना के योग की व्याख्या

वर्गों का योग प्रकारतृतीयव्याख्या करना सबसे आसान. याद रखें कि वर्गों का योग प्रकारतृतीयअन्य सभी प्रभावों को नियंत्रित करने के बाद प्रभावों की जाँच करें। उदाहरण के लिए, सांख्यिकीय रूप से महत्वपूर्ण खोजने के बाद प्रकारतृतीयकारक के लिए प्रभाव मॉड्यूल में भिन्नता का विश्लेषण, हम कह सकते हैं कि कारक का एक ही महत्वपूर्ण प्रभाव है , अन्य सभी प्रभावों (कारकों) का परिचय देने के बाद और तदनुसार इस प्रभाव की व्याख्या करें। संभवतः सभी एनोवा अनुप्रयोगों में से 99% में, यह उस प्रकार का परीक्षण है जिसमें शोधकर्ता की रुचि होती है। इस प्रकार के वर्गों के योग की गणना आमतौर पर मॉड्यूलो में की जाती है भिन्नता का विश्लेषणडिफ़ॉल्ट रूप से, चाहे विकल्प चुना गया हो प्रतिगमन दृष्टिकोणया नहीं (मॉड्यूल में अपनाए गए मानक दृष्टिकोण भिन्नता का विश्लेषणनीचे वर्णित)।

वर्गों के योग का उपयोग करके प्राप्त महत्वपूर्ण प्रभाव प्रकारया प्रकारद्वितीयवर्गों के योग की व्याख्या करना इतना आसान नहीं है। उनकी सबसे अच्छी व्याख्या चरणबद्ध बहुभिन्नरूपी प्रतिगमन के संदर्भ में की जाती है। यदि, वर्गों के योग का उपयोग करते समय प्रकारमैंकारक बी का मुख्य प्रभाव महत्वपूर्ण था (कारक ए को मॉडल में शामिल करने के बाद, लेकिन ए और बी के बीच बातचीत को जोड़ने से पहले), हम यह निष्कर्ष निकाल सकते हैं कि कारक बी का एक महत्वपूर्ण मुख्य प्रभाव है, बशर्ते कि कोई बातचीत न हो कारक ए और बी के बीच (यदि मानदंड का उपयोग कर रहे हैं प्रकारतृतीय, कारक बी भी महत्वपूर्ण निकला, तो हम यह निष्कर्ष निकाल सकते हैं कि मॉडल में अन्य सभी कारकों और उनकी अंतःक्रियाओं को पेश करने के बाद कारक बी का एक महत्वपूर्ण मुख्य प्रभाव है)।

सीमांत साधन परिकल्पना के संदर्भ में प्रकारमैंऔर प्रकारद्वितीयआमतौर पर इसकी कोई सरल व्याख्या नहीं होती। इन मामलों में, यह कहा जाता है कि कोई केवल सीमांत साधनों को देखकर प्रभावों के महत्व की व्याख्या नहीं कर सकता है। बल्कि प्रस्तुत किया गया पीसाधन एक जटिल परिकल्पना से संबंधित हैं जो साधन और नमूना आकार को जोड़ती है। उदाहरण के लिए, प्रकारद्वितीयपहले चर्चा की गई 2 x 2 डिज़ाइन के सरल उदाहरण में कारक ए के लिए परिकल्पनाएँ होंगी (वुडवर्ड, बोनेट और ब्रेख्त, 1990, पृष्ठ 219 देखें):

निज- सेल में अवलोकनों की संख्या

उइज- सेल में औसत मान

एन. जे- सीमांत औसत

विस्तार में गए बिना (अधिक विवरण के लिए, मिलिकेन और जॉनसन, 1984, अध्याय 10 देखें), यह स्पष्ट है कि ये सरल परिकल्पनाएं नहीं हैं और ज्यादातर मामलों में इनमें से कोई भी शोधकर्ता के लिए विशेष रुचि का नहीं है। हालाँकि, ऐसे मामले भी हैं जब परिकल्पनाएँ प्रकारमैंदिलचस्प हो सकता है.

मॉड्यूल में डिफ़ॉल्ट कम्प्यूटेशनल दृष्टिकोण भिन्नता का विश्लेषण

यदि विकल्प की जाँच नहीं की गई है तो डिफ़ॉल्ट प्रतिगमन दृष्टिकोण, मापांक भिन्नता का विश्लेषणउपयोग सेल औसत मॉडल. इस मॉडल की विशेषता यह है कि इसमें वर्गों का योग होता है अलग-अलग प्रभावसेल साधनों के रैखिक संयोजनों के लिए गणना की जाती है। एक पूर्ण फैक्टोरियल प्रयोग में, इसका परिणाम वर्गों का योग होता है जो पहले चर्चा किए गए वर्गों के योग के समान होता है प्रकार तृतीय. हालाँकि, विकल्प में नियोजित तुलना(खिड़की में एनोवा परिणाम), उपयोगकर्ता भारित या अभारित सेल साधनों के किसी भी रैखिक संयोजन के विरुद्ध एक परिकल्पना का परीक्षण कर सकता है। इस प्रकार, उपयोगकर्ता न केवल परिकल्पनाओं का परीक्षण कर सकता है प्रकारतृतीय, लेकिन किसी भी प्रकार की परिकल्पना (सहित) प्रकारचतुर्थ). यह सामान्य पहूंचविशेष रूप से तब उपयोगी होता है जब लुप्त कोशिकाओं (जिन्हें अपूर्ण योजनाएँ कहा जाता है) वाली योजनाओं की जाँच की जाती है।

पूर्ण फैक्टोरियल डिज़ाइन के लिए, यह दृष्टिकोण तब भी उपयोगी होता है जब कोई भारित सीमांत साधनों का विश्लेषण करना चाहता है। उदाहरण के लिए, मान लीजिए कि पहले से विचार किए गए सरल 2 x 2 डिज़ाइन में, हमें भारित (कारक स्तरों द्वारा) की तुलना करने की आवश्यकता है बी) कारक ए के लिए सीमांत साधन। यह तब उपयोगी होता है जब कोशिकाओं में अवलोकनों का वितरण प्रयोगकर्ता द्वारा तैयार नहीं किया गया था, बल्कि यादृच्छिक रूप से बनाया गया था, और यह यादृच्छिकता कारक बी के स्तरों में अवलोकनों की संख्या के वितरण में परिलक्षित होती है। सकल।

उदाहरण के लिए, एक कारक है - विधवाओं की उम्र। उत्तरदाताओं के संभावित नमूने को दो समूहों में विभाजित किया गया है: 40 वर्ष से कम आयु और 40 वर्ष से अधिक आयु (कारक बी)। योजना में दूसरा कारक (फैक्टर ए) यह था कि विधवाओं को किसी एजेंसी से सामाजिक समर्थन मिला या नहीं (कुछ विधवाओं को यादृच्छिक रूप से चुना गया था, अन्य को नियंत्रण के रूप में कार्य किया गया था)। इस मामले में, नमूने में उम्र के अनुसार विधवाओं का वितरण जनसंख्या में उम्र के अनुसार विधवाओं के वास्तविक वितरण को दर्शाता है। समूह प्रभावशीलता मूल्यांकन सामाजिक समर्थनविधवाओं द्वारा सभी उम्रदोनों के भारित औसत के अनुरूप होगा आयु के अनुसार समूह(समूह में अवलोकनों की संख्या के अनुरूप वजन के साथ)।

नियोजित तुलना

ध्यान दें कि प्रविष्ट कंट्रास्ट गुणांकों का योग आवश्यक रूप से 0 (शून्य) के बराबर नहीं है। इसके बजाय, प्रोग्राम यह सुनिश्चित करने के लिए स्वचालित रूप से समायोजन करेगा कि संबंधित परिकल्पनाएं समग्र औसत के साथ भ्रमित न हों।

इसे स्पष्ट करने के लिए, आइए पहले चर्चा की गई सरल 2 x 2 योजना पर वापस जाएँ। याद रखें कि इस असंतुलित डिज़ाइन की कोशिकाओं में अवलोकनों की संख्या -1, 2, 3, और 1 है। मान लीजिए कि हम कारक ए के लिए भारित सीमांत साधनों की तुलना करना चाहते हैं (कारक बी के स्तरों की आवृत्ति द्वारा भारित)। आप कंट्रास्ट गुणांक दर्ज कर सकते हैं:

ध्यान दें कि इन गुणांकों का योग 0 तक नहीं होता है। प्रोग्राम गुणांकों को सेट करेगा ताकि उनका योग 0 हो, और उनके सापेक्ष मान संरक्षित रहेंगे, अर्थात:

1/3 2/3 -3/4 -1/4

ये विरोधाभास फैक्टर ए के लिए भारित साधनों की तुलना करेंगे।

प्रमुख औसत के बारे में परिकल्पनाएँ।यह परिकल्पना कि अभारित मुख्य माध्य 0 है, गुणांकों का उपयोग करके पता लगाया जा सकता है:

इस परिकल्पना का परीक्षण किया जाता है कि भारित मुख्य माध्य 0 है:

किसी भी स्थिति में प्रोग्राम कंट्रास्ट अनुपात को समायोजित नहीं करता है।

लुप्त कोशिकाओं वाली योजनाओं का विश्लेषण (अधूरी योजनाएँ)

फैक्टोरियल डिज़ाइन जिनमें खाली कोशिकाएँ होती हैं (कोशिकाओं के प्रसंस्करण संयोजन जिनमें कोई अवलोकन नहीं होता है) अपूर्ण कहलाते हैं। ऐसे डिज़ाइनों में, कुछ कारक आमतौर पर ऑर्थोगोनल नहीं होते हैं और कुछ इंटरैक्शन की गणना नहीं की जा सकती है। अस्तित्व ही नहीं है सर्वोत्तम विधिऐसी योजनाओं का विश्लेषण.

प्रतिगमन दृष्टिकोण

कुछ पुराने कार्यक्रमों में जो बहुभिन्नरूपी प्रतिगमन का उपयोग करके एनोवा डिज़ाइनों का विश्लेषण करने पर भरोसा करते हैं, अपूर्ण डिज़ाइनों में कारक सामान्य रूप से डिफ़ॉल्ट रूप से निर्दिष्ट होते हैं (जैसे कि डिज़ाइन पूर्ण थे)। फिर एक बहुआयामी प्रतिगमन विश्लेषणइन डमी कोडित कारकों के लिए। दुर्भाग्य से, यह विधि ऐसे परिणाम उत्पन्न करती है जिनकी व्याख्या करना असंभव नहीं तो बहुत कठिन है क्योंकि यह स्पष्ट नहीं है कि प्रत्येक प्रभाव साधनों के रैखिक संयोजन में कैसे योगदान देता है। निम्नलिखित सरल उदाहरण पर विचार करें.

फैक्टर ए कारक बी
बी 1 बी2
ए 1 3 4, 5
ए2 6, 6, 7 चुक होना

यदि हम प्रपत्र का बहुभिन्नरूपी प्रतिगमन करते हैं आश्रित चर = स्थिरांक + गुणनखंड A + गुणनखंड B, तो साधनों के रैखिक संयोजनों के संदर्भ में कारक ए और बी के महत्व के बारे में परिकल्पना इस तरह दिखती है:

कारक ए: सेल ए1,बी1 = सेल ए2,बी1

कारक बी: सेल ए1,बी1 = सेल ए1,बी2

यह मामला सरल है. अधिक जटिल डिज़ाइनों में, वास्तव में यह निर्धारित करना असंभव है कि वास्तव में किसकी जांच की जाएगी।

सेल का अर्थ है, एनोवा दृष्टिकोण , टाइप IV परिकल्पनाएँ

साहित्य में जिस दृष्टिकोण की अनुशंसा की जाती है और जो बेहतर लगता है वह है सार्थक अध्ययन करना (शोध प्रश्नों के संदर्भ में) संभवतःयोजना की कोशिकाओं में देखे गए साधनों के बारे में परिकल्पनाएँ। इस दृष्टिकोण की विस्तृत चर्चा डॉज (1985), हेइबर्गर (1989), मिलिकेन और जॉनसन (1984), सियरल (1987), या वुडवर्ड, बोनेट और ब्रेख्त (1990) में पाई जा सकती है। अपूर्ण डिज़ाइनों में साधनों के रैखिक संयोजन के बारे में परिकल्पनाओं से जुड़े वर्गों के योग जो प्रभावों के भाग के अनुमानों की जांच करते हैं उन्हें वर्गों का योग भी कहा जाता है चतुर्थ.

प्रकार की परिकल्पनाओं का स्वचालित निर्माणचतुर्थ. जब बहुभिन्नरूपी डिज़ाइनों में जटिल लापता सेल पैटर्न होते हैं, तो ऑर्थोगोनल (स्वतंत्र) परिकल्पनाओं को परिभाषित करना वांछनीय है, जिसका अध्ययन मुख्य प्रभावों या इंटरैक्शन के अध्ययन के बराबर है। उत्पन्न करने के लिए एल्गोरिथम (कम्प्यूटेशनल) रणनीतियाँ (छद्म-उलटा डिज़ाइन मैट्रिक्स पर आधारित) विकसित की गई हैं उपयुक्त तराजूऐसी तुलनाओं के लिए. दुर्भाग्य से, अंतिम परिकल्पनाओं को अनोखे तरीके से परिभाषित नहीं किया गया है। बेशक, वे उस क्रम पर निर्भर करते हैं जिसमें प्रभावों की पहचान की गई थी और शायद ही कभी एक सरल व्याख्या की अनुमति मिलती है। इसलिए, लापता कोशिकाओं की प्रकृति का सावधानीपूर्वक अध्ययन करने, फिर परिकल्पना तैयार करने की सिफारिश की जाती है प्रकारचतुर्थ, जो अध्ययन के उद्देश्यों से सर्वाधिक सार्थक रूप से मेल खाता है। फिर विकल्प का उपयोग करके इन परिकल्पनाओं का पता लगाएं नियोजित तुलनाखिड़की में परिणाम. इस मामले में तुलना निर्दिष्ट करने का सबसे आसान तरीका सभी कारकों के लिए विरोधाभासों के एक वेक्टर की शुरूआत की आवश्यकता है एक साथखिड़की में नियोजित तुलना.डायलॉग बॉक्स को कॉल करने के बाद नियोजित तुलनासभी समूह दिखाए जाएंगे वर्तमान योजनाऔर जो छूट गए हैं उन्हें चिन्हित किया गया है।

गुम कोशिकाएं और विशिष्ट प्रभाव के लिए परीक्षण

ऐसे कई प्रकार के डिज़ाइन हैं जिनमें गायब कोशिकाओं का स्थान यादृच्छिक नहीं है, बल्कि सावधानीपूर्वक योजनाबद्ध है, जिससे अन्य प्रभावों को प्रभावित किए बिना मुख्य प्रभावों का सरल विश्लेषण किया जा सकता है। उदाहरण के लिए, जब किसी योजना में आवश्यक संख्या में सेल उपलब्ध नहीं होते हैं, तो अक्सर योजनाओं का उपयोग किया जाता है लैटिन वर्गबड़ी संख्या में स्तरों के साथ कई कारकों के मुख्य प्रभावों का अनुमान लगाना। उदाहरण के लिए, 4 x 4 x 4 x 4 फैक्टोरियल डिज़ाइन के लिए 256 कोशिकाओं की आवश्यकता होती है। उसी समय आप उपयोग कर सकते हैं ग्रीको-लैटिन वर्गडिज़ाइन में केवल 16 कोशिकाओं के साथ मुख्य प्रभावों का अनुमान लगाने के लिए (अध्याय)। प्रयोग योजना, खंड IV में ऐसी योजनाओं का विस्तृत विवरण शामिल है)। अपूर्ण डिज़ाइन जिसमें मुख्य प्रभावों (और कुछ इंटरैक्शन) का अनुमान साधनों के सरल रैखिक संयोजनों का उपयोग करके लगाया जा सकता है, कहलाते हैं संतुलित अधूरी योजनाएँ.

संतुलित डिज़ाइन में, मुख्य प्रभावों और अंतःक्रियाओं के लिए विरोधाभास (वजन) उत्पन्न करने की मानक (डिफ़ॉल्ट) विधि तब भिन्नता विश्लेषण की एक तालिका तैयार करेगी जिसमें संबंधित प्रभावों के लिए वर्गों का योग एक दूसरे के साथ भ्रमित नहीं होता है। विकल्प विशिष्ट प्रभावखिड़की परिणामलुप्त योजना कोशिकाओं पर शून्य लिखकर लुप्त विरोधाभास उत्पन्न करेगा। विकल्प के अनुरोध के तुरंत बाद विशिष्ट प्रभावकुछ परिकल्पनाओं की जांच करने वाले उपयोगकर्ता के लिए, वास्तविक भार के साथ परिणामों की एक तालिका दिखाई देती है। ध्यान दें कि एक संतुलित डिज़ाइन में, संबंधित प्रभावों के वर्गों के योग की गणना केवल तभी की जाती है जब वे प्रभाव अन्य सभी मुख्य प्रभावों और इंटरैक्शन के लिए ऑर्थोगोनल (स्वतंत्र) होते हैं। अन्यथा, आपको विकल्प का उपयोग करना होगा नियोजित तुलनासाधनों के बीच सार्थक तुलनाओं का पता लगाना।

गुम कोशिकाएं और एकत्रित प्रभाव/त्रुटि शर्तें

यदि विकल्प प्रतिगमन दृष्टिकोणमॉड्यूल प्रारंभ पैनल में भिन्नता का विश्लेषणचयनित नहीं है, सेल औसत मॉडल का उपयोग प्रभावों के लिए वर्गों के योग की गणना करते समय किया जाएगा (डिफ़ॉल्ट सेटिंग)। यदि डिज़ाइन संतुलित नहीं है, तो गैर-ऑर्थोगोनल प्रभावों का संयोजन करते समय (विकल्प की उपरोक्त चर्चा देखें छूटी हुई कोशिकाएँ और विशिष्ट प्रभाव) कोई गैर-ऑर्थोगोनल (या ओवरलैपिंग) घटकों से युक्त वर्गों का योग प्राप्त कर सकता है। प्राप्त परिणाम आमतौर पर व्याख्या योग्य नहीं होते हैं। इसलिए, जटिल अपूर्ण प्रयोगात्मक डिज़ाइनों का चयन और कार्यान्वयन करते समय किसी को बहुत सावधान रहना चाहिए।

योजनाओं की विस्तृत चर्चा वाली कई पुस्तकें हैं अलग - अलग प्रकार. (डॉज, 1985; हेइबर्गर, 1989; लिंडमैन, 1974; मिलिकेन और जॉनसन, 1984; सियरल, 1987; वुडवर्ड और बोनेट, 1990), लेकिन इस प्रकार की जानकारी इस पाठ्यपुस्तक के दायरे से परे है। हालाँकि, इस खंड में बाद में एक विश्लेषण प्रदर्शित किया जाएगा। विभिन्न प्रकार केयोजनाएं.

धारणाएँ और धारणाओं का उल्लंघन करने के प्रभाव

सामान्य वितरण की धारणा से विचलन

मान लीजिए आश्रित चर को संख्यात्मक पैमाने पर मापा जाता है। आइए हम यह भी मान लें कि आश्रित चर सामान्य रूप से प्रत्येक समूह के भीतर वितरित होता है। भिन्नता का विश्लेषणइस धारणा का समर्थन करने के लिए इसमें ग्राफ़ और आँकड़ों की एक विस्तृत श्रृंखला शामिल है।

विघ्न का प्रभाव.बिल्कुल भी एफमानदंड सामान्यता से विचलन के प्रति बहुत प्रतिरोधी है ( विस्तृत परिणामलिंडमैन देखें, 1974)। यदि कर्टोसिस 0 से अधिक है, तो आँकड़ा का मान है एफबहुत छोटा हो सकता है. शून्य परिकल्पना स्वीकार की जाती है, हालाँकि यह सत्य नहीं हो सकती है। जब कर्टोसिस 0 से कम होता है तो स्थिति उलट जाती है। वितरण विषमता पर आमतौर पर बहुत कम प्रभाव पड़ता है एफआँकड़े. यदि किसी सेल में अवलोकनों की संख्या काफी बड़ी है, तो सामान्यता से विचलन विशेष रूप से महत्वपूर्ण नहीं है केंद्रीय सीमा प्रमेय, जिसके अनुसार प्रारंभिक वितरण की परवाह किए बिना, औसत मूल्य का वितरण सामान्य के करीब है। स्थिरता की विस्तृत चर्चा एफआँकड़े बॉक्स और एंडरसन (1955), या लिंडमैन (1974) में पाए जा सकते हैं।

भिन्नता की एकरूपता

धारणाएँ.यह माना जाता है कि विभिन्न डिज़ाइन समूहों की भिन्नताएँ समान हैं। इस धारणा को धारणा कहा जाता है विचरण की एकरूपता.याद रखें कि इस खंड की शुरुआत में, वर्ग त्रुटियों के योग की गणना का वर्णन करते समय, हमने प्रत्येक समूह के भीतर योग का प्रदर्शन किया था। यदि दो समूहों में भिन्नताएं एक-दूसरे से भिन्न हैं, तो उन्हें जोड़ना बहुत स्वाभाविक नहीं है और समूह के भीतर कुल भिन्नता का अनुमान नहीं देता है (क्योंकि इस मामले में कोई सामान्य भिन्नता नहीं है)। मापांक भिन्नता का विश्लेषण -एनोवा/मनोवाइसमें एक बड़ा सेट शामिल है सांख्यिकीय मानदंडविचरण मान्यताओं की एकरूपता से विचलन का पता लगाना।

विघ्न का प्रभाव.लिंडमैन (1974, पृष्ठ 33) यह दर्शाता है एफविचरण की एकरूपता की धारणाओं के उल्लंघन के संबंध में मानदंड काफी स्थिर है ( विविधताविचरण, बॉक्स, 1954ए, 1954बी भी देखें; सू, 1938)।

विशेष मामला: साधनों और भिन्नताओं का सहसंबंध।ऐसे भी समय होते हैं जब एफआँकड़े कर सकते हैं गुमराह करनाऐसा तब होता है जब डिज़ाइन कोशिकाओं के साधन विचरण के साथ सहसंबद्ध होते हैं। मापांक भिन्नता का विश्लेषणआपको फैलाव स्कैटरप्लॉट बनाने की अनुमति देता है या मानक विचलनऐसे सहसंबंध का पता लगाने के लिए औसत के सापेक्ष। यह सहसंबंध खतरनाक क्यों है इसका कारण निम्नलिखित है। आइए कल्पना करें कि योजना में 8 सेल हैं, जिनमें से 7 का औसत लगभग समान है, और एक सेल का औसत अन्य की तुलना में बहुत अधिक है। तब एफपरीक्षण सांख्यिकीय रूप से महत्वपूर्ण प्रभाव का पता लगा सकता है। लेकिन मान लीजिए कि बड़े औसत मूल्य वाले सेल में भिन्नता अन्य की तुलना में काफी बड़ी है, यानी। कोशिकाओं में औसत मान और विचरण निर्भर होते हैं (औसत जितना अधिक होगा, विचरण उतना ही अधिक होगा)। इस मामले में, एक बड़ा औसत अविश्वसनीय है क्योंकि यह डेटा में बड़े अंतर के कारण हो सकता है। तथापि एफआँकड़ों पर आधारित यूनाइटेडकोशिकाओं के भीतर भिन्नता भव्य माध्य को पकड़ लेगी, हालांकि प्रत्येक कोशिका के भीतर भिन्नता पर आधारित परीक्षण साधनों में सभी अंतरों को महत्वपूर्ण नहीं मानेंगे।

इस प्रकार का डेटा (बड़ा माध्य और बड़ा विचरण) अक्सर तब होता है जब बाहरी अवलोकन होते हैं। एक या दो बाहरी अवलोकनों से माध्य में काफी बदलाव आता है और विचरण में काफी वृद्धि होती है।

प्रसरण और सहप्रसरण की एकरूपता

धारणाएँ.बहुभिन्नरूपी आश्रित मापों के साथ बहुभिन्नरूपी डिज़ाइन पहले वर्णित विचरण की एकरूपता की धारणा को भी लागू करते हैं। हालाँकि, चूंकि बहुभिन्नरूपी आश्रित चर हैं, इसलिए यह भी आवश्यक है कि उनके पारस्परिक सहसंबंध (सहप्रसरण) डिज़ाइन की सभी कोशिकाओं में एक समान हों। मापांक भिन्नता का विश्लेषणइन धारणाओं का परीक्षण करने के लिए विभिन्न तरीके प्रदान करता है।

विघ्न का प्रभाव. बहुआयामी एनालॉग एफ- मानदंड - विल्क्स का λ-परीक्षण। उपरोक्त मान्यताओं के उल्लंघन के संबंध में विल्क्स λ परीक्षण की मजबूती के बारे में बहुत कुछ ज्ञात नहीं है। हालाँकि, मॉड्यूल की व्याख्या के परिणाम के बाद से भिन्नता का विश्लेषणआमतौर पर अविभाज्य प्रभावों के महत्व पर आधारित होता है (सामान्य मानदंड के महत्व को स्थापित करने के बाद), मजबूती की चर्चा मुख्य रूप से विचरण के अविभाज्य विश्लेषण से संबंधित होती है। इसलिए, अविभाज्य प्रभावों के महत्व की सावधानीपूर्वक जांच की जानी चाहिए।

विशेष मामला: सहप्रसरण का विश्लेषण.विचरण/सहप्रसरण समरूपता का विशेष रूप से गंभीर उल्लंघन तब हो सकता है जब सहसंयोजकों को डिज़ाइन में शामिल किया जाता है। विशेष रूप से, यदि सहसंयोजक और आश्रित उपायों के बीच सहसंबंध डिजाइन में कोशिकाओं में भिन्न होता है, तो परिणामों की गलत व्याख्या हो सकती है। याद रखें कि सहप्रसरण का विश्लेषण अनिवार्य रूप से प्रत्येक कोशिका के भीतर विचरण के उस हिस्से को अलग करने के लिए एक प्रतिगमन विश्लेषण करता है जो सहसंयोजक द्वारा होता है। विचरण/सहप्रसरण धारणा की एकरूपता से पता चलता है कि यह प्रतिगमन विश्लेषण आयोजित किया जाता है निम्नलिखित सीमा: सभी प्रतिगमन समीकरण(ढलान) सभी कोशिकाओं के लिए समान हैं। यदि यह अपेक्षित नहीं है, तो प्रकट हो सकता है बड़ी गलतियाँ. मापांक भिन्नता का विश्लेषणइस धारणा का परीक्षण करने के लिए कई विशेष मानदंड हैं। यह सुनिश्चित करने के लिए इन मानदंडों का उपयोग करना उचित है कि विभिन्न कोशिकाओं के लिए प्रतिगमन समीकरण लगभग समान हैं।

गोलाकारता और जटिल समरूपता: विचरण के विश्लेषण में बार-बार माप के लिए बहुभिन्नरूपी दृष्टिकोण का उपयोग करने के कारण

दो से अधिक स्तरों वाले बार-बार माप वाले कारकों वाले डिज़ाइन में, यूनीवेरिएट एनोवा के उपयोग के लिए अतिरिक्त मान्यताओं की आवश्यकता होती है: यौगिक समरूपता धारणा और गोलाकार धारणा। ये धारणाएँ शायद ही कभी पूरी होती हैं (नीचे देखें)। इसलिए में पिछले साल काविचरण के बहुभिन्नरूपी विश्लेषण ने ऐसे डिज़ाइनों में लोकप्रियता हासिल की है (दोनों दृष्टिकोण मॉड्यूल में संयुक्त हैं भिन्नता का विश्लेषण).

जटिल समरूपता की धारणायौगिक समरूपता की धारणा यह है कि अलग-अलग दोहराए गए मापों के लिए प्रसरण (समूहों के भीतर साझा) और सहप्रसरण (समूहों के भीतर साझा) सजातीय (समान) हैं। बार-बार किए गए उपायों के वैध होने के लिए यूनीवेरिएट एफ परीक्षण के लिए यह एक पर्याप्त शर्त है (यानी, रिपोर्ट किए गए एफ मान औसतन एफ वितरण के अनुरूप हैं)। हालाँकि, इस मामले में यह शर्त आवश्यक नहीं है।

गोलाकारता की धारणा.एफ-परीक्षण के वैध होने के लिए गोलाकारता की धारणा एक आवश्यक और पर्याप्त शर्त है। यह इस तथ्य में निहित है कि समूहों के भीतर सभी अवलोकन स्वतंत्र और समान रूप से वितरित होते हैं। इन धारणाओं की प्रकृति और उनके उल्लंघन के प्रभाव को आमतौर पर एनोवा की पुस्तकों में अच्छी तरह से वर्णित नहीं किया गया है - इन्हें निम्नलिखित पैराग्राफ में शामिल किया जाएगा। यह भी दिखाया जाएगा कि एक अविभाज्य दृष्टिकोण के परिणाम बहुभिन्नरूपी दृष्टिकोण के परिणामों से भिन्न हो सकते हैं, और यह समझाया जाएगा कि इसका क्या अर्थ है।

परिकल्पनाओं की स्वतंत्रता की आवश्यकता.एनोवा में डेटा का विश्लेषण करने का सामान्य तरीका है मॉडल फिटिंग. यदि, मॉडल के सापेक्ष जो डेटा फिट बैठता है, तो कुछ हैं संभवतःपरिकल्पनाएँ, फिर इन परिकल्पनाओं (मुख्य प्रभावों, अंतःक्रियाओं के लिए मानदंड) का परीक्षण करने के लिए विचरण को विभाजित किया जाता है। कम्प्यूटेशनल दृष्टिकोण से, यह दृष्टिकोण विरोधाभासों का एक सेट (योजना साधनों की तुलनाओं का एक सेट) उत्पन्न करता है। हालाँकि, यदि विरोधाभास एक-दूसरे से स्वतंत्र नहीं हैं, तो भिन्नताओं का विभाजन अर्थहीन हो जाता है। उदाहरण के लिए, यदि दो विरोधाभास हैं और बीसमान हैं और विचरण का संगत भाग निकाला जाता है, फिर वही भाग दो बार निकाला जाता है। उदाहरण के लिए, दो परिकल्पनाओं की पहचान करना मूर्खतापूर्ण और निरर्थक है: "सेल 1 में माध्य सेल 2 में माध्य से अधिक है" और "सेल 1 में माध्य सेल 2 में माध्य से अधिक है।" इसलिए, परिकल्पनाएँ स्वतंत्र या ऑर्थोगोनल होनी चाहिए।

बार-बार माप में स्वतंत्र परिकल्पनाएँ। सामान्य एल्गोरिदम, मॉड्यूल में कार्यान्वित किया गया भिन्नता का विश्लेषण, प्रत्येक प्रभाव के लिए स्वतंत्र (ऑर्थोगोनल) कंट्रास्ट उत्पन्न करने का प्रयास करेगा। बार-बार मापे जाने वाले कारक के लिए, ये विरोधाभास कई परिकल्पनाएँ प्रदान करते हैं मतभेदविचाराधीन कारक के स्तरों के बीच। हालाँकि, यदि इन मतभेदों को समूहों के भीतर सहसंबद्ध किया जाता है, तो परिणामी विरोधाभास अब स्वतंत्र नहीं हैं। उदाहरण के लिए, शिक्षण में जहां छात्रों को एक सेमेस्टर में तीन बार मापा जाता है, ऐसा हो सकता है कि पहले और दूसरे माप के बीच परिवर्तन विषयों के दूसरे और तीसरे माप के बीच परिवर्तन के साथ नकारात्मक रूप से सहसंबद्ध हो। जिन लोगों ने पहले और दूसरे आयामों के बीच अधिकांश सामग्री में महारत हासिल कर ली है, वे दूसरे और तीसरे आयामों के बीच बीते समय के दौरान एक छोटे हिस्से में महारत हासिल कर लेते हैं। वास्तव में, अधिकांश मामलों में जहां एनोवा का उपयोग बार-बार माप के लिए किया जाता है, स्तरों में परिवर्तन को विषयों के बीच सहसंबद्ध माना जा सकता है। हालाँकि, जब ऐसा होता है, तो जटिल समरूपता धारणा और गोलाकार धारणा मान्य नहीं होती है और स्वतंत्र विरोधाभासों की गणना नहीं की जा सकती है।

उल्लंघनों का प्रभाव और उन्हें ठीक करने के तरीके.जब जटिल समरूपता या गोलाकार धारणाएँ मान्य नहीं होती हैं, तो एनोवा उत्पन्न हो सकता है ग़लत परिणाम. बहुभिन्नरूपी प्रक्रियाओं के पर्याप्त रूप से विकसित होने से पहले, इन धारणाओं के उल्लंघन की भरपाई के लिए कई धारणाएँ प्रस्तावित की गईं थीं। (उदाहरण के लिए, ग्रीनहाउस और गीसर, 1959 और हुइन्ह और फेल्ड्ट, 1970 देखें)। ये विधियाँ अभी भी व्यापक रूप से उपयोग की जाती हैं (यही कारण है कि इन्हें मॉड्यूल में प्रस्तुत किया गया है भिन्नता का विश्लेषण).

दोहराए गए मापों के लिए विचरण दृष्टिकोण का बहुभिन्नरूपी विश्लेषण।सामान्य तौर पर, जटिल समरूपता और गोलाकारता की समस्याएं इस तथ्य से संबंधित हैं कि बार-बार माप कारक प्रभावों (2 से अधिक स्तरों के साथ) के अध्ययन में शामिल विरोधाभासों के सेट एक दूसरे से स्वतंत्र नहीं हैं। हालाँकि, यदि उपयोग किया जाए तो उन्हें स्वतंत्र होने की आवश्यकता नहीं है बहुआयामीएक साथ सत्यापन के लिए मानदंड आंकड़ों की महत्तादो या दो से अधिक दोहराए गए माप कारक विरोधाभास। यही कारण है कि 2 से अधिक स्तरों वाले अविभाज्य दोहराए गए माप कारकों के महत्व का परीक्षण करने के लिए विचरण तकनीकों का बहुभिन्नरूपी विश्लेषण तेजी से उपयोग किया जाने लगा है। यह दृष्टिकोण व्यापक रूप से स्वीकार किया जाता है क्योंकि इसमें आम तौर पर जटिल समरूपता या गोलाकारता की आवश्यकता नहीं होती है।

ऐसे मामले जिनमें विचरण दृष्टिकोण के बहुभिन्नरूपी विश्लेषण का उपयोग नहीं किया जा सकता है।ऐसे उदाहरण (डिज़ाइन) हैं जहां विचरण दृष्टिकोण का बहुभिन्नरूपी विश्लेषण लागू नहीं किया जा सकता है। ये आम तौर पर ऐसे मामले होते हैं जहां डिज़ाइन में विषयों की संख्या कम होती है और बार-बार मापे जाने वाले कारक में कई स्तर होते हैं। बहुभिन्नरूपी विश्लेषण करने के लिए बहुत कम अवलोकन हो सकते हैं। उदाहरण के लिए, यदि 12 विषय हैं, पी = 4 बार-बार माप कारक, और प्रत्येक कारक है = 3 स्तर. फिर 4 कारकों की परस्पर क्रिया "उपभोग" करेगी (-1)पी = 2 4 = 16 स्वतंत्रता की कोटियां। हालाँकि, केवल 12 विषय हैं, इसलिए इस उदाहरण में बहुभिन्नरूपी परीक्षण नहीं किया जा सकता है। मापांक भिन्नता का विश्लेषणस्वतंत्र रूप से इन अवलोकनों का पता लगाएगा और केवल एक-आयामी मानदंडों की गणना करेगा।

एकविभिन्न और बहुभिन्नरूपी परिणामों में अंतर.यदि किसी अध्ययन में बड़ी संख्या में बार-बार किए गए उपाय शामिल हैं, तो ऐसे मामले भी हो सकते हैं, जहां एकतरफा दोहराया गया उपाय एनोवा दृष्टिकोण ऐसे परिणाम उत्पन्न करता है जो बहुभिन्नरूपी दृष्टिकोण से प्राप्त परिणामों से बहुत भिन्न होते हैं। इसका मतलब यह है कि संबंधित दोहराए गए मापों के स्तरों के बीच का अंतर सभी विषयों में सहसंबद्ध है। कभी-कभी यह तथ्य कुछ स्वतंत्र हित का होता है।

विचरण और संरचनात्मक समीकरण मॉडलिंग का बहुभिन्नरूपी विश्लेषण

हाल के वर्षों में, संरचनात्मक समीकरण मॉडलिंग विचरण के बहुभिन्नरूपी विश्लेषण के विकल्प के रूप में लोकप्रिय हो गया है (उदाहरण के लिए, बागोजी और यी, 1989; बागोजी, यी और सिंह, 1991; कोल, मैक्सवेल, अर्वे और सालास, 1993 देखें) . यह दृष्टिकोण न केवल विभिन्न समूहों में साधनों के बारे में, बल्कि आश्रित चर के सहसंबंध मैट्रिक्स के बारे में भी परिकल्पनाओं का परीक्षण करने की अनुमति देता है। उदाहरण के लिए, कोई प्रसरण और सहप्रसरण की एकरूपता की धारणाओं को शिथिल कर सकता है और प्रत्येक समूह के लिए मॉडल में त्रुटि प्रसरण और सहप्रसरण को स्पष्ट रूप से शामिल कर सकता है। मापांक सांख्यिकीसंरचनात्मक समीकरण मॉडलिंग (SEPATH) (खंड III देखें) ऐसे विश्लेषण की अनुमति देता है।

सामान्य परिभाषाएँ

विचरण के विश्लेषण (एनोवा - भिन्नता का विश्लेषण) का उद्देश्य इन समूहों के भिन्नताओं की तुलना करके विभिन्न समूहों में साधनों के बीच अंतर के महत्व का परीक्षण करना है। कुल भिन्नता को कई स्रोतों में विभाजित करना (विभिन्न डिज़ाइन प्रभावों के कारण) समूह-समूह भिन्नता के कारण भिन्नता की तुलना समूह-समूह भिन्नता के कारण भिन्नता के साथ करने की अनुमति देता है।

परीक्षण की जा रही परिकल्पना यह है कि समूहों के बीच कोई अंतर नहीं है। यदि शून्य परिकल्पना सत्य है, तो समूह के भीतर भिन्नता से जुड़े भिन्नता का अनुमान समूह के बीच भिन्नता के अनुमान के करीब होना चाहिए। यदि गलत है, तो विचलन महत्वपूर्ण है।

सामान्य तौर पर, विचरण के विश्लेषण को कई प्रकारों में विभाजित किया जा सकता है:

  • एकआयामी (एक आश्रित चर) और बहुआयामी (कई आश्रित चर);

  • कारकों के बीच संभावित अंतःक्रिया के साथ अविभाज्य (एक समूहीकरण चर) और बहुक्रियाशील (कई समूहीकरण चर);

  • सरल माप के साथ (आश्रित चर को केवल एक बार मापा जाता है) और बार-बार माप के साथ (आश्रित चर को कई बार मापा जाता है)।

में सांख्यिकीविचरण विश्लेषण के सभी ज्ञात मॉडल लागू किए गए हैं।

में सांख्यिकीब्लॉक में एनोवा मॉड्यूल का उपयोग करके विचरण का विश्लेषण किया जा सकता है स्टेटिसिटिका बेस (विश्लेषण -> विचरण का विश्लेषण (डीए)). एक विशेष प्रकार का मॉडल बनाने के लिए उपयोग करें पूर्ण संस्करणविचरण का विश्लेषण, मॉड्यूल में प्रस्तुत किया गया सामान्य रैखिक मॉडल, सामान्यीकृत रैखिक और अरेखीय मॉडल, सामान्य प्रतिगमन मॉडल, निजी के सामान्य मॉडल कम से कम वर्गों खंड से उन्नत विश्लेषण तकनीकें (स्टेटिस्टिका उन्नत रैखिक/गैर-रेखीय मॉडल).

आरंभ तक

चरण दर चरण उदाहरण सांख्यिकी

हम एनोवा की शक्ति का वर्णन करेंगे सांख्यिकी, चरण-दर-चरण मॉडल उदाहरण देख रहे हैं।

स्रोत डेटा फ़ाइल आय, शिक्षा, आयु और लिंग के विभिन्न स्तरों वाले लोगों की आबादी का वर्णन करती है। आइए विचार करें कि शिक्षा स्तर, आयु और लिंग आय स्तर को कैसे प्रभावित करते हैं।

उम्र के अनुसार, सभी लोगों को चार समूहों में विभाजित किया गया था:

  • 30 वर्ष तक की आयु;

  • 31 से 40 वर्ष की आयु तक;

  • 41 से 50 वर्ष की आयु तक;

  • 51 साल की उम्र से.

शिक्षा के स्तर के अनुसार 5 समूहों में विभाजित किया गया:

  • अधूरा माध्यमिक;

  • औसत;

  • माध्यमिक व्यावसायिक;

  • अधूरी उच्च शिक्षा;

  • उच्चतर.

चूंकि ये मॉडल डेटा हैं, इसलिए प्राप्त परिणाम मुख्य रूप से गुणात्मक प्रकृति के होंगे और विश्लेषण करने की विधि को स्पष्ट करेंगे।

चरण 1: एक विश्लेषण का चयन करना

आइए मेनू से विचरण का विश्लेषण चुनें: विश्लेषण -> उन्नत विश्लेषण विधियाँ -> सामान्य रैखिक मॉडल.

चावल। 1. स्टेटिस्टिका ड्रॉप-डाउन मेनू से एनोवा का चयन करना

इसके बाद एक विंडो खुलेगी जिसमें विभिन्न प्रकार के विश्लेषण प्रस्तुत किए जाएंगे। चुनना विश्लेषण का प्रकारविचरण का तथ्यात्मक विश्लेषण.


चावल। 2. विश्लेषण के प्रकार का चयन करना

इस विंडो में आप यह भी चुन सकते हैं कि मॉडल कैसे बनाया जाए: डायलॉग मोड या विश्लेषण विज़ार्ड का उपयोग करें। आइए डायलॉग मोड चुनें।

चरण 2: वेरिएबल सेट करना

खुली हुई डेटा फ़ाइल से, विश्लेषण के लिए चर चुनें, बटन पर क्लिक करें चर, तुम ले रहे हो:

आय- निर्भर चर,

शिक्षा का स्तर, ज़मीनऔर आयु– श्रेणीबद्ध कारक (भविष्यवक्ता)।

नोटिस जो कारक कोडइस सरल उदाहरण में आपको इसे निर्दिष्ट करने की आवश्यकता नहीं है। जब आप बटन दबाते हैं ठीक है, सांख्यिकीउन्हें स्वचालित रूप से सेट कर देगा.


चावल। 3. चर सेट करना

चरण 3: विकल्प बदलना

चलिए टैब पर चलते हैं विकल्पखिड़की में जीएलएम फैक्टोरियल हाँ.


चावल। 4. विकल्प टैब

इस संवाद में आप यह कर सकते हैं:

  • यादृच्छिक कारकों का चयन करें;

  • मॉडल मानकीकरण का प्रकार निर्धारित करें;

  • वर्गों (एसएस) के योग के प्रकार को इंगित करें, वर्गों (एसएस) के 6 अलग-अलग योग हैं;

  • क्रॉस-चेकिंग सक्षम करें.

आइए सभी डिफ़ॉल्ट सेटिंग्स छोड़ें (ज्यादातर मामलों में यह पर्याप्त है) और बटन दबाएं ठीक है.

चरण 4. परिणामों का विश्लेषण करें - सभी प्रभाव देखें

विश्लेषण परिणाम विंडो में देखे जा सकते हैं परिणामटैब और बटन समूहों का उपयोग करना। उदाहरण के लिए, टैब पर विचार करें परिणाम.


चावल। 5. परिणाम विश्लेषण विंडो: परिणाम टैब

इस टैब से आप सभी मुख्य परिणामों तक पहुंच सकते हैं। अधिक परिणामों के लिए अन्य टैब का उपयोग करें. बटन कमआपको आमतौर पर उपयोग नहीं किए जाने वाले टैब को हटाकर परिणाम संवाद को संशोधित करने की अनुमति देता है।

जब बटन दबाया जाता है सभी प्रभावों की जाँच करेंहमें निम्नलिखित तालिका प्राप्त होती है।


चावल। 6. सभी प्रभावों की तालिका

यह तालिका विश्लेषण के मुख्य परिणाम प्रदर्शित करती है: वर्गों का योग, स्वतंत्रता की डिग्री, एफ-परीक्षण मान, महत्व स्तर।

अध्ययन की सुविधा के लिए, महत्वपूर्ण प्रभाव (पृ<.05) выделены красным цветом. Два главных эффекта (शिक्षा का स्तरऔर आयु) और इस उदाहरण में कुछ इंटरैक्शन महत्वपूर्ण हैं (पृ<.05).

चरण 5. परिणामों का विश्लेषण - निर्दिष्ट प्रभावों को देखना

यह देखने का सबसे अच्छा तरीका है कि विभिन्न श्रेणियों में औसत आय कैसे भिन्न होती है, ग्राफिकल टूल का उपयोग करना है। जब आप बटन दबाते हैं सभी प्रभाव/ग्राफिक्सनिम्न संवाद बॉक्स दिखाई देगा.


चावल। 7. सभी प्रभावों की विंडो तालिका

विंडो विचाराधीन सभी प्रभावों को सूचीबद्ध करती है। सांख्यिकीय रूप से महत्वपूर्ण प्रभाव * चिह्नित हैं।

उदाहरण के लिए, आइए प्रभाव का चयन करें आयु, समूह में प्रदर्शनआइए बताते हैं मेज़और क्लिक करें ठीक है. प्रत्येक प्रभाव स्तर के लिए आश्रित चर का औसत मान दिखाने वाली एक तालिका दिखाई देती है। (आय), मानक त्रुटि मान और आत्मविश्वास सीमाएँ।


चावल। 8. आयु चर के स्तर के आधार पर वर्णनात्मक आँकड़ों वाली तालिका

इस तालिका को चित्रमय रूप में प्रस्तुत करना सुविधाजनक है। इसके लिए हम चुनते हैं अनुसूचीसमूह में प्रदर्शनसंवाद बकस मेज़सभी प्रभाव और प्रेस ठीक है. संबंधित ग्राफ़ दिखाई देगा.


चावल। 9. औसत आय बनाम उम्र का ग्राफ

ग्राफ स्पष्ट रूप से दर्शाता है कि विभिन्न आयु के लोगों के समूहों के बीच आय के स्तर में अंतर है। जितनी अधिक आयु, उतनी अधिक आय।

हम कई कारकों की परस्पर क्रिया के लिए समान ऑपरेशन करेंगे। डायलॉग बॉक्स में चलो चुनें ज़मीन*आयुऔर क्लिक करें ठीक है.


चावल। 10. लिंग और उम्र के आधार पर औसत आय का ग्राफ़

एक अप्रत्याशित परिणाम प्राप्त हुआ: 50 वर्ष से कम आयु के सर्वेक्षण किए गए लोगों के लिए, आय का स्तर उम्र के साथ बढ़ता है और लिंग पर निर्भर नहीं होता है; 50 वर्ष से अधिक आयु के सर्वेक्षण में शामिल लोगों के लिए, महिलाओं की आय पुरुषों की तुलना में काफी अधिक है।

शैक्षिक स्तर के संदर्भ में परिणामी ग्राफ बनाना उचित है। शायद इस पैटर्न का कुछ श्रेणियों में उल्लंघन किया गया है या, इसके विपरीत, यह सार्वभौमिक है। इसके लिए हम चुनते हैं शिक्षा का स्तर * ज़मीन* आयुऔर क्लिक करें ठीक है.


चावल। 11. लिंग, आयु, शिक्षा के स्तर के आधार पर औसत आय का ग्राफ

हम देखते हैं कि परिणामी निर्भरता माध्यमिक और माध्यमिक व्यावसायिक शिक्षा के लिए विशिष्ट नहीं है। अन्य मामलों में यह उचित है.

चरण 6. परिणामों का विश्लेषण - मॉडल की गुणवत्ता का आकलन

ऊपर, विचरण के विश्लेषण के ग्राफिकल साधनों का मुख्य रूप से उपयोग किया गया था। आइए कुछ अन्य उपयोगी परिणाम देखें जिन्हें प्राप्त किया जा सकता है।

सबसे पहले, यह देखना दिलचस्प है कि प्रश्न में कारकों और उनकी बातचीत से कितना भिन्नता स्पष्ट होती है। ऐसा करने के लिए, टैब में परिणामबटन पर क्लिक करें सामान्य आर मॉडल. निम्न तालिका दिखाई देगी.

चावल। 12. एसएस मॉडल और एसएस अवशेषों की तालिका

सेट कॉलम में संख्या. आर2 - वर्ग एकाधिक सहसंबंध गुणांक; यह दर्शाता है कि निर्मित मॉडल द्वारा परिवर्तनशीलता के किस अनुपात को समझाया गया है। हमारे मामले में, R2 = 0.195, जो मॉडल की निम्न गुणवत्ता को इंगित करता है। वास्तव में, आय का स्तर न केवल मॉडल में शामिल कारकों से प्रभावित होता है।

चरण 7. परिणामों का विश्लेषण - कंट्रास्ट विश्लेषण

अक्सर यह न केवल विभिन्न श्रेणियों के लिए आश्रित चर के माध्य मान में अंतर स्थापित करने के लिए आवश्यक होता है, बल्कि दी गई श्रेणियों के लिए अंतर के परिमाण को स्थापित करने के लिए भी आवश्यक होता है। ऐसा करने के लिए, विरोधाभासों का पता लगाया जाना चाहिए।

यह ऊपर दिखाया गया था कि पुरुषों और महिलाओं के लिए आय का स्तर 51 वर्ष से अधिक आयु के लिए काफी भिन्न है, अन्य मामलों में, अंतर महत्वपूर्ण नहीं है; आइए हम 51 वर्ष से अधिक और 40 से 50 वर्ष के बीच के पुरुषों और महिलाओं के आय स्तर में अंतर निकालें।

ऐसा करने के लिए, टैब पर जाएँ विरोधाभासोंऔर सभी मान निम्नानुसार सेट करें।


चावल। 13. कंट्रास्ट टैब

जब बटन दबाया जाता है गणनाकई टेबलें दिखाई देंगी. हम कंट्रास्ट अनुमान वाली एक तालिका में रुचि रखते हैं।


चावल। 14. कंट्रास्ट मूल्यांकन तालिका

निम्नलिखित निष्कर्ष निकाले जा सकते हैं:

  • 51 वर्ष से अधिक आयु के पुरुषों और महिलाओं के लिए, आय में अंतर $48.7 हजार है;

  • 41 से 50 वर्ष की आयु के पुरुषों और महिलाओं के लिए, आय में अंतर 1.73 हजार डॉलर है।

इसी तरह, आप अधिक जटिल कंट्रास्ट सेट कर सकते हैं या पूर्वनिर्धारित सेटों में से किसी एक का उपयोग कर सकते हैं।

चरण 8: अतिरिक्त परिणाम

परिणाम विंडो के शेष टैब का उपयोग करके, आप निम्नलिखित परिणाम प्राप्त कर सकते हैं:

  • चयनित प्रभाव के लिए आश्रित चर का औसत मान - टैब औसत;

  • पोस्टीरियर मानदंड की जाँच करना (पोस्ट हॉक) - टैब वापस;

  • एनोवा - टैब के लिए बनाई गई धारणाओं की जाँच करना मान्यताओं;

  • प्रतिक्रिया/वांछनीयता प्रोफ़ाइल बनाना - टैब प्रोफाइल;

  • अवशेष विश्लेषण - टैब कूड़ा;

  • विश्लेषण में प्रयुक्त मैट्रिक्स का आउटपुट - टैब मैट्रिसेस;

  • इस नोट में सांख्यिकी के उपयोग को एक क्रॉस-कटिंग उदाहरण के साथ चित्रित किया जाएगा। मान लीजिए कि आप परफेक्ट पैराशूट में प्रोडक्शन मैनेजर हैं। पैराशूट चार अलग-अलग आपूर्तिकर्ताओं द्वारा आपूर्ति किए गए सिंथेटिक फाइबर से बने होते हैं। पैराशूट की मुख्य विशेषताओं में से एक इसकी ताकत है। आपको यह सुनिश्चित करना होगा कि आपूर्ति किए गए सभी फाइबर समान ताकत के हों। इस प्रश्न का उत्तर देने के लिए, सिंथेटिक फाइबर से बुने गए पैराशूट की ताकत को मापने के लिए एक प्रयोगात्मक डिजाइन तैयार किया जाना चाहिए। विभिन्न आपूर्तिकर्ता. इस प्रयोग से प्राप्त जानकारी यह निर्धारित करेगी कि कौन सा आपूर्तिकर्ता सबसे टिकाऊ पैराशूट प्रदान करता है।

    कई अनुप्रयोगों में ऐसे प्रयोग शामिल होते हैं जो एक ही कारक के कई समूहों या स्तरों पर विचार करते हैं। कुछ कारक, जैसे सिरेमिक फायरिंग तापमान, के कई संख्यात्मक स्तर हो सकते हैं (अर्थात 300°, 350°, 400° और 450°)। अन्य कारक, जैसे कि सुपरमार्केट में वस्तुओं का स्थान, के श्रेणीबद्ध स्तर हो सकते हैं (उदाहरण के लिए, पहला आपूर्तिकर्ता, दूसरा आपूर्तिकर्ता, तीसरा आपूर्तिकर्ता, चौथा आपूर्तिकर्ता)। एकल-कारक प्रयोग जिसमें प्रायोगिक इकाइयों को यादृच्छिक रूप से समूहों या कारक स्तरों को सौंपा जाता है, पूर्णतः यादृच्छिक कहलाते हैं।

    प्रयोगएफ-कई गणितीय अपेक्षाओं के बीच अंतर का आकलन करने के लिए मानदंड

    यदि समूहों में कारक की संख्यात्मक माप निरंतर है और कुछ अतिरिक्त शर्तें पूरी होती हैं, तो कई समूहों की गणितीय अपेक्षाओं की तुलना करने के लिए विचरण का विश्लेषण (एनोवा) का उपयोग किया जाता है। एकविश्लेषण हेएफ वारियांस)। पूरी तरह से यादृच्छिक डिज़ाइन का उपयोग करके विचरण के विश्लेषण को एक-तरफ़ा एनोवा प्रक्रिया कहा जाता है। कुछ मायनों में, विचरण का विश्लेषण शब्द एक मिथ्या नाम है क्योंकि यह भिन्नताओं के बजाय समूहों के अपेक्षित मूल्यों के बीच अंतर की तुलना करता है। हालाँकि, गणितीय अपेक्षाओं की तुलना सटीक रूप से डेटा भिन्नता के विश्लेषण के आधार पर की जाती है। एनोवा प्रक्रिया में, माप परिणामों में कुल भिन्नता को समूहों के बीच और भीतर-समूहों में विभाजित किया जाता है (चित्र 1)। समूह के भीतर भिन्नता को प्रयोगात्मक त्रुटि द्वारा समझाया गया है, और समूह के बीच भिन्नता को प्रयोगात्मक स्थितियों के प्रभावों द्वारा समझाया गया है। प्रतीक साथसमूहों की संख्या को दर्शाता है.

    चावल। 1. पूरी तरह से यादृच्छिक प्रयोग में भिन्नता का विभाजन

    नोट को प्रारूप में डाउनलोड करें, प्रारूप में उदाहरण

    चलिए ऐसा दिखावा करते हैं साथसमूह स्वतंत्र आबादी से निकाले जाते हैं जिनका सामान्य वितरण और समान भिन्नता होती है। शून्य परिकल्पना यह है कि जनसंख्या की गणितीय अपेक्षाएँ समान हैं: एच 0: μ 1 = μ 2 = ... = μ s. वैकल्पिक परिकल्पना बताती है कि सभी गणितीय अपेक्षाएँ समान नहीं हैं: एच 1: सभी μ j समान नहीं हैं जे= 1, 2, …, एस)।

    चित्र में. चित्र 2 पांच तुलनात्मक समूहों की गणितीय अपेक्षाओं के बारे में सच्ची शून्य परिकल्पना प्रस्तुत करता है, बशर्ते कि आबादी का सामान्य वितरण और समान विचरण हो। कारक के विभिन्न स्तरों से जुड़ी पाँच जनसंख्याएँ समान हैं। परिणामस्वरूप, समान गणितीय अपेक्षा, भिन्नता और आकार रखते हुए, वे एक-दूसरे पर आरोपित हो जाते हैं।

    चावल। 2. पांच सामान्य आबादी की गणितीय अपेक्षा समान है: μ 1 = μ 2 = μ 3 = μ 4 = μ 5

    दूसरी ओर, मान लीजिए कि वास्तव में शून्य परिकल्पना झूठी है, चौथे स्तर पर उच्चतम अपेक्षित मूल्य है, पहले स्तर पर थोड़ा कम अपेक्षित मूल्य है, और शेष स्तरों में समान और उससे भी कम अपेक्षित मूल्य हैं ( चित्र तीन)। ध्यान दें कि, अपेक्षित मूल्यों के अपवाद के साथ, सभी पांच आबादी समान हैं (अर्थात, उनकी परिवर्तनशीलता और आकार समान है)।

    चावल। 3. प्रायोगिक स्थितियों का प्रभाव देखा जाता है: μ 4 > μ 1 > μ 2 = μ 3 = μ 5

    कई सामान्य आबादी की गणितीय अपेक्षाओं की समानता के बारे में परिकल्पना का परीक्षण करते समय, कुल भिन्नता को दो भागों में विभाजित किया जाता है: अंतरसमूह भिन्नता, समूहों के बीच अंतर के कारण, और इंट्राग्रुप भिन्नता, एक ही समूह से संबंधित तत्वों के बीच अंतर के कारण। कुल भिन्नता वर्गों के कुल योग (एसएसटी - कुल वर्गों का योग) द्वारा व्यक्त की जाती है। चूँकि शून्य परिकल्पना यह है कि सभी की गणितीय अपेक्षाएँ साथसमूह एक-दूसरे के बराबर हैं, कुल भिन्नता व्यक्तिगत अवलोकनों और सभी नमूनों के लिए गणना किए गए समग्र औसत (औसत का औसत) के बीच अंतर के वर्गों के योग के बराबर है। पूर्ण विविधता:

    कहाँ - सामान्य औसत, एक्स आईजे - मैं-ई अवलोकन में जे-समूह या स्तर, एन जे- में टिप्पणियों की संख्या जेवें समूह, एन - कुलसभी समूहों में अवलोकन (अर्थात्) एन = एन 1 + एन 2 + … + एन सी), साथ- अध्ययन किए गए समूहों या स्तरों की संख्या।

    समूह के बीच भिन्नता, जिसे आमतौर पर बीच-समूह के वर्गों का योग कहा जाता है (एसएसए - समूहों के बीच वर्गों का योग), प्रत्येक समूह के नमूना माध्य के बीच अंतर के वर्गों के योग के बराबर है जेऔर कुल मिलाकर औसत , संबंधित समूह के आयतन से गुणा किया जाता है एन जे:

    कहाँ साथ- अध्ययन किए गए समूहों या स्तरों की संख्या, एन जे- में टिप्पणियों की संख्या जेवें समूह, जे- औसत मूल्य जेवें समूह, - कुल मिलाकर औसत।

    समूह के भीतर भिन्नता, जिसे आम तौर पर समूहों के भीतर वर्गों का योग कहा जाता है (एसएसडब्ल्यू - समूहों के साथ वर्गों का योग), प्रत्येक समूह के तत्वों और इस समूह के नमूना माध्य के बीच अंतर के वर्गों के योग के बराबर है जे:

    कहाँ एक्सआईजे - मैंवां तत्व जेवें समूह, जे- औसत मूल्य जेवें समूह.

    चूँकि उनकी तुलना की जाती है साथकारक स्तर, वर्गों का अंतरसमूह योग है एस - 1स्वतंत्रता की कोटियां। की प्रत्येक साथस्तर है एन जे – 1 स्वतंत्रता की डिग्री, इसलिए वर्गों का इंट्राग्रुप योग है एन- साथस्वतंत्रता की डिग्री, और

    इसके अलावा, वर्गों का कुल योग है एन – 1 प्रत्येक अवलोकन के बाद से स्वतंत्रता की डिग्री एक्सआईजेसभी पर गणना किए गए कुल औसत से तुलना की जाती है एनअवलोकन. यदि इनमें से प्रत्येक योग को स्वतंत्रता की डिग्री की संगत संख्या से विभाजित किया जाता है, तो तीन प्रकार के फैलाव उत्पन्न होते हैं: अंतरसमूह(माध्य वर्ग - एमएसए), इंट्राग्रुप(अंदर का माध्य वर्ग - MSW) और भरा हुआ(कुल माध्य वर्ग - एमएसटी):

    इस तथ्य के बावजूद कि विचरण के विश्लेषण का मुख्य उद्देश्य गणितीय अपेक्षाओं की तुलना करना है साथप्रायोगिक स्थितियों के प्रभाव की पहचान करने के लिए समूहों का नाम इस तथ्य के कारण है कि मुख्य उपकरण विभिन्न प्रकार के भिन्नताओं का विश्लेषण है। यदि शून्य परिकल्पना सत्य है, और गणितीय अपेक्षाओं के बीच साथसमूहों में कोई महत्वपूर्ण अंतर नहीं है, सभी तीन भिन्नताएं - एमएसए, एमएसडब्ल्यू और एमएसटी - भिन्नता अनुमान हैं σ 2विश्लेषण किए गए डेटा में निहित है। इस प्रकार, शून्य परिकल्पना का परीक्षण करना एच 0: μ 1 = μ 2 = ... = μ sऔर वैकल्पिक परिकल्पना एच 1: सभी μ j समान नहीं हैं जे = 1, 2, …, साथ), आँकड़ों की गणना करना आवश्यक है एफ-मानदंड, जो दो भिन्नताओं, एमएसए और एमएसडब्ल्यू का अनुपात है। परीक्षा एफ-विचरण के एकतरफ़ा विश्लेषण में आँकड़े

    आंकड़े एफ-मानदंड के अधीन एफ-वितरण के साथ एस - 1अंश में स्वतंत्रता की डिग्री एम.एस.ए.और एन - एसहर में स्वतंत्रता की डिग्री एम.एस.डब्ल्यू.. किसी दिए गए महत्व स्तर α के लिए, गणना करने पर शून्य परिकल्पना खारिज कर दी जाती है एफ एफयू, अंतर्निहित एफ-वितरण के साथ एस - 1 एन - एसहर में स्वतंत्रता की डिग्री. अतः, आकृति में दर्शाए गए अनुसार। 4, निर्णायक नियमइस प्रकार तैयार किया गया: शून्य परिकल्पना एच 0यदि अस्वीकार कर दिया गया एफ>एफयू; अन्यथा इसे अस्वीकार नहीं किया जाता है.

    चावल। 4. किसी परिकल्पना का परीक्षण करते समय विचरण के विश्लेषण का महत्वपूर्ण क्षेत्र एच 0

    यदि शून्य परिकल्पना एच 0सत्य है, परिकलित एफ-सांख्यिकी 1 के करीब है, क्योंकि इसके अंश और हर एक ही मात्रा के अनुमान हैं - विश्लेषित डेटा में निहित फैलाव σ 2। यदि शून्य परिकल्पना एच 0गलत है (और विभिन्न समूहों की गणितीय अपेक्षाओं के बीच एक महत्वपूर्ण अंतर है), गणना की गई एफ-सांख्यिकी एक से बहुत बड़ी होगी क्योंकि इसका अंश, एमएसए, डेटा की प्राकृतिक परिवर्तनशीलता के अलावा, प्रयोगात्मक स्थितियों के प्रभाव या समूहों के बीच अंतर का अनुमान लगाता है, जबकि हर एमएसडब्ल्यू केवल डेटा की प्राकृतिक परिवर्तनशीलता का अनुमान लगाता है। . इस प्रकार, एनोवा प्रक्रिया है एफ-मानदंड जिसमें, दिए गए महत्व स्तर α पर, गणना करने पर शून्य परिकल्पना खारिज कर दी जाती है एफ-आँकड़े ऊपरी महत्वपूर्ण मूल्य से अधिक हैं एफयू, अंतर्निहित एफ-वितरण के साथ एस - 1अंश में स्वतंत्रता की डिग्री और एन - एसहर में स्वतंत्रता की डिग्री, जैसा कि चित्र में दिखाया गया है। 4.

    विचरण के एक-तरफ़ा विश्लेषण को स्पष्ट करने के लिए, आइए नोट की शुरुआत में उल्लिखित परिदृश्य पर वापस जाएँ। प्रयोग का उद्देश्य यह निर्धारित करना है कि क्या विभिन्न आपूर्तिकर्ताओं से प्राप्त सिंथेटिक फाइबर से बुने गए पैराशूट की ताकत समान है। प्रत्येक समूह में पाँच पैराशूट होते हैं। समूहों को आपूर्तिकर्ता द्वारा विभाजित किया गया है - आपूर्तिकर्ता 1, आपूर्तिकर्ता 2, आपूर्तिकर्ता 3 और आपूर्तिकर्ता 4। पैराशूट की ताकत को एक विशेष उपकरण का उपयोग करके मापा जाता है जो दोनों तरफ से कपड़े के फटने का परीक्षण करता है। पैराशूट को तोड़ने के लिए आवश्यक बल को एक विशेष पैमाने पर मापा जाता है। तोड़ने वाला बल जितना अधिक होगा, पैराशूट उतना ही मजबूत होगा। एक्सेल आपको विश्लेषण करने की अनुमति देता है एफ-एक क्लिक में आँकड़े। मेनू के माध्यम से जाओ डेटाडेटा विश्लेषण, और पंक्ति का चयन करें एक तरफ़ा एनोवा, खुलने वाली विंडो को भरें (चित्र 5)। प्रायोगिक परिणाम (ब्रेकिंग स्ट्रेंथ), कुछ वर्णनात्मक आँकड़े और विचरण के एक-तरफ़ा विश्लेषण के परिणाम चित्र में प्रस्तुत किए गए हैं। 6.

    चावल। 5. खिड़की वेरिएंस विश्लेषण पैकेज का एक-तरफ़ा विश्लेषणएक्सेल

    चावल। 6. विभिन्न आपूर्तिकर्ताओं से प्राप्त सिंथेटिक फाइबर से बुने हुए पैराशूट के शक्ति संकेतक, वर्णनात्मक आँकड़े और विचरण के एक-तरफ़ा विश्लेषण के परिणाम

    चित्र 6 के विश्लेषण से पता चलता है कि नमूना साधनों के बीच कुछ अंतर है। पहले आपूर्तिकर्ता से प्राप्त फाइबर की औसत ताकत 19.52 है, दूसरे से - 24.26, तीसरे से - 22.84 और चौथे से - 21.16। क्या यह अंतर सांख्यिकीय रूप से महत्वपूर्ण है? टूटना बल का वितरण स्कैटर प्लॉट (चित्र 7) में प्रदर्शित किया गया है। यह स्पष्ट रूप से समूहों के बीच और भीतर दोनों में अंतर दिखाता है। यदि प्रत्येक समूह आकार में बड़ा होता, तो उनका विश्लेषण करने के लिए तना-और-पत्ती आरेख, बॉक्स प्लॉट या बेल प्लॉट का उपयोग किया जा सकता था।

    चावल। 7. चार आपूर्तिकर्ताओं से प्राप्त सिंथेटिक फाइबर से बुने गए पैराशूट के लिए शक्ति फैलाव का आरेख।

    शून्य परिकल्पना बताती है कि औसत शक्ति स्कोर के बीच कोई महत्वपूर्ण अंतर नहीं है: एच 0: μ 1 = μ 2 = μ 3 = μ 4. एक वैकल्पिक परिकल्पना यह है कि कम से कम एक आपूर्तिकर्ता ऐसा है जिसकी औसत फाइबर ताकत दूसरों से भिन्न है: एच 1: सभी μ j समान नहीं हैं ( जे = 1, 2, …, साथ).

    कुल मिलाकर औसत (चित्र 6 देखें) = औसत(डी12:डी15) = 21.945; निर्धारित करने के लिए, आप सभी 20 मूल संख्याओं का औसत भी निकाल सकते हैं: = औसत(ए3:डी7)। विचरण मानों की गणना की जाती है विश्लेषण पैकेजऔर प्लेट में प्रतिबिंबित होते हैं भिन्नता का विश्लेषण(चित्र 6 देखें): एसएसए = 63.286, एसएसडब्ल्यू = 97.504, एसएसटी = 160.790 (कॉलम देखें) एसएसटेबल भिन्नता का विश्लेषणचित्र 6). औसत की गणना वर्गों के इन योगों को स्वतंत्रता की डिग्री की उचित संख्या से विभाजित करके की जाती है। क्योंकि साथ= 4, ए एन= 20, हमें स्वतंत्रता की कोटि के निम्नलिखित मान प्राप्त होते हैं; एसएसए के लिए: एस - 1=3; एसएसडब्ल्यू के लिए: एन सी= 16; एसएसटी के लिए: एन - 1= 19 (कॉलम देखें डीएफ). इस प्रकार: एमएसए = एसएसए / ( एस - 1)= 21.095; एमएसडब्ल्यू = एसएसडब्ल्यू /( एन सी) = 6.094; एमएसटी = एसएसटी /( एन - 1) = 8.463 (कॉलम देखें एमएस). एफ-सांख्यिकी = एमएसए/एमएसडब्ल्यू = 3.462 (कॉलम देखें)। एफ).

    ऊपरी महत्वपूर्ण मूल्य एफयू, विशेषता एफ-वितरण, सूत्र द्वारा निर्धारित =F.OBR(0.95;3;16) = 3.239. फ़ंक्शन के पैरामीटर =F.OBR(): α = 0.05, अंश के पास स्वतंत्रता की तीन डिग्री है, और हर के पास 16 है। इस प्रकार, गणना की गई एफ-3.462 के बराबर आँकड़ा ऊपरी महत्वपूर्ण मान से अधिक है एफयू= 3.239, शून्य परिकल्पना अस्वीकृत की जाती है (चित्र 8)।

    चावल। 8. 0.05 के महत्व स्तर पर विचरण के विश्लेषण का महत्वपूर्ण क्षेत्र यदि अंश में स्वतंत्रता की तीन डिग्री है और हर -16 है

    आर-मूल्य, यानी संभावना है कि यदि शून्य परिकल्पना सत्य है एफ-आंकड़े 3.46 से कम नहीं, 0.041 या 4.1% के बराबर (कॉलम देखें) पी-मूल्यटेबल भिन्नता का विश्लेषणचित्र 6). चूंकि यह मान महत्व स्तर α = 5% से अधिक नहीं है, इसलिए शून्य परिकल्पना खारिज कर दी जाती है। इसके अतिरिक्त, आर-मूल्य इंगित करता है कि सामान्य आबादी की गणितीय अपेक्षाओं के बीच इस तरह के या अधिक अंतर का पता लगाने की संभावना, बशर्ते कि वे वास्तव में समान हों, 4.1% के बराबर है।

    इसलिए। चारों नमूना माध्यों में अंतर है। शून्य परिकल्पना यह थी कि चार आबादी की सभी गणितीय अपेक्षाएँ समान हैं। इन शर्तों के तहत, सभी पैराशूटों की ताकत की कुल परिवर्तनशीलता (यानी कुल एसएसटी भिन्नता) की माप की गणना प्रत्येक अवलोकन के बीच वर्ग अंतर को जोड़कर की जाती है। एक्स आईजेऔर कुल मिलाकर औसत . फिर कुल भिन्नता को दो घटकों में विभाजित किया गया (चित्र 1 देखें)। पहला घटक एसएसए में समूह के बीच भिन्नता थी और दूसरा एसएसडब्ल्यू में समूह के भीतर भिन्नता थी।

    डेटा में परिवर्तनशीलता क्या बताती है? दूसरे शब्दों में, सभी अवलोकन एक जैसे क्यों नहीं हैं? एक कारण यह है कि अलग-अलग कंपनियां अलग-अलग ताकत के फाइबर की आपूर्ति करती हैं। यह आंशिक रूप से बताता है कि समूहों की अलग-अलग गणितीय अपेक्षाएँ क्यों हैं: प्रयोगात्मक स्थितियों का प्रभाव जितना मजबूत होगा, समूहों की गणितीय अपेक्षाओं के बीच अंतर उतना ही अधिक होगा। डेटा परिवर्तनशीलता का एक अन्य कारण किसी भी प्रक्रिया की प्राकृतिक परिवर्तनशीलता है, इस मामले में पैराशूट का उत्पादन। भले ही सभी फाइबर एक ही आपूर्तिकर्ता से खरीदे गए हों, उनकी ताकत समान नहीं होगी, अन्य सभी चीजें समान होंगी। चूँकि यह प्रभाव प्रत्येक समूह के भीतर होता है, इसलिए इसे समूह के भीतर भिन्नता कहा जाता है।

    नमूना साधनों के बीच अंतर को अंतरसमूह भिन्नता एसएसए कहा जाता है। समूह के भीतर भिन्नता का एक हिस्सा, जैसा कि पहले ही संकेत दिया गया है, विभिन्न समूहों से संबंधित डेटा द्वारा समझाया गया है। हालाँकि, भले ही समूह बिल्कुल समान हों (अर्थात, शून्य परिकल्पना सत्य थी), समूह के बीच भिन्नता अभी भी मौजूद होगी। इसका कारण पैराशूट निर्माण प्रक्रिया की प्राकृतिक परिवर्तनशीलता है। क्योंकि नमूने अलग-अलग हैं, उनके नमूना साधन एक-दूसरे से भिन्न हैं। इसलिए, यदि शून्य परिकल्पना सत्य है, तो समूह के बीच और भीतर की परिवर्तनशीलता दोनों जनसंख्या परिवर्तनशीलता के अनुमान का प्रतिनिधित्व करती हैं। यदि शून्य परिकल्पना गलत है, तो समूहों के बीच की परिकल्पना बड़ी होगी। यही वह तथ्य है जो इसका आधार है एफ-कई समूहों की गणितीय अपेक्षाओं के बीच अंतर की तुलना करने के लिए मानदंड।

    एक-तरफ़ा एनोवा का प्रदर्शन करने और फर्मों के बीच महत्वपूर्ण अंतर खोजने के बाद, यह अज्ञात रहता है कि कौन सा आपूर्तिकर्ता दूसरों से काफी अलग है। हम केवल इतना जानते हैं कि सामान्य आबादी की गणितीय अपेक्षाएँ समान नहीं हैं। दूसरे शब्दों में, कम से कम एक गणितीय अपेक्षा दूसरों से काफी भिन्न है। यह निर्धारित करने के लिए कि कौन सा आपूर्तिकर्ता दूसरों से अलग है, आप इसका उपयोग कर सकते हैं तुकी प्रक्रिया, आपूर्तिकर्ताओं के बीच जोड़ीवार तुलना का उपयोग करना। यह प्रक्रिया जॉन टुकी द्वारा विकसित की गई थी। इसके बाद, उन्होंने और के. क्रेमर ने उन स्थितियों के लिए इस प्रक्रिया को स्वतंत्र रूप से संशोधित किया जिनमें नमूना आकार एक दूसरे से भिन्न होते हैं।

    एकाधिक तुलना: तुकी-क्रेमर प्रक्रिया

    हमारे परिदृश्य में, पैराशूट की ताकत की तुलना करने के लिए विचरण के एक-तरफ़ा विश्लेषण का उपयोग किया गया था। चार समूहों की गणितीय अपेक्षाओं के बीच महत्वपूर्ण अंतर पाए जाने के बाद, यह निर्धारित करना आवश्यक है कि कौन से समूह एक दूसरे से भिन्न हैं। हालाँकि इस समस्या को हल करने के कई तरीके हैं, हम केवल तुकी-क्रेमर एकाधिक तुलना प्रक्रिया का वर्णन करेंगे। यह विधि पोस्ट हॉक तुलना प्रक्रियाओं का एक उदाहरण है क्योंकि परीक्षण की जा रही परिकल्पना डेटा विश्लेषण के बाद तैयार की जाती है। तुकी-क्रेमर प्रक्रिया समूहों के सभी जोड़ियों की एक साथ तुलना करने की अनुमति देती है। पहले चरण में, अंतर की गणना की जाती है एक्सजे -एक्सजे, कहाँ जे ≠जे, गणितीय अपेक्षाओं के बीच एस(एस - 1)/2समूह. गंभीर दायरातुकी-क्रेमर प्रक्रिया की गणना सूत्र द्वारा की जाती है:

    कहाँ क्यू यू- छात्रीकृत श्रेणी वितरण का ऊपरी महत्वपूर्ण मूल्य, जो है साथअंश में स्वतंत्रता की डिग्री और एन - साथहर में स्वतंत्रता की डिग्री.

    यदि नमूना आकार समान नहीं हैं, तो गणितीय अपेक्षाओं की प्रत्येक जोड़ी के लिए महत्वपूर्ण सीमा की गणना अलग से की जाती है। अंतिम चरण में, प्रत्येक एस(एस - 1)/2गणितीय अपेक्षाओं के जोड़े की तुलना संबंधित महत्वपूर्ण सीमा से की जाती है। यदि अंतर मापांक | हो तो जोड़ी के तत्वों को काफी भिन्न माना जाता है एक्सजे -एक्सजे| उनके बीच महत्वपूर्ण सीमा से अधिक है।

    आइए पैराशूट की ताकत की समस्या पर तुकी-क्रेमर प्रक्रिया लागू करें। चूंकि पैराशूट कंपनी के चार आपूर्तिकर्ता हैं, इसलिए जांच के लिए आपूर्तिकर्ताओं के 4(4 - 1)/2 = 6 जोड़े हैं (चित्र 9)।

    चावल। 9. नमूना साधनों की जोड़ीवार तुलना

    चूँकि सभी समूहों का आयतन समान है (अर्थात् सभी)। एन जे = एन जे), यह केवल एक महत्वपूर्ण सीमा की गणना करने के लिए पर्याप्त है। ऐसा करने के लिए, तालिका के अनुसार एनोवा(चित्र 6) हम MSW = 6.094 का मान निर्धारित करते हैं। तब हम मूल्य ज्ञात करते हैं क्यू यूα = 0.05 पर, साथ= 4 (अंश में स्वतंत्रता की डिग्री की संख्या) और एन- साथ= 20 – 4 = 16 (हर में स्वतंत्रता की डिग्री की संख्या)। दुर्भाग्य से, मुझे एक्सेल में संबंधित फ़ंक्शन नहीं मिला, इसलिए मैंने तालिका का उपयोग किया (चित्र 10)।

    चावल। 10. छात्रीकृत सीमा का महत्वपूर्ण मूल्य क्यू यू

    हम पाते हैं:

    चूँकि केवल 4.74 > 4.47 (चित्र 9 की निचली तालिका देखें), पहले और दूसरे आपूर्तिकर्ता के बीच सांख्यिकीय रूप से महत्वपूर्ण अंतर मौजूद है। अन्य सभी जोड़ियों के पास नमूना साधन हैं जो हमें उनके मतभेदों के बारे में बात करने की अनुमति नहीं देते हैं। नतीजतन, पहले आपूर्तिकर्ता से खरीदे गए फाइबर से बुने गए पैराशूट की औसत ताकत दूसरे की तुलना में काफी कम है।

    विचरण के एक-तरफ़ा विश्लेषण के लिए आवश्यक शर्तें

    पैराशूट की ताकत की समस्या को हल करते समय, हमने यह जांच नहीं की कि क्या जिन परिस्थितियों में एक-कारक का उपयोग करना संभव है एफ-मानदंड. आप कैसे जानेंगे कि आप एक-कारक का उपयोग कर सकते हैं? एफविशिष्ट प्रयोगात्मक डेटा का विश्लेषण करते समय मानदंड? एकल कारक एफ-मानदंड केवल तभी लागू किया जा सकता है जब तीन बुनियादी धारणाएं पूरी हों: प्रयोगात्मक डेटा यादृच्छिक और स्वतंत्र होना चाहिए, सामान्य वितरण होना चाहिए, और उनके भिन्नताएं बराबर होनी चाहिए।

    पहला अनुमान - यादृच्छिकता और डेटा स्वतंत्रता- हमेशा निष्पादित किया जाना चाहिए, क्योंकि किसी भी प्रयोग की शुद्धता पसंद की यादृच्छिकता और/या यादृच्छिकीकरण प्रक्रिया पर निर्भर करती है। परिणामों में पक्षपात से बचने के लिए यह आवश्यक है कि डेटा निकाला जाए साथसामान्य आबादी बेतरतीब ढंग से और एक दूसरे से स्वतंत्र रूप से। इसी तरह, डेटा को यादृच्छिक रूप से वितरित किया जाना चाहिए साथजिस कारक में हम रुचि रखते हैं उसके स्तर (प्रायोगिक समूह)। इन शर्तों का उल्लंघन विचरण के विश्लेषण के परिणामों को गंभीर रूप से विकृत कर सकता है।

    दूसरा अनुमान - साधारण अवस्था- इसका मतलब है कि डेटा सामान्य रूप से वितरित आबादी से निकाला गया है। से संबंधित टी-मानदंड, विचरण का एकतरफ़ा विश्लेषण के आधार पर एफ-मानदंड इस शर्त के उल्लंघन के प्रति अपेक्षाकृत कम संवेदनशील है। यदि वितरण सामान्य से बहुत अधिक विचलन नहीं करता है, तो महत्व स्तर एफ-मानदंड थोड़ा बदलता है, खासकर यदि नमूना आकार काफी बड़ा हो। यदि वितरण की सामान्यता की शर्त का गम्भीर उल्लंघन हो तो इसे लागू किया जाना चाहिए।

    तीसरा अनुमान - विचरण की एकरूपता- इसका मतलब है कि प्रत्येक जनसंख्या के प्रसरण एक दूसरे के बराबर हैं (यानी σ 1 2 = σ 2 2 = ... = σ j 2)। यह धारणा किसी को यह निर्णय लेने की अनुमति देती है कि समूह के भीतर भिन्नताओं को अलग करना है या पूल करना है। यदि समूह का आकार समान है, तो विचरण की एकरूपता की स्थिति का उपयोग करके प्राप्त निष्कर्षों पर बहुत कम प्रभाव पड़ता है एफ-मानदंड। हालाँकि, यदि नमूना आकार असमान हैं, तो भिन्नता की समानता की स्थिति का उल्लंघन भिन्नता के विश्लेषण के परिणामों को गंभीर रूप से विकृत कर सकता है। इसलिए, यह सुनिश्चित करने का प्रयास किया जाना चाहिए कि नमूना आकार समान हों। विचरण की एकरूपता की धारणा की जाँच करने के तरीकों में से एक मानदंड है लेवेनेनीचे वर्णित।

    यदि, तीनों शर्तों में से, केवल विचरण की एकरूपता की शर्त का उल्लंघन किया जाता है, तो एक प्रक्रिया समान होती है टी-अलग-अलग विचरण का उपयोग करते हुए मानदंड (अधिक जानकारी के लिए, देखें)। हालाँकि, यदि सामान्य वितरण और विचरण की एकरूपता की धारणाओं का एक साथ उल्लंघन किया जाता है, तो डेटा को सामान्य करना और भिन्नताओं के बीच अंतर को कम करना या एक गैरपैरामीट्रिक प्रक्रिया लागू करना आवश्यक है।

    विचरण की एकरूपता के परीक्षण के लिए लेवेने का परीक्षण

    हालांकि एफ-मानदंड समूहों में भिन्नताओं की समानता की स्थिति के उल्लंघन के प्रति अपेक्षाकृत प्रतिरोधी है; इस धारणा का घोर उल्लंघन मानदंड के महत्व और शक्ति के स्तर को महत्वपूर्ण रूप से प्रभावित करता है; शायद सबसे शक्तिशाली में से एक है कसौटी लेवेने. भिन्नताओं की समानता की जाँच करना साथसामान्य आबादी, हम निम्नलिखित परिकल्पनाओं का परीक्षण करेंगे:

    Н 0: σ 1 2 = σ 2 2 = … = σजे 2

    एच 1: सभी नहीं σ जे 2समान हैं ( जे = 1, 2, …, साथ)

    संशोधित लेवेने का परीक्षण इस प्रस्ताव पर आधारित है कि यदि विभिन्न समूहों में परिवर्तनशीलता समान है, तो भिन्नता के विश्लेषण का उपयोग भिन्नताओं की समानता की शून्य परिकल्पना का परीक्षण करने के लिए किया जा सकता है। सम्पूर्ण मूल्यअवलोकनों और समूह मध्यस्थों के बीच अंतर. इसलिए, आपको पहले प्रत्येक समूह में अवलोकनों और माध्यिकाओं के बीच अंतर के निरपेक्ष मूल्यों की गणना करनी चाहिए, और फिर अंतरों के परिणामी निरपेक्ष मूल्यों पर विचरण का एक-तरफ़ा विश्लेषण करना चाहिए। लेवेने की कसौटी को स्पष्ट करने के लिए, आइए नोट की शुरुआत में उल्लिखित परिदृश्य पर वापस लौटें। चित्र में प्रस्तुत डेटा का उपयोग करना। 6, हम एक समान विश्लेषण करेंगे, लेकिन प्रत्येक नमूने के लिए प्रारंभिक डेटा और माध्यकों में अंतर के मॉड्यूल के संबंध में अलग से (चित्र 11)।



साइट पर नया

>

सबसे लोकप्रिय