घर स्वच्छता एक्सेल में सहसंबंध गुणांक की गणना। सहसंबंध गुणांक ज्ञात करने का एक उदाहरण

एक्सेल में सहसंबंध गुणांक की गणना। सहसंबंध गुणांक ज्ञात करने का एक उदाहरण

सहसंबंध गुणांक (या रैखिक गुणांकसहसंबंध) को "आर" के रूप में दर्शाया जाता है (दुर्लभ मामलों में "ρ") और विशेषताएँ रैखिक सहसंबंध(अर्थात, दो या दो से अधिक चरों का एक संबंध जो किसी मान और दिशा द्वारा दिया जाता है)। गुणांक मान -1 और +1 के बीच होता है, यानी सहसंबंध सकारात्मक और नकारात्मक दोनों हो सकता है। यदि सहसंबंध गुणांक -1 है, तो एक पूर्ण नकारात्मक सहसंबंध है; यदि सहसंबंध गुणांक +1 है, तो एक पूर्ण सकारात्मक सहसंबंध है। अन्य मामलों में, दो चरों के बीच एक सकारात्मक सहसंबंध, एक नकारात्मक सहसंबंध, या कोई सहसंबंध नहीं होता है। सहसंबंध गुणांक की गणना मैन्युअल रूप से, मुफ़्त ऑनलाइन कैलकुलेटर का उपयोग करके, या एक अच्छे ग्राफ़िंग कैलकुलेटर का उपयोग करके की जा सकती है।

कदम

सहसंबंध गुणांक की मैन्युअल रूप से गणना करना

    डेटा जुटाओ।इससे पहले कि आप सहसंबंध गुणांक की गणना शुरू करें, दिए गए संख्याओं के जोड़े का अध्ययन करें। उन्हें ऐसी तालिका में लिखना बेहतर है जिसे लंबवत या क्षैतिज रूप से रखा जा सके। प्रत्येक पंक्ति या स्तंभ को "x" और "y" के रूप में लेबल करें।

    • उदाहरण के लिए, वेरिएबल्स "x" और "y" के मानों (संख्याओं) के चार जोड़े दिए गए हैं। आप निम्न तालिका बना सकते हैं:
      • एक्स || य
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  1. "x" के अंकगणितीय माध्य की गणना करें।ऐसा करने के लिए, सभी "x" मान जोड़ें, और फिर परिणामी परिणाम को मानों की संख्या से विभाजित करें।

    • हमारे उदाहरण में, वेरिएबल "x" के चार मान दिए गए हैं। "x" के अंकगणितीय माध्य की गणना करने के लिए, इन मानों को जोड़ें, और फिर योग को 4 से विभाजित करें। गणना इस प्रकार लिखी जाएगी:
    • μ x = (1 + 2 + 4 + 5) / 4 (\displaystyle \mu _(x)=(1+2+4+5)/4)
    • μ x = 12 / 4 (\displaystyle \mu _(x)=12/4)
    • μ x = 3 (\displaystyle \mu _(x)=3)
  2. अंकगणितीय माध्य "y" ज्ञात कीजिए।ऐसा करने के लिए दौड़ें समान क्रियाएं, अर्थात्, "y" के सभी मानों को जोड़ें, और फिर योग को मानों की संख्या से विभाजित करें।

    • हमारे उदाहरण में, वेरिएबल "y" के चार मान दिए गए हैं। इन मानों को जोड़ें, और फिर योग को 4 से विभाजित करें। गणना इस प्रकार लिखी जाएगी:
    • μ y = (1 + 3 + 5 + 7) / 4 (\displaystyle \mu _(y)=(1+3+5+7)/4)
    • μ y = 16 / 4 (\displaystyle \mu _(y)=16/4)
    • μ y = 4 (\displaystyle \mu _(y)=4)
  3. "x" के मानक विचलन की गणना करें।"x" और "y" के औसत मानों की गणना करने के बाद, ज्ञात कीजिए मानक विचलनये चर. मानक विचलन की गणना निम्न सूत्र का उपयोग करके की जाती है:

    • σ x = 1 n - 1 Σ (x - μ x) 2 (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(n-1))\Sigma (x-\mu _( x))^(2))))
    • σ x = 1 4 − 1 ∗ ((1 − 3) 2 + (2 − 3) 2 + (4 − 3) 2 + (5 − 3) 2) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(4-1))*((1-3)^(2)+(2-3)^(2)+(4-3)^(2)+(5-3) ^(2)))))
    • σ x = 1 3 * (4 + 1 + 1 + 4) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(4+1+1+4)) ))
    • σ x = 1 3 * (10) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(10))))
    • σ x = 10 3 (\displaystyle \sigma _(x)=(\sqrt (\frac (10)(3))))
    • σ x = 1,83 (\displaystyle \sigma _(x)=1,83)
  4. "Y" के मानक विचलन की गणना करें।पिछले चरण में वर्णित चरणों का पालन करें. उसी सूत्र का उपयोग करें, लेकिन उसमें "y" मान प्रतिस्थापित करें।

    • हमारे उदाहरण में, गणनाएँ इस प्रकार लिखी जाएंगी:
    • σ y = 1 4 − 1 ∗ ((1 − 4) 2 + (3 − 4) 2 + (5 − 4) 2 + (7 − 4) 2) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(4-1))*((1-4)^(2)+(3-4)^(2)+(5-4)^(2)+(7-4) ^(2)))))
    • σ y = 1 3 * (9 + 1 + 1 + 9) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(9+1+1+9)) ))
    • σ y = 1 3 * (20) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(20))))
    • σ y = 20 3 (\displaystyle \sigma _(y)=(\sqrt (\frac (20)(3))))
    • σ y = 2.58 (\displaystyle \sigma _(y)=2.58)
  5. सहसंबंध गुणांक की गणना के लिए मूल सूत्र लिखिए।इस सूत्र में दोनों चरों के लिए माध्य, मानक विचलन और संख्या (n) संख्याओं के जोड़े शामिल हैं। सहसंबंध गुणांक को "आर" (दुर्लभ मामलों में "ρ" के रूप में) के रूप में दर्शाया गया है। यह आलेख पियर्सन सहसंबंध गुणांक की गणना के लिए एक सूत्र का उपयोग करता है।

    • यहां और अन्य स्रोतों में, मात्राएं अलग-अलग निर्दिष्ट की जा सकती हैं। उदाहरण के लिए, कुछ सूत्रों में "ρ" और "σ" होते हैं, जबकि अन्य में "r" और "s" होते हैं। कुछ पाठ्यपुस्तकें अन्य सूत्र देती हैं, लेकिन वे उपरोक्त सूत्र के गणितीय अनुरूप हैं।
  6. आपने दोनों चरों के माध्य और मानक विचलन की गणना कर ली है, इसलिए आप सहसंबंध गुणांक की गणना के लिए सूत्र का उपयोग कर सकते हैं। याद रखें कि "n" दोनों चर के लिए मानों के जोड़े की संख्या है। अन्य मात्राओं के मूल्यों की गणना पहले की गई थी।

    • हमारे उदाहरण में, गणनाएँ इस प्रकार लिखी जाएंगी:
    • ρ = (1 n - 1) Σ (x - μ x σ x) * (y - μ y σ y) (\displaystyle \rho =\left((\frac (1)(n-1))\right) \सिग्मा \left((\frac (x-\mu _(x))(\sigma _(x)))\right)*\left((\frac (y-\mu _(y))(\sigma _(य)))\दाएं))
    • ρ = (1 3) * (\displaystyle \rho =\left((\frac (1)(3))\right)*)[ (1 - 3 1, 83) * (1 - 4 2, 58) + (2 - 3 1, 83) * (3 - 4 2, 58) (\displaystyle \left((\frac (1-3)( 1.83))\दाएं)*\बाएं((\frac (1-4)(2.58))\दाएं)+\बाएं((\frac (2-3)(1.83))\दाएं) *\बाएं((\ फ़्रेक (3-4)(2.58))\दाएँ))
      + (4 - 3 1, 83) * (5 - 4 2, 58) + (5 - 3 1, 83) * (7 - 4 2, 58) (\displaystyle +\left((\frac (4-3) )(1.83))\दाएं)*\बाएं((\frac (5-4)(2.58))\दाएं)+\बाएं((\frac (5-3)(1.83))\ दाएं)*\बाएं( (\frac (7-4)(2.58))\दाएं))]
    • ρ = (1 3) * (6 + 1 + 1 + 6 4, 721) (\displaystyle \rho =\left((\frac (1)(3))\right)*\left((\frac (6) +1+1+6)(4,721))\दाएं))
    • ρ = (1 3) * 2, 965 (\displaystyle \rho =\left((\frac (1)(3))\right)*2.965)
    • ρ = (2, 965 3) (\displaystyle \rho =\left((\frac (2.965)(3))\right))
    • ρ = 0.988 (\displaystyle \rho =0.988)
  7. परिणाम का विश्लेषण करें.हमारे उदाहरण में, सहसंबंध गुणांक 0.988 है। यह मान किसी तरह से संख्याओं के जोड़े के इस सेट की विशेषता बताता है। मूल्य के चिह्न और परिमाण पर ध्यान दें।

    • चूँकि सहसंबंध गुणांक का मान सकारात्मक है, चर "x" और "y" के बीच एक सकारात्मक सहसंबंध है। अर्थात जैसे-जैसे “x” का मान बढ़ता है, वैसे-वैसे “y” का मान भी बढ़ता है।
    • चूँकि सहसंबंध गुणांक का मान +1 के बहुत करीब है, चर "x" और "y" के मान अत्यधिक परस्पर संबंधित हैं। यदि आप निर्देशांक तल पर बिंदु अंकित करते हैं, तो वे एक निश्चित सीधी रेखा के करीब स्थित होंगे।

    सहसंबंध गुणांक की गणना के लिए ऑनलाइन कैलकुलेटर का उपयोग करना

    1. सहसंबंध गुणांक की गणना के लिए इंटरनेट पर एक कैलकुलेटर ढूंढें।इस गुणांक की गणना अक्सर आँकड़ों में की जाती है। यदि संख्याओं के कई जोड़े हैं, तो सहसंबंध गुणांक की मैन्युअल रूप से गणना करना लगभग असंभव है। इसलिए, सहसंबंध गुणांक की गणना के लिए ऑनलाइन कैलकुलेटर मौजूद हैं। किसी खोज इंजन में, "सहसंबंध गुणांक कैलकुलेटर" (बिना उद्धरण के) दर्ज करें।

    2. डेटा दर्ज करें।कृपया यह सुनिश्चित करने के लिए वेबसाइट पर दिए गए निर्देशों की समीक्षा करें कि आपने डेटा (संख्या जोड़े) सही ढंग से दर्ज किया है। संख्याओं के उपयुक्त जोड़े दर्ज करना अत्यंत महत्वपूर्ण है; अन्यथा आपको गलत परिणाम मिलेगा. याद रखें कि अलग-अलग वेबसाइटों में अलग-अलग डेटा प्रविष्टि प्रारूप होते हैं।

      • उदाहरण के लिए, वेबसाइट http://ncalculators.com/statistics/correlation-coefficient-calculator.htm पर वेरिएबल "x" और "y" के मान दो क्षैतिज रेखाओं में दर्ज किए गए हैं। मानों को अल्पविराम द्वारा अलग किया जाता है. अर्थात्, हमारे उदाहरण में, "x" मान इस प्रकार दर्ज किए गए हैं: 1,2,4,5, और "y" मान इस प्रकार दर्ज किए गए हैं: 1,3,5,7।
      • किसी अन्य साइट, http://www.alcula.com/calculators/statistics/correlation-coefficient/ पर, डेटा लंबवत रूप से दर्ज किया जाता है; इस मामले में, संख्याओं के संगत युग्मों को भ्रमित न करें।
    3. सहसंबंध गुणांक की गणना करें.डेटा दर्ज करने के बाद, परिणाम प्राप्त करने के लिए बस "गणना करें", "गणना करें" या इसी तरह के बटन पर क्लिक करें।

      ग्राफ़िंग कैलकुलेटर का उपयोग करना

      1. डेटा दर्ज करें।ग्राफ़िंग कैलकुलेटर लें, सांख्यिकीय मोड में जाएं और संपादन कमांड चुनें।

        • अलग-अलग कैलकुलेटर को दबाने के लिए अलग-अलग कीस्ट्रोक्स की आवश्यकता होती है। यह आलेख टेक्सास इंस्ट्रूमेंट्स TI-86 कैलकुलेटर पर चर्चा करता है।
        • सांख्यिकीय गणना मोड पर स्विच करने के लिए, - स्टेट ("+" कुंजी के ऊपर) दबाएँ। फिर F2 दबाएँ - संपादित करें।
      2. पिछला सहेजा गया डेटा हटाएँ.अधिकांश कैलकुलेटर आपके द्वारा दर्ज किए गए आँकड़ों को तब तक संग्रहीत रखते हैं जब तक आप उन्हें साफ़ नहीं कर देते। पुराने डेटा को नए डेटा के साथ भ्रमित करने से बचने के लिए, पहले किसी भी संग्रहीत जानकारी को हटा दें।

        • कर्सर को स्थानांतरित करने और "xStat" शीर्षक को हाइलाइट करने के लिए तीर कुंजियों का उपयोग करें। फिर xStat कॉलम में दर्ज सभी मानों को हटाने के लिए Clear और Enter दबाएँ।
        • "yStat" शीर्षक को हाइलाइट करने के लिए तीर कुंजियों का उपयोग करें। फिर yStat कॉलम में दर्ज सभी मानों को साफ़ करने के लिए Clear और Enter दबाएँ।
      3. प्रारंभिक डेटा दर्ज करें.कर्सर को "xStat" शीर्षक के अंतर्गत पहले सेल पर ले जाने के लिए तीर कुंजियों का उपयोग करें। पहला मान दर्ज करें और Enter दबाएँ। "xStat (1) = __" स्क्रीन के नीचे प्रदर्शित किया जाएगा, जहां रिक्त स्थान के बजाय दर्ज किया गया मान दिखाई देगा। आपके द्वारा Enter दबाने के बाद, दर्ज किया गया मान तालिका में दिखाई देगा और कर्सर अगली पंक्ति पर चला जाएगा; यह स्क्रीन के नीचे "xStat (2) = __" प्रदर्शित करेगा।

        • वेरिएबल "x" के लिए सभी मान दर्ज करें।
        • एक बार जब आप x वेरिएबल के लिए सभी मान दर्ज कर लेते हैं, तो yStat कॉलम पर जाने के लिए तीर कुंजियों का उपयोग करें और y वेरिएबल के लिए मान दर्ज करें।
        • एक बार संख्याओं के सभी जोड़े दर्ज हो जाने के बाद, स्क्रीन साफ़ करने के लिए बाहर निकलें दबाएँ और सांख्यिकीय गणना मोड से बाहर निकलें।
      4. सहसंबंध गुणांक की गणना करें.यह दर्शाता है कि डेटा एक निश्चित रेखा के कितना करीब है। एक रेखांकन कैलकुलेटर शीघ्रता से उपयुक्त रेखा निर्धारित कर सकता है और सहसंबंध गुणांक की गणना कर सकता है।

        • स्टेट - कैल्क पर क्लिक करें। TI-86 पर आपको - - दबाना होगा।
        • "रैखिक प्रतिगमन" फ़ंक्शन का चयन करें। TI-86 पर, दबाएँ, जिस पर "LinR" लेबल है। स्क्रीन पर पलक झपकते कर्सर के साथ लाइन "LinR_" प्रदर्शित होगी।
        • अब दो वेरिएबल्स के नाम दर्ज करें: xStat और yStat।
          • TI-86 पर, नामों की सूची खोलें; ऐसा करने के लिए, दबाएँ - -।
          • स्क्रीन की निचली रेखा उपलब्ध चर प्रदर्शित करेगी। चुनें (ऐसा करने के लिए आपको संभवतः F1 या F2 दबाने की आवश्यकता होगी), अल्पविराम दर्ज करें, और फिर चुनें।
          • दर्ज किए गए डेटा को संसाधित करने के लिए Enter दबाएँ।
      5. अपने परिणामों का विश्लेषण करें. Enter दबाने पर निम्नलिखित जानकारी स्क्रीन पर प्रदर्शित होगी:

        • y = a + b x (\displaystyle y=a+bx): यह एक फ़ंक्शन है जो एक सीधी रेखा का वर्णन करता है। कृपया ध्यान दें कि फ़ंक्शन मानक रूप (y = khx + b) में नहीं लिखा गया है।
        • ए = (\डिस्प्लेस्टाइल ए=). यह उस बिंदु का "y" निर्देशांक है जहां रेखा Y अक्ष को काटती है।
        • बी = (\डिस्प्लेस्टाइल बी=). यह रेखा का ढलान है.
        • corr = (\displaystyle (\text(corr))=). यह सहसंबंध गुणांक है.
        • n = (\displaystyle n=). यह संख्याओं के जोड़े की संख्या है जिनका उपयोग गणना में किया गया था।

आइए सहसंबंध गुणांक और सहप्रसरण की गणना करें अलग - अलग प्रकारयादृच्छिक चर के संबंध.

सहसंबंध गुणांक(सहसंबंध मानदंड पियर्सन, अंग्रेजी पियर्सन उत्पाद क्षण सहसंबंध गुणांक)डिग्री निर्धारित करता है रेखीययादृच्छिक चर के बीच संबंध.

गणना करने के लिए, परिभाषा से निम्नानुसार है सहसंबंध गुणांकयादृच्छिक चर X और Y के वितरण को जानना आवश्यक है। यदि वितरण अज्ञात हैं, तो अनुमान लगाने के लिए सहसंबंध गुणांकइस्तेमाल किया गया नमूना सहसंबंध गुणांकआर (इसे इस रूप में भी नामित किया गया है आरएक्सवाई या आर xy) :

कहां एस एक्स - मानक विचलननमूने अनियमित परिवर्तनशील वस्तु x, सूत्र द्वारा गणना:

जैसा कि गणना सूत्र से देखा जा सकता है सहसंबंध, हर (मानक विचलन का उत्पाद) बस अंश को सामान्य करता है जैसे कि सह - संबंध-1 से 1 तक एक आयामहीन संख्या बनती है। सह - संबंधऔर सहप्रसरणवही जानकारी प्रदान करें (यदि ज्ञात हो)। मानक विचलन), लेकिन सह - संबंधउपयोग करने में अधिक सुविधाजनक, क्योंकि यह एक आयामहीन मात्रा है.

गणना सहसंबंध गुणांकऔर नमूना सहप्रसरण MS EXCEL में यह कठिन नहीं है, क्योंकि इस उद्देश्य के लिए विशेष फ़ंक्शन CORREL() और KOVAR() मौजूद हैं। यह पता लगाना अधिक कठिन है कि प्राप्त मूल्यों की व्याख्या कैसे की जाए; अधिकांश लेख इसी के लिए समर्पित है;

सैद्धांतिक वापसी

आइए हम उसे याद करें सहसंबंध संबंधएक सांख्यिकीय संबंध को कॉल करें जिसमें यह तथ्य शामिल हो कि एक चर के विभिन्न मान अलग-अलग के अनुरूप हों औसतमान भिन्न हैं (X के मान में परिवर्तन के साथ औसत मूल्य Y नियमित तरीके से बदलता है)। यह मान लिया है कि दोनोंचर X और Y हैं यादृच्छिकमान और उनके सापेक्ष एक निश्चित यादृच्छिक बिखराव होता है औसत मूल्य.

टिप्पणी. यदि केवल एक चर, उदाहरण के लिए, Y, में एक यादृच्छिक प्रकृति है, और दूसरे के मान नियतात्मक हैं (शोधकर्ता द्वारा निर्धारित), तो हम केवल प्रतिगमन के बारे में बात कर सकते हैं।

इस प्रकार, उदाहरण के लिए, औसत वार्षिक तापमान की निर्भरता का अध्ययन करते समय, कोई इसके बारे में बात नहीं कर सकता है सहसंबंधतापमान और अवलोकन का वर्ष और, तदनुसार, संकेतक लागू करें सहसंबंधउनकी संगत व्याख्या के साथ।

सह - संबंधचर के बीच कई तरह से उत्पन्न हो सकते हैं:

  1. चरों के बीच एक कारण-कारण संबंध की उपस्थिति। उदाहरण के लिए, निवेश की राशि वैज्ञानिक अनुसंधान(चर X) और प्राप्त पेटेंट की संख्या (Y)। पहला वेरिएबल इस प्रकार प्रकट होता है स्वतंत्र चर (कारक), दूसरा - आश्रित चर (परिणाम). यह याद रखना चाहिए कि मात्राओं की निर्भरता उनके बीच सहसंबंध की उपस्थिति को निर्धारित करती है, लेकिन इसके विपरीत नहीं।
  2. संयुग्मन की उपस्थिति ( सामान्य कारण). उदाहरण के लिए, जैसे-जैसे संगठन बढ़ता है, वेतन निधि (पेरोल) और परिसर किराए पर लेने की लागत बढ़ती है। जाहिर है, यह मान लेना गलत है कि परिसर का किराया पेरोल पर निर्भर करता है। ये दोनों चर कई मामलों में कर्मियों की संख्या पर रैखिक रूप से निर्भर करते हैं।
  3. चरों का पारस्परिक प्रभाव (जब एक बदलता है, तो दूसरा चर बदलता है, और इसके विपरीत)। इस दृष्टिकोण के साथ, समस्या के दो सूत्रीकरण की अनुमति है; कोई भी चर स्वतंत्र चर और आश्रित चर दोनों के रूप में कार्य कर सकता है।

इस प्रकार, सहसंबंध सूचकदिखाता है कि कितना मजबूत है रैखिक संबंधदो कारकों के बीच (यदि कोई एक है), और प्रतिगमन आपको दूसरे के आधार पर एक कारक की भविष्यवाणी करने की अनुमति देता है।

सह - संबंध, किसी भी अन्य सांख्यिकीय संकेतक की तरह, जब सही उपयोगउपयोगी हो सकता है, लेकिन इसके उपयोग की सीमाएँ भी हैं। यदि यह स्पष्ट रूप से परिभाषित रैखिक संबंध दिखाता है या पूर्ण अनुपस्थितिरिश्ते, फिर सह - संबंधइसे अद्भुत ढंग से प्रतिबिंबित करेगा. लेकिन, यदि डेटा एक गैर-रेखीय संबंध (उदाहरण के लिए, द्विघात), मानों या आउटलेर्स के अलग-अलग समूहों की उपस्थिति दिखाता है, तो परिकलित मान सहसंबंध गुणांकभ्रामक हो सकता है (उदाहरण फ़ाइल देखें)।

सह - संबंध 1 या -1 के करीब (अर्थात् 1 के पूर्ण मान के करीब) चरों के बीच एक मजबूत रैखिक संबंध दिखाता है, 0 के करीब का मान कोई संबंध नहीं दिखाता है। सकारात्मक सह - संबंधइसका मतलब है कि एक संकेतक में वृद्धि के साथ, दूसरा औसतन बढ़ता है, और एक नकारात्मक संकेतक के साथ, यह घट जाता है।

सहसंबंध गुणांक की गणना करने के लिए, यह आवश्यक है कि तुलना किए गए चर निम्नलिखित शर्तों को पूरा करें:

  • चरों की संख्या दो के बराबर होनी चाहिए;
  • चर मात्रात्मक होने चाहिए (जैसे आवृत्ति, वजन, कीमत)। इन चरों का परिकलित औसत समझ में आता है: औसत मूल्यया औसत रोगी वजन. मात्रात्मक चर के विपरीत, गुणात्मक (नाममात्र) चर केवल श्रेणियों के एक सीमित सेट (उदाहरण के लिए, लिंग या रक्त प्रकार) से मान लेते हैं। ये मान पारंपरिक रूप से संख्यात्मक मानों से जुड़े होते हैं (उदाहरण के लिए, महिला लिंग 1 है, और पुरुष लिंग 2 है)। यह स्पष्ट है कि इस मामले में गणना औसत मूल्य, जिसे ढूंढना आवश्यक है सहसंबंध, गलत है, और इसलिए गणना स्वयं गलत है सहसंबंध;
  • चर यादृच्छिक चर होना चाहिए और होना चाहिए .

द्वि-आयामी डेटा की अलग-अलग संरचनाएँ हो सकती हैं। उनमें से कुछ के साथ काम करने के लिए कुछ निश्चित दृष्टिकोण की आवश्यकता होती है:

  • गैर-रेखीय संबंध वाले डेटा के लिए सह - संबंधसावधानी के साथ प्रयोग किया जाना चाहिए. कुछ समस्याओं के लिए, एक रैखिक संबंध बनाने के लिए एक या दोनों चर को बदलना उपयोगी हो सकता है (इसके लिए आवश्यक परिवर्तन के प्रकार का सुझाव देने के लिए गैर-रेखीय संबंध के प्रकार के बारे में एक धारणा बनाने की आवश्यकता होती है)।
  • का उपयोग करके तितर बितर भूखंडोंकुछ डेटा असमान भिन्नता (बिखराव) प्रदर्शित कर सकते हैं। असमान भिन्नता के साथ समस्या यह है कि उच्च भिन्नता वाले स्थान न केवल सबसे कम सटीक जानकारी प्रदान करते हैं, बल्कि आंकड़ों की गणना करते समय सबसे अधिक प्रभाव भी डालते हैं। इस समस्या को अक्सर डेटा को परिवर्तित करके भी हल किया जाता है, जैसे लघुगणक का उपयोग करना।
  • कुछ डेटा को समूहों (क्लस्टरिंग) में विभाजित होते देखा जा सकता है, जो जनसंख्या को भागों में विभाजित करने की आवश्यकता का संकेत दे सकता है।
  • एक बाह्य (तीव्र विचलन वाला मान) सहसंबंध गुणांक के परिकलित मान को विकृत कर सकता है। एक बाहरी घटना संयोग के कारण हो सकती है, डेटा संग्रह में त्रुटि हो सकती है, या वास्तव में रिश्ते की कुछ विशेषता को प्रतिबिंबित कर सकती है। चूंकि आउटलेयर औसत मूल्य से बहुत अधिक विचलन करता है, यह संकेतक की गणना में एक बड़ा योगदान देता है। सांख्यिकीय संकेतकों की गणना अक्सर आउटलेर्स को ध्यान में रखे बिना या उसके बिना की जाती है।

सहसंबंध की गणना करने के लिए MS EXCEL का उपयोग करना

आइए उदाहरण के तौर पर 2 वेरिएबल लें एक्सऔर वाईऔर तदनुसार, नमूनामानों के कई जोड़े से मिलकर (X i; Y i)। स्पष्टता के लिए, आइए निर्माण करें।

टिप्पणी: आरेख निर्माण के बारे में अधिक जानकारी के लिए लेख देखें। बिल्डिंग के लिए उदाहरण फ़ाइल में तितर बितर भूखंडोंउपयोग किया जाता है क्योंकि यहां हम इस आवश्यकता से भटक गए हैं कि वेरिएबल एक्स यादृच्छिक हो (यह पीढ़ी को सरल बनाता है विभिन्न प्रकार केरिश्ते: रुझानों का निर्माण और एक दिया गया प्रसार)। वास्तविक डेटा के लिए, आपको स्कैटर चार्ट का उपयोग करना होगा (नीचे देखें)।

गणना सहसंबंधआइए हम विभिन्न मामलों के लिए चरों के बीच संबंध बनाएं: रैखिक, द्विघातऔर कम से संचार की कमी.

टिप्पणी: उदाहरण फ़ाइल में, आप रैखिक प्रवृत्ति (ढलान, वाई-अवरोधन) के पैरामीटर और इस प्रवृत्ति रेखा के सापेक्ष बिखराव की डिग्री निर्धारित कर सकते हैं। आप द्विघात मापदंडों को भी समायोजित कर सकते हैं।

बिल्डिंग के लिए उदाहरण फ़ाइल में तितर बितर भूखंडोंयदि चरों की कोई निर्भरता नहीं है, तो एक स्कैटर आरेख का उपयोग किया जाता है। इस स्थिति में, आरेख पर बिंदु बादल के रूप में व्यवस्थित होते हैं।

टिप्पणी: कृपया ध्यान दें कि चार्ट के पैमाने को लंबवत रूप से बदलने से या क्षैतिज अक्ष, बिंदुओं के बादल को एक ऊर्ध्वाधर या क्षैतिज रेखा का रूप दिया जा सकता है। यह स्पष्ट है कि चर स्वतंत्र रहेंगे।

जैसा कि ऊपर बताया गया है, गणना करने के लिए सहसंबंध गुणांक MS EXCEL में एक CORREL() फ़ंक्शन होता है। आप समान PEARSON() फ़ंक्शन का भी उपयोग कर सकते हैं, जो समान परिणाम देता है।

यह सुनिश्चित करने के लिए कि गणना सहसंबंधउपरोक्त सूत्रों का उपयोग करके CORREL() फ़ंक्शन द्वारा उत्पादित किए जाते हैं, उदाहरण फ़ाइल गणना दिखाती है; सहसंबंधअधिक विस्तृत सूत्रों का उपयोग करना:

=सहप्रसरण.जी(बी28:बी88;डी28:डी88)/एसटीडीईवी.जी(बी28:बी88)/एसटीडीईवी.जी(डी28:डी88)

=सहप्रसरण.बी(बी28:बी88;डी28:डी88)/एसटीडीईवी.बी(बी28:बी88)/एसटीडीईवी.बी(डी28:डी88)

टिप्पणी: वर्ग सहसंबंध गुणांकआर के बराबर है निर्धारण का गुणांक R2, जिसकी गणना QPIRSON() फ़ंक्शन का उपयोग करके एक प्रतिगमन रेखा का निर्माण करते समय की जाती है। R2 का मान भी आउटपुट किया जा सकता है तितरबितर आकृतिमानक MS EXCEL कार्यक्षमता का उपयोग करके एक रैखिक प्रवृत्ति का निर्माण करके (चार्ट का चयन करें, टैब का चयन करें लेआउट, फिर समूह में विश्लेषणबटन को क्लिक करे प्रवृत्ति रेखाऔर चुनें रैखिक सन्निकटन). ट्रेंड लाइन के निर्माण के बारे में अधिक जानकारी के लिए, उदाहरण के लिए, देखें।

सहप्रसरण की गणना करने के लिए MS EXCEL का उपयोग करना

सहप्रसरणअर्थ में करीब है (फैलाव का एक माप भी) इस अंतर के साथ कि इसे 2 चर के लिए परिभाषित किया गया है, और फैलाव- एक के लिए। इसलिए, cov(x;x)=VAR(x).

MS EXCEL (संस्करण 2010 से शुरू) में सहप्रसरण की गणना करने के लिए, COVARIATION.G() और COVARIATION.B() फ़ंक्शन का उपयोग किया जाता है। पहले मामले में, गणना का सूत्र उपरोक्त (अंत) के समान है ।जीके लिए खड़ा है जनसंख्या ), दूसरे में, गुणक 1/n के बजाय, 1/(n-1) का उपयोग किया जाता है, अर्थात। समापन ।मेंके लिए खड़ा है नमूना.

टिप्पणी: COVAR() फ़ंक्शन, जो MS EXCEL के पुराने संस्करणों में मौजूद है, COVARIATION.G() फ़ंक्शन के समान है।

टिप्पणी: CORREL() और COVAR() फ़ंक्शन अंग्रेजी संस्करण में CORREL और COVAR के रूप में प्रस्तुत किए गए हैं। COVARIANCE.G() और COVARIANCE.B() फ़ंक्शन COVARIANCE.P और COVARIANCE.S के रूप में कार्य करते हैं।

गणना के लिए अतिरिक्त सूत्र सहप्रसरण:

=सारांशउत्पाद(बी28:बी88-औसत(बी28:बी88);(डी28:डी88-औसत(डी28:डी88))/गणना(डी28:डी88)

=सारांशउत्पाद(बी28:बी88-औसत(बी28:बी88),(डी28:डी88))/गणना(डी28:डी88)

=सारांश उत्पाद(बी28:बी88;डी28:डी88)/गणना(डी28:डी88)-औसत(बी28:बी88)*औसत(डी28:डी88)

ये सूत्र संपत्ति का उपयोग करते हैं सहप्रसरण:

यदि चर एक्सऔर स्वतंत्र, तो उनका सहप्रसरण 0 है। यदि चर स्वतंत्र नहीं हैं, तो उनके योग का प्रसरण बराबर है:

VAR(x+y)= VAR(x)+ VAR(y)+2COV(x;y)

फैलावउनका अंतर बराबर है

VAR(x-y)= VAR(x)+ VAR(y)-2COV(x;y)

सहसंबंध गुणांक के सांख्यिकीय महत्व का अनुमान

परिकल्पना का परीक्षण करने के लिए, हमें यादृच्छिक चर के वितरण को जानना चाहिए, अर्थात। सहसंबंध गुणांकआर। आमतौर पर, परिकल्पना का परीक्षण r के लिए नहीं, बल्कि यादृच्छिक चर t r के लिए किया जाता है:

जिसमें स्वतंत्रता की n-2 डिग्री है।

यदि यादृच्छिक चर का परिकलित मान |t r | महत्वपूर्ण मान t α,n-2 (α-निर्दिष्ट) से अधिक है, तो शून्य परिकल्पना खारिज कर दी जाती है (मानों के बीच संबंध सांख्यिकीय रूप से महत्वपूर्ण है)।

विश्लेषण पैकेज ऐड-इन

बी सहप्रसरण और सहसंबंध की गणना करने के लिए एक ही नाम के उपकरण हैं विश्लेषण.

टूल को कॉल करने के बाद, एक डायलॉग बॉक्स दिखाई देता है जिसमें निम्नलिखित फ़ील्ड होते हैं:

  • इनपुट अंतराल: आपको 2 वेरिएबल्स के लिए स्रोत डेटा के साथ एक श्रेणी का लिंक दर्ज करना होगा
  • समूहन: एक नियम के रूप में, स्रोत डेटा 2 कॉलम में दर्ज किया गया है
  • पहली पंक्ति में लेबल: यदि चेकबॉक्स चेक किया गया है, तो इनपुट अंतरालकॉलम हेडर अवश्य होने चाहिए. बॉक्स को चेक करने की अनुशंसा की जाती है ताकि ऐड-इन के परिणाम में सूचनात्मक कॉलम शामिल हों
  • आउटपुट अंतराल: कक्षों की वह श्रेणी जहां गणना परिणाम रखे जाएंगे। यह इस श्रेणी के ऊपरी बाएँ कक्ष को इंगित करने के लिए पर्याप्त है।

ऐड-इन परिकलित सहसंबंध और सहप्रसरण मान लौटाता है (सहप्रसरण के लिए, दोनों यादृच्छिक चर के प्रसरणों की भी गणना की जाती है)।

सहसंबंध गुणांक की गणना करके रिश्ते की मात्रात्मक विशेषता प्राप्त की जा सकती है।

एक्सेल में सहसंबंध विश्लेषण

फ़ंक्शन ही है सामान्य फ़ॉर्मकोरेल(सरणी1, सारणी2). "Array1" फ़ील्ड में, किसी एक मान की कोशिकाओं की श्रेणी के निर्देशांक दर्ज करें, जिसकी निर्भरता निर्धारित की जानी चाहिए। जैसा कि आप देख सकते हैं, सहसंबंध गुणांक एक संख्या के रूप में हमारे द्वारा पहले चयनित सेल में दिखाई देता है। सहसंबंध विश्लेषण मापदंडों वाली एक विंडो खुलती है। पिछली विधि के विपरीत, "इनपुट अंतराल" फ़ील्ड में हम प्रत्येक कॉलम के अंतराल को अलग से नहीं, बल्कि विश्लेषण में भाग लेने वाले सभी कॉलमों में दर्ज करते हैं। जैसा कि आप देख सकते हैं, एक्सेल एप्लिकेशन एक साथ सहसंबंध विश्लेषण के दो तरीके प्रदान करता है।

एक्सेल में सहसंबंध ग्राफ

6) अंतिम तालिका का पहला तत्व चयनित क्षेत्र के ऊपरी बाएँ कक्ष में दिखाई देगा। इसलिए, H0 परिकल्पना को अस्वीकार कर दिया गया है, अर्थात, प्रतिगमन पैरामीटर और सहसंबंध गुणांक शून्य से यादृच्छिक रूप से भिन्न नहीं हैं, लेकिन सांख्यिकीय रूप से महत्वपूर्ण हैं। 7. प्रतिगमन समीकरण के प्राप्त अनुमान इसे पूर्वानुमान के लिए उपयोग करने की अनुमति देते हैं।

एक्सेल में सहसंबंध गुणांक की गणना कैसे करें

यदि गुणांक 0 है, तो यह इंगित करता है कि मानों के बीच कोई संबंध नहीं है। चर और y के बीच संबंध खोजने के लिए, अंतर्निहित फ़ंक्शन का उपयोग करें Microsoft Excel"कोरल"। उदाहरण के लिए, "Array1" के लिए y मान चुनें, और "Array2" के लिए x मान चुनें। परिणामस्वरूप, आपको प्रोग्राम द्वारा परिकलित सहसंबंध गुणांक प्राप्त होगा। इसके बाद, आपको प्रत्येक x और xav, और yav के बीच अंतर की गणना करने की आवश्यकता है। चयनित कक्षों में लिखें सूत्र x-x, y-. औसत के साथ कोशिकाओं को पिन करना न भूलें। प्राप्त परिणाम वांछित सहसंबंध गुणांक होगा।

पियर्सन गुणांक की गणना के लिए उपरोक्त सूत्र दर्शाता है कि मैन्युअल रूप से किए जाने पर यह प्रक्रिया कितनी श्रम-गहन है। दूसरा, कृपया सुझाव दें कि डेटा के बड़े प्रसार के साथ विभिन्न नमूनों के लिए किस प्रकार के सहसंबंध विश्लेषण का उपयोग किया जा सकता है? मैं सांख्यिकीय रूप से कैसे साबित कर सकता हूं कि 60 से अधिक उम्र वाले समूह और बाकी सभी लोगों के बीच एक महत्वपूर्ण अंतर है?

DIY: एक्सेल का उपयोग करके मुद्रा सहसंबंधों की गणना करना

उदाहरण के लिए, हम माइक्रोसॉफ्ट एक्सेल का उपयोग करते हैं, लेकिन कोई अन्य प्रोग्राम जिसमें आप सहसंबंध सूत्र का उपयोग कर सकते हैं वह करेगा। 7.इसके बाद EUR/USD डेटा वाले सेल चुनें। 9.EUR/USD और USD/JPY के लिए सहसंबंध गुणांक की गणना करने के लिए Enter दबाएँ। हर दिन संख्याएँ अपडेट करना उचित नहीं है (जब तक कि आप मुद्रा सहसंबंधों से ग्रस्त न हों)।

आप पहले ही दो के बीच संबंध की डिग्री की गणना करने की आवश्यकता का सामना कर चुके हैं सांख्यिकीय मात्राएँऔर वह सूत्र निर्धारित करें जिसके द्वारा वे सहसंबंधित होते हैं? ऐसा करने के लिए, मैंने CORREL फ़ंक्शन का उपयोग किया - इसके बारे में यहां कुछ जानकारी है। यह दो डेटा श्रेणियों के बीच सहसंबंध की डिग्री लौटाता है। सैद्धांतिक रूप से, सहसंबंध फ़ंक्शन को रैखिक से घातीय या लघुगणक में परिवर्तित करके परिष्कृत किया जा सकता है। डेटा और सहसंबंध ग्राफ़ के विश्लेषण से इसकी विश्वसनीयता में काफी सुधार हो सकता है।

आइए मान लें कि सेल B2 में स्वयं सहसंबंध गुणांक होता है, और सेल B3 में पूर्ण अवलोकनों की संख्या होती है। क्या आपके पास रूसी भाषी कार्यालय है? वैसे, मुझे एक गलती भी मिली - नकारात्मक सहसंबंधों के लिए महत्व की गणना नहीं की जाती है। यदि दोनों चर मीट्रिक हैं और हैं सामान्य वितरण, तो चुनाव सही ढंग से किया गया था। और क्या केवल एक सीसी का उपयोग करके वक्रों की समानता की कसौटी को चिह्नित करना संभव है? आपके पास "वक्र" की समानता नहीं है, बल्कि दो श्रृंखलाओं की समानता है, जिसे सिद्धांत रूप में एक वक्र द्वारा वर्णित किया जा सकता है।

सहसंबंध संबंध के साथएक विशेषता का समान मूल्य दूसरे के विभिन्न मूल्यों से मेल खाता है। उदाहरण के लिए: ऊंचाई और वजन के बीच, घातक नियोप्लाज्म की घटनाओं और उम्र आदि के बीच संबंध है।

सहसंबंध गुणांक की गणना के लिए 2 विधियाँ हैं: वर्गों की विधि (पियर्सन), रैंक की विधि (स्पीयरमैन)।

सबसे सटीक वर्ग विधि (पियर्सन) है, जिसमें सहसंबंध गुणांक सूत्र द्वारा निर्धारित किया जाता है: , जहां

r xy सांख्यिकीय श्रृंखला X और Y के बीच सहसंबंध गुणांक है।

d x सांख्यिकीय श्रृंखला X की प्रत्येक संख्या का उसके अंकगणितीय माध्य से विचलन है।

d y सांख्यिकीय श्रृंखला Y की प्रत्येक संख्या का उसके अंकगणितीय माध्य से विचलन है।

कनेक्शन की ताकत और उसकी दिशा के आधार पर, सहसंबंध गुणांक 0 से 1 (-1) तक हो सकता है। 0 का सहसंबंध गुणांक कनेक्शन की पूर्ण कमी को इंगित करता है। सहसंबंध गुणांक का स्तर 1 या (-1) के जितना करीब होता है, उसके अनुरूप प्रत्यक्ष या फीडबैक का माप उतना ही अधिक और अधिक बारीकी से होता है। जब सहसंबंध गुणांक 1 या (-1) के बराबर होता है, तो कनेक्शन पूर्ण और कार्यात्मक होता है।

सहसंबंध गुणांक का उपयोग करके सहसंबंध की ताकत का आकलन करने की योजना

कनेक्शन की शक्ति

यदि उपलब्ध हो तो सहसंबंध गुणांक का मान

सीधा कनेक्शन (+)

प्रतिक्रिया (-)

कोई कनेक्शन नहीं

कनेक्शन छोटा (कमजोर) है

0 से +0.29 तक

0 से -0.29 तक

कनेक्शन औसत (मध्यम)

+0.3 से +0.69 तक

-0.3 से -0.69 तक

कनेक्शन बड़ा (मजबूत) है

+0.7 से +0.99 तक

-0.7 से -0.99 तक

पूर्ण संचार

(कार्यात्मक)

वर्ग विधि का उपयोग करके सहसंबंध गुणांक की गणना करने के लिए, 7 स्तंभों की एक तालिका संकलित की जाती है। आइए एक उदाहरण का उपयोग करके गणना प्रक्रिया को देखें:

बीच के संबंध की ताकत और प्रकृति का निर्धारण करें

यह समय है-

सत्ता

गण्डमाला

(वी )

डी एक्स = वी एक्सएम एक्स

डी आप= वी एम

डी एक्स डी

डी एक्स 2

डी 2

Σ -1345 ,0

Σ 13996 ,0

Σ 313 , 47

1. पानी में औसत आयोडीन सामग्री (मिलीग्राम/लीटर में) निर्धारित करें।

मिलीग्राम/ली

2. गण्डमाला की औसत घटना % में निर्धारित करें।

3. M x से प्रत्येक V x का विचलन निर्धारित करें, अर्थात। डीएक्स.

201–138=63; 178-138=40, आदि।

4. इसी प्रकार, हम M y से प्रत्येक V y का विचलन निर्धारित करते हैं, अर्थात। डी वाई.

0.2–3.8=-3.6; 0.6–38=-3.2, आदि।

5. विचलन के उत्पाद निर्धारित करें। हम परिणामी उत्पाद को जोड़ते हैं और प्राप्त करते हैं।

6. हम dx का वर्ग करते हैं और परिणामों का योग करते हैं, हमें मिलता है।

7. इसी प्रकार, हम d y का वर्ग करते हैं, परिणामों का योग करते हैं, हमें प्राप्त होता है

8. अंत में, हम सभी प्राप्त राशियों को सूत्र में प्रतिस्थापित करते हैं:

सहसंबंध गुणांक की विश्वसनीयता के मुद्दे को हल करने के लिए, इसे निर्धारित करें औसत त्रुटिसूत्र के अनुसार:

(यदि प्रेक्षणों की संख्या 30 से कम है, तो हर n-1 है)।

हमारे उदाहरण में

सहसंबंध गुणांक का मान विश्वसनीय माना जाता है यदि यह इसकी औसत त्रुटि से कम से कम 3 गुना अधिक है।

हमारे उदाहरण में

इस प्रकार, सहसंबंध गुणांक विश्वसनीय नहीं है, जिसके लिए अवलोकनों की संख्या में वृद्धि की आवश्यकता होती है।

सहसंबंध गुणांक को थोड़ा कम सटीक, लेकिन बहुत आसान तरीके से निर्धारित किया जा सकता है - रैंक की विधि (स्पीयरमैन)।

स्पीयरमैन विधि: P=1-(6∑d 2 /n-(n 2 -1))

पहली और दूसरी पंक्ति को क्रमशः x और y निर्दिष्ट करते हुए युग्मित तुलनीय विशेषताओं की दो पंक्तियाँ बनाएँ। इस मामले में, विशेषता की पहली पंक्ति को अवरोही या आरोही क्रम में प्रस्तुत करें, और दूसरी पंक्ति के संख्यात्मक मानों को पहली पंक्ति के उन मानों के विपरीत रखें जिनसे वे मेल खाते हैं

प्रत्येक तुलना की गई श्रृंखला में विशेषता के मान को एक क्रम संख्या (रैंक) से बदलें। रैंक, या संख्याएँ, पहली और दूसरी पंक्तियों के संकेतकों (मानों) के स्थान को दर्शाती हैं। जिसमें संख्यात्मक मूल्यदूसरी विशेषता के लिए, रैंकों को उसी क्रम में निर्दिष्ट किया जाना चाहिए जैसा कि पहली विशेषता के मूल्यों को आवंटित करते समय अपनाया गया था। किसी श्रृंखला में किसी विशेषता के समान मूल्यों के साथ, रैंक को इन मूल्यों की क्रमिक संख्याओं के योग से औसत संख्या के रूप में निर्धारित किया जाना चाहिए

x और y (d) के बीच रैंक अंतर निर्धारित करें: d = x - y

परिणामी रैंक अंतर का वर्ग करें (d 2)

अंतर के वर्गों का योग प्राप्त करें (Σ d 2) और परिणामी मानों को सूत्र में प्रतिस्थापित करें:

उदाहरण:रैंक विधि का उपयोग करते हुए, निम्नलिखित डेटा प्राप्त होने पर वर्षों के कार्य अनुभव और चोटों की आवृत्ति के बीच संबंध की दिशा और ताकत स्थापित करें:

विधि चुनने का औचित्य:किसी समस्या को हल करने के लिए केवल एक विधि का ही चयन किया जा सकता है रैंक सहसंबंध, क्योंकि विशेषता की पहली पंक्ति "वर्षों में कार्य अनुभव" में खुले विकल्प हैं (1 वर्ष और 7 या अधिक वर्षों तक कार्य अनुभव), जो कनेक्शन स्थापित करने के लिए अधिक सटीक विधि - वर्गों की विधि - के उपयोग की अनुमति नहीं देता है तुलना की गई विशेषताओं के बीच.

समाधान. गणनाओं का क्रम पाठ में प्रस्तुत किया गया है, परिणाम तालिका में प्रस्तुत किए गए हैं। 2.

तालिका 2

वर्षों में कार्य अनुभव

चोटों की संख्या

क्रमवाचक संख्या (रैंक)

रैंक का अंतर

रैंकों का वर्ग अंतर

d(x-y)

डी 2

युग्मित विशेषताओं की प्रत्येक पंक्ति को "x" और "y" (कॉलम 1-2) द्वारा निर्दिष्ट किया गया है।

प्रत्येक सुविधा का मान एक रैंक (क्रमिक) संख्या से बदल दिया जाता है। पंक्ति "x" में रैंकों के वितरण का क्रम इस प्रकार है: विशेषता का न्यूनतम मान (1 वर्ष तक का अनुभव) को क्रमांक "1" सौंपा गया है, विशेषता की उसी पंक्ति के बाद के वेरिएंट, क्रमशः, बढ़ते क्रम, 2रे, 3रे, 4थे और 5वें क्रमांक - रैंक (कॉलम 3 देखें)। दूसरी विशेषता "y" (कॉलम 4) पर रैंक वितरित करते समय एक समान क्रम का पालन किया जाता है। ऐसे मामलों में जहां समान परिमाण के कई विकल्प हैं (उदाहरण के लिए, मानक समस्या में ये 3-4 साल और 5-6 साल के अनुभव वाले प्रति 100 श्रमिकों पर 12 और 12 चोटें हैं, क्रम संख्या औसत संख्या द्वारा निर्दिष्ट की जाती है) उनकी क्रम संख्या के योग से, रैंकिंग करते समय, चोटों की संख्या (12 चोटें) पर डेटा 2 और 3 स्थानों पर होना चाहिए, इसलिए उनकी औसत संख्या (2 + 3)/2 = 2.5 है चोटों की संख्या "12" और "12" (विशेषता) है, समान रैंक संख्याएं वितरित की जानी चाहिए - "2.5" (कॉलम 4)।

रैंक अंतर निर्धारित करें d = (x - y) - (कॉलम 5)

रैंक अंतर (डी 2) का वर्ग करें और रैंक अंतर Σ डी 2 (कॉलम 6) के वर्गों का योग प्राप्त करें।

सूत्र का उपयोग करके रैंक सहसंबंध गुणांक की गणना करें:

जहां n पंक्ति "x" और पंक्ति "y" में तुलना किए जा रहे विकल्पों के जोड़े की संख्या है

सहसंबंध विश्लेषण-लोकप्रिय विधि सांख्यिकीय अनुसंधान, जिसका उपयोग एक संकेतक की दूसरे पर निर्भरता की डिग्री की पहचान करने के लिए किया जाता है। Microsoft Excel में इस प्रकार का विश्लेषण करने के लिए एक विशेष उपकरण डिज़ाइन किया गया है। आइए जानें कैसे करें इस फीचर का इस्तेमाल.

सहसंबंध विश्लेषण का सार

सहसंबंध विश्लेषण का उद्देश्य बीच संबंध की उपस्थिति की पहचान करना है कई कारक. अर्थात्, यह निर्धारित किया जाता है कि एक संकेतक में कमी या वृद्धि दूसरे में परिवर्तन को प्रभावित करती है या नहीं।

यदि निर्भरता स्थापित हो जाती है, तो सहसंबंध गुणांक निर्धारित किया जाता है। प्रतिगमन विश्लेषण के विपरीत, यह एकमात्र संकेतक है जो गणना करता है यह विधिसांख्यिकीय अनुसंधान. सहसंबंध गुणांक +1 से -1 तक होता है। यदि कोई सकारात्मक सहसंबंध है, तो एक संकेतक में वृद्धि दूसरे में वृद्धि में योगदान करती है। नकारात्मक सहसंबंध के साथ, एक संकेतक में वृद्धि दूसरे में कमी लाती है। सहसंबंध गुणांक का मॉड्यूल जितना बड़ा होगा, एक संकेतक में परिवर्तन उतना ही अधिक ध्यान देने योग्य होगा जो दूसरे में परिवर्तन में परिलक्षित होगा। जब गुणांक 0 होता है, तो उनके बीच पूरी तरह से कोई निर्भरता नहीं होती है।

सहसंबंध गुणांक की गणना

आइए अब एक विशिष्ट उदाहरण का उपयोग करके सहसंबंध गुणांक की गणना करने का प्रयास करें। हमारे पास एक तालिका है जिसमें विज्ञापन लागत और बिक्री की मात्रा मासिक रूप से अलग-अलग कॉलम में दिखाई जाती है। हमें यह पता लगाना होगा कि बिक्री की संख्या किस हद तक राशि पर निर्भर करती है धनजो विज्ञापन पर खर्च किया गया।

विधि 1: फ़ंक्शन विज़ार्ड के माध्यम से सहसंबंध को परिभाषित करना

सहसंबंध विश्लेषण करने का एक तरीका CORREL फ़ंक्शन का उपयोग करना है। फ़ंक्शन का सामान्य रूप CORREL(array1, array2) है।

  1. उस सेल का चयन करें जिसमें गणना परिणाम प्रदर्शित होना चाहिए। "इन्सर्ट फंक्शन" बटन पर क्लिक करें, जो फॉर्मूला बार के बाईं ओर स्थित है।
  2. फ़ंक्शन विज़ार्ड विंडो में प्रस्तुत सूची में, CORREL फ़ंक्शन देखें और चुनें। ठीक बटन पर क्लिक करें।
  3. फ़ंक्शन तर्क विंडो खुलती है. "Array1" फ़ील्ड में, किसी एक मान की कोशिकाओं की श्रेणी के निर्देशांक दर्ज करें, जिसकी निर्भरता निर्धारित की जानी चाहिए। हमारे मामले में, ये "बिक्री मूल्य" कॉलम में मान होंगे। फ़ील्ड में सरणी का पता दर्ज करने के लिए, बस उपरोक्त कॉलम में डेटा वाले सभी कक्षों का चयन करें।

    "Array2" फ़ील्ड में आपको दूसरे कॉलम के निर्देशांक दर्ज करने होंगे। हमारे लिए यह विज्ञापन लागत है। ठीक उसी तरह जैसे पिछले मामले में, हम फ़ील्ड में डेटा दर्ज करते हैं।

    ठीक बटन पर क्लिक करें।

जैसा कि आप देख सकते हैं, सहसंबंध गुणांक एक संख्या के रूप में हमारे द्वारा पहले चयनित सेल में दिखाई देता है। में इस मामले मेंयह 0.97 के बराबर है, जो बहुत है उच्च चिन्हएक मात्रा की दूसरे पर निर्भरता।

विधि 2: विश्लेषण पैकेज का उपयोग करके सहसंबंध की गणना करें

वैकल्पिक रूप से, सहसंबंध की गणना विश्लेषण पैकेज में दिए गए उपकरणों में से एक का उपयोग करके की जा सकती है। लेकिन सबसे पहले हमें इस टूल को सक्रिय करना होगा।

  1. "फ़ाइल" टैब पर जाएँ.
  2. खुलने वाली विंडो में, "सेटिंग्स" अनुभाग पर जाएँ।
  3. इसके बाद, "ऐड-ऑन" आइटम पर जाएं।
  4. अगली विंडो के नीचे, "प्रबंधन" अनुभाग में, स्विच को "एक्सेल ऐड-इन्स" स्थिति में ले जाएं यदि यह एक अलग स्थिति में है। ठीक बटन पर क्लिक करें।
  5. ऐड-ऑन विंडो में, "विश्लेषण पैकेज" आइटम के बगल में स्थित बॉक्स को चेक करें। ठीक बटन पर क्लिक करें।
  6. इसके बाद विश्लेषण पैकेज सक्रिय हो जाता है। "डेटा" टैब पर जाएँ. जैसा कि आप देख सकते हैं, यह यहाँ टेप पर दिखाई देता है नया ब्लॉकउपकरण - "विश्लेषण"। "डेटा विश्लेषण" बटन पर क्लिक करें, जो इसमें स्थित है।
  7. एक सूची खुलती है विभिन्न विकल्पडेटा विश्लेषण। "सहसंबंध" आइटम का चयन करें. ठीक बटन पर क्लिक करें।
  8. सहसंबंध विश्लेषण मापदंडों वाली एक विंडो खुलती है। पिछली विधि के विपरीत, "इनपुट अंतराल" फ़ील्ड में हम प्रत्येक कॉलम के अंतराल को अलग से नहीं, बल्कि विश्लेषण में भाग लेने वाले सभी कॉलमों में दर्ज करते हैं। हमारे मामले में, यह "विज्ञापन लागत" और "बिक्री मूल्य" कॉलम में डेटा है।

    हम "ग्रुपिंग" पैरामीटर को अपरिवर्तित छोड़ देते हैं - "कॉलम द्वारा", क्योंकि हमारे डेटा समूह दो कॉलम में विभाजित हैं। यदि वे लाइन दर लाइन टूट गए थे, तो स्विच को "लाइन द्वारा" स्थिति में ले जाना होगा।

    डिफ़ॉल्ट आउटपुट पैरामीटर में, "नई वर्कशीट" आइटम सेट किया गया है, यानी, डेटा किसी अन्य शीट पर आउटपुट होगा। आप स्विच को घुमाकर स्थान बदल सकते हैं. यह वर्तमान शीट हो सकती है (तब आपको सूचना आउटपुट कोशिकाओं के निर्देशांक निर्दिष्ट करने होंगे) या एक नई कार्यपुस्तिका (फ़ाइल)।

    जब सभी सेटिंग्स सेट हो जाएं, तो "ओके" बटन पर क्लिक करें।

चूंकि विश्लेषण परिणामों के लिए आउटपुट स्थान को डिफ़ॉल्ट के रूप में छोड़ दिया गया था, हम एक नई शीट पर जाते हैं। जैसा कि आप देख सकते हैं, सहसंबंध गुणांक यहां दर्शाया गया है। स्वाभाविक रूप से, यह पहली विधि का उपयोग करते समय वैसा ही है - 0.97। ऐसा इसलिए है क्योंकि दोनों विकल्प समान गणना करते हैं, बस उन्हें अलग-अलग तरीकों से किया जा सकता है।

जैसा कि आप देख सकते हैं, एक्सेल एप्लिकेशन एक साथ सहसंबंध विश्लेषण के दो तरीके प्रदान करता है। यदि आप सब कुछ सही ढंग से करते हैं, तो गणना का परिणाम पूरी तरह से समान होगा। लेकिन, प्रत्येक उपयोगकर्ता अपने लिए अधिक सुविधाजनक गणना विकल्प चुन सकता है।

हमें खुशी है कि हम समस्या का समाधान करने में आपकी मदद कर सके।

समस्या का सार विस्तार से बताते हुए अपना प्रश्न टिप्पणियों में पूछें। हमारे विशेषज्ञ यथाशीघ्र उत्तर देने का प्रयास करेंगे।

क्या इस आलेख से आपको मदद हुई?

प्रतिगमन और सहसंबंध विश्लेषण सांख्यिकीय अनुसंधान विधियां हैं। एक या अधिक स्वतंत्र चरों पर किसी पैरामीटर की निर्भरता दिखाने के ये सबसे सामान्य तरीके हैं।

नीचे विशिष्ट पर व्यावहारिक उदाहरणआइए अर्थशास्त्रियों के बीच इन दो बेहद लोकप्रिय विश्लेषणों पर नजर डालें। हम उन्हें संयोजित करते समय परिणाम प्राप्त करने का एक उदाहरण भी देंगे।

एक्सेल में प्रतिगमन विश्लेषण

आश्रित चर पर कुछ मानों (स्वतंत्र, स्वतंत्र) का प्रभाव दर्शाता है। उदाहरण के लिए, आर्थिक रूप से सक्रिय जनसंख्या की संख्या उद्यमों की संख्या, वेतन और अन्य मापदंडों पर कैसे निर्भर करती है। या: विदेशी निवेश, ऊर्जा की कीमतें आदि जीडीपी के स्तर को कैसे प्रभावित करते हैं।

विश्लेषण का परिणाम आपको प्राथमिकताओं को उजागर करने की अनुमति देता है। और मुख्य कारकों के आधार पर, प्राथमिकता वाले क्षेत्रों के विकास की भविष्यवाणी करें, योजना बनाएं और प्रबंधन निर्णय लें।

प्रतिगमन होता है:

  • रैखिक (y = a + bx);
  • परवलयिक (y = a + bx + cx2);
  • घातांकीय (y = a * exp(bx));
  • शक्ति (y = a*x^b);
  • अतिपरवलयिक (y = b/x + a);
  • लघुगणक (y = b * 1n(x) + a);
  • घातांकीय (y = a * b^x).

आइए निर्माण को एक उदाहरण के रूप में देखें प्रतिगमन मॉडलएक्सेल में और परिणामों की व्याख्या। आइए प्रतिगमन का रैखिक प्रकार लें।

काम। 6 उद्यमों में, औसत मासिक वेतनऔर छोड़ने वाले कर्मचारियों की संख्या। औसत वेतन पर नौकरी छोड़ने वाले कर्मचारियों की संख्या की निर्भरता निर्धारित करना आवश्यक है।

नमूना रेखीय प्रतिगमननिम्नलिखित रूप है:

Y = a0 + a1x1 +…+अख्क।

जहां a प्रतिगमन गुणांक हैं, x चर को प्रभावित कर रहे हैं, k कारकों की संख्या है।

हमारे उदाहरण में, Y कर्मचारियों को छोड़ने का संकेतक है। प्रभावित करने वाला कारक मजदूरी (x) है।

एक्सेल में अंतर्निहित फ़ंक्शन हैं जो आपको रैखिक प्रतिगमन मॉडल के मापदंडों की गणना करने में मदद कर सकते हैं। लेकिन "विश्लेषण पैकेज" ऐड-ऑन यह काम तेजी से करेगा।

हम एक शक्तिशाली विश्लेषणात्मक उपकरण सक्रिय करते हैं:

  1. "ऑफिस" बटन पर क्लिक करें और "एक्सेल विकल्प" टैब पर जाएं। "ऐड-ऑन"।
  2. सबसे नीचे, ड्रॉप-डाउन सूची के नीचे, "प्रबंधित करें" फ़ील्ड में एक शिलालेख "एक्सेल ऐड-इन्स" होगा (यदि यह वहां नहीं है, तो दाईं ओर चेकबॉक्स पर क्लिक करें और चुनें)। और "जाओ" बटन. क्लिक करें.
  3. उपलब्ध ऐड-ऑन की एक सूची खुलती है। "विश्लेषण पैकेज" चुनें और ठीक पर क्लिक करें।

एक बार सक्रिय होने पर, ऐड-ऑन डेटा टैब में उपलब्ध होगा।

अब आइए प्रतिगमन विश्लेषण स्वयं करें।

  1. "डेटा विश्लेषण" टूल मेनू खोलें। "रिग्रेशन" चुनें।
  2. इससे इनपुट मान और आउटपुट विकल्प (जहां परिणाम प्रदर्शित करना है) चुनने के लिए एक मेनू खुल जाएगा। प्रारंभिक डेटा के लिए फ़ील्ड में, हम वर्णित पैरामीटर की सीमा (Y) और इसे प्रभावित करने वाले कारक (X) को इंगित करते हैं। शेष को नहीं भरा जा सकता है।
  3. ओके पर क्लिक करने के बाद, प्रोग्राम एक नई शीट पर गणना प्रदर्शित करेगा (आप वर्तमान शीट पर प्रदर्शित करने के लिए एक अंतराल का चयन कर सकते हैं या एक नई कार्यपुस्तिका में आउटपुट असाइन कर सकते हैं)।

सबसे पहले, हम आर-वर्ग और गुणांक पर ध्यान देते हैं।

आर-वर्ग निर्धारण का गुणांक है। हमारे उदाहरण में - 0.755, या 75.5%। इसका मतलब यह है कि मॉडल के परिकलित पैरामीटर अध्ययन किए गए मापदंडों के बीच 75.5% संबंध की व्याख्या करते हैं। निर्धारण का गुणांक जितना अधिक होगा, मॉडल उतना ही बेहतर होगा। अच्छा - 0.8 से ऊपर. खराब - 0.5 से कम (ऐसा विश्लेषण शायद ही उचित माना जा सकता है)। हमारे उदाहरण में - "बुरा नहीं"।

गुणांक 64.1428 दर्शाता है कि यदि विचाराधीन मॉडल में सभी चर 0 के बराबर हैं तो Y क्या होगा। यानी, विश्लेषण किए गए पैरामीटर का मान मॉडल में वर्णित अन्य कारकों से भी प्रभावित होता है।

गुणांक -0.16285, Y पर चर "-" चिन्ह एक नकारात्मक प्रभाव को दर्शाता है: वेतन जितना अधिक होगा, कम लोग नौकरी छोड़ेंगे। जो उचित है.

एक्सेल में सहसंबंध विश्लेषण

सहसंबंध विश्लेषण यह निर्धारित करने में मदद करता है कि एक या दो नमूनों में संकेतकों के बीच कोई संबंध है या नहीं। उदाहरण के लिए, किसी मशीन के परिचालन समय और मरम्मत की लागत, उपकरण की कीमत और संचालन की अवधि, बच्चों की ऊंचाई और वजन आदि के बीच।

यदि कोई संबंध है, तो क्या एक पैरामीटर में वृद्धि से दूसरे में वृद्धि (सकारात्मक सहसंबंध) या कमी (नकारात्मक) होती है। सहसंबंध विश्लेषण विश्लेषक को यह निर्धारित करने में मदद करता है कि क्या एक संकेतक के मूल्य का उपयोग भविष्यवाणी करने के लिए किया जा सकता है संभव अर्थएक और।

सहसंबंध गुणांक को r द्वारा निरूपित किया जाता है। +1 से -1 तक भिन्न होता है। वर्गीकरण सहसंबंधके लिए अलग - अलग क्षेत्रअलग होगा. जब गुणांक 0 है रैखिक निर्भरतानमूनों के बीच मौजूद नहीं है.

आइए देखें कि Excel का उपयोग करके सहसंबंध गुणांक कैसे ज्ञात करें।

युग्मित गुणांक खोजने के लिए, CORREL फ़ंक्शन का उपयोग किया जाता है।

उद्देश्य: यह निर्धारित करना कि क्या खराद के परिचालन समय और उसके रखरखाव की लागत के बीच कोई संबंध है।

कर्सर को किसी भी सेल में रखें और fx बटन दबाएँ।

  1. "सांख्यिकीय" श्रेणी में, CORREL फ़ंक्शन का चयन करें।
  2. तर्क "सरणी 1" - मानों की पहली श्रेणी - मशीन संचालन समय: A2:A14।
  3. तर्क "सरणी 2" - मूल्यों की दूसरी श्रेणी - मरम्मत लागत: बी2:बी14। ओके पर क्लिक करें।

कनेक्शन के प्रकार को निर्धारित करने के लिए, आपको गुणांक की पूर्ण संख्या को देखने की आवश्यकता है (गतिविधि के प्रत्येक क्षेत्र का अपना पैमाना होता है)।

कई मापदंडों (2 से अधिक) के सहसंबंध विश्लेषण के लिए, "डेटा विश्लेषण" ("विश्लेषण पैकेज" ऐड-ऑन) का उपयोग करना अधिक सुविधाजनक है। आपको सूची से सहसंबंध का चयन करना होगा और सरणी को निर्दिष्ट करना होगा। सभी।

परिणामी गुणांक सहसंबंध मैट्रिक्स में प्रदर्शित किए जाएंगे। इस कदर:

सहसंबंध और प्रतिगमन विश्लेषण

व्यवहार में, इन दोनों तकनीकों का अक्सर एक साथ उपयोग किया जाता है।

  1. हम एक सहसंबंध क्षेत्र बनाते हैं: "सम्मिलित करें" - "आरेख" - "स्कैटर आरेख" (आपको जोड़े की तुलना करने की अनुमति देता है)। मानों की श्रेणी तालिका में सभी संख्यात्मक डेटा है।
  2. आरेख पर किसी भी बिंदु पर बायाँ-क्लिक करें। तो ठीक है. खुलने वाले मेनू में, "ट्रेंड लाइन जोड़ें" चुनें।
  3. लाइन के लिए पैरामीटर निर्दिष्ट करें. प्रकार - "रैखिक"। सबसे नीचे - "आरेख पर समीकरण दिखाएँ।"
  4. "बंद करें" पर क्लिक करें।

अब प्रतिगमन विश्लेषण डेटा दृश्यमान हो गया है।

1. एक्सेल खोलें

2. डेटा कॉलम बनाएं. हमारे उदाहरण में, हम प्रथम-ग्रेडर में आक्रामकता और आत्म-संदेह के बीच संबंध, या सहसंबंध पर विचार करेंगे। प्रयोग में 30 बच्चों ने भाग लिया, डेटा एक्सेल तालिका में प्रस्तुत किया गया है:

1 कॉलम - विषय संख्या

कॉलम 2 - अंकों में आक्रामकता

कॉलम 3 - अंकों में आत्म-संदेह

3. फिर आपको टेबल के बगल में एक खाली सेल का चयन करना होगा और आइकन पर क्लिक करना होगा एफ(एक्स)एक्सेल पैनल में

4.फ़ंक्शन मेनू खुल जाएगा, आपको श्रेणियों में से चयन करना होगा सांख्यिकीय, और फिर फ़ंक्शंस की सूची में वर्णानुक्रम से खोजें कोरेलऔर ओके पर क्लिक करें

5. फिर फ़ंक्शन तर्कों का एक मेनू खुल जाएगा, जो आपको हमारे लिए आवश्यक डेटा कॉलम का चयन करने की अनुमति देगा। पहला कॉलम चुनने के लिए आक्रामकताआपको लाइन के आगे नीले बटन पर क्लिक करना होगा सारणी1

6.के लिए डेटा का चयन करें सारणी1कॉलम से आक्रामकताऔर डायलॉग बॉक्स में नीले बटन पर क्लिक करें

7. फिर, ऐरे 1 की तरह, लाइन के आगे नीले बटन पर क्लिक करें सारणी2

8.के लिए डेटा का चयन करें सारणी2- स्तंभ संशयऔर नीला बटन फिर से दबाएँ, फिर ठीक है

9. यहां, आर-पियर्सन सहसंबंध गुणांक की गणना की गई है और इसे चयनित सेल में लिखा गया है, हमारे मामले में, यह सकारात्मक और लगभग बराबर है। यह बात करता है मध्यम सकारात्मकप्रथम-ग्रेडर में आक्रामकता और आत्म-संदेह के बीच संबंध

इस प्रकार, सांख्यिकीय निष्कर्षप्रयोग होगा: r = 0.225, चरों के बीच एक मध्यम सकारात्मक संबंध सामने आया आक्रामकताऔर संशय.

हालाँकि, कुछ अध्ययनों में सहसंबंध गुणांक के महत्व के पी-स्तर को निर्दिष्ट करने की आवश्यकता होती है एक्सेल प्रोग्रामएसपीएसएस के विपरीत, ऐसा कोई विकल्प प्रदान नहीं करता है। यह ठीक है, टेबलें हैं महत्वपूर्ण मूल्यसहसंबंध (ए.डी. नास्लेडोव)।

आप एक्सेल में एक रिग्रेशन लाइन भी बना सकते हैं और इसे शोध परिणामों के साथ जोड़ सकते हैं।



साइट पर नया

>

सबसे लोकप्रिय