Гэр Эрүүл ахуй Excel дээр корреляцийн коэффициентийг тооцоолох. Корреляцийн коэффициентийг олох жишээ

Excel дээр корреляцийн коэффициентийг тооцоолох. Корреляцийн коэффициентийг олох жишээ

Корреляцийн коэффициент (эсвэл шугаман коэффициентхамаарал) -ийг "r" (ховор тохиолдолд "ρ") гэж тэмдэглэж, шинж чанарыг илэрхийлдэг шугаман хамаарал(энэ нь ямар нэг утга, чиглэлээр өгөгдсөн хамаарал) хоёр ба түүнээс дээш хувьсагчийн. Коэффициентийн утга нь -1 ба +1 хооронд байна, өөрөөр хэлбэл хамаарал нь эерэг ба сөрөг аль аль нь байж болно. Корреляцийн коэффициент -1 бол төгс сөрөг хамаарал байна; корреляцийн коэффициент +1 бол төгс эерэг хамаарал байна. Бусад тохиолдолд хоёр хувьсагчийн хооронд эерэг хамаарал, сөрөг хамаарал эсвэл хамаарал байхгүй байна. Корреляцийн коэффициентийг гараар, үнэгүй онлайн тооцоолуур эсвэл сайн график тооцоолуур ашиглан тооцоолж болно.

Алхам

Корреляцийн коэффициентийг гараар тооцоолох

    Өгөгдөл цуглуул.Корреляцийн коэффициентийг тооцоолж эхлэхээсээ өмнө өгөгдсөн хос тоог судал. Тэдгээрийг босоо болон хэвтээ байдлаар байрлуулж болох хүснэгтэд бичих нь дээр. Мөр, багана бүрийг "x" болон "y" гэж тэмдэглэ.

    • Жишээлбэл, "x" ба "y" хувьсагчийн дөрвөн хос утгыг (тоо) өгсөн болно. Та дараах хүснэгтийг үүсгэж болно.
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  1. "x"-ийн арифметик дундажийг тооцоол.Үүнийг хийхийн тулд бүх "x" утгыг нэмж, үр дүнг утгын тоонд хуваана.

    • Бидний жишээнд "x" хувьсагчийн дөрвөн утгыг өгсөн болно. "x"-ийн арифметик дундажийг тооцоолохын тулд эдгээр утгыг нэмээд нийлбэрийг 4-т хуваана. Тооцооллыг дараах байдлаар бичнэ.
    • μ x = (1 + 2 + 4 + 5) / 4 (\displaystyle \mu _(x)=(1+2+4+5)/4)
    • μ x = 12/4 (\displaystyle \mu _(x)=12/4)
    • μ x = 3 (\displaystyle \mu _(x)=3)
  2. "y" арифметик дундажийг ол.Үүнийг хийхийн тулд гүй ижил төстэй үйлдлүүд, өөрөөр хэлбэл "y"-ийн бүх утгыг нэмээд дараа нь нийлбэрийг утгуудын тоонд хуваана.

    • Бидний жишээнд "y" хувьсагчийн дөрвөн утгыг өгсөн болно. Эдгээр утгыг нэмээд нийлбэрийг 4-т хуваа. Тооцооллыг дараах байдлаар бичнэ.
    • μ y = (1 + 3 + 5 + 7) / 4 (\displaystyle \mu _(y)=(1+3+5+7)/4)
    • μ y = 16/4 (\displaystyle \mu _(y)=16/4)
    • μ y = 4 (\displaystyle \mu _(y)=4)
  3. "x"-ийн стандарт хазайлтыг тооцоол."x" ба "y"-ийн дундаж утгыг тооцоолсны дараа олоорой стандарт хазайлтэдгээр хувьсагчууд. Стандарт хазайлтыг дараах томъёогоор тооцоолно.

    • σ x = 1 n − 1 Σ (x − μ x) 2 (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(n-1))\Sigma (x-\mu _() x)))^(2))))
    • σ x = 1 4 − 1 ∗ ((1 − 3) 2 + (2 − 3) 2 + (4 − 3) 2 + (5 − 3) 2) (\displaystyle \sigma _(x)=(\sqrt) ((\frac (1)(4-1))*((1-3)^(2)+(2-3)^(2)+(4-3)^(2)+(5-3) ^(2))))
    • σ x = 1 3 ∗ (4 + 1 + 1 + 4) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(4+1+1+4)) ))
    • σ x = 1 3 ∗ (10) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(10))))
    • σ x = 10 3 (\displaystyle \sigma _(x)=(\sqrt (\frac (10)(3))))
    • σ x = 1, 83 (\displaystyle \sigma _(x)=1,83)
  4. "y" стандарт хазайлтыг тооцоол.Өмнөх алхамд тайлбарласан алхмуудыг дагана уу. Үүнтэй ижил томъёог ашиглана уу, гэхдээ "y" утгыг орлуулна уу.

    • Бидний жишээн дээр тооцооллыг дараах байдлаар бичнэ.
    • σ y = 1 4 − 1 ∗ ((1 − 4) 2 + (3 − 4) 2 + (5 − 4) 2 + (7 − 4) 2) (\displaystyle \sigma _(y)=(\sqrt) ((\frac (1)(4-1))*((1-4)^(2)+(3-4)^(2)+(5-4)^(2)+(7-4) ^(2))))
    • σ у = 1 3 ∗ (9 + 1 + 1 + 9) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(9+1+1+9)) ))
    • σ y = 1 3 ∗ (20) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(20))))
    • σ y = 20 3 (\displaystyle \sigma _(y)=(\sqrt (\frac (20)(3))))
    • σ у = 2.58 (\displaystyle \sigma _(y)=2.58)
  5. Корреляцийн коэффициентийг тооцоолох үндсэн томъёог бичнэ үү.Энэ томьёо нь хоёр хувьсагчийн дундаж, стандарт хазайлт, тооны (n) хос тоог агуулдаг. Корреляцийн коэффициентийг "r" гэж тэмдэглэнэ (ховор тохиолдолд "ρ"). Энэ нийтлэлд Пирсоны корреляцийн коэффициентийг тооцоолох томъёог ашигладаг.

    • Энд болон бусад эх сурвалжид тоо хэмжээг өөрөөр зааж өгч болно. Жишээлбэл, зарим томьёо нь "ρ" ба "σ", зарим нь "r", "s" -ийг агуулдаг. Зарим сурах бичигт өөр томьёо өгдөг боловч дээрх томьёоны математикийн аналогууд юм.
  6. Та хоёр хувьсагчийн дундаж болон стандарт хазайлтыг тооцоолсон тул корреляцийн коэффициентийг тооцоолохдоо томъёог ашиглаж болно. "n" нь хоёр хувьсагчийн хос утгын тоо гэдгийг санаарай. Бусад хэмжигдэхүүнүүдийн утгыг өмнө нь тооцоолсон.

    • Бидний жишээн дээр тооцооллыг дараах байдлаар бичнэ.
    • ρ = (1 n − 1) Σ (x − μ x σ x) ∗ (y − μ y σ y) (\displaystyle \rho =\left((\frac (1)(n-1))\баруун) \Sigma \left((\frac (x-\mu _(x))(\sigma _(x)))\баруун)*\left((\frac (y-\mu _(y))(\sigma) _(y)))\баруун))
    • ρ = (1 3) ∗ (\displaystyle \rho =\left((\frac (1)(3))\баруун)*)[ (1 − 3 1 , 83) ∗ (1 − 4 2 , 58) + (2 − 3 1 , 83) ∗ (3 − 4 2 , 58) (\displaystyle \left((\frac (1-3)) 1.83))\баруун)*\зүүн((\frac (1-4)(2.58))\баруун)+\зүүн((\frac (2-3)(1.83))\баруун) *\зүүн((\ frac (3-4)(2.58))\баруун))
      + (4 − 3 1 , 83) ∗ (5 − 4 2 , 58) + (5 − 3 1 , 83) ∗ (7 − 4 2 , 58) (\displaystyle +\left((\frac (4-3)) )(1.83))\баруун)*\зүүн((\frac (5-4)(2.58))\баруун)+\left((\frac (5-3)(1.83))\ баруун)*\зүүн( (\frac (7-4)(2.58))\баруун))]
    • ρ = (1 3) ∗ (6 + 1 + 1 + 6 4 , 721) (\displaystyle \rho =\left((\frac (1)(3))\баруун)*\left((\frac (6)) +1+1+6)(4,721))\баруун))
    • ρ = (1 3) ∗ 2 , 965 (\displaystyle \rho =\left((\frac (1)(3))\баруун)*2.965)
    • ρ = (2 , 965 3) (\displaystyle \rho =\left((\frac (2.965)(3))\баруун))
    • ρ = 0.988 (\displaystyle \rho =0.988)
  7. Үр дүнд дүн шинжилгээ хийх.Бидний жишээнд корреляцийн коэффициент 0.988 байна. Энэ утга нь ямар нэгэн байдлаар энэ хос тооны багцыг тодорхойлдог. Үнийн тэмдэг, хэмжээг анхаарч үзээрэй.

    • Корреляцийн коэффициентийн утга эерэг байх тул “x” болон “y” хувьсагчдын хооронд эерэг хамаарал байна. Өөрөөр хэлбэл, "x"-ийн утга нэмэгдэхийн хэрээр "y"-ийн утга нэмэгддэг.
    • Корреляцийн коэффициентийн утга нь +1-тэй маш ойрхон тул "x" ба "y" хувьсагчдын утгууд хоорондоо маш их хамааралтай байдаг. Хэрэв та координатын хавтгайд цэгүүдийг зурвал тэдгээр нь тодорхой шулуун шугамын ойролцоо байрлана.

    Корреляцийн коэффициентийг тооцоолохын тулд онлайн тооцоолуур ашиглах

    1. Корреляцийн коэффициентийг тооцоолохын тулд интернетээс тооцоолуур олоорой.Энэ коэффициентийг статистикт ихэвчлэн тооцдог. Хэрэв олон тооны хос тоо байвал корреляцийн коэффициентийг гараар тооцоолох нь бараг боломжгүй юм. Тиймээс корреляцийн коэффициентийг тооцоолох онлайн тооны машинууд байдаг. Хайлтын системд "корреляцийн коэффициентийн тооцоолуур" гэж бичнэ үү (хашилтгүйгээр).

    2. Өгөгдлийг оруулна уу.Өгөгдлийг (тоо хос) зөв оруулсан эсэхээ шалгахын тулд вэбсайт дээрх зааврыг шалгана уу. Тохиромжтой хос тоог оруулах нь маш чухал юм; эс бөгөөс та буруу үр дүнд хүрэх болно. Өөр өөр вэбсайтууд өөр өөр өгөгдөл оруулах форматтай байдаг гэдгийг санаарай.

      • Жишээлбэл, http://ncalculators.com/statistics/correlation-coefficient-calculator.htm вэбсайт дээр "x" ба "y" хувьсагчдын утгыг хоёр хэвтээ шугамаар оруулсан болно. Утгуудыг таслалаар тусгаарлана. Өөрөөр хэлбэл, бидний жишээн дээр "x" утгуудыг дараах байдлаар оруулсан болно: 1,2,4,5, "y" утгууд нь: 1,3,5,7.
      • Өөр сайт болох http://www.alcula.com/calculators/statistics/correlation-coefficient/ дээр өгөгдлийг босоо байдлаар оруулсан; энэ тохиолдолд харгалзах хос тоог андуурч болохгүй.
    3. Корреляцийн коэффициентийг тооцоол.Өгөгдлийг оруулсны дараа үр дүнг авахын тулд "Тооцоолох", "Тооцоолох" эсвэл ижил төстэй товчлуур дээр дарна уу.

      График тооцоолуур ашиглах

      1. Өгөгдлийг оруулна уу.График тооцоолуур аваад статистикийн горимд ороод Засах командыг сонгоно уу.

        • Өөр өөр тооны машинууд өөр өөр товчлуур дарахыг шаарддаг. Энэ нийтлэлд Texas Instruments TI-86 тооны машиныг авч үзэх болно.
        • Статистикийн тооцооллын горимд шилжихийн тулд - Stat ("+" товчлуур дээр) дарна уу. Дараа нь F2 - Засварлах товчийг дарна уу.
      2. Өмнөх хадгалсан өгөгдлийг устгах.Ихэнх тооны машинууд таны оруулсан статистикийг арилгах хүртэл хадгалдаг. Хуучин өгөгдлийг шинэ өгөгдөлтэй андуурахгүйн тулд эхлээд хадгалсан мэдээллийг устгана уу.

        • Сум товчлуурыг ашиглан курсорыг хөдөлгөж, "xStat" гарчгийг тодруулна уу. Дараа нь Clear болон Enter товчийг дарж xStat баганад оруулсан бүх утгыг устгана уу.
        • Сум товчийг ашиглан "yStat" гарчгийг тодруулна уу. Дараа нь Clear болон Enter товчийг дарж yStat баганад оруулсан бүх утгыг арилгана.
      3. Анхны өгөгдлийг оруулна уу.Сум товчийг ашиглан курсорыг "xStat" гарчгийн эхний нүд рүү шилжүүлнэ үү. Эхний утгыг оруулаад Enter дарна уу. Дэлгэцийн доод талд “xStat (1) = __” гарч ирэх ба энд хоосон зайны оронд оруулсан утга гарч ирнэ. Enter товчийг дарсны дараа оруулсан утга хүснэгтэд гарч ирэх ба курсор дараагийн мөрөнд шилжинэ; Энэ нь дэлгэцийн доод хэсэгт "xStat (2) = __" гэсэн бичээсийг харуулах болно.

        • "x" хувьсагчийн бүх утгыг оруулна уу.
        • Та x хувьсагчийн бүх утгыг оруулсны дараа сум товчийг ашиглан yStat багана руу шилжиж, y хувьсагчийн утгыг оруулна уу.
        • Бүх хос тоог оруулсны дараа Exit товчийг дарж дэлгэцийг цэвэрлэж, статистик тооцооллын горимоос гарна.
      4. Корреляцийн коэффициентийг тооцоол.Энэ нь өгөгдөл нь тодорхой шугамд хэр ойрхон байгааг тодорхойлдог. График тооцоолуур нь тохирох шугамыг хурдан тодорхойлж, корреляцийн коэффициентийг тооцоолох боломжтой.

        • Статистик - Тооцоолох дээр дарна уу. TI-86 дээр та – – товчийг дарах хэрэгтэй.
        • "Шугаман регресс" функцийг сонгоно уу. TI-86 дээр "LinR" гэсэн шошготой товчийг дарна уу. Дэлгэц дээр анивчих курсортой "LinR_" гэсэн мөр гарч ирнэ.
        • Одоо xStat ба yStat гэсэн хоёр хувьсагчийн нэрийг оруулна уу.
          • TI-86 дээр нэрсийн жагсаалтыг нээнэ үү; Үүнийг хийхийн тулд – – дээр дарна уу.
          • Дэлгэцийн доод мөрөнд боломжтой хувьсагчдыг харуулах болно. Сонгох (үүнийг хийхийн тулд та F1 эсвэл F2 товчийг дарах хэрэгтэй болно), таслал оруулаад дараа нь -г сонгоно уу.
          • Оруулсан өгөгдлийг боловсруулахын тулд Enter дарна уу.
      5. Үр дүндээ дүн шинжилгээ хий. Enter товчийг дарснаар дэлгэцэн дээр дараах мэдээлэл гарч ирнэ.

        • y = a + b x (\displaystyle y=a+bx): Энэ нь шулуун шугамыг дүрсэлсэн функц юм. Функц нь стандарт хэлбэрээр бичигдээгүй гэдгийг анхаарна уу (y = kh + b).
        • a = (\ Displaystyle a =). Энэ нь шугамын Y тэнхлэгтэй огтлолцох цэгийн "y" координат юм.
        • b = (\ Displaystyle b =). Энэ бол шугамын налуу юм.
        • corr = (\displaystyle (\text(corr))=). Энэ нь корреляцийн коэффициент юм.
        • n = (\displaystyle n =). Энэ нь тооцоололд ашигласан хос тооны тоо юм.

-ын корреляцийн коэффициент ба ковариацыг тооцоолъё янз бүрийн төрөлсанамсаргүй хэмжигдэхүүнүүдийн хамаарал.

Корреляцийн коэффициент(корреляцийн шалгуур Пирсон, Англи Pearson Бүтээгдэхүүний Моментийн корреляцийн коэффициент)зэргийг тодорхойлдог шугамансанамсаргүй хэмжигдэхүүнүүдийн хоорондын хамаарал.

Тодорхойлолтоос харахад тооцоолох корреляцийн коэффициент X ба Y санамсаргүй хэмжигдэхүүний тархалтыг мэдэх шаардлагатай. Хэрэв тархалт нь тодорхойгүй бол тооцоолно. корреляцийн коэффициенташигласан түүвэр корреляцийн коэффициентr (гэж бас тодорхойлсон Rxy эсвэл r xy) :

хаана S x - стандарт хэлбэлзэлдээж санамсаргүй хувьсагч x, томъёогоор тооцоолсон:

Тооцооллын томъёоноос харж болно хамаарал, хуваагч (стандарт хазайлтын үржвэр) нь тоологчийг энгийн байдлаар хэвийн болгодог хамаарал-1-ээс 1 хүртэлх хэмжээсгүй тоо болж хувирна. КорреляциТэгээд ковариацижил мэдээллийг өгөх (хэрэв мэдэгдэж байгаа бол стандарт хазайлт), Гэхдээ хамааралашиглахад илүү тохиромжтой, учир нь энэ нь хэмжээсгүй хэмжигдэхүүн юм.

Тооцоол корреляцийн коэффициентТэгээд түүвэр ковариац MS EXCEL-д тийм ч хэцүү биш, учир нь энэ зорилгоор CORREL() болон KOVAR() тусгай функцууд байдаг. Олж авсан утгыг хэрхэн тайлбарлахыг ойлгоход илүү хэцүү байдаг, нийтлэлийн ихэнх нь үүнд зориулагдсан болно.

Онолын ухралт

Үүнийг эргэн санацгаая корреляцийн холболтНэг хувьсагчийн өөр өөр утгууд өөр өөр утгатай тохирч байгаа статистик харилцааг нэрлэнэ дундажутгууд өөр байна (X-ийн утгын өөрчлөлттэй дундаж утга Y тогтмол байдлаар өөрчлөгддөг). гэж таамаглаж байна хоёулаа X ба Y хувьсагчууд Санамсаргүйутгууд ба тэдгээртэй харьцуулахад тодорхой санамсаргүй тархалттай байна дундаж утга.

Анхаарна уу. Хэрэв зөвхөн нэг хувьсагч, жишээлбэл, Y нь санамсаргүй шинж чанартай, нөгөөгийнх нь утгууд нь тодорхойлогддог (судлаач тогтоосон) бол бид зөвхөн регрессийн тухай ярьж болно.

Жишээлбэл, жилийн дундаж температурын хамаарлыг судлахдаа энэ талаар ярих боломжгүй юм хамааралтемператур, ажиглалтын жил, үүний дагуу үзүүлэлтүүдийг хэрэглэнэ хамааралтэдгээрийн холбогдох тайлбартай.

КорреляциХувьсагчдын хооронд хэд хэдэн аргаар үүсч болно:

  1. Хувьсагчдын хооронд учир шалтгааны хамаарал байгаа эсэх. Тухайлбал, хөрөнгө оруулалтын хэмжээ Шинжлэх ухааны судалгаа(х хувьсагч) ба хүлээн авсан патентын тоо (Y). Эхний хувьсагч дараах байдлаар харагдана бие даасан хувьсагч (хүчин зүйл), хоёрдугаарт - хамааралтай хувьсагч (үр дүн). Хэмжигдэхүүний хамаарал нь тэдгээрийн хоорондын хамаарал байгаа эсэхийг тодорхойлдог боловч эсрэгээр биш гэдгийг санах нь зүйтэй.
  2. Коньюгаци байгаа эсэх ( нийтлэг шалтгаан). Тухайлбал, байгууллага томрох тусам цалингийн сан (цалингийн сан) болон байр түрээслэх зардал нэмэгддэг. Байр түрээслэх нь цалингийн сангаас хамаарна гэж үзэх нь мэдээжийн хэрэг. Эдгээр хоёр хувьсагч нь олон тохиолдолд боловсон хүчний тооноос шугаман хамааралтай байдаг.
  3. Хувьсагчдын харилцан нөлөөлөл (нэг нь өөрчлөгдөхөд хоёр дахь хувьсагч өөрчлөгдөх ба эсрэгээр). Энэ аргын тусламжтайгаар асуудлын хоёр томъёололыг зөвшөөрдөг; Аливаа хувьсагч нь бие даасан хувьсагч болон хамааралтай хувьсагчийн үүрэг гүйцэтгэдэг.

Тиймээс, корреляцийн үзүүлэлтхэр хүчтэй байгааг харуулж байна шугаман хамааралхоёр хүчин зүйлийн хооронд (хэрэв нэг байгаа бол), регресс нь нэг хүчин зүйлийг нөгөөгөөр нь таамаглах боломжийг олгодог.

Корреляци, бусад статистик үзүүлэлтүүдийн нэгэн адил, хэзээ зөв хэрэглээашигтай байж болох ч ашиглахад хязгаарлалттай байдаг. Хэрэв энэ нь тодорхой тодорхойлогдсон шугаман хамаарлыг харуулсан бол эсвэл бүрэн байхгүйхарилцаа холбоо, тэгвэл хамааралүүнийг гайхалтайгаар тусгах болно. Гэхдээ хэрэв өгөгдөл нь шугаман бус хамаарлыг (жишээлбэл, квадрат), тусдаа бүлгүүд эсвэл хэт давсан үзүүлэлтүүдийг харуулсан бол тооцоолсон утга корреляцийн коэффициенттөөрөгдүүлсэн байж магадгүй (жишээ файлыг үзнэ үү).

Корреляци 1 эсвэл -1-тэй ойролцоо (өөрөөр хэлбэл үнэмлэхүй утгаараа 1-тэй ойролцоо) нь хувьсагчдын хооронд хүчтэй шугаман хамаарлыг, 0-тэй ойролцоо утга нь хамааралгүй байгааг харуулж байна. Эерэг хамааралНэг үзүүлэлт өсөхөд нөгөө нь дунджаар өсөж, сөрөг үзүүлэлттэй байвал буурна гэсэн үг.

Корреляцийн коэффициентийг тооцоолохын тулд харьцуулсан хувьсагчид дараахь нөхцлийг хангасан байх шаардлагатай.

  • хувьсагчийн тоо хоёртой тэнцүү байх ёстой;
  • хувьсагч нь тоон шинж чанартай байх ёстой (жишээлбэл, давтамж, жин, үнэ). Эдгээр хувьсагчийн тооцоолсон дундаж утга нь: дундаж үнээсвэл өвчтөний дундаж жин. Тоон хувьсагчдаас ялгаатай нь чанарын (нэрлэсэн) хувьсагч нь зөвхөн хязгаарлагдмал ангиллын багцаас (жишээ нь, хүйс эсвэл цусны бүлэг) утгыг авдаг. Эдгээр утгууд нь уламжлалт байдлаар тоон утгатай холбоотой байдаг (жишээлбэл, эмэгтэй хүйс 1, эрэгтэй хүйс 2). Энэ тохиолдолд тооцоо хийх нь тодорхой байна дундаж утга, үүнийг олох шаардлагатай хамаарал, буруу, тиймээс тооцоолол өөрөө буруу байна хамаарал;
  • хувьсагч нь санамсаргүй хэмжигдэхүүн байх ёстой бөгөөд заавал байх ёстой .

Хоёр хэмжээст өгөгдөл нь өөр өөр бүтэцтэй байж болно. Тэдгээрийн зарим нь ажиллахын тулд тодорхой арга барилыг шаарддаг:

  • Шугаман бус хамаарал бүхий өгөгдлийн хувьд хамааралболгоомжтой хэрэглэх хэрэгтэй. Зарим асуудлын хувьд шугаман хамаарлыг бий болгохын тулд нэг эсвэл хоёуланг нь хувьсагчийг хувиргах нь ашигтай байж болох юм (энэ нь шаардлагатай хувиргалтын төрлийг санал болгохын тулд шугаман бус харилцааны төрлийг таамаглах шаардлагатай).
  • Ашиглах замаар тараах талбайнуудЗарим өгөгдөл нь тэгш бус хэлбэлзэлтэй (тарсан) байж болно. Тэгш бус хэлбэлзэлтэй холбоотой асуудал бол өндөр хэлбэлзэлтэй байршил нь хамгийн бага үнэн зөв мэдээлэл өгөхөөс гадна статистикийг тооцоолоход хамгийн их нөлөө үзүүлдэгт оршино. Энэ асуудлыг ихэвчлэн логарифм ашиглах гэх мэт өгөгдлийг хувиргах замаар шийддэг.
  • Зарим өгөгдлүүд нь бүлгүүдэд хуваагдаж байгааг ажиглаж болно (бүлэглэл), энэ нь популяцийг хэсэг хэсгээр нь хуваах хэрэгцээг илэрхийлж болно.
  • Хэт их утга (хурц хазайсан утга) нь корреляцийн коэффициентийн тооцоолсон утгыг гажуудуулж болно. Хэт өндөр үзүүлэлт нь тохиолдлын улмаас, мэдээлэл цуглуулах явцад гарсан алдаа эсвэл харилцааны зарим шинж чанарыг тусгаж болно. Зөрчлийн үзүүлэлт нь дундаж утгаас ихээхэн хазайдаг тул энэ нь үзүүлэлтийг тооцоолоход ихээхэн хувь нэмэр оруулдаг. Статистикийн үзүүлэлтүүдийг ихэвчлэн хэт давсан үзүүлэлттэй, харгалзахгүйгээр тооцдог.

Корреляцийг тооцоолохын тулд MS EXCEL програмыг ашиглах

2 хувьсагчийг жишээ болгон авч үзье XТэгээд Юмөн үүний дагуу, дээжхэд хэдэн хос утгуудаас бүрдэнэ (X i; Y i). Тодорхой болгохын тулд бүтээцгээе.

Анхаарна уу: Диаграмм бүтээх талаар дэлгэрэнгүй мэдээллийг нийтлэлээс үзнэ үү. Барилгын жишээ файлд тараах талбайнуудучир нь ашигладаг Энд бид X хувьсагч санамсаргүй байх шаардлагаас хазайсан (энэ нь үүслийг хялбаршуулдаг янз бүрийн төрөлхарилцаа: бий болгох чиг хандлага ба өгөгдсөн тархалт). Бодит өгөгдлийн хувьд та Scatter диаграмыг ашиглах ёстой (доороос харна уу).

Тооцоолол хамааралТөрөл бүрийн тохиолдлуудад хувьсагчдын хоорондын хамаарлыг зурцгаая. шугаман, квадратболон цагт харилцааны хомсдол.

Анхаарна уу: Жишээ файлд та шугаман трендийн параметрүүд (налуу, Y-таслалт) болон энэ чиг хандлагын шугамтай харьцуулахад тархалтын зэргийг тохируулж болно. Та мөн квадрат параметрүүдийг тохируулах боломжтой.

Барилгын жишээ файлд тараах талбайнуудХэрэв хувьсагчийн хамаарал байхгүй бол тархалтын диаграммыг ашиглана. Энэ тохиолдолд диаграм дээрх цэгүүдийг үүл хэлбэрээр байрлуулна.

Анхаарна уу: Графикийн масштабыг босоо чиглэлд өөрчлөх замаар эсвэл хэвтээ тэнхлэг, цэгүүдийн үүл нь босоо эсвэл хэвтээ шугамын дүр төрхийг өгч болно. Хувьсагчид бие даасан хэвээр байх нь тодорхой.

Дээр дурдсанчлан тооцоолохын тулд корреляцийн коэффициент MS EXCEL дээр CORREL() функц байдаг. Та мөн ижил үр дүнг буцаадаг PEARSON() функцийг ашиглаж болно.

Тооцооллыг баталгаажуулахын тулд хамааралнь дээрх томьёог ашиглан CORREL() функцээр үүсгэгдсэн, жишээ файл нь тооцоог харуулж байна хамааралилүү нарийвчилсан томъёог ашиглан:

=COVARIANCE.G(B28:B88;D28:D88)/STDEV.G(B28:B88)/STDEV.G(D28:D88)

=КОВАРИАНС.B(B28:B88;D28:D88)/STDEV.B(B28:B88)/STDEV.B(D28:D88)

Анхаарна уу: Дөрвөлжин корреляцийн коэффициент r нь тэнцүү байна тодорхойлох коэффициент R2, энэ нь QPIRSON() функцийг ашиглан регрессийн шугамыг байгуулахад тооцдог. R2-ийн утгыг мөн гаргаж болно тархалтын диаграм MS EXCEL-ийн стандарт функцийг ашиглан шугаман чиг хандлагыг бий болгох замаар (диаграмыг сонгох, табыг сонгох) Зохион байгуулалт, дараа нь бүлэгт Шинжилгээтовчийг дарна уу Тренд шугамболон сонгох Шугаман ойртолт). Трендийн шугамыг бий болгох талаар дэлгэрэнгүй мэдээллийг, жишээ нь, үзнэ үү.

Ковариацыг тооцоолохын тулд MS EXCEL програмыг ашиглах

КовариацЭнэ нь 2 хувьсагчийн хувьд тодорхойлогддог ялгааны хувьд (мөн тархалтын хэмжүүр) утгатай ойролцоо бөгөөд тархалт- нэг нь. Иймд cov(x;x)=VAR(x).

MS EXCEL-д (2010 оны хувилбараас эхлэн) ковариацыг тооцоолохын тулд COVARIATION.Г() болон COVARIATION.В() функцуудыг ашиглана. Эхний тохиолдолд тооцоолох томъёо нь дээрхтэй төстэй байна (төгсгөл ны төлөө Хүн ам ), хоёр дахь нь үржүүлэгчийн оронд 1 / n, 1 / (n-1) ашиглагддаг, i.e. төгсгөл .INны төлөө Дээж.

Анхаарна уу: Өмнөх хувилбаруудад MS EXCEL-д байдаг COVAR() функц нь COVARIATION.G() функцтэй төстэй.

Анхаарна уу: CORREL() болон COVAR() функцуудыг англи хувилбар дээр CORREL болон COVAR хэлбэрээр танилцуулсан. COVARIANCE.G() ба COVARIANCE.B() функцууд нь COVARIANCE.P болон COVARIANCE.S.

Тооцооллын нэмэлт томъёо ковариацууд:

=SUMPRODUCT(B28:B88- AVERAGE(B28:B88);(D28:D88- AVERAGE(D28:D88)/COUNT(D28:D88)

=СУПРОДУКТ(B28:B88-ДУНДЖ(B28:B88),(D28:D88))/COUNT(D28:D88)

=СУПРОДУКТ(B28:B88;D28:D88)/COUNT(D28:D88)-ДУНДЖ(B28:B88)*ДУНДЖ(D28:D88)

Эдгээр томьёо нь өмчийг ашигладаг ковариацууд:

Хэрэв хувьсагч xТэгээд yхамааралгүй бол тэдгээрийн ковариац нь 0. Хэрэв хувьсагчид бие даасан биш бол тэдгээрийн нийлбэрийн дисперс нь дараахтай тэнцүү байна.

VAR(x+y)= VAR(x)+ VAR(y)+2COV(x;y)

А тархалттэдний ялгаа тэнцүү байна

VAR(x-y)= VAR(x)+ VAR(y)-2COV(x;y)

Корреляцийн коэффициентийн статистик ач холбогдлын үнэлгээ

Таамаглалыг шалгахын тулд бид санамсаргүй хэмжигдэхүүний тархалтыг мэдэх ёстой, өөрөөр хэлбэл. корреляцийн коэффициент r. Ихэвчлэн таамаглалыг r-д биш, харин t r-ийн санамсаргүй хэмжигдэхүүнээр шалгадаг.

n-2 зэрэгтэй эрх чөлөө.

Хэрэв санамсаргүй хэмжигдэхүүний тооцоолсон утга |t r | t α,n-2 (α-заасан) чухал утгаас их байвал тэг таамаглал няцаагдана (утгуудын хоорондын хамаарал статистик ач холбогдолтой).

Шинжилгээний багц нэмэлт

Б ковариац ба корреляцийг тооцоолох ижил нэртэй хэрэгслүүд байдаг шинжилгээ.

Хэрэгслийг дуудсаны дараа дараах талбаруудыг агуулсан харилцах цонх гарч ирнэ.

  • Оролтын интервал: та 2 хувьсагчийн эх өгөгдөл бүхий муж руу холбоос оруулах шаардлагатай
  • Бүлэглэх: Дүрмээр бол эх өгөгдлийг 2 баганад оруулна
  • Эхний мөрөнд байгаа шошго: шалгах нүдийг тэмдэглэсэн бол Оролтын интервалбаганын толгойг агуулсан байх ёстой. Нэмэлтийн үр дүн нь мэдээллийн багана агуулсан байхаар нүдийг шалгахыг зөвлөж байна
  • Гаралтын интервал: тооцооллын үр дүнг байрлуулах нүднүүдийн муж. Энэ хүрээний зүүн дээд нүдийг зааж өгөхөд хангалттай.

Нэмэлт нь тооцоолсон корреляц ба ковариацын утгыг буцаана (ковариацын хувьд санамсаргүй хэмжигдэхүүний аль алиных нь хэлбэлзлийг мөн тооцдог).

Корреляцийн коэффициентийг тооцоолох замаар харилцааны тоон шинж чанарыг олж авч болно.

Excel дэх корреляцийн шинжилгээ

Функц нь өөрөө байдаг ерөнхий хэлбэр CORREL(массив1, массив2). "Масив1" талбарт хамаарлыг тодорхойлох ёстой утгуудын аль нэгний нүдний мужуудын координатыг оруулна уу. Таны харж байгаагаар корреляцийн коэффициент нь тоо хэлбэрээр бидний өмнө нь сонгосон нүдэнд харагдана. Корреляцийн шинжилгээний параметр бүхий цонх нээгдэнэ. Өмнөх аргаас ялгаатай нь "Оролтын интервал" талбарт бид багана бүрийн интервалыг тусад нь оруулдаггүй, харин шинжилгээнд оролцож буй бүх баганын интервалыг оруулна. Таны харж байгаагаар Excel програм нь корреляцийн шинжилгээний хоёр аргыг нэгэн зэрэг санал болгодог.

Excel дэх корреляцийн график

6) Сонгосон хэсгийн зүүн дээд нүдэнд эцсийн хүснэгтийн эхний элемент гарч ирнэ. Тиймээс H0 таамаглалыг үгүйсгэсэн, өөрөөр хэлбэл регрессийн параметрүүд болон корреляцийн коэффициент нь тэгээс санамсаргүй байдлаар ялгаатай биш, харин статистикийн хувьд чухал ач холбогдолтой юм. 7. Регрессийн тэгшитгэлийн олж авсан үнэлгээ нь түүнийг урьдчилан таамаглахад ашиглах боломжийг олгодог.

Excel дээр корреляцийн коэффициентийг хэрхэн тооцоолох вэ

Хэрэв коэффициент 0 бол энэ нь утгуудын хооронд ямар ч хамаарал байхгүй гэдгийг харуулж байна. Хувьсагч ба y хоорондын хамаарлыг олохын тулд суулгасан функцийг ашиглана уу Microsoft Excel"КОРРЕЛ". Жишээлбэл, "Массив1"-ийн хувьд y утгыг, "Массив2"-ийн хувьд x утгыг сонгоно. Үүний үр дүнд та програмаар тооцсон корреляцийн коэффициентийг хүлээн авах болно. Дараа нь та x, xav, yav бүрийн ялгааг тооцоолох хэрэгтэй. Сонгосон нүднүүдэд бичнэ үү x-x томьёо, y-. Дундажаар нүднүүдийг тэмдэглэхээ бүү мартаарай. Хүлээн авсан үр дүн нь хүссэн корреляцийн коэффициент байх болно.

Пирсоны коэффициентийг тооцоолох дээрх томьёо нь энэ үйл явц нь гараар хийгдсэн бол хэр их хөдөлмөр шаарддаг болохыг харуулж байна. Хоёрдугаарт, өргөн тархсан өгөгдлийн янз бүрийн түүврийн хувьд ямар төрлийн корреляцийн шинжилгээг ашиглаж болохыг зөвлөж байна уу? 60-аас дээш насны бүлэг болон бусад бүх хүмүүсийн хооронд мэдэгдэхүйц ялгаа байгааг би хэрхэн статистик байдлаар батлах вэ?

DIY: Excel ашиглан валютын хамаарлыг тооцоолох

Жишээлбэл, бид Microsoft Excel програмыг ашигладаг боловч корреляцийн томъёог ашиглаж болох бусад програмууд үүнийг хийх болно. 7. Үүний дараа EUR/USD өгөгдөлтэй нүднүүдийг сонгоно. 9. Enter товч дарж EUR/USD болон USD/JPY-ийн корреляцийн коэффициентийг тооцоолно. Тоонуудыг өдөр бүр шинэчлэх нь үнэ цэнэтэй зүйл биш юм (хэрэв та валютын хамааралд хэт автахгүй бол).

Та хоёрын хоорондох холболтын зэргийг тооцоолох хэрэгцээтэй аль хэдийн тулгарсан статистик тоо хэмжээмөн тэдгээрийн хамаарал бүхий томъёог тодорхойлох уу? Үүнийг хийхийн тулд би CORREL функцийг ашигласан - энэ талаар зарим мэдээлэл энд байна. Энэ нь хоёр өгөгдлийн муж хоорондын хамаарлын зэргийг буцаана. Онолын хувьд корреляцийн функцийг шугаманаас экспоненциал эсвэл логарифм руу хөрвүүлэх замаар боловсронгуй болгож болно. Өгөгдлийн дүн шинжилгээ ба корреляцийн график нь түүний найдвартай байдлыг эрс сайжруулдаг.

B2 нүдэнд корреляцийн коэффициент, В3 нүд нь бүрэн ажиглалтын тоог агуулна гэж бодъё. Дашрамд хэлэхэд, та орос хэлээр ярьдаг оффистой юу? Хэрэв хоёр хувьсагч нь хэмжигдэхүүн бөгөөд байна хэвийн тархалт, дараа нь сонголтыг зөв хийсэн. Зөвхөн нэг CC ашиглан муруйнуудын ижил төстэй байдлын шалгуурыг тодорхойлох боломжтой юу?

Корреляцийн холболттойнэг шинж чанарын ижил утга нь нөгөөгийн өөр өөр утгатай тохирч байна. Жишээлбэл: өндөр ба жин, хорт хавдрын өвчлөл, нас гэх мэт харилцан хамаарал байдаг.

Корреляцийн коэффициентийг тооцоолох 2 арга байдаг: квадратын арга (Пирсон), зэрэглэлийн арга (Спирман).

Хамгийн үнэн зөв нь квадратуудын арга (Пирсон) бөгөөд корреляцийн коэффициентийг дараах томъёогоор тодорхойлдог.

r xy нь X ба Y статистик цувралуудын хоорондын хамаарлын коэффициент юм.

d x нь статистикийн X цувралын тоо тус бүрийн арифметик дунджаас хазайлт юм.

d y нь статистикийн Y цувралын тоо тус бүрийн арифметик дунджаас хазайлт юм.

Холболтын хүч ба түүний чиглэлээс хамааран корреляцийн коэффициент нь 0-ээс 1 (-1) хооронд хэлбэлзэж болно. Корреляцийн коэффициент 0 нь холболт байхгүй байгааг илтгэнэ. Корреляцийн коэффициентийн түвшин 1 эсвэл (-1) байх тусам түүний хэмждэг шууд эсвэл санал хүсэлт нь илүү их, илүү нягт байдаг. Корреляцийн коэффициент 1 эсвэл (-1) -тэй тэнцүү байх үед холболт бүрэн, ажиллагаатай байна.

Корреляцийн коэффициентийг ашиглан корреляцийн бат бөх чанарыг үнэлэх схем

Холболтын хүч

Хэрэв байгаа бол корреляцийн коэффициентийн утга

шууд холболт (+)

санал хүсэлт (-)

Холболт байхгүй

Холболт бага (сул)

0-ээс +0.29 хүртэл

0-ээс -0.29 хүртэл

Холболтын дундаж (дунд)

+0.3-аас +0.69 хүртэл

-0.3-аас -0.69 хүртэл

Холболт нь том (хүчтэй)

+0.7-аас +0.99 хүртэл

-0.7-оос -0.99 хүртэл

Бүрэн харилцаа холбоо

(функциональ)

Корреляцийн коэффициентийг квадрат аргыг ашиглан тооцоолохын тулд 7 баганын хүснэгтийг эмхэтгэсэн. Тооцооллын процессыг жишээгээр харцгаая.

ХООЛЫН ХОЛБООНЫ ХҮЧ, МЭНДИЙГ ТОДОРХОЙЛ

Цаг нь боллоо-

ness

бахлуур

(В y )

г x = В xМ x

г у= В yМ y

г x г y

г x 2

г y 2

Σ -1345 ,0

Σ 13996 ,0

Σ 313 , 47

1. Усан дахь иодын дундаж хэмжээг (мг/л-ээр) тодорхойлно.

мг/л

2. Бахлуурын өвчлөлийн дундаж хэмжээг % -аар тодорхойлно.

3. M x-ээс V х тус бүрийн хазайлтыг тодорхойлох, i.e. dx.

201–138=63; 178–138=40 гэх мэт.

4. Үүний нэгэн адил бид V y бүрийн хазайлтыг M y-ээс тодорхойлно, i.e. г ж.

0.2–3.8=-3.6; 0.6–38=-3.2 гэх мэт.

5. Хазайсны үржвэрийг тодорхойлох. Бид гарсан бүтээгдэхүүнийг нэгтгэж, авдаг.

6. Бид d x-ийг квадрат болгож, үр дүнг нэгтгэн гаргана.

7. Үүний нэгэн адил бид квадрат d y, үр дүнг нэгтгэн дүгнэж, бид олж авна

8. Эцэст нь бид бүх хүлээн авсан дүнг томъёонд орлуулна.

Корреляцийн коэффициентийн найдвартай байдлын асуудлыг шийдэхийн тулд үүнийг тодорхойлно дундаж алдаатомъёоны дагуу:

(Хэрэв ажиглалтын тоо 30-аас бага бол хуваагч нь n–1 байна).

Бидний жишээнд

Корреляцийн коэффициентийн утга нь дундаж алдаанаас дор хаяж 3 дахин их байвал найдвартай гэж үзнэ.

Бидний жишээнд

Тиймээс корреляцийн коэффициент нь найдвартай биш бөгөөд энэ нь ажиглалтын тоог нэмэгдүүлэх шаардлагатай болдог.

Корреляцийн коэффициентийг арай бага нарийвчлалтай, гэхдээ илүү хялбар аргаар тодорхойлж болно - зэрэглэлийн арга (Спирман).

Спирмен арга: P=1-(6∑d 2 /n-(n 2 -1))

Эхний болон хоёр дахь эгнээнд x ба y-г тус тус зааж, хосолсон харьцуулах шинж чанаруудыг хоёр эгнээ болго. Энэ тохиолдолд шинж чанарын эхний мөрийг буурах эсвэл өсөх дарааллаар танилцуулж, хоёр дахь эгнээний тоон утгуудыг эхний эгнээний тэдгээрт тохирох утгуудын эсрэг байрлуулна.

харьцуулсан цуврал бүрийн шинж чанарын утгыг серийн дугаар (зэрэглэл)-ээр солино. Зэрэглэл буюу тоонууд нь эхний ба хоёр дахь эгнээний үзүүлэлтүүдийн (утга) газрыг заана. Хаана тоон утгуудХоёрдахь шинж чанарын хувьд зэрэглэлийг эхний шинж чанарын утгуудад хуваарилахдаа баталсан дарааллаар олгох ёстой. Цуврал дахь шинж чанарын ижил утгатай бол зэрэглэлийг эдгээр утгуудын дарааллын тоонуудын нийлбэрээс дундаж тоогоор тодорхойлно.

x ба у хоёрын зэрэглэлийн зөрүүг тодорхойлох (d): d = x - y

гарсан зэрэглэлийн зөрүүний квадрат (d 2)

зөрүүний квадратуудын нийлбэрийг (Σ d 2) олж, үр дүнгийн утгыг томъёонд орлуулна.

Жишээ:Зэрэглэл тогтоох аргыг ашиглан дараах өгөгдлийг олж авсан бол олон жилийн ажлын туршлага, гэмтлийн давтамж хоорондын хамаарлын чиглэл, бат бөх байдлыг тогтооно.

Аргыг сонгох үндэслэл:Асуудлыг шийдэхийн тулд зөвхөн аргыг сонгож болно зэрэглэлийн хамаарал, учир нь "Олон жил ажилласан туршлага" гэсэн шинж чанарын эхний мөрөнд нээлттэй сонголтууд (1 жил ба 7 ба түүнээс дээш жил ажилласан туршлагатай) байдаг бөгөөд энэ нь холболтыг бий болгох илүү нарийвчлалтай аргыг - квадрат аргыг ашиглахыг зөвшөөрдөггүй. харьцуулсан шинж чанаруудын хооронд.

Шийдэл. Тооцооллын дарааллыг текстэд, үр дүнг хүснэгтэд үзүүлэв. 2.

хүснэгт 2

Олон жил ажилласан туршлагатай

Гэмтлийн тоо

Дарааллын тоо (зэрэглэл)

Зэрэглэлийн ялгаа

Зэрэглэлийн квадратын зөрүү

d(x-y)

г 2

Хосолсон шинж чанаруудын мөр бүрийг "x" ба "y" (1-2-р багана) гэж тэмдэглэнэ.

Онцлог бүрийн утгыг зэрэглэлийн (дан) тоогоор солино. "x" эгнээний зэрэглэлийг хуваарилах дараалал нь дараах байдалтай байна: шинж чанарын хамгийн бага утгыг (1 жил хүртэлх ажлын туршлага) "1" серийн дугаар, ижил шинж чанарын дараагийн хувилбаруудад тус тус олгоно. өсөн нэмэгдэж буй дараалал, 2, 3, 4, 5-р серийн дугаарууд - зэрэглэл (3-р баганыг үзнэ үү). Хоёрдахь шинж чанарт "y" (4-р багана) зэрэглэлийг хуваарилахдаа ижил төстэй дарааллыг баримтална. Ижил хэмжээтэй хэд хэдэн сонголт байгаа тохиолдолд (жишээлбэл, стандарт асуудалд 3-4 жил, 5-6 жил ажилласан туршлагатай 100 ажилтанд 12 ба 12 гэмтэл байгаа бол серийн дугаарыг дундаж тоогоор тодорхойлно. Тэдний серийн дугааруудын нийлбэрээс Эдгээрийг эрэмблэхдээ гэмтлийн тоо (12 гэмтэл) 2 ба 3 байрыг эзлэх ёстой тул тэдгээрийн дундаж тоо (2 + 3) / 2 = 2.5 байна Гэмтлийн тоо нь "12" ба "12" (шинж чанар) - "2.5" (4-р багана).

Зэрэглэлийн зөрүүг тодорхойлно d = (x - y) - (5-р багана)

Зэрэглэлийн зөрүүг (d 2) квадрат болгож, зэрэглэлийн зөрүү Σ d 2 (багана 6) -ын квадратуудын нийлбэрийг олоорой.

Дараахь томъёогоор зэрэглэлийн корреляцийн коэффициентийг тооцоол.

Энд n нь "x" ба "y" мөрөнд харьцуулж буй хос сонголтуудын тоо юм.

Корреляцийн шинжилгээ- түгээмэл арга статистик судалгаа, энэ нь нэг үзүүлэлтийн нөгөө үзүүлэлтээс хамааралтай байдлын түвшинг тодорхойлоход хэрэглэгддэг. Microsoft Excel нь энэ төрлийн шинжилгээг хийх тусгай хэрэгсэлтэй. Энэ функцийг хэрхэн ашиглах талаар олж мэдье.

Корреляцийн шинжилгээний мөн чанар

Корреляцийн шинжилгээний зорилго нь хоорондын хамаарал байгаа эсэхийг тодорхойлох явдал юм янз бүрийн хүчин зүйлүүд. Өөрөөр хэлбэл, нэг үзүүлэлтийн бууралт, өсөлт нь нөгөө үзүүлэлтийн өөрчлөлтөд нөлөөлж байгаа эсэхийг тодорхойлдог.

Хэрэв хамаарал тогтоогдвол корреляцийн коэффициентийг тодорхойлно. Регрессийн шинжилгээнээс ялгаатай нь энэ нь тооцоолох цорын ганц үзүүлэлт юм энэ аргастатистик судалгаа. Корреляцийн коэффициент нь +1-ээс -1 хооронд хэлбэлздэг. Хэрэв эерэг хамаарал байгаа бол нэг үзүүлэлтийн өсөлт нь хоёр дахь үзүүлэлтийн өсөлтөд нөлөөлдөг. Сөрөг хамааралтай бол нэг үзүүлэлтийн өсөлт нь нөгөө үзүүлэлт буурахад хүргэдэг. Корреляцийн коэффициентийн модуль том байх тусам нэг үзүүлэлтийн өөрчлөлт нь хоёр дахь үзүүлэлтийн өөрчлөлтөд илүү мэдэгдэхүйц байх болно. Коэффициент 0 байх үед тэдгээрийн хооронд бүрэн хамаарал байхгүй болно.

Корреляцийн коэффициентийн тооцоо

Одоо тодорхой жишээн дээр корреляцийн коэффициентийг тооцоолохыг хичээцгээе. Бид зар сурталчилгааны зардал, борлуулалтын хэмжээг сар бүр тусад нь баганад харуулсан хүснэгттэй. Борлуулалтын тоо хэмжээнээс хэр хамааралтайг бид олж мэдэх ёстой Мөнгө, энэ нь сурталчилгаанд зарцуулагдсан.

Арга 1: Функцийн шидтэн ашиглан хамаарлыг тодорхойлох

Корреляцийн шинжилгээ хийх нэг арга бол CORREL функцийг ашиглах явдал юм. Функц нь өөрөө CORREL(массив1, массив2) ерөнхий хэлбэртэй байна.

  1. Тооцооллын үр дүнг харуулах нүдийг сонгоно уу. Томъёоны мөрний зүүн талд байрлах "Функц оруулах" товчийг дарна уу.
  2. Function Wizard цонхонд үзүүлсэн жагсаалтаас CORREL функцийг хайж олоод сонгоно уу. "OK" товчийг дарна уу.
  3. Функцийн аргументуудын цонх нээгдэнэ. "Масив1" талбарт хамаарлыг тодорхойлох ёстой утгуудын аль нэгний нүдний мужуудын координатыг оруулна уу. Манай тохиолдолд эдгээр нь "Борлуулалтын үнэ цэнэ" баганад байгаа утгууд байх болно. Талбарт массивын хаягийг оруулахын тулд дээрх баганад байгаа өгөгдөл бүхий бүх нүдийг сонгоход хангалттай.

    "Масив2" талбарт та хоёр дахь баганын координатыг оруулах хэрэгтэй. Бидний хувьд энэ нь сурталчилгааны зардал юм. Өмнөх тохиолдолтой яг ижил аргаар бид өгөгдлийг талбарт оруулна.

    "OK" товчийг дарна уу.

Таны харж байгаагаар корреляцийн коэффициент нь тоо хэлбэрээр бидний өмнө нь сонгосон нүдэнд харагдана. IN энэ тохиолдолдэнэ нь 0.97-тэй тэнцүү бөгөөд энэ нь маш их юм өндөр тэмдэгнэг хэмжигдэхүүнээс нөгөө хэмжигдэхүүнээс хамаарах хамаарал.

Арга 2: Шинжилгээний багцыг ашиглан корреляцийг тооцоол

Өөрөөр хэлбэл, шинжилгээний багцад өгөгдсөн хэрэгслүүдийн аль нэгийг ашиглан корреляцийг тооцоолж болно. Гэхдээ эхлээд бид энэ хэрэгслийг идэвхжүүлэх хэрэгтэй.

  1. "Файл" таб руу очно уу.
  2. Нээгдсэн цонхонд "Тохиргоо" хэсэгт очно уу.
  3. Дараа нь "Нэмэлт" зүйл рүү очно уу.
  4. Дараагийн цонхны доод хэсэгт байрлах "Удирдлага" хэсэгт шилжүүлэгч өөр байрлалд байгаа бол "Excel Нэмэлтүүд" байрлал руу шилжүүлнэ үү. "OK" товчийг дарна уу.
  5. Нэмэлтүүдийн цонхонд "Шинжилгээний багц" зүйлийн хажууд байгаа нүдийг шалгана уу. "OK" товчийг дарна уу.
  6. Үүний дараа шинжилгээний багц идэвхждэг. "Өгөгдөл" таб руу очно уу. Таны харж байгаагаар энэ нь соронзон хальс дээр харагдаж байна шинэ блокхэрэгсэл - "Шинжилгээ". Тэнд байрлах "Өгөгдлийн шинжилгээ" товчийг дарна уу.
  7. -ээр жагсаалт нээгдэнэ янз бүрийн сонголтуудмэдээллийн дүн шинжилгээ хийх. "Харилцаа" гэсэн зүйлийг сонгоно уу. "OK" товчийг дарна уу.
  8. Корреляцийн шинжилгээний параметр бүхий цонх нээгдэнэ. Өмнөх аргаас ялгаатай нь "Оролтын интервал" талбарт бид багана бүрийн интервалыг тусад нь оруулдаггүй, харин шинжилгээнд оролцож буй бүх баганын интервалыг оруулна. Манай тохиолдолд энэ нь "Зар сурталчилгааны зардал" ба "Борлуулалтын үнэ" баганад байгаа өгөгдөл юм.

    Манай өгөгдлийн бүлгүүд хоёр баганад хуваагддаг тул бид "Бүлэглэх" параметрийг өөрчлөхгүй - "Баганаар" үлдээдэг. Хэрэв тэдгээрийг мөр мөрөөр задалсан бол шилжүүлэгчийг "Мөрөөр" байрлалд шилжүүлэх шаардлагатай болно.

    Өгөгдмөл гаралтын параметрүүдэд "Шинэ ажлын хуудас" гэсэн зүйлийг тохируулсан бөгөөд өөрөөр хэлбэл өгөгдлийг өөр хуудсан дээр гаргах болно. Шилжүүлэгчийг хөдөлгөж байршлыг өөрчилж болно. Энэ нь одоогийн хуудас (дараа нь та мэдээллийн гаралтын нүднүүдийн координатыг зааж өгөх шаардлагатай болно) эсвэл шинэ ажлын ном (файл) байж болно.

    Бүх тохиргоог тохируулсны дараа "OK" товчийг дарна уу.

Шинжилгээний үр дүнгийн гаралтын байршлыг анхдагч байдлаар үлдээсэн тул бид шинэ хуудас руу шилжинэ. Таны харж байгаагаар корреляцийн коэффициентийг энд харуулав. Мэдээжийн хэрэг, энэ нь эхний аргыг ашиглахтай адил юм - 0.97. Учир нь энэ хоёр сонголт хоёулаа ижил тооцоолол хийдэг тул тэдгээрийг өөр өөр аргаар хийж болно.

Таны харж байгаагаар Excel програм нь корреляцийн шинжилгээний хоёр аргыг нэгэн зэрэг санал болгодог. Тооцооллын үр дүн, хэрэв та бүх зүйлийг зөв хийвэл бүрэн ижил байх болно. Гэхдээ хэрэглэгч бүр өөрт нь илүү тохиромжтой тооцооны сонголтыг сонгох боломжтой.

Бид танд асуудлыг шийдвэрлэхэд тусалж чадсандаа баяртай байна.

Асуудлын мөн чанарыг нарийвчлан тайлбарлаж, тайлбар дээр асуултаа асуугаарай. Манай мэргэжилтнүүд аль болох хурдан хариулахыг хичээх болно.

Энэ нийтлэл танд тусалсан уу?

Регресс ба корреляцийн шинжилгээ нь статистик судалгааны арга юм. Эдгээр нь нэг буюу хэд хэдэн бие даасан хувьсагчаас параметрийн хамаарлыг харуулах хамгийн түгээмэл арга юм.

Тодорхой талаар доор практик жишээнүүдЭдийн засагчдын дунд маш их алдартай эдгээр хоёр шинжилгээг авч үзье. Бид тэдгээрийг нэгтгэх үед үр дүнг олж авах жишээг өгөх болно.

Excel дээрх регрессийн шинжилгээ

Зарим утгуудын (бие даасан, бие даасан) хамааралтай хувьсагчид үзүүлэх нөлөөллийг харуулна. Тухайлбал, эдийн засгийн идэвхтэй хүн амын тоо нь аж ахуйн нэгжийн тоо, цалин болон бусад үзүүлэлтээс хэрхэн хамаардаг. Эсвэл: гадаадын хөрөнгө оруулалт, эрчим хүчний үнэ зэрэг нь ДНБ-ий түвшинд хэрхэн нөлөөлдөг вэ.

Шинжилгээний үр дүн нь тэргүүлэх чиглэлийг тодруулах боломжийг танд олгоно. Мөн үндсэн хүчин зүйлс дээр үндэслэн тэргүүлэх чиглэлүүдийн хөгжлийг урьдчилан таамаглах, төлөвлөх, удирдлагын шийдвэр гаргах.

Регресс тохиолддог:

  • шугаман (y = a + bx);
  • параболик (y = a + bx + cx2);
  • экспоненциал (y = a * exp(bx));
  • хүч (y = a*x^b);
  • гипербол (y = b/x + a);
  • логарифм (y = b * 1n(x) + a);
  • экспоненциал (y = a * b^x).

Барилга байгууламжийг жишээ болгон авч үзье регрессийн загвар Excel болон үр дүнгийн тайлбар. Регрессийн шугаман төрлийг авч үзье.

Даалгавар. 6 аж ахуйн нэгжид сарын дундаж цалинболон гарсан ажилчдын тоо. Ажлаас халагдсан ажилчдын тоо дундаж цалингаас хамаарах эсэхийг тодорхойлох шаардлагатай.

Загвар шугаман регрессдараах хэлбэртэй байна:

Y = a0 + a1x1 +…+akhk.

a регрессийн коэффициентууд, х нь нөлөөлөх хувьсагчид, k нь хүчин зүйлийн тоо юм.

Бидний жишээн дээр Y нь ажилчдыг ажлаас халах үзүүлэлт юм. Нөлөөлөх хүчин зүйл нь цалин (x) юм.

Excel-д шугаман регрессийн загварын параметрүүдийг тооцоолоход туслах функцууд байдаг. Гэхдээ "Шинжилгээний багц" нэмэлт нь үүнийг илүү хурдан хийх болно.

Бид хүчирхэг аналитик хэрэгслийг идэвхжүүлдэг:

  1. "Office" товчийг дараад "Excel Options" таб руу очно уу. "Нэмэлтүүд".
  2. Доод талд, унждаг жагсаалтын доор "Удирдах" талбарт "Excel Нэмэлтүүд" гэсэн бичээс байх болно (хэрэв байхгүй бол баруун талд байгаа чагт дээр дарж сонгоно уу). Мөн "Явах" товч. дарна уу.
  3. Боломжтой нэмэлтүүдийн жагсаалт нээгдэнэ. "Шинжилгээний багц" -ыг сонгоод OK дарна уу.

Идэвхжүүлсний дараа нэмэлт нь Мэдээллийн таб дээр гарч ирнэ.

Одоо регрессийн шинжилгээг өөрөө хийцгээе.

  1. "Өгөгдлийн шинжилгээ" хэрэгслийн цэсийг нээнэ үү. "Регресс"-ийг сонгоно уу.
  2. Энэ нь оролтын утга болон гаралтын сонголтыг сонгох цэсийг нээнэ (үр дүнг хаана харуулах). Анхны өгөгдлийн талбаруудад бид тайлбарлаж буй параметрийн хүрээ (Y) ба түүнд нөлөөлж буй хүчин зүйлийг (X) заана. Үлдсэн хэсгийг нь бөглөхгүй байж болно.
  3. OK дарсны дараа програм нь тооцооллыг шинэ хуудсан дээр харуулах болно (та одоогийн хуудсан дээр харуулах интервалыг сонгох эсвэл шинэ ажлын дэвтэрт гаралтыг оноож болно).

Юуны өмнө бид R квадрат болон коэффициентүүдэд анхаарлаа хандуулдаг.

R-квадрат нь детерминацын коэффициент юм. Бидний жишээнд - 0.755 буюу 75.5%. Загварын тооцоолсон параметрүүд нь судалж буй параметрүүдийн хоорондын хамаарлын 75.5%-ийг тайлбарлаж байна гэсэн үг. Детерминацийн коэффициент өндөр байх тусам загвар нь илүү сайн байх болно. Сайн - 0.8-аас дээш. Муу - 0.5-аас бага (ийм дүн шинжилгээг үндэслэлтэй гэж үзэх боломжгүй). Бидний жишээнд - "муу биш".

64.1428 коэффициент нь авч үзэж буй загвар дахь бүх хувьсагч 0-тэй тэнцүү байвал Y ямар байхыг харуулдаг. Өөрөөр хэлбэл, дүн шинжилгээ хийсэн параметрийн утгад загварт заагаагүй бусад хүчин зүйлс мөн нөлөөлдөг.

Коэффициент -0.16285 нь Х хувьсагчийн Y дээрх жинг харуулж байна. Өөрөөр хэлбэл, энэ загварт багтсан сарын дундаж цалин нь -0.16285 жинтэй (энэ нь бага хэмжээний нөлөөлөл) ажлаас халагдсан хүмүүсийн тоонд нөлөөлдөг. "-" тэмдэг нь сөрөг нөлөөллийг илтгэнэ: цалин өндөр байх тусам цөөхөн хүн ажлаасаа гарах болно. Аль нь шударга вэ.

Excel дэх корреляцийн шинжилгээ

Корреляцийн шинжилгээ нь нэг эсвэл хоёр түүврийн үзүүлэлтүүдийн хооронд хамаарал байгаа эсэхийг тодорхойлоход тусалдаг. Жишээлбэл, машины ашиглалтын хугацаа болон засварын зардал, тоног төхөөрөмжийн үнэ ба ашиглалтын хугацаа, хүүхдийн өндөр, жин гэх мэт.

Хэрэв холболт байгаа бол нэг параметрийн өсөлт нь нөгөө параметрийн өсөлт (эерэг хамаарал) эсвэл буурах (сөрөг) болоход хүргэдэг. Корреляцийн шинжилгээ нь шинжээчдэд нэг үзүүлэлтийн утгыг таамаглахад ашиглаж болох эсэхийг тодорхойлоход тусалдаг боломжит утгаөөр.

Корреляцийн коэффициентийг r гэж тэмдэглэнэ. +1-ээс -1 хооронд хэлбэлздэг. Ангилал хамааралУчир нь өөр өөр газар нутагөөр байх болно. Коэффициент 0 байх үед шугаман хамааралдээжийн хооронд байхгүй.

Excel ашиглан корреляцийн коэффициентийг хэрхэн олохыг харцгаая.

Хосолсон коэффициентийг олохын тулд CORREL функцийг ашигладаг.

Зорилго: Токарийн ажиллах хугацаа болон засвар үйлчилгээний зардал хоёрын хооронд хамаарал байгаа эсэхийг тодорхойлох.

Курсорыг дурын нүдэнд байрлуулаад fx товчийг дарна уу.

  1. "Статистик" ангилалд CORREL функцийг сонгоно уу.
  2. Аргумент "Масив 1" - утгын эхний муж - машины ажиллах хугацаа: A2: A14.
  3. Аргумент "Масив 2" - утгын хоёр дахь муж - засварын зардал: B2: B14. OK дарна уу.

Холболтын төрлийг тодорхойлохын тулд та коэффициентийн үнэмлэхүй тоог харах хэрэгтэй (үйл ажиллагааны талбар бүр өөрийн гэсэн масштабтай).

Хэд хэдэн параметрийн (2-оос дээш) хамаарлын шинжилгээ хийхдээ "Өгөгдлийн шинжилгээ" ("Шинжилгээний багц" нэмэлт) ашиглах нь илүү тохиромжтой. Жагсаалтаас хамаарлыг сонгоод массивыг зааж өгөх хэрэгтэй. Бүгд.

Үр дүнгийн коэффициентүүд нь корреляцийн матрицад харагдах болно. Үүн шиг:

Корреляци ба регрессийн шинжилгээ

Практикт эдгээр хоёр аргыг ихэвчлэн хамт ашигладаг.

  1. Бид корреляцийн талбарыг байгуулдаг: "Оруулах" - "Диаграмм" - "Тараах диаграм" (хосыг харьцуулах боломжийг танд олгоно). Утгын хүрээ нь хүснэгтийн бүх тоон өгөгдөл юм.
  2. Диаграмын аль ч цэг дээр хулганы зүүн товчийг дарна уу. Дараа нь зөв. Нээгдэх цэснээс "Тренд шугам нэмэх" гэснийг сонгоно уу.
  3. Шугамын параметрүүдийг оноох. Төрөл - "шугаман". Доод талд - "Тэгшитгэлийг диаграм дээр харуулах".
  4. "Хаах" дээр дарна уу.

Одоо регрессийн шинжилгээний өгөгдөл харагдах болсон.

1. Excel програмыг нээнэ үү

2.Өгөгдлийн багана үүсгэх. Бидний жишээн дээр бид нэгдүгээр ангийн сурагчдын түрэмгий зан, өөртөө эргэлзэх хоёрын хоорондын хамаарлыг авч үзэх болно. Туршилтанд 30 хүүхэд оролцсон бөгөөд өгөгдлийг Excel хүснэгтэд үзүүлэв.

1 багана - сэдвийн дугаар

2-р багана - онооны түрэмгий байдал

3-р багана - оноогоор өөртөө эргэлзэх

3. Дараа нь та хүснэгтийн хажууд байгаа хоосон нүдийг сонгоод дүрс дээр дарах хэрэгтэй f(x) Excel самбар дээр

4.Функцийн цэс нээгдэх бөгөөд та ангиллуудаас сонгох ёстой Статистик, дараа нь функцуудын жагсаалтаас цагаан толгойн дарааллаар олоорой КОРРЕЛболон OK дарна уу

5.Дараа нь функцын аргументуудын цэс нээгдэх бөгөөд энэ нь бидэнд хэрэгтэй өгөгдлийн баганыг сонгох боломжийг танд олгоно. Эхний баганыг сонгохын тулд Түрэмгий байдалта мөрний хажууд байгаа цэнхэр товчлуур дээр дарах хэрэгтэй Массив 1

6. Өгөгдлийг сонгох Массив1баганаас Түрэмгий байдалмөн харилцах цонхон дээрх цэнхэр товчлуур дээр дарна уу

7. Дараа нь 1-р массивын адил мөрний хажууд байрлах цэнхэр товчлуур дээр дарна Массив2

8. Өгөгдлийг сонгох Массив2- багана Ялгаадахин цэнхэр товчийг дараад OK дарна уу

9. Энд r-Пирсон корреляцийн коэффициентийг тооцоолж, сонгосон нүдэнд бичсэн байгаа бөгөөд энэ нь эерэг бөгөөд ойролцоогоор тэнцүү байна. Энэ тухай ярьж байна дунд зэргийн эерэгНэгдүгээр ангийн сурагчдын түрэмгий байдал ба өөртөө эргэлзэх хоёрын хоорондын холбоо

Тиймээс, статистик дүгнэлтТуршилт нь: r = 0.225, хувьсагчдын хооронд дунд зэргийн эерэг хамаарал илэрсэн. түрэмгий байдалТэгээд үл итгэх байдал.

Зарим судалгаанд корреляцийн коэффициентийн ач холбогдлын p түвшнийг зааж өгөх шаардлагатай байдаг Excel програм, SPSS-ээс ялгаатай нь ийм сонголтыг өгдөггүй. Зүгээр дээ, ширээ байгаа чухал үнэ цэнэхамаарал (А.Д. Наследов).

Та мөн Excel дээр регрессийн шугам үүсгэж, судалгааны үр дүнд хавсаргаж болно.



Сайт дээр шинэ

>

Хамгийн алдартай