Додому Вилучення Позитивний та негативний кореляційний зв'язок в excel. Як виконується кореляція в Excel

Позитивний та негативний кореляційний зв'язок в excel. Як виконується кореляція в Excel

У наукових дослідженняхчасто виникає необхідність у знаходженні зв'язку між результативними та факторними змінними (урожайністю будь-якої культури та кількістю опадів, зростанням та вагою людини в однорідних групах за статтю та віком, частотою пульсу та температурою тіла тощо).

Другі є ознаки, сприяють зміні таких, що з ними (першими).

Поняття про кореляційний аналіз

Існує безліч Виходячи з вищевикладеного, можна сказати, що кореляційний аналіз - це метод, що застосовується з метою перевірки гіпотези про статистичної значимостідвох і більше змінних, якщо дослідник може вимірювати, але з змінювати.

Є й інші визначення поняття, що розглядається. Кореляційний аналіз— це метод обробки полягає у вивченні коефіцієнтів кореляції між змінними. При цьому порівнюються коефіцієнти кореляції між однією парою або безліччю пар ознак для встановлення між ними статистичних взаємозв'язків. Кореляційний аналіз — це метод вивчення статистичної залежності між випадковими величинами з необов'язковою наявністю суворого функціонального характеру, при якій динаміка однієї випадкової величинипризводить до динаміки математичного очікуванняінший.

Поняття про хибність кореляції

При проведенні кореляційного аналізу необхідно враховувати, що його можна провести по відношенню до будь-якої сукупності ознак, часто абсурдних один до одного. Часом вони не мають жодного причинного зв'язку один з одним.

У цьому випадку говорять про хибну кореляцію.

Завдання кореляційного аналізу

Виходячи з наведених вище визначень, можна сформулювати такі завдання описуваного методу: отримати інформацію про одну з змінних, що шукаються, за допомогою іншої; визначити тісноту зв'язку між досліджуваними змінними.

Кореляційний аналіз передбачає визначення залежності між ознаками, що досліджуються, у зв'язку з чим завдання кореляційного аналізу можна доповнити такими:

  • виявлення факторів, що мають найбільший вплив на результативну ознаку;
  • виявлення невивчених раніше причин зв'язків;
  • побудова кореляційної моделі з її параметричним аналізом;
  • вивчення значимості властивостей зв'язку та його інтервальна оцінка.

Зв'язок кореляційного аналізу з регресійним

Метод кореляційного аналізу часто не обмежується знаходженням тісноти зв'язку між досліджуваними величинами. Іноді він доповнюється складанням рівнянь регресії, які отримують за допомогою однойменного аналізу, і є описом кореляційної залежності між результуючим і факторним (факторними) ознакою (ознаками). Цей метод разом із аналізованим аналізом становить метод

Умови використання методу

Результативні чинники залежить від однієї до кількох чинників. Метод кореляційного аналізу може застосовуватися в тому випадку, якщо є велика кількість спостережень про величину результативних та факторних показників (факторів), при цьому досліджувані фактори мають бути кількісними та відображатись у конкретних джерелах. Перше може визначатися нормальним законом - у цьому випадку результатом кореляційного аналізу виступають коефіцієнти кореляції Пірсона, або, якщо ознаки не підкоряються цьому закону, використовується коефіцієнт рангової кореляціїСпірмена.

Правила відбору факторів кореляційного аналізу

При застосуванні даного методунеобхідно визначитися з факторами, які впливають на результативні показники. Їх відбирають з урахуванням того, що між показниками мають бути причинно-наслідкові зв'язки. У разі створення багатофакторної кореляційної моделі відбирають ті з них, які істотно впливають на результуючий показник. чи функціональний характер.

Відображення результатів

Результати кореляційного аналізу можуть бути представлені у текстовому та графічному видах. У першому випадку вони видаються як коефіцієнт кореляції, у другому - у вигляді діаграми розкиду.

За відсутності кореляції між параметрами точки на діаграмі розташовані хаотично, середній ступінь зв'язку характеризується більшим ступенем упорядкованості та характеризується більш-менш рівномірною віддаленістю нанесених позначок медіани. Сильна зв'язок прагне прямий і за r=1 точковий графік є рівною лінію. Зворотна кореляція відрізняється спрямованістю графіка з лівого верхнього в правий нижній, пряма — з нижнього лівого у верхній правий кут.

Тривимірне уявлення діаграми розкиду (розсіювання)

Крім традиційного 2D-подання діаграми розкиду, в даний час використовується 3D-відображення графічного представлення кореляційного аналізу.

Також використовується матриця діаграми розсіювання, яка відображає всі парні графіки на одному малюнку в матричному форматі. Для n змінних матриця містить n рядків та n стовпців. Діаграма, розташована на перетині i-го рядка і j-ого стовпця, є графік змінних Xi в порівнянні з Xj. Таким чином, кожен рядок і стовпець є одним виміром, окремий осередок відображає діаграму розсіювання двох вимірів.

Оцінка тісноти зв'язку

Тіснота кореляційного зв'язку визначається за коефіцієнтом кореляції (r): сильна – r = ±0,7 до ±1, середня – r = ±0,3 до ±0,699, слабка – r = 0 до ±0,299. Ця класифікація перестав бути суворої. На малюнку показано дещо іншу схему.

Приклад застосування методу кореляційного аналізу

У Великій Британії було зроблено цікаве дослідження. Воно присвячене зв'язку куріння з раком легенів, та проводилося шляхом кореляційного аналізу. Це спостереження наведено нижче.

Вихідні дані для кореляційного аналізу

Професійна група

смертність

Фермери, лісники та рибалки

Шахтарі та працівники кар'єрів

Виробники газу, коксу та хімічних речовин

Виробники скла та кераміки

Працівники печей, ковальських, ливарних та прокатних станів

Працівники електротехніки та електроніки

Інженерні та суміжні професії

Деревообробні виробництва

Кожувенники

Текстильні робітники

Виробники робочого одягу

Працівники харчової, питної та тютюнової промисловості

Виробники паперу та друку

Виробники інших продуктів

Будівельники

Художники та декоратори

Водії стаціонарних двигунів, кранів тощо.

Робочі, не включені до інших місць

Працівники транспорту та зв'язку

Складські робітники, комірники, пакувальники та працівники розливальних машин

Канцелярські працівники

Продавці

Працівники служби спорту та відпочинку

Адміністратори та менеджери

Професіонали, технічні працівники та художники

Розпочинаємо кореляційний аналіз. Рішення краще починати для наочності з графічного методу, Навіщо побудуємо діаграму розсіювання (розкиду).

Вона показує прямий зв'язок. Однак на підставі лише графічного методу зробити однозначний висновок складно. Тому продовжимо виконувати кореляційний аналіз. Приклад розрахунку коефіцієнта кореляції наведено нижче.

За допомогою програмних засобів (з прикладу MS Excel буде описано далі) визначаємо коефіцієнт кореляції, який становить 0,716, що означає сильний зв'язок між досліджуваними параметрами. Визначимо статистичну достовірність отриманого значення за відповідною таблицею, для чого нам потрібно відняти з 25 пар значень 2, в результаті чого отримаємо 23 і по цьому рядку в таблиці знайдемо r критичне для p=0,01 (оскільки це медичні дані, тут використовується більш строга залежність, в решті випадків достатньо p=0,05), яке становить 0,51 для цього кореляційного аналізу. Приклад продемонстрував, що розрахункове більше r критичного, значення коефіцієнта кореляції вважається статистично достовірним.

Використання ПЗ під час проведення кореляційного аналізу

Описуваний вид статистичної обробки даних може здійснюватися за допомогою програмного забезпеченнязокрема, MS Excel. Кореляційний передбачає обчислення наступних параметрів з використанням функцій:

1. Коефіцієнт кореляції визначається за допомогою функції КОРРЕЛ (масив1; масив2). Масив1,2 - осередок інтервалу значень результативних і факторних змінних.

Лінійний коефіцієнт кореляції також називається коефіцієнтом кореляції Пірсона, у зв'язку з чим, починаючи з Excel 2007 можна використовувати функцію з тими ж масивами.

Графічне відображення кореляційного аналізу в Excel здійснюється за допомогою панелі "Діаграми" з вибором "Точкова діаграма".

Після вказівки вихідних даних отримуємо графік.

2. Оцінка значимості коефіцієнта парної кореляції з допомогою t-критерію Стьюдента. Розраховане значення t-критерію порівнюється з табличною (критичною) величиною даного показника з відповідної таблиці значень аналізованого параметра з урахуванням заданого рівня значущості та числа ступенів свободи. Ця оцінка здійснюється з використанням функції СТЬЮДРАСПОБР (імовірність; ступеня_свободи).

3. Матриця коефіцієнтів парної кореляції. Аналіз здійснюється за допомогою засобу "Аналіз даних", в якому вибирається "Кореляція". Статистичну оцінку коефіцієнтів парної кореляції здійснюють у порівнянні його абсолютної величини з табличним (критичним) значенням. При перевищенні розрахункового коефіцієнта парної кореляції над таким критичним можна говорити, з урахуванням заданого ступеня ймовірності, що нульова гіпотеза про значимість лінійного зв'язку не відкидається.

На закінчення

Використання в наукових дослідженнях методу кореляційного аналізу дозволяє визначити зв'язок між різними факторамита результативними показниками. При цьому необхідно враховувати, що високий коефіцієнт кореляції можна отримати і з абсурдної пари чи безлічі даних, у зв'язку з чим даний виданалізу слід здійснювати на досить великому масиві даних.

Після отримання розрахункового значення r бажано порівняти з r критичним для підтвердження статистичної достовірності певної величини. Кореляційний аналіз може здійснюватися вручну з використанням формул або за допомогою програмних засобів, зокрема MS Excel. Тут же можна побудувати діаграму розкиду (розсіювання) з метою наочного уявлення про зв'язок між факторами кореляційного аналізу, що вивчаються, і результативною ознакою.

У сьогоднішній статті мова підеу тому, як змінні може бути пов'язані друг з одним. За допомогою кореляції ми зможемо визначити, чи існує зв'язок між першою та другою змінною. Сподіваюся, це заняття здасться вам не менш цікавим, ніж попередні!

Кореляція вимірює потужність та напрямок зв'язку між x та y. На малюнку представлені різні типикореляції як графіків розсіювання упорядкованих пар (x, y). За традицією змінна х розміщається на горизонтальної осі, а y – на вертикальній.

Графік А є прикладом позитивної лінійної кореляції: при збільшенні х також збільшується у, причому лінійно. Графік В показує нам приклад негативної лінійної кореляції, на якому при збільшенні х лінійно зменшується. На графіку З бачимо відсутність кореляції між х і у. Ці змінні аж ніяк не впливають одна на одну.

Зрештою, графік D – це приклад нелінійних відносин між змінними. У міру збільшення x у спочатку зменшується, потім змінює напрямок і збільшується.

Решта статті присвячена лінійним взаємозв'язкам між залежною та незалежною змінними.

Коефіцієнт кореляції

Коефіцієнт кореляції, r, надає нам як силу, так і напрямок зв'язку між незалежною та залежною змінними. Значення r знаходяться в діапазоні між 1.0 і + 1.0. Коли r має позитивне значення, зв'язок між х і у є позитивним (графік A на малюнку), а коли значення r негативне, зв'язок також негативний (графік В). Коефіцієнт кореляції, близький до нульового значення, свідчить про те, що між х та у зв'язку не існує графік С).

Сила зв'язку між х і у визначається близькістю коефіцієнта кореляції до - 1.0 або + - 1.0. Вивчіть наступний малюнок.

Графік A показує ідеальну позитивну кореляцію між х та у при r = + 1.0. Графік В - ідеальна негативна кореляція між х та у при r = - 1.0. Графіки З і D - приклади слабших зв'язків між залежною та незалежною змінними.

Коефіцієнт кореляції, r, визначає, як силу, так і напрямок зв'язку між залежною та незалежною змінними. Значення r знаходяться в діапазоні від - 1.0 (сильний негативний зв'язок) до + 1.0 (сильний позитивний зв'язок). При r= 0 між змінними х і немає ніякого зв'язку.

Ми можемо обчислити фактичний коефіцієнт кореляції за допомогою наступного рівняння:

Ну і ну! Я знаю, що це рівняння виглядає як страшне нагромадження незрозумілих символів, але перш ніж ударятися в паніку, давайте застосуємо до нього приклад з екзаменаційною оцінкою. Припустимо, я хочу визначити, чи існує зв'язок між кількістю годин, присвячених студентом вивченню статистики, та фінальною екзаменаційною оцінкою. Таблиця, наведена нижче, допоможе нам розбити це рівняння на кілька нескладних обчислень і зробити їх більш керованими.

Як бачите, між кількістю годин, присвячених вивченню предмета, та екзаменаційною оцінкою існує дуже сильна позитивна кореляція. Викладачі будуть дуже раді дізнатися про це.

Яка вигода встановлювати зв'язок між подібними змінними? Чудове питання. Якщо виявляється, що зв'язок існує, ми можемо передбачити екзаменаційні результати на основі певної кількості годин, присвячених вивченню предмета. Простіше кажучи, що сильніший зв'язок, то точнішим буде наше передбачення.

Використання Excel для обчислення коефіцієнтів кореляції

Я впевнений, що, глянувши на ці жахливі обчислення коефіцієнтів кореляції, ви відчуєте справжню радість, дізнавшись, що програма Excelможе виконати за вас всю цю роботу за допомогою функції КОРРЕЛ з наступними характеристиками:

КОРРЕЛ (масив 1; масив 2),

масив 1 = діапазон даних для першої змінної,

масив 2 = діапазон даних для другої змінної.

Наприклад, на малюнку показано функцію КОРРЕЛ, яка використовується при обчисленні коефіцієнта кореляції для прикладу з екзаменаційною оцінкою.

Коефіцієнт кореляції (або лінійний коефіцієнткореляції) позначається як «r» (у поодиноких випадках як «ρ») і характеризує лінійну кореляцію(тобто взаємозв'язок, що задається деяким значенням та напрямом) двох або більше змінних. Значення коефіцієнта лежить між -1 та +1, тобто кореляція буває як позитивною, так і негативною. Якщо коефіцієнт кореляції дорівнює -1, має місце ідеальна негативна кореляція; якщо коефіцієнт кореляції дорівнює +1, має місце ідеальна позитивна кореляція. В інших випадках між двома змінними спостерігається позитивна кореляція, негативна кореляція або відсутність кореляції. Коефіцієнт кореляції можна обчислити вручну за допомогою безкоштовних онлайн-калькуляторів або за допомогою гарного графічного калькулятора.

Кроки

Обчислення коефіцієнта кореляції вручну

    Зберіть дані.Перед тим як розпочати обчислення коефіцієнта кореляції, вивчіть дані пари чисел. Краще записати їх у таблицю, яку можна розташувати вертикально чи горизонтально. Кожен рядок чи стовпець позначте як «х» і «у».

    • Наприклад, дано чотири пари значень (чисел) змінних «х» і «у». Можна створити таку таблицю:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  1. Обчисліть середнє арифметичне «х».Для цього складіть всі значення "х", а потім отриманий результат поділіть на кількість значень.

    • У прикладі дано чотири значення змінної «х». Щоб обчислити середнє арифметичне «х», складіть ці значення, а потім суму розділіть на 4. Обчислення запишуться так:
    • μ x = (1 + 2 + 4 + 5) / 4 (\displaystyle \mu _(x)=(1+2+4+5)/4)
    • μ x = 12/4 (\displaystyle \mu _(x)=12/4)
    • μ x = 3 (\displaystyle \mu _(x)=3)
  2. Знайдіть середнє арифметичне "у".Для цього виконайте аналогічні дії, тобто складіть всі значення у, а потім суму розділіть на кількість значень.

    • У нашому прикладі наведено чотири значення змінної «у». Складіть ці значення, потім суму розділіть на 4. Обчислення запишуться так:
    • μ y = (1 + 3 + 5 + 7) / 4 (\displaystyle \mu _(y)=(1+3+5+7)/4)
    • μ y = 16/4 (\displaystyle \mu _(y)=16/4)
    • μ y = 4 (\displaystyle \mu _(y)=4)
  3. Обчисліть стандартне відхилення "х".Обчисливши середні значення «х» та «у», знайдіть стандартні відхиленняцих змінних. Стандартне відхилення обчислюється за такою формулою:

    • σ x = 1 n − 1 Σ (x − μ x) 2 (\displaystyle \sigma _(x)=(\sqrt ((\frac(1)(n-1)))\Sigma (x-\mu _( x))^(2))))
    • σ x = 1 4 − 1 ∗ ((1 − 3) 2 + (2 − 3) 2 + (4 − 3) 2 + (5 − 3) 2) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(4-1))*((1-3)^(2)+(2-3)^(2)+(4-3)^(2)+(5-3) ^(2)))))
    • σ x = 1 3 * (4 + 1 + 1 + 4) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(4+1+1+4)) ))
    • σ x = 1 3 ∗ (10) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(10))))
    • σ x = 10 3 (\displaystyle \sigma _(x)=(\sqrt (\frac (10)(3))))
    • x = 1 , 83 (\displaystyle \sigma _(x)=1,83)
  4. Обчисліть стандартне відхилення "у".Виконайте дії, описані в попередньому кроці. Скористайтеся тією ж формулою, але підставте значення «у».

    • У прикладі обчислення запишуться так:
    • σ y = 1 4 − 1 ∗ ((1 − 4) 2 + (3 − 4) 2 + (5 − 4) 2 + (7 − 4) 2) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(4-1))*((1-4)^(2)+(3-4)^(2)+(5-4)^(2)+(7-4) ^(2)))))
    • y = 1 3 ∗ (9 + 1 + 1 + 9) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(9+1+1+9)) ))
    • σ y = 1 3 ∗ (20) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(20))))
    • σ y = 20 3 (\displaystyle \sigma _(y)=(\sqrt (\frac (20)(3))))
    • σ y = 2,58 (\displaystyle \sigma _(y)=2,58)
  5. Запишіть основну формулу обчислення коефіцієнта кореляції.У цю формулу входять середні значення, стандартні відхилення та кількість (n) пар чисел обох змінних. Коефіцієнт кореляції позначається як «r» (у поодиноких випадках як «ρ»). У статті використовується формула для обчислення коефіцієнта кореляції Пірсона.

    • Тут та інших джерелах величини можуть позначатися по-різному. Наприклад, у деяких формулах присутні «ρ» та «σ», а в інших «r» та «s». У деяких підручниках наводяться інші формули, але є математичними аналогами наведеної вище формули.
  6. Ви обчислили середні значення та стандартні відхилення обох змінних, тому можна скористатися формулою для обчислення коефіцієнта кореляції. Нагадаємо, що «n» – це кількість пар значень обох змінних. Значення інших величин було обчислено раніше.

    • У прикладі обчислення запишуться так:
    • ρ = (1 n − 1) Σ (x − μ x σ x) ∗ (y − μ y σ y) (\displaystyle \rho =\left((\frac (1)(n-1))\right) \Sigma \left((\frac (x-\mu _(x))(\sigma _(x)))\right)*\left((\frac (y-\mu _(y)))(\sigma _(y)))\right))
    • ρ = (1 3) ∗ (\displaystyle \rho =\left((\frac (1)(3))\right)*)[ (1 − 3 1 , 83) ∗ (1 − 4 2 , 58) + (2 − 3 1 , 83) ∗ (3 − 4 2 , 58) (\displaystyle \left((\frac (1-3)( 1,83))\right)*\left((\frac (1-4)(2,58))\right)+\left((\frac (2-3)(1,83))\right) *\left((\frac (3-4)(2,58))\right))
      + (4 − 3 1 , 83) ∗ (5 − 4 2 , 58) + (5 − 3 1 , 83) ∗ (7 − 4 2 , 58) (\displaystyle +\left((\frac (4-3) )(1,83))\right)*\left((\frac (5-4)(2,58))\right)+\left((\frac (5-3)(1,83))\ right)*\left((\frac (7-4)(2,58))\right))]
    • ρ = (1 3) * (6 + 1 + 1 + 6 4 , 721) (\displaystyle \rho =\left((\frac (1)(3))\right)*\left((\frac (6) +1+1+6)(4,721))\right))
    • ρ = (1 3) ∗ 2 , 965 (\displaystyle \rho =\left((\frac (1)(3))\right)*2,965)
    • ρ = (2 , 965 3) (\displaystyle \rho =\left((\frac (2,965)(3))\right))
    • ρ = 0 , 988 (\displaystyle \rho =0,988)
  7. Проаналізуйте отриманий результат.У прикладі коефіцієнт кореляції дорівнює 0,988. Це значення певним чином характеризує цей набір пар чисел. Зверніть увагу на знак та величину значення.

    • Оскільки значення коефіцієнта кореляції позитивно, між змінними «х» і «у» має місце позитивна кореляція. Тобто зі збільшенням значення «х», значення «у» теж збільшується.
    • Так як значення коефіцієнта кореляції дуже близько до +1, значення змінних "х" і "у" сильно взаємопов'язані. Якщо нанести точки на координатну площину, вони розташовані близько до деякої прямої.

    Використання онлайн-калькуляторів для обчислення коефіцієнта кореляції

    1. В інтернеті знайдіть калькулятор для обчислення коефіцієнта кореляції.Цей коефіцієнт досить часто обчислюється у статистиці. Якщо пар чисел багато, визначити коефіцієнт кореляції вручну практично неможливо. Тому є онлайн-калькулятори для обчислення коефіцієнта кореляції. У пошуковій системі введіть «коефіцієнт кореляції калькулятор» (без лапок).

    2. Введіть дані.Ознайомтеся з інструкціями на сайті, щоб правильно ввести дані (пари чисел). Вкрай важливо вводити відповідні пари чисел; в іншому випадку ви отримаєте неправильний результат. Пам'ятайте, що різні формати введення даних на різних веб-сайтах.

      • Наприклад, на сайті http://ncalculators.com/statistics/correlation-coefficient-calculator.htm значення змінних "х" і "у" вводяться у двох горизонтальних рядках. Значення поділяються комами. Тобто в прикладі значення «х» вводяться так: 1,2,4,5, а значення «у» так: 1,3,5,7.
      • На іншому сайті, http://www.alcula.com/calculators/statistics/correlation-coefficient/, дані вводяться по вертикалі; у цьому випадку не переплутайте відповідних кіл чисел.
    3. Обчисліть коефіцієнт кореляції.Ввівши дані, просто натисніть на кнопку Calculate, Обчислити або аналогічну, щоб отримати результат.

      Використання графічного калькулятора

      1. Введіть дані.Візьміть графічний калькулятор, перейдіть у режим статистичних обчислень та виберіть команду «Edit» (Редагувати).

        • На різних калькуляторах потрібно натискати клавіші. У статті розглядається калькулятор Texas Instruments TI-86.
        • Щоб перейти в режим статистичних обчислень, натисніть Stat (над клавішею «+»). Потім натисніть F2 – Edit (Редагувати).
      2. Видаліть попередні збережені дані.У більшості калькуляторів введені статистичні дані зберігаються до тих пір, поки ви не зітре їх. Щоб не сплутати старі дані з новими, спершу видаліть будь-яку збережену інформацію.

        • За допомогою кнопок зі стрілками перемістіть курсор і виділіть заголовок «xStat». Потім натисніть Clear (Очистити) та Enter (Ввести), щоб видалити всі значення, введені в стовпець xStat.
        • За допомогою кнопок зі стрілками виділіть заголовок «yStat». Потім натисніть Clear (Очистити) та Enter (Ввести), щоб видалити всі значення, введені в стовпець у Stat.
      3. Введіть вихідні дані.За допомогою клавіш зі стрілками перемістіть курсор у першу комірку під заголовком xStat. Введіть перше значення та натисніть Enter. У нижній частині екрана з'явиться "xStat(1) = __", де замість пробілу буде стояти введене значення. Після натискання Enter введене значення з'явиться в таблиці, а курсор переміститься на наступний рядок; при цьому в нижній частині екрана відобразиться xStat(2) = __.

        • Введіть усі значення змінної "х".
        • Ввівши всі значення змінної «х», за допомогою клавіш зі стрілками перейдіть у стовпець yStat і введіть значення змінної «у».
        • Після введення всіх пар чисел натисніть Exit (Вийти), щоб очистити екран і вийти з статистичних обчислень.
      4. Обчисліть коефіцієнт кореляції.Він характеризує, наскільки близькі дані розташовані до деякої прямої. Графічний калькулятор може швидко визначити відповідну пряму та обчислити коефіцієнт кореляції.

        • Натисніть Stat (Статистика) – Calc (Обчислення). На TI-86 потрібно натиснути – – .
        • Виберіть функцію «Linear Regression» (Лінійна регресія). На TI-86 натисніть , яка позначена як LinR. На екрані з'явиться рядок «LinR _» з миготливим курсором.
        • Тепер введіть імена двох змінних: xStat та yStat.
          • На TI-86 відкрийте перелік імен; для цього натисніть – – .
          • У нижньому рядку екрана з'являться доступні змінні. Виберіть (для цього, швидше за все, потрібно натиснути F1 або F2), введіть кому, а потім виберіть .
          • Натисніть клавішу Enter, щоб обробити введені дані.
      5. Проаналізуйте отримані результати.Натиснувши Enter, на екрані з'явиться така інформація:

        • y = a + b x (\displaystyle y = a + bx): це функція, яка описує пряму Зауважте, що функція записана не в стандартній формі (у = kх + b).
        • a = (\displaystyle a=). Це координата "у" точки перетину прямої з віссю Y.
        • b = (\displaystyle b=). Це кутовий коефіцієнт прямий.
        • corr = (\displaystyle (\text(corr))=). Це коефіцієнт кореляції.
        • n = (\displaystyle n=). Це кількість пар чисел, яка була використана у обчисленнях.

Регресійний та кореляційний аналіз – статистичні методи дослідження. Це найпоширеніші способи показати залежність будь-якого параметра від однієї чи кількох незалежних змінних.

Нижче на конкретних практичні прикладирозглянемо ці два дуже популярні серед економістів аналізу. А також наведемо приклад отримання результатів при їх об'єднанні.

Регресійний аналіз у Excel

Показує вплив одних значень (самостійних, незалежних) на залежну змінну. Наприклад, як залежить кількість економічно активного населення кількості підприємств, величини зарплати та інших. властивостей. Або як впливають іноземні інвестиції, ціни на енергоресурси та ін на рівень ВВП.

Результат аналізу дає змогу виділяти пріоритети. І ґрунтуючись на головних чинниках, прогнозувати, планувати розвиток пріоритетних напрямів, приймати управлінські рішення.

Регресія буває:

  • лінійної (у = а + bx);
  • параболічній (y = a + bx + cx 2);
  • експоненційною (y = a * exp (bx));
  • статечної (y = a * x ^ b);
  • гіперболічної (y = b/x + a);
  • логарифмічної (y = b * 1n(x) + a);
  • показовою (y = a * b^x).

Розглянемо з прикладу побудова регресійної моделів Excel та інтерпретацію результатів. Візьмемо лінійний тип регресії.

Завдання. На 6 підприємствах було проаналізовано середньомісячну заробітня платаі кількість співробітників, що звільнилися. Необхідно визначити залежність кількості співробітників, що звільнилися, від середньої зарплати.

Модель лінійної регресіїмає такий вигляд:

У = а 0 + а 1 х 1 + ... + а до х к.

Де а – коефіцієнти регресії, х – що впливають змінні, до – число чинників.

У нашому прикладі як У виступає показник працівників, що звільнилися. фактор, що впливає - заробітна плата (х).

У Excel існують інтегровані функції, з допомогою яких можна розрахувати параметри моделі лінійної регресії. Але найшвидше це зробить надбудова «Пакет аналізу».

Активуємо потужний аналітичний інструмент:

Після активації надбудова буде доступна на вкладці "Дані".

Тепер візьмемося безпосередньо регресійним аналізом.



Насамперед звертаємо увагу на R-квадрат та коефіцієнти.

R-квадрат – коефіцієнт детермінації. У прикладі – 0,755, чи 75,5%. Це означає, що розрахункові параметри моделі на 75,5% пояснюють залежність між параметрами, що вивчаються. Що коефіцієнт детермінації, то якісніша модель. Добре – понад 0,8. Погано – менше 0,5 (такий аналіз навряд можна вважати резонним). У нашому прикладі - "непогано".

Коефіцієнт 64,1428 показує, яким буде Y, якщо всі змінні в моделі, що розглядається, будуть рівні 0. Тобто на значення аналізованого параметра впливають і інші фактори, не описані в моделі.

p align="justify"> Коефіцієнт -0,16285 показує вагомість змінної Х на Y. Тобто середньомісячна заробітна плата в межах даної моделі впливає на кількість звільнених з вагою -0,16285 (це невеликий ступінь впливу). Знак «-» вказує на негативний вплив: що більше зарплата, то менше звільнених. Що слушно.



Кореляційний аналіз у Excel

Кореляційний аналіз допомагає встановити, чи між показниками в одній або двох вибірках є зв'язок. Наприклад, між часом роботи верстата та вартістю ремонту, ціною техніки та тривалістю експлуатації, зростанням та вагою дітей тощо.

Якщо зв'язок є, то чи тягне збільшення одного параметра підвищення (позитивна кореляція) чи зменшення (негативна) іншого. Кореляційний аналіз допомагає аналітику визначитися, чи можна за величиною одного показника передбачити можливе значенняіншого.

Коефіцієнт кореляції позначається r. Варіюється в межах від +1 до -1. Класифікація кореляційних зв'язків для різних сфербуде відрізнятись. При значенні коефіцієнта 0 лінійної залежностіміж вибірками немає.

Розглянемо, як з допомогою засобів Excel визначити коефіцієнт кореляції.

Для знаходження парних коефіцієнтів застосовується функція Корел.

Завдання: Визначити, чи є взаємозв'язок між часом роботи токарного верстата та вартістю його обслуговування.

Ставимо курсор у будь-яку комірку і натискаємо кнопку fx.

  1. У категорії «Статистичні» вибираємо функцію КОРРЕЛ.
  2. Аргумент "Масив 1" - перший діапазон значень - час роботи верстата: А2: А14.
  3. Аргумент "Масив 2" - другий діапазон значень - вартість ремонту: В2: В14. Тиснемо ОК.

Щоб визначити тип зв'язку, потрібно подивитися абсолютну кількість коефіцієнта (для кожної сфери діяльності є своя шкала).

Для кореляційного аналізу кількох параметрів (більше 2) зручніше застосовувати "Аналіз даних" (надбудова "Пакет аналізу"). У списку потрібно вибрати кореляцію та позначити масив. Всі.

Отримані коефіцієнти відобразяться у кореляційній матриці. На кшталт такий:

Кореляційно-регресійний аналіз

Насправді ці дві методики часто застосовуються разом.

Приклад:


Тепер стали помітні й дані регресійного аналізу.

Кількісна характеристика взаємозв'язку можна отримати при обчисленні коефіцієнта кореляції.

Кореляційний аналіз у Excel

Сама функція має загальний виглядКорел (масив1; масив2). У полі «Масив1» вводимо координати діапазону осередків одного із значень, залежність якого слід визначити. Як бачимо, коефіцієнт кореляції у вигляді числа з'являється в заздалегідь вибраному комірці. Відкривається вікно із параметрами кореляційного аналізу. На відміну від попереднього способу, у полі "Вхідний інтервал" ми вводимо інтервал не кожного стовпця окремо, а всіх стовпців, які беруть участь у аналізі. Як бачимо, програма Ексель пропонує відразу два способи кореляційного аналізу.

Графік кореляції в excel

6) У лівому верхньому осередку виділеної області з'явиться перший елемент підсумкової таблиці. Тому гіпотеза Н0 відхиляється, тобто параметри регресії та коефіцієнт кореляції не випадково відрізняються від нуля, а статистично значущі. 7. Отримані оцінки рівняння регресії дають змогу використовувати його для прогнозу.

Як розрахувати коефіцієнт кореляції в Excel

Якщо коефіцієнт дорівнює 0, це свідчить, що взаємозв'язок між значеннями відсутня. Щоб знайти взаємозв'язок між змінними та у, скористайтеся вбудованою функцією Microsoft Excel«Коррел». Наприклад, для "Масив1" виділіть значення у, а для "Масив2" виділіть значення х. У результаті ви отримаєте розрахований програмою коефіцієнт кореляції. Далі необхідно обчислити різницю між кожним x і xср, y yср. У вибраних осередках напишіть формули x-x, y-. Не забудьте закріпити комірки із середніми значеннями. Отриманий результат і буде шуканим коефіцієнтом кореляції.

Наведена вище формула розрахунку коефіцієнта Пірсона, показує наскільки трудомісткий цей процес, якщо виконувати його вручну. Друге, порекомендуйте, будь ласка, який вид кореляційного аналізу можна використовувати для різних вибірок із великим розкидом даних? Як мені статистично довести достовірність відмінностей між групою старше 60 років та рештою?

Зроби сам: обчислення кореляцій валют із використанням Excel

Ми, наприклад, використовуємо Microsoft Excel, але підійде будь-яка інша програма, в якій можна використовувати кореляційну формулу. 7.Після цього виділіть комірки з даними по EUR/USD. 9. Натисніть Enter для того, щоб вирахувати коефіцієнт кореляції для EUR/USD та USD/JPY. Оновлювати цифри щодня не варто (ну, хіба ви одержимі кореляціями валюти).

Ви вже стикалися з необхідністю розрахувати ступінь зв'язку двох статистичних величинта визначити формулу, за якою вони корелюють? Для цього я скористався функцією CORREL (КОРРЕЛ) – про неї є небагато інформації тут. Вона повертає рівень кореляції двох діапазонів даних. Теоретично, функцію кореляції можна уточнити, якщо перевести її з лінійної до експоненційної або логарифмічної. Аналіз даних та графіків кореляції дозволяє покращити її достовірність дуже суттєво.

Припустимо, в комірці В2 знаходиться сам коефіцієнт кореляції, в комірці В3 кількість повних спостережень. У Вас російськомовний офіс? До речі, знайшов і помилку – значимість не обчислюється для негативних кореляцій. Якщо обидві змінні метричні та мають нормальний розподіл, то вибір зроблено правильно. І, чи можна, характеризувати критерій схожості кривих лише по одному КК? У Вас не схожість «кривих», а схожість двох рядів, яка в принципі може описуватися кривою.



Нове на сайті

>

Найпопулярніше