Додому Протезування та імплантація Критичні значення коефіцієнта кореляції рангів спірмена. Кореляційний аналіз методом Спірмена (ранги Спірмена)

Критичні значення коефіцієнта кореляції рангів спірмена. Кореляційний аналіз методом Спірмена (ранги Спірмена)

Коефіцієнт кореляції рангів, запропонований К. Спірменом, відноситься до непараметричних показників зв'язку між змінними, виміряними в ранговій шкалі. При розрахунку цього коефіцієнта не потрібно ніяких припущень про характер розподілу ознак у генеральній сукупності. Цей коефіцієнт визначає ступінь тісноти зв'язку порядкових ознак, які у разі є ранги порівнюваних величин.

Величина коефіцієнта кореляції Спірмена лежить в інтервалі +1 і -1. Він, як і коефіцієнт Пірсона, може бути позитивним та негативним, характеризуючи спрямованість зв'язку між двома ознаками, виміряними у ранговій шкалі.

У принципі число ранжируемых ознак (якостей, чорт тощо.) може бути будь-яким, але процес ранжирування більшого, ніж 20 числа ознак - скрутний. Можливо, що саме тому таблиця критичних значень рангового коефіцієнта кореляції розрахована лише сорока ранжируемых ознак (n< 40, табл. 20 приложения 6).

Ранговий коефіцієнт кореляції Спірмена підраховується за такою формулою:

де n - кількість ранжованих ознак (показників, випробуваних);

D - різниця між рангами по двох змінних для кожного випробуваного;

Сума квадратів різниць рангів.

Використовуючи ранговий коефіцієнт кореляції, розглянемо такий приклад.

приклад: Психолог з'ясовує, як пов'язані між собою індивідуальні показники готовності до школи, отримані до початку навчання у школі у 11 першокласників та їхня середня успішність наприкінці навчального року.

Для вирішення цього завдання було проранжовано, по-перше, значення показників шкільної готовності, отримані під час вступу до школи, і, по-друге, підсумкові показники успішності наприкінці року в тих учнів у середньому. Результати представимо в табл. 13.

Таблиця 13

№ учнів

Ранги показників шкільної готовності

Ранги середньорічної успішності

Підставляємо отримані дані у формулу та проводимо розрахунок. Отримуємо:

Для знаходження рівня значущості звертаємось до табл. 20 додатка 6, в якій наведено критичні значеннядля коефіцієнтів рангової кореляції.

Підкреслимо, що у табл. 20 додатка 6, як і в таблиці для лінійної кореляціїПірсона, всі величини коефіцієнтів кореляції дано за абсолютною величиною. Тому, знак коефіцієнта кореляції враховується лише за його інтерпретації.

Знаходження рівнів значимості у цій таблиці здійснюється за кількістю n, т. е. за кількістю піддослідних. У нашому випадку n = 11. Для цього числа знаходимо:

0,61 для P 0,05

0,76 для P 0,01

Будуємо відповідну ``вісь значущості'':

Отриманий коефіцієнт кореляції збігся з критичним значенням рівня значимості в 1%. Отже, можна стверджувати, що показники шкільної готовності та підсумкові оцінки першокласників пов'язані позитивною кореляційною залежністю - інакше кажучи, чим вищий показник шкільної готовності, тим краще навчається першокласник. У термінах статистичних гіпотез психолог повинен відхилити нульову (Нгіпотезу про подібність і прийняти альтернативну (Але наявності відмінностей, яка говорить про те, що зв'язок між показниками шкільної готовності та середньою успішністю відрізняється від нуля).

Випадок однакових (рівних) рангів

За наявності однакових рангів формула розрахунку коефіцієнта лінійної кореляції Спірмена буде дещо іншою. У цьому випадку до формули обчислення коефіцієнтів кореляції додаються два нових члени, що враховують однакові ранги. Вони називаються поправками на однакові ранги і додаються до чисельника розрахункової формули.

де n - число однакових рангів у першому стовпці,

k – число однакових рангів у другому стовпці.

Якщо є дві групи однакових рангів, у якомусь стовпці то формула поправки дещо ускладнюється:

де n - число однакових рангів у першій групі стовпця, що ранжується,

k - число однакових рангів у другій групі стовпця, що ранжується. Модифікація формули загальному випадкутака:

приклад: Психолог, використовуючи тест розумового розвитку (ШТУР) проводить дослідження інтелекту у 12 учнів 9 класу. Одночасно з цим, але просить вчителів літератури та математики провести ранжування цих самих учнів за показниками розумового розвитку. Завдання полягає в тому, щоб визначити, як пов'язані між собою об'єктивні показники розумового розвитку (дані ШТУРу) та експертні оцінки вчителів.

Експериментальні дані цієї задачі та додаткові стовпці, необхідні для розрахунку коефіцієнта кореляції Спірмена, представимо у вигляді табл. 14.

Таблиця 14

№ учнів

Ранги тестування за допомогою ШТУРу

Експертні оцінки вчителів з математики

Експертні оцінки вчителів з літератури

D (другого та третього стовпців)

D (другого та четвертого стовпців)

(другого та третього стовпців)

(другого та четвертого стовпців)

Оскільки при ранжируванні використовувалися однакові ранги, необхідно перевірити правильність ранжирування у другому, третьому і четвертому стовпцях таблиці. Підсумовування у кожному з цих стовпців дає однакову суму - 78.

Перевіряємо по розрахунковій формулі. Перевірка дає:

У п'ятому та шостому стовпцях таблиці наведено величини різниці рангів між експертними оцінками психолога за тестом ШТУР для кожного учня та величинами експертних оцінок вчителів, відповідно до математики та літератури. Сума величин різниць рангів повинна дорівнювати нулю. Підсумовування величин D в п'ятому і шостому стовпцях дало результат. Отже, віднімання рангів проведено правильно. Подібну перевірку необхідно робити щоразу під час проведення складних видів ранжування.

Перш ніж розпочати розрахунок за формулою, необхідно розрахувати поправки на однакові ранги для другого, третього і четвертого стовпців таблиці.

У нашому випадку у другому стовпці таблиці два однакові ранги, отже, за формулою величина поправки D1 ​​буде:

У третьому стовпці три однакові ранги, отже, за формулою величина поправки D2 буде:

У четвертому стовпці таблиці дві групи по три однакові ранги, отже, за формулою величина поправки D3 буде:

Перш, ніж почати вирішення завдання, нагадаємо, що психолог з'ясовує два питання - як пов'язані величини рангів за тестом ШТУР з експертними оцінкамиз математики та літератури. Саме тому розрахунок проводиться двічі.

Вважаємо перший ранговий коефіцієнт з урахуванням добавок за формулою. Отримуємо:

Підрахуємо без урахування добавки:

Як бачимо, різниця у величинах коефіцієнтів кореляції виявилася дуже незначною.

Вважаємо другий ранговий коефіцієнт з урахуванням добавок за формулою. Отримуємо:

Підрахуємо без урахування добавки:

І знову, відмінності виявилися дуже незначними. Оскільки кількість учнів у обох випадках однаково, по табл. 20 додатка 6 знаходимо критичні значення при n = 12 одночасно для обох коефіцієнтів кореляції.

0,58 для P 0,05

0,73 для P 0,01

Відкладаємо перше значення на "осі значущості"":

У першому випадку отриманий коефіцієнт рангової кореляції перебуває у зоні значимості. Тому психолог повинен відхилити нульову Нгіпотезу про схожість коефіцієнта кореляції з нулем і прийняти альтернативну Але значну відмінність коефіцієнта кореляції від нуля. Іншими словами, отриманий результат говорить про те, що чим вищі експертні оцінки учнів з тесту ШТУР, тим вищі їх експертні оцінки з математики.

Відкладаємо друге значення на "осі значущості"":

У другому випадку коефіцієнт рангової кореляції знаходиться у зоні невизначеності. Тому психолог може прийняти нульову Нгіпотезу про схожість коефіцієнта кореляції з нулем і відхилити альтернативну Але значну відмінність коефіцієнта кореляції від нуля. У цьому випадку отриманий результат свідчить, що експертні оцінки учнів з тесту ШТУР не пов'язані з експертними оцінками з літератури.

Для застосування коефіцієнта кореляції Спірмена, необхідно дотримуватись наступних умов:

1. Змінні змінні повинні бути отримані в порядковій (ранговій) шкалі, але можуть бути виміряні також у шкалі інтервалів та відносин.

2. Характер розподілу корелюваних величин не має значення.

3. Число змін, що варіюють, в порівнюваних змінних X і Y повинно бути однаковим.

Таблиці визначення критичних значень коефіцієнта кореляції Спірмена (табл. 20 додаток 6) розраховані від числа ознак рівних n = 5 до n = 40 і за більшому числі порівнюваних змінних слід використовувати таблицю для пірсоновского коефіцієнта кореляції (табл. 19 додаток 6). Знаходження критичних значень здійснюється за k = n.

Кореляційний аналіз є методом, що дозволяє виявляти залежність між певною кількістю випадкових величин. Мета кореляційного аналізу зводиться до виявлення оцінки сили зв'язків між такими випадковими величинамиабо ознаками, що характеризують певні реальні процеси.

Сьогодні ми пропонуємо розглянути, як застосовується кореляційний аналіз Спірмена, для наочного відображення форм зв'язку в практичному трейдингу.

Кореляція за Спірменом чи основа кореляційного аналізу

Щоб зрозуміти, що таке кореляційний аналіз, спочатку слід усвідомити поняття кореляції.

При цьому, якщо ціна почне рухатися в потрібному напрямку, необхідно вчасно розлокувати позиції.


Для цієї стратегії основою якої покладено кореляційний аналіз, найкраще підходять торгові інструменти мають високий рівень кореляції (EUR/USD і GBP/USD, EUR/AUD і EUR/NZD, AUD/USD і NZD/USD, контракти CFD тощо) .

Відео: Застосування кореляції Спирмена на ринку Форекс

37. Коефіцієнт рангової кореляції Спірмена.

С. 56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Коефіцієнт рангової кореляції Спірмена використовується у випадках, коли:
- змінні мають рангову шкалувимірювання;
- розподіл даних занадто відрізняється від нормальногочи взагалі невідомо;
- вибірки мають невеликий обсяг (N< 30).

Інтерпретація рангового коефіцієнта кореляції Спірмена не відрізняється від коефіцієнта Пірсона, проте його сенс дещо відмінний. Щоб зрозуміти відмінність цих методів і логічно обґрунтувати сфери їх застосування порівняємо їх формули.

Коефіцієнт кореляції Пірсона:

Коефіцієнт кореляції Спірмена:

Як бачимо, формули значно різняться. Порівняємо формули

У формулі кореляції Пірсона використовується середнє арифметичне та стандартне відхилення корелюваних рядів, а у формулі Спірмена не використовується. Таким чином, для отримання адекватного результату за формулою Пірсона, необхідно, щоб корелювані ряди були наближені до нормального розподілу (середнє та стандартне відхилення є параметрами нормального розподілу ). Для формули Спірмена це актуально.

Елементом формули Пірсона є стандартизація кожного ряду z-шкалу.

Як бачимо, переведення змінних у Z-шкалу є у формулі коефіцієнта кореляції Пірсона. Відповідно, для коефіцієнта Пірсона абсолютно не має значення масштаб даних: наприклад, ми можемо корелювати дві змінні, одна з яких має хв. = 0 та макс. = 1, а друга хв. = 100 та макс. = 1000. Як би розрізнявся розмах діапазону значень, всі вони будуть переведені в стандартні z-значення однакові за своїм масштабом.

У коефіцієнті Спірмена такої нормалізації немає, тому

ОБОВ'ЯЗКОВИМ УМОВОМ ВИКОРИСТАННЯ КОЕФІЦІЄНТА СПІРМЕНА Є РІВНІСТЬ РОЗМАХУ ДВОХ ЗМІННИХ.

Перед використанням коефіцієнта Спірмена для рядів даних з різним розмахом необхідно обов'язково їх ранжувати. Ранжування призводить до того, що значення цих рядів набувають однакового мінімуму = 1 (мінімальний ранг) і максимум, що дорівнює кількості значень (максимальний, останній ранг = N, тобто максимальній кількості випадків у вибірці).

У яких випадках можна обійтись без ранжування

Це випадки, коли дані мають вихідно рангову шкалу. Наприклад, тест ціннісних орієнтацій Рокіча.

Також, це випадки, коли кількість варіантів значень невелика і у вибірці є фіксовані мінімум і максимум. Наприклад, у семантичному диференціалі мінімум = 1, максимум = 7.

Приклад розрахунку рангового коефіцієнта кореляції Спірмена

Тест ціннісних орієнтацій Рокича провели на двох вибірках Xи Y. Завдання: дізнатися, наскільки близькі ієрархії цінностей даних вибірок (буквально – скільки вони схожі).

Отримане значення r=0,747 перевіряється за таблиці критичних значень. Згідно з таблицею, при N=18, отримане значення достовірно на рівні p<=0,005

Рангові коефіцієнти кореляції за Спірманом та Кендалом

Для змінних, що належать до порядкової шкали або для змінних, що не підкоряються нормальному розподілу, а також для змінних, що належать до інтервальної шкали, замість коефіцієнта Пірсона розраховується рангова кореляція за Спірманом. І тому окремим значенням змінних присвоюються рангові місця, які згодом обробляються з допомогою відповідних формул. Щоб виявити рангову кореляцію, заберіть у діалоговому вікні Bivariate Correlations... (Парні кореляції) позначку для розрахунку кореляції за Пірсоном, встановлену за замовчуванням. Натомість активуйте розрахунок кореляції Спірмана. Це розрахунок дасть такі результати. Коефіцієнти рангової кореляції дуже близькі до відповідних значень коефіцієнтів Пірсона (початкові змінні мають нормальний розподіл).

titkova-matmetody.pdf с. 45

Метод рангової кореляції Спірмена дозволяє визначити тісноту (силу) та напрямок

кореляційного зв'язку між двома ознакамиабо двома профілями (ієрархіями)ознак.

Для підрахунку рангової кореляції необхідно мати два ряди значень,

які можуть бути проранжовані. Такими рядами значень можуть бути:

1) дві ознаки,виміряні в одній і тій же групівипробуваних;

2) дві індивідуальні ієрархії ознак,виявлені у двох піддослідних по тому самому

набору ознак;

3) дві групові ієрархії ознак,

4) індивідуальна та груповаієрархії ознак.

Спочатку показники ранжуються окремо за кожною ознакою.

Як правило, меншим значенням ознаки нараховується менший ранг.

У першому випадку (дві ознаки) ранжуються індивідуальні значення за першим

ознакою, отриманими різними випробуваними, а потім індивідуальними значеннями по другому

ознакою.

Якщо дві ознаки пов'язані позитивно, то випробувані, що мають низькі ранги по

одному з них, будуть мати низькі ранги і по іншому, а випробувані, що мають високі ранги за

одній з ознак, матимуть за іншою ознакою також високі ранги. Для підрахунку rs

необхідно визначити різниці (d)між рангами, отриманими даним випробуваним по обом

ознак. Потім ці показники d певним чином перетворюються і віднімаються з 1.

менше різниці між рангами, тим більше буде rs, тим ближче він буде до +1.

Якщо кореляція відсутня, всі ранги будуть перемішані і між ними не буде

жодної відповідності. Формула складена так, що в цьому випадку rs виявиться близьким до 0.

У разі негативної кореляціїнизьким рангам випробуваних за однією ознакою

будуть відповідати високі ранги за іншою ознакою, і навпаки. Чим більший розбіжність

між рангами випробуваних за двома змінними, тим ближче rs до -1.

У другому випадку (два індивідуальні профілі), ранжуються індивідуальні

значення, отримані кожним з 2-х випробуваних за певним (однаковим для них

обох) набору ознак. Перший ранг отримає ознаку з самим низьким значенням; другий ранг -

ознака з вищим значенням тощо. Очевидно, що всі ознаки повинні бути виміряні в

одних і тих самих одиницях, інакше ранжування неможливе. Наприклад, неможливо

проранжувати показники по опитувальнику Кеттелла (16PF), якщо вони виражені в

"сирих" балах, оскільки з різних факторів діапазони значень різні: від 0 до 13, від 0 до

20 і від 0 до 26. Ми не можемо сказати, який з факторів займатиме перше місце по

виразності, поки не наведемо всі значення до єдиної шкали (найчастіше це шкала стін).

Якщо індивідуальні ієрархії двох піддослідних пов'язані позитивно, ознаки,

мають низькі ранги в одного з них, матимуть низькі ранги і в іншого, і навпаки.

Наприклад, якщо в одного випробуваного фактор Е (домінантність) має найнижчий ранг, то й у

іншого випробуваного він повинен мати низький ранг, якщо в одного випробуваного фактор С

(емоційна стійкість) має вищий ранг, те й інший випробуваний повинен мати по

цьому чиннику високий ранг тощо.

У третьому випадку (два групових профілю), ранжуються середньогрупові значення,

отримані в 2-х групах випробуваних за певним, однаковим для двох груп, набором

ознак. Надалі лінія міркувань така сама, як і в попередніх двох випадках.

У випадку 4-му (індивідуальний та груповий профілі), ранжуються окремо

індивідуальні значення випробуваного та середньогрупові значення за тим же набором

ознак, які отримані, як правило, при виключенні цього окремого випробуваного – він

не бере участі в середньогруповому профілі, з яким зіставлятиметься його індивідуальний

профіль. Рангова кореляція дозволить перевірити, наскільки узгоджені індивідуальні та

груповий профілі.

У всіх чотирьох випадках значимість отриманого коефіцієнта кореляції визначається

за кількістю ранжованих значень N.У першому випадку ця кількість співпадатиме з

обсягом вибірки n. У другому випадку кількістю спостережень буде кількість ознак,

складових ієрархію. У третьому та четвертому випадку N – це також кількість зіставних

ознак, а чи не кількість випробуваних у групах. Детальні пояснення наведено в прикладах. Якщо

абсолютна величина rs досягає критичного значення або перевищує його, кореляція

достовірна.

Гіпотези.

Можливі два варіанти гіпотез. Перший відноситься до випадку 1, другий - до трьох інших

Перший варіант гіпотез

H0: Кореляція між змінними А та Б не відрізняється від нуля.

H2: Кореляція між змінними А та Б достовірно відрізняється від нуля.

Другий варіант гіпотез

H0: Кореляція між ієрархіями А та Б не відрізняється від нуля.

H2: Кореляція між ієрархіями А та Б достовірно відрізняється від нуля.

Обмеження коефіцієнта рангової кореляції

1. По кожній змінній має бути представлено не менше 5 спостережень. Верхня

межа вибірки визначається наявними таблицями критичних значень .

2. Коефіцієнт рангової кореляції Спірмена rs за великої кількості однакових

рангів по одній або обох змінним, що зіставляється, дає огрублені значення. В ідеалі

обидва корелювані ряди повинні являти собою дві послідовності несхожих

значень. У разі, якщо цієї умови не дотримується, необхідно вносити поправку на

однакові ранги.

Коефіцієнт рангової кореляції Спірмена підраховується за такою формулою:

Якщо в обох зіставних рангових рядах присутні групи однакових рангів,

перед підрахунком коефіцієнта рангової кореляції необхідно внести поправки на однакові

ранги Та і Тв:

Та = Σ (а3 - а) / 12,

Тв = Σ (в3 - в) / 12,

де а –обсяг кожної групи однакових рангів у ранговому ряду А, обсяг кожної

групи однакових рангів у ранговому ряду Ст.

Для підрахунку емпіричного значення rs використовують формулу:

38. Точково-бісеріальний коефіцієнт кореляції.

Про кореляцію взагалі див. питання № 36с. 56 (64) 063.JPG

harchenko-korranaliz.pdf

Нехай змінна X виміряна у сильній шкалі, а змінна Y – у дихотомічній. Точковий бісеріальний коефіцієнт кореляції rpb обчислюється за такою формулою:

Тут x 1 - Середнє значення по Х об'єктів зі значенням «одиниця» по Y;

x 0 – середнє значення Х об'єктів зі значенням «нуль» по Y;

s х - Середнє квадратичне відхилення всіх значень по Х;

n 1 – число об'єктів «одиниця» за Y, n 0 – число об'єктів «нуль» за Y;

n = n 1 + n 0 – обсяг вибірки.

Точковий бісеріальний коефіцієнт кореляції можна розрахувати також за допомогою інших еквівалентних виразів:

Тут x– загальне середнє значення змінної Х.

Точковий бісеріальний коефіцієнт кореляції rpbзмінюється не більше –1 до +1. Його значення дорівнює нулю в тому випадку, якщо змінні з одиницею по Yмають середнє по Y, що дорівнює середньому змінних з нулем по Y.

Перевірка гіпотези про значимістьточкового бісеріального коефіцієнта кореляції полягає у перевірці нульової гіпотезиh 0 про рівність генерального коефіцієнта кореляції нулю: ρ = 0, що здійснюється за допомогою критерію Стьюдента. Емпіричне значення

порівнюється з критичними значеннями t a (df) для числа ступенів свободи df = n– 2

Якщо виконується умова | t| ≤ (df), нульова гіпотеза ρ = 0 не відкидається. Точковий бісеріальний коефіцієнт кореляції істотно відрізняється від нуля, якщо емпіричне значення | t| потрапляє у критичну область, тобто якщо виконується умова | t| > (n- 2). Достовірність зв'язку, розрахованого за допомогою точкового бісеріального коефіцієнта кореляції rpb, можна визначити також за допомогою критерію χ 2 для числа ступенів свободи df= 2.

Точково-бісеріальна кореляція

Наступна модифікація коефіцієнта кореляції твору моментів отримала відображення у точково бісеріальному r. Ця стаття. показує зв'язок між двома змінними, одна з яких брало імовірно безперервна і нормально розподілена, а ін. яв-ся дискретної в точному сенсі слова. Точково-бісеріальний коефіцієнт кореляції позначається через r pbisОскільки в r pbisдихотомія відбиває справжню природу дискретної змінної, а чи не яв-ся штучної, як у разі r bisйого знак визначається довільно. Тому всім практ. цілей r pbisрозглядається у діапазоні від 0,00 до +1,00.

Існує і такий випадок, коли дві змінні вважаються безперервними та нормально розподіленими, але обидві штучно дихотомізовані, як у разі бісеріальної кореляції. Для оцінки зв'язку між такими змінними застосовується тетрахоричний коефіцієнт кореляції r tet, який був також виведений Пірсоном. основ. (точні) формули та процедури для обчислення r tetдосить складні. Тому за практ. застосування цього методу використовуються наближення r tet, одержувані з урахуванням скорочених процедур і таблиць.

/on-line/dictionary/dictionary.php?term=511

ТОЧКОВО-БІСЕРІАЛЬНИЙ КОЕФІЦІЄНТ КОРРЕЛЯЦІЇ- це коефіцієнт кореляції між двома змінними, одна з яких виміряна у дихотомічній шкалі, а інша – в інтервальній шкалі. Застосовується в класичній та сучасній тестології як показник якості тестового завдання- надійності-узгодженості із загальним балом за тестом.

Для корелювання змінних, виміряних у дихотомічної та інтервальної шкаливикористовують точково-бісеріальний коефіцієнт кореляції.
Точково-бісеріальний коефіцієнт кореляції - це метод кореляційного аналізу відношення змінних, одна з яких виміряна в шкалі найменувань і приймає лише 2 значення (наприклад, чоловіка/жінки, відповідь вірна/відповідь невірна, ознака є/ознака немає), а друга у шкалі відносин або інтервальної шкали. Формула розрахунку коефіцієнта точково-бісеріальної кореляції:

Де:
m1 і m0 - середні значення Х зі значенням 1 або 0 Y.
σx – стандартне відхилення всіх значень по Х
n1, n0 – кількість значень Х з 1 або 0 Y.
n – Загальна кількістьпар значень

Найчастіше даний видкоефіцієнта кореляції застосовується до розрахунку зв'язку пунктів тесту з сумарною шкалою. Це один із видів перевірки валідності.

39. Рангово-бісеріальний коефіцієнт кореляції.

Про кореляцію взагалі див. питання № 36с. 56 (64) 063.JPG

harchenko-korranaliz.pdf с. 28

Рангово-бісеріальний коефіцієнт кореляції, що використовується у випадках, коли одна із змінних ( Х) представлена ​​в порядковій шкалі, а інша ( Y) – у дихотомічній, обчислюється за формулою

.

Тут – середній ранг об'єктів, що мають одиницю по Y; - Середній ранг об'єктів з нулем по Y, n- Обсяг вибірки.

Перевірка гіпотези про значимістьрангово-бісеріального коефіцієнта кореляції здійснюється аналогічно точковому бісеріальному коефіцієнту кореляції за допомогою критерію Стьюдента із заміною у формулах rpbна rrb.

У тих випадках, коли одна змінна вимірюється у дихотомічній шкалі (змінна X),а інша в ранговій шкалі (змінна У), використовується рангово-бісеріальний коефіцієнт кореляції. Ми пам'ятаємо, що змінна X,виміряна в дихотомічній шкалі, приймає лише два значення (коду) 0 і 1. Особливо підкреслимо: незважаючи на те, що цей коефіцієнт змінюється в діапазоні від -1 до +1, його знак для інтерпретації результатів не має значення. Це ще один виняток із загального правила.

Розрахунок цього коефіцієнта провадиться за формулою:

де ` X 1середній ранг за тими елементами змінної Y, яким відповідає код (ознака) 1 у змінній Х;

`X 0– середній ранг за тими елементами змінної Y,яким відповідає код (ознака) 0 у змінній Х\

N –загальна кількість елементів у змінній X.

Для застосування рангово-бісеріального коефіцієнта кореляції необхідно дотримуватись наступних умов:

1. Змінні змінні повинні бути виміряні в різних шкалах: одна X –у дихотомічній шкалі; інша Y-у ранговій шкалі.

2. Число варіюючих ознак у порівнюваних змінних Xі Yмає бути однаковим.

3. Для оцінки рівня достовірності рангово-бісеріального коефіцієнта кореляції слід користуватися формулою (11.9) та таблицею критичних значень для критерію Стьюдентапрі k = n - 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

Випадки, коли одна із змінних представлена ​​в дихотомічній шкалі, а інша в ранговий (порядковий), Вимагають застосування коефіцієнта рангово-бісеріальної кореляції:

rpb = 2 / n * (m1 - m0)

де:
n – кількість об'єктів виміру
m1 та m0 - середній ранг об'єктів з 1 або 0 по другій змінній.
Цей коефіцієнт також застосовується під час перевірки валідності тестів.

40. Коефіцієнт лінійної кореляції.

Про кореляцію взагалі (і зокрема про лінійну саме) див. питання № 36с. 56 (64) 063.JPG

КОЕФІЦІЄНТ КОРРЕЛЯЦІЇ г-ПІРСОНА

r-Пірсона (Pearson r) застосовується для вивчення взаємозв'язку двох метрич-ких змінних, виміряних на одній і тій же вибірці.Існує безліч ситуацій, у яких доречне його застосування. Чи впливає інтелект на успішність на старших курсах університету? Чи пов'язаний розмір заробітної плати працівника з його доброзичливістю до колег? Чи впливає настрій школяра на успішність розв'язання складного арифметичного завдання? Для відповіді на подібні питання дослідник повинен виміряти два цікаві для його показника у кожного члена вибірки. Дані вивчення взаємозв'язку потім зводяться в таблицю, як у наведеному нижче прикладі.

ПРИКЛАД 6.1

У таблиці наведено приклад вихідних даних вимірювання двох показників інтелекту (вербального та невербального) у 20 учнів 8-го класу.

Зв'язок між цими змінними можна зобразити за допомогою діаграми розсіювання (див. рис. 6.3). Діаграма показує, що існує деякий взаємозв'язок виміряних показників: чим більше значення вербального інтелекту, тим (переважно) більше значення невербального інтелекту.

Перш ніж дати формулу коефіцієнта кореляції, спробуємо простежити логіку її виникнення, використовуючи дані прикладу 6.1. Положення кожної /-точки (випробуваного з номером /) на діаграмі розсіювання щодо інших точок (рис. 6.3) може бути задано величинами і знаками відхилень відповідних значень змінних від своїх середніх величин: (xj - MJ і (у, -М у ). Якщо знаки цих відхилень збігаються, це свідчить на користь позитивного взаємозв'язку (великим значенням по хвідповідають великі значення по уабо меншим значенням по хвідповідають менші значення по у).

Для випробуваного № 1 відхилення від середнього по хі по упозитивне, а випробуваного № 3 і те й інше відхилення негативні. Отже, дані того й іншого свідчать про позитивний взаємозв'язок досліджуваних ознак. Навпаки, якщо знаки відхилень від середніх по хі по урізняться, це свідчить про негативної взаємозв'язку між ознаками. Так, для випробуваного № 4 відхилення від середнього по хє негативним, за у -позитивним, а для випробуваного №9 – навпаки.

Таким чином, якщо добуток відхилень (х,- М х ) х (у, - М у ) позитивне, то дані /-випробуваного свідчать про прямий (позитивний) взаємозв'язок, а якщо негативне - то про зворотний (негативний) взаємозв'язок. Відповідно, якщо хwу ъосновному пов'язані прямо пропорційно, більшість творів відхилень буде позитивним, і якщо вони пов'язані зворотним співвідношенням, більшість творів буде негативним. Отже, загальним показником для сили та напрями взаємозв'язку може бути сума всіх творів відхилень для даної вибірки:

При прямо пропорційному зв'язку між змінними ця величина є великою і позитивною - для більшості випробуваних відхилення збігаються за знаком (великим значенням однієї змінної відповідають великі значення інший змінної і навпаки). Якщо ж хі умають зворотний зв'язок, то для більшості випробуваних великим значенням однієї змінної будуть відповідати менші значення іншої змінної, тобто знаки творів будуть негативними, а сума творів в цілому буде теж великий за абсолютною величиною, але негативною за знаком. Якщо систематичного зв'язку між змінними нічого очікувати спостерігатися, то позитивні доданки (твори відхилень) врівноважаться негативними доданками, і сума всіх творів відхилень буде близька до нуля.

Щоб сума творів не залежала від обсягу вибірки, достатньо її усереднити. Але міра взаємозв'язку нас цікавить не як генеральний параметр, бо як його оцінка - статистика. Тому, як і для формули дисперсії, в цьому випадку вчинимо також, ділимо суму творів відхилень не на N, а на TV-1. Виходить міра зв'язку, що широко застосовується у фізиці та технічних науках, яка називається підступністю (Covahance):


У психології, на відміну фізики, більшість змінних вимірюються в довільних шкалах, оскільки психологів цікавить не абсолютне значення ознаки, а взаємне розташуваннявипробуваних у групі. До того ж коваріація дуже чутлива до масштабу шкали (дисперсії), де виміряно ознаки. Щоб зробити міру зв'язку незалежною від одиниць виміру того й іншого ознаки, досить розділити коваріацію на відповідні стандартні відхилення. Таким чином і було отримано фор-мула коефіцієнта кореляції К. Пірсона:

або, після підстановки виразів для х і


Якщо значення тієї та іншої змінної були перетворені на г-значення за формулою


то формула коефіцієнта кореляції r-Пірсона виглядає простіше (071.JPG):

/dict/sociology/article/soc/soc-0525.htm

КОРЕЛЯЦІЯ ЛІНІЙНА- статистичний лінійний зв'язок непричинного характеру між двома кількісними змінними хі у. Вимірюється за допомогою "коефіцієнта К.Л." Пірсона, який є результатом поділу коваріації на стандартні відхилення обох змінних:

,

де s xy- коваріація між змінними хі у;

s x , s y- стандартні відхилення для змінних хі у;

x i , y i- значення змінних хі удля об'єкта з номером i;

x, y- середні арифметичні для змінних хі у.

Коефіцієнт Пірсона rможе набувати значення з інтервалу [-1; +1]. Значення r = 0означає відсутність лінійного зв'язку між змінними хі у(але не виключає статистичного зв'язку нелінійного). Позитивні значення коефіцієнта ( r> 0) свідчать про прямий лінійний зв'язок; що ближче його значення до +1, то сильніший зв'язок статистична пряма. Негативні значення коефіцієнта ( r < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее Зворотній зв'язок. Значення r= ±1 означають наявність повного лінійного зв'язку, прямого або зворотного. У разі повного зв'язку всі точки з координатами ( x i , y i) лежать на прямій y = a + bx.

"Коефіцієнт К.Л." Пірсона застосовується також для вимірювання тісноти зв'язку в моделі регресії лінійної парної.

41. Кореляційна матриця та кореляційний граф.

Про кореляцію взагалі див. питання № 36с. 56 (64) 063.JPG

Кореляційна матриця.Часто кореляційний аналіз включає вивчення зв'язків не двох, а безлічі змінних, виміряних в кількісної шкалі на одній вибірці. У цьому випадку обчислюються кореляції для кожної пари з цієї множини змінних. Обчислення зазвичай проводяться на комп'ютері, а результатом є кореляційна матриця.

Кореляційна матриця(Correlation Matrix) - це результат обчислення кореляцій одного типу для кожної пари з множини Рзмінних, виміряних в кількісній шкалі на одній вибірці.

ПРИКЛАД

Припустимо, вивчаються зв'язки між 5 змінними (vl, v2,..., v5; P= 5), виміряними на вибірці чисельністю N=30людина. Нижче наведена таблиця вихідних даних і кореляційна матриця.

І
подібні дані:

Кореляційна матриця:

Неважко помітити, що кореляційна матриця є квадратною, симетричною відносно головної діагоналі (таккакг, у = /) у), з одиницями на головній діагоналі (бо г і = Гу = 1).

Кореляційна матриця є квадратної:число рядків і стовпців дорівнює кількості змінних. Вона симетричнащодо головної діагоналі, оскільки кореляція хз удорівнює кореляції уз х.На її головній діагоналі розташовуються одиниці, оскільки кореляція ознаки із собою дорівнює одиниці. Отже, аналізу підлягають не всі елементи кореляційної матриці, а ті, які знаходяться вище або нижче головної діагоналі.

Кількість коефіцієнтів кореляції,підлягають аналізу щодо зв'язків Рпризнаків визначається формулою: Р(Р- 1)/2. У наведеному прикладі кількість таких коефіцієнтів кореляції 5(5 - 1)/2 = 10.

Основне завдання аналізу кореляційної матриці -виявлення структури взаємозв'язків безлічі ознак. При цьому можливий візуальний аналіз кореляційних плеяд- графічного зображення структури статистичнозначних зв'язків,якщо таких зв'язків дуже багато (до 10-15). Інший спосіб - застосування багатовимірних методів: множинного регресійного, факторного або кластерного аналізу (див. розділ «Багатомірні методи ...»). Застосовуючи факторний або кластерний аналіз, можна виділити угруповання змінних, які тісніше пов'язані один з одним, ніж з іншими змінними. Дуже ефективним є і поєднання цих методів, наприклад, якщо ознак багато і вони не однорідні.

Порівняння кореляцій -додаткове завдання аналізу кореляційної матриці, що має два варіанти. Якщо необхідно порівняння кореляцій в одному з рядків кореляційної матриці (для однієї зі змінних), застосовується метод порівняння для залежних вибірок (с. 148-149). При порівнянні однойменних кореляцій, обчислених для різних вибірок, застосовується метод порівняння для незалежних вибірок (с. 147-148).

Методи порівняннякореляцій у діагоналяхкореляційної матриці (для оцінки стаціонарності випадкового процесу) та порівняння кількохкореляційних матриць, отриманих для різних вибірок (на предмет їх однорідності), є трудомісткими і виходять за рамки цієї книги. Познайомитись з цими методами можна за книгою Г. В. Суходольського 1 .

Проблема статистичної значимостікореляцій.Проблема полягає в тому, що процедура статистичної перевіркигіпотези передбачає одне-кратневипробування, проведене однією вибірці. Якщо той самий метод застосовується багаторазово,нехай навіть щодо різних змінних, то збільшується ймовірність отримати результат чисто випадково. У випадку, якщо ми повторюємо той самий метод перевірки гіпотези разщодо різних змінних або вибірок, то при встановленій величині а ми гарантовано отримаємо підтвердження гіпотези в ахкчисла випадків.

Припустимо, аналізується кореляційна матриця для 15 змінних, тобто обчислено 15(15-1)/2 = 105 коефіцієнтів кореляції. Для перевірки гіпотез встановлено рівень а = 0,05. Перевіряючи гіпотезу 105 разів, ми п'ять разів (!) отримаємо її підтвердження незалежно від того, чи існує зв'язок насправді. Знаючи це і отримавши, скажімо, 15 «статистично достовірних» коефіцієнтів кореляції, чи зможемо ми сказати, які з них отримані випадково, а які - відбивають реальний зв'язок?

Строго кажучи, для ухвалення статистичного рішеннянеобхідно зменшити рівень а в стільки разів, скільки гіпотез перевіряється. Але навряд чи це доцільно, тому що непередбачуваним чином збільшується ймовірність проігнорувати реально існуючий зв'язок (припуститися помилки II роду).

Одна тільки кореляційна матриця не є достатньою основоюдля статистичних висновків щодо входять до неї окремих коефіцієнтів.цієнтів кореляцій!

Можна вказати лише один дійсно переконливий спосіб вирішення цієї проблеми: розділити вибірку випадковим чином на дві частини і приймати до уваги тільки ті кореляції, які статистично значущі в обох частинах вибірки. Альтернативою може бути використання багатовимірних методів (факторного, кластерного або множинного регресійного аналізу) - для виділення і подальшої інтерпретації груп статистично значимо пов'язаних змінних.

Проблема пропущених значень.Якщо даних є пропущені значення, то можливі два варіанти розрахунку кореляційної матриці: а) посрочное видалення значень (Excludecaseslistwise); б) попарне видалення значень (Excludecasespairwise). При порядковому видаленніспостережень з перепустками видаляється весь рядок для об'єкта (випробуваного), який має хоча б одне пропущене значення за однією зі змінних. Цей спосіб призводить до «правильної» кореляційної матриці в тому сенсі, що всі коефіцієнти обчислені по одному і тому ж безлічі об'єктів. Однак якщо пропущені значення розподілені випадковим чином змінних, то даний методможе призвести до того, що в множині даних, що розглядається, не залишиться жодного об'єкта (у кожному рядку зустрінеться, принаймні, одне пропущене значення). Щоб уникнути подібної ситуації, використовують інший спосіб, який називають попарним видаленням.У цьому способі враховуються лише перепустки в кожній вибраній парі стовпців-змінних і ігноруються перепустки в інших змінних. Кореляція для пари змінних обчислюється за тими об'єктами, де немає перепусток. У багатьох ситуаціях, особливо коли кількість перепусток відносно мала, скажімо 10%, і перепустки розподілені досить хаотично, цей метод не призводить до серйозних помилок. Однак, іноді це не так. Наприклад, у систематичному зміщенні (зрушенні) оцінки може «ховатися» систематичне розташування перепусток, що є причиною відмінності коефіцієнтів кореляції, побудованих за різними підмножинами (наприклад - для різних підгруп об'єктів). Інша проблема, пов'язана з кореляційною матрицею, обчисленою при попарномувидалення перепусток, виникає при використанні цієї матриці в інших видах аналізу (наприклад, у множинному регресійному або факторному аналізі). У них передбачається, що використовується «правильна» кореляційна матриця з певним рівнем спроможності та «відповідності» різних коефіцієнтів. Використання матриці з «поганими» (зміщеними) оцінками призводить до того, що програма або не в змозі аналізувати таку матрицю, або результати будуть помилковими. Тому, якщо застосовується попарний метод виключення пропущених даних, необхідно перевірити, чи є чи ні систематичні закономірності у розподілі перепусток.

Якщо попарне виключення пропущених даних не призводить до будь-якого систематичного зсуву середніх значень та дисперсій (стандартних відхилень), то ці статистики будуть схожі на аналогічні показники, обчислені при строковому способі видалення перепусток. Якщо спостерігається значну відмінність, тобто підставу припускати наявність зсуву в оцінках. Наприклад, якщо середнє (або стандартне відхилення) значень змінної А,яке використовувалося при обчисленні її кореляції зі змінною В,набагато менше середнього (або стандартного відхилення) тих же значень змінної А,які використовувалися при обчисленні її кореляції з пе-ременной С, то є всі підстави очікувати, що ці дві кореляції (А-ВнА-С)засновані на різних підмножинах даних. У кореляціях буде зрушення, викликане невипадковим розташуванням перепусток у значеннях змінних.

Аналіз кореляційних плеяд.Після вирішення проблеми статистичної значимості елементів кореляційної матриці статистично значущі кореляції можна представити графічно у вигляді кореляційної плеяди або плеяд. Кореляційна плеядаце фігура, що складається з вершин і ліній, що їх з'єднують. Вершини відповідають ознакам і позначаються зазвичай цифрами - номерами змінних. Лінії відповідають статистично достовірним зв'язкам і графічно виражають знак, інколи ж - і /j-рівень значущості зв'язку.

Кореляційна плеяда може відображати Усестатистично значні зв'язкикореляційної матриці (іноді називається кореляційним графом ) або тільки їх змістовно виділену частину (наприклад, відповідну одному фактору за результатами факторного аналізу).

ПРИКЛАД ПОБУДУВАННЯ КОРРЕЛЯЦІЙНОЇ ПЛЕЯДИ


Підготовка до проведення державної (підсумкової) атестації випускників: формування бази ЄДІ (загальний список учасників ЄДІ всіх категорій із зазначенням предметів) – з урахуванням резервних днів у разі збігу предметів;

  • План роботи (27)

    Рішення

    2. Діяльність ОУ з удосконалення змісту та оцінки якості з предметів природничо-математичної освіти МОУ ЗОШ № 4, Литвинівська, Чапаєвська,

  • Рангова кореляція Спірмена(Кореляція рангів). Рангова кореляція Спірмена – найпростіший спосіб визначення ступеня зв'язку між факторами. Назва методу свідчить у тому, що зв'язок визначають між рангами, тобто рядами отриманих кількісних значень, ранжированих порядку спадання чи зростання. Треба мати на увазі, що, по-перше, рангове кореляцію Не рекомендується проводити, якщо зв'язок пар менше чотирьох і більше двадцяти; по-друге, рангова кореляція дозволяє визначати зв'язок і в іншому випадку, якщо значення мають напівкількісний характер, тобто не мають числового виразу, що відображають чіткий порядок дотримання цих величин; по-третє, рангову кореляцію доцільно застосовувати у тих випадках, коли достатньо отримати приблизні дані. Приклад розрахунку коефіцієнта рангової кореляції для визначення питання: заміряють питання X і Y подібні особистісні якостівипробуваних. За допомогою двох запитань (X та Y), які вимагають альтернативних відповідей "так" чи "ні", отримали первинні результати - відповіді 15 піддослідних (N = 10). Результати подали у вигляді суми ствердних відповідей окремо для опитувальника X та для опитувальника В. Ці результати зведені в табл. 5.19.

    Таблиця 5.19. Табулювання первинних результатів для розрахунку коефіцієнта рангової кореляції за Спірменом (р) *

    Аналіз зведеної кореляційної матриці. Метод кореляційних плеяд.

    приклад. У табл. 6.18 наведено інтерпретації одинадцяти змінних, що тестуються за методикою Векслера. Дані одержали на однорідній вибірці віком від 18 до 25 років (n = 800).

    Перед розшаровуванням кореляційну матрицю доцільно ранжувати. Для цього у вихідній матриці обчислюють середні значення коефіцієнтів кореляції кожної змінної з усіма іншими.

    Потім табл. 5.20 визначають допустимі рівні розшарування кореляційної матриці при заданих довірчої ймовірності 0,95 і n - кількості

    Таблиця 6.20. Східна кореляційна матриця

    Змінні 1 2 3 4 б 0 7 8 0 10 11 M (rij) Ранг
    1 1 0,637 0,488 0,623 0,282 0,647 0,371 0,485 0,371 0,365 0,336 0,454 1
    2 1 0,810 0,557 0,291 0,508 0,173 0,486 0,371 0,273 0,273 0,363 4
    3 1 0,346 0,291 0,406 0,360 0,818 0,346 0,291 0,282 0,336 7
    4 1 0,273 0,572 0,318 0,442 0,310 0,318 0,291 0,414 3
    5 1 0,354 0,254 0,216 0,236 0,207 0,149 0,264 11
    6 1 0,365 0,405 0,336 0,345 0,282 0,430 2
    7 1 0,310 0,388 0,264 0,266 0,310 9
    8 1 0,897 0,363 0,388 0,363 5
    9 1 0,388 0,430 0,846 6
    10 1 0,336 0,310 8
    11 1 0,300 10

    Позначення: 1 – загальна поінформованість; 2 - поняттєвість; 3 – уважність; 4 - вдатність До узагальнення; б - безпосереднє запам'ятовування (на цифрах) 6 - рівень освоєння рідною мовою; 7 - швидкість оволодіння сенсомоторними навичками (кодування символами) 8 - спостережливість; 9 - комбінаторні здібності (до аналізу та синтезу) 10 - здатність до організації елементів в осмислене ціле; 11 – здатність до евристичного синтезу; M (rij) - середнє значення коефіцієнтів кореляції змінної з рештою змінних спостережень (у нашому випадку n = 800): r(0) - значення нульової "Розсікає" площини - мінімальна значуща абсолютна величина коефіцієнта кореляції (n - 120, r(0) = 0,236;n = 40, r(0) = 0,407) | Δr | - допустимий крок розшарування (n = 40, | Δr | = 0,558) - допустима кількістьрівнів розшарування (n = 40, s = 1; n = 120, s = 2); r(1), r(2), ..., r(9) - абсолютне значення січної площини (n = 40, r(1) = 0,965).

    Для n = 800 знаходимо значення гтип і межі гі після чого розшаровує ранжовані кореляційну матрицю, виділяючи кореляційні плеяди всередині шарів, або відокремлюємо частини кореляційної матриці, вимальовуючи об'єднання кореляційних плеяд для вище шарів (рис. 5.5).

    Змістовний аналіз отриманих плеяд виходить за межі математичної статистики. Слід зазначити два формальні показники, які допомагають при змістовній інтерпретації плеяд. Одним суттєвим показником є ​​ступінь вершини, тобто кількість ребер, що примикають до вершини. Змінна з найбільшою кількістю ребер є "ядром" плеяди і її можна розглядати як індикатор інших змінних цієї плеяди. Інший суттєвий показник – щільність зв'язку. Змінна може мати менше зв'язків в одній плеяді, але вже і більше зв'язків в іншій плеяді, проте менш тісних.

    Передбачення та оцінки. Рівняння у = b1x + b0 називається загальним рівняннямпрямий. Воно свідчить про те, що пара точок (x, y), які

    Мал. 5.5. Кореляційні плеяди, одержані розшаруванням матриці

    лежать на деякій прямий, пов'язані так, що для будь-якого значення х величину в знаходиться в ньому в парі, можна знайти, помноживши х на деяке число b1 додавши других, число b0 до цього твору.

    p align="justify"> Коефіцієнт регресії дозволяє визначити ступінь зміни слідчого фактора при зміні причинного фактора на одну одиницю. Абсолютні величини характеризують залежність між змінними факторами щодо їх абсолютними значеннями. Коефіцієнт регресії обчислюють за такою формулою:

    Планування та аналіз експериментів. Планування та аналіз експериментів – це третя важлива галузь статистичних методів, розроблених для знаходження та перевірки причинних зв'язків між змінними.

    Для дослідження багатофакторних залежностей Останнім часомдедалі частіше використовують методи математичного планування експерименту.

    Можливість одночасного варіювання всіма факторами дозволяє: а) зменшити кількість дослідів;

    б) звести помилку експерименту до мінімуму;

    в) спростити обробку даних;

    г) забезпечити наочність та легкість у порівнянні результатів.

    Кожен фактор може набувати певної відповідної кількості різних значень, які називаються рівнями і позначають -1, 0 і 1. Фіксований набір рівнів факторів визначає умови одного з можливих дослідів.

    Сукупність всіх можливих поєднань обчислюють за такою формулою:

    Повним факторним експериментом називається експеримент, у якому реалізуються всі можливі поєднання рівнів факторів. Повні факторні експерименти можуть мати властивість ортогональності. При ортогональному плануванні фактори в експерименті є некорельованими, коефіцієнти регресії, що вираховуються в результаті, визначають незалежно один від одного.

    Важливою перевагою методу математичного планування експерименту є його універсальність, придатність у багатьох сферах досліджень.

    Розглянемо приклад порівняння впливу деяких чинників формування рівня психічного напруги в регулювальників кольорових телевізорів.

    В основу експерименту покладено ортогональний План 2 три (три фактори змінюються на двох рівнях).

    Експеримент проводили з повною частиною 2+3 з трикратним повторенням.

    Ортогональне планування виходить з побудові рівняння регресії. Для трьох факторів воно виглядає так:

    Обробка результатів у цьому прикладі включає:

    а) побудова ортогонального плану 2+3 таблиці для розрахунку;

    б) обчислення коефіцієнтів регресії;

    в) перевірку їхньої значущості;

    г) інтерпретацію одержаних даних.

    Для коефіцієнтів регресії згаданого рівняння треба було поставити N = 2 3 = 8 варіантів, щоб мати можливість оцінити значущість коефіцієнтів, де кількість повторень До дорівнювала 3.

    Складена матриця планування експерименту виглядала.

    У випадках, якщо вимірювання досліджуваних ознак проводяться в шкалі порядку, або форма взаємозв'язку відрізняється від лінійної, дослідження взаємозв'язку між двома випадковими величинами здійснюється за допомогою рангових коефіцієнтівкореляції. Розглянемо коефіцієнт рангової кореляції Спірмена. За його обчисленні необхідно ранжувати (упорядкувати) варіанти вибірки. Ранжуванням називається угруповання експериментальних даних у певному порядку, або за зростанням, або за зменшенням.

    Проведення операції ранжирування здійснюється за таким алгоритмом:

    1. Найменшому значенню нараховується менший ранг. Найбільшому значенню нараховується ранг, відповідний кількості значень, що ранжуються. Найменшому значенню нараховується ранг 1. Наприклад, якщо n=7, то найбільше значенняотримає ранг під номером 7, крім випадків, передбачених другим правилом.

    2. Якщо кілька значень рівні, то їм нараховується ранг, що є середнім значенням з тих рангів, які вони отримали б, якби не були рівні. Як приклад розглянемо впорядковану за зростанням вибірку, що складається з 7 елементів: 22, 23, 25, 25, 25, 28, 30. Значення 22 і 23 зустрічаються по одному разу, тому їх ранги відповідно дорівнюють R22=1, а R23=2 . Значення 25 трапляється 3 рази. Якби ці значення не повторювалися, їх ранги були б рівними 3, 4, 5. Тому їх ранг R25 дорівнює середньому арифметичному 3, 4 і 5: . Значення 28 та 30 не повторюються, тому їх ранги відповідно дорівнюють R28=6, а R30=7. Остаточно маємо таку відповідність:

    3. Загальна сумарангів має збігатися з розрахунковою, яка визначається за формулою:

    де n - загальна кількість значень, що ранжуються.

    Розбіжність реальної та розрахункової сумрангів свідчить про помилку, допущену при нарахуванні рангів або їх підсумовування. У цьому випадку необхідно знайти та виправити помилку.

    Коефіцієнт рангової кореляції Спірмена є методом, що дозволяє визначити силу та спрямованість взаємозв'язку між двома ознаками або двома ієрархіями ознак. Застосування коефіцієнта рангової кореляції має низку обмежень:

    • а) Передбачувана кореляційна залежність повинна мати монотонний характер.
    • б) Обсяг кожної з вибірок має бути більшим або дорівнює 5. Для визначення верхнього кордонуВибірки користуються таблицями критичних значень (Таблиця 3 Додатка). Максимальне значення n таблиці - 40.
    • в) Під час проведення аналізу можлива можливість появи великої кількості однакових рангов. У цьому випадку необхідно вносити поправку. Найбільш сприятливим є випадок коли обидві досліджувані вибірки являють собою дві послідовності несупадних значень.

    Для проведення кореляційного аналізу дослідник повинен мати дві вибірки, які можуть бути ранжовані, наприклад:

    • - Дві ознаки, виміряні в одній і тій же групі піддослідних;
    • - дві індивідуальні ієрархії ознак, виявлені у двох піддослідних по одному й тому набору ознак;
    • - Дві групові ієрархії ознак;
    • - індивідуальна та групова ієрархії ознак.

    Розрахунок починаємо з ранжування показників, що вивчаються окремо за кожною з ознак.

    Проведемо аналіз випадку з двома ознаками, виміряними в одній і тій же групі випробуваних. Спочатку ранжують індивідуальні значення за першою ознакою, отримані різними випробуваними, а потім індивідуальні значення за другою ознакою. Якщо меншим рангам одного показника відповідають менші ранги іншого показника, а більшим рангам одного показника відповідають більші ранги іншого показника, дві ознаки пов'язані позитивно. Якщо ж більшим рангам одного показника відповідають менші ранги іншого показника, дві ознаки пов'язані негативно. Для знаходження rs визначаємо різниці між рангами (d) по кожному випробуваному. Що менше різниці між рангами, то ближче коефіцієнт рангової кореляції rs буде до «+1». Якщо взаємозв'язок відсутня, то між ними не буде жодної відповідності, отже, rs виявиться близьким до нуля. Чим більше різниці між рангами випробуваних за двома змінними, тим ближче до «-1» буде значення коефіцієнта rs. Таким чином, коефіцієнт рангової кореляції Спірмена є мірою будь-якої монотонної залежності між двома ознаками, що досліджуються.

    Розглянемо випадок з двома індивідуальними ієрархіями ознак, виявленими у двох піддослідних по одному й тому набору ознак. У цій ситуації ранжують індивідуальні значення, отримані кожним із двох випробуваних за певною сукупністю ознак. Ознаку з найнижчим значенням необхідно надати перший ранг; ознакою з вищим значенням - другий ранг тощо. Слід звернути особливу увагуна те, щоб усі ознаки були виміряні в одних і тих самих одиницях. Наприклад, неможливо ранжувати показники, якщо вони виражені в різних за «ціною» балах, оскільки неможливо визначити, який із факторів займатиме перше місце за виразністю, доки всі значення не будуть приведені до єдиної шкали. Якщо ознаки, мають низькі ранги в однієї з піддослідних як і мають низькі ранги в іншого, і навпаки, то індивідуальні ієрархії пов'язані позитивно.

    У випадку з двома груповими ієрархіями ознак ранжують середньо-групові значення, отримані в двох групах випробуваних за однаковим для досліджуваних груп, набору ознак. Далі слід дотримуватись алгоритму, наведеного у попередніх випадках.

    Проведемо аналіз випадку з індивідуальною та груповою ієрархією ознак. Починають з того, що ранжують окремо індивідуальні значення випробуваного та середньо-групові значення за тим же набором ознак, які отримані, за винятком того випробуваного, який не бере участі в середньо-груповій ієрархії, оскільки з нею буде зіставлятися його індивідуальна ієрархія. Рангова кореляція дозволяє оцінити ступінь узгодженості індивідуальної та групової ієрархії ознак.

    Розглянемо, як визначається значимість коефіцієнта кореляції у випадках. У разі двох ознак вона визначатиметься обсягом вибірки. Що стосується двома індивідуальними ієрархіями ознак значимість залежить кількості ознак, які входять у ієрархію. У двох останніх випадках значимість обумовлюється числом ознак, що вивчаються, а не чисельністю груп. Таким чином, значимість rs у всіх випадках визначається числом ранжованих значень n.

    При перевірці статистичної значущості rs користуються таблицями критичних значень коефіцієнта рангової кореляції, складених для різних кількостей ранжованих значень різних рівнівзначимості. Якщо абсолютна величина rs досягає критичного значення або перевищує його, то кореляція достовірна.

    При розгляді першого варіанта (випадок із двома ознаками, виміряними в одній і тій же групі піддослідних) можливі наступні гіпотези.

    Н0: Кореляція між змінними x та y не відрізняється від нуля.

    Н1: Кореляція між змінними x та y достовірно відрізняється від нуля.

    Якщо ми працюємо з будь-яким із трьох випадків, то необхідно висунути іншу пару гіпотез:

    Н0: Кореляція між ієрархіями x та y не відрізняється від нуля.

    Н1: Кореляція між ієрархіями x та y достовірно відрізняється від нуля.

    Послідовність дій під час обчислення коефіцієнта рангової кореляції Спірмена rs така.

    • - Визначити, які дві ознаки або дві ієрархії ознак братимуть участь у зіставленні як змінні x та y.
    • - Ранжувати значення змінної x, нараховуючи ранг 1 найменшому значенню, відповідно до правил ранжування. Помістити ранги у першу колонку таблиці по порядку номерів випробуваних чи ознак.
    • - Ранжувати значення змінної y. Помістити ранги у другу колонку таблиці за порядком номерів випробуваних чи ознак.
    • - Обчислити різниці d між рангами x та y по кожному рядку таблиці. Результати помістити до наступної колонки таблиці.
    • - Обчислити квадрати різниць (d2). Отримані значення помістити до четвертої колонки таблиці.
    • – Обчислити суму квадратів різниць? d2.
    • - при виникненні однакових рангів обчислити поправки:

    де tx – обсяг кожної групи однакових рангів у вибірці x;

    ty - обсяг кожної групи однакових рангів у вибірці y.

    Обчислити коефіцієнт рангової кореляції залежно від наявності чи відсутності однакових рангів. За відсутності однакових рангів коефіцієнт рангової кореляції rs розрахувати за такою формулою:

    За наявності однакових рангів коефіцієнт рангової кореляції rs розрахувати за такою формулою:

    де? d2 – сума квадратів різниць між рангами;

    Tx і Ty – поправки на однакові ранги;

    n - кількість випробуваних чи ознак, що брали участь у ранжируванні.

    Визначити за таблицею 3 Додатки критичні значення rs для даної кількості піддослідних n. Достовірна відмінність від нуля коефіцієнта кореляції спостерігатиметься за умови, якщо rs не менше критичного значення.



    Нове на сайті

    >

    Найпопулярніше