Додому Протезування та імплантація Однофакторний дисперсійний аналіз. Факторний та дисперсійний аналіз в Excel з автоматизацією підрахунків

Однофакторний дисперсійний аналіз. Факторний та дисперсійний аналіз в Excel з автоматизацією підрахунків

Завдання. Студентів 1-го курсу опитували з метою виявлення занять, яким вони присвячують своє вільний час. Перевірте, чи різняться розподіл вербальних та невербальних переваг студентів.

Рішенняпроводимо з використанням калькулятора.
Знаходимо групові середні:

NП 1П 2
1 12 17
2 18 19
3 23 25
4 10 7
5 15 17
x ср 15.6 17

Позначимо р - кількість рівнів фактора (р = 2). Число вимірів кожному рівні однаково і дорівнює q=5.
В останньому рядку розміщені групові середні для кожного рівня фактора.
Загальну середню можна отримати як середнє арифметичне групових середніх:
(1)
На розкид групових середніх процентів відмови щодо загальної середньої впливають як зміни рівня аналізованого фактора, так і випадкові фактори.
Щоб врахувати вплив даного фактора, загальна вибіркова дисперсія розбивається на дві частини, перша з яких називається факторною S 2 ф, а друга - залишкової S 2 зуп.
З метою обліку цих складових спочатку розраховується Загальна сумаквадратів відхилень варіант від загальної середньої:

та факторна сума квадратів відхилень групових середніх від загальної середньої, яка і характеризує вплив даного фактора:

Останній вираз отримано шляхом заміни кожної варіанти у виразі R загальної групової середньої для даного фактора.
Залишкова сума квадратів відхилень виходить як різниця:
R ост = R заг - R ф
Для визначення загальної вибіркової дисперсії необхідно R заг розділити на число вимірювань pq:

а для отримання незміщеної загальної вибіркової дисперсії цей вираз потрібно помножити на pq/(pq-1):

Відповідно, для незміщеної факторної вибіркової дисперсії:

де p-1 – число ступенів свободи незміщеної факторної вибіркової дисперсії.
З метою оцінки впливу фактора на зміни параметра, що розглядається, розраховується величина:

Так як відношення двох вибіркових дисперсій S 2 ф і S 2 ост розподілено за законом Фішера-Снедекору, отримане значення f набл порівнюють зі значенням функції розподілу

у критичній точці f кр, що відповідає обраному рівню значимості a.
Якщо f набл >f кр, то чинник істотно впливає і його слід враховувати, інакше він має незначний вплив, яким можна знехтувати.
Для розрахунку R набл і R ф можуть бути використані формули:
(4)
(5)
Знаходимо загальну середню за формулою (1):
Для розрахунку Rзаг за формулою (4) складаємо таблицю 2 квадратів варіант:
NП 2 1П 2 2
1 144 289
2 324 361
3 529 625
4 100 49
5 225 289
1322 1613

Загальна середня обчислюється за формулою (1):

R заг = 1322 + 1613 - 5 2 16.3 2 = 278.1
Знаходимо R ф за формулою (5):
R ф = 5 (15.6 2 + 17 2) - 2 16.3 2 = 4.9
Отримуємо R ост: R ост = R заг - R ф = 278.1 - 4.9 = 273.2
Визначаємо факторну та залишкову дисперсії:


Якщо середні значення випадкової величини, обчислені за окремими вибірками однакові, то оцінки факторної та залишкової дисперсій є незміщеними оцінками генеральної дисперсіїі різняться несуттєво.
Тоді зіставлення оцінок цих дисперсій за критерієм Фішера має показати, що нульову гіпотезу про рівність факторної та залишкової дисперсій відкинути немає підстав.
Оцінка факторної дисперсії менша за оцінку залишкової дисперсії, тому можна відразу стверджувати справедливість нульової гіпотези про рівність математичних очікувань за шарами вибірки.
Інакше висловлюючись, у цьому прикладі чинник Ф надає істотного впливу випадкову величину.
Перевіримо нульову гіпотезу H0: рівність середніх значень х.
Знаходимо f набл

Для рівня значущості α=0.05, чисел ступенів свободи 1 та 8 знаходимо f кр з таблиці розподілу Фішера-Снедекору.
f кр (0.05; 1; 8) = 5.32
У зв'язку з тим, що f набл< f кр, нулевую гипотезу о существенном влиянии фактора на результаты экспериментов отклоняем.
Інакше кажучи, розподіл вербальних і невербальних переваг студентів різняться.

Завдання. На заводі встановлено чотири лінії з випуску облицювальної плитки. З кожної лінії випадково протягом зміни відібрано по 10 плиток і зроблено виміри їх товщини (мм). Відхилення від номінального розміру наведено у таблиці. Потрібно лише на рівні значимості a = 0,05 встановити наявність залежності випуску якісних плиток від лінії випуску (фактор A).

Завдання. На рівні важливості a = 0,05 вивчити вплив кольору фарби на термін служби покриття.

Приклад №1. Зроблено 13 випробувань, з них – 4 на першому рівні фактора, 4 – на другому, 3 – на третьому та 2 на четвертому. Методом дисперсійного аналізу за рівня значущості 0,05 перевірити нульову гіпотезу про рівність групових середніх. Передбачається, що вибірки вилучені із нормальних сукупностей з однаковими дисперсіями. Результати випробувань наведено у таблиці.

Рішення:
Знаходимо групові середні:

NП 1П 2П 3П 4
1 1.38 1.41 1.32 1.31
2 1.38 1.42 1.33 1.33
3 1.42 1.44 1.34 -
4 1.42 1.45 - -
5.6 5.72 3.99 2.64
x ср 1.4 1.43 1.33 1.32

Позначимо р - кількість рівнів фактора (р = 4). Число вимірів на кожному рівні дорівнює: 4,4,3,2
В останньому рядку розміщені групові середні для кожного рівня фактора.
Загальна середня обчислюється за такою формулою:

Для розрахунку Sзаг за формулою (4) складаємо таблицю 2 квадратів варіант:

NП 2 1П 2 2П 2 3П 2 4
1 1.9 1.99 1.74 1.72
2 1.9 2.02 1.77 1.77
3 2.02 2.07 1.8 -
4 2.02 2.1 - -
7.84 8.18 5.31 3.49

Загальну суму квадратів відхилень знаходять за такою формулою:


Знаходимо S ф за формулою:


Отримуємо S ост: S ост = S заг - S ф = 0.0293 - 0.0263 = 0.003
Визначаємо факторну дисперсію:

та залишкову дисперсію:

Якщо середні значення випадкової величини, обчислені за окремими вибірками однакові, оцінки факторної і залишкової дисперсій є незміщеними оцінками генеральної дисперсії і різняться несуттєво.
Тоді зіставлення оцінок цих дисперсій за критерієм Фішера має показати, що нульову гіпотезу про рівність факторної та залишкової дисперсій відкинути немає підстав.
Оцінка факторної дисперсії більша за оцінку залишкової дисперсії, тому можна відразу стверджувати не справедливість нульової гіпотези про рівність математичних очікувань за шарами вибірки.
Інакше висловлюючись, у цьому прикладі чинник Ф істотно впливає на випадкову величину.
Перевіримо нульову гіпотезу H0: рівність середніх значень х.
Знаходимо f набл

Для рівня значущості α=0.05, чисел ступенів свободи 3 і 12 знаходимо f кр таблиці розподілу Фішера-Снедекора.
f кр (0.05; 3; 12) = 3.49
У зв'язку з тим, що f набл > f кр, нульову гіпотезу про суттєвий вплив фактора на результати експериментів приймаємо (нульову гіпотезу про рівність групових середніх відкидаємо). Інакше кажучи, групові середні загалом різняться значимо.

Приклад №2. У школі 5 шостих класів. Психологу ставиться завдання визначити, чи однаковий середній рівень ситуативної тривожності в класах. Для цього було наведено в таблиці. Перевірити рівень значення α=0.05 припущення, що середня ситуативна тривожність у класах не відрізняється.

Приклад №3. Для вивчення величини X проведено 4 випробування кожному з п'яти рівнів чинника F. Результати випробувань наведено у таблиці. З'ясувати, чи суттєво вплив фактора F на величину X. Прийняти α = 0.05. Передбачається, що вибірки вилучені із нормальних сукупностей з однаковими дисперсіями.

Приклад №4. Припустимо, що у педагогічному експерименті брали участь три групи студентів по 10 осіб у кожній. У групах застосували різні методинавчання: у першій - традиційний (F 1), у другій - заснований на комп'ютерних технологіях (F 2), у третій - метод, що широко використовує завдання для самостійної роботи(F 3). Знання оцінювалися за десятибальною системою.
Потрібно опрацювати отримані дані про екзамени і зробити висновок про те, чи важливий вплив методу викладання, взявши за рівень значущості α=0.05.
Результати іспитів задані таблицею, F j - рівень фактора x ij - оцінка i-го учня, який навчається за методикою F j .

Рівень фактора

Приклад №5. Показано результати конкурсного сортовипробування культур (врожайність у ц.с га). Кожен сорт випробовувався на чотирьох ділянках. Методом дисперсійного аналізу вивчіть вплив ґатунку на врожайність. Встановіть суттєвість впливу фактора (частку міжгрупової варіації у загальній варіації) та значущість результатів досвіду при рівні значущості 0,05.
Урожайність на сортовипробувальних ділянках

Сорт Урожайність за повторностями ц. з га
1 2 3 4
1
2
3
42,4
52,5
52,3
37,4
50,1
53,0
40,7
53,8
51,4
38,2
50,7
53,6

Застосування статистики у цій нотатці буде показано на наскрізному прикладі. Припустимо, що ви – керівник виробництва у компанії Perfect Parachute («Ідеальний парашут»). Парашути виготовляються із синтетичних волокон, що постачаються чотирма різними постачальниками. Однією з основних характеристик парашута є його міцність. Вам необхідно переконатися, що всі волокна, що поставляються, мають однакову міцність. Щоб відповісти на це питання, слід розробити схему експерименту, під час якого вимірюється міцність парашутів, зітканих із синтетичних волокон різних постачальників. Інформація, отримана під час експерименту, дозволить визначити, який постачальник забезпечують найбільшу міцність парашутів.

Багато програм пов'язані з експериментами, у яких розглядається кілька груп чи рівнів одного чинника. Деякі фактори, наприклад температура випалу кераміки, можуть мати кілька числових рівнів (тобто 300°, 350°, 400° і 450°). Інші фактори, наприклад, розташування товарів у супермаркеті, можуть мати категоріальні рівні (наприклад, перший постачальник, другий постачальник, третій постачальник, четвертий постачальник). Однофакторні експерименти, в ході яких експериментальні одиниці випадково розподіляються по групах або рівнях фактора, називаються повністю рандомізованими.

ВикористанняF-критерія для оцінки різниць між кількома математичними очікуваннями

Якщо числові вимірювання фактора в групах є безперервними і виконуються деякі додаткові умови, для порівняння математичних очікувань кількох груп застосовується дисперсійний аналіз(ANOVA - An alysis o f Va riance). Дисперсійний аналіз, який використовує повністю рандомізовані плани, називається однофакторною процедурою ANOVA. У певному сенсі термін дисперсійний аналіз є неточним, оскільки у цьому аналізі порівнюються різниці між математичними очікуваннями груп, а чи не між дисперсіями. Проте, порівняння математичних очікувань здійснюється саме на основі аналізу варіації даних. У процедурі ANOVA повна варіація результатів вимірювань поділяється на міжгрупову та внутрішньогрупову (рис. 1). Внутрішньогрупова варіація пояснюється помилкою експерименту, а міжгрупова – ефектами умов експерименту. Символ зпозначає кількість груп.

Мал. 1. Поділ варіації у повністю рандомізованому експерименті

Завантажити нотатку у форматі або , приклади у форматі

Припустимо, що згруп вилучено із незалежних генеральних сукупностей, що мають нормальний розподіл та однакову дисперсію. Нульова гіпотеза полягає в тому, що математичні очікуваннягенеральних сукупностей однакові: Н 0: μ 1 = μ 2 = … = μ с. Альтернативна гіпотеза свідчить, що не всі математичні очікування однакові: Н 1: не всі μ j однакові j= 1, 2, …, с).

На рис. 2 представлена ​​справжня нульова гіпотеза про математичні очікування п'яти порівнюваних груп за умови, що генеральні сукупності мають нормальний розподіл та однакову дисперсію. П'ять генеральних сукупностей, пов'язаних з різними рівнямифактора, ідентичні. Отже, вони накладаються одна на одну, маючи однакові математичне очікування, варіацію та форму.

Мал. 2. П'ять генеральних сукупностей мають однакове математичне очікування: μ 1 = μ 2 = μ 3 = μ 4 = μ 5

З іншого боку, припустимо, що насправді нульова гіпотеза є хибною, причому четвертий рівень має найбільше математичне очікування, перший рівень - трохи менше математичне очікування, а інші рівні - однакові і менші математичні очікування (рис. 3). Зверніть увагу на те, що за винятком величини математичних очікувань всі п'ять генеральних сукупностей ідентичні (тобто мають однакову мінливість та форму).

Мал. 3. Спостерігається ефект умов експерименту: μ 4 > μ 1 > μ 2 = μ 3 = μ 5

При перевірці гіпотези про рівність математичних очікувань кількох генеральних сукупностей повна варіація поділяється на дві частини: міжгрупову варіацію, обумовлену різницею між групами, та внутрішньогрупову, обумовлену різницею між елементами, що належать одній групі. Повна варіація виражається повною сумою квадратів (SST – sum of squares total). Оскільки нульова гіпотеза полягає в тому, що математичні очікування всіх згруп рівні між собою, повна варіація дорівнює сумі квадратів різниць між окремими спостереженнями та загальним середнім (середнє середніх), обчисленим за всіма вибірками. Повна варіація:

де - загальне середнє, X ij - i-e спостереження в j-й групі чи рівні, n j- кількість спостережень у j-ї групи, n - Загальна кількістьспостережень переважають у всіх групах (тобто. n = n 1 + n 2 + … + n c), з- кількість груп, що вивчаються або рівнів.

Міжгрупова варіація, звана зазвичай міжгруповою сумою квадратів (SSA – sum of squares among groups), дорівнює сумі квадратів різниць між вибірковим середнім кожної групи jта загальним середнім , помножених на об'єм відповідної групи n j:

де з- кількість груп, що вивчаються, або рівнів, n j- кількість спостережень у j-ї групи, j- середнє значення j-ї групи, - загальне середнє.

Внутрігрупова варіація, звана зазвичай внутрішньогруповою сумою квадратів (SSW – sum of squares withing groups), дорівнює сумі квадратів різниць між елементами кожної групи і середнім вибірковим цієї групи j:

де Хij - i-й елемент j-ї групи, j- середнє значення j-ї групи.

Оскільки порівняння піддаються зрівнів фактора, міжгрупова сума квадратів має з 1степенів свободи. Кожен з зрівнів має n j – 1 ступенями свободи, тому внутрішньогрупова сума квадратів має n- зступенів свободи, та

Крім того, загальна сума квадратів має n – 1 ступенів свободи, оскільки кожне спостереження Хijпорівнюється із загальним середнім, обчисленим за всіма nспостереженням. Якщо кожну з цих сум поділити на відповідну кількість ступенів свободи, виникнуть три види дисперсії: міжгрупова(mean square among - MSA), внутрішньогрупова(mean square within - MSW) та повна(Mean Square Total - MST):

Незважаючи на те, що основне призначення дисперсійного аналізу - порівняти математичні очікування згруп, щоб виявити ефект умов експерименту, його назва обумовлена ​​тим, що головним інструментом є аналіз дисперсій різного типу. Якщо нульова гіпотеза є істинною, і між математичними очікуваннями згруп немає істотних відмінностей, всі три дисперсії – MSA, MSW та MST – є оцінками дисперсії σ 2, властивої аналізованим даним. Таким чином, щоб перевірити нульову гіпотезу Н 0: μ 1 = μ 2 = … = μ ста альтернативну гіпотезу Н 1: не всі μ j однакові j = 1, 2, …, з), необхідно обчислити статистику F-критерію, що представляє собою відношення двох дисперсій, MSA та MSW. Тестова F-статистика в однофакторному дисперсійному аналізі

Статистика F-Критерія підпорядковується F-розподілу з з 1ступенями свободи у чисельнику MSAі n – зступенями свободи у знаменнику MSW. При заданому рівні значимості нульова гіпотеза відхиляється, якщо обчислена F FU, властивого F-розподілу з з 1 n – зступенями свободи у знаменнику. Таким чином, як показано на рис. 4, вирішальне правилоформулюється так: нульова гіпотеза Н 0відхиляється, якщо F > FU; в іншому випадку вона не відхиляється.

Мал. 4. Критична область дисперсійного аналізу під час перевірки гіпотези Н 0

Якщо нульова гіпотеза Н 0є істинною, обчислена F-статистика близька до 1, оскільки її чисельник і знаменник є оцінками однієї і тієї ж величини - дисперсії 2, властивої аналізованим даним. Якщо нульова гіпотеза Н 0є хибною (і між математичними очікуваннями різних груп існує значна різниця), обчислена F-статистика буде набагато більше одиниці, оскільки її чисельник, MSA, крім природної мінливості даних, оцінює ефект умов експерименту чи різниці між групами, тоді як знаменник MSW оцінює лише природну мінливість даних. Таким чином, процедура ANOVA є F-критерій, у якому при заданому рівні значущості нульова гіпотеза відхиляється, якщо обчислена F-Статистика більше верхнього критичного значення FU, властивого F-розподілу з з 1ступенями свободи в чисельнику та n – зступенями свободи у знаменнику, як показано на рис. 4.

Для ілюстрації однофакторного дисперсійного аналізу повернемося до сценарію, викладеного на початку нотатки. Мета експерименту - визначити, чи мають парашути, зіткані із синтетичного волокна, отриманого від різних постачальників, однакову міцність. У кожній із груп зіткано по п'ять парашутів. Групи розділені за постачальникам-Постачальник 1, Постачальник 2, Постачальник 3 і Постачальник 4. Міцність парашутів вимірюється за допомогою спеціального пристрою, що зазнає тканини на розрив з двох сторін. Сила, потрібна для розриву парашута, вимірюється за особливою шкалою. Чим вища сила розриву, тим міцніше парашут. Excel дозволяє провести аналіз F-Статистики одним кліком. Пройдіть меню ДаніАналіз даних, і виберіть рядок Однофакторний дисперсійний аналіз, заповніть вікно, що відкрилося (рис. 5). Результати експерименту (сила розриву), деякі описові статистики та результати однофакторного дисперсійного аналізу представлені на рис. 6.

Мал. 5. Вікно Однофакторний дисперсійний аналіз Пакету аналізу Excel

Мал. 6. Показники міцності парашутів, зітканих із синтетичних волокон, отриманих від різних постачальників, описові статистики та результати однофакторного дисперсійного аналізу

Аналіз малюнка 6 показує, що між вибірковими середніми спостерігається певна різниця. Середня міцність волокон, отриманих від першого постачальника, дорівнює 19,52, від другого – 24,26, від третього – 22,84 та від четвертого – 21,16. Чи можна назвати цю різницю статистично значущою? Розподіл сили розриву продемонстровано на діаграмі розкиду (рис. 7). На ній ясно помітні різниці як між групами, так і всередині них. Якби обсяг кожної групи був більшим, для їх аналізу можна було б застосувати діаграму «ствол та листя», блокову діаграму або графік нормального розподілу.

Мал. 7. Діаграма розкиду міцності парашутів, зітканих із синтетичних волокон, отриманих від чотирьох постачальників

Нульова гіпотеза стверджує, що серед середніми показниками міцності немає істотних відмінностей: Н 0: μ 1 = μ 2 = μ 3 = μ 4. Альтернативна гіпотеза полягає в тому, що існує принаймні один постачальник, у якого середня міцність волокон відрізняється від інших: Н 1: не всі μ j однакові ( j = 1, 2, …, з).

Загальне середнє (див. рис. 6) = СРЗНАЧ(D12: D15) = 21,945; для визначення також можна усереднити всі 20 вихідних чисел: СРЗНАЧ(A3:D7). Значення дисперсій розраховуються Пакетом аналізуі відображаються у табличці Дисперсійний аналіз(див. рис. 6): SSA = 63,286, SSW = 97,504, SST = 160,790 (див. колонку SSтаблиці Дисперсійний аналізмалюнку 6). Середні значення обчислюються шляхом розподілу цих сум квадратів відповідну кількість ступенів свободи. Оскільки з= 4, а n= 20, отримуємо такі значення ступенів свободи; для SSA: з 1= 3; для SSW: n – c= 16; для SST: n – 1= 19 (див. колонку df). Таким чином: MSA = SSA / ( з 1)= 21,095; MSW = SSW / ( n – c) = 6,094; MST = SST / ( n – 1) = 8,463 (див. колонку MS). F-статистика = MSA / MSW = 3,462 (див. колонку F).

Верхнє критичне значення FU, характерне для F-розподілу, визначається за формулою = F.ОБР (0,95; 3; 16) = 3,239. Параметри функції =F.ОБР(): α = 0,05, чисельник має три ступені свободи, а знаменник - 16. Таким чином, обчислена F-статистика, що дорівнює 3,462, перевищує верхнє критичне значення FU= 3,239, нульова гіпотеза відхиляється (рис. 8).

Мал. 8. Критична область дисперсійного аналізу при рівні значущості, що дорівнює 0,05, якщо чисельник має три ступені свободи, а знаменник -16

р-значення, тобто. ймовірність того, що за істинної нульової гіпотези F-статистика не менше 3,46, дорівнює 0,041 або 4,1% (див. колонку р-Значеннятаблиці Дисперсійний аналізмалюнку 6). Оскільки ця величина вбирається у рівень значимості α = 5%, нульова гіпотеза відхиляється. Більш того, р-значення свідчить у тому, що можливість виявити таку чи велику різницю між математичними очікуваннями генеральних сукупностей за умови, що вони однакові, дорівнює 4,1%.

Отже. Між чотирма середніми вибірковими існує різниця. Нульова гіпотеза полягала у тому, що це математичні очікування чотирьох генеральних сукупностей рівні між собою. У цих умовах міра повної мінливості (тобто повна варіація SST) міцності всіх парашутів обчислюється шляхом підсумовування квадратів різниць між кожним спостереженням X ijта загальним середнім . Потім повна варіація поділялася на два компоненти (див. рис. 1). Перший компонент був міжгруповою варіацією SSA, а другий - внутрішньогрупову SSW.

Чим пояснюється мінливість даних? Інакше кажучи, чому всі спостереження однакові? Одна з причин полягає в тому, що різні фірми постачають волокна різної міцності. Це частково пояснює, чому групи мають різні математичні очікування: чим сильніший ефект умов експерименту, тим більша різниця між математичними очікуваннями груп. Іншою причиною мінливості даних є природна мінливість будь-якого процесу, даному випадку- Виробництва парашутів. Навіть якби всі волокна купувалися в одного і того ж постачальника, їхня міцність була б неоднаковою за інших рівних умов. Оскільки цей ефект проявляється у кожній із груп, він називається внутрішньогруповою варіацією.

Різниці між вибірковими середніми називаються міжгруповою варіацією SSA. Частина внутрішньогрупової варіації, як зазначалося, пояснюється належністю даних різним групам. Однак навіть якби групи були абсолютно однаковими (тобто нульова гіпотеза була б істинною), міжгрупова варіація все одно існувала. Причина цього полягає у природній мінливості процесу виробництва парашутів. Оскільки вибірки різні, їх середні вибіркові відрізняються один від одного. Отже, якщо нульова гіпотеза є істинною, як міжгрупова, так і внутрішньогрупова мінливість є оцінкою мінливості генеральної сукупності. Якщо нульова гіпотеза є хибною, міжгрупова гіпотеза буде більшою. Саме цей факт лежить в основі F-Критерію для порівняння різниць між математичними очікуваннями кількох груп.

Після виконання однофакторного дисперсійного аналізу та виявлення значної різниці між фірмами залишається невідомим, який із постачальників істотно відрізняється від інших. Нам відомо лише, що математичні очікування генеральних сукупностей не рівні. Інакше висловлюючись, по крайнього заходу одне з математичних очікувань суттєво відрізняється від інших. Щоб визначити, який постачальник відрізняється від інших, можна скористатися процедурою Тьюкі, що використовує попарне порівняння між постачальниками Ця процедура була розроблена Джоном Тьюкі. Згодом і К. Крамер незалежно друг від друга модифікували цю процедуру для ситуацій, у яких обсяги вибірок відрізняються друг від друга.

Множинне порівняння: процедура Тьюкі-Крамера

У нашому сценарії для порівняння міцності парашутів використовувався однофакторний дисперсійний аналіз. Виявивши значні різницю між математичними очікуваннями чотирьох груп, необхідно визначити, які саме групи відрізняються друг від друга. Хоча існує кілька способів вирішити це завдання, ми опишемо лише процедуру множинного порівняння Тьюкі-Крамера. Цей метод є прикладом процедур апостеріорного порівняння (post hoc comparison), оскільки гіпотеза, що перевіряється, формулюється після аналізу даних. Процедура Тьюкі-Крамера дозволяє одночасно порівняти всі пари груп. На першому етапі обчислюються різниці Xj - Xj, де j ≠j, між математичними очікуваннями с(с – 1)/2груп. Критичний розмахпроцедури Тьюкі-Крамера обчислюється за такою формулою:

де Q U- верхнє критичне значення розподілу стюдентизованого розмаху, що має зступенів свободи в чисельнику та n - зступенів свободи у знаменнику.

Якщо обсяги вибірок не однакові, критичний розмах обчислюється кожної пари математичних очікувань окремо. На останньому етапі кожна з с(с – 1)/2пар математичних очікувань порівнюється із відповідним критичним розмахом. Елементи пари є значно різними, якщо модуль різниці | X j - Xj| між ними перевищує критичний розмах.

Застосуємо процедуру Тьюкі-Крамера до завдання міцності парашутів. Оскільки компанія, яка виробляє парашути, має чотири постачальники, слід перевірити 4(4 – 1)/2 = 6 пар постачальників (рис. 9).

Мал. 9. Попарні порівняння вибіркових середніх

Оскільки всі групи мають однаковий обсяг (тобто всі n j = n j), достатньо обчислити лише один критичний розмах. Для цього за таблицею Дисперсійний аналіз(Рис. 6) визначимо величину MSW = 6,094. Потім знайдемо величину Q Uпри α = 0,05, з= 4 (число ступенів свободи в чисельнику) та n- з= 20 - 4 = 16 (число ступенів свободи в знаменнику). На жаль, я не знайшов відповідної функції в Excel, тому скористався таблицею (рис. 10).

Мал. 10. Критичне значення стюдентизованого розмаху Q U

Отримуємо:

Оскільки лише 4,74> 4,47 (див. нижню таблицю рис. 9), статистично значуща різниця існує між першим та другим постачальником. Всі інші пари мають вибіркові середні, які не дозволяють говорити про їхню відмінність. Отже, середня міцність парашутів, зітканих з волокон, придбаних у першого постачальника, значно менше, ніж у другого.

Необхідні умови однофакторного дисперсійного аналізу

При вирішенні задачі про міцність парашутів ми не перевіряли, чи виконуються умови, за яких можна використовувати однофакторний F-Критерій. Як дізнатися, чи можна застосовувати однофакторний F-Критерій під час аналізу конкретних експериментальних даних? Однофакторний F-Критерій можна застосовувати тільки якщо виконуються три основні припущення: експериментальні дані повинні бути випадковими і незалежними, мати нормальний розподіл, а їх дисперсії повинні бути однаковими.

Перше припущення - випадковість та незалежність даних- повинно виконуватися завжди, оскільки коректність будь-якого експерименту залежить від випадковості вибору та процесу рандомізації. Щоб уникнути спотворення результатів, необхідно, щоб дані витягувалися з згенеральних сукупностей випадково та незалежно один від одного. Аналогічно дані повинні бути випадковим чином розподіленими за зрівням цікавого для нас фактора (експериментальним групам). Порушення цих умов може серйозно спотворити результати дисперсійного аналізу.

Друге припущення - нормальність- означає, що дані вилучені із нормально розподілених генеральних сукупностей. Як і для t-критерію, однофакторний дисперсійний аналіз на основі F-Критерія відносно мало чутливий до порушення цієї умови. Якщо розподіл не дуже відрізняється від нормального, рівень значущості F-Критерію змінюється мало, особливо якщо обсяг вибірок досить великий. Якщо ж умова нормальності розподілу порушується серйозно, слід застосовувати .

Третє припущення - однорідність дисперсії- означає, що дисперсії кожної генеральної сукупності рівні між собою (тобто σ 1 2 = σ 2 2 = … = σ j 2). Це припущення дозволяє вирішити, розділяти чи поєднувати внутрішньогрупові дисперсії. Якщо обсяги груп збігаються, умова однорідності дисперсії слабко впливає висновки, отримані з допомогою F-Критерія. Однак, якщо обсяги вибірок неоднакові, порушення умови рівності дисперсій може серйозно спотворити результати дисперсійного аналізу. Таким чином, слід прагнути того, щоб обсяги вибірок були однаковими. Одним із методів перевірки припущення про однорідність дисперсії є критерій Левене, описаний нижче.

Якщо з усіх трьох умов порушується лише умова однорідності дисперсії, можна застосовувати процедуру, аналогічну t-критерію, що використовує роздільну дисперсію (докладніше див). Однак, якщо припущення про нормальному розподіліта однорідності дисперсії порушуються одночасно, необхідно виконати нормалізацію даних та зменшити різниці між дисперсіями або застосувати непараметричну процедуру.

Критерій Левене для перевірки однорідності дисперсії

Незважаючи на те що F-Критерій щодо стійкий до порушень умови про рівність дисперсій у групах, грубе порушення цього припущення істотно впливає на рівень значущості та потужність критерію. Можливо, одним із найпотужніших є критерій Левене. Для перевірки рівності дисперсій згенеральних сукупностей перевіримо такі гіпотези:

Н 0: σ 1 2 = σ 2 2 = … = σj 2

Н 1: не всі σ j 2однакові ( j = 1, 2, …, з)

Модифікований критерій Левене заснований на твердженні, що якщо мінливість у групах однакова, для перевірки нульової гіпотези про рівність дисперсій можна застосувати аналіз дисперсії абсолютних величинрізниць між спостереженнями та медіанами груп. Отже, спочатку слід обчислити абсолютні величини різниць між спостереженнями та медіанами у кожній групі, а потім виконати однофакторний дисперсійний аналіз отриманих абсолютних величин різниць. Для ілюстрації критерію Левене повернемося до сценарію, викладеного на початку нотатки. Використовуючи дані, подані на рис. 6, проведемо аналогічний аналіз, але щодо модулів різниць вихідних даних та медіан по кожній вибірці окремо (рис. 11).

Дисперсійний аналіз

1. Поняття дисперсійного аналізу

Дисперсійний аналіз- це аналіз мінливості ознаки під впливом будь-яких контрольованих змінних факторів У зарубіжній літературі дисперсійний аналіз часто позначається як ANOVA, що перекладається як аналіз варіативності (Analysis of Variance).

Завдання дисперсійного аналізуполягає в тому, щоб із загальної варіативності ознаки виокремити варіативність іншого роду:

а) варіативність обумовлену дією кожної із досліджуваних незалежних змінних;

б) варіативність, обумовлену взаємодією досліджуваних незалежних змінних;

в) випадкову варіативність, обумовлену усіма іншими невідомими змінними.

Варіативність, обумовлена ​​дією досліджуваних змінних та його взаємодією, співвідноситься з випадковою варіативністю. Показником цього співвідношення є критерій Фішера F.

До формули розрахунку критерію F входять оцінки дисперсій, тобто параметрів розподілу ознаки, тому критерій F є параметричним критерієм.

Чим більшою мірою варіативність ознаки обумовлена ​​досліджуваними змінними (факторами) або їх взаємодією, тим вище емпіричні значення критерію.

Нульова гіпотеза в дисперсійному аналізі буде говорити, що середні величини досліджуваного результативного ознаки у всіх градаціях однакові.

Альтернативна гіпотеза стверджуватиме, що середні величини результативної ознаки в різних градаціях досліджуваного фактора різні.

Дисперсійний аналіз дозволяє нам констатувати зміну ознаки, але при цьому не вказує напрямокцих змін.

почнемо розгляд дисперсійного аналізу з найпростішого випадку, коли досліджується лише дія однієїзмінної (одного чинника).

2. Однофакторний дисперсійний аналіз для непов'язаних вибірок

2.1. Призначення методу

Метод однофакторного дисперсійного аналізу застосовується в тих випадках, коли досліджуються зміни результативної ознаки під впливом умов, що змінюються або градацій будь-якого фактора. В даному варіанті методу впливу кожної з градацій фактора піддаються різнівибірки піддослідних. Градацій фактора має бути не менше трьох. (Градацій може бути і дві, але в цьому випадку ми не зможемо встановити нелінійних залежностей і розумнішим є використання більш простих).

Непараметричним варіантом цього виду аналізу є критерій Н Крускала-Уолліса.

Гіпотези

H 0: Відмінності між градаціями фактора (різними умовами) не більш вираженими, ніж випадкові відмінності всередині кожної групи.

H 1: Відмінності між градаціями фактора (різними умовами) більш вираженими, ніж випадкові відмінності всередині кожної групи.

2.2. Обмеження методу однофакторного дисперсійного аналізу для непов'язаних вибірок

1. Однофакторний дисперсійний аналіз вимагає не менше трьох градацій фактора і не менше двох випробуваних у кожній градації.

2. Результативна ознака має бути нормально розподілена в досліджуваній вибірці.

Правда, зазвичай не вказується, чи йдеться про розподіл ознаки у всій обстеженій вибірці або в тій її частині, яка складає дисперсійний комплекс.

3. Приклад розв'язання задачі методом однофакторного дисперсійного аналізу для незв'язаних вибірок на прикладі:

Три різні групи із шести піддослідних отримали списки з десяти слів. Першій групі слова пред'являлися з низькою швидкістю -1 слово в 5 секунд, другий групі із середньою швидкістю - 1 слово в 2 секунди, і третій групі з великою швидкістю - 1 слово в секунду. Було передбачено, що показники відтворення залежатимуть від швидкості слів. Результати представлені у Табл. 1.

Кількість відтворених слів Таблиця 1

№ випробуваного

низька швидкість

Середня швидкість

висока швидкість

Загальна сума

H 0: Відмінність обсягу відтворення слів міжгрупами не більш вираженими, ніж випадкові відмінності всерединікожної групи.

H 1: Відмінності обсягом відтворення слів міжгрупами є більш вираженими, ніж випадкові відмінності всерединікожної групи. Використовуючи експериментальні значення, подані в Табл. 1, встановимо деякі величини, які будуть необхідні розрахунку критерію F.

Розрахунок основних величин для однофакторного дисперсійного аналізу подамо в таблиці:

Таблиця 2

Таблиця 3

Послідовність операцій в однофакторному дисперсійному аналізі для непов'язаних вибірок

Часто зустрічається в цій та наступних таблицях позначення SS - скорочення від "суми квадратів" (sum of squares). Це скорочення найчастіше використовується у перекладних джерелах.

SS фактозначає варіативність ознаки, обумовлену дією фактора, що досліджується;

SS заг- загальну варіативність ознаки;

S CA-варіативність, обумовлену неврахованими факторами, "випадкову" або "залишкову" варіативність.

MS- "Середній квадрат", або математичне очікування суми квадратів, усереднена величина відповідних SS.

df - Число ступенів свободи, яке при розгляді непараметричних критеріїв ми позначили грецькою літерою v.

Висновок: H0 відхиляється. Приймається H1. Відмінності обсягом відтворення слів між групами є більш вираженими, ніж випадкові відмінності всередині кожної групи (α=0,05). Отже, швидкість пред'явлення слів впливає обсяг їхнього відтворення.

Приклад вирішення задачі в Excel наведено нижче:

Вихідні дані:

Використовуючи команду: Сервіс->Аналіз даних->Однофакторний дисперсійний аналіз, отримаємо наступні результати:

Однофакторна дисперсійна модельмає вигляд

де Xjj -значення досліджуваної змінної, отриманої на г-му рівніфактора (г = 1, 2,..., т)су-м порядковим номером (j- 1,2,..., д);/у - ефект, обумовлений впливом рівня рівня фактора; е^. - випадкова компонента, чи обурення, викликане впливом неконтрольованих чинників, тобто. варіацією змінної всередині окремого рівня.

Під рівнем факторарозуміється деяка його міра чи стан, наприклад, кількість добрив, що вносяться, вид плавки металу або номер партії деталей і т.п.

Основні причини дисперсійного аналізу.

1. Математичне очікування обурення ? (/ - одно нулю для будь-яких i,тобто.

  • 2. Обурення взаємно незалежні.
  • 3. Дисперсія обурення (або змінної Ху) стала для будь-яких ij>тобто.

4. Обурення е# (або змінна Ху) має нормальний закон розподілу N( 0; а 2).

Вплив рівнів фактора може бути як фіксованим, або систематичним(модель I), так і випадковим(Модель II).

Нехай, наприклад, необхідно з'ясувати, чи є суттєві різницю між партіями виробів за деяким показником якості, тобто. перевірити вплив на якість одного фактора – партії виробів. Якщо включити у дослідження всі партії сировини, вплив рівня такого чинника систематичне (модель I), а отримані висновки застосовні лише до окремих партій, які залучалися щодо; якщо ж включити лише відібрану випадково частину партій, вплив фактора випадкове (модель II). У багатофакторних комплексах можлива змішана модель III, у якій одні чинники мають випадкові рівні, інші - фіксовані.

Розглянемо це завдання докладніше. Нехай є тпартії виробів. З кожної партії відібрано відповідно п Л, п 2 ,п твиробів (для простоти вважаємо, що щ = п 2 =... = п т = п).Значення показника якості цих виробів представимо у вигляді матриці спостережень


Необхідно перевірити суттєвість впливу партій виробів з їхньої якість.

Якщо вважати, що елементи рядків матриці спостережень – це чисельні значення (реалізації) випадкових величин X t , Х 2 ,..., Х т,виражають якість виробів і мають нормальний закон розподілу з математичними очікуваннями відповідно a v а 2 , ..., а ті однаковими дисперсіями а 2 дане завданнязводиться до перевірки нульової гіпотези # 0: a v = a 2l = ... = ат, що здійснюється в дисперсійному аналізі.

Позначимо усереднення за яким-небудь індексом зірочкою (або крапкою) замість індексу, тоді середній показникякості виробів г'-ї партії, або групова середнядля г-го рівня фактора, набуде вигляду

а загальна середня -

Розглянемо суму квадратів відхилень спостережень від загальної середньої x:

або Q = Q, + Q 2+ ?>з Останнє доданок

оскільки сума відхилень значень змінної з його середньої, тобто. ? 1.г у - х) дорівнює нулю. ) =х

Перший доданок можна записати у вигляді

У результаті отримаємо таку тотожність:

т п. _

де Q = Y, X [х ij _ х„, I 2 - загальна,або повна,сума квадратів відхилень; 7 = 1

Q, - n^)

Нове на сайті

>

Найпопулярніше