Додому Протезування та імплантація Як знайти довірчий інтервал прикладу. Довірчий інтервал

Протезування та імплантація

Як знайти довірчий інтервал прикладу. Довірчий інтервал

Довірчий інтервал- граничні значення статистичної величини, яка із заданою довірчою ймовірністю γ буде знаходиться в цьому інтервалі при вибірці більшого обсягу. Позначається як P(θ - ε. На практиці вибирають довірчу ймовірність γ з досить близьких до одиниці значень γ = 0.9, γ = 0.95, γ = 0.99.

Призначення сервісу. За допомогою цього сервісу визначаються:

довірчий інтервал для генерального середнього; довірчий інтервал для дисперсії;
довірчий інтервал для середнього квадратичного відхилення; довірчий інтервал для генеральної частки;

Отримане рішення зберігається у файлі Word (див. приклад). Нижче наведено відеоінструкцію, як заповнювати вихідні дані.

Приклад №1. У колгоспі із загального стада у 1000 голів овець вибірковій контрольній стрижці зазнали 100 овець. В результаті було встановлено середній настриг вовни 4,2 кг на одну вівцю. Визначити з ймовірністю 0,99 середню квадратичну помилку вибірки щодо середнього настригу вовни однією вівцю і межі, у яких укладена величина настрига, якщо дисперсія дорівнює 2,5 . Вибірка неповторна.
Приклад №2. З партії імпортованої продукції посаді Московської Північної митниці було взято як випадкової повторної вибірки 20 проб продукту «А». В результаті перевірки встановлено середню вологість продукту «А» у вибірці, яка дорівнювала 6 % при середньому квадратичному відхиленні 1 %.
Визначте з ймовірністю 0,683 межі середньої вологості продукту в усій партії імпортованої продукції.
Приклад №3. Опитування 36 студентів показало, що середня кількість підручників, прочитаних ними за навчальний рік, виявилося рівним 6. Вважаючи, що кількість підручників, прочитаних студентом за семестр, має нормальний закон розподілу із середнім квадратичним відхиленням, рівним 6, знайти: А) з надійністю 0,99 інтервальну оцінку для математичного очікування цієї випадкової величини; Б) з якою ймовірністю можна стверджувати, що середня кількість підручників, прочитаних студентом за семестр, обчислена за даною вибіркою, відхилиться від математичного очікування абсолютної величини не більше, ніж на 2.

Класифікація довірчих інтервалів

По виду оцінюваного параметра:

За типом вибірки:

Довірчий інтервал для безкінечної вибірки;
Довірчий інтервал для кінцевої вибірки;

Вибірка називається повторноюякщо відібраний об'єкт перед вибором наступного повертається в генеральну сукупність. Вибірка називається безповторноюякщо відібраний об'єкт у генеральну сукупність не повертається. Насправді зазвичай мають справу з безповторними вибірками.

Розрахунок середньої помилки вибірки при випадковому відборі

Розбіжність між значеннями показників, отриманих за вибіркою, та відповідними параметрами генеральної сукупності називається помилкою репрезентативності.
Позначення основних параметрів генеральної та вибіркової сукупності.

Формули середньої помилки вибірки
повторний відбір		безповторний відбір
для середньої	для частки	для середньої	для частки

Співвідношення між межею помилки вибірки (Δ), що гарантується з деякою ймовірністю Р(t),і середньою помилкоювибірки має вигляд: або Δ = t·μ, де t- Коефіцієнт довіри, що визначається залежно від рівня ймовірності Р(t) по таблиці інтегральної функції Лапласа.

Формули розрахунку чисельності вибірки при власне-випадковому способі відбору

У попередніх підрозділах ми розглянули питання щодо оцінки невідомого параметра аодним числом. Така оцінка називається "точковою". У ряді завдань потрібно не тільки знайти параметр авідповідне чисельне значення, але й оцінити його точність та надійність. Потрібно знати, до яких помилок може призвести заміна параметра айого точковою оцінкою аі з яким ступенем впевненості можна очікувати, що ці помилки не вийдуть за певні межі?

Такі завдання особливо актуальні при малій кількості спостережень, коли точкова оцінка а взначною мірою випадкова і наближена заміна а на а може призвести до серйозних помилок.

Щоб дати уявлення про точність та надійність оцінки а,

в математичної статистикикористуються так званими довірчими інтервалами та довірчими ймовірностями.

Нехай для параметра аотримана з досвіду незміщена оцінка а.Ми хочемо оцінити можливу при цьому помилку. Призначимо деяку досить велику ймовірність р (наприклад, р = 0,9, 0,95 або 0,99) таку, що подію з ймовірністю р можна вважати практично достовірною, і знайдемо таке значення s, для якого

Тоді діапазон практично можливих значеньпомилки, що виникає під час заміни ана а, буде ± s; великі по абсолютній величині помилки з'являтимуться лише з малою ймовірністю а = 1 - р. Перепишемо (14.3.1) у вигляді:

Рівність (14.3.2) означає, що з ймовірністю р невідоме значення параметра апотрапляє в інтервал

При цьому слід зазначити одну обставину. Раніше ми неодноразово розглядали можливість потрапляння випадкової величини в заданий невипадковий інтервал. Тут справа інакша: величина ане випадкова, зате випадковий інтервал/р. Випадково його становище на осі абсцис, що визначається його центром а; випадкова взагалі і довжина інтервалу 2s, оскільки величина s обчислюється, як правило, за дослідними даними. Тому в даному випадкукраще буде тлумачити величину р не як ймовірність «попадання» точки ав інтервал/р, а як ймовірність того, що випадковий інтервал/р накриє точку а(Рис. 14.3.1).

Мал. 14.3.1

Імовірність р прийнято називати довірчою ймовірністю, а інтервал / р - довірчим інтервалом.Межі інтервалу If. а х = а- s та а 2 = а +а називаються довірчими межами.

Дамо ще одне тлумачення поняттю довірчого інтервалу: його можна як інтервал значень параметра а,сумісних з досвідченими даними і не суперечать їм. Справді, якщо домовитися вважати подію з ймовірністю а = 1-р практично неможливим, то значення параметра а, котрим а - а> s, слід визнати такими, що суперечать досвідченим даним, а ті, для яких |а - а a t na 2 .

Нехай для параметра ає незміщена оцінка а.Якби нам був відомий закон розподілу величини а, Завдання знаходження довірчого інтервалу була б дуже проста: достатньо було б знайти таке значення s, для якого

Труднощі полягає в тому, що закон розподілу оцінки азалежить від закону розподілу величини Xі, отже, від його невідомих параметрів (зокрема, і від параметра а).

Щоб обійти цю скруту, можна застосувати наступний грубо наближений прийом: замінити у виразі s невідомі параметри їх точковими оцінками. При порівняно великій кількості дослідів п(близько 20...30) цей прийом зазвичай дає задовільні за точністю результати.

Як приклад розглянемо завдання про довірчий інтервал для математичного очікування.

Нехай зроблено п X,характеристики якої - математичне очікування тта дисперсія D- Невідомі. Для цих параметрів отримано оцінки:

Потрібно побудувати довірчий інтервал/р, що відповідає довірчій ймовірності р, для математичного очікування твеличини X.

При вирішенні цього завдання скористаємося тим, що величина тявляє собою суму пнезалежних однаково розподілених випадкових величин X hі відповідно до центральної граничної теореми за досить великого пїї закон розподілу близький до нормального. Насправді навіть за відносно невеликій кількості доданків (близько 10...20) закон розподілу суми можна приблизно вважати нормальним. Виходитимемо з того, що величина трозподілено за нормальним законом. Характеристики цього закону – математичне очікування та дисперсія – рівні відповідно ті

(Див. розділ 13 підрозділ 13.3). Припустимо, що величина Dнам відома і знайдемо таку величину Єр, для якої

Застосовуючи формулу (6.3.5) глави 6, виразимо ймовірність у лівій частині (14.3.5) через нормальну функцію розподілу

де - середнє квадратичне відхилення оцінки т.

З рівняння

знаходимо значення Sp:

де arg Ф * (х) - функція, зворотна Ф * (х),тобто. таке значення аргументу, за якого нормальна функціярозподілу дорівнює х.

Дисперсія D,через яку виражена величина а 1П, нам точно не відома; як її орієнтовне значення можна скористатися оцінкою D(14.3.4) та покласти приблизно:

Таким чином, наближено вирішено завдання побудови довірчого інтервалу, який дорівнює:

де gp визначається формулою (14.3.7).

Щоб уникнути при обчисленні s p зворотного інтерполювання у таблицях функції Ф*(л), зручно скласти спеціальну таблицю (табл. 14.3.1), де наводяться значення величини

залежно від нар. Величина (р визначає для нормального закону число середніх квадратичних відхилень, яке потрібно відкласти праворуч і ліворуч від центру розсіювання для того, щоб ймовірність попадання в отриману ділянку дорівнювала р.).

Через величину 7 р довірчий інтервал виражається у вигляді:

Таблиця 14.3.1

Приклад 1. Проведено 20 дослідів над величиною X;результати наведено у табл. 14.3.2.

Таблиця 14.3.2

Потрібно знайти оцінку для математичного очікування від величини Xта побудувати довірчий інтервал, що відповідає довірчій ймовірності р = 0,8.

Рішення.Маємо:

Вибравши за початок відліку л: = 10, за третьою формулою (14.2.14) знаходимо незміщену оцінку D :

За табл. 14.3,1 знаходимо

Довірчі кордони:

Довірчий інтервал:

Значення параметра т,що лежать у цьому інтервалі, є сумісними з досвідченими даними, наведеними в табл. 14.3.2.

Аналогічним способом може бути побудований довірчий інтервал для дисперсії.

Нехай зроблено пнезалежних дослідів над випадковою величиною Xз невідомими параметрами від Л і для дисперсії Dотримано незміщену оцінку:

Потрібно приблизно побудувати довірчий інтервал для дисперсії.

З формули (14.3.11) видно, що величина Dявляє собою

суму пвипадкових величин виду. Ці величини не є

незалежними, тому що до кожної з них входить величина т,залежить від решти. Однак, можна показати, що при збільшенні пзакон розподілу їхньої суми теж наближається до нормального. Практично при п= 20...30 він може вважатися нормальним.

Припустимо, що це так, і знайдемо характеристики цього закону: математичне очікування та дисперсію. Оскільки оцінка D- незміщена, то М [D] = D.

Обчислення дисперсії D Dпов'язано з порівняно складними викладками, тому наведемо її вираз без висновку:

де ц 4 - четвертий центральний моментвеличини X.

Щоб скористатися цим виразом, потрібно підставити значення ц 4 і D(хоча б наближені). Замість Dможна скористатися його оцінкою D.У принципі четвертий центральний момент також можна замінити його оцінкою, наприклад величиною виду:

але така заміна дасть вкрай невисоку точність, тому що взагалі при обмеженій кількості досвідів моменти високого порядкувизначаються з великими помилками. Однак практично часто буває, що вид закону розподілу величини Xвідомий наперед: невідомі лише його параметри. Тоді можна спробувати виразити ц 4 через D.

Візьмемо випадок, що найбільш часто зустрічається, коли величина Xрозподілено за нормальним законом. Тоді її четвертий центральний момент виражається через дисперсію (див. Розділ 6 підрозділ 6.2);

та формула (14.3.12) дає або

Заміняючи на (14.3.14) невідоме Dйого оцінкою D, отримаємо: звідки

Момент ц 4 можна виразити через Dтакож і в деяких інших випадках, коли розподіл величини Xперестав бути нормальним, але його відомий. Наприклад, для закону рівномірної щільності(див. розділ 5) маємо:

де (а, Р) - інтервал, у якому заданий закон.

Отже,

За формулою (14.3.12) отримаємо: звідки знаходимо приблизно

У випадках, коли вид закону розподілу величини 26 невідомий, при орієнтовній оцінці величини а/) рекомендується все ж таки користуватися формулою (14.3.16), якщо немає спеціальних підстав вважати, що цей закон сильно відрізняється від нормального (має помітний позитивний або негативний ексцес) .

Якщо орієнтовне значення а/) тим чи іншим способом отримано, можна побудувати довірчий інтервал для дисперсії аналогічно тому, як ми будували його для математичного очікування:

де величина в залежності від заданої ймовірності р знаходиться по таблиці. 14.3.1.

Приклад 2. Знайти приблизно 80% довірчий інтервал для дисперсії випадкової величини Xв умовах прикладу 1, якщо відомо, що величина Xрозподілено згідно із законом, близьким до нормального.

Рішення.Розмір залишається тієї ж, що у табл. 14.3.1:

За формулою (14.3.16)

За формулою (14.3.18) знаходимо довірчий інтервал:

Відповідний інтервал значень середнього квадратичного відхилення: (0,21; 0,29).

14.4. Точні методи побудови довірчих інтервалівдля параметрів випадкової величини, розподіленої за нормальним законом

У попередньому підрозділі ми розглянули грубо наближені методи побудови довірчих інтервалів для математичного очікування та дисперсії. Тут ми дамо уявлення про точні методи вирішення того ж завдання. Підкреслимо, що для точного знаходження довірчих інтервалів необхідно знати заздалегідь вид закону розподілу величини X,тоді як застосування наближених методів це обов'язково.

Ідея точних методівпобудови довірчих інтервалів зводиться до наступного. Будь-який довірчий інтервал знаходиться з умови, що виражає ймовірність виконання деяких нерівностей, в які входить оцінка, що нас цікавить а.Закон розподілу оцінки ав загальному випадкузалежить від невідомих параметрів величини X.Однак іноді вдається перейти в нерівності від випадкової величини адо будь-якої іншої функції спостережених значень Х п Х 2 , ..., X п.закон розподілу якої не залежить від невідомих параметрів, а залежить тільки від кількості дослідів та від виду закону розподілу величини X.Такі випадкові величини грають велику роль математичної статистиці; вони найбільш докладно вивчені для нормального розподілу величини X.

Наприклад, доведено, що за нормального розподілу величини Xвипадкова величина

підкоряється так званому закону розподілу Ст'юдентаз п- 1 ступенями свободи; щільність цього закону має вигляд

де Г(х) - відома гамма-функція:

Доведено також, що випадкова величина

має «розподіл %2» з п- 1 ступенями свободи (див. розділ 7), щільність якого виражається формулою

Не зупиняючись на висновках розподілів (14.4.2) та (14.4.4), покажемо, як їх можна застосувати при побудові довірчих інтервалів для параметрів ти D .

Нехай зроблено пнезалежних дослідів над випадковою величиною X,розподіленої за нормальним законом із невідомими параметрами тіо.Для цих параметрів отримано оцінки

Потрібно побудувати довірчі інтервали для обох параметрів, що відповідають довірчій ймовірності р.

Побудуємо спочатку довірчий інтервал для математичного очікування. Природно, цей інтервал взяти симетричним відносно т; позначимо s p половину довжини інтервалу. Величину s p потрібно вибрати так, щоб виконувалася умова

Спробуємо перейти у лівій частині рівності (14.4.5) від випадкової величини тдо випадкової величини Т,розподіленої згідно із законом Стьюдента. І тому помножимо обидві частини нерівності |m-w?|

на позитивну величину: або, використовуючи позначення (14.4.1),

Знайдемо таке число/р, що Величина/р знайдеться з умови

З формули (14.4.2) видно, що (1) - парна функціятому (14.4.8) дає

Рівність (14.4.9) визначає величину/р залежно від р. Якщо мати у своєму розпорядженні таблицю значень інтегралу

то величину/р можна знайти зворотним інтерполюванням у таблиці. Проте зручніше скласти заздалегідь таблицю значень/р. Така таблиця дається у додатку (табл. 5). У цій таблиці наведено значення залежно від довірчої ймовірності р та числа ступенів свободи п- 1. Визначивши/р за табл. 5 і вважаючи

ми знайдемо половину ширини довірчого інтервалу/р та сам інтервал

Приклад 1. Зроблено 5 незалежних дослідів над випадковою величиною X,розподіленої нормально з невідомими параметрами тта о. Результати дослідів наведено у табл. 14.4.1.

Таблиця 14.4.1

Знайти оцінку тдля математичного очікування і побудувати для нього 90%-й довірчий інтервал/р (тобто інтервал, що відповідає довірчій ймовірності р=0,9).

Рішення.Маємо:

За таблицею 5 додатки для п - 1 = 4 і р = 0,9 знаходимо звідки

Довірчий інтервал буде

Приклад 2 Для умов прикладу 1 підрозділу 14.3, припускаючи величину Xрозподілено нормально, знайти точний довірчий інтервал.

Рішення.За таблицею 5 додатка знаходимо при п - 1 = 19ір =

0,8/р = 1,328; звідси

Порівнюючи з рішенням прикладу 1 підрозділу 14.3 (е р = 0,072), переконуємося, що розбіжність дуже незначна. Якщо зберегти точність до другого знака після коми, то довірчі інтервали, знайдені точним та наближеним методами, збігаються:

Перейдемо до побудови довірчого інтервалу дисперсії. Розглянемо незміщену оцінку дисперсії

і висловимо випадкову величину Dчерез величину V(14.4.3), що має розподіл х 2 (14.4.4):

Знаючи закон розподілу величини V,можна знайти інтервал / (1, в який вона потрапляє із заданою ймовірністю р.).

Закон розподілу k n _ x (v)величини I 7 має вигляд, зображений на рис. 14.4.1.

Мал. 14.4.1

Виникає питання: як вибрати інтервал/р? Якби закон розподілу величини Vбув симетричним (як нормальний закон чи розподіл Стьюдента), природно було взяти інтервал /р симетричним щодо математичного очікування. В даному випадку закон до п х (v)несиметричний. Умовимося вибирати інтервал /р так, щоб ймовірність виходу величини Vза межі інтервалу вправо та вліво (заштриховані площі на рис. 14.4.1) були однакові та рівні

Щоб побудувати інтервал/р з такою властивістю, скористаємось табл. 4 додатки: у ній наведені числа у)такі, що

для величини V,що має х 2 -розподіл з г ступенями свободи. У нашому випадку г = п- 1. Зафіксуємо г = п- 1 і знайдемо у відповідному рядку табл. 4 два значення х 2 -одне, що відповідає ймовірності інше - ймовірності Позначимо ці

значення у 2і xl?Інтервал має у 2 ,своїм лівим, а у ~правим кінцем.

Тепер знайдемо по інтервалу /р шуканий довірчий інтервал /|, для дисперсії з межами D, та D 2 ,який накриває крапку Dз ймовірністю р:

Побудуємо такий інтервал /(, = (?> ь А), який накриває точку Dтоді і лише тоді, коли величина Vпотрапляє в інтервал/р. Покажемо, що інтервал

задовольняє цю умову. Справді, нерівності рівносильні нерівностям

а ці нерівності виконуються з ймовірністю р. Таким чином, довірчий інтервал дисперсії знайдено і виражається формулою (14.4.13).

Приклад 3. Знайти довірчий інтервал дисперсії в умовах прикладу 2 підрозділу 14.3, якщо відомо, що величина Xрозподілено нормально.

Рішення.Маємо . За таблицею 4 додатки

знаходимо при г = п - 1 = 19

За формулою (14.4.13) знаходимо довірчий інтервал для дисперсії

Відповідний інтервал для середнього відхилення квадратичного: (0,21; 0,32). Цей інтервал лише трохи перевищує отриманий у прикладі 2 підрозділу 14.3 наближеним методом інтервал (0,21; 0,29).

На малюнку 14.3.1 розглядається довірчий інтервал, симетричний щодо а. Загалом, як ми побачимо далі, це необов'язково.

Оцінка довірчих інтервалів

Цілі навчання

Статистика розглядає такі два основні завдання:

У нас є деяка оцінка, побудована на вибіркових даних, і ми хочемо зробити деяке ймовірнісне твердження щодо того, де знаходиться справжнє значення параметра, що оцінюється.

Ми маємо конкретну гіпотезу, яку необхідно перевірити на основі вибіркових даних.

У цій темі ми розглядаємо перше завдання. Введемо також визначення довірчого інтервалу.

Довірчий інтервал - це інтервал, який будується навколо оцінного значення параметра і показує, де знаходиться справжнє значення параметра з апріорі заданою ймовірністю.

Вивчивши матеріал цієї теми, Ви:

дізнаєтесь, що таке довірчий інтервал оцінки;

навчіться класифікувати статистичні завдання;

освоїте техніку побудови довірчих інтервалів як за статистичними формулами, так і за допомогою програмного інструментарію;

навчитеся визначати необхідні розміри вибірок для досягнення певних параметрів точності статистичних оцінок.

Розподіл вибіркових характеристик

Т-розподіл

Як обговорювали вище розподіл випадкової величини, близький до стандартизованого нормальному розподілуз параметрами 0 та 1. Оскільки нам не відома величина σ, ми замінюємо її на деяку оцінку s . Величина вже має інший розподіл, а саме чи Розподіл Стьюдента, Яке визначається параметром n -1 (кількість ступенів свободи). Цей розподіл близький до нормального розподілу (що більше n, тим розподіл ближче).

На рис. 95
представлено розподіл Стьюдента з 30 ступенями свободи. Як видно, воно дуже близьке до нормального розподілу.

Аналогічно до функцій для роботи з нормальним розподілом НОРМРАСП і НОРМОБР є функції для роботи з t-розподілом - СТЬЮДРАСП (TDIST) і Стьюдрозбір (TINV). Приклад використання цих функцій можна переглянути у файлі СТЬЮДРАСП.XLS (шаблон і рішення) та на рис. 96
.

Розподіл інших характеристик

Як ми вже знаємо, для визначення точності оцінювання математичного очікування нам необхідний t-розподіл. Для оцінювання інших параметрів, наприклад дисперсії, потрібні інші розподіли. Два з них - це F-розподіл та x 2 -розподіл.

Довірчий інтервал для середнього значення

Довірчий інтервал- це інтервал, який будується навколо оцінного значення параметра і показує, де знаходиться справжнє значення параметра, що оцінюється, з апріорі заданою ймовірністю.

Побудова довірчого інтервалу для середнього значення відбувається наступним чином:

приклад

У ресторані швидкого обслуговування планується розширити асортимент нового вигляду сендвіча. Для того щоб оцінити попит на нього, менеджер випадково планує вибрати 40 відвідувачів з тих, хто вже спробував його і запропонувати їм оцінити їхнє ставлення до нового продукту в балах від 1 до 10. Менеджер хоче оцінити очікувану кількість балів, яку отримає новий продукт і побудувати 95% довірчий інтервал цієї оцінки. Як це здійснити? (Див. файл СЕНДВІЧ1.XLS (шаблон і рішення).

Рішення

Для вирішення цього завдання можна скористатися. Результати подано на рис. 97
.

Довірчий інтервал для сумарного значення

Іноді за вибірковими даними потрібно оцінити не математичне очікування, а загальну сумузначень. Наприклад, у ситуації з аудитором інтерес може становити оцінка середньої величини рахунку, а суми всіх рахунків.

Нехай N - Загальна кількістьелементів, n - розмір вибірки, T 3 - сума значень у вибірці, T" - оцінка для суми по всій сукупності, тоді а довірчий інтервал обчислюється за формулою , де s - оцінка стандартного відхилення для вибірки, - оцінка середнього для вибірки.

приклад

Припустимо, деяка податкова служба хоче оцінити розмір сумарних податкових повернень для 10 000 платників податків. Платник податків отримує повернення, або доплачує податки. Знайдіть 95%-й довірчий інтервал для суми повернення за умови, що розмір вибірки становить 500 осіб (див. файл СУМА ПОВЕРНЕНЬ.XLS (шаблон і рішення ).

Рішення

У StatPro немає спеціальної процедури для цього випадку, однак можна помітити, що кордони можна отримати з кордонів для середнього виходячи з наведених вище формул (рис. 98).
).

Довірчий інтервал для пропорції

Нехай p - математичне очікування частки клієнтів, а р - оцінка цієї частки, отримана за вибіркою розміру n. Можна показати, що для чималих розподіл оцінки буде близьким до нормального з математичним очікуванням p і стандартним відхиленням . Стандартна помилка оцінки в даному випадку виражається як , а довірчий інтервал як .

приклад

У ресторані швидкого обслуговування планується розширити асортимент нового вигляду сендвіча. Для того щоб оцінити попит на нього, менеджер випадково вибрав 40 відвідувачів з тих, хто вже спробував його і запропонував їм оцінити їхнє ставлення до нового продукту в балах від 1 до 10. Менеджер хоче оцінити очікувану частку клієнтів, які оцінюють новий продукт не менше ніж у 6 балів (він очікує, що саме ці клієнти будуть споживачами нового продукту).

Рішення

Спочатку створюємо новий стовпець за ознакою 1, якщо оцінка клієнта була більше 6 балів і 0 інакше (див. файл СЕНДВІЧ2.XLS (шаблон та рішення)).

Спосіб 1

Підраховуючи кількість 1 оцінюємо частку, а далі використовуємо формули.

Значення z кр береться зі спеціальних таблиць нормального розподілу (наприклад, 1,96 для 95% довірчого інтервалу).

Використовуючи даний підхід і конкретні дані для побудови 95% інтервалу, отримаємо наступні результати (рис. 99
). Критичне значенняпараметра z кр дорівнює 1,96. Стандартна помилка оцінки – 0,077. Нижня межа довірчого інтервалу – 0,475. Верхня межа довірчого інтервалу – 0,775. Таким чином, менеджер вправі вважати з 95% впевненістю, що відсоток клієнтів, які оцінили новий продукт на 6 балів і вище, буде між 47,5 і 77,5.

Спосіб 2

Це завдання допускає рішення стандартними засобами StatPro. Для цього досить помітити, що частка в даному випадку збігається із середнім значенням стовпця Тип . Далі застосуємо StatPro/Statistical Inference/One-Sample Analysisдля побудови довірчого інтервалу середнього значення (оцінки математичного очікування) стовпця Тип . Отримані у разі результат, будуть дуже близький до результату 1-го способу (рис. 99).

Довірчий інтервал для стандартного відхилення

Як оцінка стандартного відхилення використовується s (формула наведена у розділі 1). Функцією щільності розподілу оцінки s є функція хі-квадрат, яка, як і t-розподіл, має n-1 ступінь свободи. Є спеціальні функції для роботи з цим розподілом ХІ2РАСП (CHIDIST) та ХІ2ОБР (CHIINV).

Довірчий інтервал у разі вже буде не симетричним. Умовна схема меж представлена на рис. 100 .

приклад

Верстат повинен робити деталі діаметром 10 см. Однак через різні обставини відбуваються помилки. Контролера за якістю хвилюють дві обставини: по-перше, середнє значення має дорівнювати 10 см; по-друге, навіть у разі, якщо відхилення будуть великі, багато деталі будуть забраковані. Щодня він робить вибірку з 50 деталей (див. файл КОНТРОЛЬ ЯКОСТІ.XLS (шаблон та рішення)) Які висновки може дати така вибірка?

Рішення

Побудуємо 95% довірчі інтервали для середнього і для стандартного відхилення за допомогою StatPro/Statistical Inference/ One-Sample Analysis(Мал. 101
).

Далі, використовуючи припущення про розподіл діаметрів, розрахуємо частку бракованих виробів, задавшись граничним відхиленням 0,065. Використовуючи можливості таблиці підстановки (випадок двох параметрів), побудуємо залежність частки шлюбу від середнього значення та стандартного відхилення (рис. 102)
).

Довірчий інтервал для різниці двох середніх значень

Це одне з найбільш важливих застосуваньстатистичних методів. Приклади ситуацій.

Менеджер магазину одягу хотів би знати, на скільки більше чи менше витрачає у магазині середня жінка-покупець, ніж чоловік.

Дві авіакомпанії літають аналогічними маршрутами. Організація-споживач хотіла б порівняти різницю між середньоочікуваними часом затримок рейсів по обох авіакомпаніях.

Компанія розсилає купони на окремі видитоварів в одному місті та не розсилає в іншому. Менеджери хочуть порівняти середні обсяги купівлі цих товарів у найближчі два місяці.

Автомобільний дилер часто має справу на презентаціях із заміжніми парами. Щоб зрозуміти їхню персональну реакцію на презентацію, пари часто опитують окремо. Менеджер хоче оцінити різницю в рейтингах, які вказують чоловіки і жінки.

Випадок незалежних вибірок

Різниця середніх значень матиме t-розподіл із n 1 + n 2 - 2 ступенями свободи. Довірчий інтервал для μ 1 - μ 2 виражається співвідношенням:

Дане завдання допускає рішення не тільки за наведеними вище формулами, але і стандартними засобами StatPro. Для цього достатньо застосувати

Довірчий інтервал для різниці між пропорціями

Нехай - математичне очікування часток. Нехай їх вибіркові оцінки, побудовані за вибірками розміру n 1 і n 2 відповідно. Тоді є оцінкою для різниці. Отже, довірчий інтервал цієї різниці виражається як:

Тут z кр є значенням, отриманим з нормального розподілу за спеціальними таблицями (наприклад, 1,96 для 95% довірчого інтервалу).

Стандартна помилка оцінки виражається у разі співвідношенням:

приклад

Магазин, готуючись до великого розпродажу, зробив наступні маркетингові дослідження. Було обрано 300 найкращих покупців, які у свою чергу були випадково поділені на дві групи по 150 членів у кожній. Усім із відібраних покупців було розіслано запрошення для участі у розпродажі, але тільки для членів першої групи було додано купон, що дає право на знижку 5%. Під час розпродажу купівлі всіх 300 відібраних покупців фіксувалися. Як менеджер може інтерпретувати отримані результати і зробити висновок про ефективність надання купонів? (див. файл КУПОНИ.XLS (шаблон і рішення)).

Рішення

Для нашого конкретного випадку з 150 покупців, які отримали купон на знижку, 55 зробили покупку на розпродажі, а серед 150 купон, що не отримали, купівлю зробили тільки 35 (рис. 103
). Тоді значення вибіркових пропорцій відповідно 0,3667 та 0,2333. А вибіркова різниця між ними дорівнює відповідно 0,1333. Вважаючи довірчий інтервал 95%, знаходимо по таблиці нормального розподілу z кр = 1,96. Обчислення стандартної помилки вибіркової різниці дорівнює 0,0524. Остаточно отримуємо, що нижня межа 95% довірчого інтервалу дорівнює 0,0307, а верхня межа 0,2359 відповідно. Отримані результати можна інтерпретувати таким чином, що на кожних 100 покупців, які отримали купон зі знижкою, очікується від 3 до 23 нових покупців. Однак треба мати на увазі, що цей висновок сам по собі ще не означає ефективності застосування купонів (оскільки надаючи знижку ми втрачаємо в прибутку!). Продемонструємо це на конкретних даних. Припустимо, що середній розмірпокупки дорівнює 400 руб., З яких 50 руб. є прибуток магазину. Тоді очікуваний прибуток на 100 покупцях, які не отримали купон, дорівнює:

50 0,2333 100 = 1166,50 руб.

Аналогічні обчислення для 100 покупців, які отримали купон, дають:

30 0,3667 100 = 1100,10 руб.

Зменшення середнього прибутку до 30 пояснюється тим, що, використовуючи знижку, покупці, які отримали купон, у середньому робитимуть покупку на 380 руб.

Таким чином, підсумковий висновок говорить про неефективність використання таких купонів у цій конкретній ситуації.

Зауваження. Це завдання допускає рішення стандартними засобами StatPro. Для цього достатньо звести дане завданнядо завдання оцінки різниці двох середніх способом, а далі застосувати StatPro/Statistical Inference/Two-Sample Analysisдля побудови довірчого інтервалу різниці двох середніх значень.

Управління довжиною довірчого інтервалу

Довжина довірчого інтервалу залежить від наступних умов :

безпосередньо даних (стандартне відхилення);

рівня значимості;

розміру вибірки.

Розмір вибірки для оцінки середнього значення

Спочатку розглянемо завдання у випадку. Позначимо дане нам значення половини довжини довірчого інтервалу за (рис. 104
). Нам відомо, що довірчий інтервал для середнього значення деякої випадкової величини X виражається як , де . Вважаючи:

і висловлюючи n, отримаємо.

На жаль, точне значеннядисперсії випадкової величини X нам невідомо. Крім цього, нам невідомо і значення t кр, оскільки воно залежить від n через кількість ступенів свободи. У цій ситуації ми можемо вчинити так. Замість дисперсії s використовуємо будь-яку оцінку дисперсії, за якими є реалізація досліджуваної випадкової величини. Замість значення t кр використовуємо значення z кр нормального розподілу. Це цілком припустимо, оскільки функції щільності розподілів для нормального та t-розподілу дуже близькі (за винятком випадку малих n). Таким чином, шукана формула набуває вигляду:

Оскільки формула дає, взагалі кажучи, нецілочисленний результат, як шуканий розмір вибірки береться округлення з надлишком результату.

приклад

У ресторані швидкого обслуговування планується розширити асортимент нового вигляду сендвіча. Для того щоб оцінити попит на нього, менеджер випадково планує вибрати деяку кількість відвідувачів з тих, хто вже спробував його, і запропонувати їм оцінити їхнє ставлення до нового продукту в балах від 1 до 10. Менеджер хоче оцінити очікувану кількість балів, яку отримає новий продукт і побудувати 95% довірчий інтервал цієї оцінки. При цьому він хоче, щоб половина ширини довірчого інтервалу не перевищувала 0,3. Яку кількість відвідувачів йому потрібно опитати?

виглядає наступним чином:

Тут р оц- оцінка частки p , а є задана половина довжини довірчого інтервалу. Завищене значення для n можна отримати, використовуючи значення р оц= 0,5. У цьому випадку довжина довірчого інтервалу не перевищуватиме заданого значення при будь-якому істинному значенні p .

приклад

Нехай менеджер із попереднього прикладу планує оцінити частку клієнтів, які віддали перевагу новому виду продукції. Він хоче побудувати 90% довірчий інтервал, половина довжини якого не перевищувала б 0,05. Скільки клієнтів має увійти до випадкової вибірки?

Рішення

У разі значення z кр = 1,645. Тому шукана кількість обчислюється як .

Якби менеджер мав підстави вважати, що шукане значення p становить, наприклад, приблизно 0,3, то, підставляючи це значення у наведену вище формулу, ми отримали б менше значення величини випадкової вибірки, а саме 228.

Формула для визначення розмірів випадкової вибірки у разі різниці між двома середніми значеннямизаписується як:

приклад

Деяка комп'ютерна компанія має сервісний центр обслуговування клієнтів. У Останнім часомзбільшилася кількість скарг клієнтів на погану якість обслуговування. У сервісному центрів основному працюють співробітники двох типів: які не мають великого досвіду, але закінчили спеціальні підготовчі курси і мають великий практичний досвід, але не закінчили спеціальних курсів. Компанія хоче проаналізувати нарікання клієнтів за останні півроку та порівняти їх середні кількості, що припадають на кожну з двох груп співробітників. Передбачається, що кількості у вибірках з обох груп будуть однакові. Яку кількість співробітників необхідно включити у вибірку, щоб отримати 95% інтервал з половиною довжини не більше 2?

Рішення

Тут σ оц є оцінка стандартного відхилення обох випадкових змінних у припущенні, що вони близькі. Таким чином, у нашому завданні нам необхідно якимось чином одержати цю оцінку. Це можна зробити, наприклад, в такий спосіб. Переглянувши дані щодо нарікань клієнтів за останні півроку, менеджер може помітити, що на кожного співробітника в основному припадає від 6 до 36 нарікань. Знаючи, що для нормального розподілу практично всі значення віддалені від середнього значення не більше ніж на три стандартних відхилень, може з певним підставою вважати, що:

, Звідки σ оц = 5.

Підставляючи це значення у формулу, отримуємо .

Формула для визначення розміру випадкової вибірки у разі оцінки різниці між часткамимає вигляд:

приклад

Деяка компанія має дві заводи з виробництва аналогічної продукції. Менеджер компанії хоче порівняти частки бракованої продукції обох фабриках. За наявною інформацією відсоток шлюбу обох фабриках становить від 3 до 5%. Передбачається побудувати 99% довірчий інтервал з половиною довжини не більше 0,005 (або 0,5%). Яку кількість виробів необхідно вибрати з кожної фабрики?

Рішення

Тут р 1оц і р 2оц є оцінками двох невідомих часток шлюбу на 1-й та 2-й фабриці. Якщо покласти р 1оц = р 2оц = 0,5, ми отримаємо підвищене значення для n . Але оскільки в нашому випадку ми маємо деяку апріорну інформацію про ці частки, то беремо верхню оцінку цих часток, а саме 0,05. Отримуємо

Коли проводиться оцінка деяких параметрів сукупності за вибірковими даними, корисно дати не лише точкову оцінкупараметра, але й вказати довірчий інтервал, який показує, де може знаходитися точне значення параметра, що оцінюється.

У цьому розділі ми також познайомилися з кількісними співвідношеннями, що дозволяють будувати такі інтервали для різних параметрів; дізналися методи управління довжиною довірчого інтервалу.

Зазначимо також, що завдання оцінки розмірів вибірки (завдання планування експерименту) можна вирішити, використовуючи стандартні засоби StatPro, а саме StatPro/Statistical Inference/Sample Size Selection.

«Катрен-Стиль» продовжує публікацію циклу Костянтина Кравчика про медичної статистики. У попередніх статтях автор стосувався пояснення таких понять, як і .

Костянтин Кравчик

Математик-аналітик. Спеціаліст в області статистичних дослідженьу медицині та гуманітарних науках

Місто Москва

Дуже часто у статтях з клінічним дослідженнямможна зустріти загадкове словосполучення: «довірчий інтервал» (95% ДІ або 95% CI - confidence interval). Наприклад, у статті може бути написано: «Для оцінки значущості відмінностей використовували t-критерій Стьюдентаз розрахунком 95% довірчого інтервалу».

Якого ж значення «95% довірчого інтервалу» і навіщо його розраховувати?

Що таке довірчий інтервал? - Це діапазон, в якому знаходяться справжні середні значення у генеральній сукупності. А що, бувають несправжні середні значення? У певному сенсі так, бувають. Ми пояснювали, що неможливо виміряти цікавий параметр у всій генеральній сукупності, тому дослідники задовольняються обмеженою вибіркою. У цій вибірці (наприклад, за масою тіла) є одне середнє значення (певна вага), за яким ми і судимо про середнє значення у всій генеральній сукупності. Однак навряд чи середня вага у вибірці (особливо невелика) збігається із середньою вагою в генеральній сукупності. Тому більш правильно розраховувати та користуватися діапазоном середніх значень генеральної сукупності.

Наприклад, уявимо, що 95% довірчий інтервал (95% ДІ) по гемоглобіну становить від 110 до 122 г/л. Це означає, що з ймовірністю 95% справжнє середнє значення по гемоглобіну в генеральній сукупності перебуватиме в межах від 110 до 122 г/л. Іншими словами, ми не знаємо середній показникгемоглобіну в генеральній сукупності, але можемо з 95% ймовірністю вказати діапазон значень для цієї ознаки.

Довірчий інтервал особливо доречний для різниці середніх значеннях між групами або, як це називають, у розмірі ефекту.

Припустимо, ми порівнювали ефективність двох препаратів заліза: давно присутнього на ринку і щойно зареєстрованого. Після курсу терапії оцінили концентрацію гемоглобіну в досліджуваних групах пацієнтів, і статистична програма нам визнала, що різниця між середніми значеннями двох груп з ймовірністю 95% знаходиться в діапазоні від 1,72 до 14,36 г/л (табл. 1).

Табл. 1. Критерій для незалежних вибірок
(порівнюються групи за рівнем гемоглобіну)

Трактувати це слід так: частина пацієнтів генеральної сукупності, яка приймає новий препарат, гемоглобін буде вищим у середньому на 1,72–14,36 г/л, ніж у тих, хто приймав уже відомий препарат.

Іншими словами, в генеральній сукупності різниця в середніх значеннях по гемоглобіну у груп з 95% ймовірністю знаходиться в цих межах. Судити, багато це чи мало буде вже дослідник. Сенс всього цього в тому, що ми працюємо не з одним середнім значенням, а з діапазоном значень, отже, ми вірогідніше оцінюємо різницю за параметром між групами.

У статистичних пакетах, на розсуд дослідника, можна самостійно звужувати чи розширювати межі довірчого інтервалу. Знижуючи ймовірність довірчого інтервалу, ми звужуємо діапазон середніх. Наприклад, при 90% ДІ діапазон середніх (або різниці середніх) буде вже, ніж при 95%.

І навпаки, збільшення ймовірності до 99% розширює діапазон значень. При порівнянні груп нижня межа ДІ може перетнути нульову позначку. Наприклад, якщо ми розширили межі довірчого інтервалу до 99%, то межі інтервалу розташувалися від –1 до 16 г/л. Це означає, що в генеральній сукупності є групи, відмінність середніх між якими за ознакою, що вивчається, дорівнює 0 (М = 0).

За допомогою довірчого інтервалу можна перевіряти статистичні гіпотези. Якщо довірчий інтервал перетинає нульове значення, то нульова гіпотеза, яка передбачає, що групи не відрізняються за параметром, що вивчається, вірна. Приклад описаний вище, коли ми розширили межі до 99%. Десь у генеральній сукупності у нас знайшлися групи, які не відрізнялися.

95% довірчий інтервал різниці по гемоглобіну, (г/л)

На малюнку у вигляді лінії зображено 95% довірчий інтервал різниці середніх значень по гемоглобіну між двома групами. Лінія проходить нульову позначку, отже, має місце різниця між середніми значеннями, що дорівнює нулю, що підтверджує нульову гіпотезу про те, що групи не відрізняються. Діапазон різниці між групами лежить від -2 до 5 г/л. Це означає, що гемоглобін може знизитися на 2 г/л, так і підвищитися на 5 г/л.

Довірчий інтервал - дуже важливий показник. Завдяки йому можна подивитися, чи були відмінності в групах дійсно за рахунок різниці середніх або за рахунок великої вибірки, тому що при великій вибірці шанси знайти відмінності більше, ніж за малої.

Насправді це може виглядати так. Ми взяли вибірку в 1000 осіб, виміряли рівень гемоглобіну та виявили, що довірчий інтервал різниці середніх лежить від 1,2 до 1,5 г/л. Рівень статистичної значущості у своїй p

Ми бачимо, що концентрація гемоглобіну підвищилася, але практично непомітно, отже, статистична значимістьз'явилася за рахунок обсягу вибірки.

Довірчий інтервал може бути вирахований як для середніх значень, але й пропорцій (і відносин ризиків). Наприклад, нас цікавить довірчий інтервал пропорцій пацієнтів, які досягли ремісії, приймаючи розроблені ліки. Припустимо, що 95% ДІ для пропорцій, тобто для частки таких пацієнтів, лежить в межах 0,60-0,80. Таким чином, ми можемо сказати, що наші ліки надають терапевтичний ефектвід 60 до 80% випадків.

Нехай у нас є велика кількість предметів з нормальним розподілом деяких характеристик (наприклад, повний склад однотипних овочів, розмір і вага яких варіюється). Ви хочете знати середні характеристики всієї партії товару, але у Вас немає ні часу, ні бажання вимірювати та зважувати кожен овоч. Ви розумієте, що в цьому немає потреби. Але скільки треба було б взяти на вибіркову перевірку?

Перш ніж дати кілька корисних для цієї ситуації формул нагадаємо деякі позначення.

По-перше, якби ми все-таки проміряли весь склад овочів (це безліч елементів називається генеральною сукупністю), то ми дізналися б з усією доступною нам точністю середнє значення ваги всієї партії. Назвемо це середнє значення Х ср .г він . - Генеральним середнім. Ми вже знаємо, що визначається повністю, якщо відомо його середнє значення та відхилення s . Щоправда, поки що ми ні Х ср.ген., ні s генеральної сукупності не знаємо. Ми можемо тільки взяти деяку вибірку, заміряти потрібні нам значення і порахувати для цієї вибірки як середнє значення Х порівн. виб., так і середнє квадратичне відхилення S виб.

Відомо, що якщо наша вибіркова перевірка містить велику кількість елементів (зазвичай n більше 30) і вони взяті дійсно випадковим чином, то s генеральної сукупності майже не відрізнятиметься від S виб..

Крім того, для нормального розподілу ми можемо користуватися такими формулами:

Імовірно 95%

Імовірно 99%

У загальному вигляді c ймовірністю Р(t)

Зв'язок значення t із значенням ймовірності Р(t), з якою ми хочемо знати довірчий інтервал, можна взяти з наступної таблиці:

Отже, ми визначили, у якому діапазоні перебуває середнє значення для генеральної сукупності (з цією ймовірністю).

Якщо ми не маємо достатньо великої вибірки, ми не можемо стверджувати, що Генеральна сукупністьмає s = S виб. Крім того, у цьому випадку проблематична близькість вибірки до нормального розподілу. У цьому випадку також користуються S виб замість s у формулі:

але значення t для фіксованої ймовірності Р(t) залежатиме від кількості елементів у вибірці n. Чим більше n, тим ближчим буде отриманий довірчий інтервал до значення, що дається формулою (1). Значення t у цьому випадку беруться з іншої таблиці (t-критерій Стьюдента), яку ми наводимо нижче:

Значення t-критерію Стьюдента для ймовірності 0,95 та 0,99

приклад 3.З працівників фірми випадково відібрано 30 осіб. За вибіркою виявилося, що середня зарплата (на місяць) становить 30 тис. рублів за середнього квадратичного відхилення 5 тис. рублів. Імовірно 0,99 визначити середню зарплату у фірмі.

Рішення:За умовою маємо n = 30, Х порівн. = 30000, S = 5000, Р = 0,99. Для знаходження довірчого інтервалу скористаємося формулою, яка відповідає критерію Стьюдента. По таблиці для n = 30 і Р = 0,99 знаходимо t = 2,756, отже,

тобто. шуканий довірчийінтервал 27484< Х ср.ген < 32516.

Отже, ймовірністю 0,99 можна стверджувати, що інтервал (27484; 32516) містить у собі середню зарплату у фірмі.

Ми сподіваємося, що Ви користуватиметеся цим методом, при цьому не обов'язково, щоб при Вас щоразу була таблиця. Підрахунки можна проводити в Excel автоматично. Перебуваючи у файлі Excel, натисніть кнопку fx у верхньому меню. Потім, виберіть серед функцій тип "статистичні", та із запропонованого переліку у віконці - СТЬЮДРАСПОБР. Потім, за підказкою, поставивши курсор у полі "імовірність", наберіть значення зворотної ймовірності (тобто в нашому випадку замість ймовірності 0,95 треба набирати ймовірність 0,05). Мабуть, електронна таблицяскладено так, що результат відповідає на питання, з якою ймовірністю ми можемо помилитися. Аналогічно в полі "ступінь свободи" введіть значення (n-1) для вибірки.