У дома Премахване Тестване на статистически хипотези в MS EXCEL за равенството на средната стойност на разпределението (дисперсията е неизвестна). Тестване на хипотезата за равенството на средните стойности на две или повече популации

Тестване на статистически хипотези в MS EXCEL за равенството на средната стойност на разпределението (дисперсията е неизвестна). Тестване на хипотезата за равенството на средните стойности на две или повече популации

3. ПРОВЕРКА НА ХИПОТЕЗАТА ЗА РАВЕНСТВОТО НА СРЕДНИТЕ

Използва се за тестване на твърдението, че средната стойност на два показателя, представени от извадки, е значително различна. Има три вида тест: един за свързани проби и два за несвързани проби (с еднакви и различни вариации). Ако извадките не са свързани, тогава първо трябва да се тества хипотезата за равенство на дисперсиите, за да се определи кой критерий да се използва. Точно както в случая на сравняване на дисперсии, има 2 начина за решаване на проблема, които ще разгледаме с пример.

ПРИМЕР 3. Има данни за броя на продажбите на стоки в два града. Тествайте при ниво на значимост 0,01 статистическата хипотеза, че средният брой продажби на продукти в градовете е различен.

23 25 23 22 23 24 28 16 18 23 29 26 31 19
22 28 26 26 35 20 27 28 28 26 22 29

Използваме пакета Data Analysis. В зависимост от вида на критерия се избира един от трите: „Сдвоен двуизвадков t-тест за средни стойности“ - за свързани извадки и „Двуизвадков t-тест с еднакви дисперсии“ ​​или „Двуизвадков t-тест с различни отклонения” - за несвързани проби. Извикайте теста със същите вариации, в прозореца, който се отваря, в полетата „Променлив интервал 1“ и „Променлив интервал 2“ въведете връзки към данните (съответно A1-N1 и A2-L2); ако има данни етикети, след което поставете отметка в квадратчето до „Етикети“ (нямаме такива, така че квадратчето за отметка не е отметнато). След това въведете нивото на значимост в полето „Алфа“ - 0,01. Полето „Хипотетична средна разлика“ е оставено празно. В секцията „Опции за изход“ поставете отметка до „Интервал на изхода“ и като поставите курсора в полето, което се появява срещу надписа, щракнете върху левия бутон в клетка B7. Резултатът ще бъде изведен, започвайки от тази клетка. Като щракнете върху „OK“, се появява таблица с резултати. Преместете границата между колони B и C, C и D, D и E, като увеличите ширината на колони B, C и D, така че всички етикети да паснат. Процедурата показва основните характеристики на извадката, t-статистиката, критични стойноститези статистики и критични нивазначение "P(T<=t) одностороннее» и «Р(Т<=t) двухстороннее». Если по модулю t-статистика меньше критического, то средние показатели с заданной вероятностью равны. В нашем случае│-1,784242592│ < 2,492159469, следовательно, среднее число продаж значимо не отличается. Следует отметить, что если взять уровень значимости α=0,05, то результаты исследования будут совсем иными.



Двуизвадков t-тест с равни дисперсии

Средно аритметично 23,57142857 26,41666667
дисперсия 17,34065934 15,35606061
Наблюдения 14 12
Обединена вариация 16,43105159
Хипотетична средна разлика 0
df 24
t-статистика -1,784242592
P(T<=t) одностороннее 0,043516846
t критично едностранно 2,492159469
P(T<=t) двухстороннее 0,087033692
t критичен двупосочен 2,796939498

Лабораторна работа №3

СВОЙНА ЛИНЕЙНА РЕГРЕСИЯ

Цел: Да овладеете методите за конструиране на линейно уравнение на сдвоена регресия с помощта на компютър, да научите как да получавате и анализирате основните характеристики на регресионното уравнение.

Нека разгледаме методологията за конструиране на регресионно уравнение с помощта на пример.

ПРИМЕР. Дадени са примерни фактори x i и y i. Използвайки тези проби, намерете уравнението на линейната регресия ỹ = ax + b. Намерете коефициента на корелация на двойката. Проверете регресионния модел за адекватност при ниво на значимост a = 0,05.

х 0 1 2 3 4 5 6 7 8 9
Y 6,7 6,3 4,4 9,5 5,2 4,3 7,7 7,1 7,1 7,9

За да намерите коефициентите a и b на регресионното уравнение, използвайте функциите SLOPE и INTERCEPT, категории „Статистически“. Въвеждаме сигнатурата “a=” в A5 и въвеждаме функцията TILT в съседната клетка B5, поставяме курсора в полето “Iz_value_y” и задаваме връзка към клетки B2-K2, като ги обикаляме с мишката. Резултатът е 0,14303. Нека сега намерим коефициента b. Въвеждаме сигнатурата “b=” в A6, а в B6 функцията CUT със същите параметри като функциите TILT. Резултатът е 5.976364. следователно уравнението на линейната регресия е y=0,14303x+5,976364.

Нека начертаем регресионното уравнение. За да направите това, в третия ред на таблицата въвеждаме стойностите на функцията в дадените точки X (първи ред) – y(x 1). За да получите тези стойности, използвайте функцията TREND на статистическата категория. Въвеждаме подписа „Y(X)“ в A3 и като поставим курсора в B3, извикваме функцията TREND. В полетата “From_value_y” и “From_value_x” даваме връзка към B2-K2 и B1-K1. в полето “New_value_x” също въвеждаме връзка към B1-K1. в полето “Константа” въведете 1, ако регресионното уравнение има формата y=ax+b, и 0, ако y=ax. В нашия случай въвеждаме такъв. Функцията TREND е масив, така че за да покажете всички нейни стойности, изберете област B3-K3 и натиснете F2 и Ctrl+Shift+Enter. Резултатът е стойностите на регресионното уравнение в дадени точки. Изграждаме график. Поставете курсора във всяка свободна клетка, извикайте съветника за диаграма, изберете категорията „Sharpened“, типа на графиката – линия без точки (в долния десен ъгъл), щракнете върху „Напред“, въведете връзката към B3-K3 в Поле „Диагностика“. отидете в раздела „Ред“ и в полето „Стойности X“ въведете връзката към B1-K1, щракнете върху „Край“. Резултатът е права регресионна линия. Нека видим как се различават графиките на експерименталните данни и регресионните уравнения. За да направите това, поставете курсора във всяка свободна клетка, извикайте съветника за диаграма, категория „Графика“, тип графика – прекъсната линия с точки (втора от горния ляв ъгъл), щракнете върху „Напред“, в полето „Диапазон“ въведете връзка към втория и третия ред B2- K3. отидете в раздела „Ред“ и в полето „Етикети на ос X“ въведете връзката към B1-K1, щракнете върху „Край“. Резултатът е два реда (синьо – оригинално, червено – регресионно уравнение). Вижда се, че линиите се различават малко една от друга.

а= 0,14303
b= 5,976364

За да изчислите коефициента на корелация r xy, използвайте функцията PEARSON. Поставяме графиката така, че да са разположени над ред 25, а в A25 правим подписа „Корелация“, в B25 извикваме функцията PEARSON, в полетата на която „Масив 2“ въвеждаме връзка към изходните данни B1 -K1 и B2-K2. резултатът е 0.993821. коефициентът на детерминация R xy е квадрат на корелационния коефициент r xy . В A26 подписваме „Определяне“, а в B26 записваме формулата „=B25*B25“. Резултатът е 0,265207.

Има обаче една функция в Excel, която изчислява всички основни характеристики на линейната регресия. Това е функцията LINEST. Поставете курсора в B28 и извикайте функцията LINEST, категория „Статистически“. В полетата “From_value_y” и “From_value_x” даваме връзка към B2-K2 и B1-K1. полето “Constant” има същото значение като функцията TREND, в нашия случай е равно на 1. Полето “Stat” трябва да съдържа 1, ако трябва да покажете пълна статистика за регресията. В нашия случай поставяме един там. Функцията връща масив от 2 колони и 5 реда. След като въведете, изберете клетка B28-C32 с мишката и натиснете F2 и Ctrl+Shift+Enter. Резултатът е таблица със стойности, числата в която имат следното значение:



Коефициент а

Коефициент b

Стандартна грешка m o

Стандартна грешка m h

Коефициент на определяне R xy

Стандартно отклонение

F – статистика

Степени на свобода n-2

Регресионна сума на квадратите S n 2

Остатъчна сума на квадратите S n 2

0,14303 5,976364
0,183849 0,981484
0,070335 1,669889
0,60525 8
1,687758 22,30824

Анализ на резултата: в първия ред - коефициентите на регресионното уравнение, сравнете ги с изчислените функции SLOPE и INTERCEPT. Вторият ред е стандартните грешки на коефициентите. Ако един от тях е по-голям по абсолютна стойност от самия коефициент, тогава коефициентът се счита за нула. Коефициентът на детерминация характеризира качеството на връзката между факторите. Получената стойност от 0,070335 показва много добра връзка между факторите, F - статистиката тества хипотезата за адекватността на регресионния модел. Това число трябва да се сравни с критичната стойност, за да го получим, въвеждаме подписа „F-критичен“ в E33, а във F33 функцията FRIST, аргументите на която въвеждаме съответно „0,05“ (ниво на значимост), „1“ (брой фактори X) и "8" (степени на свобода).

F-критичен 5,317655

Може да се види, че F-статистиката е по-малка от F-критичната, което означава, че регресионният модел не е адекватен. Последният ред показва регресионната сума на квадратите и остатъчни суми на квадрати . Важно е регресионната сума (обяснена с регресия) да е много по-голяма от остатъка (необяснена с регресия, причинена от случайни фактори). В нашия случай това условие не е изпълнено, което показва лоша регресия.

Заключение: В хода на работата си усвоих методите за конструиране на линейно уравнение на двойна регресия с помощта на компютър, научих се да получавам и анализирам основните характеристики на регресионното уравнение.


Лабораторна работа №4

НЕЛИНЕЙНА РЕГРЕСИЯ

Цел: да овладеете методите за конструиране на основните типове нелинейни двойни регресионни уравнения с помощта на компютър (вътрешни линейни модели), научете се да получавате и анализирате показатели за качество на регресионни уравнения.

Нека разгледаме случая, когато нелинейните модели могат да бъдат редуцирани до линейни с помощта на трансформация на данни (вътрешни линейни модели).

ПРИМЕР. Конструирайте регресионно уравнение y = f(x) за извадката x n y n (f = 1,2,…,10). Като f(x), разгледайте четири вида функции - линейни, степенни, експоненциални и хипербола:

y = Ax + B; y = Ax B; y = Ae Bx; y = A/x + B.

Необходимо е да се намерят техните коефициенти A и B и след сравняване на показателите за качество изберете функцията, която най-добре описва зависимостта.

Печалба Y 0,3 1,2 2,8 5,2 8,1 11,0 16,8 16,9 24,7 29,4
Печалба X 0,25 0,50 0,75 1,00 1,25 1,50 1,75 2,00 2,25 2,50

Нека въведем данните в таблицата заедно с подписите (клетки A1-K2). Нека оставим свободни три реда под таблицата за въвеждане на конвертираните данни, изберете първите пет реда, като плъзнете по лявата сива рамка покрай числата от 1 до 5 и изберете цвят (светло - жълт или розов), за да оцветите фона на клетки. След това, започвайки от A6, показваме параметрите на линейната регресия. За да направите това, напишете „Линеен“ в клетка A6 и въведете функцията LINEST в съседна клетка B6. В полетата „Izv_value_x“ даваме връзка към B2-K2 и B1-K1, следващите две полета приемат стойности от едно. След това оградете зоната отдолу в 5 реда и отляво в 2 реда и натиснете F2 и Ctrl+Shift+Enter. Резултатът е таблица с регресионни параметри, от които най-голям интерес представлява коефициентът на детерминация в първата колона, трета отгоре. В нашия случай тя е равна на R 1 = 0,951262. Стойността на F-критерия, който позволява проверка на адекватността на модела F 1 = 156.1439

(четвърти ред, първа колона). Регресионното уравнение е

y = 12,96 x +6,18 (коефициентите a и b са дадени в клетки B6 и C6).

Линеен 12,96 -6,18
1,037152 1,60884
0,951262 2,355101
156,1439 8
866,052 44,372

Нека определим подобни характеристики за други регресии и в резултат на сравняване на коефициентите на определяне ще намерим най-добрия регресионен модел. Нека разгледаме хиперболичната регресия. За да го получим, ние трансформираме данните. В третия ред в клетка A3 въвеждаме сигнатурата “1/x” и в клетка B3 въвеждаме формулата “=1/B2”. Нека автоматично да попълним тази клетка в областта B3-K3. Нека да получим характеристиките на регресионния модел. В клетка A12 въвеждаме сигнатурата “Хипербола”, а в съседната функция LINEST. В полетата „From_value_y“ и „From_value_x2“ даваме връзка към B1-K1 и преобразуваните данни на аргумент x – B3-K3, следващите две полета приемат стойности от едно. След това оградете зоната под 5 реда и 2 реда вляво и натиснете F2 и Ctrl+Shift+Enter. Получаваме таблица с регресионни параметри. Коефициент на детерминация в в такъв случайе равно на R 2 = 0,475661, което е много по-лошо, отколкото в случая на линейна регресия. F-статистиката е F2 = 7,257293. Регресионното уравнение е y = -6,25453x 18,96772.

Хипербола -6,25453 18,96772
2,321705 3,655951
0,475661 7,724727
7,257293 8
433,0528 477,3712

Нека разгледаме експоненциалната регресия. За да го линеаризираме, получаваме уравнението , където ỹ = ln y, ã = b, = ln a. Вижда се, че трябва да се направи трансформация на данните - заменете y с ln y. Поставете курсора в клетка A4 и направете заглавието „ln y“. Поставете курсора в B4 и въведете формулата LN (категория „Математически“). Като аргумент се позоваваме на B1. Използвайки автоматично попълване, разширяваме формулата до четвъртия ред до клетки B4-K4. След това в клетка F6 задаваме подписа „Exponent“ и в съседната G6 въвеждаме функцията LINEST, чиито аргументи ще бъдат трансформираните данни B4-K4 (в полето „Measured_value_y“), а останалите полета са същото като в случая на линейна регресия (B2-K2, единадесет). След това оградете клетки G6-H10 и натиснете F2 и Ctrl+Shift+Enter. Резултатът е R 3 = 0,89079, F 3 = 65,25304, което показва много добра регресия. За намиране на коефициентите на регресионното уравнение b = ã; поставете курсора в J6 и направете заглавието „a=“, а в съседния K6 формулата „=EXP(H6)“, в J7 даваме заглавието „b=“, а в K7 формулата „=G6“. Регресионното уравнение е y = 0,511707 · e 6,197909 x.

Изложител 1,824212 -0,67 а= 0,511707
0,225827 0,350304 b= 6,197909
0,89079 0,512793
65,25304 8
17,15871 2,103652

Нека разгледаме степенната регресия. За да го линеаризираме, получаваме уравнението ỹ = ã, където ỹ = ln y, = ln x, ã = b, = ln a. Вижда се, че е необходимо да се трансформират данните - заменете y с ln y и заменете x с ln x. Вече имаме линията с ln y. Нека трансформираме променливите x. В клетка A5 записваме сигнатурата “ln x”, а в клетка B5 въвеждаме формулата LN (категория “Mathematical”). Като аргумент се позоваваме на B2. Използвайки автоматично попълване, разширяваме формулата до петия ред до клетки B5-K5. След това в клетка F12 задаваме подписа „Power“ и в съседния G12 въвеждаме функцията LINEST, чиито аргументи ще бъдат преобразуваните данни B4-K4 (в полето „From_value_y“) и B5-K5 (в полето „From_value_x“), останалите полета са единици. След това освободете клетки G12-H16 и натиснете F2 и Ctrl+Shift+Enter. Резултатът е R 4 = 0,997716, F 4 = 3494,117, което показва добра регресия. За намиране на коефициентите на регресионното уравнение b = ã; поставете курсора в J12 и направете заглавието „a=“, а в съседния K12 формулата „=EXP(H12)“, в J13 даваме заглавието „b=“, а в K13 формулата „=G12“. Регресионното уравнение е y = 4,90767/x+ 7,341268.

Мощност 1,993512 1,590799 а= 4,90767
0,033725 0,023823 b= 7,341268
0,997716 0,074163
3494,117 8
19,21836 0,044002

Нека проверим дали всички уравнения описват адекватно данните. За да направите това, трябва да сравните F-статистиката на всеки критерий с критичната стойност. За да го получим, въвеждаме подписа „F-критичен“ в A21, а в B21 функцията FRIST, чиито аргументи въвеждаме съответно „0,05“ (ниво на значимост), „1“ (броят на факторите X в редът „Ниво на значимост 1“) и „8“ (степен на свобода 2 = n – 2). Резултатът е 5.317655. F – критично е по-голямо от F – статистика, което означава, че моделът е адекватен. Останалите регресии също са адекватни. За да определим кой модел най-добре описва данните, сравняваме индексите на определяне за всеки модел R 1, R 2, R 3, R 4. Най-голямото е R4 = 0,997716. Това означава, че експерименталните данни се описват по-добре с y = 4,90767/x + 7,341268.

Заключение: В хода на работата си усвоих методи за конструиране на основните типове нелинейни двойни регресионни уравнения с помощта на компютър (вътрешни линейни модели), научих се да получавам и анализирам показатели за качество на регресионни уравнения.

Y 0,3 1,2 2,8 5,2 8,1 11 16,8 16,9 24,7 29,4
х 0,25 0,5 0,75 1 1,25 1,5 1,75 2 2,25 2,5
1/x 4 2 1,333333 1 0,8 0,666667 0,571429 0,5 0,444444 0,4
в y -1,20397 0,182322 1,029619 1,648659 2,0918641 2,397895 2,821379 2,827314 3,206803 3,380995
в х -1,38629 -0,69315 -0,28768 0 0,2231436 0,405465 0,559616 0,693147 0,81093 0,916291
Линеен 12,96 -6,18 Изложител 1,824212 -0,67 а= 0,511707
1,037152 1,60884 0,225827 0,350304 b= 6,197909
0,951262 2,355101 0,89079 0,512793
156,1439 8 65,25304 8
866,052 44,372 17,15871 2,103652
Хипербола -6,25453 18,96772 Мощност 1,993512 1,590799 а= 4,90767
2,321705 3,655951 0,033725 0,023823 b= 7,341268
0,475661 7,724727 0,997716 0,074163
7,257293 8 3494,117 8
433,0528 477,3712 19,21836 0,044002
F - критично 5,317655

Лабораторна работа № 5

ПОЛИНОМИАЛНА РЕГРЕСИЯ

Цел: Използвайки експериментални данни, съставете регресионно уравнение във формата y = ax 2 + bx + c.

НАПРЕДЪК:

Разглежда се зависимостта на добива от определена култура y i от количеството минерални торове, внесени в почвата x i. Приема се, че тази зависимост е квадратична. Необходимо е да се намери регресионно уравнение под формата ỹ = ax 2 + bx + c.

х 0 1 2 3 4 5 6 7 8 9
г 29,8 58,8 72,2 101,5 141 135,1 156,6 181,7 216,6 208,2

Нека въведем тези данни в електронната таблица заедно с подписи в клетки A1-K2. Нека изградим графика. За да направите това, кръгнете данните Y (клетки B2-K2), извикайте съветника за диаграма, изберете типа диаграма „Графика“, тип диаграма – графика с точки (втора от горния ляв ъгъл), щракнете върху „Напред“, отидете на Раздел „Серии“ и в „ Етикети на оста X" направете връзка към B2-K2, щракнете върху „Край“. Графиката може да се апроксимира с полином от степен 2 y = ax 2 + bx + c. За да намерите коефициентите a, b, c, трябва да решите системата от уравнения:

Да изчислим сумите. За да направите това, въведете подписа „X^2“ в клетка A3 и въведете формулата „= B1*B1“ в клетка B3 и я прехвърлете на целия ред B3-K3 с помощта на автоматично попълване. В клетка A4 въвеждаме сигнатурата “X^3”, а в B4 формулата “=B1*B3” и Autofill я прехвърля на целия ред B4-K4. В клетка A5 въвеждаме “X^4”, а в B5 формулата “=B4*B1”, автоматично попълване на реда. В клетка A6 въвеждаме “X*Y”, а в B8 формулата “=B2*B1”, автоматично попълване на реда. В клетка A7 въвеждаме “X^2*Y”, а в B9 формулата “=B3*B2”, автоматично попълване на реда. Сега броим сумите. Изберете колона L с различен цвят, като щракнете върху заглавката и изберете цвят. Поставете курсора в клетка L1 и щракнете върху бутона за автоматична сума с иконата ∑, за да изчислите сумата на първия ред. Използвайки AutoFill, прехвърляме формулата в клетки L1-710.

Сега решаваме системата от уравнения. За целта въвеждаме основната матрица на системата. В клетка A13 въвеждаме сигнатурата “A=”, а в матрични клетки B13-D15 въвеждаме връзките, отразени в таблицата

б ° С д
13 =L5 =L4 =L3
14 =L3 =L2 =L1
15 =L2 =L1 =9

Въвеждаме и дясната страна на системата от уравнения. В G13 въвеждаме сигнатурата “B=”, а в H13-H15 въвеждаме съответно връзки към клетки “=L7”, “=L6”, “=L2”. Решаваме системата с помощта на матричния метод. От висшата математика е известно, че решението е равно на A -1 B. Намерете обратната матрица. За да направите това, въведете подписа „A arr.” в клетка J13. и като поставите курсора в K13, задайте формулата MOBR (категория „Математически“). Като аргумент Array предоставяме препратка към клетки B13:D15. Резултатът също трябва да бъде матрица 4x4. За да го получите, оградете клетките K13-M15 с мишката, като ги изберете и натиснете F2 и Ctrl+Shift+Enter. Резултатът е матрица A -1. Нека сега намерим произведението на тази матрица и колона B (клетки H13-H15). Въвеждаме сигнатурата „Коефициенти“ в клетка A18 и в B18 задаваме функцията MULTIPLE (категория „Mathematical“). Аргументите на функцията “Масив 1” са връзка към матрица A-1 (клетки K13-M15), а в полето “Масив 2” предоставяме връзка към колона B (клетки H13-H16). След това изберете B18-B20 и натиснете F2 и Ctrl+Shift+Enter. Полученият масив е коефициентите на регресионното уравнение a, b, c. В резултат на това получаваме регресионно уравнение от вида: y = 1.201082x 2 – 5.619177x + 78.48095.

Нека изградим графики на оригиналните данни и тези, получени въз основа на регресионното уравнение. За да направите това, въведете подписа „Регресия“ в клетка A8 и въведете формулата „=$B$18*B3+$B$19*B1+$B$20“ в B8. Използвайки AutoFill, прехвърляме формулата в клетки B8-K8. За да изградите графика, изберете клетки B8-K8 и като задържите натиснат клавиша Ctrl, изберете клетки B2-M2. Извикайте съветника за диаграма, изберете типа на диаграмата „Графика“, тип на диаграмата – графика с точки (втора от горния ляв ъгъл), щракнете върху „Напред“, отидете в раздела „Серии“ и в полето „Етикети на ос X“ направете връзка към B2-M2, щракнете върху „Готово“. Вижда се, че кривите почти съвпадат.

ЗАКЛЮЧЕНИЕ: в процеса на работа, въз основа на експериментални данни, се научих да съставя регресионно уравнение под формата y = ax 2 + bx + c.





Емпирична плътност на разпределение на случайната анализирана променлива и изчисляване на характеристиките й. Определете обхвата на наличните данни, т.е. разлика между най-голямата и най-малката стойност на извадката (R = Xmax – Xmin): Избор на броя на интервалите на групиране k за броя на наблюденията n<100 – ориентировочное значение интервалов можно рассчитать с использованием формулы Хайнхольда и Гаеде: ...

Данни, може надеждно да се прецени статистическите връзки, които съществуват между променливите, които се изследват в този експеримент. Всички методи на математически и статистически анализ са условно разделени на първични и вторични. Първичните методи са тези, които могат да се използват за получаване на показатели, които пряко отразяват резултатите от измерванията, направени в експеримент. Съответно под...

Процесори с общо предназначение (например Excel, Lotus 1-2-3 и др.), както и някои бази данни. Западните статистически пакети (SPSS, SAS, BMDP и др.) имат следните възможности: Позволяват ви да обработвате гигантски количества данни. Включва инструменти за описание на задачи на вграден език. Те позволяват изграждането на системи за обработка на информация на тяхна база за цели предприятия. Позволява...



Курс на масаж и 1-2 месеца след него. 1.2 Форми на лечебен масаж Формата на лечебен масаж се разделя на общ и частен. Тези форми са характерни за всички видове и методи на масаж. Както частният, така и общият масаж може да се извършва от масажист под формата на взаимен масаж, масаж на двойки или самомасаж. 1.2.1 Общ масаж Общият масаж е такава масажна сесия (независимо от...

х 0 1 2 3 4 5 6 7 8 9
г 29,8 58,8 72,2 101,5 141 135,1 156,6 181,7 216,6 208,2
X^2 0 1 4 9 16 25 36 49 64 81
X^3 0 1 8 27 64 125 216 343 512 729
X^4 0 1 16 81 256 625 1296 2401 4096 6561
X*Y 0 58,8 144,4 304,5 564 675,5 939,6 1271,9 1732,8 1873,8
X^2*Y 0 58,8 288,8 913,5 2256 3377,5 5637,6 8903,3 13862,4 16864,2
Регресия. 78,48095 85,30121 94,52364 106,1482 120,175 136,6039 155,435 176,6682 200,3036 226,3412
А= 15333 2025 285 B= 52162,1 A Arr. 0,003247 -0,03247 0,059524
2025 285 45 7565,3 -0,03247 0,341342 -0,67857
285 45 9 1301,5 0,059524 -0,67857 1,619048
Коефициент 1,201082 а
5,619177

5 ноември 2012 г. 5 ноември 2012 г. 5 ноември 2012 г. 5 ноември 2012 г. Лекция 6. Сравняване на две проби 6-1. Хипотеза за равенство на средствата. Сдвоени проби 6-2 Доверителен интервал за разликата в средните стойности. Сдвоени проби 6-3. Хипотеза за равенство на вариантите 6-4. Хипотеза за равенство на дяловете 6-5. Доверителен интервал за разликата в пропорциите


2 Иванов О.В., 2005 В тази лекция... В предишната лекция тествахме хипотезата за равенството на средните на две генерални съвкупности и конструирахме доверителен интервалза разликата в средните за случая на независими проби. Сега ще разгледаме критерия за тестване на хипотезата за равенство на средните стойности и ще конструираме доверителен интервал за разликата в средните стойности в случай на сдвоени (зависими) проби. След това в раздел 6-3 ще бъде тествана хипотезата за равенство на дисперсиите, в раздел 6-4 - хипотезата за равенство на дяловете. Накрая конструираме доверителен интервал за разликата в пропорциите.


5 ноември 2012 г. 5 ноември 2012 г. 5 ноември 2012 г. 5 ноември 2012 г. Хипотеза за равенство на средствата. Сдвоени проби Постановка на проблема Хипотези и статистика Последователност от действия Пример


4 Иванов О.В., 2005 Сдвоени проби. Описание на проблема Какво имаме 1. Две прости произволни извадки, получени от две генерални съвкупности. Пробите са сдвоени (зависими). 2. И двете проби имат размер n 30. Ако не, тогава и двете проби са взети от нормално разпределени популации. Това, което искаме, е да тестваме хипотезата за разликата между средните стойности на две популации:


5 Иванов О.В., 2005 Статистика за двойки проби За проверка на хипотезата се използва статистика: къде е разликата между две стойности в една двойка - общата средна стойност за двойки разлики - средната стойност на извадката за двойки разлики - стандартно отклонениеразлики за извадката - брой двойки


6 Иванов О.В., 2005 Пример. Обучение на студенти Група от 15 студенти се явиха на тест преди и след обучението. Резултатите от теста са в таблицата. Нека проверим хипотезата за сдвоени извадки за липсата на влияние на обучението върху подготовката на учениците при ниво на значимост 0,05. Решение. Нека изчислим разликите и техните квадрати. Студент ПредиСлед Σ= 21 Σ= 145


7 Иванов О.В., 2005 Решение Стъпка 1. Основни и алтернативни хипотези: Стъпка 2. Задава се ниво на значимост =0,05. Стъпка 3. Използвайки таблицата за df = 15 – 1=14, намираме критичната стойност t = 2.145 и записваме критичната област: t > 2.145. 2.145."> 2.145."> 2.145." title="7 Ivanov O.V., 2005 Решение Стъпка 1. Основни и алтернативни хипотези: Стъпка 2. Нивото на значимост е зададено = 0.05. Стъпка 3. По таблица за df = 15 – 1=14 намираме критичната стойност t = 2.145 и записваме критичната област: t > 2.145."> title="7 Иванов О.В., 2005 Решение Стъпка 1. Основни и алтернативни хипотези: Стъпка 2. Задава се ниво на значимост =0,05. Стъпка 3. Използвайки таблицата за df = 15 – 1=14, намираме критичната стойност t = 2.145 и записваме критичната област: t > 2.145."> !}




9 Иванов О.В., 2005 Статистика на решението приема стойността: Стъпка 5. Сравнете получената стойност с критичната област. 1,889


5 ноември 2012 г. 5 ноември 2012 г. 5 ноември 2012 г. 5 ноември 2012 г. Доверителен интервал за разликата в средните стойности. Сдвоени проби Постановка на проблема Метод за конструиране на доверителен интервал Пример


11 Иванов О.В., 2005 Описание на проблема Какво имаме Имаме две произволни сдвоени (зависими) извадки с размер n от две генерални съвкупности. Генералните съвкупности имат нормален закон на разпределение с параметри 1, 1 и 2, 2 или обемите на двете извадки са 30. Това, което искаме, е да оценим средната стойност на разликите в двойки за две генерални съвкупности. За да направите това, изградете доверителен интервал за средната стойност във формата:






5 ноември 2012 г. 5 ноември 2012 г. 5 ноември 2012 г. 5 ноември 2012 г. Хипотеза за равенство на дисперсии Постановка на проблема Хипотези и статистика Последователност от действия Пример


15 Иванов О.В., 2005 г. По време на изследването... Изследователят може да се наложи да провери предположението, че дисперсиите на двете изследвани популации са равни. В случая, когато тези генерални съвкупности имат нормална дистрибуция, за това има F-тест, наричан още критерий на Фишер. За разлика от Студент, Фишер не е работил в пивоварна.


16 Иванов О.В., 2005 Описание на проблема Какво имаме 1. Две прости случайни извадки, получени от две нормално разпределени популации. 2. Пробите са независими. Това означава, че няма връзка между пробните субекти. Това, което искаме, е да тестваме хипотезата за равенство на вариациите на популацията:














23 Иванов О.В., 2005 г. Пример Медицински изследовател иска да провери дали има разлика между сърдечната честота на пушачи и непушачи (брой удари в минута). Резултатите от две произволно избрани групи са показани по-долу. Използвайки α = 0,05, разберете дали лекарят е прав. Пушачи Непушачи


24 Иванов О.В., 2005 Решение Стъпка 1. Основни и алтернативни хипотези: Стъпка 2. Задава се ниво на значимост =0,05. Стъпка 3. Използвайки таблицата за броя на степените на свобода на числителя 25 и знаменателя 17, намираме критичната стойност f = 2,19 и критичната област: f > 2,19. Стъпка 4. Използвайки извадката, изчисляваме статистическата стойност: 2.19. Стъпка 4. Използвайки извадката, изчисляваме статистическата стойност: ">




5 ноември 2012 г. 5 ноември 2012 г. 5 ноември 2012 г. 5 ноември 2012 г. Хипотеза за равни дялове Постановка на проблема Хипотези и статистика Последователност от действия Пример


27 Иванов О.В., 2005 Въпрос От 100 произволно избрани студенти от социологическия факултет 43 посещават специални курсове. От 200 произволно избрани студенти по икономика 90 посещават специални курсове. Различава ли се делът на студентите, посещаващи специални курсове, между факултетите по социология и икономика? Не изглежда да се различава значително. Как мога да проверя това? Делът на посещаващите специални курсове е делът на атрибута. 43 – брой „успехи“. 43/100 – дял от успеха. Терминологията е същата като в схемата на Бернули.


28 Иванов О.В., 2005 г. Описание на проблема Какво имаме 1. Две прости произволни извадки, получени от две нормално разпределени популации. Пробите са независими. 2. За пробите са изпълнени np 5 и nq 5. Това означава, че поне 5 елемента от пробата имат изследваната характеристична стойност, а поне 5 не. Това, което искаме, е да проверим хипотезата за равенството на дяловете на характеристика в две генерални съвкупности:






31 Иванов О.В., 2005 Пример. Специални курсове на два факултета От 100 произволно избрани студенти на социологическия факултет 43 посещават специални курсове. От 200 студенти по икономика 90 посещават специални курсове. При ниво на значимост = 0,05, проверете хипотезата, че няма разлика между дела на студентите, посещаващи специални курсове в тези два факултета. 33 Иванов О.В., 2005 Решение Стъпка 1. Основни и алтернативни хипотези: Стъпка 2. Задава се ниво на значимост =0,05. Стъпка 3. Използвайки таблицата за нормално разпределение, намираме критичните стойности z = – 1.96 и z = 1.96 и конструираме критичната област: z 1.96. Стъпка 4. Въз основа на извадката изчисляваме стойността на статистиката.


34 Иванов О.В., 2005 Решение Стъпка 5. Сравнете получената стойност с критичната област. Получената статистическа стойност не попада в критичната област. Стъпка 6. Формулирайте заключението. Няма причина да отхвърлим основната хипотеза. Делът на посещаващите специални курсове не се различава статистически значимо.


5 ноември 2012 г. 5 ноември 2012 г. 5 ноември 2012 г. 5 ноември 2012 г. Доверителен интервал за разликата в пропорциите Постановка на проблема Метод за конструиране на доверителен интервал Пример





Разгледайте две независими проби x 1, x 2, ….., x n и y 1, y 2, …, y n, извлечени от нормални популации с равни дисперсии, с размери на извадката n и m, съответно, и средни стойности μ x, μ y и дисперсията σ 2 са неизвестни. Изисква се да се тества основната хипотеза H 0: μ x = μ y с конкуриращата се H 1: μ x μ y.

Както е известно, извадковите средни ще имат следните свойства: ~N(μ x, σ 2 /n), ~N(μ y, σ 2 /m).

Разликата им е нормална стойност със средната и дисперсия, така че

~ (23).

Нека приемем за момент, че основната хипотеза H 0 е правилна: μ x – μ y =0. Тогава и разделяйки стойността на нейното стандартно отклонение, получаваме стандартната нормална sl. Размер ~N(0,1).

По-рано беше отбелязано, че величина разпределени по закон с (n-1)-та степен на свобода, а - по закона с (m-1) степени на свобода. Като вземем предвид независимостта на тези две суми, намираме, че те са обща сума разпределени по закон с n+m-2 степени на свобода.

Спомняйки си стъпка 7, виждаме, че дробта се подчинява на t-разпределението (Стюдънт) с ν=m+n-2 степени на свобода: Z=t. Този факт възниква само когато хипотезата H 0 е вярна.

Заменяйки ξ и Q с техните изрази, получаваме разширена формула за Z:

(24)

Следващата Z стойност, наречена критериална статистика, ви позволява да вземете решение със следната последователност от действия:

1. Установява се площта D=[-t β,ν , +t β,ν ], съдържаща β=1–α области под кривата на разпределение t ν (Таблица 10).

2. Експерименталната стойност Z на статистиката Z се изчислява с помощта на формула (24), за която стойностите x 1 и y 1 на конкретни проби, както и техните средни стойности на извадката и , се заместват вместо X 1 и Y 1 .

3. Ако Z върху D, тогава се счита, че хипотезата H 0 не противоречи на експерименталните данни и се приема.

Ако Z върху D, тогава хипотезата H 1 се приема.

Ако хипотезата H 0 е вярна, тогава Z се подчинява на известното t ν -разпределение с нулева средна стойност и с голяма вероятност β = 1–α попада в D-областта на приемане на хипотезата H 0 . Когато наблюдаваната, експериментална стойност на Z on попада в D. Ние считаме това за доказателство в полза на хипотезата H 0.

Когато Z 0 n лежи извън D (както се казва, лежи в критичната област K), което е естествено, ако хипотезата H 1 е вярна, но малко вероятно, ако H 0 е вярна, тогава можем само да отхвърлим хипотезата H 0, като приемем H 1 .

Пример 31.

Сравняват се два вида бензин: А и В. На 11 превозни средства с еднаква мощност са тествани веднъж на кръгло шаси бензини от класове А и В. Една кола се повреди по пътя и за нея няма данни за бензин Б.

Разход на бензин на 100 км

Таблица 12

аз
X i 10,51 11,86 10,5 9,1 9,21 10,74 10,75 10,3 11,3 11,8 10,9 n=11
U i 13,22 13,0 11,5 10,4 11,8 11,6 10,64 12,3 11,1 11,6 - m=10

Разликата в потреблението на бензин класове A и B е неизвестна и се приема, че е еднаква. Възможно ли е при ниво на значимост α=0,05 да се приеме хипотезата, че истинските средни разходи μ A и μ B на тези видове бензин са еднакви?

Решение. Тестване на хипотезата H 0: μ A -μ B = 0 с конкурентна. H 1:μ 1 μ 2 направете следното:

1. Намерете примерните средни стойности и сумата от квадратите на отклоненията Q.

;

;

2. Изчислете експерименталната стойност на Z статистиката

3. От таблица 10 на t-разпределението намираме границата t β,ν за броя на степените на свобода ν=m+n–2=19 и β=1–α=0,95. Таблица 10 има t 0.95.20 =2.09 и t 0.95.15 =2.13, но не и t 0.95.19. Намираме чрез интерполация t 0,95,19 =2,09+ =2,10.

4. Проверете коя от двете области D или K съдържа числото Zon. Zon=-2.7 D=[-2.10; -2,10].

Тъй като наблюдаваната стойност на Z on лежи в критичната област, K = R\D, ние я отхвърляме. H 0 и приемете хипотезата H 1. В този случай те казват, че разликата им е значителна. Ако при всички условия на този пример само Q се беше променило, да речем, Q се беше удвоило, тогава нашето заключение би се променило. Удвояването на Q би довело до намаляване на стойността на Zon с фактор и тогава числото Zon би попаднало в допустимата област D, така че хипотезата H 0 ще издържи теста и ще бъде приета. В този случай несъответствието между и ще се обясни с естественото разсейване на данните, а не с факта, че μ A μ B.

Теорията за проверка на хипотези е много обширна; хипотезите могат да бъдат за вида на закона за разпределение, за хомогенността на извадките, за независимостта на следващите количества и т.н.

КРИТЕРИЙ c 2 (PEARSON)

Най-често срещаният критерий в практиката за проверка на проста хипотеза. Прилага се, когато законът за разпределение е неизвестен. Да разгледаме случайна променлива X, върху която n независими тестове. Получава се реализацията x 1 , x 2 ,...,x n. Необходимо е да се провери хипотезата за закона за разпределение на тази случайна променлива.

Нека разгледаме случая на проста хипотеза. Една проста хипотеза тества съответствието на извадка с популация, която е нормално разпределена (известна). Строим по мостри вариационна серия x (1) , x (2) , ..., x (n) . Разделяме интервала на подинтервали. Нека тези интервали са r. Тогава ще намерим вероятността X в резултат на теста да попадне в интервала Di, i=1 ,..., r, ако проверяваната хипотеза е вярна.

Критерият не проверява истинността на плътността на вероятността, а истинността на числата

С всеки интервал Di свързваме случайно събитие A i - попадение в този интервал (попадение в резултат на тест върху X на резултата от изпълнението му в Di). Нека въведем случайни променливи. m i е броят тестове от n проведени, при които е настъпило събитието A i. m i се разпределят според биномния закон и ако хипотезата е вярна

Dm i =np i (1-p i)

Критерият c 2 има формата

p 1 +p 2 +...+p r =1

m 1 +m 2 +...+m r =n

Ако хипотезата, която се тества, е правилна, тогава m i представлява честотата на поява на събитие, което има вероятност pi във всяко от n опита, следователно можем да разглеждаме m i като случайна променлива, подчинена на биномиалния закон с център в точка npi. Когато n е голямо, тогава можем да приемем, че честотата е разпределена асимптотично нормално със същите параметри. Ако хипотезата е вярна, трябва да очакваме, че те ще бъдат асимптотично нормално разпределени

свързани помежду си чрез връзка

Като мярка за несъответствието между примерните данни m 1 +m 2 +...+m r и теоретичните np 1 +np 2 +...+np r, разгледайте стойността

c 2 - сумата от квадратите на свързаните асимптотично нормални величини линейна зависимост. По-рано сме се сблъсквали с подобен случай и знаем, че наличието на линейна връзка доведе до намаляване на броя на степените на свобода с една.

Ако тестваната хипотеза е вярна, тогава критерият c 2 има разпределение, което клони като n®¥ към разпределението на c 2 с r-1 степени на свобода.

Да приемем, че хипотезата е невярна. Тогава има тенденция сумарните членове да нарастват, т.е. ако хипотезата е неправилна, тогава тази сума ще попадне в определена област с големи стойности на c 2. Като критичен регион приемаме района на положителните стойности на критерия


В случай на неизвестни параметри на разпределение, всеки параметър намалява броя на степените на свобода за критерия на Pearson с една

8.1. Концепцията за зависими и независими проби.

Избор на критерий за проверка на хипотеза

се определя основно от това дали разглежданите проби са зависими или независими. Нека въведем съответните определения.

Деф.Пробите се наричат независима, ако процедурата за избор на единици в първата извадка по никакъв начин не е свързана с процедурата за избор на единици във втората извадка.

Пример за две независими извадки биха били обсъдените по-горе извадки на мъже и жени, работещи в едно и също предприятие (в една и съща индустрия и т.н.).

Имайте предвид, че независимостта на две проби изобщо не означава, че няма изискване за определен вид сходство на тези проби (тяхната хомогенност). По този начин, когато изучаваме нивото на доходите на мъжете и жените, е малко вероятно да допуснем ситуация, при която мъжете са избрани измежду московските бизнесмени, а жените от аборигените на Австралия. Жените също трябва да бъдат московчани и освен това „бизнес дами“. Но тук не говорим за зависимостта на извадките, а за изискването за хомогенност на изследваната популация от обекти, което трябва да бъде изпълнено както при събиране, така и при анализ на социологически данни.

Деф.Пробите се наричат зависими или сдвоени,ако всяка единица от една проба е „свързана“ с конкретна единица от втората проба.

Това последно определение вероятно ще стане по-ясно, ако дадем пример за зависими извадки.

Да предположим, че искаме да разберем дали социалният статус на бащата е средно по-нисък от социалния статус на сина (вярваме, че можем да измерим това сложно и двусмислено разбирано социални характеристикилице). Изглежда очевидно, че в такава ситуация е препоръчително да се изберат двойки респонденти (баща, син) и да се приеме, че всеки елемент от първата извадка (един от бащите) е „свързан“ с определен елемент от втората извадка (неговият син). Тези две проби ще се наричат ​​зависими.

8.2. Проверка на хипотези за независими извадки

За независимапроби, изборът на критерий зависи от това дали знаем общите вариации s 1 2 и s 2 2 на разглежданата характеристика за изследваните проби. Ще считаме този проблем за решен, ако приемем, че извадковите дисперсии съвпадат с общите. В този случай критерият е стойността:

Преди да преминем към обсъждане на ситуацията, когато общите отклонения (или поне една от тях) са ни неизвестни, отбелязваме следното.

Логиката за използване на критерия (8.1) е подобна на тази, която описахме при разглеждането на критерия „хи-квадрат“ (7.2). Има само една фундаментална разлика. Говорейки за значението на критерия (7.2), ние разгледахме безкраен брой проби с размер n, „изтеглени“ от нашите население. Тук, анализирайки значението на критерия (8.1), преминаваме към разглеждане на безкраен брой парапроби с размер n 1 и n 2. За всяка двойка се изчислява статистика от формата (8.1). Съвкупността от получените стойности на такава статистика, в съответствие с нашата нотация, съответства на нормално разпределение (както се съгласихме, буквата z се използва за обозначаване на такъв критерий, на който отговаря нормалното разпределение).

Така че, ако общите дисперсии са ни неизвестни, тогава сме принудени да използваме техните извадкови оценки s 1 2 и s 2 2 вместо това. В този случай обаче нормалното разпределение трябва да се замени с разпределението на Стюдънт - z трябва да се замени с t (както беше в подобна ситуация при конструиране на доверителен интервал за математическото очакване). Въпреки това, при достатъчно големи размери на извадката (n 1, n 2 ³ 30), както вече знаем, разпределението на Стюдънт практически съвпада с нормалното. С други думи, за големи проби можем да продължим да използваме критерия:

Ситуацията е по-сложна, когато дисперсиите са неизвестни и размерът на поне една извадка е малък. Тогава друг фактор влиза в действие. Видът на критерия зависи от това дали можем да считаме неизвестните вариации на разглежданата характеристика в двете анализирани извадки за равни. За да разберем, трябва да проверим хипотезата:

H 0: s 1 2 = s 2 2. (8.3)

За проверка на тази хипотеза се използва критерият

Относно спецификата на използването на този критерий Ще говоримпо-долу, а сега ще продължим да обсъждаме алгоритъма за избор на критерий, който се използва за тестване на хипотези за равенството на математическите очаквания.

Ако хипотезата (8.3) бъде отхвърлена, тогава критерият, който ни интересува, приема формата:

(8.5)

(т.е. той се различава от критерия (8.2), който беше използван за големи извадки, по това, че съответните статистики нямат нормално разпределение, а разпределение на Стюдънт). Ако се приеме хипотеза (8.3), тогава видът на използвания критерий се променя:

(8.6)

Нека обобщим как се избира критерий за проверка на хипотезата за равенството на общите математически очаквания въз основа на анализа на две независими извадки.

известен

неизвестен

размерът на извадката е голям

H 0: s 1 = s 2 отхвърлени

Прието

8.3. Проверка на хипотези за зависими извадки

Нека да преминем към разглеждане на зависими проби. Нека последователностите от числа

X 1, X 2, …, X n;

Y 1, Y 2, …, Y n –

това са стойностите на разглеждания случаен за елементите на две зависими проби. Нека въведем обозначението:

D i = X i - Y i , i = 1, ... , n.

За зависимпримерен критерий, който ви позволява да тествате хипотеза

както следва:

Обърнете внимание, че току-що даденият израз за s D не е нищо повече от нов израз за известна формула, изразяваща стандартното отклонение. В този случай говорим за стандартното отклонение на стойностите на D i . Подобна формула често се използва на практика като по-опростен (в сравнение с изчислението „напред“ на сумата от квадратните отклонения на стойностите на разглежданата стойност от съответната средна аритметична) метод за изчисляване на дисперсията.

Ако сравним горните формули с тези, които използвахме, когато обсъждахме принципите за конструиране на доверителен интервал, лесно се забелязва, че тестването на хипотезата за равенство на средните за случая на зависими извадки по същество е тестване на равенството на математическото очакване на стойностите D i до нула. величина

е стандартното отклонение за D i . Следователно, стойността на току-що описания критерий t n -1 е по същество равна на стойността на D i, изразена като част от стандартното отклонение. Както казахме по-горе (когато обсъждаме методите за конструиране на доверителни интервали), този индикатор може да се използва за преценка на вероятността на разглежданата стойност Di. Разликата е, че по-горе говорихме за проста аритметична средна, нормално разпределена, а тук говорим за средни разлики, такива средни имат разпределение на Стюдънт. Но разсъжденията относно връзката между вероятността за отклонение на средната аритметична извадка от нула (с математическо очакване, равно на нула) с колко единици s това отклонение остава в сила.

Пример. Приходите на аптеките в един от микрорайоните на града за определен период възлизат на 128; 192; 223; 398; 205; 266; 219; 260; 264; 98 (условни единици). В съседния микрорайон за същото време те са били 286; 240; 263; 266; 484; 223; 335.
За двете проби изчислете средната стойност, коригираната дисперсия и стандартното отклонение. Намерете диапазона на вариация, средното абсолютно (линейно) отклонение, коефициента на вариация, линеен коефициентвариации, коефициент на трептене.
Ако приемем, че това произволна стойностима нормално разпределение, определете доверителния интервал за общата средна стойност (и в двата случая).
Използвайки критерия на Фишер, проверете хипотезата за равенство на общите дисперсии. С помощта на теста на Стюдънт проверете хипотезата за равенството на общите средни (алтернативната хипотеза е за тяхната неравенство).
При всички изчисления нивото на значимост е α = 0,05.

Извършваме решението с помощта на калкулатора Тестване на хипотезата за равенство на дисперсии.
1. Намерете индикаторите за вариация за първата проба.

х|x - x av |(x - x ср.) 2
98 127.3 16205.29
128 97.3 9467.29
192 33.3 1108.89
205 20.3 412.09
219 6.3 39.69
223 2.3 5.29
260 34.7 1204.09
264 38.7 1497.69
266 40.7 1656.49
398 172.7 29825.29
2253 573.6 61422.1


.



Вариационни индикатори.
.

R = X max - X min
R = 398 - 98 = 300
Средно линейно отклонение


Всяка стойност от серията се различава от другата средно с 57,36
дисперсия


Безпристрастен оценител на дисперсията


.

Всяка стойност от серията се различава от средната стойност от 225,3 със средно 78,37
.

.

Коефициентът на вариация

Тъй като v>30%, но v или

Коефициент на трептене

.
.


С помощта на таблицата на ученика намираме:
T таблица (n-1;α/2) = T таблица (9;0,025) = 2,262

(225.3 - 59.09;225.3 + 59.09) = (166.21;284.39)

2. Намерете индикаторите за вариация за втората проба.
Нека класираме реда. За да направите това, сортираме стойностите му във възходящ ред.
Таблица за изчисляване на показатели.

х|x - x av |(x - x ср.) 2
223 76.57 5863.18
240 59.57 3548.76
263 36.57 1337.47
266 33.57 1127.04
286 13.57 184.18
335 35.43 1255.18
484 184.43 34013.9
2097 439.71 47329.71

За да оценим серията на разпространение, намираме следните показатели:
Индикатори на разпределителен център.
Обикновено средно аритметично


Вариационни индикатори.
Абсолютни вариации.
Диапазонът на вариация е разликата между максималните и минималните стойности на характеристиката на първичната серия.
R = X max - X min
R = 484 - 223 = 261
Средно линейно отклонение- изчислени, за да се вземат предвид разликите на всички единици от изследваната съвкупност.


Всяка стойност от серията се различава от другата средно с 62,82
дисперсия- характеризира мярката за дисперсия около нейната средна стойност (мярка за дисперсия, т.е. отклонение от средната стойност).


Безпристрастен оценител на дисперсията- последователна оценка на дисперсията (коригирана дисперсия).


Стандартно отклонение.

Всяка стойност от серията се различава от средната стойност от 299,57 със средно 82,23
Оценка на стандартното отклонение.

Относителни мерки за вариация.
Относителните показатели на вариация включват: коефициент на трептене, линеен коефициент на вариация, относително линейно отклонение.
Коефициентът на вариация- мярка за относителната дисперсия на стойностите на съвкупността: показва каква част от средната стойност на тази стойност е нейната средна дисперсия.

Тъй като v ≤ 30%, популацията е хомогенна и вариацията е слаба. На получените резултати може да се вярва.
Линеен коефициент на вариацияили Относително линейно отклонение- характеризира съотношението на средната стойност на знака на абсолютните отклонения от средната стойност.

Коефициент на трептене- отразява относителното колебание на екстремните стойности на характеристиката около средната.

Интервална оценка на населения център.
Доверителен интервал за обща средна стойност.

Определете t kp стойността, като използвате таблицата за разпределение на Student
С помощта на таблицата на ученика намираме:
T таблица (n-1;α/2) = T таблица (6;0,025) = 2,447

(299.57 - 82.14;299.57 + 82.14) = (217.43;381.71)
С вероятност от 0,95 може да се каже, че средната стойност с по-голям размер на извадката няма да попадне извън намерения интервал.
Тестваме хипотезата за равенство на дисперсиите:
H 0: D x = D y ;
H 1: D x Нека намерим наблюдаваната стойност на критерия на Фишер:

Тъй като s y 2 > s x 2, тогава s b 2 = s y 2, s m 2 = s x 2
Брой степени на свобода:
f 1 = n y – 1 = 7 – 1 = 6
f 2 = n x – 1 = 10 – 1 = 9
Използвайки таблицата на критичните точки на разпределението на Fisher–Snedecor при ниво на значимост α = 0,05 и даден брой степени на свобода, намираме F cr (6;9) = 3,37
защото F. Тестваме хипотезата за равенството на общите средни:


Нека намерим експерименталната стойност на критерия на Стюдънт:


Брой степени на свобода f = n x + n y – 2 = 10 + 7 – 2 = 15
Определете t kp стойността, като използвате таблицата за разпределение на Student
С помощта на таблицата на ученика намираме:
T таблица (f;α/2) = T таблица (15;0,025) = 2,131
Използвайки таблицата на критичните точки на разпределението на Стюдънт при ниво на значимост α = 0,05 и даден брой степени на свобода, намираме tcr = 2,131
защото t наб.



Ново в сайта

>

Най - известен