У дома Зъболечение Оценки на математическото очакване и дисперсията. Оценка на математическото очакване на случайна величина

Оценки на математическото очакване и дисперсията. Оценка на математическото очакване на случайна величина

Нека се проведат независими експерименти върху случайна променлива с неизвестно математическо очакване и дисперсия, което даде резултатите - . Нека изчислим последователни и безпристрастни оценки за параметрите и .

Като оценка за математическото очакване вземаме средноаритметичната стойност на експерименталните стойности

. (2.9.1)

Според закона големи числатази оценка е богат , със стойност по вероятност. Същата оценка е и безпристрастен , тъй като

. (2.9.2)

Дисперсията на тази оценка е

. (2.9.3)

Може да се покаже, че за нормалния закон на разпределение тази оценка е ефективен . За други закони това може да не е така.

Нека сега оценим дисперсията. Нека първо изберем за оценка формулата за статистическа дисперсия

. (2.9.4)

Нека проверим последователността на оценката на дисперсията. Нека отворим скобите във формула (2.9.4)

.

Когато първият член се сближава по вероятност със стойността , във втория - до. Така нашата оценка се сближава по вероятност с дисперсията

,

следователно тя е богат .

Да проверим неразместен оценки за количеството. За да направим това, заместваме израза (2.9.1) във формула (2.9.4) и вземаме предвид, че случайните променливи независима

,

. (2.9.5)

Нека във формула (2.9.5) преминем към флуктуациите на случайни променливи

Отваряйки скобите, получаваме

,

. (2.9.6)

Нека изчислим математическото очакване на стойността (2.9.6), като вземем предвид това

. (2.9.7)

Връзката (2.9.7) показва, че стойността, изчислена по формула (2.9.4) не е безпристрастна оценка за дисперсия. Неговото математическо очакване не е равно, а малко по-малко. Такава оценка води до системна грешка надолу. За да премахнете такова отклонение, трябва да въведете корекция чрез умножаване на стойността. Тази коригирана статистическа дисперсия може след това да служи като безпристрастен оценител за дисперсията

. (2.9.8)

Тази оценка е също толкова валидна, колкото и оценката, тъй като стойността е .

На практика, вместо оценка (2.9.8), понякога е по-удобно да се използва еквивалентна оценка, свързана с втория начален статистически момент

. (2.9.9)

Оценките (2.9.8), (2.9.9) не са ефективни. Може да се покаже, че в случай на нормален закон за разпределение те ще бъдат асимптотично ефективна (по желание се стремят към минималната възможна стойност).

Така можем да формулираме следните правила за обработка с ограничен обем статистически материал. Ако при независими експерименти случайната променлива приема стойностите с неизвестно математическо очакване и дисперсия, тогава за определяне на тези параметри трябва да се използват приблизителни оценки

(2.9.10)

Край на работата -

Тази тема принадлежи към раздела:

Бележки от лекции по математика, теория на вероятностите, математическа статистика

Катедра Висша математика и компютърни науки.. Конспекти от лекции.. по математика..

Ако имате нужда от допълнителен материал по тази тема или не сте намерили това, което търсите, препоръчваме да използвате търсенето в нашата база данни с произведения:

Какво ще правим с получения материал:

Ако този материал е бил полезен за вас, можете да го запазите на страницата си в социалните мрежи:

Всички теми в този раздел:

Теория на вероятностите
Теорията на вероятностите е дял от математиката, в който се изучават моделите на случайни масови явления. Явление, което е случайно, се нарича

Статистическа дефиниция на вероятността
Едно събитие е случайно явление, което може или не може да се появи в резултат на опит (двусмислено явление). Посочете събитията с главни латински букви

Пространство на елементарни събития
Нека има много събития, свързани с някакво преживяване и: 1) в резултат на преживяването се появява едно и само едно нещо

Действия върху събития
Сумата от две събития и

Пренареждания
Броят на различните пермутации на елементи се означава с

Разположения
Чрез поставяне на елементите според

Комбинации
Комбинация от елементи

Формула за добавяне на вероятности за несъвместими събития
Теорема. Вероятността за сумата от две несъвместими събития е равна на сумата от вероятностите за тези събития. (1

Формула за добавяне на вероятности за произволни събития
Теорема. Вероятността за сумата от две събития е равна на сумата от вероятностите за тези събития без вероятността за техния продукт.

Формула за умножение на вероятностите
Нека две събития и да бъдат дадени. Помислете за събитието

Формула за пълна вероятност
Нека е пълна група от несъвместими събития; те се наричат ​​хипотези; Помислете за някакво събитие

Формула за вероятност на хипотеза (Бейес)
Да разгледаме отново - пълната група от несъвместими хипотези и събитието

Асимптотична формула на Поасон
В случаите, когато броят на тестовете е голям и вероятността за възникване на събитие

Случайни дискретни величини
Случайно количество е количество, което при повторение на експеримент може да приеме различни стойности. числови стойности. Случайната променлива се нарича дискретна,

Случайни непрекъснати променливи
Ако в резултат на експеримент случайна променлива може да приеме произволна стойност от определен сегмент или цялата реална ос, тогава тя се нарича непрекъсната. закон

Функция на плътността на вероятността на случайна непрекъсната променлива
Нека бъде. Нека разгледаме една точка и да я увеличим

Числени характеристики на случайни величини
Случайните дискретни или непрекъснати променливи се считат за напълно определени, ако техните закони за разпределение са известни. Всъщност, знаейки законите за разпределение, винаги можете да изчислите вероятността за удряне

Квантили на случайни променливи
Квантил от порядъка на случайна непрекъсната променлива

Математическо очакване на случайни променливи
Очаквана стойност случайна величинахарактеризира неговата средна стойност. Всички стойности на случайната променлива са групирани около тази стойност. Нека първо разгледаме случайната дискретна променлива

Стандартно отклонение и дисперсия на случайни променливи
Нека първо разгледаме случайна дискретна променлива. Режим на числови характеристики, медиана, квантили и математическо очакване

Моменти на случайни променливи
В допълнение към математическото очакване и дисперсията, теорията на вероятностите използва числови характеристики от по-високи порядъци, които се наричат ​​моменти на случайни променливи.

Теореми за числените характеристики на случайни величини
Теорема 1. Математическото очакване на неслучайна стойност е равно на самата тази стойност. Доказателство: Нека

Биномен закон на разпределение

Закон за разпределение на Поасон
Нека произволна дискретна променлива приема стойностите

Закон за равномерно разпределение
Единен законразпределението на случайна непрекъсната променлива се нарича закон за функцията на плътността на вероятността, който

Закон за нормалното разпределение
Нормалният закон за разпределение на случайна непрекъсната променлива е законът за функцията на плътността

Експоненциален закон за разпределение
Експоненциалното или експоненциалното разпределение на случайна променлива се използва в приложения на теорията на вероятностите като теорията опашка, теория на надеждността

Системи от случайни величини
На практика в приложенията на теорията на вероятностите често се срещат проблеми, при които резултатите от даден експеримент се описват не от една случайна променлива, а от няколко случайни променливи наведнъж.

Система от две случайни дискретни променливи
Нека две са произволни дискретни количестваобразуват система. Случайна стойност

Система от две случайни непрекъснати променливи
Нека сега системата е образувана от две случайни непрекъснати променливи. Законът за разпределение на тази система се нарича вероятно

Условни закони на разпределение
Нека зависими произволни непрекъснати количества

Числени характеристики на система от две случайни величини
Началният момент на подреждане на система от случайни променливи

Система от няколко случайни променливи
Резултатите, получени за система от две случайни променливи, могат да бъдат обобщени за случая на системи, състоящи се от произволен брой случайни променливи. Нека системата е образувана от множество

Нормален закон на разпределение на система от две случайни променливи
Помислете за система от две произволни непрекъснати количества. Законът за разпределение на тази система е нормалният закон за разпределение

Пределни теореми на теорията на вероятностите
Основната цел на дисциплината теория на вероятностите е да изучава моделите на случайни масови явления. Практиката показва, че наблюдението на маса от еднородни случайни явления разкрива

Неравенството на Чебишев
Помислете за случайна променлива с математическо очакване

Теорема на Чебишев
Ако случайните променливи са по двойки независими и имат крайни, колективно ограничени дисперсии

Теорема на Бернули
С неограничено увеличаване на броя на експериментите, честотата на възникване на дадено събитие се сближава по вероятност с вероятността на събитието

Централна гранична теорема
При добавяне на случайни променливи с всякакви закони на разпределение, но със съвместно ограничени вариации, законът на разпределение

Основни проблеми на математическата статистика
Законите на теорията на вероятностите, обсъдени по-горе, представляват математически израз на реални модели, които действително съществуват в различни случайни масови явления. Изучаване

Проста статистическа съвкупност. Статистическа функция на разпределение
Нека разгледаме някаква случайна променлива, чийто закон на разпределение е неизвестен. Изисква се въз основа на опит

Статистически серии. стълбовидна диаграма
С голям брой наблюдения (от порядъка на стотици) населениестава неудобно и тромаво за записване на статистически материали. За прегледност и компактност, статистически материал

Числени характеристики на статистическото разпределение
В теорията на вероятностите бяха разгледани различни числени характеристики на случайни променливи: математическо очакване, дисперсия, начална и централни точкиразлични поръчки. Подобни числа

Избор на теоретично разпределение по метода на моментите
Всяко статистическо разпределение неизбежно съдържа елементи на случайност, свързани с ограничения брой наблюдения. С голям брой наблюдения тези елементи на случайност се изглаждат,

Проверка на правдоподобността на хипотезата за формата на закона за разпределение
Нека даденото статистическо разпределениеапроксимирана с някаква теоретична крива или

Критерии за съгласие
Нека разгледаме един от най-често използваните критерии за съответствие - така нареченият критерий на Пиърсън. Познайте

Точкови оценки за неизвестни параметри на разпределение
В пп. 2.1. – 2.7 разгледахме подробно как се решават първата и втората основни задачи на математическата статистика. Това са проблемите за определяне на законите на разпределение на случайни променливи въз основа на експериментални данни

Доверителен интервал. Вероятност за доверие
На практика, с малък брой експерименти върху случайна променлива, приблизителна замяна на неизвестния параметър

Нека има случайна променлива хс математическо очакване ми дисперсия д, докато и двата параметъра са неизвестни. Над стойността хпроизведени ннезависими експерименти, в резултат на които набор от нчислени резултати x 1, x 2, …, x N. Като оценка на математическото очакване е естествено да се предложи средноаритметичното на наблюдаваните стойности

(1)

Тук като x iсе вземат предвид конкретни стойности (числа), получени в резултат нексперименти. Ако вземем други (независими от предишните) нексперименти, тогава очевидно ще получим различна стойност. Ако приемете повече нексперименти, тогава ще получим друга нова стойност. Нека означим с X iслучайна променлива в резултат на iия експеримент, след това реализациите X iще бъдат числата, получени от тези експерименти. Очевидно случайната променлива X iще има същата функция на плътност на вероятността като оригиналната случайна променлива х. Ние също вярваме, че случайните променливи X iИ Xjса независими, когато i, не е равно й(различни експерименти, независими един от друг). Следователно пренаписваме формула (1) в различна (статистическа) форма:

(2)

Нека покажем, че оценката е безпристрастна:

По този начин математическото очакване на средната стойност на извадката е равно на истинското математическо очакване на случайната променлива м. Това е доста предвидим и разбираем факт. Следователно средната стойност на извадката (2) може да се приеме като оценка на математическото очакване на случайна променлива. Сега възниква въпросът: какво се случва с дисперсията на оценката на математическото очакване, когато броят на експериментите се увеличава? Това показват аналитичните изчисления

където е дисперсията на оценката на математическото очакване (2) и д- истинска дисперсия на случайната променлива х.

От горното следва, че с нарастване н(брой експерименти) дисперсията на оценката намалява, т.е. Колкото повече обобщаваме независими реализации, толкова по-близо до математическото очакване получаваме оценка.


Оценки на математическата дисперсия

На пръв поглед най-естествената оценка изглежда

(3)

където се изчислява по формула (2). Нека проверим дали оценката е безпристрастна. Формула (3) може да бъде записана по следния начин:

Нека заместим израз (2) в тази формула:

Нека намерим математическото очакване на оценката на дисперсията:

(4)

Тъй като дисперсията на случайна променлива не зависи от това какво е математическото очакване на случайната променлива, нека вземем математическото очакване равно на 0, т.е. м = 0.

(5)
при .(6)

Най-важните числени характеристики на случайна променлива хса тя математическо очакване m x =M и дисперсияσ 2 x = D[x] = M[(X – m x) 2 ] = M –. Номер m xе средната стойност на случайна променлива, около която са разпръснати стойностите на количествата х, мярка за това разпространение е дисперсията D[x]И стандартно отклонение:

s x =(1.11)

Ще разгледаме допълнително важна задачаза изследване на наблюдавана случайна променлива. Нека има някакъв образец (ще го обозначим С) случайна величина х. Изисква се оценка от наличната извадка неизвестни стойности m xИ .

Теорията на оценките на различни параметри заема математическа статистиказначително място. Затова нека първо да разгледаме обща задача. Нека е необходимо да се оцени някакъв параметър апо проба С. Всяка такава оценка а*е някаква функция a*=a*(S)от примерни стойности. Стойностите на извадката са произволни, следователно и самата оценка а*е случайна променлива. Възможно е да се изградят много различни оценки(т.е. функции) а*, но в същото време е желателно да има „добра“ или дори „най-добра“, в известен смисъл оценка. Следните три естествени изисквания обикновено се налагат на оценките.

1. Неразместен.Математическо очакване на оценката а*трябва да е равна на точната стойност на параметъра: М = а. С други думи, резултатът а*не трябва да има системна грешка.

2. Богатство.С безкрайно увеличаване на размера на извадката, оценката а*трябва да се сближи до точна стойност, т.е. с увеличаване на броя на наблюденията грешката в оценката клони към нула.

3. Ефективност.Степен а*се нарича ефективен, ако е безпристрастен и има възможно най-малката вариация на грешката. В този случай разпространението на оценките е минимално а*спрямо точната стойност и оценката е в известен смисъл „най-точна“.

За съжаление, не винаги е възможно да се състави оценка, която да удовлетворява и трите изисквания едновременно.

За оценка на математическото очакване най-често се използва оценка.

= , (1.12)

тоест средноаритметичната стойност на извадката. Ако случайната променлива хима крайни m xИ s x, тогава оценката (1.12) не е предубедена и последователна. Тази оценка е ефективна, например, ако хима нормално разпределение (Фигура 1.4, Приложение 1). За други дистрибуции може да не е ефективно. Например в случай равномерно разпределение(Фигура 1.1, Приложение 1) ще бъде безпристрастна, последователна оценка

(1.13)

В същото време оценката (1.13) за нормалното разпределение няма да бъде нито последователна, нито ефективна и дори ще се влоши с увеличаване на размера на извадката.

По този начин за всеки тип разпределение на случайна променлива хтрябва да използвате вашата оценка на математическото очакване. В нашата ситуация обаче видът на разпределението може да бъде известен само условно. Затова ще използваме оценка (1.12), която е доста проста и има най-много важни свойствабезпристрастност и последователност.

За да се оцени математическото очакване за групирана извадка, се използва следната формула:

= , (1.14)

което може да се получи от предишното, ако вземем предвид всичко m iпримерни стойности, включени в i-ти интервал, равен на представителя z iтози интервал. Тази оценка естествено е по-груба, но изисква значително по-малко изчисления, особено при голям размер на извадката.

Най-често използваната оценка за оценка на дисперсията е:

= , (1.15)

Тази оценка не е пристрастна и е валидна за всяка случайна променлива х, имащи крайни моменти до четвърти ред включително.

В случай на групирана извадка се използва оценката:

= (1.16)

Оценките (1.14) и (1.16) като правило са пристрастни и несъстоятелни, тъй като техните математически очаквания и границите, до които се сближават, се различават от m xи поради подмяната на всички примерни стойности, включени в i-ти интервал, за представител на интервал z i.

Имайте предвид, че за големи н,коефициент n/(n – 1)в изрази (1.15) и (1.16) е близо до единица, така че може да бъде пропуснато.

Интервални оценки.

Позволявам точна стойностнякакъв параметър е равен на аи неговата оценка беше намерена като)по проба С. Оценка а*съответства на точка от цифровата ос (фиг. 1.5), така че тази оценка се нарича точка. Всички оценки, обсъдени в предходния параграф, са точкови оценки. Почти винаги, поради случайността

а* ¹ а, и можем само да се надяваме, че точката а*е някъде наблизо а. Но колко близо? Всяка друга точкова оценка ще има същия недостатък - липсата на мярка за надеждността на резултата.


Фиг.1.5. Оценка на точковия параметър.

По-конкретни в това отношение са интервални оценки. Интервалният резултат представлява интервал I b = (a, b), в който точната стойност на оценявания параметър се намира с дадена вероятност b. Интервал аз бНаречен доверителен интервал, и вероятността bНаречен вероятност за доверие и може да се разглежда като надеждност на оценката.

Доверителният интервал се базира на наличната извадка С, той е случаен в смисъл, че неговите граници са произволни като)И b(S), което ще изчислим от (случайна) извадка. Ето защо bима възможност случайният интервал аз бще покрие неслучайна точка а. На фиг. 1.6. интервал аз бпокри точката а, А Ib*- Не. Следователно не е съвсем правилно да се каже това а "попада" в интервала.

Ако вероятността за доверие bголеми (напр. b = 0,999), тогава почти винаги точната стойност ае в рамките на изградения интервал.


Фиг.1.6. Доверителни интервали на параметъра аза различни проби.

Нека разгледаме метода на изграждане доверителен интервалза математическото очакване на случайна променлива Х,базиран на централна гранична теорема.

Нека случайната променлива хима неизвестно математическо очакване m xИ известна дисперсия. Тогава, по силата на централната гранична теорема, средното аритметично е:

= , (1.17)

резултати н независими тестовеколичества хе случайна променлива, чието разпределение като цяло н, близо до нормална дистрибуциясъс средно m xи стандартно отклонение. Следователно случайната променлива

(1.18)

има вероятностно разпределение, което може да се вземе предвид стандартно нормалнос плътност на разпространение j(t), чиято графика е показана на фиг. 1.7 (както и на фиг. 1.4, Приложение 1).



Фиг.1.7. Разпределение на плътността на вероятността на случайна променлива T.

Нека бъде дадена вероятността за доверие bИ t b -число, удовлетворяващо уравнението

b = Ф 0 (t b) – Ф 0 (-t b) = 2 Ф 0 (t b),(1.19)

Където - Функция на Лаплас. Тогава вероятността за попадане в интервала (-t b, t b)ще бъде равно на защрихованото на фиг. 1.7. площ, и по силата на израз (1.19) е равно на b. Следователно

b = P(-t b< < t b) = P( – тб< m x < + t b ) =

= P( – тб< m x < + t b ).(1.20)

Така като доверителен интервал можем да вземем интервала

I b = ( – t b ; + t b ) , (1.21)

тъй като израз (1.20) означава, че неизвестната точна стойност m xе в аз бс определена доверителна вероятност b. За изграждане аз бнеобходимо, както е посочено bнамирам t bот уравнение (1.19). Нека дадем няколко стойности t bнеобходими в бъдеще :

t 0.9 = 1.645; t 0,95 = 1,96; t 0,99 = 2,58; t 0,999 = 3,3.

При извеждането на израз (1.21) се приема, че точната стойност на стандартното отклонение е известна s x. Не винаги обаче се знае. Затова нека използваме неговата оценка (1.15) и да получим:

I b = ( – t b ; +tb). (1.22)

Съответно оценките на и получените от групираната извадка дават следната формула за доверителния интервал:

I b = ( – t b ; +tb). (1.23)

ЦЕЛ НА ЛЕКЦИЯТА: да се въведе концепцията за оценка на неизвестен параметър на разпределение и да се даде класификация на такива оценки; получаване на точкови и интервални оценки на математическото очакване и дисперсията.

На практика в повечето случаи законът за разпределение на случайна променлива е неизвестен и според резултатите от наблюденията
необходимо е да се оценят числени характеристики (например математическо очакване, дисперсия или други моменти) или неизвестен параметър , който определя закона за разпределение (плътност на разпределение)
изследвана случайна променлива. По този начин за експоненциално разпределение или разпределение на Поасон е достатъчно да се оцени един параметър, но за нормално разпределение трябва да се оценят два параметъра - математическото очакване и дисперсията.

Видове оценки

Случайна стойност
има плътност на вероятността
, Където – неизвестен параметър на разпределение. В резултат на експеримента бяха получени стойностите на тази случайна променлива:
. Да се ​​направи оценка по същество означава, че примерните стойности на случайна променлива трябва да бъдат свързани с определена стойност на параметър , т.е. създайте някаква функция от резултатите от наблюдението
, чиято стойност се приема като приблизителна параметър . Индекс показва броя на извършените експерименти.

Всяка функция, която зависи от резултатите от наблюденията, се нарича статистика. Тъй като резултатите от наблюденията са случайни променливи, статистиката също ще бъде случайна променлива. Следователно оценката
неизвестен параметър трябва да се разглежда като случайна променлива и нейната стойност, изчислена от експериментални данни в обем , – като един от възможни стойноститази случайна променлива.

Оценките на параметрите на разпределението (числовите характеристики на случайна променлива) са разделени на точки и интервали. Точкова оценкапараметър определени от едно число , а неговата точност се характеризира с дисперсията на оценката. Интервална оценканаречен резултат, който се определя от две числа, И – краища на интервала, покриващ оценения параметър с определена доверителна вероятност.

Класификация точкови оценки

За точкова оценка на неизвестен параметър
най-доброто по отношение на точността, то трябва да бъде последователно, безпристрастно и ефективно.

Богатнаречена оценка
параметър , ако се сближава по вероятност с оценения параметър, т.е.

. (8.8)

Въз основа на неравенството на Чебишев може да се покаже, че достатъчно условиеизпълнението на отношението (8.8) е равенството

.

Съгласуваността е асимптотична характеристика на оценката при
.

Безпристрастеннаречена оценка
(оценка без систематична грешка), чието математическо очакване е равно на оценявания параметър, т.е.

. (8.9)

Ако равенството (8.9) не е изпълнено, тогава оценката се нарича предубедена. Разлика
наречено отклонение или систематична грешка в оценката. Ако равенството (8.9) е изпълнено само за
, тогава съответната оценка се нарича асимптотично безпристрастна.

Трябва да се отбележи, че ако последователността е почти задължително условие за всички оценки, използвани в практиката (непоследователните оценки се използват изключително рядко), тогава свойството на безпристрастност е само желателно. Много често използвани оценки нямат безпристрастното свойство.

Като цяло, точността на оценката на някакъв параметър , получени въз основа на експериментални данни
, характеризиращ се със средната квадратна грешка

,

които могат да бъдат сведени до формата

,

къде е дисперсията,
– отклонение на квадратната оценка.

Ако оценката е безпристрастна, тогава

При ограничен оценките може да се различават със средна квадратна грешка . Естествено, колкото по-малка е тази грешка, толкова по-тясно са групирани стойностите на оценката около прогнозния параметър. Следователно винаги е желателно грешката в оценката да бъде възможно най-малка, т.е. условието да е изпълнено

. (8.10)

Оценка , удовлетворяваща условието (8.10), се нарича оценка с минимална квадратна грешка.

Ефективеннаречена оценка
, за които средната квадратна грешка не е по-голяма от средната квадратна грешка на всяка друга оценка, т.е.

Където – всяка друга оценка на параметъра .

Известно е, че дисперсията на всяка безпристрастна оценка на един параметър удовлетворява неравенството на Крамър-Рао

,

Където
– условно разпределение на плътността на вероятността на получените стойности на случайната променлива при истинската стойност на параметъра .

По този начин, безпристрастната оценка
, за които неравенството на Крамър–Рао се превръща в равенство, ще бъдат ефективни, т.е. такава оценка има минимална дисперсия.

Точкови оценки на очакванията и дисперсиите

Ако се разглежда случайна променлива
, което има математическо очакване и дисперсия , тогава и двата параметъра се считат за неизвестни. Следователно, над случайна променлива
произведени независими експерименти, които дават резултати:
. Необходимо е да се намерят последователни и безпристрастни оценки на неизвестни параметри И .

Като оценки И Обикновено статистическата (извадка) средна стойност и статистическа (извадка) дисперсия се избират съответно:

; (8.11)

. (8.12)

Оценката на математическото очакване (8.11) е последователна според закона за големите числа (теорема на Чебишев):

.

Очакване на случайна променлива

.

Следователно оценката е безпристрастен.

Разсейване на оценката на математическото очакване:

Ако случайната променлива
се разпределя по нормалния закон, след това оценката също е ефективен.

Очакване на оценка на дисперсията

В същото време

.

защото
, А
, тогава получаваме

. (8.13)

По този начин,
– необективна оценка, въпреки че е последователна и ефективна.

От формула (8.13) следва, че за получаване на безпристрастна оценка
дисперсията на извадката (8.12) трябва да се модифицира, както следва:

което се счита за „по-добро“ в сравнение с оценката (8.12), макар и като цяло тези оценки са почти равни една на друга.

Методи за получаване на оценки на параметрите на разпределението

Често на практика, въз основа на анализ на физическия механизъм, който генерира случайната променлива
, можем да направим заключение за закона за разпределение на тази случайна променлива. Параметрите на това разпределение обаче са неизвестни и трябва да бъдат оценени от експерименталните резултати, обикновено представени под формата на крайна извадка
. За решаването на този проблем най-често се използват два метода: методът на моментите и методът на максималната вероятност.

Метод на моментите. Методът се състои в приравняване на теоретичните моменти със съответните емпирични моменти от същия порядък.

Емпирични отправни точки -ти ред се определят по формулите:

,

и съответните теоретични начални моменти -ти ред - формули:

за дискретни случайни променливи,

за непрекъснати случайни променливи,

Където – оценен параметър на разпределение.

Да се ​​получат оценки на параметрите на разпределение, съдържащо два неизвестни параметъра И , се съставя система от две уравнения

Където И – теоретични и емпирични централни моменти от втори ред.

Решението на системата от уравнения са оценките И неизвестни параметри на разпространение И .

Приравнявайки теоретичните и емпиричните начални моменти от първи ред, получаваме, че чрез оценка на математическото очакване на случайна променлива
, с произволно разпределение, ще бъде средната стойност на извадката, т.е.
. Тогава, приравнявайки теоретичните и емпиричните централни моменти от втори ред, получаваме, че оценката на дисперсията на случайната променлива
, която има произволно разпределение, се определя по формулата

.

По подобен начин могат да се намерят оценки на теоретични моменти от всякакъв порядък.

Методът на моментите е прост и не изисква сложни изчисления, но оценките, получени по този метод, често са неефективни.

Метод на максимална вероятност. Методът на максималната вероятност за точкова оценка на неизвестни параметри на разпределение се свежда до намиране на максимума на функцията на един или повече оценени параметри.

Позволявам
е непрекъсната случайна променлива, която като резултат тестовете взеха стойности
. За да получите оценка на неизвестен параметър необходимо е да се намери такава стойност , при което вероятността за реализиране на получената извадка би била максимална. защото
представляват взаимно независими величини с еднаква вероятностна плътност
, Че функция на вероятносттаизвикване на аргументната функция :

Чрез оценка на максималната вероятност на параметъра тази стойност се нарича , при което функцията на вероятността достига максимум, т.е. е решение на уравнението

,

което явно зависи от резултатите от теста
.

Тъй като функциите
И
достигат максимум при същите стойности
, тогава за опростяване на изчисленията те често използват логаритмичната функция на вероятността и търсят корена на съответното уравнение

,

което се нарича уравнение на вероятността.

Ако трябва да оцените няколко параметъра
разпространение
, тогава функцията на вероятността ще зависи от тези параметри. За да намерите оценки
параметри на разпределение е необходимо да се реши системата уравнения на вероятността

.

Методът на максималната вероятност предоставя последователни и асимптотично ефективни оценки. Въпреки това, оценките, получени чрез метода на максималната вероятност, са пристрастни и в допълнение, за да се намерят оценки, често е необходимо да се решат доста сложни системи от уравнения.

Интервални оценки на параметрите

Точността на точковите оценки се характеризира с тяхната дисперсия. Няма обаче информация колко близки са получените оценки до истинските стойности на параметрите. В редица задачи не само трябва да намерите параметъра подходяща числена стойност, но и за оценка на нейната точност и надеждност. Трябва да разберете до какви грешки може да доведе подмяната на параметър неговата точкова оценка и с каква степен на увереност трябва да очакваме, че тези грешки няма да надхвърлят известните граници.

Такива задачи са особено подходящи, когато има малък брой експерименти. , когато точковата оценка до голяма степен произволна и приблизителна замяна На може да доведе до значителни грешки.

По-пълна и надежден начиноценката на параметрите на разпределенията се състои в определяне не на една точка, а на интервал, който с дадена вероятност покрива истинската стойност на оценения параметър.

Нека според резултатите експерименти, беше получена безпристрастна оценка
параметър . Необходимо е да се оцени възможната грешка. Избира се някаква достатъчно голяма вероятност
(например), така че събитие с тази вероятност може да се счита за практически сигурно събитие и се намира такава стойност , за което

. (8.15)

В този случай диапазонът от практически възможни стойности на грешката, която възниква по време на подмяната На , ще
, и големите абсолютна стойностгрешки ще се появят само с малка вероятност .

Израз (8.15) означава, че с вероятност
неизвестна стойност на параметъра попада в интервала

. (8.16)

Вероятност
Наречен вероятност за доверие, и интервалът , обхващащ с вероятност извиква се истинската стойност на параметъра доверителен интервал. Имайте предвид, че е неправилно да се каже, че стойността на параметъра е в рамките на доверителния интервал с вероятност . Използваната формулировка (обхваща) означава, че въпреки че параметърът, който се оценява, е неизвестен, той има постоянна стойност и следователно няма разпространение, тъй като не е случайна променлива.

ПРЕДМЕТ:Точкови оценки на математическото очакване. Точкови оценки на дисперсията. Точкова оценка на вероятността от събитие. Точкова оценка на параметрите на равномерното разпределение.

клауза 1.Точкови оценки на математическото очакване.

Да приемем, че функцията на разпределение на случайната променлива ξ зависи от неизвестния параметър θ : P (ξ θ;).

Ако х 1 , х 2 …., х не извадка от общата съвкупност на случайна променлива ξ, след това чрез оценка на параметъра θ е произволна функция от примерни стойности

Стойността на оценката се променя от извадка на извадка и следователно е случайна променлива. В повечето експерименти стойността на тази случайна променлива е близка до стойността на оценявания параметър, ако за всяка стойност n математическото очакване на стойността е равно на истинската стойност на параметъра, тогава се наричат ​​оценки, които удовлетворяват условието; безпристрастен. Безпристрастната оценка означава, че оценката не подлежи на системна грешка.

Оценката се нарича оценка на последователен параметър θ , ако за всяко ξ>0 е вярно

По този начин, с увеличаване на размера на извадката, точността на резултата се увеличава.

Позволявам х 1 , х 2 х н – извадка от генералната съвкупност, съответстваща на случайна променлива ξ с неизвестно математическо очакване и известна дисперсия Dξ=σ 2 . Нека изградим няколко оценки на неизвестния параметър. Ако, тогава , т.е. въпросният оценител е безпристрастен оценител. Но тъй като стойността изобщо не зависи от размера на извадката n, оценката не е валидна.

Ефективна оценка на математическото очакване на нормално разпределена случайна променлива е оценката

Оттук нататък, за да оценим неизвестното математическо очакване на случайна променлива, ще използваме средната стойност на извадката, т.е.

Съществуват стандартни (редовни) методи за получаване на оценки на неизвестни параметри на разпределението. Най-известните от тях: метод на моментите, метод на максимална вероятностИ метод на най-малките квадрати.

т.2 Точкови оценки на дисперсията.

За дисперсията σ 2 на случайна променлива ξ Може да се предложи следната оценка:

къде е средната стойност на извадката.

Доказано е, че тази оценка е валидна, но разместен.

Като последователна безпристрастна оценка на дисперсията използвайте стойността

Това е точно безпристрастността на оценката с 2 обяснява я повече честа употребакато оценка на величината дξ.

Имайте предвид, че Mathcad предлага като оценка на дисперсията стойността , не s 2: функция вар(х) изчислява стойността

Където означава (х) -извадкова средна стойност.

ЗАДАЧА 6.5

Μξ и дисперсия дξ случайна променлива ξ въз основа на примерните стойности, дадени в задачата.

Процедура за изпълнение на задачата

    Прочетете файл, съдържащ примерни стойности от диска, или въведете определена проба от клавиатурата.

    Изчисляване на точкови оценки Μξ И дξ.

Пример за изпълнение на задача

Намерете последователни безпристрастни оценки на математическото очакване Μξ и дисперсия дξ случайна величина ξ според примерните стойности, дадени в следната таблица.

За извадка, дефинирана от таблица от този тип (дадена е стойността на извадката и число, показващо колко пъти тази стойност се среща в извадката), формулите за последователни безпристрастни оценки на очакването и дисперсията са:

, ,

Където к - брой стойности в таблицата; н i - брой стойности х i в пробата; н- размер на извадката.

По-долу е даден фрагмент от работен документ на Mathcad с изчисления на точкови оценки.

От горните изчисления става ясно, че предубедената оценка дава подценяване на оценката на дисперсията.

клауза 3. Точкова оценка на вероятността за събитие

Да предположим, че в някакъв експеримент събитието А(благоприятен резултат от теста) възниква с вероятност стри не се случва с вероятност р = 1 - Р.Задачата е да се получи оценка на неизвестния параметър на разпределението стрвъз основа на резултатите от серията нслучайни експерименти. За определен брой тестове нброй благоприятни резултати мв серия от тестове - случайна променлива с разпределение на Бернули. Нека го обозначим с буквата μ.

Ако събитието Ав поредица от нпроведени независими тестове

мпъти, след това оценката на стойността стрпредлага се да се изчисли по формулата

Нека разберем свойствата на предложената оценка. Тъй като случайната променлива μ тогава има разпределение на Бернули Μμ= н.п. ИМ = М = p, т.е. има безпристрастна оценка.

За тестовете на Бернули е валидна теоремата на Бернули, според която , т.е. клас стр богат.

Доказано е, че тази оценка е ефективна, тъй като при равни други условия има минимална дисперсия.

В Mathcad за симулиране на извадка от стойности на случайна променлива с разпределение на Бернули е предназначена функцията rbinom(fc,η,ρ), която генерира вектор от Да се произволни числа, κα­ ι всеки от които е равен на броя успехи в серия от η независими опити с вероятност за успех ρ във всеки.

ЗАДАЧА 6.6

Симулирайте няколко проби от стойности на случайна променлива с разпределение на Бернули с дадена стойност на параметъра Р. Изчислете оценката на параметъра за всяка проба стри сравнете с посочената стойност. Представете резултатите от изчислението графично.

Процедура за изпълнение на задачата

1. Използване на функцията rbinom(1, н, стр), описват и генерират последователност от стойности на случайна променлива, имаща разпределение на Бернули с дадено стрИ нЗа н = 10, 20, ..., Ν, като функция от размера на извадката П.

2. Изчислете за всяка стойност нточкови вероятностни оценки Р.

Пример за изпълнение на задача

Пример за получаване на точкови оценки на обемни проби н= 10, 20,..., 200 стойности на случайна променлива μ с разпределение на Бернули с параметър стр= 0,3, дадено по-долу.

Забележка: Тъй като стойността на функцията е вектор, брой успехи в серия ннезависими опити с вероятност за успех стрвъв всеки опит се съдържа в първия компонент на вектора rbinom(1, н, стр), т.е. броят на успехите е rbinom(1, н, стр). В горния фрагмент к- аз векторен компонент Ρ съдържа броя на успехите в серията 10 кнезависими тестове за к = 1,2,..., 200.

т. 4. Точкова оценка на параметри на равномерно разпределение

Нека да разгледаме още един поучителен пример. Нека е извадка от генералната съвкупност, съответстваща на случайна променлива ξ, която има равномерно разпределение в сегмент с неизвестен параметър θ . Нашата задача е да оценим този неизвестен параметър.

Нека разгледаме един от възможни начиниизграждане на необходимата оценка. Ако ξ е случайна променлива, която има равномерно разпределение на сегмента, тогава Μ ξ = . Тъй като оценката на величината известен Μξ =, след това за оценка на параметъра θ можете да вземете оценка

Безпристрастността на оценката е очевидна:

След като изчислихме дисперсията и границата D като n →∞, проверяваме последователността на оценката:

За да получите друга оценка на параметъра θ Нека да разгледаме други статистики. Нека = max). Нека намерим разпределението на случайната променлива:

След това математическото очакване и дисперсията на случайната променлива

с разпределение са равни съответно:

;

тези. оценката е последователна, но пристрастна. Въпреки това, ако вместо = max) считаме = max), тогава и двете , и следователно оценката е последователна и безпристрастна.

В същото време, тъй като

значително по-ефективен от оценката

Например, с n = 97, разпространението на оценката θ^ е 33 rala по-малко от разпространението на оценката

Последният пример още веднъж показва, че изборът на статистическа оценка за неизвестен параметър на разпределение е важна и нетривиална задача.

В Mathcad за симулиране на извадка от стойности на случайна променлива, която има равномерно разпределение в интервала [a, b], е предназначена функцията runif(fc,o,b), която генерира вектор от Да се случайни числа, всяко от които е стойността на случайна променлива, равномерно разпределена в интервала [a, 6].



Ново в сайта

>

Най - известен