Domov Zubní ošetření Odhady matematického očekávání a rozptylu. Odhad matematického očekávání náhodné veličiny

Odhady matematického očekávání a rozptylu. Odhad matematického očekávání náhodné veličiny

Nechť jsou provedeny nezávislé experimenty na náhodné veličině s neznámým matematickým očekáváním a rozptylem, které daly výsledky - . Vypočítejme konzistentní a nezkreslené odhady pro parametry a .

Jako odhad matematického očekávání bereme aritmetický průměr experimentálních hodnot

. (2.9.1)

Podle zákona vysoká čísla tento odhad je bohatý , s hodnotou podle pravděpodobnosti. Toto stejné hodnocení je také objektivní , protože

. (2.9.2)

Rozptyl tohoto odhadu je

. (2.9.3)

Lze ukázat, že pro zákon normálního rozdělení tento odhad je efektivní . U jiných zákonů tomu tak být nemusí.

Pojďme nyní odhadnout rozptyl. Nejprve zvolíme pro odhad vzorec pro statistický rozptyl

. (2.9.4)

Pojďme zkontrolovat konzistenci odhadu rozptylu. Otevřeme závorky ve vzorci (2.9.4)

.

Když první člen konverguje v pravděpodobnosti k hodnotě , ve druhém - až. Náš odhad tedy konverguje v pravděpodobnosti k rozptylu

,

proto je bohatý .

Pojďme zkontrolovat nepřemístěný odhady pro množství. K tomu dosadíme výraz (2.9.1) do vzorce (2.9.4) a vezmeme v úvahu, že náhodné proměnné nezávislý

,

. (2.9.5)

Přesuňme se ve vzorci (2.9.5) k fluktuacím náhodných veličin

Otevřením závorek, dostaneme

,

. (2.9.6)

Vypočítejme matematické očekávání hodnoty (2.9.6) s přihlédnutím k tomu

. (2.9.7)

Vztah (2.9.7) ukazuje, že hodnota vypočtená pomocí vzorce (2.9.4) není nestranný odhad pro rozptýlení. Jeho matematické očekávání není stejné, ale poněkud menší. Takové hodnocení vede k sestupné systematické chybě. Chcete-li takové zkreslení odstranit, musíte provést opravu vynásobením hodnoty . Tento opravený statistický rozptyl pak může sloužit jako nezaujatý odhad rozptylu

. (2.9.8)

Tento odhad je stejně platný jako odhad , odkdy je hodnota .

V praxi je někdy vhodnější místo odhadu (2.9.8) použít ekvivalentní odhad spojený s druhým počátečním statistickým momentem

. (2.9.9)

Odhady (2.9.8), (2.9.9) nejsou účinné. Lze ukázat, že v případě normálního distribučního zákona budou asymptoticky účinné (při bude směřovat k minimální možné hodnotě).

Můžeme tedy formulovat následující pravidla pro objemově omezené zpracování statistický materiál. Pokud v nezávislých experimentech náhodná veličina nabývá hodnot s neznámým matematickým očekáváním a rozptylem, pak k určení těchto parametrů je třeba použít přibližné odhady

(2.9.10)

Konec práce -

Toto téma patří do sekce:

Přednášky z matematiky teorie pravděpodobnosti matematická statistika

Katedra vyšší matematiky a informatiky.. Poznámky k přednášce.. z matematiky..

Pokud potřebujete další materiál k tomuto tématu nebo jste nenašli to, co jste hledali, doporučujeme použít vyhledávání v naší databázi prací:

Co uděláme s přijatým materiálem:

Pokud byl pro vás tento materiál užitečný, můžete si jej uložit na svou stránku na sociálních sítích:

Všechna témata v této sekci:

Teorie pravděpodobnosti
Teorie pravděpodobnosti je odvětví matematiky, ve kterém se studují vzorce náhodných hromadných jevů. Jev, který je náhodný, se nazývá

Statistická definice pravděpodobnosti
Událost je náhodný jev, který se může, ale nemusí objevit jako výsledek zkušenosti (nejednoznačný jev). Události uveďte velkými latinskými písmeny

Prostor elementárních událostí
Nechť je mnoho událostí spojených s nějakým zážitkem a: 1) v důsledku zážitku se objeví jedna jediná věc

Akce na akcích
Součet dvou událostí a

Přeskupení
Počet různých permutací prvků je označen

Umístění
Umístěním prvků podle

Kombinace
Kombinace prvků

Vzorec pro přidání pravděpodobností pro nekompatibilní události
Teorém. Pravděpodobnost součtu dvou neslučitelných událostí je rovna součtu pravděpodobností těchto událostí. (1

Vzorec pro přidání pravděpodobností pro libovolné události
Teorém. Pravděpodobnost součtu dvou událostí je rovna součtu pravděpodobností těchto událostí bez pravděpodobnosti jejich součinu.

Vzorec pro násobení pravděpodobnosti
Nechte dvě události a být dán. Zvažte událost

Vzorec celkové pravděpodobnosti
Nechť je úplná skupina neslučitelných událostí, nazývají se hypotézy. Uvažujme o nějaké události

Vzorec pravděpodobnosti hypotézy (Bayesovský)
Uvažujme znovu - kompletní skupinu neslučitelných hypotéz a událost

Asymptotický Poissonův vzorec
V případech, kdy je počet testů velký a pravděpodobnost výskytu události

Náhodné diskrétní veličiny
Náhodná veličina je veličina, která při opakování experimentu může nabývat nestejných hodnot. číselné hodnoty. Náhodná veličina se nazývá diskrétní,

Náhodné spojité proměnné
Pokud může náhodná veličina v důsledku experimentu nabývat libovolné hodnoty z určitého segmentu nebo celé reálné osy, pak se nazývá spojitá. Zákon

Funkce hustoty pravděpodobnosti náhodné spojité veličiny
Nech být. Vezměme si bod a dáme mu přírůstky

Numerické charakteristiky náhodných veličin
Náhodné diskrétní nebo spojité proměnné jsou považovány za zcela specifikované, pokud jsou známy jejich distribuční zákony. Ve skutečnosti, když znáte distribuční zákony, můžete vždy vypočítat pravděpodobnost zásahu

Kvantily náhodných veličin
Kvantil řádu náhodné spojité proměnné

Matematické očekávání náhodných veličin
Očekávaná hodnota náhodná proměnná charakterizuje jeho průměrnou hodnotu. Všechny hodnoty náhodné proměnné jsou seskupeny kolem této hodnoty. Podívejme se nejprve na náhodnou diskrétní veličinu

Směrodatná odchylka a rozptyl náhodných veličin
Uvažujme nejprve náhodnou diskrétní proměnnou. Režim číselných charakteristik, medián, kvantily a matematické očekávání

Momenty náhodných veličin
Teorie pravděpodobnosti kromě matematického očekávání a disperze využívá číselné charakteristiky vyšších řádů, které se nazývají momenty náhodných veličin.

Věty o numerických charakteristikách náhodných veličin
Věta 1. Matematické očekávání nenáhodné hodnoty se rovná této hodnotě samotné. Důkaz: Nech

Zákon binomického rozdělení

Poissonův distribuční zákon
Nechť náhodná diskrétní proměnná nabývá hodnot

Zákon o jednotné distribuci
Jednotné právo rozdělení náhodné spojité veličiny se nazývá zákon funkce hustoty pravděpodobnosti, který

Zákon normálního rozdělení
Zákon normálního rozdělení náhodné spojité proměnné je zákon funkce hustoty

Zákon exponenciálního rozdělení
Exponenciální nebo exponenciální rozdělení náhodné proměnné se používá v aplikacích teorie pravděpodobnosti, jako je teorie ve frontě, teorie spolehlivosti

Systémy náhodných veličin
V praxi se při aplikacích teorie pravděpodobnosti často setkáváme s problémy, kdy výsledky experimentu nejsou popsány jednou náhodnou veličinou, ale několika náhodnými veličinami najednou.

Systém dvou náhodných diskrétních proměnných
Nechť jsou dva náhodné diskrétní veličiny vytvořit systém. Náhodná hodnota

Systém dvou náhodných spojitých veličin
Nechť nyní systém tvoří dvě náhodné spojité proměnné. Distribuční zákon tohoto systému se nazývá pravděpodobně

Podmíněné zákony distribuce
Nechť závislé náhodné spojité veličiny

Numerické charakteristiky soustavy dvou náhodných veličin
Počáteční moment řádu soustavy náhodných veličin

Systém více náhodných veličin
Výsledky získané pro systém dvou náhodných veličin lze zobecnit na případ systémů sestávajících z libovolného počtu náhodných veličin. Nechť soustavu tvoří množina

Zákon normálního rozdělení soustavy dvou náhodných veličin
Uvažujme systém dvou náhodných spojité veličiny. Distribuční zákon tohoto systému je normální distribuční zákon

Limitní věty teorie pravděpodobnosti
Hlavním cílem disciplíny teorie pravděpodobnosti je studium vzorců náhodných hromadných jevů. Praxe ukazuje, že pozorování množství homogenních náhodných jevů odhalí

Čebyševova nerovnost
Uvažujme náhodnou veličinu s matematickým očekáváním

Čebyševova věta
Pokud jsou náhodné proměnné párově nezávislé a mají konečné, kolektivně ohraničené rozptyly

Bernoulliho věta
S neomezeným nárůstem počtu experimentů frekvence výskytu události konverguje v pravděpodobnosti k pravděpodobnosti události

Teorém centrálního limitu
Při sčítání náhodných veličin s libovolnými zákony rozdělení, ale se společně omezenými rozptyly, zákon rozdělení

Hlavní problémy matematické statistiky
Výše diskutované zákony teorie pravděpodobnosti představují matematické vyjádření skutečných vzorců, které skutečně existují v různých náhodných hromadných jevech. Studium

Jednoduchá statistická populace. Statistická distribuční funkce
Uvažujme nějakou náhodnou veličinu, jejíž distribuční zákon je neznámý. Vyžadováno na základě zkušeností

Statistická řada. sloupcový graf
S velkým počtem pozorování (řádově stovky) populace se stává nepohodlným a těžkopádným pro záznam statistických materiálů. Pro přehlednost a kompaktnost statistický materiál

Numerické charakteristiky statistického rozdělení
V teorii pravděpodobnosti byly uvažovány různé číselné charakteristiky náhodných veličin: matematické očekávání, disperze, počáteční a centrální body různé objednávky. Podobná čísla

Výběr teoretického rozdělení pomocí metody momentů
Jakékoli statistické rozdělení nevyhnutelně obsahuje prvky náhodnosti spojené s omezeným počtem pozorování. S velkým počtem pozorování jsou tyto prvky náhodnosti vyhlazeny,

Ověření věrohodnosti hypotézy o podobě distribučního zákona
Nechte dané statistické rozdělení aproximováno nějakou teoretickou křivkou popř

Kritéria souhlasu
Podívejme se na jedno z nejčastěji používaných kritérií dobré shody – tzv. Pearsonovo kritérium. Tipni si

Bodové odhady pro neznámé distribuční parametry
V pp. 2.1. – 2.7 jsme podrobně zkoumali, jak vyřešit první a druhý hlavní problém matematické statistiky. Jedná se o problémy stanovení zákonů rozdělení náhodných veličin na základě experimentálních dat

Interval spolehlivosti. Pravděpodobnost spolehlivosti
V praxi, s malým počtem experimentů na náhodné veličině, přibližné nahrazení neznámého parametru

Nechť existuje náhodná veličina X s matematickým očekáváním m a rozptyl D, přičemž oba tyto parametry jsou neznámé. Nadhodnota X vyrobeno N nezávislých experimentů, jejichž výsledkem je soubor Nčíselné výsledky x 1, x 2, …, x N. Jako odhad matematického očekávání je přirozené navrhnout aritmetický průměr pozorovaných hodnot

(1)

Zde jako x i jsou uvažovány konkrétní hodnoty (čísla) získané jako výsledek N experimenty. Pokud vezmeme ostatní (nezávisle na předchozích) N experimenty, pak samozřejmě dostaneme jinou hodnotu. Pokud si vezmete více N experimenty, pak získáme další novou hodnotu. Označme podle X i náhodná proměnná vyplývající z i experiment, pak implementace X i budou čísla získaná z těchto experimentů. Pochopitelně náhodná veličina X i bude mít stejnou funkci hustoty pravděpodobnosti jako původní náhodná veličina X. Také věříme, že náhodné proměnné X i A Xj jsou nezávislí, když i, ne rovné j(různé na sobě nezávislé experimenty). Proto vzorec (1) přepíšeme do jiného (statistického) tvaru:

(2)

Ukažme, že odhad je nestranný:

Matematické očekávání výběrového průměru se tedy rovná skutečnému matematickému očekávání náhodné veličiny m. To je poměrně předvídatelná a pochopitelná skutečnost. V důsledku toho lze výběrový průměr (2) brát jako odhad matematického očekávání náhodné veličiny. Nyní vyvstává otázka: co se stane s rozptylem matematického odhadu očekávání, když se počet experimentů zvyšuje? Ukazují to analytické výpočty

kde je rozptyl matematického odhadu očekávání (2), a D- skutečný rozptyl náhodné veličiny X.

Z výše uvedeného vyplývá, že s rostoucí N(počet experimentů) klesá rozptyl odhadu, tzn. Čím více sčítáme nezávislé realizace, tím blíže k matematickému očekávání dostaneme odhad.


Odhady matematického rozptylu

Na první pohled se zdá nejpřirozenější hodnocení

(3)

kde se vypočítá pomocí vzorce (2). Zkontrolujeme, zda je odhad nezkreslený. Vzorec (3) lze napsat takto:

Dosadíme výraz (2) do tohoto vzorce:

Pojďme najít matematické očekávání odhadu rozptylu:

(4)

Protože rozptyl náhodné veličiny nezávisí na tom, jaké je matematické očekávání náhodné veličiny, vezměme matematické očekávání rovné 0, tzn. m = 0.

(5)
na .(6)

Nejdůležitější číselné charakteristiky náhodné veličiny X jsou ona matematické očekávání m x =M a disperzeσ 2 x = D[x] = M[(X – m x) 2 ] = M –. Číslo m x je průměrná hodnota náhodné veličiny, kolem které jsou rozptýleny hodnoty veličin X, měřítkem tohoto šíření je rozptyl D[x] A standardní odchylka:

s x =(1.11)

Budeme dále zvažovat důležitý úkol studovat pozorovanou náhodnou veličinu. Nechť je nějaký vzorek (označíme ho S) náhodná proměnná X. Je třeba provést odhad z dostupného vzorku neznámé hodnoty m x A .

Zabývá se teorií odhadů různých parametrů matematické statistiky významné místo. Proto nejprve uvažujme společný úkol. Budiž třeba odhadnout nějaký parametr A podle vzorku S. Každé takové hodnocení A* je nějaká funkce a*=a*(S) z hodnot vzorku. Hodnoty vzorku jsou náhodné, proto samotný odhad A* je náhodná veličina. Je možné postavit mnoho různé odhady(tj. funkce) A*, ale zároveň je žádoucí mít „dobré“ nebo dokonce „nejlepší“, v jistém smyslu hodnocení. Na hodnocení jsou obvykle kladeny následující tři přirozené požadavky.

1. Neposunutý. Matematické očekávání hodnocení A* se musí rovnat přesné hodnotě parametru: M = a. Jinými slovy, skóre A* neměl by mít systematickou chybu.

2. Bohatství. S nekonečným nárůstem velikosti vzorku se odhad A* by měla konvergovat k přesné hodnotě, to znamená, že s rostoucím počtem pozorování má chyba odhadu tendenci k nule.

3. Účinnost.Školní známka A* se říká, že je efektivní, pokud je nezaujatý a má nejmenší možný rozptyl chyb. V tomto případě je rozptyl odhadů minimální A* vzhledem k přesné hodnotě a odhad je v určitém smyslu „nejpřesnější“.

Bohužel ne vždy je možné sestavit hodnocení, které splňuje všechny tři požadavky současně.

K odhadu matematického očekávání se nejčastěji používá odhad.

= , (1.12)

tedy aritmetický průměr vzorku. Pokud náhodná veličina X má konečný m x A s x, pak odhad (1.12) není zkreslený a konzistentní. Tento odhad je účinný např X má normální rozdělení (obrázek 1.4, příloha 1). U jiných distribucí nemusí být efektivní. Například v případě rovnoměrné rozložení(Obrázek 1.1, Příloha 1) bude nestranný, konzistentní odhad

(1.13)

Odhad (1,13) pro normální rozdělení přitom nebude konzistentní ani efektivní a bude se s rostoucí velikostí vzorku dokonce zhoršovat.

Tedy pro každý typ rozdělení náhodné veličiny X měli byste použít svůj odhad matematického očekávání. V naší situaci však lze typ distribuce znát pouze orientačně. Proto použijeme odhad (1.12), který je celkem jednoduchý a má nejvíce důležité vlastnosti nezaujatost a důslednost.

K odhadu matematického očekávání pro seskupený vzorek se používá následující vzorec:

= , (1.14)

které lze získat z předchozího, uvážíme-li vše m i vzorové hodnoty zahrnuté v i-tý interval rovný zástupce z i tento interval. Tento odhad je přirozeně hrubší, ale vyžaduje podstatně méně výpočtů, zejména při velké velikosti vzorku.

Nejčastěji používaný odhad pro odhad rozptylu je:

= , (1.15)

Tento odhad není zkreslený a je platný pro jakoukoli náhodnou veličinu X, mající konečné momenty až do čtvrtého řádu včetně.

V případě seskupeného vzorku je použitý odhad:

= (1.16)

Odhady (1.14) a (1.16) jsou zpravidla neobjektivní a neudržitelné, protože jejich matematická očekávání a limity, ke kterým konvergují, se liší od m x a z důvodu výměny všech vzorových hodnot zahrnutých v i-tý interval, na zástupce intervalu z i.

Všimněte si, že pro velké n, součinitel n/(n – 1) ve výrazech (1.15) a (1.16) se blíží jednotě, lze jej tedy vynechat.

Intervalové odhady.

Nechat přesná hodnota nějaký parametr se rovná A a jeho odhad byl nalezen tak jako) podle vzorku S. Hodnocení A* odpovídá bodu na číselné ose (obr. 1.5), proto se tento odhad nazývá směřovat. Všechny odhady uvedené v předchozím odstavci jsou bodové odhady. Téměř vždy, díky náhodě

a* ¹ a, a můžeme jen doufat, že bod A* je někde poblíž A. Ale jak blízko? Jakýkoli jiný bodový odhad bude mít stejnou nevýhodu - nedostatek míry spolehlivosti výsledku.


Obr.1.5. Odhad bodového parametru.

Konkrétnější jsou v tomto ohledu intervalové odhady. Intervalové skóre představuje interval I b = (a, b), ve kterém je s danou pravděpodobností nalezena přesná hodnota odhadovaného parametru b. Interval já b volal interval spolehlivosti a pravděpodobnost b volal pravděpodobnost spolehlivosti a lze je považovat za spolehlivost posouzení.

Interval spolehlivosti je založen na dostupném vzorku S, je náhodný v tom smyslu, že jeho hranice jsou náhodné tak jako) A b(S), kterou vypočítáme z (náhodného) vzorku. Proto b existuje možnost, že náhodný interval já b bude pokrývat nenáhodný bod A. Na Obr. 1.6. interval já b pokryl bod A, A Ib*- Ne. Není proto zcela správné to říkat a " spadá“ do intervalu.

Pokud pravděpodobnost spolehlivosti b velké (např. b = 0,999), pak téměř vždy přesnou hodnotu A je ve vytvořeném intervalu.


Obr.1.6. Intervaly spolehlivosti parametru A pro různé vzorky.

Podívejme se na způsob výstavby interval spolehlivosti pro matematické očekávání náhodné veličiny X, na základě teorém centrálního limitu.

Nechť náhodnou veličinu X má neznámá matematická očekávání m x A známý rozptyl. Pak na základě centrální limitní věty je aritmetický průměr:

= , (1.17)

Výsledek n nezávislé testy množství X je náhodná veličina, jejíž distribuce jako celek n, blízko k normální distribuce s průměrem m x a standardní odchylka. Proto náhodná veličina

(1.18)

má rozdělení pravděpodobnosti, které lze uvažovat standardní normální s hustotou distribuce j(t), jehož graf je na obr. 1.7 (stejně jako na obr. 1.4, příloha 1).



Obr.1.7. Rozdělení hustoty pravděpodobnosti náhodné veličiny t.

Nechť je dána pravděpodobnost spolehlivosti b A tb -číslo splňující rovnici

b = Ф 0 (t b) – Ф 0 (-t b) = 2 Ф 0 (t b),(1.19)

Kde - Laplaceova funkce. Pak pravděpodobnost pádu do intervalu (-t b, t b) se bude rovnat šrafovanému na obr. 1.7. plocha a na základě výrazu (1.19) se rovná b. Proto

b = P(-tb< < t b) = P( – t b< m x < + t b) =

= P( – t b< m x < + t b).(1.20)

Jako interval spolehlivosti tedy můžeme brát interval

I b = ( – t b; + t b ) , (1.21)

protože výraz (1.20) znamená, že neznámá přesná hodnota m x je v já b s danou pravděpodobností spolehlivosti b. Na stavbu já b potřebné podle specifikace b nalézt t b z rovnice (1.19). Uveďme pár hodnot t b v budoucnu potřeba :

t 0,9 = 1,645; t 0,95 = 1,96; t 0,99 = 2,58; t 0,999 = 3,3.

Při odvozování výrazu (1.21) se předpokládalo, že je známa přesná hodnota směrodatné odchylky s x. Ne vždy se to však pozná. Použijme tedy jeho odhad (1.15) a získáme:

I b = ( – t b; +tb). (1.22)

V souladu s tím odhady a získané ze seskupeného vzorku poskytují následující vzorec pro interval spolehlivosti:

I b = ( – t b; +tb). (1.23)

ÚČEL PŘEDNÁŠKY: představit koncept odhadu neznámého distribučního parametru a uvést klasifikaci těchto odhadů; získat bodové a intervalové odhady matematického očekávání a rozptylu.

V praxi je ve většině případů zákon rozdělení náhodné veličiny neznámý a podle výsledků pozorování
je nutné odhadnout číselné charakteristiky (například matematické očekávání, rozptyl nebo jiné momenty) nebo neznámý parametr , který určuje distribuční zákon (hustota distribuce)
studovaná náhodná veličina. Pro exponenciální rozdělení nebo Poissonovo rozdělení tedy stačí odhadnout jeden parametr, ale pro normální rozdělení je třeba odhadnout parametry dva - matematické očekávání a rozptyl.

Typy hodnocení

Náhodná hodnota
má hustotu pravděpodobnosti
, Kde – neznámý distribuční parametr. V důsledku experimentu byly získány hodnoty této náhodné proměnné:
. Provést hodnocení v podstatě znamená, že vzorové hodnoty náhodné proměnné musí být spojeny s určitou hodnotou parametru , tedy vytvořit nějakou funkci výsledků pozorování
, jehož hodnota je brána jako odhad parametr . Index udává počet provedených experimentů.

Zavolá se jakákoli funkce, která závisí na výsledcích pozorování statistika. Protože výsledky pozorování jsou náhodné veličiny, bude náhodnou veličinou i statistika. Proto posouzení
neznámý parametr by měla být považována za náhodnou veličinu a její hodnota se vypočítá z experimentálních dat v objemu , – jako jeden z možné hodnoty tuto náhodnou veličinu.

Odhady distribučních parametrů (číselné charakteristiky náhodné veličiny) se dělí na bodové a intervalové. Bodový odhad parametr určeno jedním číslem a jeho přesnost je charakterizována rozptylem odhadu. Intervalový odhad nazývá skóre, které je určeno dvěma čísly, A – konce intervalu pokrývajícího odhadovaný parametr s danou pravděpodobností spolehlivosti.

Klasifikace bodové odhady

Pro bodový odhad neznámého parametru
nejlepší z hlediska přesnosti, musí být konzistentní, nezaujatý a účinný.

Bohatý tzv. hodnocení
parametr , pokud konverguje v pravděpodobnosti k odhadovanému parametru, tzn.

. (8.8)

Na základě Čebyševovy nerovnosti lze ukázat, že dostatečný stav splněním vztahu (8.8) je rovnost

.

Konzistence je asymptotickou charakteristikou odhadu at
.

Objektivní tzv. hodnocení
(odhad bez systematické chyby), jehož matematické očekávání se rovná odhadovanému parametru, tzn.

. (8.9)

Pokud rovnost (8.9) není splněna, pak se odhad nazývá vychýlený. Rozdíl
nazývaná zkreslení nebo systematická chyba v odhadu. Je-li rovnost (8.9) splněna pouze pro
, pak se odpovídající odhad nazývá asymptoticky nestranný.

Je třeba poznamenat, že pokud je konzistence téměř povinnou podmínkou pro všechny v praxi používané odhady (nekonzistentní odhady se používají extrémně zřídka), pak je vlastnost nestrannosti pouze žádoucí. Mnoho často používaných odhadů nemá nezaujatou vlastnost.

Obecně přesnost odhadu nějakého parametru , získaných na základě experimentálních dat
, vyznačující se střední čtvercovou chybou

,

které lze zredukovat do podoby

,

kde je ten rozptyl,
– čtvercové zkreslení odhadu.

Pokud je odhad nestranný, pak

V konečném odhady se mohou lišit střední čtvercovou chybou . Přirozeně, čím menší je tato chyba, tím přesněji jsou hodnoty hodnocení seskupeny kolem odhadovaného parametru. Proto je vždy žádoucí, aby chyba v odhadu byla co nejmenší, tedy aby byla splněna podmínka

. (8.10)

Hodnocení , splňující podmínku (8.10), se nazývá odhad s minimální čtvercovou chybou.

Efektivní tzv. hodnocení
, u kterého střední kvadratická chyba není větší než střední kvadratická chyba jakéhokoli jiného odhadu, tzn.

Kde – jakýkoli jiný odhad parametrů .

Je známo, že rozptyl jakéhokoli nestranného odhadu jednoho parametru splňuje Cramer-Raoovu nerovnost

,

Kde
– podmíněné rozdělení hustoty pravděpodobnosti získaných hodnot náhodné veličiny při skutečné hodnotě parametru .

Tedy nestranný odhad
, pro které se Cramerova–Raova nerovnost stane rovností, bude efektivní, tj. takový odhad má minimální rozptyl.

Bodové odhady očekávání a rozptylu

Pokud se uvažuje náhodná veličina
, která má matematické očekávání a rozptyl , pak jsou oba tyto parametry považovány za neznámé. Proto nad náhodnou veličinou
vyrobeno nezávislé experimenty, které dávají výsledky:
. Je nutné najít konzistentní a nezkreslené odhady neznámých parametrů A .

Podle odhadů A Obvykle se volí statistický (výběrový) průměr a statistický (výběrový) rozptyl:

; (8.11)

. (8.12)

Odhad matematického očekávání (8.11) je konzistentní podle zákona velkých čísel (Čebyševova věta):

.

Očekávání náhodné veličiny

.

Proto ten odhad je nezaujatý.

Rozptyl matematického odhadu očekávání:

Pokud náhodná veličina
se rozděluje podle normálního zákona, pak odhad je také účinný.

Očekávání odhadu rozptylu

Ve stejný čas

.

Protože
, A
, pak dostaneme

. (8.13)

Tím pádem,
– neobjektivní hodnocení, ačkoli je konzistentní a účinné.

Ze vzorce (8.13) vyplývá, že získat nezkreslený odhad
výběrový rozptyl (8.12) by měl být upraven takto:

což je považováno za „lepší“ ve srovnání s odhadem (8.12), i když obecně tyto odhady jsou téměř stejné.

Metody získávání odhadů distribučních parametrů

V praxi často na základě analýzy fyzikálního mechanismu, který náhodnou veličinu generuje
, můžeme vyvodit závěr o zákonu rozdělení této náhodné veličiny. Parametry tohoto rozdělení jsou však neznámé a musí být odhadnuty z experimentálních výsledků, obvykle prezentovaných ve formě konečného vzorku
. K řešení tohoto problému se nejčastěji používají dvě metody: metoda momentů a metoda maximální věrohodnosti.

Metoda momentů. Metoda spočívá ve zrovnoprávnění teoretických momentů s odpovídajícími empirickými momenty stejného řádu.

Empirická východiska -tého řádu jsou určeny vzorcem:

,

a odpovídající teoretické počáteční momenty -tý řád – vzorce:

pro diskrétní náhodné proměnné,

pro spojité náhodné proměnné,

Kde – odhadovaný distribuční parametr.

Získat odhady parametrů rozdělení obsahující dva neznámé parametry A , je sestavena soustava dvou rovnic

Kde A – teoretické a empirické ústřední momenty druhého řádu.

Řešením soustavy rovnic jsou odhady A neznámé distribuční parametry A .

Porovnáním teoretických a empirických počátečních momentů prvního řádu získáme, že odhadem matematického očekávání náhodné veličiny
, mající libovolné rozdělení, bude výběrový průměr, tzn.
. Poté, když přirovnáme teoretické a empirické centrální momenty druhého řádu, získáme, že odhad rozptylu náhodné veličiny
, který má libovolné rozdělení, je určen vzorcem

.

Podobným způsobem lze nalézt odhady teoretických momentů libovolného řádu.

Metoda momentů je jednoduchá a nevyžaduje složité výpočty, ale odhady získané touto metodou jsou často neúčinné.

Metoda maximální pravděpodobnosti. Metoda maximální věrohodnosti bodového odhadu neznámých distribučních parametrů spočívá v nalezení maxima funkce jednoho nebo více odhadovaných parametrů.

Nechat
je spojitá náhodná veličina, která jako výsledek testy nabraly hodnoty
. Získání odhadu neznámého parametru je nutné takovou hodnotu najít , při kterém by pravděpodobnost realizace výsledného vzorku byla maximální. Protože
představují vzájemně nezávislé veličiny se stejnou hustotou pravděpodobnosti
, Že pravděpodobnostní funkce zavolejte funkci argument :

Odhadem parametru s maximální pravděpodobností tato hodnota se nazývá , při kterém věrohodnostní funkce dosahuje maxima, tj. je řešením rovnice

,

což jasně závisí na výsledcích testů
.

Vzhledem k tomu, funkce
A
dosáhnout maxima při stejných hodnotách
, pak pro zjednodušení výpočtů často používají logaritmickou věrohodnostní funkci a hledají kořen odpovídající rovnice

,

který se nazývá pravděpodobnostní rovnice.

Pokud potřebujete vyhodnotit několik parametrů
rozdělení
, pak bude pravděpodobnostní funkce záviset na těchto parametrech. Chcete-li najít odhady
distribuční parametry je nutné soustavu řešit pravděpodobnostní rovnice

.

Metoda maximální věrohodnosti poskytuje konzistentní a asymptoticky účinné odhady. Odhady získané metodou maximální věrohodnosti jsou však zkreslené a pro nalezení odhadů je navíc často nutné řešit poměrně složité soustavy rovnic.

Intervalové odhady parametrů

Přesnost bodových odhadů je charakterizována jejich rozptylem. Neexistují však žádné informace o tom, jak blízko jsou získané odhady skutečným hodnotám parametrů. V řadě úloh je potřeba nejen najít parametr vhodnou číselnou hodnotu, ale také vyhodnotit její přesnost a spolehlivost. Musíte zjistit, k jakým chybám může výměna parametru vést jeho bodový odhad as jakou mírou spolehlivosti bychom měli očekávat, že tyto chyby nepřekročí známé limity.

Takové úkoly jsou zvláště důležité, pokud existuje malý počet experimentů. , kdy bodový odhad převážně náhodná a přibližná výměna na může vést k významným chybám.

Kompletnější a spolehlivým způsobem odhad parametrů rozdělení spočívá v určení nikoli jedné bodové hodnoty, ale intervalu, který s danou pravděpodobností pokrývá skutečnou hodnotu odhadovaného parametru.

Nechte podle výsledků experimentů byl získán nestranný odhad
parametr . Je třeba vyhodnotit možnou chybu. Je vybrána nějaká dostatečně velká pravděpodobnost
(například), že událost s touto pravděpodobností lze považovat za prakticky jistou událost a taková hodnota se najde , pro který

. (8.15)

V tomto případě je rozsah prakticky možných hodnot chyby, ke které dochází při výměně na , vůle
, a ty velké absolutní hodnota chyby se objeví jen s nízkou pravděpodobností .

Výraz (8.15) znamená, že s pravděpodobností
neznámá hodnota parametru spadá do intervalu

. (8.16)

Pravděpodobnost
volal pravděpodobnost spolehlivosti a interval , pokrývající s pravděpodobností je volána skutečná hodnota parametru interval spolehlivosti. Všimněte si, že je nesprávné říkat, že hodnota parametru leží v intervalu spolehlivosti s pravděpodobností . Použitá formulace (pokrývá) znamená, že ačkoli je odhadovaný parametr neznámý, má konstantní hodnotu, a proto nemá žádné rozšíření, protože se nejedná o náhodnou veličinu.

PŘEDMĚT: Bodové odhady matematického očekávání. Bodové odhady rozptylu. Bodový odhad pravděpodobnosti události. Bodový odhad parametrů rovnoměrného rozdělení.

klauzule 1.Bodové odhady matematického očekávání.

Předpokládejme, že distribuční funkce náhodné veličiny ξ závisí na neznámém parametru θ : P (ξ θ;).

Li X 1 , X 2 …., X n je vzorek z obecné populace náhodné veličiny ξ, poté odhadem parametru θ je libovolná funkce vzorových hodnot

Hodnota odhadu se mění vzorek od vzorku, a je tedy náhodnou veličinou. Ve většině experimentů se hodnota této náhodné veličiny blíží hodnotě odhadovaného parametru, pokud se pro jakoukoli hodnotu n matematické očekávání hodnoty rovná skutečné hodnotě parametru, pak jsou volány odhady splňující podmínku; objektivní. Nestranný odhad znamená, že odhad nepodléhá systematické chybě.

Odhad se nazývá odhad konzistentního parametru θ , pokud pro libovolné ξ>0 platí

S rostoucí velikostí vzorku se tedy zvyšuje přesnost výsledku.

Nechat X 1 , X 2 X n – vzorek z obecné populace odpovídající náhodné veličině ξ s neznámým matematickým očekáváním a známým rozptylem Dξ=σ 2 . Vytvořme několik odhadů neznámého parametru. Pokud, tak , tj. dotyčný odhadce je nezaujatý odhad. Ale protože hodnota vůbec nezávisí na velikosti vzorku n, odhad není platný.

Efektivní odhad matematického očekávání normálně rozdělené náhodné veličiny je odhad

Od této chvíle budeme pro odhad neznámého matematického očekávání náhodné veličiny používat výběrový průměr, tzn.

Existují standardní (běžné) metody pro získávání odhadů neznámých distribučních parametrů. Nejznámější z nich: metoda momentů, metoda maximální pravděpodobnosti A metoda nejmenších čtverců.

p.2 Bodové odhady rozptylu.

Pro rozptyl σ 2 náhodné veličiny ξ Lze navrhnout následující hodnocení:

kde je průměr vzorku.

Bylo prokázáno, že tento odhad je platný, ale přemístěno.

Jako konzistentní nezkreslený odhad rozptylu použijte hodnotu

Je to právě nestrannost odhadu s 2 vysvětluje jí víc časté používání jako odhad velikosti Dξ.

Všimněte si, že Mathcad nabízí jako odhad rozptylu hodnotu , ne s 2: funkce var(X) vypočítá hodnotu

Kde znamenat (X) - ukázkový průměr.

ÚKOL 6.5

Μξ a rozptyl Dξ náhodná veličina ξ na základě vzorových hodnot uvedených v úloze.

Postup při splnění úkolu

    Přečtěte si soubor obsahující ukázkové hodnoty z disku nebo zadejte zadaný vzorek z klávesnice.

    Vypočítat odhady bodů Μξ A Dξ.

Příklad splnění úkolu

Najděte konzistentní nezkreslené odhady matematického očekávání Μξ a rozptyl Dξ náhodná proměnná ξ podle vzorových hodnot uvedených v následující tabulce.

Pro vzorek definovaný tabulkou tohoto typu (uvedena je hodnota vzorku a číslo udávající, kolikrát se tato hodnota ve vzorku vyskytuje), jsou vzorce pro konzistentní nezkreslené odhady očekávání a rozptylu:

, ,

Kde k - počet hodnot v tabulce; n i - počet hodnot X i ve vzorku; n- velikost vzorku.

Níže je uveden fragment pracovního dokumentu Mathcad s výpočty bodových odhadů.

Z výše uvedených výpočtů je zřejmé, že zkreslený odhad dává podhodnocení odhadu rozptylu.

klauzule 3. Bodový odhad pravděpodobnosti události

Předpokládejme, že v nějakém experimentu událost A(příznivý výsledek testu) se vyskytuje s pravděpodobností p a nestane se to s pravděpodobností q = 1 - R.Úkolem je získat odhad neznámého distribučního parametru p na základě výsledků série n náhodné experimenty. Pro daný počet testů n množství příznivých výsledků m v sérii testů - náhodná veličina mající Bernoulliho rozdělení. Označme to písmenem μ.

Pokud událost A v řadě n proběhly nezávislé testy

m krát, pak odhad hodnoty p navrhuje se vypočítat pomocí vzorce

Pojďme zjistit vlastnosti navrhovaného odhadu. Od náhodné veličiny μ má tedy Bernoulliho distribuci Μμ= n.p. AM = M = p, tj. existuje nestranný odhad.

Pro Bernoulliho testy platí Bernoulliho věta, podle níž , tj. školní známka p bohatý.

Bylo prokázáno, že tento odhad je efektivní, protože za jinak stejných okolností má minimální rozptyl.

V Mathcadu je pro simulaci vzorku hodnot náhodné veličiny s Bernoulliho rozdělením určena funkce rbinom(fc,η,ρ), která generuje vektor z Na náhodná čísla, κα­ ι z nichž každý je roven počtu úspěchů v sérii η nezávislých pokusů s pravděpodobností úspěchu ρ v každém.

ÚKOL 6.6

Simulujte několik vzorků hodnot náhodné veličiny s Bernoulliho rozdělením s danou hodnotou parametru R. Pro každý vzorek vypočítejte odhad parametru p a porovnat se zadanou hodnotou. Prezentujte výsledky výpočtu graficky.

Postup při splnění úkolu

1. Pomocí funkce rbinom(1, n, p), popište a vygenerujte posloupnost hodnot náhodné proměnné, která má Bernoulliho rozdělení s daným p A n Pro n = 10, 20, ..., Ν, jako funkce velikosti vzorku P.

2. Vypočítejte pro každou hodnotu n bodové odhady pravděpodobnosti R.

Příklad splnění úkolu

Příklad získání bodových odhadů pro objemové vzorky n= 10, 20,..., 200 hodnot náhodné veličiny μ mající Bernoulliho rozdělení s parametrem p= 0,3, uvedeno níže.

Poznámka. Protože hodnota funkce je vektor, počet úspěchů v sérii n nezávislé pokusy s pravděpodobností úspěchu p v každém pokusu je obsažen v první složce vektoru rbinom(1, n, p), tj. počet úspěchů je rbinom(1, n, p). Ve výše uvedeném úryvku k- vektorová složka Ρ obsahuje počet úspěchů v sérii 10 k nezávislé testy pro k = 1,2,..., 200.

bod 4. Bodový odhad parametrů rovnoměrného rozdělení

Podívejme se na další poučný příklad. Nechť je vzorek z obecné populace odpovídající náhodné veličině ξ, která má rovnoměrné rozdělení na segmentu s neznámým parametrem θ . Naším úkolem je tento neznámý parametr odhadnout.

Uvažujme o jednom z možné způsoby sestavení požadovaného odhadu. Li ξ je náhodná proměnná, která má rovnoměrné rozdělení na segmentu , tedy Μ ξ = . Od odhadu velikosti známý Μξ =, pak pro odhad parametrů θ můžete udělat odhad

Nestrannost odhadu je zřejmá:

Po výpočtu disperze a limity D jako n →∞ ověříme platnost odhadu:

Chcete-li získat jiný odhad parametru θ Podívejme se na další statistiky. Nechat = max). Pojďme najít rozdělení náhodné veličiny:

Pak matematické očekávání a rozptyl náhodné veličiny

s distribucí jsou si rovni:

;

těch. Hodnocení je platné, ale neobjektivní. Pokud však místo = max) uvažujeme = max), pak obojí , a tedy odhad je konzistentní a nezaujatý.

Zároveň od

výrazně efektivnější než hodnocení

Například při n = 97 je rozptyl odhadu θ^ o 33 ral menší než rozptyl odhadu

Poslední příklad opět ukazuje, že výběr statistického odhadu pro neznámý distribuční parametr je důležitý a netriviální úkol.

V Mathcadu je pro simulaci vzorku hodnot náhodné veličiny, která má rovnoměrné rozložení na intervalu [a, b], určena funkce runif(fc,o,b), která generuje vektor z Na náhodná čísla, z nichž každé je hodnotou náhodné veličiny rovnoměrně rozložené na intervalu [a, 6].



Novinka na webu

>

Nejoblíbenější