Dom Stomatologia dziecięca Przedział ufności dla matematycznego oczekiwania rozkładu normalnego ze znaną wariancją. Przedziały ufności do szacowania oczekiwań matematycznych

Przedział ufności dla matematycznego oczekiwania rozkładu normalnego ze znaną wariancją. Przedziały ufności do szacowania oczekiwań matematycznych

I inne Wszystkie są szacunkami ich teoretycznych odpowiedników, które można by uzyskać, gdyby nie próbka, ale dostępna była populacja ogólna. Ale niestety, ogólna populacja jest bardzo droga i często niedostępna.

Pojęcie estymacji przedziałowej

Każde oszacowanie próbki ma pewien rozrzut, ponieważ jest zmienną losową zależną od wartości w konkretnej próbce. Dlatego, aby uzyskać bardziej wiarygodne wnioski statystyczne, należy znać nie tylko oszacowanie punktowe, ale także przedział, co z dużym prawdopodobieństwem γ (gamma) obejmuje oceniany wskaźnik θ (teta).

Formalnie są to dwie takie wartości (statystyki) T1 (X) I T2 (X), Co T 1< T 2 , dla którego przy danym poziomie prawdopodobieństwa γ warunek jest spełniony:

Krótko mówiąc, jest to prawdopodobne γ lub więcej, prawdziwy wskaźnik znajduje się pomiędzy punktami T1 (X) I T2 (X), które nazywane są dolną i górną granicą przedział ufności.

Jednym z warunków konstrukcji przedziałów ufności jest jego maksymalna wąskość, tj. powinien być jak najkrótszy. Pragnienie jest całkiem naturalne, bo... badacz stara się dokładniej zlokalizować lokalizację pożądanego parametru.

Wynika z tego, że przedział ufności musi obejmować maksymalne prawdopodobieństwa rozkładu. a w centrum powinna znajdować się sama ocena.

Oznacza to, że prawdopodobieństwo odchylenia (prawdziwego wskaźnika od oszacowania) w górę jest równe prawdopodobieństwu odchylenia w dół. Należy również zauważyć, że w przypadku rozkładów asymetrycznych przedział po prawej stronie nie jest równy interwałowi lewy.

Powyższy rysunek wyraźnie pokazuje, że im większe prawdopodobieństwo ufności, tym szerszy przedział – zależność bezpośrednia.

Było to krótkie wprowadzenie do teorii estymacji przedziałowej nieznanych parametrów. Przejdźmy do znalezienia granic ufności dla oczekiwanie matematyczne.

Przedział ufności dla oczekiwań matematycznych

Jeśli oryginalne dane są rozłożone na , wówczas średnia będzie wartością normalną. Wynika to z reguły, że liniowa kombinacja wartości normalnych ma również rozkład normalny. Dlatego do obliczenia prawdopodobieństw można zastosować aparat matematyczny prawa rozkładu normalnego.

Będzie to jednak wymagało znajomości dwóch parametrów – oczekiwań i wariancji, które zwykle są nieznane. Można oczywiście zastosować szacunki zamiast parametrów (średnia arytmetyczna i ), ale wtedy rozkład średniej nie będzie do końca normalny, będzie lekko spłaszczony w dół. Fakt ten sprytnie zauważył obywatel William Gosset z Irlandii, publikując swoje odkrycie w marcowym wydaniu czasopisma Biometrica z 1908 roku. Dla zachowania tajemnicy Gosset podpisał się jako Student. Tak pojawił się rozkład t-Studenta.

Jednak rozkład normalny danych, stosowany przez K. Gaussa do analizy błędów w obserwacjach astronomicznych, jest w życiu ziemskim niezwykle rzadki i dość trudny do ustalenia (do dużej dokładności potrzeba około 2 tysięcy obserwacji). Dlatego najlepiej odrzucić założenie o normalności i zastosować metody, które nie zależą od rozkładu oryginalnych danych.

Powstaje pytanie: jaki jest rozkład średniej arytmetycznej, jeśli jest ona obliczana na podstawie danych nieznana dystrybucja? Odpowiedź daje dobrze znana w teorii prawdopodobieństwa Centralne twierdzenie graniczne(CPT). W matematyce istnieje kilka jej wariantów (sformułowania były przez lata udoskonalane), ale wszystkie z grubsza sprowadzają się do stwierdzenia, że ​​suma dużej liczby niezależnych zmiennych losowych spełnia prawo rozkładu normalnego.

Przy obliczaniu średniej arytmetycznej wykorzystuje się sumę zmiennych losowych. Stąd okazuje się, że średnia arytmetyczna ma rozkład normalny, w którym oczekiwanie jest oczekiwaniem danych pierwotnych, a wariancja wynosi .

Mądrzy ludzie wiedzą, jak udowodnić CLT, ale zweryfikujemy to za pomocą eksperymentu przeprowadzonego w Excelu. Zasymulujmy próbkę 50 zmiennych losowych o równomiernym rozkładzie (używając funkcji Excel RANDBETWEEN). Następnie wykonamy 1000 takich próbek i dla każdej obliczymy średnią arytmetyczną. Przyjrzyjmy się ich dystrybucji.

Można zauważyć, że rozkład średniej jest zbliżony do prawa normalnego. Jeśli wielkość i liczba próbek zostaną jeszcze większe, podobieństwo będzie jeszcze większe.

Teraz, gdy na własne oczy widzieliśmy zasadność CLT, możemy za pomocą , obliczyć przedziały ufności dla średniej arytmetycznej, które z zadanym prawdopodobieństwem pokrywają się z prawdziwą średnią lub oczekiwaniem matematycznym.

Aby ustawić górny i dolny limit, musisz znać parametry normalna dystrybucja. Z reguły ich nie ma, dlatego stosuje się szacunki: Średnia arytmetyczna I wariancja próbki. Powtarzam, ta metoda daje dobre przybliżenie tylko w przypadku dużych próbek. W przypadku małych próbek często zaleca się użycie rozkładu Studenta. Nie wierz w to! Rozkład Studenta dla średniej występuje tylko wtedy, gdy oryginalne dane mają rozkład normalny, czyli prawie nigdy. Dlatego lepiej od razu umieścić minimalny pasek w zależności od ilości wymaganych danych i stosowania metod asymptotycznie poprawnych. Mówią, że 30 obserwacji wystarczy. Weź 50 - nie pomylisz się.

T 1,2– dolna i górna granica przedziału ufności

– średnia arytmetyczna próbki

s 0– odchylenie standardowe próbki (bezstronnej)

N - wielkość próbki

γ – prawdopodobieństwo ufności (zwykle równe 0,9, 0,95 lub 0,99)

do γ = Φ -1 ((1+γ)/2)– wartość odwrotna standardowej funkcji rozkładu normalnego. Mówiąc najprościej, jest to liczba błędów standardowych od średniej arytmetycznej do dolnej lub Górna granica(wskazane trzy prawdopodobieństwa odpowiadają wartościom 1,64, 1,96 i 2,58).

Istota wzoru polega na tym, że bierze się średnią arytmetyczną, a następnie odkłada się od niej pewną kwotę ( z γ) błędy standardowe ( s 0 /√n). Wszystko jest znane, weź to i rozważ.

Zanim masowe użycie Do wyznaczenia wartości funkcji rozkładu normalnego i jej odwrotności wykorzystano komputer PC. Używa się ich do dziś, jednak skuteczniejsze jest korzystanie z gotowych formuł w Excelu. Wszystkie elementy z powyższego wzoru ( , i ) można łatwo obliczyć w programie Excel. Ale istnieje gotowy wzór na obliczenie przedziału ufności - NORMA ZAUFANIA. Jego składnia jest następująca.

UFNOŚĆ.NORM(alfa;standard_wył.;rozmiar)

alfa– poziom istotności lub poziom ufności, który w przyjętym powyżej zapisie jest równy 1- γ, tj. prawdopodobieństwo, że matematyczneoczekiwanie będzie znajdować się poza przedziałem ufności. Na prawdopodobieństwo pewności 0,95, alfa wynosi 0,05 itd.

standardowe_wyłączone– odchylenie standardowe danych próbki. Nie ma potrzeby obliczania błędu standardowego; sam Excel podzieli przez pierwiastek z n.

rozmiar– wielkość próby (n).

Wynikiem funkcji NORM UFNOŚCI jest drugi wyraz ze wzoru na obliczenie przedziału ufności, tj. półprzerwa Odpowiednio dolny i górny punkt to średnia ± uzyskana wartość.

Dzięki temu możliwe jest skonstruowanie uniwersalnego algorytmu obliczania przedziałów ufności dla średniej arytmetycznej, który nie zależy od rozkładu danych wyjściowych. Ceną za uniwersalność jest jej asymptotyczny charakter, tj. konieczność stosowania stosunkowo dużych próbek. Jednak w wieku nowoczesne technologie zebranie wymaganej ilości danych zwykle nie jest trudne.

Testowanie hipotez statystycznych przy użyciu przedziałów ufności

(moduł 111)

Jednym z głównych problemów rozwiązywanych w statystyce jest. Jego istota jest w skrócie następująca. Zakłada się, że np. oczekiwanie populacja równa jakiejś wartości. Następnie konstruowany jest rozkład średnich z próby, jakie można zaobserwować dla danego oczekiwania. Następnie sprawdzają, gdzie w tym rozkładzie warunkowym znajduje się rzeczywista średnia. Jeśli wykracza poza dopuszczalne granice, pojawienie się takiej średniej jest bardzo mało prawdopodobne, a jeśli eksperyment zostanie powtórzony raz, jest to prawie niemożliwe, co stoi w sprzeczności z postawioną hipotezą, która została skutecznie odrzucona. Jeśli średnia nie przekracza poziom krytyczny, to hipoteza nie zostaje odrzucona (ale też nie udowodniona!).

Zatem za pomocą przedziałów ufności, w naszym przypadku oczekiwań, można także przetestować niektóre hipotezy. Jest to bardzo łatwe do zrobienia. Załóżmy, że średnia arytmetyczna dla pewnej próbki jest równa 100. Testowana jest hipoteza, że ​​wartość oczekiwana wynosi, powiedzmy, 90. Oznacza to, że jeśli postawimy pytanie prymitywnie, brzmi to tak: czy tak może być przy prawdziwej wartość średniej równa 90, obserwowana średnia okazała się równa 100?

Aby odpowiedzieć na to pytanie, będziesz potrzebować dodatkowo informacji o odchyleniu standardowym i wielkości próby. Powiedzmy odchylenie standardowe wynosi 30, a liczba obserwacji wynosi 64 (aby można było łatwo wydobyć pierwiastek). Wtedy błąd standardowy średniej wynosi 30/8 lub 3,75. Aby obliczyć 95% przedział ufności, należy dodać dwa błędy standardowe do każdej strony średniej (dokładniej 1,96). Przedział ufności będzie wynosić w przybliżeniu 100±7,5 lub od 92,5 do 107,5.

Dalsze rozumowanie jest następujące. Jeśli testowana wartość mieści się w przedziale ufności, to nie jest to sprzeczne z hipotezą, ponieważ mieści się w granicach wahań losowych (z prawdopodobieństwem 95%). Jeżeli sprawdzany punkt wykracza poza przedział ufności, wówczas prawdopodobieństwo takiego zdarzenia jest bardzo małe, w każdym razie poniżej poziomu akceptowalnego. Oznacza to, że hipoteza jest odrzucana jako sprzeczna z zaobserwowanymi danymi. W naszym przypadku hipoteza o wartości oczekiwanej leży poza przedziałem ufności (testowana wartość 90 nie mieści się w przedziale 100±7,5), zatem należy ją odrzucić. Odpowiadając na prymitywne pytanie powyżej, należy powiedzieć: nie, w każdym razie nie może, zdarza się to niezwykle rzadko. Często wskazują one konkretne prawdopodobieństwo błędnego odrzucenia hipotezy (poziom p), a nie określony poziom, na którym skonstruowano przedział ufności, ale o tym innym razem.

Jak widać, skonstruowanie przedziału ufności dla średniej (lub oczekiwań matematycznych) nie jest trudne. Najważniejsze jest uchwycenie esencji, a wtedy sprawy potoczą się dalej. W praktyce w większości przypadków stosuje się 95% przedział ufności, który wynosi w przybliżeniu dwa błędy standardowe po obu stronach średniej.

To wszystko na teraz. Wszystkiego najlepszego!

Niech zmienna losowa (możemy mówić o populacji ogólnej) będzie miała rozkład według prawa normalnego, dla którego znana jest wariancja D = 2 (> 0). Z populacji ogólnej (na zbiorze obiektów, dla których wyznaczana jest zmienna losowa) tworzy się próbę o wielkości n. Próbkę x 1 , x 2 ,..., x n traktuje się jako zbiór n niezależnych zmiennych losowych o rozkładzie analogicznym do (podejście wyjaśnione powyżej w tekście).

Wcześniej omówiono i udowodniono także następujące równości:

Mx 1 = Mx 2 = ... = Mx n = M;

Dx 1 = Dx 2 = ... = Dx n = D;

Wystarczy po prostu udowodnić (pomijamy dowód), że zmienna losowa w w tym przypadku jest również rozdzielany zgodnie z prawem normalnym.

Oznaczmy nieznaną wielkość M przez a i na podstawie zadanej wiarygodności wybierzmy liczbę d > 0 tak, aby warunek był spełniony:

P(-a< d) = (1)

Ponieważ zmienna losowa ma rozkład zgodny z prawem normalnym z oczekiwaniem matematycznym M = M = a i wariancją D = D /n = 2 /n, otrzymujemy:

P(-a< d) =P(a - d < < a + d) =

Pozostaje wybrać d takie, aby zachodziła równość

Dla dowolnego z nich możesz użyć tabeli, aby znaleźć liczbę t taką, że (t) = / 2. Ta liczba t jest czasami nazywana kwantyl.

Teraz z równości

określmy wartość d:

Wynik końcowy uzyskujemy przedstawiając wzór (1) w postaci:

Znaczenie ostatniej formuły jest następujące: z niezawodnością, przedział ufności

obejmuje nieznany parametr a = M populacji. Można to powiedzieć inaczej: Punktowe oszacowanie wyznacza wartość parametru M z dokładnością d= t/ i rzetelnością.

Zadanie. Niech będzie populacja ogólna o określonej charakterystyce rozłożonej zgodnie z prawem normalnym z wariancją równą 6,25. Pobrano próbę o liczebności n = 27 i otrzymano średnią wartość próbki cechy = 12. Znajdź przedział ufności obejmujący nieznane oczekiwanie matematyczne badanej cechy populacji ogólnej z rzetelnością = 0,99.

Rozwiązanie. Najpierw, korzystając z tabeli funkcji Laplace'a, znajdujemy wartość t z równości (t) = / 2 = 0,495. Na podstawie otrzymanej wartości t = 2,58 wyznaczamy dokładność oszacowania (lub połowę długości przedziału ufności) d: d = 2,52,58 / 1,24. Stąd otrzymujemy pożądany przedział ufności: (10,76; 13,24).

hipoteza statystyczna, ogólna wariacja

Przedział ufności dla matematycznego oczekiwania rozkładu normalnego z nieznaną wariancją

Niech będzie zmienną losową o rozkładzie normalnym z nieznanym oczekiwaniem matematycznym M, co oznaczamy literą a. Zróbmy próbkę o objętości n. Wyznaczmy średnią próbę i skorygowaną wariancję próbki s 2, korzystając ze znanych wzorów.

Losowa wartość

rozłożone zgodnie z prawem Studenta z n - 1 stopniami swobody.

Zadanie polega na znalezieniu liczby t dla danej niezawodności i liczby stopni swobody n - 1 takiej, aby równość

lub równoważna równość

Tutaj w nawiasie zapisano warunek, że wartość nieznanego parametru a należy do pewnego przedziału, który jest przedziałem ufności. Jego granice zależą od niezawodności oraz parametrów próbkowania i s.

Aby określić wartość t według wielkości, przekształcamy równość (2) do postaci:

Teraz zgodnie z tabelą dla zmienna losowa t, rozłożony zgodnie z prawem Studenta, korzystając z prawdopodobieństwa 1 - i liczby stopni swobody n - 1, znajdujemy t. Wzór (3) daje odpowiedź na postawiony problem.

Zadanie. Podczas testów kontrolnych 20 lamp elektrycznych przeciętny czas trwania ich praca wyniosła 2000 godzin przy odchyleniu standardowym (liczonym jako pierwiastek kwadratowy skorygowanej wariancji próbki) równym 11 godzin. Wiadomo, że czas działania lampy jest zmienną losową o rozkładzie normalnym. Wyznacz z rzetelnością 0,95 przedział ufności dla matematycznego oczekiwania tej zmiennej losowej.

Rozwiązanie. Wartość 1 - w tym przypadku wynosi 0,05. Zgodnie z tablicą rozkładu Studenta, przy liczbie stopni swobody równej 19, znajdujemy: t = 2,093. Obliczmy teraz dokładność oszacowania: 2,093121/ = 56,6. Stąd otrzymujemy wymagany przedział ufności: (1943,4; 2056,6).

Niech zostanie pobrana próbka z ogólnej populacji podlegającej prawu normalna dystrybucja XN( M; ). To podstawowe założenie statystyki matematycznej opiera się na centralnym twierdzeniu granicznym. Niech będzie znane ogólne odchylenie standardowe , ale matematyczne oczekiwanie rozkładu teoretycznego jest nieznane M(Średnia wartość ).

W tym przypadku średnia z próbki , uzyskana w trakcie eksperymentu (pkt. 3.4.2), również będzie zmienną losową M;
). Następnie „znormalizowane” odchylenie
N(0;1) – jest standardową normalną zmienną losową.

Zadanie polega na znalezieniu estymatora przedziału dla M. Skonstruujmy dwustronny przedział ufności dla M tak, że prawdziwe oczekiwanie matematyczne należy do niego z określonym prawdopodobieństwem (rzetelnością) .

Ustaw taki interwał dla wartości
- oznacza to znalezienie maksymalnej wartości tej wielkości
i minimalne
, które są granicami obszaru krytycznego:
.

Ponieważ to prawdopodobieństwo jest równe
, to pierwiastek tego równania
można znaleźć, korzystając z tablic funkcji Laplace'a (Tabela 3, Załącznik 1).

Potem z prawdopodobieństwem można argumentować, że zmienna losowa
, to znaczy pożądana średnia ogólna należy do przedziału
. (3.13)

Rozmiar
(3.14)

zwany dokładność oceny.

Numer
kwantyl rozkład normalny - można znaleźć jako argument funkcji Laplace'a (Tabela 3, Załącznik 1), biorąc pod uwagę relację 2Ф( ty)=, tj. F( ty)=
.

Odwrotnie, zgodnie z określoną wartością odchylenia można znaleźć, z jakim prawdopodobieństwem nieznana średnia ogólna należy do przedziału
. Aby to zrobić, musisz obliczyć

. (3.15)

Niech losowa próba zostanie wyodrębniona z populacji ogólnej przy użyciu metody selekcji powtarzanej. Z równania
może być znaleziony minimum ponowne próbkowanie głośności N, niezbędne dla przedziału ufności przy danej niezawodności nie przekroczyła zadanej wartości . Wymaganą liczebność próby szacuje się za pomocą wzoru:

. (3.16)

Odkryjmy dokładność szacunków
:

1) Wraz ze wzrostem wielkości próbki N ogrom maleje, a co za tym idzie, dokładność oszacowania wzrasta.

2) C zwiększyć wiarygodność oceny wartość argumentu wzrasta ty(ponieważ F(ty) rośnie monotonicznie) i dlatego wzrasta . W tym przypadku wzrost niezawodności zmniejsza trafność jego oceny .

Ocena
(3.17)

zwany klasyczny(Gdzie T- określony parametr w zależności od I N), ponieważ charakteryzuje najczęściej spotykane prawa dystrybucji.

3.5.3 Przedziały ufności do szacowania oczekiwań matematycznych rozkładu normalnego z nieznanym odchyleniem standardowym 

Należy wiedzieć, że populacja podlega prawu rozkładu normalnego XN( M;), gdzie wartość średnia kwadratowa odchylenia nieznany.

Aby skonstruować przedział ufności w celu oszacowania średniej ogólnej w tym przypadku, stosuje się statystykę
, posiadający dystrybucję Studenta z k= N–1 stopień swobody. Wynika to z faktu, że N(0;1) (patrz sekcja 3.5.2), oraz
(patrz sekcja 3.5.3) oraz z definicji rozkładu Studenta (część 1. sekcja 2.11.2).

Znajdźmy dokładność klasycznego oszacowania rozkładu Studenta: tj. znajdziemy T ze wzoru (3.17). Niech prawdopodobieństwo spełnienia nierówności
podana przez niezawodność :

. (3.18)

Ponieważ TSt( N-1), to jest oczywiste T zależy od I N, więc zwykle piszą
.

(3.19)

Gdzie
– Funkcja rozkładu uczniów za pomocą N-1 stopień swobody.

Rozwiązanie tego równania dla M, otrzymujemy przedział
który wiarygodnie  pokrywa nieznany parametr M.

Ogrom T , N-1, używany do określenia przedziału ufności zmiennej losowej T(N-1), rozłożone zgodnie z testem t N Nazywa się -1 stopniem swobody Współczynnik studenta. Należy go znaleźć według podanych wartości N oraz  z tabel „Punkty krytyczne rozkładu Studenta”. (Tabela 6, Załącznik 1), które reprezentują rozwiązania równania (3.19).

W rezultacie otrzymujemy następujące wyrażenie dokładność przedział ufności dla oszacowania oczekiwanej matematycznej (średniej ogólnej), jeśli wariancja jest nieznana:

(3.20)

Zatem istnieje ogólny wzór na konstruowanie przedziałów ufności dla matematycznych oczekiwań populacji:

gdzie jest dokładność przedziału ufności w zależności od znanej lub nieznanej dyspersji wyznacza się odpowiednio według wzorów 3.16. i 3,20.

Problem 10. Przeprowadzono kilka testów, których wyniki zestawiono w tabeli:

X I

Wiadomo, że przestrzegają prawa rozkładu normalnego
. Znajdź ocenę M* dla oczekiwań matematycznych M, skonstruuj dla niego 90% przedział ufności.

Rozwiązanie:

Więc, M(2.53;5.47).

Problem 11. Głębokość morza mierzy się za pomocą urządzenia, którego błąd systematyczny wynosi 0, a błędy losowe rozkładają się zgodnie z prawem normalnym, z odchyleniem standardowym =15 m. Ile niezależnych pomiarów należy wykonać, aby określić głębokość z błędami nie większymi niż 5 m przy poziomie ufności 90%?

Rozwiązanie:

Zgodnie z warunkami problemu, który mamy XN( M; ), Gdzie =15 m, =5 m, =0,9. Znajdźmy objętość N.

1) Przy zadanej niezawodności = 0,9 z tabeli 3 (załącznik 1) znajdujemy argument funkcji Laplace’a ty = 1.65.

2) Znajomość określonej dokładności estymacji =ty=5, znajdźmy
. Mamy

. Stąd liczba testów N25.

Problem 12. Próbkowanie temperatury T za pierwsze 6 dni stycznia przedstawia tabela:

Znajdź przedział ufności dla oczekiwań matematycznych M populacja z prawdopodobieństwem ufnym
i oceń generała odchylenie standardowe S.

Rozwiązanie:


I
.

2) Bezstronne oszacowanie znajdź go za pomocą wzoru
:

=-175

=234.84

;
;

=-192

=116


.

3) Ponieważ wariancja ogólna nie jest znana, ale znane jest jej oszacowanie, należy oszacować oczekiwanie matematyczne M korzystamy z rozkładu Studenta (Tabela 6, Załącznik 1) i wzoru (3.20).

Ponieważ N 1 =N 2 = 6, wówczas ,
, S 1 = 6,85 mamy:
, stąd -29,2-4,1<M 1 < -29.2+4.1.

Dlatego -33,3<M 1 <-25.1.

Podobnie mamy,
, S 2 = 4,8, czyli

–34.9< M 2 < -29.1. Тогда доверительные интервалы примут вид: M 1 (-33,3;-25,1) i M 2 (-34.9;-29.1).

W naukach stosowanych, na przykład w dyscyplinach budowlanych, do oceny dokładności obiektów stosuje się tablice przedziałów ufności, które są podane w odpowiedniej literaturze przedmiotu.

Niech CB X tworzy populację ogólną i niech β będzie nieznanym parametrem CB X. Jeżeli oszacowanie statystyczne w * jest spójne, to im większa liczebność próby, tym dokładniej otrzymujemy wartość β. Jednak w praktyce nie mamy bardzo dużych próbek, więc nie możemy zagwarantować większej dokładności.

Niech b* będzie statystycznym oszacowaniem dla c. Wartość |w* - w| nazywa się dokładnością estymacji. Oczywiste jest, że dokładność wynosi CB, ponieważ β* jest zmienną losową. Podajmy małą liczbę dodatnią 8 i wymagajmy, aby dokładność oszacowania |в* - в| był mniejszy niż 8, tj. | w* - w |< 8.

Wiarygodność g lub prawdopodobieństwo ufności oszacowania w * to prawdopodobieństwo g, z którym nierówność |in * - in|< 8, т. е.

Zazwyczaj niezawodność g jest określona z góry, a g przyjmuje się jako liczbę bliską 1 (0,9; 0,95; 0,99; ...).

Ponieważ nierówność |in * - in|< S равносильно двойному неравенству в* - S < в < в* + 8, то получаем:

Przedział (w * - 8, w * + 5) nazywany jest przedziałem ufności, tj. przedział ufności obejmuje nieznany parametr z prawdopodobieństwem y. Należy zauważyć, że końce przedziału ufności są losowe i różnią się w zależności od próbki, dlatego dokładniejsze jest stwierdzenie, że przedział (w * - 8, w * + 8) obejmuje nieznany parametr w, a nie w należy do tego interwał.

Niech populację zdefiniuje zmienna losowa X, rozłożona według prawa normalnego, i znane jest odchylenie standardowe a. Niewiadomą jest oczekiwanie matematyczne a = M (X). Należy znaleźć przedział ufności dla a dla zadanej niezawodności y.

Przykładowa średnia

jest oszacowaniem statystycznym dla xr = a.

Twierdzenie. Zmienna losowa xB ma rozkład normalny, jeśli X ma rozkład normalny i M (XB) = a,

A (XB) = a, gdzie a = y/B (X), a = M (X). l/i

Przedział ufności dla a ma postać:

Znajdujemy 8.

Używając proporcji

gdzie Ф(r) jest funkcją Laplace'a, mamy:

P ( | XB - a |<8} = 2Ф

tabelę wartości funkcji Laplace'a znajdujemy wartość t.

Mając wyznaczone

T, otrzymujemy F(t) = g Ponieważ g jest dane, to przez

Z równości wynika, że ​​oszacowanie jest dokładne.

Oznacza to, że przedział ufności dla a ma postać:

Biorąc pod uwagę próbę z populacji X

ng Do" X2 Xm
N. n1 n2 nm

n = U1 + ... + nm, wówczas przedział ufności będzie wynosił:

Przykład 6.35. Znajdź przedział ufności umożliwiający oszacowanie oczekiwań matematycznych a rozkładu normalnego z rzetelnością 0,95, znając średnią próbki Xb = 10,43, liczebność próby n = 100 i odchylenie standardowe s = 5.

Skorzystajmy ze wzoru

Niech zmienna losowa X populacji będzie miała rozkład normalny, biorąc pod uwagę, że znana jest wariancja i odchylenie standardowe s tego rozkładu. Wymagane jest oszacowanie nieznanego oczekiwania matematycznego przy użyciu średniej próbki. W tym przypadku zadanie sprowadza się do znalezienia przedziału ufności dla oczekiwania matematycznego z rzetelnością b. Jeśli określisz wartość prawdopodobieństwa ufności (rzetelności) b, to prawdopodobieństwo wpadnięcia w przedział dla nieznanego oczekiwania matematycznego możesz obliczyć za pomocą wzoru (6.9a):

gdzie Ф(t) jest funkcją Laplace'a (5.17a).

W rezultacie możemy sformułować algorytm znajdowania granic przedziału ufności dla oczekiwania matematycznego, jeśli znana jest wariancja D = s 2:

  1. Ustaw wartość niezawodności – b.
  2. Z (6.14) wyrazić Ф(t) = 0,5× b. Wybierz wartość t z tabeli funkcji Laplace'a w oparciu o wartość Ф(t) (patrz dodatek 1).
  3. Oblicz odchylenie e korzystając ze wzoru (6.10).
  4. Zapisz przedział ufności korzystając ze wzoru (6.12) taki, że z prawdopodobieństwem b zachodzi nierówność:

.

Przykład 5.

Zmienna losowa X ma rozkład normalny. Znajdź przedziały ufności dla oszacowania o wiarygodności b = 0,96 nieznanego oczekiwania matematycznego a, jeśli podano:

1) ogólne odchylenie standardowe s = 5;

2) średnia próbki;

3) liczebność próby n = 49.

We wzorze (6.15) oszacowanie przedziału oczekiwania matematycznego A z niezawodnością b wszystkie wielkości oprócz t są znane. Wartość t można znaleźć korzystając z (6.14): b = 2Ф(t) = 0,96. Ф(t) = 0,48.

Korzystając z tabeli w Załączniku 1 dla funkcji Laplace'a Ф(t) = 0,48, znajdź odpowiednią wartość t = 2,06. Stąd, . Podstawiając obliczoną wartość e do wzoru (6.12) można otrzymać przedział ufności: 30-1,47< a < 30+1,47.

Wymagany przedział ufności dla oszacowania o wiarygodności b = 0,96 nieznanego oczekiwania matematycznego wynosi: 28,53< a < 31,47.



Nowość na stronie

>

Najbardziej popularny