Dom Jama ustna Przedział ufności dla matematycznego oczekiwania rozkładu normalnego ze znaną wariancją. Przedział ufności dla oczekiwań matematycznych

Przedział ufności dla matematycznego oczekiwania rozkładu normalnego ze znaną wariancją. Przedział ufności dla oczekiwań matematycznych

Budujmy w MS EXCEL przedział ufności oszacować średnią wartość rozkładu w tym przypadku znana wartość odchylenia.

Oczywiście, że wybór poziom zaufania całkowicie zależy od rozwiązywanego problemu. Zatem stopień zaufania pasażera lotniczego do niezawodności samolotu powinien być niewątpliwie wyższy niż stopień zaufania kupującego do niezawodności żarówki elektrycznej.

Sformułowanie problemu

Załóżmy, że od populacja zostały podjęte próbka rozmiar nr. Zakłada się, że odchylenie standardowe ten rozkład jest znany. Na tej podstawie jest to konieczne próbki ocenić nieznane średnia dystrybucji(μ, ) i skonstruuj odpowiednie dwustronna przedział ufności.

Punktowe oszacowanie

Jak wiadomo z Statystyka(oznaczmy to X średnio) Jest bezstronne oszacowanie średniej Ten populacja i ma rozkład N(μ;σ 2 /n).

Notatka: Co zrobić, jeśli musisz zbudować przedział ufności w przypadku dystrybucji nie jest normalna? W tym wypadku na ratunek przychodzi co oznacza, że ​​wystarczy duży rozmiar próbki n z dystrybucji nie będąc normalna, przykładowy rozkład statystyk X śr będzie około korespondować normalna dystrybucja o parametrach N(μ;σ 2 /n).

Więc, Punktowe oszacowanie przeciętny wartości dystrybucji mamy - to średnia próbki, tj. X średnio. Teraz zacznijmy przedział ufności.

Konstruowanie przedziału ufności

Zwykle znając rozkład i jego parametry, możemy obliczyć prawdopodobieństwo, że zmienna losowa przyjmie wartość z określonego przez nas przedziału. Teraz zróbmy odwrotnie: znajdź przedział, w którym zmienna losowa będzie przypadać z danym prawdopodobieństwem. Na przykład z właściwości normalna dystrybucja wiadomo, że z prawdopodobieństwem 95% rozłożona jest zmienna losowa normalne prawo, będzie mieścić się w przedziale około +/- 2 od Średnia wartość(patrz artykuł o). Ten przedział będzie dla nas prototypem przedział ufności.

Zobaczmy teraz, czy znamy rozkład , obliczyć ten odstęp? Aby odpowiedzieć na pytanie, należy wskazać kształt rozkładu i jego parametry.

Znamy formę dystrybucji - to jest normalna dystrybucja (pamiętaj, że mówimy o dystrybucja próbek Statystyka X średnio).

Parametr μ nie jest nam znany (wystarczy go oszacować za pomocą przedział ufności), ale mamy jego szacunki X średnio, obliczone na podstawie próbki, które można wykorzystać.

Drugi parametr - odchylenie standardowe średniej próbki uznamy to za znane, jest równe σ/√n.

Ponieważ nie wiemy μ, to zbudujemy przedział +/- 2 odchylenia standardowe nie z Średnia wartość oraz na podstawie znanych szacunków X średnio. Te. przy obliczaniu przedział ufności NIE założymy tego X średnio mieści się w przedziale +/- 2 odchylenia standardowe od μ z prawdopodobieństwem 95% i założymy, że przedział wynosi +/- 2 odchylenia standardowe z X średnio z 95% prawdopodobieństwem obejmie μ – średnia dla populacji ogólnej, z którego zostało wzięte próbka. Te dwa stwierdzenia są równoważne, ale drugie stwierdzenie pozwala nam skonstruować przedział ufności.

Dodatkowo wyjaśnijmy sobie przedział: zmienną losową rozłożoną na przestrzeni normalne prawo, z prawdopodobieństwem 95% mieści się w przedziale +/- 1,960 odchylenia standardowe, nie +/- 2 odchylenia standardowe. Można to obliczyć za pomocą wzoru =NORMALNY.ST.REV((1+0,95)/2), cm. przykładowy plik Przedział arkusza.

Teraz możemy sformułować stwierdzenie probabilistyczne, które posłuży nam do uformowania przedział ufności:
„Prawdopodobieństwo, że średnia populacji położony od średnia próbki w ciągu 1960" odchylenia standardowe średniej próbki” równy 95%”.

Wartość prawdopodobieństwa wymieniona w zestawieniu ma specjalną nazwę , z czym się wiąże poziom istotności α (alfa) za pomocą prostego wyrażenia poziom zaufania =1 . W naszym przypadku poziom istotności α =1-0,95=0,05 .

Teraz, w oparciu o to probabilistyczne stwierdzenie, piszemy wyrażenie do obliczeń przedział ufności:

gdzie Z α/2 standard normalna dystrybucja(ta wartość zmiennej losowej z, Co P(z>=Z α/2 )=α/2).

Notatka: Górny kwantyl α/2 określa szerokość przedział ufności V odchylenia standardowe średnia próbki. Górny kwantyl α/2 standard normalna dystrybucja zawsze większa niż 0, co jest bardzo wygodne.

W naszym przypadku, przy α=0,05, górny kwantyl α/2 wynosi 1,960. Dla pozostałych poziomów istotności α (10%; 1%) górny kwantyl α/2 Z α/2 można obliczyć za pomocą wzoru =NORMAL.ST.REV(1-α/2) lub, jeśli jest znany poziom zaufania, =NORMALNY.ST.OBR((1+poziom zaufania)/2).

Zwykle podczas budowy przedziały ufności dla oszacowania średniej tylko do użytku górna alfa/2-kwantyl i nie używaj niższe α/2-kwantyl. Jest to możliwe, ponieważ standard normalna dystrybucja symetrycznie względem osi x ( jego gęstość dystrybucji symetryczny w przybliżeniu średni, tj. 0). Dlatego nie ma potrzeby obliczania niższy kwantyl α/2(nazywa się to po prostu α /2-kwantyl), ponieważ jest równe górna alfa/2-kwantyl ze znakiem minus.

Przypomnijmy, że niezależnie od kształtu rozkładu wartości x, odpowiada jej zmienna losowa X średnio Rozpowszechniane około Cienki N(μ;σ 2 /n) (patrz artykuł na temat). Dlatego w przypadek ogólny, powyższe wyrażenie dla przedział ufności jest jedynie przybliżeniem. Jeśli wartość x jest rozłożona na normalne prawo N(μ;σ 2 /n), wówczas wyrażenie na przedział ufności Jest dokładna.

Obliczanie przedziału ufności w programie MS EXCEL

Rozwiążmy problem.
Czas reakcji elementu elektronicznego na sygnał wejściowy wynosi ważna cecha urządzenia. Inżynier chce skonstruować przedział ufności dla średniego czasu reakcji na poziomie ufności 95%. Z wcześniejszych doświadczeń inżynier wie, że odchylenie standardowe czasu odpowiedzi wynosi 8 ms. Wiadomo, że do oceny czasu odpowiedzi inżynier wykonał 25 pomiarów, średnia wartość wyniosła 78 ms.

Rozwiązanie: Inżynier chce znać czas reakcji urządzenie elektroniczne, ale rozumie, że czas reakcji nie jest wartością stałą, ale zmienną losową, która ma swój własny rozkład. Jedyne, na co może więc liczyć, to określenie parametrów i kształtu tego rozkładu.

Niestety z warunków problemowych nie znamy kształtu rozkładu czasu odpowiedzi (nie musi tak być normalna). , rozkład ten jest również nieznany. Znany jest tylko on odchylenie standardoweσ=8. Dlatego chociaż nie możemy obliczyć prawdopodobieństw i skonstruować przedział ufności.

Jednak pomimo tego, że nie znamy dystrybucji czas osobna odpowiedź, wiemy, że wg CPT, dystrybucja próbek średni czas reakcji jest w przybliżeniu normalna(założymy, że warunki CPT są realizowane, ponieważ rozmiar próbki dość duży (n=25)) .

Ponadto, przeciętny rozkład ten jest równy Średnia wartość dystrybucja pojedynczej odpowiedzi, tj. μ. A odchylenie standardowe tego rozkładu (σ/√n) można obliczyć ze wzoru =8/ROOT(25) .

Wiadomo również, że inżynier otrzymał Punktowe oszacowanie parametr μ równy 78 ms (X avg). Dlatego teraz możemy obliczyć prawdopodobieństwa, ponieważ znamy formę dystrybucji ( normalna) i jego parametry (X avg i σ/√n).

Inżynier chce wiedzieć wartość oczekiwana rozkłady czasu odpowiedzi μ. Jak stwierdzono powyżej, to μ jest równe matematyczne oczekiwanie rozkładu próbki średniego czasu odpowiedzi. Jeśli użyjemy normalna dystrybucja N(X avg; σ/√n), to pożądane μ będzie mieściło się w przedziale +/-2*σ/√n z prawdopodobieństwem około 95%.

Poziom istotności równa się 1-0,95=0,05.

Na koniec znajdźmy lewą i prawą granicę przedział ufności.
Lewa granica: =78-NORMALNY.ST.REV(1-0,05/2)*8/ROOT(25) = 74,864
Prawa granica: =78+NORMALNY.ROOT.INV(1-0,05/2)*8/ROOT(25)=81,136

Lewa granica: =NORMALNY.OBRÓT(0,05/2; 78; 8/ROOT(25))
Prawa granica: =NORMALNY.OBRÓT(1-0,05/2; 78; 8/ROOT(25))

Odpowiedź: przedział ufności Na Poziom ufności 95% i σ=8msek równa się 78+/-3,136 ms.

W przykładowy plik na arkuszu Sigma znany, stworzył formularz do obliczeń i konstrukcji dwustronna przedział ufności za dowolne próbki z danym σ i poziom istotności.

Funkcja UFNOŚĆ.NORMALNA().

Jeśli wartości próbki są w zasięgu B20:B79 , A poziom istotności równy 0,05; następnie formuła MS EXCEL:
=ŚREDNIA(B20:B79)-NORMA UFNOŚCI(0,05;σ; LICZBA(B20:B79))
zwróci lewą granicę przedział ufności.

Ten sam limit można obliczyć korzystając ze wzoru:
=ŚREDNIA(B20:B79)-NORMAL.ST.REV(1-0,05/2)*σ/ROOT(LICZBA(B20:B79))

Notatka: Funkcja CONFIDENCE.NORM() pojawiła się w MS EXCEL 2010. We wcześniejszych wersjach MS EXCEL używana była funkcja TRUST().

Przedział ufności dla oczekiwań matematycznych - jest to przedział obliczony na podstawie danych, który ze znanym prawdopodobieństwem zawiera matematyczne oczekiwanie populacji ogólnej. Naturalnym oszacowaniem oczekiwania matematycznego jest średnia arytmetyczna jego zaobserwowanych wartości. Dlatego podczas całej lekcji będziemy używać terminów „średnia” i „wartość średnia”. W przypadku problemów związanych z obliczaniem przedziału ufności najczęściej wymagana jest odpowiedź w stylu: „Przedział ufności średniej liczby [wartości w konkretnym problemie] wynosi od [mniejsza wartość] do [większa wartość]”. Korzystając z przedziału ufności, można ocenić nie tylko wartości średnie, ale także odsetek określonej cechy w populacji ogólnej. Na lekcji omawiane są wartości średnie, rozrzut, odchylenie standardowe i błąd, dzięki którym dotrzemy do nowych definicji i wzorów Charakterystyka próby i populacji .

Punktowe i przedziałowe oszacowanie średniej

Jeżeli średnią wartość populacji szacuje się liczbą (punktem), to za oszacowanie nieznanej średniej wartości populacji przyjmuje się konkretną średnią, obliczoną z próby obserwacji. W tym przypadku wartość średniej próby – zmiennej losowej – nie pokrywa się ze średnią wartością populacji ogólnej. Dlatego też, wskazując średnią próbki, należy jednocześnie wskazać błąd próbkowania. Miarą błędu próbkowania jest błąd standardowy, który wyraża się w tych samych jednostkach co średnia. Dlatego często stosuje się następującą notację: .

Jeśli oszacowanie średniej trzeba wiązać z pewnym prawdopodobieństwem, to interesujący w populacji parametr należy oceniać nie jedną liczbą, ale przedziałem. Przedział ufności to przedział, w którym z pewnym prawdopodobieństwem P znaleziono wartość szacowanego wskaźnika populacji. Przedział ufności, w którym jest to prawdopodobne P = 1 - α znaleziona zostanie zmienna losowa, obliczona w następujący sposób:

,

α = 1 - P, który można znaleźć w dodatku do niemal każdej książki o statystyce.

W praktyce średnia i wariancja populacji nie są znane, dlatego wariancję populacji zastępuje się wariancją z próby, a średnią z populacji – średnią z próby. Zatem przedział ufności w większości przypadków oblicza się w następujący sposób:

.

Do oszacowania średniej populacji można zastosować wzór na przedział ufności

  • znane jest odchylenie standardowe populacji;
  • lub odchylenie standardowe populacji jest nieznane, ale wielkość próby jest większa niż 30.

Średnia z próby jest obiektywnym oszacowaniem średniej populacji. Z kolei wariancja próbki nie jest obiektywnym oszacowaniem wariancji populacji. Aby uzyskać obiektywne oszacowanie wariancji populacji we wzorze na wariancję próbki, wielkość próby N należy zastąpić N-1.

Przykład 1. Ze 100 losowo wybranych kawiarni w pewnym mieście zebrano informację, że średnia liczba pracowników w nich wynosi 10,5 przy odchyleniu standardowym 4,6. Określ 95% przedział ufności dla liczby pracowników kawiarni.

gdzie jest wartością krytyczną standardowego rozkładu normalnego dla poziomu istotności α = 0,05 .

Zatem 95% przedział ufności dla średniej liczby pracowników kawiarni wahał się od 9,6 do 11,4.

Przykład 2. Dla próby losowej z populacji 64 obserwacji obliczono następujące sumaryczne wartości:

suma wartości w obserwacjach,

suma kwadratów odchyleń wartości od średniej .

Oblicz 95% przedział ufności dla oczekiwań matematycznych.

Obliczmy odchylenie standardowe:

,

Obliczmy średnią wartość:

.

Podstawiamy wartości do wyrażenia przedziału ufności:

gdzie jest wartością krytyczną standardowego rozkładu normalnego dla poziomu istotności α = 0,05 .

Otrzymujemy:

Zatem 95% przedział ufności dla oczekiwań matematycznych tej próbki wahał się od 7,484 do 11,266.

Przykład 3. Dla losowej próby populacji składającej się ze 100 obserwacji obliczona średnia wynosi 15,2, a odchylenie standardowe wynosi 3,2. Oblicz 95% przedział ufności dla wartości oczekiwanej, a następnie 99% przedział ufności. Jeśli moc próbki i jej zmienność pozostaną niezmienione, a współczynnik ufności wzrośnie, to czy przedział ufności zwęzi się czy poszerzy?

Podstawiamy te wartości do wyrażenia przedziału ufności:

gdzie jest wartością krytyczną standardowego rozkładu normalnego dla poziomu istotności α = 0,05 .

Otrzymujemy:

.

Zatem 95% przedział ufności dla średniej tej próby wahał się od 14,57 do 15,82.

Ponownie podstawiamy te wartości do wyrażenia przedziału ufności:

gdzie jest wartością krytyczną standardowego rozkładu normalnego dla poziomu istotności α = 0,01 .

Otrzymujemy:

.

Zatem 99% przedział ufności dla średniej tej próby wahał się od 14,37 do 16,02.

Jak widzimy, wraz ze wzrostem współczynnika ufności wzrasta również wartość krytyczna standardowego rozkładu normalnego, w związku z czym punkty początkowe i końcowe przedziału znajdują się dalej od średniej, a tym samym wzrasta przedział ufności dla oczekiwań matematycznych .

Punktowe i przedziałowe szacunki ciężaru właściwego

Udział jakiejś cechy próbki można interpretować jako Punktowe oszacowanie środek ciężkości P o tej samej charakterystyce w populacji ogólnej. Jeżeli wartość tę trzeba powiązać z prawdopodobieństwem, należy obliczyć przedział ufności ciężaru właściwego P charakterystyczne w populacji z prawdopodobieństwem P = 1 - α :

.

Przykład 4. W pewnym mieście jest dwóch kandydatów A I B kandydują na burmistrza. W badaniu losowym wzięło udział 200 mieszkańców miasta, z czego 46% odpowiedziało, że oddałoby głos na danego kandydata A, 26% - dla kandydata B a 28% nie wie, na kogo będzie głosować. Określ 95% przedział ufności dla odsetka mieszkańców miasta popierających kandydata A.

Na początek przypomnijmy następującą definicję:

Rozważmy następującą sytuację. Niech warianty populacji mają rozkład normalny z oczekiwaniem matematycznym $a$ i odchyleniem standardowym $\sigma$. Próbka oznacza w w tym przypadku będzie traktowana jako zmienna losowa. Gdy ilość $X$ ma rozkład normalny, średnia próbki również będzie miała rozkład normalny wraz z parametrami

Znajdźmy przedział ufności obejmujący wartość $a$ z niezawodnością $\gamma $.

Aby to zrobić, potrzebujemy równości

Z tego otrzymujemy

Stąd możemy łatwo znaleźć $t$ z tabeli wartości funkcji $Ф\left(t\right)$ i w konsekwencji znaleźć $\delta $.

Przypomnijmy sobie tabelę wartości funkcji $Ф\left(t\right)$:

Rysunek 1. Tabela wartości funkcji $Ф\left(t\right).$

Całka ufności do szacowania oczekiwań matematycznych dla nieznanej $(\mathbf \sigma )$

W tym przypadku użyjemy skorygowanej wartości wariancji $S^2$. Zastępując w powyższym wzorze $\sigma $ przez $S$, otrzymujemy:

Przykładowe problemy ze znalezieniem przedziału ufności

Przykład 1

Niech ilość $X$ ma rozkład normalny z wariancją $\sigma =4$. Niech wielkość próbki wyniesie $n=64$, a niezawodność $\gamma =0,95$. Znajdź przedział ufności umożliwiający oszacowanie oczekiwań matematycznych tego rozkładu.

Musimy znaleźć przedział ($\overline(x)-\delta ,\overline(x)+\delta)$.

Jak widzieliśmy powyżej

\[\delta =\frac(\sigma t)(\sqrt(n))=\frac(4t)(\sqrt(64))=\frac(\t)(2)\]

Parametr $t$ można znaleźć ze wzoru

\[Ф\left(t\right)=\frac(\gamma )(2)=\frac(0,95)(2)=0,475\]

Z tabeli 1 wynika, że ​​$t=1,96$.

Niech CB X tworzy populację ogólną i niech β będzie nieznanym parametrem CB X. Jeżeli oszacowanie statystyczne w * jest spójne, to im większa liczebność próby, tym dokładniej otrzymujemy wartość β. Jednak w praktyce nie mamy bardzo dużych próbek, więc nie możemy zagwarantować większej dokładności.

Niech b* będzie statystycznym oszacowaniem dla c. Wartość |w* - w| nazywa się dokładnością estymacji. Oczywiste jest, że dokładność wynosi CB, ponieważ β* jest zmienną losową. Podajmy małą liczbę dodatnią 8 i wymagajmy, aby dokładność oszacowania |в* - в| był mniejszy niż 8, tj. | w* - w |< 8.

Niezawodność g lub prawdopodobieństwo pewności oszacowania in by in * to prawdopodobieństwo g, z jakim nierówność |in * - in|< 8, т. е.

Zazwyczaj niezawodność g jest określona z góry, a g przyjmuje się jako liczbę bliską 1 (0,9; 0,95; 0,99; ...).

Ponieważ nierówność |in * - in|< S равносильно двойному неравенству в* - S < в < в* + 8, то получаем:

Przedział (w * - 8, w * + 5) nazywany jest przedziałem ufności, tj. przedział ufności obejmuje nieznany parametr z prawdopodobieństwem y. Należy zauważyć, że końce przedziału ufności są losowe i różnią się w zależności od próbki, dlatego dokładniejsze jest stwierdzenie, że przedział (w * - 8, w * + 8) obejmuje nieznany parametr w, a nie w należy do tego interwał.

Pozwalać populacja jest dana przez zmienną losową X, rozłożoną zgodnie z prawem normalnym, a odchylenie standardowe a jest znane. Niewiadomą jest oczekiwanie matematyczne a = M (X). Należy znaleźć przedział ufności dla a dla zadanej niezawodności y.

Przykładowa średnia

jest oszacowaniem statystycznym dla xr = a.

Twierdzenie. Losowa wartość xB ma rozkład normalny, jeśli X ma rozkład normalny i M(XB) = a,

A (XB) = a, gdzie a = y/B (X), a = M (X). l/i

Przedział ufności dla a ma postać:

Znajdujemy 8.

Używając proporcji

gdzie Ф(r) jest funkcją Laplace'a, mamy:

P ( | XB - a |<8} = 2Ф

tabelę wartości funkcji Laplace'a znajdujemy wartość t.

Mając wyznaczone

T, otrzymujemy F(t) = g Ponieważ g jest dane, to przez

Z równości wynika, że ​​oszacowanie jest dokładne.

Oznacza to, że przedział ufności dla a ma postać:

Biorąc pod uwagę próbę z populacji X

ng Do" X2 Xm
N. n1 n2 nm

n = U1 + ... + nm, wówczas przedział ufności będzie wynosił:

Przykład 6.35. Znajdź przedział ufności umożliwiający oszacowanie oczekiwań matematycznych a rozkładu normalnego z rzetelnością 0,95, znając średnią próbki Xb = 10,43, liczebność próby n = 100 i odchylenie standardowe s = 5.

Skorzystajmy ze wzoru

Niech zmienna losowa X populacji będzie miała rozkład normalny, biorąc pod uwagę, że znana jest wariancja i odchylenie standardowe s tego rozkładu. Wymagane jest oszacowanie nieznanego oczekiwania matematycznego przy użyciu średniej próbki. W tym przypadku zadanie sprowadza się do znalezienia przedziału ufności dla oczekiwania matematycznego z rzetelnością b. Jeśli określisz wartość prawdopodobieństwa ufności (rzetelności) b, to prawdopodobieństwo wpadnięcia w przedział dla nieznanego oczekiwania matematycznego możesz obliczyć za pomocą wzoru (6.9a):

gdzie Ф(t) jest funkcją Laplace'a (5.17a).

W rezultacie możemy sformułować algorytm znajdowania granic przedziału ufności dla oczekiwania matematycznego, jeśli znana jest wariancja D = s 2:

  1. Ustaw wartość niezawodności – b.
  2. Z (6.14) wyrazić Ф(t) = 0,5× b. Wybierz wartość t z tabeli funkcji Laplace'a w oparciu o wartość Ф(t) (patrz dodatek 1).
  3. Oblicz odchylenie e korzystając ze wzoru (6.10).
  4. Zapisz przedział ufności korzystając ze wzoru (6.12) taki, że z prawdopodobieństwem b zachodzi nierówność:

.

Przykład 5.

Zmienna losowa X ma rozkład normalny. Znajdź przedziały ufności dla oszacowania o wiarygodności b = 0,96 nieznanego oczekiwania matematycznego a, jeśli podano:

1) ogólne odchylenie standardowe s = 5;

2) średnia próbki;

3) liczebność próby n = 49.

We wzorze (6.15) oszacowanie przedziału oczekiwania matematycznego A z niezawodnością b wszystkie wielkości oprócz t są znane. Wartość t można znaleźć korzystając z (6.14): b = 2Ф(t) = 0,96. Ф(t) = 0,48.

Korzystając z tabeli w Załączniku 1 dla funkcji Laplace'a Ф(t) = 0,48, znajdź odpowiednią wartość t = 2,06. Stąd, . Podstawiając obliczoną wartość e do wzoru (6.12) można otrzymać przedział ufności: 30-1,47< a < 30+1,47.

Wymagany przedział ufności dla oszacowania o wiarygodności b = 0,96 nieznanego oczekiwania matematycznego wynosi: 28,53< a < 31,47.



Nowość na stronie

>

Najbardziej popularny