Dom Zapalenie jamy ustnej Przedział ufności jest równy. Przedział ufności

Przedział ufności jest równy. Przedział ufności

W statystyce istnieją dwa rodzaje szacunków: punktowe i przedziałowe. Punktowe oszacowanie reprezentuje oddzielną przykładową statystykę używaną do oszacowania parametru populacja. Na przykład średnia próbki jest oceną punktową oczekiwanie matematyczne populacja i wariancja próby S2- punktowa estymacja wariancji populacji σ 2. wykazano, że średnia z próby jest bezstronnym oszacowaniem matematycznych oczekiwań populacji. Średnia próbki nazywana jest bezstronną, ponieważ średnia wszystkich średnich z próby (przy tej samej wielkości próby) N) jest równa matematycznym oczekiwaniom populacji ogólnej.

Aby uzyskać wariancję próbki S2 stała się obiektywnym oszacowaniem wariancji populacji σ 2, mianownik wariancji próbki powinien być równy N – 1 , ale nie N. Innymi słowy, wariancja populacji jest średnią wszystkich możliwych wariancji próby.

Szacując parametry populacji należy mieć na uwadze, że przykładowe statystyki takie jak , zależą od konkretnych próbek. Aby wziąć pod uwagę ten fakt, uzyskać oszacowanie interwału matematyczne oczekiwania populacji ogólnej, przeanalizuj rozkład średnich z próby (więcej szczegółów można znaleźć w artykule). Skonstruowany przedział charakteryzuje się pewnym poziomem ufności, który reprezentuje prawdopodobieństwo, że prawdziwy parametr populacji zostanie poprawnie oszacowany. Podobne przedziały ufności można zastosować do oszacowania proporcji cechy R i główna rozproszona masa populacji.

Pobierz notatkę w formacie lub, przykłady w formacie

Konstruowanie przedziału ufności dla oczekiwań matematycznych populacji ze znanym odchyleniem standardowym

Konstruowanie przedziału ufności dla udziału cechy w populacji

W tej sekcji rozszerzono koncepcję przedziału ufności na dane kategoryczne. Pozwala to oszacować udział danej cechy w populacji R przy użyciu przykładowego udziału RS= X/N. Jak wskazano, jeśli ilości NR I N(1 – p) przekracza liczbę 5, rozkład dwumianowy można przybliżyć w sposób normalny. Zatem, aby oszacować udział cechy w populacji R możliwe jest skonstruowanie przedziału, którego poziom ufności jest równy (1 – α)х100%.


Gdzie PS- próbna proporcja cechy równa X/N, tj. liczba sukcesów podzielona przez wielkość próby, R- udział cechy w populacji ogólnej, Z- wartość krytyczna standaryzacji normalna dystrybucja, N- wielkość próbki.

Przykład 3. Załóżmy, że próba składająca się ze 100 faktur wypełnionych w trakcie w zeszłym miesiącu. Załóżmy, że 10 z tych faktur zostało sporządzonych z błędami. Zatem, R= 10/100 = 0,1. Poziom ufności 95% odpowiada wartości krytycznej Z = 1,96.

Zatem prawdopodobieństwo, że od 4,12% do 15,88% faktur zawiera błędy, wynosi 95%.

Dla danej liczebności próby przedział ufności zawierający proporcję cechy w populacji wydaje się szerszy niż w przypadku przedziału ciągłego zmienna losowa. Dzieje się tak, ponieważ pomiary ciągłej zmiennej losowej zawierają więcej informacji niż pomiary danych kategorycznych. Innymi słowy, dane kategoryczne, które przyjmują tylko dwie wartości, zawierają niewystarczającą ilość informacji, aby oszacować parametry ich rozkładu.

Wobliczanie szacunków uzyskanych ze skończonej populacji

Szacowanie oczekiwań matematycznych. Współczynnik korygujący dla populacji końcowej ( fpc) zastosowano w celu zmniejszenia błędu standardowego o współczynnik. Przy obliczaniu przedziałów ufności dla oszacowań parametrów populacji stosuje się współczynnik korygujący w sytuacjach, gdy próbki są pobierane bez zwracania. Zatem przedział ufności dla oczekiwań matematycznych mający poziom ufności równy (1 – α)х100%, oblicza się według wzoru:

Przykład 4. Aby zilustrować zastosowanie współczynnika korygującego dla skończonej populacji, wróćmy do problemu obliczania przedziału ufności dla średniej kwoty faktur, omówionego powyżej w przykładzie 3. Załóżmy, że firma wystawia 5000 faktur miesięcznie i X= 110,27 dolarów, S= 28,95 USD, N = 5000, N = 100, α = 0,05, t 99 = 1,9842. Korzystając ze wzoru (6) otrzymujemy:

Oszacowanie udziału cechy. W przypadku wyboru bez zwrotu, przedział ufności dla proporcji atrybutu mającego poziom ufności równy (1 – α)х100%, oblicza się według wzoru:

Przedziały ufności i kwestie etyczne

Podczas pobierania próbek z populacji i wyciągania wniosków statystycznych często pojawiają się problemy etyczne. Najważniejszym z nich jest zgodność przedziałów ufności i szacunków punktowych statystyk z próby. Publikowanie szacunków punktowych bez określenia powiązanych przedziałów ufności (zwykle na poziomie ufności 95%) i wielkości próby, z której je wyprowadzono, może powodować zamieszanie. Może to wywołać u użytkownika wrażenie, że oszacowanie punktowe jest dokładnie tym, czego potrzebuje do przewidzenia właściwości całej populacji. Dlatego należy zrozumieć, że w każdym badaniu należy skupiać się nie na szacunkach punktowych, ale na szacunkach przedziałowych. Oprócz, Specjalna uwaga należy podać właściwy wybór rozmiary próbek.

Najczęściej przedmiotem manipulacji statystycznych są wyniki badań socjologicznych ludności na temat określonych kwestii politycznych. W tym przypadku wyniki ankiety publikowane są na pierwszych stronach gazet i popełniają błąd przykładowa ankieta a metodologia analizy statystycznej jest wydrukowana gdzieś pośrodku. Aby udowodnić słuszność uzyskanych estymatorów punktowych, należy wskazać liczebność próby, na podstawie której je uzyskano, granice przedziału ufności oraz jego poziom istotności.

Następna notatka

Wykorzystano materiały z książki Levin i wsp. Statystyka dla menedżerów. – M.: Williams, 2004. – s. 25 448–462

Centralne twierdzenie graniczne stwierdza, że ​​przy wystarczająco dużej próbie rozkład średnich próby można przybliżyć rozkładem normalnym. Właściwość ta nie zależy od rodzaju rozmieszczenia populacji.

W poprzednich podrozdziałach rozważaliśmy kwestię estymacji nieznanego parametru A jeden numer. Nazywa się to oszacowaniem „punktowym”. W wielu zadaniach trzeba nie tylko znaleźć parametr A odpowiednią wartość liczbową, ale także ocenę jego dokładności i wiarygodności. Trzeba wiedzieć do jakich błędów może doprowadzić zmiana parametru A jego oszacowanie punktowe A oraz z jakim stopniem pewności możemy oczekiwać, że błędy te nie przekroczą znanych limitów?

Problemy tego rodzaju są szczególnie istotne w przypadku małej liczby obserwacji, gdy oszacowanie punktowe i w jest w dużej mierze losowe i przybliżone zastąpienie a może prowadzić do poważnych błędów.

Aby dać wyobrażenie o dokładności i wiarygodności oszacowania A,

V statystyka matematyczna Używają tak zwanych przedziałów ufności i prawdopodobieństw ufności.

Niech dla parametru A bezstronny szacunek uzyskany z doświadczenia A. Chcemy oszacować możliwy błąd w tym przypadku. Przypiszmy jakieś wystarczająco duże prawdopodobieństwo p (na przykład p = 0,9, 0,95 lub 0,99), aby zdarzenie z prawdopodobieństwem p można było uznać za praktycznie wiarygodne i znajdźmy wartość s, dla której

Następnie zakres praktycznie możliwych wartości błędu powstałego podczas wymiany A NA A, będzie ± s; Duże błędy w wartości bezwzględnej pojawią się tylko z małym prawdopodobieństwem a = 1 - p. Przepiszmy (14.3.1) jako:

Równość (14.3.2) oznacza, że ​​z prawdopodobieństwem p nieznana wartość parametr A mieści się w przedziale

Należy zwrócić uwagę na jedną okoliczność. Wcześniej wielokrotnie rozważaliśmy prawdopodobieństwo, że zmienna losowa znajdzie się w danym nielosowym przedziale. Tutaj sytuacja jest inna: wielkość A nie jest losowy, ale przedział /p jest losowy. Jego położenie na osi x jest losowe i zależy od jego środka A; Ogólnie rzecz biorąc, długość przedziału 2s jest również losowa, ponieważ wartość s jest obliczana z reguły na podstawie danych eksperymentalnych. Dlatego w w tym przypadku lepiej byłoby interpretować wartość p nie jako prawdopodobieństwo „trafienia” w punkt A w przedziale /p oraz jako prawdopodobieństwo, że losowy przedział /p obejmie punkt A(Rys. 14.3.1).

Ryż. 14.3.1

Zwykle nazywa się prawdopodobieństwo p prawdopodobieństwo pewności i przedział / p - przedział ufności. Granice przedziałów Jeśli. a x = a- i za 2 = za + i są tzw granice zaufania.

Podajmy inną interpretację pojęcia przedziału ufności: można go uznać za przedział wartości parametrów A, zgodne z danymi eksperymentalnymi i nie zaprzeczające im. Rzeczywiście, jeśli zgodzimy się uznać zdarzenie z prawdopodobieństwem a = 1-p praktycznie niemożliwe, to te wartości parametru a, dla których a - a> s należy uznać za sprzeczne z danymi eksperymentalnymi oraz takie, dla których |a - A na 2 .

Niech dla parametru A istnieje bezstronny szacunek A. Gdybyśmy znali prawo podziału ilości A, zadanie znalezienia przedziału ufności byłoby bardzo proste: wystarczyłoby znaleźć wartość s, dla której

Trudność polega na tym, że prawo rozkładu szacunków A zależy od prawa podziału ilości X a zatem na jego nieznanych parametrach (w szczególności na samym parametrze A).

Aby obejść tę trudność, można zastosować następującą, w przybliżeniu przybliżoną technikę: zastąp nieznane parametry w wyrażeniu dla s ich oszacowaniami punktowymi. Przy stosunkowo dużej liczbie eksperymentów P(około 20...30) technika ta zazwyczaj daje wyniki zadowalające pod względem dokładności.

Jako przykład rozważmy problem przedziału ufności dla oczekiwań matematycznych.

Niech się wyprodukuje P X, których charakterystyka jest oczekiwaniem matematycznym T i wariancja D- nieznany. Dla tych parametrów uzyskano następujące szacunki:

Wymagane jest skonstruowanie odpowiedniego przedziału ufności /p prawdopodobieństwo pewności p, dla oczekiwań matematycznych T wielkie ilości X.

Rozwiązując to zadanie skorzystamy z faktu, że ilość T reprezentuje sumę P niezależne zmienne losowe o jednakowym rozkładzie X godz i zgodnie z centralnym twierdzeniem granicznym dla wystarczająco dużego P jego prawo dystrybucji jest zbliżone do normalnego. W praktyce, nawet przy stosunkowo niewielkiej liczbie wyrazów (około 10...20), prawo podziału sumy można w przybliżeniu uznać za normalne. Zakładamy, że wartość T rozdzielone zgodnie z prawem normalnym. Charakterystyki tego prawa – matematyczne oczekiwanie i wariancja – są odpowiednio równe T I

(patrz rozdział 13, podpunkt 13.3). Załóżmy, że wartość D znamy i znajdziemy wartość Ep dla której

Korzystając ze wzoru (6.3.5) z rozdziału 6, wyrażamy prawdopodobieństwo po lewej stronie (14.3.5) poprzez funkcję rozkładu normalnego

gdzie jest odchyleniem standardowym oszacowania T.

Z równania

znajdź wartość Sp:

gdzie arg Ф* (х) jest funkcją odwrotną Ф* (X), te. wartość argumentu, przy której normalna funkcja rozkład jest równy X.

Dyspersja D, za pomocą którego wyrażana jest ilość A 1P, nie wiemy dokładnie; jako jego przybliżoną wartość można posłużyć się oszacowaniem D(14.3.4) i umieść w przybliżeniu:

W ten sposób problem konstrukcji przedziału ufności został w przybliżeniu rozwiązany, który jest równy:

gdzie gp określa się wzorem (14.3.7).

Aby uniknąć odwrotnej interpolacji w tabelach funkcji Ф* (l) przy obliczaniu s p, wygodnie jest skompilować specjalną tabelę (tabela 14.3.1), która podaje wartości wielkości

w zależności od r. Wartość (p określa dla prawa normalnego liczbę odchyleń standardowych, które należy wykreślić w prawo i w lewo od środka dyspersji, aby prawdopodobieństwo dostania się do otrzymanego obszaru było równe p.

Stosując wartość 7 p, przedział ufności wyraża się jako:

Tabela 14.3.1

Przykład 1. Przeprowadzono 20 eksperymentów ilościowych X; wyniki przedstawiono w tabeli. 14.3.2.

Tabela 14.3.2

Wymagane jest znalezienie oszacowania na podstawie matematycznego oczekiwania wielkości X i skonstruuj przedział ufności odpowiadający prawdopodobieństwu ufności p = 0,8.

Rozwiązanie. Mamy:

Wybierając l: = 10 jako punkt odniesienia, korzystając z trzeciego wzoru (14.2.14) znajdujemy nieobciążone oszacowanie D :

Według tabeli 14.3.1 znajdujemy

Granice zaufania:

Przedział ufności:

Wartości parametrów T, mieszczące się w tym przedziale są zgodne z danymi eksperymentalnymi podanymi w tabeli. 14.3.2.

W podobny sposób można skonstruować przedział ufności dla wariancji.

Niech się wyprodukuje P niezależne eksperymenty na zmiennej losowej X z nieznanymi parametrami zarówno dla A, jak i dyspersji D uzyskano bezstronny szacunek:

Wymagane jest w przybliżeniu skonstruowanie przedziału ufności dla wariancji.

Ze wzoru (14.3.11) wynika, że ​​ilość D reprezentuje

kwota P zmienne losowe postaci . Te wartości nie są

niezależny, ponieważ którykolwiek z nich zawiera ilość T, zależny od wszystkich innych. Można jednak wykazać, że wraz ze wzrostem P prawo podziału ich sumy również zbliża się do normalnego. Prawie o godz P= 20...30 to już można uznać za normalne.

Załóżmy, że tak jest i znajdźmy cechy tego prawa: matematyczne oczekiwanie i rozproszenie. Od oceny D- zatem bezstronny M[D] = D.

Obliczanie wariancji D D wiąże się ze stosunkowo złożonymi obliczeniami, dlatego przedstawiamy jego wyrażenie bez wyprowadzenia:

gdzie q 4 jest czwartą punkt centralny wielkie ilości X.

Aby użyć tego wyrażenia, należy zastąpić wartości \u003d 4 i D(przynajmniej bliscy). Zamiast D możesz skorzystać z jego oceny D. W zasadzie czwarty moment centralny można również zastąpić oszacowaniem, na przykład wartością postaci:

ale taka zamiana zapewni wyjątkowo niską dokładność, ponieważ ogólnie przy ograniczonej liczbie eksperymentów momenty wysoki porządek ustalone od duże błędy. Jednak w praktyce często zdarza się, że rodzaj prawa podziału ilościowego X znane z góry: nieznane są jedynie jego parametry. Następnie możesz spróbować wyrazić μ 4 poprzez D.

Weźmy najczęstszy przypadek, gdy wartość X rozdzielone zgodnie z prawem normalnym. Następnie jego czwarty moment centralny wyraża się w postaci rozproszenia (patrz rozdział 6, podrozdział 6.2);

i wzór (14.3.12) daje Lub

Zastępowanie nieznanego w (14.3.14) D jego ocenę D, dostajemy: skąd

Moment μ 4 można wyrazić poprzez D także w niektórych innych przypadkach, gdy rozkład wartości X nie jest normalne, ale znany jest jego wygląd. Na przykład dla prawa jednolita gęstość(patrz rozdział 5) mamy:

gdzie (a, P) jest przedziałem, dla którego określone jest prawo.

Stąd,

Korzystając ze wzoru (14.3.12) otrzymujemy: gdzie znajdziemy w przybliżeniu

W przypadkach, gdy nie jest znany rodzaj prawa podziału dla wielkości 26, przy przybliżonym oszacowaniu wartości a/) nadal zaleca się stosowanie wzoru (14.3.16), chyba że istnieją szczególne podstawy, aby sądzić, że to prawo bardzo różni się od normalnej (ma zauważalną kurtozę dodatnią lub ujemną).

Jeśli przybliżoną wartość a/) uzyskamy w ten czy inny sposób, wówczas możemy skonstruować przedział ufności dla wariancji w taki sam sposób, jak zbudowaliśmy go dla oczekiwań matematycznych:

gdzie zgodnie z tabelą znajduje się wartość zależną od danego prawdopodobieństwa p. 14.3.1.

Przykład 2. Znajdź w przybliżeniu 80% przedział ufności dla wariancji zmiennej losowej X w warunkach z przykładu 1, jeśli wiadomo, że wartość X rozłożone zgodnie z prawem zbliżonym do normalnego.

Rozwiązanie. Wartość pozostaje taka sama jak w tabeli. 14.3.1:

Zgodnie ze wzorem (14.3.16)

Korzystając ze wzoru (14.3.18) znajdujemy przedział ufności:

Odpowiedni przedział wartości średnich odchylenie kwadratowe: (0,21; 0,29).

14.4. Dokładne metody konstruowania przedziałów ufności dla parametrów zmiennej losowej o rozkładzie normalnym

W poprzednim podrozdziale zbadaliśmy mniej więcej przybliżone metody konstruowania przedziałów ufności dla matematycznych oczekiwań i wariancji. Tutaj przedstawimy dokładne metody rozwiązania tego samego problemu. Podkreślamy, że aby dokładnie znaleźć przedziały ufności, należy koniecznie znać z góry postać prawa dystrybucji wielkości X, podczas gdy w przypadku stosowania metod przybliżonych nie jest to konieczne.

Pomysł precyzyjne metody Konstruowanie przedziałów ufności sprowadza się do następujących kwestii. Dowolny przedział ufności wyznacza się z warunku wyrażającego prawdopodobieństwo spełnienia określonych nierówności, do których zalicza się interesujące nas oszacowanie A. Prawo dystrybucji wartości A V przypadek ogólny zależy od nieznanych parametrów ilościowych X. Czasami jednak możliwe jest przekazanie nierówności ze zmiennej losowej A do jakiejś innej funkcji obserwowanych wartości X p X 2, ..., X s. którego prawo dystrybucji nie zależy od nieznanych parametrów, ale zależy tylko od liczby eksperymentów i rodzaju prawa dystrybucji wielkości X. Tego rodzaju zmienne losowe odgrywają ważną rolę w statystyce matematycznej; zostały one zbadane najbardziej szczegółowo w przypadku rozkładu normalnego wielkości X.

Udowodniono na przykład, że przy normalnym rozkładzie wartości X wartość losowa

przestrzega tzw Prawo dotyczące dystrybucji studentów Z P- 1 stopień swobody; gęstość tego prawa ma postać

gdzie G(x) jest znaną funkcją gamma:

Udowodniono również, że zmienna losowa

ma „dystrybucję% 2” z P- 1 stopień swobody (patrz rozdział 7), którego gęstość wyraża się wzorem

Nie wnikając w wyprowadzenia rozkładów (14.4.2) i (14.4.4), pokażemy, jak można je zastosować przy konstruowaniu przedziałów ufności dla parametrów ty D.

Niech się wyprodukuje P niezależne eksperymenty na zmiennej losowej X, rozkład normalny z nieznanymi parametrami DO. Dla tych parametrów uzyskano szacunki

Należy skonstruować przedziały ufności dla obu parametrów odpowiadających prawdopodobieństwu ufności p.

Najpierw skonstruujmy przedział ufności dla oczekiwań matematycznych. Naturalne jest, aby przyjąć ten przedział symetrycznie względem T; niech s p oznacza połowę długości przedziału. Wartość s p należy tak dobrać, aby warunek był spełniony

Spróbujmy przejść na lewą stronę równości (14.4.5) od zmiennej losowej T do zmiennej losowej T, dystrybuowane zgodnie z prawem Studenta. Aby to zrobić, pomnóż obie strony nierówności |m-w?|

o wartość dodatnią: lub używając notacji (14.4.1),

Znajdźmy liczbę / p taką, że wartość / p można znaleźć z warunku

Ze wzoru (14.4.2) wynika, że ​​(1) - nawet funkcjonować, więc (14.4.8) daje

Równość (14.4.9) określa wartość / p w zależności od p. Jeśli masz do dyspozycji tabelę wartości całkowitych

wówczas wartość /p można znaleźć w tabeli poprzez odwrotną interpolację. Jednak wygodniej jest wcześniej sporządzić tabelę wartości /p. Taka tabela znajduje się w dodatku (tabela 5). Ta tabela pokazuje wartości w zależności od poziomu ufności p i liczby stopni swobody P- 1. Po ustaleniu / p z tabeli. 5 i zakładamy

znajdziemy połowę szerokości przedziału ufności / p i sam przedział

Przykład 1. Przeprowadzono 5 niezależnych eksperymentów na zmiennej losowej X, rozkład normalny z nieznanymi parametrami T i o. Wyniki doświadczeń podano w tabeli. 14.4.1.

Tabela 14.4.1

Znajdź ocenę T dla oczekiwania matematycznego i skonstruuj dla niego 90% przedział ufności / p (tj. przedział odpowiadający prawdopodobieństwu ufności p = 0,9).

Rozwiązanie. Mamy:

Zgodnie z tabelą 5 wniosku o dot P - 1 = 4 i p = 0,9 znajdujemy Gdzie

Przedział ufności będzie wynosił

Przykład 2. Dla warunków przykładu 1 z podrozdziału 14.3, przyjmując wartość X rozkład normalny, znajdź dokładny przedział ufności.

Rozwiązanie. Według tabeli 5 w załączniku dowiadujemy się kiedy P - 1 = 19ir =

0,8 / p = 1,328; stąd

Porównując z rozwiązaniem przykładu 1 z podrozdziału 14.3 (e p = 0,072) jesteśmy przekonani, że rozbieżność jest bardzo niewielka. Jeśli zachowamy dokładność do drugiego miejsca po przecinku, wówczas przedziały ufności znalezione metodami dokładnymi i przybliżonymi pokrywają się:

Przejdźmy do konstruowania przedziału ufności dla wariancji. Rozważmy nieobciążony estymator wariancji

i wyrazić zmienną losową D poprzez wielkość V(14.4.3), mający rozkład x 2 (14.4.4):

Znajomość prawa podziału ilości V, możesz znaleźć przedział /(1), w którym mieści się on z danym prawdopodobieństwem p.

Prawo dystrybucji kn_x(v) wielkość I 7 ma postać pokazaną na ryc. 14.4.1.

Ryż. 14.4.1

Powstaje pytanie: jak wybrać przedział/p? Jeśli prawo rozkładu wielkości V był symetryczny (jak prawo normalne lub rozkład Studenta), naturalnym byłoby przyjęcie przedziału /p symetrycznego względem oczekiwań matematycznych. W tym wypadku prawo k p_x (v) asymetryczny. Zgódźmy się na taki wybór przedziału /p, aby prawdopodobieństwo wartości było V poza odstępem po prawej i lewej stronie (zacienione obszary na ryc. 14.4.1) były takie same i równe

Aby skonstruować przedział /p z tą właściwością, skorzystamy z tabeli. 4 zastosowania: zawiera cyfry y) takie, że

dla wartości V, mający rozkład x 2 z r stopniami swobody. W naszym przypadku r = n- 1. Naprawmy r = n- 1 i znajdź w odpowiednim wierszu tabeli. 4 dwa znaczenia x 2 - jedno odpowiada prawdopodobieństwu, drugie prawdopodobieństwu. Oznaczmy je

wartości o 2 I XL? Przerwa ma y 2, z lewą stroną i y ~ prawy koniec.

Znajdźmy teraz z przedziału / p pożądany przedział ufności /| dla dyspersji z granicami D i D2, co obejmuje ten punkt D z prawdopodobieństwem p:

Skonstruujmy przedział / (, = (?> ь А) obejmujący ten punkt D wtedy i tylko wtedy, gdy wartość V mieści się w przedziale /r. Pokażmy, że przedział

spełnia ten warunek. Faktycznie, nierówności są równoważne nierównościom

i nierówności te są spełnione z prawdopodobieństwem p. W ten sposób wyznaczono przedział ufności dla wariancji, który wyraża się wzorem (14.4.13).

Przykład 3. Znajdź przedział ufności dla wariancji w warunkach z przykładu 2 z podrozdziału 14.3, jeśli wiadomo, że wartość X normalnie dystrybuowane.

Rozwiązanie. Mamy . Zgodnie z tabelą 4 w załączniku

znajdziemy na r = n - 1 = 19

Korzystając ze wzoru (14.4.13) znajdujemy przedział ufności dla wariancji

Odpowiedni przedział odchylenia standardowego wynosi (0,21; 0,32). Przedział ten tylko nieznacznie przekracza przedział (0,21; 0,29) uzyskany w przykładzie 2 z podrozdziału 14.3 metodą przybliżoną.

  • Rysunek 14.3.1 przedstawia przedział ufności symetryczny względem a. Ogólnie rzecz biorąc, jak zobaczymy później, nie jest to konieczne.

Przedziały ufności.

Obliczenie przedziału ufności opiera się na średnim błędzie odpowiedniego parametru. Przedział ufności pokazuje, w jakich granicach z prawdopodobieństwem (1-a) mieści się prawdziwa wartość szacowanego parametru. Tutaj a jest poziomem istotności, (1-a) jest również nazywane prawdopodobieństwem ufności.

W pierwszym rozdziale pokazaliśmy, że np. dla średniej arytmetycznej prawdziwa średnia populacji w około 95% przypadków mieści się w granicach 2 błędów standardowych średniej. Zatem granice 95% przedziału ufności dla średniej będą dwukrotnie dłuższe od średniej próbki średni błądśredni, tj. mnożymy średni błąd średniej przez określony współczynnik w zależności od poziomu ufności. Za średnią i różnicę średnich przyjmuje się współczynnik Studenta (wartość krytyczna testu Studenta), dla udziału i różnicy udziałów wartość krytyczną kryterium z. Iloczyn współczynnika i błędu średniego można nazwać błędem maksymalnym danego parametru, tj. maksimum, jakie możemy uzyskać przy jego ocenie.

Przedział ufności dla Średnia arytmetyczna : .

Oto przykładowa średnia;

Średni błąd średniej arytmetycznej;

S - Odchylenie standardowe próbki;

N

f = rz-1 (współczynnik Studenta).

Przedział ufności dla różnice średnich arytmetycznych :

Oto różnica między przykładowymi średnimi;

- błąd średni różnicy średnich arytmetycznych;

s 1 , s 2 – przykładowe odchylenia standardowe;

n1, n2

Krytyczna wartość Test t-Studenta dla zadanego poziomu istotności a i liczby stopni swobody f=n 1 + n 2-2 (współczynnik Studenta).

Przedział ufności dla Akcje :

.

Tutaj d jest frakcją próbki;

– średni błąd ułamkowy;

N– liczebność próby (wielkość grupy);

Przedział ufności dla różnica udziałów :

Oto różnica w przykładowych udziałach;

– błąd średni różnicy średnich arytmetycznych;

n1, n2– objętości próbek (liczba grup);

Wartość krytyczna kryterium z na danym poziomie istotności a ( , , ).

Obliczając przedziały ufności dla różnicy między wskaźnikami, po pierwsze, bezpośrednio widzimy możliwa wartość efekt i nie tylko Punktowe oszacowanie. Po drugie, możemy wyciągnąć wniosek o przyjęciu lub odrzuceniu hipotezy zerowej, a po trzecie, możemy wyciągnąć wniosek o mocy testu.

Testując hipotezy za pomocą przedziałów ufności należy przestrzegać następującej zasady:

Jeżeli 100(1-a) procentowy przedział ufności różnicy średnich nie zawiera zera, wówczas różnice są istotne statystycznie na poziomie istotności a; wręcz przeciwnie, jeśli ten przedział zawiera zero, to różnice nie są istotne statystycznie.

Rzeczywiście, jeśli w tym przedziale znajduje się zero, oznacza to, że porównywany wskaźnik może być większy lub mniejszy w jednej z grup w porównaniu do drugiej, tj. zaobserwowane różnice wynikają z przypadku.

Moc testu można ocenić na podstawie położenia zera w przedziale ufności. Jeśli zero jest bliskie wartości niższej lub Górna granica odstępie czasu, to być może przy większej liczbie porównywanych grup różnice by sięgnęły znaczenie statystyczne. Jeśli zero znajduje się blisko środka przedziału, oznacza to, że zarówno wzrost, jak i spadek wskaźnika w grupie eksperymentalnej są równie prawdopodobne i prawdopodobnie tak naprawdę nie ma różnic.

Przykłady:

Porównanie śmiertelności chirurgicznej przy zastosowaniu dwóch różnych rodzajów znieczulenia: w pierwszym rodzaju znieczulenia operowano 61 osób, 8 zmarło, w drugim – 67 osób, 10 zmarło.

re 1 = 8/61 = 0,131; d2 = 10/67 = 0,149; d1-d2 = - 0,018.

Różnica w śmiertelności porównywanych metod będzie mieściła się w przedziale (-0,018 - 0,122; -0,018 + 0,122) lub (-0,14; 0,104) z prawdopodobieństwem 100(1-a) = 95%. Przedział zawiera zero, tj. hipoteza o tej samej śmiertelności w dwóch przypadkach różne rodzaje Nie można odmówić znieczulenia.

Zatem śmiertelność może i będzie spadać do 14% i wzrastać do 10,4% z prawdopodobieństwem 95%, tj. zero znajduje się mniej więcej pośrodku przedziału, więc można argumentować, że najprawdopodobniej te dwie metody naprawdę nie różnią się śmiertelnością.

W omówionym wcześniej przykładzie porównano średni czas prasowania podczas testu stukania w czterech grupach uczniów różniących się wynikami egzaminu. Obliczmy przedziały ufności dla średniego czasu prasowania dla uczniów, którzy zdali egzamin z ocenami 2 i 5 oraz przedział ufności dla różnicy między tymi średnimi.

Współczynniki Studenta wyznacza się korzystając z tablic rozkładów Studenta (patrz załącznik): dla pierwszej grupy: = t(0,05;48) = 2,011; dla drugiej grupy: = t(0,05;61) = 2,000. Zatem przedziały ufności dla pierwszej grupy: = (162,19-2,011*2,18; 162,19+2,011*2,18) = (157,8; 166,6), dla drugiej grupy (156,55-2000*1,88; 156,55+2000*1,88) = (152,8 ; 160,3). Zatem dla tych, którzy zdali egzamin na 2, średni czas prasowania waha się od 157,8 ms do 166,6 ms z prawdopodobieństwem 95%, dla tych, którzy zdali egzamin na 5 – od 152,8 ms do 160,3 ms z prawdopodobieństwem 95%. .

Hipotezę zerową można także przetestować, używając przedziałów ufności dla średnich, a nie tylko dla różnicy średnich. Przykładowo, jak w naszym przypadku, jeżeli przedziały ufności dla średnich pokrywają się, to hipotezy zerowej nie można odrzucić. Aby odrzucić hipotezę na wybranym poziomie istotności, odpowiednie przedziały ufności nie mogą się pokrywać.

Znajdźmy przedział ufności dla różnicy średniego czasu prasowania w grupach, które zdały egzamin z ocenami 2 i 5. Różnica średnich: 162,19 – 156,55 = 5,64. Współczynnik Studenta: = t(0,05;49+62-2) = t(0,05;109) = 1,982. Grupowe odchylenia standardowe będą równe: ; . Obliczamy błąd średni różnicy średnich: . Przedział ufności: =(5,64-1,982*2,87; 5,64+1,982*2,87) = (-0,044; 11,33).

Zatem różnica w średnim czasie prasowania w grupach, które zdały egzamin na 2 i 5, będzie się mieścić w przedziale od -0,044 ms do 11,33 ms. Przedział ten zawiera zero, tj. Średni czas prasowania dla osób, które zdały egzamin dobrze, może się wydłużyć lub zmniejszyć w porównaniu do osób, które zdały egzamin niezadowalająco, tj. hipotezy zerowej nie można odrzucić. Jednak zero jest bardzo blisko dolnej granicy, a czas wciskania jest znacznie bardziej skrócony w przypadku tych, którzy zdali dobrze. Możemy zatem stwierdzić, że nadal istnieją różnice w średnim czasie tłoczenia pomiędzy osobami, które zdały egzamin 2 i 5, po prostu nie mogliśmy ich wykryć, biorąc pod uwagę zmianę średniego czasu, rozpiętość średniego czasu i wielkość próby.



Moc testu to prawdopodobieństwo odrzucenia błędnej hipotezy zerowej, tj. znaleźć różnice tam, gdzie faktycznie istnieją.

Moc testu określa się na podstawie poziomu istotności, wielkości różnic między grupami, rozrzutu wartości w grupach oraz wielkości próbek.

Do testu studenckiego i analiza wariancji Można skorzystać z diagramów wrażliwości.

Siłę kryterium można wykorzystać do wstępnego określenia wymaganej liczby grup.

Przedział ufności pokazuje, w jakich granicach z danym prawdopodobieństwem mieści się prawdziwa wartość szacowanego parametru.

Korzystając z przedziałów ufności, można testować hipotezy statystyczne i wyciągać wnioski na temat wrażliwości kryteriów.

LITERATURA.

Glanz S. – Rozdział 6,7.

Rebrova O.Yu. – s. 112-114, s. 171-173, s. 234-238.

Sidorenko E.V. – s. 32-33.

Pytania do samodzielnego sprawdzenia uczniów.

1. Jaka jest siła kryterium?

2. W jakich przypadkach należy oceniać siłę kryteriów?

3. Metody obliczania mocy.

6. Jak testować hipotezę statystyczną za pomocą przedziału ufności?

7. Co można powiedzieć o mocy kryterium przy obliczaniu przedziału ufności?

Zadania.

Załóżmy, że mamy dużą liczbę towarów o rozkładzie normalnym pewnych cech (na przykład pełny magazyn warzyw tego samego rodzaju, których wielkość i waga są różne). Chcesz poznać średnią charakterystykę całej partii towaru, ale nie masz czasu i ochoty mierzyć i ważyć każdego warzywa. Rozumiesz, że to nie jest konieczne. Ale ile sztuk trzeba będzie pobrać do kontroli wyrywkowej?

Zanim podamy kilka wzorów przydatnych w tej sytuacji, przypomnijmy sobie pewne oznaczenia.

Po pierwsze, gdybyśmy zmierzyli cały magazyn warzyw (ten zbiór elementów nazywa się populacją ogólną), to znalibyśmy z całą dostępną nam dokładnością średnią masę całej partii. Nazwijmy to średnią X średnio .g en . - Średnia ogólna. Wiemy już, co jest całkowicie określone, jeśli znana jest jego wartość średnia i odchylenie s . To prawda, choć nie jesteśmy ani przeciętnym pokoleniem X, ani S Nie znamy ogólnej populacji. Możemy pobrać tylko określoną próbkę, zmierzyć potrzebne nam wartości i obliczyć dla tej próbki zarówno średnią wartość X śr., jak i odchylenie standardowe S wybrane.

Wiadomo, że jeśli nasza próbna kontrola zawiera dużą liczbę elementów (zwykle n jest większe niż 30) i są one brane pod uwagę naprawdę losowe, następnie s populacja ogólna prawie nie będzie się różnić od selekcji S.

Dodatkowo dla przypadku rozkładu normalnego możemy skorzystać z następujących wzorów:

Z prawdopodobieństwem 95%


Z prawdopodobieństwem 99%



W ogólna perspektywa z prawdopodobieństwem P (t)


Zależność pomiędzy wartością t a wartością prawdopodobieństwa P(t), z jaką chcemy poznać przedział ufności, można odczytać z poniższej tabeli:


Ustaliliśmy w ten sposób, w jakim przedziale mieści się (z zadanym prawdopodobieństwem) wartość średnia dla populacji.

Jeśli nie mamy wystarczająco dużej próby, nie możemy powiedzieć, że populacja ma s = S wybierz Dodatkowo w tym przypadku problematyczna jest bliskość próbki do rozkładu normalnego. W tym przypadku również używamy zamiast tego Sselect s we wzorze:




ale wartość t dla ustalonego prawdopodobieństwa P(t) będzie zależała od liczby elementów w próbce n. Im większe n, tym wynikowy przedział ufności będzie bliższy wartości podanej wzorem (1). Wartości t w tym przypadku są pobierane z innej tabeli ( Test t-Studenta), które prezentujemy poniżej:

Wartości testu t-Studenta dla prawdopodobieństwa 0,95 i 0,99


Przykład 3. Spośród pracowników firmy wybrano losowo 30 osób. Według próby okazało się, że średnia pensja (miesięczna) wynosi 30 tysięcy rubli przy odchyleniu standardowym 5 tysięcy rubli. Określ średnie wynagrodzenie w firmie z prawdopodobieństwem 0,99.

Rozwiązanie: Pod warunkiem mamy n = 30, X śr. =30000, S=5000, P = 0,99. Aby znaleźć przedział ufności, skorzystamy ze wzoru odpowiadającego testowi t-Studenta. Z tabeli dla n = 30 i P = 0,99 znajdujemy zatem t = 2,756


te. poszukiwany kurator przedział 27484< Х ср.ген < 32516.

Zatem z prawdopodobieństwem 0,99 możemy powiedzieć, że przedział (27484; 32516) zawiera w sobie przeciętne wynagrodzenie w firmie.

Mamy nadzieję, że skorzystasz z tej metody i nie jest konieczne, abyś za każdym razem miał przy sobie stolik. Obliczenia można przeprowadzić automatycznie w programie Excel. Będąc w pliku Excel, kliknij przycisk fx w górnym menu. Następnie spośród funkcji wybierz typ „statystyczny” i z proponowanej listy w oknie – STUDAR DISCOVER. Następnie po wskazaniu, umieszczając kursor w polu „prawdopodobieństwo” wprowadź wartość prawdopodobieństwa odwrotnego (czyli w naszym przypadku zamiast prawdopodobieństwa 0,95 należy wpisać prawdopodobieństwo 0,05). Najwyraźniej arkusz zestawiony jest w taki sposób, aby wynik odpowiadał na pytanie, z jakim prawdopodobieństwem możemy popełnić błąd. Podobnie w polu Stopień swobody wprowadź wartość (n-1) dla swojej próbki.

Przedział ufności dla oczekiwań matematycznych - jest to przedział obliczony na podstawie danych, który ze znanym prawdopodobieństwem zawiera matematyczne oczekiwanie populacji ogólnej. Naturalnym oszacowaniem oczekiwania matematycznego jest średnia arytmetyczna jego zaobserwowanych wartości. Dlatego podczas całej lekcji będziemy używać terminów „średnia” i „wartość średnia”. W przypadku problemów związanych z obliczaniem przedziału ufności najczęściej wymagana jest odpowiedź w stylu: „Przedział ufności średniej liczby [wartości w konkretnym problemie] wynosi od [mniejsza wartość] do [większa wartość]”. Korzystając z przedziału ufności, można ocenić nie tylko wartości średnie, ale także odsetek określonej cechy w populacji ogólnej. Średnie, wariancja, odchylenie standardowe a błędy, dzięki którym dotrzemy do nowych definicji i wzorów, zostaną omówione na lekcji Charakterystyka próby i populacji .

Punktowe i przedziałowe oszacowanie średniej

Jeżeli średnią wartość populacji szacuje się liczbą (punktem), to za oszacowanie nieznanej średniej wartości populacji przyjmuje się konkretną średnią, obliczoną z próby obserwacji. W tym przypadku wartość średniej próby – zmiennej losowej – nie pokrywa się ze średnią wartością populacji ogólnej. Dlatego też, wskazując średnią próbki, należy jednocześnie wskazać błąd próbkowania. Miarą błędu próbkowania jest błąd standardowy, który wyraża się w tych samych jednostkach co średnia. Dlatego często stosuje się następującą notację: .

Jeśli oszacowanie średniej trzeba wiązać z pewnym prawdopodobieństwem, to interesujący w populacji parametr należy oceniać nie jedną liczbą, ale przedziałem. Przedział ufności to przedział, w którym z pewnym prawdopodobieństwem P znaleziono wartość szacowanego wskaźnika populacji. Przedział ufności, w którym jest to prawdopodobne P = 1 - α znaleziona zostanie zmienna losowa, obliczona w następujący sposób:

,

α = 1 - P, który można znaleźć w dodatku do niemal każdej książki o statystyce.

W praktyce średnia i wariancja populacji nie są znane, dlatego wariancję populacji zastępuje się wariancją z próby, a średnią z populacji – średnią z próby. Zatem przedział ufności w większości przypadków oblicza się w następujący sposób:

.

Do oszacowania średniej populacji można zastosować wzór na przedział ufności

  • znane jest odchylenie standardowe populacji;
  • lub odchylenie standardowe populacji jest nieznane, ale wielkość próby jest większa niż 30.

Średnia z próby jest obiektywnym oszacowaniem średniej populacji. Z kolei wariancja próbki nie jest obiektywnym oszacowaniem wariancji populacji. Aby uzyskać bezstronne oszacowanie wariancji populacji we wzorze na wariancję próbki, wielkość próby N należy zastąpić N-1.

Przykład 1. Ze 100 losowo wybranych kawiarni w pewnym mieście zebrano informację, że średnia liczba pracowników w nich wynosi 10,5 przy odchyleniu standardowym 4,6. Określ 95% przedział ufności dla liczby pracowników kawiarni.

gdzie jest wartością krytyczną standardowego rozkładu normalnego dla poziomu istotności α = 0,05 .

Zatem 95% przedział ufności dla średniej liczby pracowników kawiarni wahał się od 9,6 do 11,4.

Przykład 2. Dla próby losowej z populacji 64 obserwacji obliczono następujące sumaryczne wartości:

suma wartości w obserwacjach,

suma kwadratów odchyleń wartości od średniej .

Oblicz 95% przedział ufności dla oczekiwań matematycznych.

Obliczmy odchylenie standardowe:

,

Obliczmy średnią wartość:

.

Podstawiamy wartości do wyrażenia przedziału ufności:

gdzie jest wartością krytyczną standardowego rozkładu normalnego dla poziomu istotności α = 0,05 .

Otrzymujemy:

Zatem 95% przedział ufności dla oczekiwań matematycznych tej próbki wahał się od 7,484 do 11,266.

Przykład 3. Dla losowej próby populacji składającej się ze 100 obserwacji obliczona średnia wynosi 15,2, a odchylenie standardowe wynosi 3,2. Oblicz 95% przedział ufności dla wartości oczekiwanej, a następnie 99% przedział ufności. Jeśli moc próbki i jej zmienność pozostaną niezmienione, a współczynnik ufności wzrośnie, to czy przedział ufności zwęzi się czy poszerzy?

Podstawiamy te wartości do wyrażenia przedziału ufności:

gdzie jest wartością krytyczną standardowego rozkładu normalnego dla poziomu istotności α = 0,05 .

Otrzymujemy:

.

Zatem 95% przedział ufności dla średniej tej próby wahał się od 14,57 do 15,82.

Ponownie podstawiamy te wartości do wyrażenia przedziału ufności:

gdzie jest wartością krytyczną standardowego rozkładu normalnego dla poziomu istotności α = 0,01 .

Otrzymujemy:

.

Zatem 99% przedział ufności dla średniej tej próby wahał się od 14,37 do 16,02.

Jak widzimy, wraz ze wzrostem współczynnika ufności wzrasta również wartość krytyczna standardowego rozkładu normalnego, a w konsekwencji punkty początkowe i końcowe przedziału znajdują się dalej od średniej, a tym samym wzrasta przedział ufności dla oczekiwań matematycznych .

Punktowe i przedziałowe szacunki ciężaru właściwego

Udział jakiegoś atrybutu próbki można interpretować jako oszacowanie punktowe środek ciężkości P o tej samej charakterystyce w populacji ogólnej. Jeżeli wartość tę trzeba powiązać z prawdopodobieństwem, należy obliczyć przedział ufności ciężaru właściwego P charakterystyczne w populacji z prawdopodobieństwem P = 1 - α :

.

Przykład 4. W pewnym mieście jest dwóch kandydatów A I B kandydują na burmistrza. W badaniu losowym wzięło udział 200 mieszkańców miasta, z czego 46% odpowiedziało, że oddałoby głos na danego kandydata A, 26% - dla kandydata B a 28% nie wie, na kogo będzie głosować. Określ 95% przedział ufności dla odsetka mieszkańców miasta popierających kandydata A.



Nowość na stronie

>

Najbardziej popularny