Dom Protetyka i implantacja Jak znaleźć przykład przedziału ufności. Przedział ufności

Jak znaleźć przykład przedziału ufności. Przedział ufności

Przedział ufności– wartości graniczne wartość statystyczna, które przy danym prawdopodobieństwie ufności γ będzie znajdować się w tym przedziale przy próbkowaniu większej objętości. Oznaczane jako P(θ - ε. W praktyce prawdopodobieństwo ufności γ wybiera się spośród wartości całkiem bliskich jedności: γ = 0,9, γ = 0,95, γ = 0,99.

Cel usługi. Korzystając z tej usługi możesz określić:

  • przedział ufności dla średniej ogólnej, przedział ufności dla wariancji;
  • przedział ufności dla odchylenia standardowego, przedział ufności dla udziału ogólnego;
Powstałe rozwiązanie zapisywane jest w pliku Word (patrz przykład). Poniżej znajduje się instrukcja wideo dotycząca wypełniania danych początkowych.

Przykład nr 1. W kołchozowym stadzie liczącym 1000 owiec 100 owiec zostało poddanych selektywnemu strzyżeniu kontrolnemu. W rezultacie ustalono średni strzyżenie wełny na owcę na poziomie 4,2 kg. Wyznaczyć z prawdopodobieństwem 0,99 średni błąd kwadratowy próbki przy wyznaczaniu średniego strzyżenia wełny na owcę oraz granice, w jakich mieści się wartość strzyżenia, jeżeli wariancja wynosi 2,5. Próbka nie jest powtarzalna.
Przykład nr 2. Z partii importowanych produktów na placówce Moskiewskiego Północnego Urzędu Celnego pobrano 20 próbek produktu „A” w drodze losowego, powtarzanego pobierania próbek. W wyniku badania ustalono średnią wilgotność produktu „A” w próbce, która okazała się równa 6% przy odchyleniu standardowym 1%.
Wyznaczyć z prawdopodobieństwem 0,683 granice średniej wilgotności produktu w całej partii importowanych produktów.
Przykład nr 3. Badanie przeprowadzone wśród 36 uczniów wykazało, że średnia liczba podręczników czytanych przez nich w ciągu roku wynosi ok rok akademicki, okazało się równe 6. Zakładając, że liczba podręczników przeczytanych przez studenta w semestrze ma rozkład normalny z odchyleniem standardowym równym 6, znajdź: A) z rzetelnością 0,99, oszacowanie przedziałowe dla oczekiwanie tego zmienna losowa; B) z jakim prawdopodobieństwem można powiedzieć, że średnia liczba podręczników przeczytanych przez studenta w semestrze, obliczona na podstawie danej próby, będzie odbiegać od oczekiwań matematycznych według całkowita wartość nie więcej niż 2.

Klasyfikacja przedziałów ufności

Według rodzaju ocenianego parametru:

Według typu próbki:

  1. Przedział ufności dla nieskończonej próbki;
  2. Przedział ufności dla próbki końcowej;
Próbkę nazywa się ponownym próbkowaniem, jeśli wybrany obiekt zostanie zwrócony do populacji przed wybraniem kolejnego. Próbkę nazywa się niepowtarzalną, jeśli wybrany obiekt nie zostanie zwrócony do populacji. W praktyce zazwyczaj mamy do czynienia z próbkami jednorazowymi.

Obliczanie średniego błędu próbkowania dla losowego doboru próby

Nazywa się rozbieżność między wartościami wskaźników uzyskanych z próby a odpowiadającymi im parametrami populacji ogólnej błąd reprezentatywności.
Oznaczenia głównych parametrów populacji ogólnej i próbnej.
Wzory średniego błędu próbkowania
ponowny wybórpowtórzyć wybór
dla przeciętnegodo udostępnieniadla przeciętnegodo udostępnienia
Zależność między granicą błędu próbkowania (Δ) gwarantowana z pewnym prawdopodobieństwem Р(t), I średni błąd próbka ma postać: lub Δ = t·μ, gdzie T– współczynnik ufności, wyznaczany w zależności od poziomu prawdopodobieństwa P(t) zgodnie z tablicą całki Laplace’a.

Wzory do obliczania wielkości próby przy zastosowaniu metody doboru czysto losowego

W poprzednich podrozdziałach rozważaliśmy kwestię estymacji nieznanego parametru A jeden numer. Nazywa się to oszacowaniem „punktowym”. W wielu zadaniach trzeba nie tylko znaleźć parametr A odpowiednią wartość liczbową, ale także ocenę jego dokładności i wiarygodności. Trzeba wiedzieć do jakich błędów może doprowadzić zmiana parametru A jego oszacowanie punktowe A oraz z jakim stopniem pewności możemy oczekiwać, że błędy te nie przekroczą znanych limitów?

Problemy tego rodzaju są szczególnie istotne w przypadku małej liczby obserwacji, gdy oszacowanie punktowe i w jest w dużej mierze losowe i przybliżone zastąpienie a może prowadzić do poważnych błędów.

Aby dać wyobrażenie o dokładności i wiarygodności oszacowania A,

V statystyka matematyczna Używają tak zwanych przedziałów ufności i prawdopodobieństw ufności.

Niech dla parametru A bezstronny szacunek uzyskany z doświadczenia A. Chcemy oszacować możliwy błąd w tym przypadku. Przypiszmy jakieś wystarczająco duże prawdopodobieństwo p (na przykład p = 0,9, 0,95 lub 0,99), aby zdarzenie z prawdopodobieństwem p można było uznać za praktycznie pewne i znajdźmy wartość s, dla której

Wtedy zasięg jest praktycznie możliwa wartość błąd pojawiający się przy wymianie A NA A, będzie ± s; Duże błędy w wartości bezwzględnej pojawią się tylko z małym prawdopodobieństwem a = 1 - p. Przepiszmy (14.3.1) jako:

Równość (14.3.2) oznacza, że ​​z prawdopodobieństwem p nieznana wartość parametru A wpada w interwał

Należy zwrócić uwagę na jedną okoliczność. Wcześniej wielokrotnie rozważaliśmy prawdopodobieństwo, że zmienna losowa znajdzie się w danym nielosowym przedziale. Tutaj sytuacja jest inna: wielkość A nie jest losowy, ale przedział /p jest losowy. Jego położenie na osi x jest losowe i zależy od jego środka A; Ogólnie rzecz biorąc, długość przedziału 2s jest również losowa, ponieważ wartość s jest obliczana z reguły na podstawie danych eksperymentalnych. Dlatego w w tym przypadku lepiej byłoby interpretować wartość p nie jako prawdopodobieństwo „trafienia” w punkt A w przedziale /p oraz jako prawdopodobieństwo, że losowy przedział /p obejmie punkt A(Rys. 14.3.1).

Ryż. 14.3.1

Zwykle nazywa się prawdopodobieństwo p prawdopodobieństwo pewności i przedział / p - przedział ufności. Granice przedziałów Jeśli. a x = a- i za 2 = za + i są tzw granice zaufania.

Podajmy inną interpretację pojęcia przedziału ufności: można go uznać za przedział wartości parametrów A, zgodne z danymi eksperymentalnymi i nie zaprzeczające im. Rzeczywiście, jeśli zgodzimy się uznać zdarzenie z prawdopodobieństwem a = 1-p praktycznie niemożliwe, to te wartości parametru a, dla których a - a> s należy uznać za sprzeczne z danymi eksperymentalnymi oraz takie, dla których |a - A na na 2 .

Niech dla parametru A istnieje bezstronny szacunek A. Gdybyśmy znali prawo podziału ilości A, zadanie znalezienia przedziału ufności byłoby bardzo proste: wystarczyłoby znaleźć wartość s, dla której

Trudność polega na tym, że prawo rozkładu szacunków A zależy od prawa podziału ilości X a zatem na jego nieznanych parametrach (w szczególności na samym parametrze A).

Aby obejść tę trudność, można zastosować następującą, w przybliżeniu przybliżoną technikę: zamień nieznane parametry w wyrażeniu dla s na ich oszacowania punktowe. Przy stosunkowo dużej liczbie eksperymentów P(około 20...30) technika ta zazwyczaj daje wyniki zadowalające pod względem dokładności.

Jako przykład rozważmy problem przedziału ufności dla oczekiwań matematycznych.

Niech się wyprodukuje P X, których cechy są wartość oczekiwana T i wariancja D- nieznany. Dla tych parametrów uzyskano następujące szacunki:

Wymagane jest skonstruowanie przedziału ufności /p odpowiadającego prawdopodobieństwu ufności p dla oczekiwań matematycznych T wielkie ilości X.

Rozwiązując to zadanie skorzystamy z faktu, że ilość T reprezentuje sumę P niezależne zmienne losowe o jednakowym rozkładzie X godz i zgodnie z centralnym twierdzeniem granicznym dla wystarczająco dużego P jego prawo dystrybucji jest zbliżone do normalnego. W praktyce, nawet przy stosunkowo niewielkiej liczbie wyrazów (około 10...20), prawo podziału sumy można w przybliżeniu uznać za normalne. Zakładamy, że wartość T rozdzielone zgodnie z prawem normalnym. Charakterystyki tego prawa – matematyczne oczekiwanie i wariancja – są odpowiednio równe T I

(patrz rozdział 13, podpunkt 13.3). Załóżmy, że wartość D znamy i znajdziemy wartość Ep dla której

Korzystając ze wzoru (6.3.5) z rozdziału 6, wyrażamy prawdopodobieństwo po lewej stronie (14.3.5) poprzez funkcję rozkładu normalnego

gdzie jest odchyleniem standardowym oszacowania T.

Z równania

znajdź wartość Sp:

gdzie arg Ф* (х) jest funkcją odwrotną Ф* (X), te. wartość argumentu, przy którym normalna funkcja rozkład jest równy X.

Dyspersja D, za pomocą którego wyrażana jest ilość A 1P, nie wiemy dokładnie; jako jego przybliżoną wartość można posłużyć się oszacowaniem D(14.3.4) i umieść w przybliżeniu:

W ten sposób problem konstrukcji przedziału ufności został w przybliżeniu rozwiązany, który jest równy:

gdzie gp określa się wzorem (14.3.7).

Aby uniknąć odwrotnej interpolacji w tabelach funkcji Ф* (l) przy obliczaniu s p, wygodnie jest skompilować specjalną tabelę (tabela 14.3.1), która podaje wartości wielkości

w zależności od r. Wartość (p określa dla prawa normalnego liczbę odchyleń standardowych, które należy wykreślić w prawo i w lewo od środka dyspersji, aby prawdopodobieństwo dostania się do otrzymanego obszaru było równe p.

Przez wartość 7 p przedział ufności wyraża się jako:

Tabela 14.3.1

Przykład 1. Przeprowadzono 20 eksperymentów ilościowych X; wyniki przedstawiono w tabeli. 14.3.2.

Tabela 14.3.2

Wymagane jest znalezienie oszacowania na podstawie matematycznego oczekiwania wielkości X i skonstruuj przedział ufności odpowiadający prawdopodobieństwu ufności p = 0,8.

Rozwiązanie. Mamy:

Wybierając l: = 10 jako punkt odniesienia, korzystając z trzeciego wzoru (14.2.14) znajdujemy nieobciążone oszacowanie D :

Według tabeli 14.3.1 znajdujemy

Granice zaufania:

Przedział ufności:

Wartości parametrów T, mieszczące się w tym przedziale są zgodne z danymi eksperymentalnymi podanymi w tabeli. 14.3.2.

W podobny sposób można skonstruować przedział ufności dla wariancji.

Niech się wyprodukuje P niezależne eksperymenty na zmiennej losowej X z nieznanymi parametrami zarówno dla A, jak i dyspersji D uzyskano bezstronny szacunek:

Wymagane jest w przybliżeniu skonstruowanie przedziału ufności dla wariancji.

Ze wzoru (14.3.11) wynika, że ​​ilość D reprezentuje

kwota P zmienne losowe postaci . Te ilości nie są

niezależny, ponieważ którykolwiek z nich zawiera ilość T, zależny od wszystkich innych. Można jednak wykazać, że wraz ze wzrostem P prawo podziału ich sumy również zbliża się do normalnego. Prawie o godz P= 20...30 to już można uznać za normalne.

Załóżmy, że tak jest i znajdź cechy tego prawa: matematyczne oczekiwanie i rozproszenie. Od oceny D- zatem bezstronny M[D] = D.

Obliczanie wariancji D D wiąże się ze stosunkowo złożonymi obliczeniami, dlatego przedstawiamy jego wyrażenie bez wyprowadzenia:

gdzie q 4 jest czwartą punkt centralny wielkie ilości X.

Aby użyć tego wyrażenia, należy zastąpić wartości \u003d 4 i D(przynajmniej bliscy). Zamiast D możesz skorzystać z jego oceny D. W zasadzie czwarty moment centralny można również zastąpić oszacowaniem, na przykład wartością postaci:

ale taka zamiana zapewni wyjątkowo niską dokładność, ponieważ ogólnie rzecz biorąc, przy ograniczonej liczbie eksperymentów, momenty wysoki porządek ustalone od duże błędy. Jednak w praktyce często zdarza się, że rodzaj prawa podziału ilościowego X znane z góry: nieznane są jedynie jego parametry. Następnie możesz spróbować wyrazić μ 4 poprzez D.

Weźmy najczęstszy przypadek, gdy wartość X rozdzielone zgodnie z prawem normalnym. Następnie jego czwarty moment centralny wyraża się w postaci rozproszenia (patrz rozdział 6, podrozdział 6.2);

i wzór (14.3.12) daje Lub

Zastępowanie nieznanego w (14.3.14) D jego ocenę D, dostajemy: skąd

Moment μ 4 można wyrazić poprzez D także w niektórych innych przypadkach, gdy rozkład wartości X nie jest normalne, ale znany jest jego wygląd. Na przykład dla prawa jednolita gęstość(patrz rozdział 5) mamy:

gdzie (a, P) jest przedziałem, dla którego określone jest prawo.

Stąd,

Korzystając ze wzoru (14.3.12) otrzymujemy: gdzie znajdziemy w przybliżeniu

W przypadkach, gdy nie jest znany rodzaj prawa podziału dla wielkości 26, przy przybliżonym oszacowaniu wartości a/) nadal zaleca się stosowanie wzoru (14.3.16), chyba że istnieją szczególne podstawy, aby sądzić, że to prawo bardzo różni się od normalnej (ma zauważalną kurtozę dodatnią lub ujemną).

Jeśli przybliżoną wartość a/) uzyskamy w ten czy inny sposób, wówczas możemy skonstruować przedział ufności dla wariancji w taki sam sposób, jak zbudowaliśmy go dla oczekiwań matematycznych:

gdzie zgodnie z tabelą znajduje się wartość zależną od danego prawdopodobieństwa p. 14.3.1.

Przykład 2. Znajdź w przybliżeniu 80% przedział ufności dla wariancji zmiennej losowej X w warunkach z przykładu 1, jeśli wiadomo, że wartość X rozłożone zgodnie z prawem zbliżonym do normalnego.

Rozwiązanie. Wartość pozostaje taka sama jak w tabeli. 14.3.1:

Według wzoru (14.3.16)

Korzystając ze wzoru (14.3.18) znajdujemy przedział ufności:

Odpowiedni przedział wartości średnich odchylenie kwadratowe: (0,21; 0,29).

14.4. Precyzyjne metody konstrukcyjne przedziały ufności dla parametrów zmiennej losowej o rozkładzie normalnym

W poprzednim podrozdziale zbadaliśmy mniej więcej przybliżone metody konstruowania przedziałów ufności dla matematycznych oczekiwań i wariancji. Tutaj przedstawimy dokładne metody rozwiązania tego samego problemu. Podkreślamy, że aby dokładnie znaleźć przedziały ufności, należy koniecznie znać z góry postać prawa dystrybucji wielkości X, podczas gdy w przypadku stosowania metod przybliżonych nie jest to konieczne.

Pomysł precyzyjne metody Konstruowanie przedziałów ufności sprowadza się do następujących kwestii. Dowolny przedział ufności wyznacza się z warunku wyrażającego prawdopodobieństwo spełnienia określonych nierówności, do których zalicza się interesujące nas oszacowanie A. Prawo dystrybucji wartości A V przypadek ogólny zależy od nieznanych parametrów ilościowych X. Czasami jednak możliwe jest przekazanie nierówności ze zmiennej losowej A do jakiejś innej funkcji obserwowanych wartości X p X 2, ..., X s. którego prawo rozkładu nie zależy od nieznanych parametrów, ale zależy tylko od liczby eksperymentów i rodzaju prawa rozkładu wielkości X. Tego rodzaju zmienne losowe odgrywają ważną rolę w statystyce matematycznej; najbardziej szczegółowo zbadano je dla przypadku rozkładu normalnego wielkości X.

Udowodniono na przykład, że przy normalnym rozkładzie wartości X wartość losowa

przestrzega tzw Prawo dotyczące dystrybucji studentów Z P- 1 stopień swobody; gęstość tego prawa ma postać

gdzie G(x) jest znaną funkcją gamma:

Udowodniono również, że zmienna losowa

ma „dystrybucję% 2” z P- 1 stopień swobody (patrz rozdział 7), którego gęstość wyraża się wzorem

Nie wnikając w wyprowadzenia rozkładów (14.4.2) i (14.4.4), pokażemy, jak można je zastosować przy konstruowaniu przedziałów ufności dla parametrów ty D.

Niech się wyprodukuje P niezależne eksperymenty na zmiennej losowej X, rozkład normalny z nieznanymi parametrami DO. Dla tych parametrów uzyskano szacunki

Należy skonstruować przedziały ufności dla obu parametrów odpowiadających prawdopodobieństwu ufności p.

Najpierw skonstruujmy przedział ufności dla oczekiwań matematycznych. Naturalne jest, aby przyjąć ten przedział symetrycznie względem T; niech s p oznacza połowę długości przedziału. Wartość s p należy tak dobrać, aby warunek był spełniony

Spróbujmy przejść na lewą stronę równości (14.4.5) od zmiennej losowej T do zmiennej losowej T, dystrybuowane zgodnie z prawem Studenta. Aby to zrobić, pomnóż obie strony nierówności |m-w?|

o wartość dodatnią: lub używając notacji (14.4.1),

Znajdźmy liczbę / p taką, że wartość / p można znaleźć z warunku

Ze wzoru (14.4.2) wynika, że ​​(1) - nawet funkcjonować, więc (14.4.8) daje

Równość (14.4.9) określa wartość / p w zależności od p. Jeśli masz do dyspozycji tabelę wartości całkowitych

wówczas wartość /p można znaleźć w tabeli poprzez odwrotną interpolację. Jednak wygodniej jest wcześniej sporządzić tabelę wartości /p. Taka tabela znajduje się w dodatku (tabela 5). W poniższej tabeli przedstawiono wartości w zależności od poziomu ufności p i liczby stopni swobody P- 1. Po ustaleniu / p z tabeli. 5 i zakładamy

znajdziemy połowę szerokości przedziału ufności / p i sam przedział

Przykład 1. Przeprowadzono 5 niezależnych eksperymentów na zmiennej losowej X, rozkład normalny z nieznanymi parametrami T i o. Wyniki eksperymentów podano w tabeli. 14.4.1.

Tabela 14.4.1

Znajdź ocenę T dla oczekiwania matematycznego i skonstruuj dla niego 90% przedział ufności / p (tj. przedział odpowiadający prawdopodobieństwu ufności p = 0,9).

Rozwiązanie. Mamy:

Zgodnie z tabelą 5 wniosku o dot P - 1 = 4 i p = 0,9 znajdujemy Gdzie

Przedział ufności będzie wynosił

Przykład 2. Dla warunków przykładu 1 z podrozdziału 14.3, przyjmując wartość X rozkład normalny, znajdź dokładny przedział ufności.

Rozwiązanie. Zgodnie z tabelą 5 w załączniku znajdujemy się pod adresem P - 1 = 19ir =

0,8 / p = 1,328; stąd

Porównując z rozwiązaniem przykładu 1 z podrozdziału 14.3 (e p = 0,072) jesteśmy przekonani, że rozbieżność jest bardzo niewielka. Jeśli zachowamy dokładność do drugiego miejsca po przecinku, wówczas przedziały ufności znalezione metodami dokładnymi i przybliżonymi pokrywają się:

Przejdźmy do konstruowania przedziału ufności dla wariancji. Rozważmy nieobciążony estymator wariancji

i wyrazić zmienną losową D poprzez wielkość V(14.4.3), mający rozkład x 2 (14.4.4):

Znajomość prawa podziału ilości V, możesz znaleźć przedział /(1), w którym mieści się on z danym prawdopodobieństwem p.

Prawo dystrybucji kn_x(v) wielkość I 7 ma postać pokazaną na ryc. 14.4.1.

Ryż. 14.4.1

Powstaje pytanie: jak wybrać przedział/p? Jeśli prawo rozkładu wielkości V był symetryczny (jak prawo normalne lub rozkład Studenta), naturalnym byłoby przyjęcie przedziału /p symetrycznego względem oczekiwań matematycznych. W tym wypadku prawo k p_x (v) asymetryczny. Zgódźmy się na taki wybór przedziału /p, aby prawdopodobieństwo wartości było V poza odstępem po prawej i lewej stronie (obszary zacienione na ryc. 14.4.1) były takie same i równe

Aby skonstruować przedział /p z tą właściwością, skorzystamy z tabeli. 4 zastosowania: zawiera cyfry y) takie, że

dla wartości V, mający rozkład x 2 z r stopniami swobody. W naszym przypadku r = n- 1. Naprawmy r = n- 1 i znajdź w odpowiednim wierszu tabeli. 4 dwa znaczenia x 2 - jedno odpowiada prawdopodobieństwu, drugie prawdopodobieństwu. Oznaczmy je

wartości o 2 I XL? Przerwa ma y 2, z lewą stroną i y~ prawy koniec.

Znajdźmy teraz z przedziału / p pożądany przedział ufności /| dla dyspersji z granicami D i D2, co obejmuje ten punkt D z prawdopodobieństwem p:

Skonstruujmy przedział / (, = (?> ь А) obejmujący ten punkt D wtedy i tylko wtedy, gdy wartość V mieści się w przedziale /r. Pokażmy, że przedział

spełnia ten warunek. Faktycznie, nierówności są równoważne nierównościom

i nierówności te są spełnione z prawdopodobieństwem p. W ten sposób wyznaczono przedział ufności dla wariancji, który wyraża się wzorem (14.4.13).

Przykład 3. Znajdź przedział ufności dla wariancji w warunkach z przykładu 2 z podrozdziału 14.3, jeśli wiadomo, że wartość X normalnie dystrybuowane.

Rozwiązanie. Mamy . Zgodnie z tabelą 4 w załączniku

znajdziemy na g = n - 1 = 19

Korzystając ze wzoru (14.4.13) znajdujemy przedział ufności dla wariancji

Odpowiedni przedział odchylenia standardowego wynosi (0,21; 0,32). Przedział ten tylko nieznacznie przekracza przedział (0,21; 0,29) uzyskany w przykładzie 2 z podrozdziału 14.3 metodą przybliżoną.

  • Rysunek 14.3.1 przedstawia przedział ufności symetryczny względem a. Ogólnie rzecz biorąc, jak zobaczymy później, nie jest to konieczne.

Oszacowanie przedziałów ufności

Cele kształcenia

Statystyki uwzględniają następujące kwestie dwa główne zadania:

    Mamy pewne szacunki oparte na przykładowych danych i chcemy sformułować probabilistyczne stwierdzenie na temat tego, gdzie leży prawdziwa wartość szacowanego parametru.

    Mamy konkretną hipotezę, którą należy przetestować na przykładowych danych.

W tym temacie rozważamy pierwsze zadanie. Wprowadźmy jeszcze definicję przedziału ufności.

Przedział ufności to przedział zbudowany wokół szacowanej wartości parametru i pokazujący, gdzie znajduje się prawdziwa wartość szacowanego parametru z określonym z góry prawdopodobieństwem.

Po przestudiowaniu materiału na ten temat:

    dowiedz się, czym jest przedział ufności;

    nauczyć się klasyfikować problemy statystyczne;

    opanować technikę konstruowania przedziałów ufności, zarówno przy użyciu wzorów statystycznych, jak i przy użyciu narzędzi programowych;

    nauczyć się określać wymaganą liczebność próby, aby osiągnąć określone parametry dokładności szacunków statystycznych.

Rozkłady cech próbek

Rozkład T

Jak omówiono powyżej, rozkład zmiennej losowej jest zbliżony do standaryzowanego normalna dystrybucja z parametrami 0 i 1. Ponieważ nie znamy wartości σ, zastępujemy ją pewnym oszacowaniem s. Ilość ma już inny rozkład, a mianowicie lub Dystrybucja studencka, który jest określony przez parametr n -1 (liczba stopni swobody). Rozkład ten jest zbliżony do rozkładu normalnego (im większe n, tym bliższe rozkłady).

Na ryc. 95
przedstawiono rozkład Studenta z 30 stopniami swobody. Jak widać jest on bardzo zbliżony do rozkładu normalnego.

Podobnie do funkcji pracy z rozkładem normalnym ROZKŁAD NORMALNY i NORMINV, istnieją funkcje do pracy z rozkładem t - ROZKŁAD.T. STUDRASOBR (TINV). Przykład wykorzystania tych funkcji można zobaczyć w pliku STUDRASP.XLS (szablon i rozwiązanie) oraz na rys. 96
.

Rozkłady innych cech

Jak już wiemy, aby określić dokładność oszacowania oczekiwań matematycznych, potrzebujemy rozkładu t. Aby oszacować inne parametry, takie jak wariancja, wymagane są różne rozkłady. Dwa z nich to dystrybucja F i x 2 -dystrybucja.

Przedział ufności dla średniej

Przedział ufności- jest to przedział zbudowany wokół szacowanej wartości parametru i pokazujący, gdzie z określonym z góry prawdopodobieństwem znajduje się prawdziwa wartość szacowanego parametru.

Następuje konstrukcja przedziału ufności dla wartości średniej w następujący sposób:

Przykład

Restauracja typu fast food planuje poszerzyć swój asortyment o nowy rodzaj kanapki. Aby oszacować popyt na niego, menadżer planuje losowo wybrać 40 gości spośród tych, którzy już go wypróbowali i poprosić ich o ocenę swojego stosunku do nowego produktu w skali od 1 do 10. Menedżer chce oszacować oczekiwane liczbę punktów, jaką otrzyma nowy produkt i skonstruuj 95% przedział ufności dla tego oszacowania. Jak to zrobić? (patrz plik SANDWICH1.XLS (szablon i rozwiązanie).

Rozwiązanie

Aby rozwiązać ten problem, możesz użyć . Wyniki przedstawiono na ryc. 97
.

Przedział ufności dla wartości całkowitej

Czasami, korzystając z przykładowych danych, konieczne jest oszacowanie nie oczekiwania matematycznego, ale całkowita kwota wartości. Na przykład w sytuacji audytora interesem może być oszacowanie nie średniej wielkości konta, ale sumy wszystkich rachunków.

Niech N - całkowity elementów, n to liczebność próby, T 3 to suma wartości w próbie, T” to oszacowanie sumy dla całej populacji, następnie , a przedział ufności oblicza się ze wzoru , gdzie s jest oszacowaniem odchylenia standardowego dla próby, a jest oszacowaniem średniej dla próby.

Przykład

Powiedzmy, że trochę obsługa podatkowa chce oszacować kwotę całkowitego zwrotu podatku dla 10 000 podatników. Podatnik albo otrzymuje zwrot podatku, albo płaci dodatkowy podatek. Znajdź 95% przedział ufności dla kwoty zwrotu, zakładając wielkość próby 500 osób (patrz plik KWOTA ZWROTU.XLS (szablon i rozwiązanie).

Rozwiązanie

StatPro nie ma specjalnej procedury w tym przypadku, można jednak zauważyć, że granice można wyznaczyć z granic średniej na podstawie powyższych wzorów (ryc. 98
).

Przedział ufności dla proporcji

Niech p będzie matematycznym oczekiwaniem udziału klientów, a p b będzie oszacowaniem tego udziału uzyskanym z próby o wielkości n. Można to wykazać dla wystarczająco dużych rozkład ocen będzie zbliżony do normalnego z oczekiwaniem matematycznym p i odchyleniem standardowym . Standardowy błąd oszacowania w tym przypadku wyraża się jako , a przedział ufności wynosi .

Przykład

Restauracja typu fast food planuje poszerzyć swój asortyment o nowy rodzaj kanapki. Aby ocenić popyt na niego, menadżer wybrał losowo 40 gości spośród tych, którzy już go wypróbowali i poprosił ich o ocenę swojego stosunku do nowego produktu w skali od 1 do 10. Menedżer chce oszacować oczekiwany udział klientów, którzy ocenią nowy produkt na co najmniej 6 punktów (oczekuje, że ci klienci będą konsumentami nowego produktu).

Rozwiązanie

Początkowo tworzymy nową kolumnę na podstawie atrybutu 1 jeśli ocena klienta była większa niż 6 punktów, a w innym przypadku 0 (patrz plik SANDWICH2.XLS (szablon i rozwiązanie).

Metoda 1

Licząc liczbę 1, szacujemy udział, a następnie korzystamy ze wzorów.

Wartość zcr pobierana jest ze specjalnych tablic rozkładu normalnego (na przykład 1,96 dla 95% przedziału ufności).

Stosując to podejście i konkretne dane do skonstruowania przedziału 95%, otrzymujemy następujące wyniki (ryc. 99).
). Krytyczna wartość parametr z cr jest równy 1,96. Błąd standardowy oszacowania wynosi 0,077. Dolna granica przedziału ufności wynosi 0,475. Górna granica przedziału ufności wynosi 0,775. Menedżer ma więc prawo wierzyć z 95% pewnością, że odsetek klientów oceniających nowy produkt na 6 lub więcej punktów będzie się mieścić w przedziale 47,5–77,5.

Metoda 2

Problem ten można rozwiązać za pomocą standardowych narzędzi StatPro. Aby to zrobić, wystarczy zauważyć, że udział w tym przypadku pokrywa się ze średnią wartością kolumny Typ. Następnie aplikujemy StatPro/Wnioskowanie statystyczne/Analiza jednej próbki skonstruować przedział ufności średniej (oszacowanie oczekiwań matematycznych) dla kolumny Typ. Wyniki uzyskane w tym przypadku będą bardzo zbliżone do wyników pierwszej metody (ryc. 99).

Przedział ufności dla odchylenia standardowego

s służy jako estymata odchylenia standardowego (wzór podano w rozdziale 1). Funkcja gęstości oszacowania s jest funkcją chi-kwadrat, która podobnie jak rozkład t ma n-1 stopni swobody. Istnieją specjalne funkcje do pracy z tą dystrybucją CHIDIST i CHIINV.

Przedział ufności w tym przypadku nie będzie już symetryczny. Konwencjonalny diagram graniczny pokazano na ryc. 100 .

Przykład

Maszyna musi produkować części o średnicy 10 cm, jednak z różnych powodów pojawiają się błędy. Kontrolera jakości niepokoją dwie okoliczności: po pierwsze, średnia wartość powinna wynosić 10 cm; po drugie, nawet w tym przypadku, jeśli odchylenia są duże, wiele części zostanie odrzuconych. Codziennie wykonuje próbkę 50 części (patrz plik KONTROLA JAKOŚCI.XLS (szablon i rozwiązanie). Jakie wnioski może dać taka próbka?

Rozwiązanie

Skonstruujmy 95% przedziały ufności dla średniej i odchylenia standardowego za pomocą StatPro/Wnioskowanie statystyczne/Analiza jednej próbki(ryc. 101
).

Następnie, korzystając z założenia o normalnym rozkładzie średnic, obliczamy odsetek produktów wadliwych, ustalając maksymalne odchylenie na poziomie 0,065. Korzystając z możliwości tabeli podstawieniowej (w przypadku dwóch parametrów) wykreślamy zależność proporcji defektów od wartości średniej i odchylenia standardowego (ryc. 102
).

Przedział ufności dla różnicy między dwiema średnimi

To jest jeden z najbardziej ważne aplikacje metody statystyczne. Przykłady sytuacji.

    Kierownik sklepu odzieżowego chciałby wiedzieć, ile mniej więcej przeciętna klientka wydaje w sklepie, niż przeciętny mężczyzna.

    Obie linie latają na podobnych trasach. Organizacja konsumencka chciałaby porównać różnicę między średnim oczekiwanym czasem opóźnienia lotu w przypadku obu linii lotniczych.

    Firma wysyła kupony na poszczególne gatunki towarów w jednym mieście i nie wysyła do innego. Menedżerowie chcą porównać średnie wolumeny zakupów tych produktów w ciągu najbliższych dwóch miesięcy.

    Dealer samochodowy często ma do czynienia z małżeństwami podczas prezentacji. Aby zrozumieć ich osobiste reakcje na prezentację, pary często przeprowadzają oddzielne wywiady. Menedżer chce ocenić różnicę w ocenach wystawianych przez mężczyzn i kobiety.

Przypadek próbek niezależnych

Różnica między średnimi będzie miała rozkład t z n 1 + n 2 - 2 stopniami swobody. Przedział ufności dla μ 1 - μ 2 wyraża zależność:

Problem ten można rozwiązać nie tylko za pomocą powyższych formuł, ale także za pomocą standardowych narzędzi StatPro. Aby to zrobić, wystarczy użyć

Przedział ufności dla różnicy proporcji

Niech będzie matematycznym oczekiwaniem udziałów. Niech będą ich przykładowymi szacunkami, skonstruowanymi z próbek o wielkości odpowiednio n 1 i n 2. Następnie następuje oszacowanie różnicy. Dlatego przedział ufności tej różnicy wyraża się jako:

Tutaj z cr jest wartością uzyskaną z rozkładu normalnego przy użyciu specjalnych tabel (na przykład 1,96 dla 95% przedziału ufności).

Standardowy błąd oszacowania wyraża się w tym przypadku zależnością:

.

Przykład

Sklep przygotowując się do dużej wyprzedaży podjął następujące kroki: badania marketingowe. Wybrano 300 najlepsi nabywcy, które z kolei zostały losowo podzielone na dwie grupy po 150 członków każda. Do wszystkich wybranych klientów wysłano zaproszenia do wzięcia udziału w wyprzedaży, jednak jedynie członkowie pierwszej grupy otrzymali kupon uprawniający do 5% rabatu. Podczas sprzedaży rejestrowano zakupy wszystkich 300 wybranych kupujących. Jak menedżer może zinterpretować wyniki i ocenić skuteczność kuponów? (patrz plik COUPONS.XLS (szablon i rozwiązanie)).

Rozwiązanie

W naszym konkretnym przypadku spośród 150 klientów, którzy otrzymali kupon rabatowy, 55 dokonało zakupu w promocji, a spośród 150, którzy nie otrzymali kuponu, jedynie 35 dokonało zakupu (ryc. 103
). Wówczas wartości proporcji próbek wynoszą odpowiednio 0,3667 i 0,2333. A różnica próbek między nimi wynosi odpowiednio 0,1333. Zakładając 95% przedział ufności, z tabeli rozkładu normalnego wynika, że ​​z cr = 1,96. Obliczenie błędu standardowego różnicy próbek wynosi 0,0524. W końcu stwierdzamy, że dolna granica 95% przedziału ufności wynosi 0,0307, ​​a Górna granica Odpowiednio 0,2359. Uzyskane wyniki można interpretować w ten sposób, że na każdych 100 klientów, którzy otrzymali kupon rabatowy, możemy spodziewać się od 3 do 23 nowych klientów. Musimy jednak pamiętać, że wniosek ten sam w sobie nie oznacza efektywności wykorzystania kuponów (bo udzielając rabatu tracimy zysk!). Pokażmy to na konkretnych danych. Udawajmy, że tak średni rozmiar zakup wynosi 400 rubli, z czego 50 rubli. sklep ma zysk. Wówczas oczekiwany zysk na 100 klientach, którzy nie otrzymali kuponu wynosi:

50 0,2333 100 = 1166,50 rub.

Podobne wyliczenia dla 100 klientów, którzy otrzymali kupon dają:

30 0,3667 100 = 1100,10 rub.

Spadek średniego zysku do 30 tłumaczy się tym, że korzystając z rabatu klienci, którzy otrzymali kupon, dokonają zakupu średnio za 380 rubli.

Ostateczny wniosek wskazuje zatem na nieefektywność wykorzystania tego typu kuponów w tej konkretnej sytuacji.

Komentarz. Problem ten można rozwiązać za pomocą standardowych narzędzi StatPro. Aby to zrobić, wystarczy zmniejszyć to zadanie do problemu oszacowania różnicy pomiędzy dwiema średnimi za pomocą metody, a następnie zastosować StatPro/Wnioskowanie statystyczne/Analiza dwóch próbek skonstruować przedział ufności dla różnicy pomiędzy dwiema wartościami średnimi.

Sterowanie długością przedziału ufności

Długość przedziału ufności zależy od następujące warunki :

    dane bezpośrednio (odchylenie standardowe);

    poziom istotności;

    wielkość próbki.

Wielkość próby do oszacowania średniej

Najpierw rozważmy problem w ogólnym przypadku. Oznaczmy wartość połowy długości podanego nam przedziału ufności jako B (ryc. 104).
). Wiemy, że przedział ufności dla średniej wartości jakiejś zmiennej losowej X wyraża się jako , Gdzie . Wierząc:

i wyrażając n, otrzymujemy .

Niestety, Dokładna wartość Nie znamy wariancji zmiennej losowej X. Ponadto nie znamy wartości tcr, ponieważ zależy ona od n poprzez liczbę stopni swobody. W tej sytuacji możemy wykonać następujące czynności. Zamiast wariancji s używamy pewnego oszacowania wariancji w oparciu o wszelkie dostępne implementacje badanej zmiennej losowej. Zamiast wartości t cr dla rozkładu normalnego używamy wartości z cr. Jest to całkiem akceptowalne, ponieważ funkcje gęstości rozkładu dla rozkładu normalnego i t są bardzo zbliżone (z wyjątkiem przypadku małego n). Zatem wymagana formuła ma postać:

.

Ponieważ wzór daje, ogólnie rzecz biorąc, wyniki niecałkowite, za pożądaną wielkość próby przyjmuje się zaokrąglenie z nadmiarem wyniku.

Przykład

Restauracja typu fast food planuje poszerzyć swój asortyment o nowy rodzaj kanapki. Aby ocenić popyt na ten produkt, menedżer planuje losowo wybrać liczbę odwiedzających spośród tych, którzy już go wypróbowali, i poprosić ich o ocenę swojego stosunku do nowego produktu w skali od 1 do 10. Menedżer chce oszacować oczekiwaną liczbę punktów, jaką nowy produkt otrzyma i skonstruuj 95% przedział ufności dla tego oszacowania. Jednocześnie chce, aby połowa szerokości przedziału ufności nie przekraczała 0,3. Z iloma gośćmi musi przeprowadzić wywiad?

następująco:

Tutaj ot jest oszacowaniem proporcji p, a B jest daną połową długości przedziału ufności. Zawyżenie wartości n można uzyskać za pomocą tej wartości ot= 0,5. W tym przypadku długość przedziału ufności nie przekroczy określonej wartości B dla żadnej prawdziwej wartości p.

Przykład

Niech menedżer z poprzedniego przykładu zaplanuje oszacowanie udziału klientów, którzy preferowali nowy typ produktu. Chce skonstruować 90% przedział ufności, którego połowa długości nie przekracza 0,05. Ilu klientów należy uwzględnić w próbie losowej?

Rozwiązanie

W naszym przypadku wartość z cr = 1,645. Dlatego wymaganą ilość oblicza się jako .

Jeżeli menedżer miałby podstawy sądzić, że pożądana wartość p wynosi na przykład około 0,3, to podstawiając tę ​​wartość do powyższego wzoru otrzymalibyśmy mniejszą wartość próbki losowej, a mianowicie 228.

Wzór do ustalenia losowa wielkość próby w przypadku różnicy między dwiema średnimi jest napisane jako:

.

Przykład

Niektóre firmy komputerowe mają centrum obsługi klienta. W Ostatnio wzrosła liczba skarg klientów na złą jakość obsługi. W punkt serwisowy Wyróżnia się głównie dwa typy pracowników: tych, którzy nie mają dużego doświadczenia, ale ukończyli specjalne kursy przygotowawcze, oraz tych, którzy mają duże doświadczenie praktyczne, ale nie ukończyli specjalnych kursów. Firma chce przeanalizować reklamacje klientów na przestrzeni ostatnich sześciu miesięcy i porównać średnią liczbę reklamacji dla każdej z dwóch grup pracowników. Zakłada się, że liczebność próbek w obu grupach będzie taka sama. Ilu pracowników należy uwzględnić w próbie, aby uzyskać przedział 95% z połową długości nie większą niż 2?

Rozwiązanie

Tutaj σ ots jest oszacowaniem odchylenia standardowego obu zmiennych losowych przy założeniu, że są one bliskie. Zatem w naszym problemie musimy w jakiś sposób uzyskać to oszacowanie. Można to zrobić na przykład w następujący sposób. Analizując dane dotyczące skarg klientów w ciągu ostatnich sześciu miesięcy, menedżer może zauważyć, że na jednego pracownika przypada zazwyczaj od 6 do 36 skarg. Wiedząc, że w przypadku rozkładu normalnego prawie wszystkie wartości są oddalone od średniej nie więcej niż trzykrotnie odchylenia standardowe może zasadnie sądzić, że:

, skąd σ ots = 5.

Podstawiając tę ​​wartość do wzoru, otrzymujemy .

Wzór do ustalenia wielkość próby losowej w przypadku szacowania różnicy proporcji ma postać:

Przykład

Niektóre firmy mają dwie fabryki produkujące podobne produkty. Menedżer firmy chce porównać odsetek wadliwych produktów w obu fabrykach. Według dostępnych informacji, wskaźnik defektów w obu fabrykach waha się od 3 do 5%. Jego celem jest skonstruowanie 99% przedziału ufności z połową długości nie większą niż 0,005 (lub 0,5%). Ile produktów należy wybrać z każdej fabryki?

Rozwiązanie

Tutaj p 1ots i p 2ots to szacunki dwóch nieznanych udziałów wad w pierwszej i drugiej fabryce. Jeśli wstawimy p 1ots = p 2ots = 0,5, wówczas otrzymamy zawyżoną wartość dla n. Ponieważ jednak w naszym przypadku mamy informację aprioryczną o tych udziałach, przyjmujemy górne oszacowanie tych udziałów, czyli 0,05. Dostajemy

Przy szacowaniu niektórych parametrów populacji na podstawie przykładowych danych przydatne jest podanie nie tylko Punktowe oszacowanie parametru, ale także wskazują przedział ufności, który pokazuje, gdzie może znajdować się dokładna wartość szacowanego parametru.

W tym rozdziale zapoznaliśmy się także z zależnościami ilościowymi, które pozwalają nam konstruować takie przedziały dla różnych parametrów; nauczyli się sposobów kontrolowania długości przedziału ufności.

Należy również zauważyć, że problem szacowania wielkości próby (problem planowania eksperymentu) można rozwiązać za pomocą standardowych narzędzi StatPro, a mianowicie StatPro/wnioskowanie statystyczne/wybór wielkości próbki.

„Katren-Style” kontynuuje publikację cyklu Konstantina Krawczyka pt statystyka medyczna. W dwóch poprzednich artykułach autor zajmował się wyjaśnieniem takich pojęć jak i.

Konstanty Krawczik

Matematyk-analityk. Specjalista w swojej dziedzinie badania statystyczne w medycynie i naukach humanistycznych

Moskwa

Bardzo często w artykułach nt badania kliniczne można spotkać się z tajemniczym zwrotem: „przedział ufności” (95 % CI lub 95 % CI - przedział ufności). W artykule można na przykład napisać: „Aby ocenić znaczenie różnic, wykorzystaliśmy Test t-Studenta z obliczeniem 95 % przedziału ufności.”

Jaka jest wartość „95 % przedziału ufności” i po co go obliczać?

Co to jest przedział ufności? - Jest to zakres, w którym mieszczą się prawdziwe średnie populacyjne. Czy istnieją „nieprawdziwe” średnie? W pewnym sensie tak. W wyjaśniliśmy, że nie da się zmierzyć interesującego nas parametru w całej populacji, dlatego badacze zadowalają się ograniczoną próbą. W tej próbie (np. według masy ciała) występuje jedna wartość średnia (pewna masa), na podstawie której oceniamy wartość średnią w całej populacji. Jest jednak mało prawdopodobne, aby średnia waga w próbie (zwłaszcza małej) pokrywała się ze średnią wagą w populacji ogólnej. Dlatego bardziej poprawne jest obliczenie i wykorzystanie zakresu średnich wartości populacji.

Załóżmy na przykład, że 95% przedział ufności (95% CI) dla hemoglobiny wynosi 110 do 122 g/l. Oznacza to, że istnieje 95% szans, że prawdziwa średnia wartość hemoglobiny w populacji będzie wynosić od 110 do 122 g/l. Innymi słowy, nie wiemy przeciętny hemoglobiny w populacji ogólnej, ale możemy wskazać zakres wartości tej cechy z prawdopodobieństwem 95%.

Przedziały ufności są szczególnie istotne w przypadku różnic w średnich między grupami lub, jak się je nazywa, wielkości efektu.

Załóżmy, że porównaliśmy skuteczność dwóch preparatów żelaza: tego, który jest na rynku od dawna i tego, który właśnie został zarejestrowany. Po zakończeniu terapii oceniano stężenie hemoglobiny w badanych grupach pacjentów, a program statystyczny wyliczył, że różnica pomiędzy wartościami średnimi w obu grupach z 95 % prawdopodobieństwem mieściła się w przedziale od 1,72 do 14,36 g /l (Tabela 1).

Tabela 1. Przetestuj próbki niezależne
(grupy porównuje się według poziomu hemoglobiny)

Należy to interpretować w następujący sposób: u niektórych pacjentów w populacji ogólnej, którzy przyjmują nowy lek hemoglobina będzie wyższa średnio o 1,72–14,36 g/l niż u osób, które zażywały już znany lek.

Innymi słowy, w populacji ogólnej różnica średnich wartości hemoglobiny między grupami mieści się w tych granicach z prawdopodobieństwem 95%. Ocena, czy to dużo, czy mało, należy do badacza. Chodzi o to, że nie pracujemy z jedną wartością średnią, ale z zakresem wartości, dlatego wiarygodniej szacujemy różnicę parametru pomiędzy grupami.

W pakietach statystycznych, według uznania badacza, można samodzielnie zawęzić lub rozszerzyć granice przedziału ufności. Obniżając prawdopodobieństwa przedziału ufności zawężamy zakres średnich. Na przykład przy 90 % CI zakres średnich (lub różnica średnich) będzie węższy niż przy 95 %.

I odwrotnie, zwiększenie prawdopodobieństwa do 99 % rozszerza zakres wartości. Podczas porównywania grup dolna granica CI może przekroczyć granicę zera. Przykładowo, jeśli rozszerzymy granice przedziału ufności do 99 %, to granice przedziału wahają się od –1 do 16 g/l. Oznacza to, że w populacji ogólnej istnieją grupy, pomiędzy którymi różnica średnich dla badanej cechy jest równa 0 (M = 0).

Korzystając z przedziału ufności, możesz to sprawdzić hipotezy statystyczne. Jeżeli przedział ufności przekracza wartość zerową, wówczas prawdziwa jest hipoteza zerowa, która zakłada, że ​​grupy nie różnią się pod względem badanego parametru. Przykład opisano powyżej, gdzie rozszerzyliśmy granice do 99 %. Gdzieś w populacji ogólnej znaleźliśmy grupy, które nie różniły się niczym.

95% przedział ufności różnicy w stężeniu hemoglobiny (g/l)


Rysunek pokazuje 95% przedział ufności dla różnicy średnich wartości hemoglobiny pomiędzy obiema grupami. Linia przechodzi przez znak zerowy, zatem istnieje różnica pomiędzy średnimi zera, co potwierdza hipotezę zerową, że grupy nie różnią się. Zakres różnicy między grupami wynosi od –2 do 5 g/l. Oznacza to, że stężenie hemoglobiny może albo spaść o 2 g/l, albo wzrosnąć o 5 g/l.

Przedział ufności jest bardzo ważny wskaźnik. Dzięki niemu widać, czy różnice w grupach rzeczywiście wynikały z różnicy średnich, czy też z dużej próby, gdyż przy dużej próbie szanse na znalezienie różnic są większe niż przy małej.

W praktyce może to wyglądać tak. Pobraliśmy próbkę 1000 osób, zmierzyliśmy poziom hemoglobiny i odkryliśmy, że przedział ufności dla różnicy średnich wahał się od 1,2 do 1,5 g/l. Poziom istotności statystycznej na tym p

Widzimy, że stężenie hemoglobiny wzrosło, ale dlatego prawie niezauważalnie znaczenie statystyczne pojawił się właśnie ze względu na wielkość próby.

Przedziały ufności można obliczyć nie tylko dla średnich, ale także dla proporcji (i współczynników ryzyka). Nas interesuje np. przedział ufności odsetka pacjentów, którzy osiągnęli remisję po przyjęciu opracowanego leku. Załóżmy, że 95 % CI dla proporcji, czyli dla odsetka takich pacjentów, mieści się w przedziale 0,60–0,80. Można zatem powiedzieć, że nasz lek ma efekt terapeutyczny od 60 do 80 % przypadków.

Załóżmy, że mamy dużą liczbę towarów o rozkładzie normalnym pewnych cech (na przykład pełny magazyn warzyw tego samego rodzaju, których wielkość i waga są różne). Chcesz poznać średnią charakterystykę całej partii towaru, ale nie masz czasu i ochoty mierzyć i ważyć każdego warzywa. Rozumiesz, że to nie jest konieczne. Ale ile sztuk trzeba będzie pobrać do kontroli wyrywkowej?

Zanim podamy kilka wzorów przydatnych w tej sytuacji, przypomnijmy sobie pewne oznaczenia.

Po pierwsze, gdybyśmy zmierzyli cały magazyn warzyw (ten zbiór elementów nazywa się populacją ogólną), to znalibyśmy z całą dostępną nam dokładnością średnią wagę całej partii. Nazwijmy to średnią X średnio .g en . - Średnia ogólna. Wiemy już, co jest całkowicie określone, jeśli znana jest jego wartość średnia i odchylenie s . To prawda, choć nie jesteśmy ani przeciętnym pokoleniem X, ani S Nie znamy ogólnej populacji. Możemy pobrać tylko określoną próbkę, zmierzyć potrzebne nam wartości i obliczyć dla tej próbki zarówno średnią wartość X śr., jak i odchylenie standardowe S. wybrane.

Wiadomo, że jeśli nasza próbna kontrola zawiera dużą liczbę elementów (zwykle n jest większe niż 30) i są one brane pod uwagę naprawdę losowe, następnie s populacja ogólna prawie nie będzie się różnić od selekcji S.

Dodatkowo dla przypadku rozkładu normalnego możemy skorzystać z następujących wzorów:

Z prawdopodobieństwem 95%


Z prawdopodobieństwem 99%



W ogólna perspektywa z prawdopodobieństwem P (t)


Zależność pomiędzy wartością t a wartością prawdopodobieństwa P(t), z jaką chcemy poznać przedział ufności, można odczytać z poniższej tabeli:


Ustaliliśmy w ten sposób, w jakim przedziale mieści się (z zadanym prawdopodobieństwem) wartość średnia dla populacji.

Nie możemy tego stwierdzić, jeśli nie mamy wystarczająco dużej próbki populacja ma s = S wybierz Dodatkowo w tym przypadku problematyczna jest bliskość próbki do rozkładu normalnego. W tym przypadku również używamy zamiast tego Sselect s we wzorze:




ale wartość t dla ustalonego prawdopodobieństwa P(t) będzie zależała od liczby elementów w próbce n. Im większe n, tym wynikowy przedział ufności będzie bliższy wartości podanej wzorem (1). Wartości t w tym przypadku pobieramy z innej tabeli (test t-Studenta), którą prezentujemy poniżej:

Wartości testu t-Studenta dla prawdopodobieństwa 0,95 i 0,99


Przykład 3. Spośród pracowników firmy wybrano losowo 30 osób. Według próby okazało się, że średnia pensja (miesięczna) wynosi 30 tysięcy rubli przy odchyleniu standardowym 5 tysięcy rubli. Określ średnie wynagrodzenie w firmie z prawdopodobieństwem 0,99.

Rozwiązanie: Pod warunkiem mamy n = 30, X śr. =30000, S=5000, P = 0,99. Aby znaleźć przedział ufności, skorzystamy ze wzoru odpowiadającego testowi t-Studenta. Z tabeli dla n = 30 i P = 0,99 znajdujemy zatem t = 2,756


te. poszukiwany kurator przedział 27484< Х ср.ген < 32516.

Zatem z prawdopodobieństwem 0,99 możemy powiedzieć, że przedział (27484; 32516) zawiera w sobie przeciętne wynagrodzenie w firmie.

Mamy nadzieję, że skorzystasz z tej metody i nie jest konieczne, abyś za każdym razem miał przy sobie stolik. Obliczenia można przeprowadzić automatycznie w programie Excel. Będąc w pliku Excel, kliknij przycisk fx w górnym menu. Następnie spośród funkcji wybierz typ „statystyczny” i z proponowanej listy w oknie – STUDAR DISCOVER. Następnie po wskazaniu, umieszczając kursor w polu „prawdopodobieństwo” wprowadź wartość prawdopodobieństwa odwrotnego (czyli w naszym przypadku zamiast prawdopodobieństwa 0,95 należy wpisać prawdopodobieństwo 0,05). Najwyraźniej arkusz zestawiony jest w taki sposób, aby wynik odpowiadał na pytanie, z jakim prawdopodobieństwem możemy popełnić błąd. Podobnie w polu Stopień swobody wprowadź wartość (n-1) dla swojej próbki.



Nowość na stronie

>

Najbardziej popularny