Dom Zapobieganie Przedział ufności dla oczekiwań matematycznych. Przedział ufności dla oszacowania średniej (znana jest wariancja) w MS EXCEL

Przedział ufności dla oczekiwań matematycznych. Przedział ufności dla oszacowania średniej (znana jest wariancja) w MS EXCEL

Często rzeczoznawca musi dokonać analizy rynku nieruchomości segmentu, w którym zlokalizowana jest wyceniana nieruchomość. Jeśli rynek jest rozwinięty, analiza całego zbioru prezentowanych obiektów może być trudna, dlatego do analizy wykorzystuje się próbkę obiektów. Próba ta nie zawsze okazuje się jednorodna, czasami konieczne jest oczyszczenie jej ze skrajnych punktów – zbyt wysokich lub zbyt niskich ofert rynkowych. W tym celu się go używa przedział ufności. Cel to badanie- przeprowadzić analizę porównawczą dwóch metod obliczania przedziału ufności i wybrać optymalną opcję obliczeń przy pracy z różnymi próbkami w systemie estimatica.pro.

Przedział ufności- przedział wartości atrybutów obliczony na podstawie próbki, która ze znanym prawdopodobieństwem zawiera szacowany parametr populacja.

Celem obliczenia przedziału ufności jest takie skonstruowanie takiego przedziału na podstawie przykładowych danych, aby z zadanym prawdopodobieństwem można było stwierdzić, że wartość szacowanego parametru mieści się w tym przedziale. Innymi słowy, przedział ufności zawiera się z pewnym prawdopodobieństwem nieznana wartość przewidywana wartość. Im szerszy przedział, tym większa niedokładność.

Istnieją różne metody wyznaczania przedziału ufności. W tym artykule przyjrzymy się 2 metodom:

  • poprzez medianę i odchylenie standardowe;
  • Poprzez Krytyczna wartość statystyka t (współczynnik Studenta).

Gradacja analiza porównawcza różne sposoby Obliczenia CI:

1. utworzyć próbkę danych;

2. przetwarzamy to metodami statystycznymi: obliczamy wartość średnią, medianę, wariancję itp.;

3. obliczyć przedział ufności na dwa sposoby;

4. analizować oczyszczone próbki i wynikające z nich przedziały ufności.

Etap 1. Próbkowanie danych

Próbkę utworzono przy użyciu systemu estimatica.pro. Próba obejmowała 91 ofert sprzedaży mieszkań 1-pokojowych w III strefie cenowej w układzie typu „Chruszczow”.

Tabela 1. Próbka wyjściowa

Cena 1 m2, sztuka

Ryc.1. Pierwotna próbka



Etap 2. Przetwarzanie próbki wstępnej

Przetwarzanie próbki metodami statystycznymi wymaga obliczenia następujących wartości:

1. Średnia arytmetyczna

2. Mediana to liczba charakteryzująca próbę: dokładnie połowa elementów próbki jest większa od mediany, druga połowa jest mniejsza od mediany

(dla próbki o nieparzystej liczbie wartości)

3. Zakres – różnica pomiędzy wartościami maksymalnymi i minimalnymi w próbce

4. Wariancja – służy do dokładniejszego oszacowania zmienności danych

5. Odchylenie standardowe próbki (dalej - SD) jest najczęstszym wskaźnikiem rozproszenia wartości korekty wokół średniej arytmetycznej.

6. Współczynnik zmienności – odzwierciedla stopień rozproszenia wartości korekty

7. współczynnik oscylacji – odzwierciedla względne wahania skrajnych wartości cen w próbie wokół średniej

Tabela 2. Wskaźniki statystyczne próby pierwotnej

Współczynnik zmienności charakteryzujący jednorodność danych wynosi 12,29%, ale współczynnik oscylacji jest zbyt wysoki. Można zatem powiedzieć, że próbka pierwotna nie jest jednorodna, zatem przejdźmy do obliczania przedziału ufności.

Etap 3. Obliczanie przedziału ufności

Metoda 1. Obliczenia z wykorzystaniem mediany i odchylenia standardowego.

Przedział ufności wyznacza się w następujący sposób: wartość minimalna – od mediany odejmuje się odchylenie standardowe; wartość maksymalna - do mediany dodawane jest odchylenie standardowe.

Zatem przedział ufności (47179 CU; 60689 CU)

Ryż. 2. Wartości mieszczące się w przedziale ufności 1.



Metoda 2. Konstruowanie przedziału ufności przy użyciu wartości krytycznej statystyki t (współczynnik Studenta)

S.V. Gribowskiego w książce „ Metody matematyczne Szacowanie wartości nieruchomości” opisuje metodę obliczania przedziału ufności przy użyciu współczynnika Studenta. Obliczając tą metodą estymator musi sam ustalić poziom istotności ∝, który określa prawdopodobieństwo, z jakim zostanie skonstruowany przedział ufności. Zazwyczaj stosuje się poziomy istotności 0,1; 0,05 i 0,01. Odpowiadają one prawdopodobieństwu ufności 0,9; 0,95 i 0,99. W tej metodzie przyjmuje się wartości prawdziwe oczekiwanie matematyczne a wariancje są praktycznie nieznane (co prawie zawsze jest prawdą przy rozwiązywaniu praktycznych problemów estymacji).

Wzór na przedział ufności:

n - wielkość próbki;

Wartość krytyczna statystyki t (rozkład Studenta) o poziomie istotności ∝, liczbie stopni swobody n-1, która jest wyznaczana ze specjalnych tablic statystycznych lub za pomocą programu MS Excel (→„Statystyka” → STUDIST);

∝ - poziom istotności, przyjmij ∝=0,01.

Ryż. 2. Wartości mieszczące się w przedziale ufności 2.

Etap 4. Analiza różnych metod obliczania przedziału ufności

Doprowadziły do ​​tego dwie metody obliczania przedziału ufności – poprzez medianę i współczynnik Studenta różne znaczenia interwały. W związku z tym otrzymaliśmy dwie różne oczyszczone próbki.

Tabela 3. Statystyki dla trzech próbek.

Indeks

Pierwotna próbka

1 opcja

Opcja 2

Średnia wartość

Dyspersja

Współczynnik. odmiany

Współczynnik. oscylacje

Liczba wycofanych obiektów, szt.

Na podstawie przeprowadzonych obliczeń można stwierdzić, że uzyskano różne metody wartości przedziałów ufności przecinają się, dlatego można zastosować dowolną metodę obliczeniową według uznania oceniającego.

Uważamy jednak, że pracując w systemie estimatica.pro warto wybrać metodę obliczania przedziału ufności w zależności od stopnia rozwoju rynku:

  • jeżeli rynek jest niezabudowany, należy zastosować metodę obliczeń wykorzystując medianę i odchylenie standardowe, ponieważ liczba obiektów wycofanych w tym przypadku jest niewielka;
  • jeżeli rynek jest rozwinięty, należy zastosować obliczenia poprzez wartość krytyczną statystyki t (współczynnik Studenta), ponieważ możliwe jest utworzenie dużej próby początkowej.

Przygotowując artykuł wykorzystano:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Matematyczne metody oceny wartości nieruchomości. Moskwa, 2014

2. Dane systemowe estimatica.pro

Przedział ufności dla oczekiwań matematycznych - jest to przedział obliczony na podstawie danych, który ze znanym prawdopodobieństwem zawiera matematyczne oczekiwanie populacji ogólnej. Naturalnym oszacowaniem oczekiwania matematycznego jest średnia arytmetyczna jego zaobserwowanych wartości. Dlatego podczas całej lekcji będziemy używać terminów „średnia” i „wartość średnia”. W przypadku problemów związanych z obliczaniem przedziału ufności najczęściej wymagana jest odpowiedź w stylu: „Przedział ufności średniej liczby [wartości w konkretnym problemie] wynosi od [mniejsza wartość] do [większa wartość]”. Korzystając z przedziału ufności, można ocenić nie tylko wartości średnie, ale także odsetek określonej cechy w populacji ogólnej. Średnie, wariancja, odchylenie standardowe a błędy, dzięki którym dotrzemy do nowych definicji i wzorów, zostaną omówione na lekcji Charakterystyka próby i populacji .

Punktowe i przedziałowe oszacowanie średniej

Jeżeli średnią wartość populacji szacuje się liczbą (punktem), to za oszacowanie nieznanej średniej wartości populacji przyjmuje się konkretną średnią, obliczoną z próby obserwacji. W tym przypadku wartość średniej próby – zmiennej losowej – nie pokrywa się ze średnią wartością populacji ogólnej. Dlatego też, wskazując średnią próbki, należy jednocześnie wskazać błąd próbkowania. Miarą błędu próbkowania jest błąd standardowy, który wyraża się w tych samych jednostkach co średnia. Dlatego często stosuje się następującą notację: .

Jeśli oszacowanie średniej trzeba wiązać z pewnym prawdopodobieństwem, to interesujący w populacji parametr należy oceniać nie jedną liczbą, ale przedziałem. Przedział ufności to przedział, w którym z pewnym prawdopodobieństwem P znaleziono wartość szacowanego wskaźnika populacji. Przedział ufności, w którym jest to prawdopodobne P = 1 - α znaleziona zostanie zmienna losowa, obliczona w następujący sposób:

,

α = 1 - P, który można znaleźć w dodatku do niemal każdej książki o statystyce.

W praktyce średnia i wariancja populacji nie są znane, dlatego wariancję populacji zastępuje się wariancją z próby, a średnią z populacji – średnią z próby. Zatem przedział ufności w większości przypadków oblicza się w następujący sposób:

.

Do oszacowania średniej populacji można zastosować wzór na przedział ufności

  • znane jest odchylenie standardowe populacji;
  • lub odchylenie standardowe populacji jest nieznane, ale wielkość próby jest większa niż 30.

Średnia z próby jest obiektywnym oszacowaniem średniej populacji. Z kolei wariancja próbki nie jest obiektywnym oszacowaniem wariancji populacji. Aby uzyskać bezstronne oszacowanie wariancji populacji we wzorze na wariancję próbki, wielkość próby N należy zastąpić N-1.

Przykład 1. Ze 100 losowo wybranych kawiarni w pewnym mieście zebrano informację, że średnia liczba pracowników w nich wynosi 10,5 przy odchyleniu standardowym 4,6. Określ 95% przedział ufności dla liczby pracowników kawiarni.

gdzie jest wartością krytyczną normy normalna dystrybucja dla poziomu istotności α = 0,05 .

Zatem 95% przedział ufności dla średniej liczby pracowników kawiarni wahał się od 9,6 do 11,4.

Przykład 2. Dla próby losowej z populacji 64 obserwacji obliczono następujące sumaryczne wartości:

suma wartości w obserwacjach,

suma kwadratów odchyleń wartości od średniej .

Oblicz 95% przedział ufności dla oczekiwań matematycznych.

Obliczmy odchylenie standardowe:

,

Obliczmy średnią wartość:

.

Podstawiamy wartości do wyrażenia przedziału ufności:

gdzie jest wartością krytyczną standardowego rozkładu normalnego dla poziomu istotności α = 0,05 .

Otrzymujemy:

Zatem 95% przedział ufności dla oczekiwań matematycznych tej próbki wahał się od 7,484 do 11,266.

Przykład 3. Dla losowej próby populacji składającej się ze 100 obserwacji obliczona średnia wynosi 15,2, a odchylenie standardowe wynosi 3,2. Oblicz 95% przedział ufności dla wartości oczekiwanej, a następnie 99% przedział ufności. Jeśli moc próbki i jej zmienność pozostaną niezmienione, a współczynnik ufności wzrośnie, to czy przedział ufności zwęzi się czy poszerzy?

Podstawiamy te wartości do wyrażenia przedziału ufności:

gdzie jest wartością krytyczną standardowego rozkładu normalnego dla poziomu istotności α = 0,05 .

Otrzymujemy:

.

Zatem 95% przedział ufności dla średniej tej próby wahał się od 14,57 do 15,82.

Ponownie podstawiamy te wartości do wyrażenia przedziału ufności:

gdzie jest wartością krytyczną standardowego rozkładu normalnego dla poziomu istotności α = 0,01 .

Otrzymujemy:

.

Zatem 99% przedział ufności dla średniej tej próby wahał się od 14,37 do 16,02.

Jak widzimy, wraz ze wzrostem współczynnika ufności wzrasta również wartość krytyczna standardowego rozkładu normalnego, a w konsekwencji punkty początkowe i końcowe przedziału znajdują się dalej od średniej, a tym samym wzrasta przedział ufności dla oczekiwań matematycznych .

Punktowe i przedziałowe szacunki ciężaru właściwego

Udział jakiegoś atrybutu próbki można interpretować jako oszacowanie punktowe środek ciężkości P o tej samej charakterystyce w populacji ogólnej. Jeżeli wartość tę trzeba powiązać z prawdopodobieństwem, należy obliczyć przedział ufności ciężaru właściwego P charakterystyczne w populacji z prawdopodobieństwem P = 1 - α :

.

Przykład 4. W pewnym mieście jest dwóch kandydatów A I B kandydują na burmistrza. W badaniu losowym wzięło udział 200 mieszkańców miasta, z czego 46% odpowiedziało, że oddałoby głos na danego kandydata A, 26% - dla kandydata B a 28% nie wie, na kogo będzie głosować. Określ 95% przedział ufności dla odsetka mieszkańców miasta popierających kandydata A.

Przedział ufności– wartości graniczne wartość statystyczna, które przy danym prawdopodobieństwie ufności γ będzie znajdować się w tym przedziale przy próbkowaniu większej objętości. Oznaczane jako P(θ - ε. W praktyce prawdopodobieństwo ufności γ wybiera się spośród wartości całkiem bliskich jedności: γ = 0,9, γ = 0,95, γ = 0,99.

Cel usługi. Korzystając z tej usługi możesz określić:

  • przedział ufności dla średniej ogólnej, przedział ufności dla wariancji;
  • przedział ufności dla odchylenia standardowego, przedział ufności dla udziału ogólnego;
Powstałe rozwiązanie jest zapisywane w pliku Word (patrz przykład). Poniżej znajduje się filmowa instrukcja jak wypełnić dane początkowe.

Przykład nr 1. W kołchozowym stadzie liczącym 1000 owiec 100 owiec zostało poddanych selektywnemu strzyżeniu kontrolnemu. W rezultacie ustalono średni strzyżenie wełny na owcę na poziomie 4,2 kg. Wyznaczyć z prawdopodobieństwem 0,99 średni błąd kwadratowy próbki przy wyznaczaniu średniego strzyżenia wełny na owcę oraz granice, w jakich mieści się wartość strzyżenia, jeżeli wariancja wynosi 2,5. Próbka nie jest powtarzalna.
Przykład nr 2. Z partii importowanych produktów na placówce Moskiewskiego Północnego Urzędu Celnego pobrano 20 próbek produktu „A” w drodze losowego, powtarzanego pobierania próbek. W wyniku badania ustalono średnią wilgotność produktu „A” w próbce, która okazała się równa 6% przy odchyleniu standardowym 1%.
Wyznacz z prawdopodobieństwem 0,683 granice średniej wilgotności produktu w całej partii importowanych produktów.
Przykład nr 3. Badanie przeprowadzone wśród 36 uczniów wykazało, że średnia liczba podręczników czytanych przez nich w ciągu roku wynosi ok rok akademicki, okazało się równe 6. Zakładając, że liczba podręczników przeczytanych przez studenta w semestrze ma rozkład normalny z odchyleniem standardowym równym 6, znajdź: A) z rzetelnością 0,99, oszacowanie przedziałowe dla oczekiwanie tej zmiennej losowej; B) z jakim prawdopodobieństwem można powiedzieć, że obliczona na podstawie tej próby średnia liczba podręczników przeczytanych przez studenta w semestrze będzie odbiegać od oczekiwań matematycznych w wartości bezwzględnej nie więcej niż o 2.

Klasyfikacja przedziałów ufności

Według rodzaju ocenianego parametru:

Według typu próbki:

  1. Przedział ufności dla nieskończonej próbki;
  2. Przedział ufności dla próbki końcowej;
Próbkę nazywa się ponownym próbkowaniem, jeśli wybrany obiekt zostanie zwrócony do populacji przed wybraniem kolejnego. Próbkę nazywa się niepowtarzalną, jeśli wybrany obiekt nie zostanie zwrócony do populacji. W praktyce zazwyczaj mamy do czynienia z próbkami jednorazowymi.

Obliczanie średniego błędu próbkowania dla losowego doboru próby

Nazywa się rozbieżność między wartościami wskaźników uzyskanych z próby a odpowiadającymi im parametrami populacji ogólnej błąd reprezentatywności.
Oznaczenia głównych parametrów populacji ogólnej i próbnej.
Wzory średniego błędu próbkowania
ponowny wybórpowtórzyć wybór
dla przeciętnegodo udostępnieniadla przeciętnegodo udostępnienia
Zależność między granicą błędu próbkowania (Δ) gwarantowana z pewnym prawdopodobieństwem Р(t), I średni błąd próbka ma postać: lub Δ = t·μ, gdzie T– współczynnik ufności, wyznaczany w zależności od poziomu prawdopodobieństwa P(t) zgodnie z tablicą całki Laplace’a.

Wzory do obliczania liczebności próby przy zastosowaniu metody doboru czysto losowego

Niech zmienna losowa (możemy mówić o populacji ogólnej) będzie miała rozkład według prawa normalnego, dla którego znana jest wariancja D = 2 (> 0). Z populacji ogólnej (na zbiorze obiektów, dla których wyznaczana jest zmienna losowa) tworzy się próbę o wielkości n. Próbkę x 1 , x 2 ,..., x n traktuje się jako zbiór n niezależnych zmiennych losowych o rozkładzie analogicznym do (podejście wyjaśnione powyżej w tekście).

Wcześniej omówiono i udowodniono także następujące równości:

Mx 1 = Mx 2 = ... = Mx n = M;

Dx 1 = Dx 2 = ... = Dx n = D;

Wystarczy po prostu udowodnić (pomijamy dowód), że zmienna losowa w w tym przypadku jest również rozdzielany zgodnie z prawem normalnym.

Oznaczmy nieznaną wielkość M przez a i na podstawie zadanej wiarygodności wybierzmy liczbę d > 0 tak, aby warunek był spełniony:

P(-a< d) = (1)

Ponieważ zmienna losowa ma rozkład zgodny z prawem normalnym z oczekiwaniem matematycznym M = M = a i wariancją D = D /n = 2 /n, otrzymujemy:

P(-a< d) =P(a - d < < a + d) =

Pozostaje wybrać d takie, aby zachodziła równość

Dla dowolnego z nich możesz użyć tabeli, aby znaleźć liczbę t taką, że (t) = / 2. Ta liczba t jest czasami nazywana kwantyl.

Teraz z równości

określmy wartość d:

Wynik końcowy uzyskujemy przedstawiając wzór (1) w postaci:

Znaczenie ostatniej formuły jest następujące: z niezawodnością, przedział ufności

obejmuje nieznany parametr a = M populacji. Można to powiedzieć inaczej: Punktowe oszacowanie wyznacza wartość parametru M z dokładnością d= t/ i rzetelnością.

Zadanie. Niech będzie populacja ogólna o określonej charakterystyce rozłożonej zgodnie z prawem normalnym z wariancją równą 6,25. Pobrano próbę o liczebności n = 27 i otrzymano średnią wartość próby cechy = 12. Znajdź przedział ufności obejmujący nieznane oczekiwanie matematyczne badanej cechy populacji ogólnej z rzetelnością = 0,99.

Rozwiązanie. Najpierw, korzystając z tabeli funkcji Laplace'a, znajdujemy wartość t z równości (t) = / 2 = 0,495. Na podstawie otrzymanej wartości t = 2,58 wyznaczamy dokładność oszacowania (lub połowę długości przedziału ufności) d: d = 2,52,58 / 1,24. Stąd otrzymujemy wymagany przedział ufności: (10,76; 13,24).

hipoteza statystyczna, ogólna wariacja

Przedział ufności dla matematycznych oczekiwań rozkładu normalnego, gdy tak nie jest znana rozbieżność

Niech będzie zmienną losową o rozkładzie normalnym z nieznanym oczekiwaniem matematycznym M, co oznaczamy literą a. Zróbmy próbkę o objętości n. Wyznaczmy średnią próbę i skorygowaną wariancję próbki s 2, korzystając ze znanych wzorów.

Losowa wartość

rozłożone zgodnie z prawem Studenta z n - 1 stopniami swobody.

Zadanie polega na znalezieniu liczby t dla danej niezawodności i liczby stopni swobody n - 1 takiej, aby równość

lub równoważna równość

Tutaj w nawiasie zapisano warunek, że wartość nieznanego parametru a należy do pewnego przedziału, który jest przedziałem ufności. Jego granice zależą od niezawodności oraz parametrów próbkowania i s.

Aby określić wartość t według wielkości, przekształcamy równość (2) do postaci:

Teraz korzystając z tabeli zmiennej losowej t o rozkładzie zgodnym z prawem Studenta, korzystając z prawdopodobieństwa 1 - i liczby stopni swobody n - 1, znajdujemy t. Wzór (3) daje odpowiedź na postawiony problem.

Zadanie. Podczas testów kontrolnych 20 lamp elektrycznych przeciętny czas trwania ich praca wyniosła 2000 godzin przy odchyleniu standardowym (liczonym jako pierwiastek kwadratowy skorygowanej wariancji próbki) równym 11 godzin. Wiadomo, że czas działania lampy ma rozkład normalny zmienna losowa. Wyznacz z rzetelnością 0,95 przedział ufności dla matematycznego oczekiwania tej zmiennej losowej.

Rozwiązanie. Wartość 1 - w tym przypadku wynosi 0,05. Zgodnie z tablicą rozkładu Studenta, przy liczbie stopni swobody równej 19, znajdujemy: t = 2,093. Obliczmy teraz dokładność oszacowania: 2,093121/ = 56,6. Stąd otrzymujemy wymagany przedział ufności: (1943,4; 2056,6).

Niech zmienna losowa X populacji będzie miała rozkład normalny, biorąc pod uwagę, że znana jest wariancja i odchylenie standardowe s tego rozkładu. Wymagane jest oszacowanie nieznanego oczekiwania matematycznego przy użyciu średniej próbki. W tym przypadku zadanie sprowadza się do znalezienia przedziału ufności dla oczekiwania matematycznego z rzetelnością b. Jeśli ustawisz wartość prawdopodobieństwo pewności(rzetelność) b, to prawdopodobieństwo wpadnięcia w przedział o nieznanym oczekiwaniu matematycznym można obliczyć korzystając ze wzoru (6.9a):

gdzie Ф(t) jest funkcją Laplace'a (5.17a).

W rezultacie możemy sformułować algorytm znajdowania granic przedziału ufności dla oczekiwania matematycznego, jeśli znana jest wariancja D = s 2:

  1. Ustaw wartość niezawodności – b.
  2. Z (6.14) wyrazić Ф(t) = 0,5× b. Wybierz wartość t z tabeli funkcji Laplace'a w oparciu o wartość Ф(t) (patrz dodatek 1).
  3. Oblicz odchylenie e korzystając ze wzoru (6.10).
  4. Zapisz przedział ufności korzystając ze wzoru (6.12) taki, że z prawdopodobieństwem b zachodzi nierówność:

.

Przykład 5.

Zmienna losowa X ma rozkład normalny. Znajdź przedziały ufności dla oszacowania o wiarygodności b = 0,96 nieznanego oczekiwania matematycznego a, jeśli podano:

1) ogólne odchylenie standardowe s = 5;

2) średnia próbki;

3) liczebność próby n = 49.

We wzorze (6.15) oszacowanie przedziału oczekiwania matematycznego A z niezawodnością b wszystkie wielkości oprócz t są znane. Wartość t można znaleźć korzystając z (6.14): b = 2Ф(t) = 0,96. Ф(t) = 0,48.

Korzystając z tabeli w Załączniku 1 dla funkcji Laplace'a Ф(t) = 0,48, znajdź odpowiednią wartość t = 2,06. Stąd, . Podstawiając obliczoną wartość e do wzoru (6.12) można otrzymać przedział ufności: 30-1,47< a < 30+1,47.

Wymagany przedział ufności dla oszacowania o wiarygodności b = 0,96 nieznanego oczekiwania matematycznego wynosi: 28,53< a < 31,47.



Nowość na stronie

>

Najbardziej popularny