Dom Stomatologia dziecięca Skonstruuj szereg rozkładów przedziałowych. Konstrukcja szeregów zmienności przedziałowej dla ciągłych danych ilościowych

Skonstruuj szereg rozkładów przedziałowych. Konstrukcja szeregów zmienności przedziałowej dla ciągłych danych ilościowych

W wielu przypadkach statystyczna populacja kotów obejmuje dużą lub nawet większą liczbę nieskończona liczba opcji, którą najczęściej spotyka się przy ciągłej zmienności, utworzenie grupy jednostek dla każdej opcji jest praktycznie niemożliwe i niepraktyczne. Łączenie jednostek statystycznych w grupy jest wówczas możliwe jedynie na podstawie przedziału, tj. taka grupa, która ma pewne ograniczenia dla wartości zmiennej cechy. Granice te są oznaczone dwiema liczbami wskazującymi górną i dolną granicę każdej grupy. Użycie przedziałów prowadzi do powstania szeregu rozkładów przedziałowych.

Interwał rad jest serią wariacyjną, której warianty są prezentowane w postaci przedziałów.

Szereg przedziałowy można utworzyć z przedziałów równych i nierównych, przy czym wybór zasady konstruowania tego szeregu zależy głównie od stopnia reprezentatywności i wygody populacji statystycznej. Jeżeli populacja jest wystarczająco duża (reprezentatywna) pod względem liczby jednostek i jest całkowicie jednorodna w swoim składzie, wówczas warto oprzeć tworzenie szeregu przedziałowego na równości przedziałów. Zwykle, korzystając z tej zasady, tworzy się szereg przedziałowy dla tych populacji, w których zakres zmienności jest stosunkowo mały, tj. opcje maksymalne i minimalne zwykle różnią się od siebie kilkukrotnie. W tym przypadku wartość równych przedziałów oblicza się ze stosunku zakresu zmienności cechy do zadanej liczby utworzonych przedziałów. Aby określić równe I przedziału można zastosować wzór Sturgessa (zwykle przy niewielkiej zmienności charakterystyki przedziału i dużej liczbie jednostek w populacji statystycznej):

gdzie x i - równa wartość przedziału; X max, X min – opcje maksymalne i minimalne w agregacie statystycznym; N . - liczba jednostek w agregacie.

Przykład. Wskazane jest obliczenie wielkości równego przedziału według gęstości skażenia radioaktywnego cezem - 137 w 100 osadach obwodu krasnopolskiego obwodu mohylewskiego, jeśli wiadomo, że opcja początkowa (minimalna) jest równa I km / km 2, finał ( maksymalnie) - 65 ki/km 2. Korzystając ze wzoru 5.1. otrzymujemy:

Dlatego, aby utworzyć serię interwałową z w równych odstępach według gęstości skażenia cezem - 137 osad regionu krasnopolskiego, wielkość równego przedziału może wynosić 8 ki/km 2.

W warunkach nierównomiernego rozkładu, tj. gdy opcje maksymalne i minimalne są setki razy, tworząc serię przedziałów, możesz zastosować tę zasadę nierówny interwały. Nierówne odstępy zwykle rosną w miarę przechodzenia do większych wartości cechy.

Kształt przedziałów może być zamknięty lub otwarty. Zamknięte Zwyczajowo nazywa się przedziały, które mają zarówno dolną, jak i górną granicę. otwarty Przedziały mają tylko jedną granicę: w pierwszym przedziale znajduje się górna granica, w ostatnim dolna granica.

Ocena seria interwałowa, szczególnie w nierównych odstępach czasu, zaleca się przeprowadzenie biorąc pod uwagę gęstość dystrybucji, najprostszym sposobem obliczenia jest stosunek częstotliwości lokalnej (lub częstotliwości) do rozmiaru przedziału.

Aby praktycznie utworzyć szereg przedziałowy, można skorzystać z układu tabelarycznego. 5.3.

Tabela 5.3. Procedura tworzenia szeregu przedziałowego osady Obwód krasnopolski według gęstości skażenia radioaktywnego cezem -137

Główną zaletą serii interwałowej jest jej maksimum ścisłość. jednocześnie w szeregach rozkładów przedziałowych poszczególne warianty cechy ukryte są w odpowiednich przedziałach

Podczas graficznego przedstawiania szeregu przedziałów w układzie współrzędnych prostokątnych, górne granice przedziałów są wykreślane na osi odciętych, a częstości lokalne szeregu na osi rzędnych. Graficzna konstrukcja szeregu przedziałowego różni się od konstrukcji wielokąta rozkładu tym, że każdy przedział ma dolną i górną granicę, a dwie odcięte odpowiadają jednej wartości rzędnej. Dlatego na wykresie szeregu przedziałowego nie zaznacza się punktu, jak w wielokącie, ale linię łączącą dwa punkty. Te poziome linie łączą się ze sobą liniami pionowymi i uzyskuje się figurę wielokąta schodkowego, co jest powszechnie nazywane histogram dystrybucja (ryc. 5.3).

Na konstrukcja graficzna szeregów przedziałowych w wystarczająco dużej populacji statystycznej, zbliża się histogram symetryczny forma dystrybucji. W przypadkach, gdy populacja statystyczna jest z reguły niewielka, asymetryczny wykres słupkowy.

W niektórych przypadkach wskazane jest utworzenie pewnej liczby skumulowanych częstotliwości, tj. łączny wiersz. Szereg skumulowany można utworzyć na podstawie szeregu rozkładu dyskretnego lub przedziałowego. Podczas graficznego przedstawiania serii skumulowanej w układzie współrzędnych prostokątnych warianty są wykreślane na osi odciętych, a skumulowane częstotliwości (częstotliwości) są wykreślane na osi współrzędnych. Powstała zakrzywiona linia jest zwykle nazywana łączny dystrybucja (ryc. 5.4).

Formacja i przedstawienie graficzne różne rodzaje szeregi zmian przyczyniają się do uproszczonego obliczenia głównych cech statystycznych, które szczegółowo omówiono w temacie 6, pomagają lepiej zrozumieć istotę praw rozkładu populacji statystycznej. Analiza seria odmian nabiera szczególnego znaczenia w przypadkach, gdy konieczne jest zidentyfikowanie i prześledzenie zależności pomiędzy opcjami a częstotliwościami (częstotliwościami). Zależność ta przejawia się w tym, że liczba przypadków przypadająca na opcję jest w pewien sposób powiązana z wielkością tej opcji, tj. wraz ze wzrostem wartości zmiennej charakterystyki częstotliwości (częstotliwości) tych wartości ulegają pewnym, systematycznym zmianom. Oznacza to, że liczby w kolumnie częstotliwości (częstotliwości) nie zmieniają się chaotycznie, ale zmieniają się w określonym kierunku, w określonej kolejności i sekwencji.

Jeśli częstotliwości wykazują pewną systematyczność w swoich zmianach, oznacza to, że jesteśmy na dobrej drodze do zidentyfikowania prawidłowości. System, porządek, kolejność w zmieniających się częstotliwościach jest odbiciem wspólne powody, ogólne warunki, charakterystyczne dla całej populacji.

Nie należy zakładać, że schemat rozkładu podawany jest zawsze w formie gotowej. Istnieje sporo serii odmian, w których częstotliwości dziwnie przeskakują, czasem rosną, czasem maleją. W takich przypadkach warto dowiedzieć się, z jakim rozkładem ma do czynienia badacz: albo rozkład ten nie ma w ogóle żadnych wzorców, albo jego natura nie została jeszcze ujawniona: Pierwszy przypadek jest rzadki, ale drugi przypadek jest zjawiskiem dość powszechnym i bardzo powszechnym.

Zatem przy tworzeniu serii przedziałów całkowita liczba jednostek statystycznych może być niewielka, a każdy przedział zawiera niewielką liczbę wariantów (na przykład 1-3 jednostki). W takich przypadkach nie można liczyć na przejaw jakiegokolwiek schematu. Aby na podstawie przypadkowych obserwacji można było uzyskać naturalny wynik, konieczne jest wejście w życie ustawy duże liczby, tj. tak, że dla każdego przedziału byłoby nie kilka, ale dziesiątki i setki jednostek statystycznych. W tym celu musimy starać się maksymalnie zwiększać liczbę obserwacji. To jest najbardziej właściwy sposób wykrywanie wzorców w procesach masowych. Jeśli nie wydaje się prawdziwa szansa zwiększyć liczbę obserwacji, wówczas identyfikację prawidłowości można osiągnąć poprzez zmniejszenie liczby przedziałów w szeregach dystrybucyjnych. Zmniejszając liczbę przedziałów w szeregu zmian, zwiększa się w ten sposób liczba częstotliwości w każdym przedziale. Oznacza to, że losowe wahania każdego z nich jednostka statystyczna nakładają się na siebie, „wygładzają”, zamieniając się we wzór.

Tworzenie i konstrukcja szeregów wariacyjnych pozwala uzyskać jedynie ogólny, przybliżony obraz rozkładu populacji statystycznej. Np. histogram tylko w przybliżonej formie wyraża związek pomiędzy wartościami cechy a jej częstotliwościami (częstotliwościami), dlatego szeregi zmienności są w zasadzie jedynie podstawą do dalszych, pogłębionych badań wewnętrznej regularności statycznej dystrybucja.

PYTANIA TESTOWE DO TEMATU 5

1. Czym jest zmienność? Co powoduje zmienność cechy w populacji statystycznej?

2. Jakie rodzaje zmiennych cech mogą występować w statystyce?

3. Co to jest szereg zmian? Jakie mogą być rodzaje szeregów wariacyjnych?

4. Co to jest seria rankingowa? Jakie są jego zalety i wady?

5. Co to jest szereg dyskretny i jakie są jego zalety i wady?

6. Jak wygląda procedura tworzenia szeregu przedziałowego, jakie są jego zalety i wady?

7. Jaka jest graficzna reprezentacja uporządkowanych, dyskretnych szeregów o rozkładzie przedziałowym?

8. Czym jest kumulacja dystrybucji i czym się charakteryzuje?

Wyślij swoją dobrą pracę do bazy wiedzy jest prosta. Skorzystaj z poniższego formularza

Dobra robota do serwisu">

Studenci, doktoranci, młodzi naukowcy, którzy wykorzystują bazę wiedzy w swoich studiach i pracy, będą Państwu bardzo wdzięczni.

Wysłany dnia http://www.allbest.ru/

ZADANIE1

Dostępne są następujące informacje na temat wynagrodzenie pracownicy przedsiębiorstwa:

Tabela 1.1

Wysokość wynagrodzeń w ujęciu konwencjonalnym. legowisko. jednostki

Wymagane jest skonstruowanie szeregu rozkładów przedziałowych, według którego można znaleźć;

1) przeciętne wynagrodzenie;

2) średnie odchylenie liniowe;

4) odchylenie standardowe;

5) zakres zmienności;

6) współczynnik oscylacji;

7) współczynnik liniowy odmiany;

8) prosty współczynnik zmienności;

10) mediana;

11) współczynnik asymetrii;

12) Wskaźnik asymetrii Pearsona;

13) współczynnik kurtozy.

Rozwiązanie

Jak wiadomo, opcje (rozpoznawane wartości) są ułożone w kolejności rosnącej dyskretne serie zmian. Z dużą liczbą opcji (więcej niż 10), nawet w przypadku zmienności dyskretnej konstruowane są szeregi przedziałowe.

Jeśli szereg przedziałów jest zestawiany z przedziałami parzystymi, wówczas zakres zmienności jest dzielony przez określoną liczbę przedziałów. Co więcej, jeżeli otrzymana wartość jest liczbą całkowitą i jednoznaczną (co zdarza się rzadko), to przyjmuje się, że długość przedziału jest równa tej liczbie. W innych sprawach wytworzony zaokrąglenie Koniecznie V strona zwiększyć, Więc Do ostatnia cyfra, która pozostała, była parzysta. Oczywiście wraz ze wzrostem długości interwału, tj zakres zmienności o wielkość równą iloczynowi liczby przedziałów: o różnicę między obliczoną a początkową długością przedziału

A) Jeżeli wielkość rozszerzenia zakresu zmienności jest niewielka, wówczas jest ona albo dodawana do największej, albo odejmowana od najmniejszej wartości cechy;

b) Jeżeli zauważalna jest wielkość rozszerzenia zakresu zmienności, to aby środek zakresu się nie przesunął, dzieli się go w przybliżeniu na pół, jednocześnie dodając do największego i odejmując od najniższe wartości podpisać.

Jeżeli zestawiony zostanie szereg przedziałów o nierównych odstępach, proces ulega uproszczeniu, ale nadal długość przedziałów należy wyrazić liczbą z ostatnią parzystą cyfrą, co znacznie ułatwia późniejsze obliczenia charakterystyk numerycznych.

30 to wielkość próbki.

Utwórzmy szereg rozkładów przedziałowych, korzystając ze wzoru Sturgesa:

K = 1 + 3,32*log n,

K - liczba grup;

K = 1 + 3,32*lg 30 = 5,91=6

Zakres atrybutu – płace pracowników w przedsiębiorstwie – (x) wyznaczamy korzystając ze wzoru

R= xmax - xmin i podziel przez 6; R= 195-112=83

Wtedy długość interwału będzie l pas=83:6=13,83

Początek pierwszego interwału będzie wynosił 112. Dodając do 112 l ras = 13,83, otrzymujemy jego końcową wartość 125,83, która jest jednocześnie początkiem drugiego przedziału itd. koniec piątego interwału – 195.

Przy znajdowaniu częstotliwości należy kierować się zasadą: „jeżeli wartość cechy pokrywa się z granicą przedziału wewnętrznego, to należy ją przypisać do przedziału poprzedniego”.

Otrzymujemy przedziałową serię częstotliwości i częstotliwości skumulowane.

Tabela 1.2

Zatem 3 pracowników ma wynagrodzenie. opłata od 112 do 125,83 konwencjonalnych jednostek pieniężnych. Najwyższa pensja opłata od 181,15 do 195 konwencjonalnych jednostek pieniężnych. tylko 6 pracowników.

Aby obliczyć charakterystyki numeryczne, przekształcamy szereg przedziałowy w szereg dyskretny, opcjonalnie przyjmując środek przedziału:

Tabela 1.3

14131,83

Korzystanie ze wzoru na średnią arytmetyczną ważoną

konwencjonalne jednostki monetarne

Średnie odchylenie liniowe:

gdzie xi jest wartością badanej cechy dla i-tej jednostki populacji,

Średnia wartość badanej cechy.

Wysłany dnia http://www.allbest.ru/

LWysłano dnia http://www.allbest.ru/

Konwencjonalne jednostki monetarne

Odchylenie standardowe:

Dyspersja:

Względny zakres zmienności (współczynnik oscylacji): c= R:,

Względne odchylenie liniowe: q = L:

Współczynnik zmienności: V = y:

Współczynnik oscylacji pokazuje względne wahania skrajnych wartości cechy wokół średniej arytmetycznej, a współczynnik zmienności charakteryzuje stopień i jednorodność populacji.

c= R: = 83 / 159,485*100% = 52,043%

Zatem różnica pomiędzy skrajnymi wartościami jest o 5,16% (=94,84%-100%) mniejsza od przeciętnego wynagrodzenia pracowników w przedsiębiorstwie.

q = L: = 17,765/ 159,485*100% = 11,139%

V = y: = 21,704/ 159,485*100% = 13,609%

Współczynnik zmienności wynosi niecałe 33%, co świadczy o słabym zróżnicowaniu wynagrodzeń pracowników w przedsiębiorstwie, tj. że średnia wartość jest typową cechą płac pracowników (populacja jest jednorodna).

W szeregach rozkładu przedziałowego moda określone przez wzór -

Częstotliwość przedziału modalnego, czyli przedziału zawierającego największą liczbę opcji;

Częstotliwość przedziału poprzedzającego mod;

Częstotliwość przedziału następującego po modale;

Długość interwału modalnego;

Dolna granica przedziału modalnego.

Do ustalenia mediany w szeregach przedziałowych używamy wzoru

gdzie jest skumulowaną (skumulowaną) częstotliwością przedziału poprzedzającego medianę;

Dolna granica średniego przedziału;

Mediana częstotliwości interwałów;

Długość średniego interwału.

Mediana interwału- przedział, którego skumulowana częstotliwość (=3+3+5+7) przekracza połowę sumy częstotliwości - (153,49; 167,32).

Obliczmy asymetrię i kurtozę, dla których utworzymy nowy arkusz:

Tabela 1.4

Dane rzeczowe

Obliczone dane

Obliczmy moment trzeciego rzędu

Zatem asymetria jest równa

Od 0,3553 0,25 asymetrię uważa się za znaczącą.

Obliczmy moment czwartego rzędu

Dlatego kurtoza jest równa

Ponieważ< 0, то эксцесс является плосковершинным.

Stopień asymetrii można określić za pomocą współczynnika asymetrii Pearsona (As): obrót wartości próbki oscylacji

gdzie jest średnią arytmetyczną szeregu rozkładów; -- moda; -- odchylenie standardowe.

Zatem przy rozkładzie symetrycznym (normalnym) = Mo współczynnik asymetrii wynosi zero. Jeżeli As > 0, to modów jest więcej, zatem występuje asymetria prawoskrętna.

Jeśli jako< 0, то mniej mody zatem występuje asymetria lewostronna. Współczynnik asymetrii może zmieniać się od -3 do +3.

Rozkład nie jest symetryczny, ale ma lewostronną asymetrię.

ZADANIE 2

Jaka powinna być liczebność próby, aby z prawdopodobieństwem 0,954 błąd próby nie przekroczył 0,04, jeżeli z poprzednich badań wiadomo, że wariancja wynosi 0,24?

Rozwiązanie

Liczebność próby w przypadku pobierania próbek jednorazowych oblicza się ze wzoru:

t - współczynnik ufności (z prawdopodobieństwem 0,954 jest równy 2,0; wyznaczany z tablic całek prawdopodobieństwa),

y2=0,24 - odchylenie standardowe;

10 000 osób - wielkość próbki;

Dx =0,04 - maksymalny błąd średniej próbki.

Z prawdopodobieństwem 95,4% można stwierdzić, że wielkość próby zapewniająca błąd względny nie większy niż 0,04 powinna wynosić co najmniej 566 rodzin.

ZADANIE3

Dostępne są następujące dane na temat dochodów z głównej działalności przedsiębiorstwa, w milionach rubli.

Aby przeanalizować szereg dynamiki, określ następujące wskaźniki:

1) łańcuchowy i podstawowy:

Bezwzględne wzrosty;

Tempo wzrostu;

Tempo wzrostu;

2) średnia

Poziom wiersza dynamiki;

Absolutny wzrost;

Tempo wzrostu;

Tempo wzrostu;

3) wartość bezwzględna wzrostu o 1%.

Rozwiązanie

1. Bezwzględny wzrost (Dy)- to jest różnica pomiędzy kolejnym poziomem serii a poprzednim (lub podstawowym):

łańcuch: DN = yi - yi-1,

podstawowy: DN = yi - y0,

уi - poziom wiersza,

i - numer poziomu wiersza,

y0 - poziom roku bazowego.

2. Tempo wzrostu (Tu) to stosunek kolejnego poziomu szeregu do poprzedniego (lub roku bazowego 2001):

łańcuch: Tu = ;

podstawowy: Tu =

3. Tempo wzrostu (TD) to stosunek bezwzględnego wzrostu do poprzedniego poziomu, wyrażony w %.

łańcuch: Tu = ;

podstawowy: Tu =

4. Wartość bezwzględna wzrostu o 1% (A)- jest to stosunek bezwzględnego wzrostu łańcucha do tempa wzrostu, wyrażony w %.

A =

Średni poziom wiersza oblicza się przy użyciu wzoru na średnią arytmetyczną.

Średni poziom przychodów z działalności podstawowej za 4 lata:

Średni bezwzględny wzrost obliczane według wzoru:

gdzie n jest liczbą poziomów szeregu.

Średnio za rok dochody z działalności podstawowej wzrosły o 3,333 mln rubli.

Średnioroczne tempo wzrostu oblicza się ze wzoru na średnią geometryczną:

уn to ostatni poziom rzędu,

y0 - Pierwszy poziom wiersz.

Tu = 100% = 102,174%

Średnioroczne tempo wzrostu obliczane według wzoru:

T? = Tu – 100% = 102,74% – 100% = 2,74%.

Tym samym średnio w ciągu roku przychody z podstawowej działalności przedsiębiorstwa wzrosły o 2,74%.

ZADANIAA4

Oblicz:

1. Indywidualne wskaźniki cen;

2. Ogólny wskaźnik obrotów handlowych;

3. Zagregowany wskaźnik cen;

4. Zagregowany wskaźnik fizycznego wolumenu sprzedaży towarów;

5. Rozłóż bezwzględny wzrost wartości obrotów handlowych według czynników (w wyniku zmian cen i liczby sprzedanych towarów);

6. Wyciągnij krótkie wnioski na temat wszystkich uzyskanych wskaźników.

Rozwiązanie

1. Zgodnie z warunkiem indywidualne wskaźniki cen produktów A, B, C wyniosły -

ipA=1,20; iрБ=1,15; iрВ=1,00.

2. Wskaźnik ogólnego obrotu handlowego obliczymy ze wzoru:

I w = = 1470/1045*100% = 140,67%

Obroty handlowe wzrosły o 40,67% (140,67%-100%).

Ceny surowców wzrosły średnio o 10,24%.

Wysokość dodatkowych kosztów kupujących z tytułu podwyżek cen:

w(p) =? p1q1 -? p0q1 = 1470 - 1333,478 = 136,522 mln rubli.

W wyniku rosnących cen kupujący musieli wydać dodatkowe 136,522 mln rubli.

4. Ogólny wskaźnik fizycznego wolumenu obrotu handlowego:

Fizyczny wolumen obrotów handlowych wzrósł o 27,61%.

5. Określmy ogólną zmianę obrotów handlowych w drugim okresie w porównaniu do pierwszego okresu:

w = 1470-1045 = 425 milionów rubli.

ze względu na zmiany cen:

W(p) = 1470 - 1333,478 = 136,522 mln rubli.

ze względu na zmiany objętości fizycznej:

w(q) = 1333,478 - 1045 = 288,478 milionów rubli.

Obrót towarowy wzrósł o 40,67%. Ceny średnio za 3 towary wzrosły o 10,24%. Fizyczny wolumen obrotów handlowych wzrósł o 27,61%.

Ogółem wolumen sprzedaży wzrósł o 425 mln rubli, w tym ze względu na rosnące ceny wzrósł o 136,522 mln rubli, a ze względu na wzrost wolumenu sprzedaży - o 288,478 mln rubli.

ZADANIE5

Poniższe dane są dostępne dla 10 fabryk w jednej branży.

Numer rośliny

Wydajność produktu, tys. szt. (X)

Na podstawie podanych danych:

I) potwierdzić założenia analizy logicznej o występowaniu liniowej korelacji między charakterystyką czynnikową (objętość produktu) a charakterystyką wypadkową (zużycie energii elektrycznej), nanieść dane początkowe na wykres pola korelacji i wyciągnąć wnioski co do postaci związku podaj jego formułę;

2) wyznaczyć parametry równania połączenia i wykreślić otrzymaną linię teoretyczną na wykresie pola korelacji;

3) obliczyć współczynnik korelacji liniowej,

4) wyjaśnić znaczenie wskaźników uzyskanych w pkt 2) i 3);

5) korzystając z otrzymanego modelu dokonać prognozy możliwego zużycia energii w zakładzie o wielkości produkcji 4,5 tys. sztuk.

Rozwiązanie

Dane atrybutu - wielkość produkcji (czynnik) będą oznaczone przez xi; znak - zużycie energii elektrycznej (wynik) przez yi; punkty o współrzędnych (x, y) nanoszone są na pole korelacyjne OXY.

Punkty pola korelacji leżą na określonej linii prostej. Zależność jest zatem liniowa, równania regresji będziemy szukać w postaci prostej Уx=ax+b. Aby to znaleźć, używamy układu równań normalnych:

Stwórzmy tabelę obliczeniową.

Korzystając ze znalezionych średnich, tworzymy układ i rozwiązujemy go w odniesieniu do parametrów a i b:

Otrzymujemy więc równanie regresji dla y na x: = 3,57692 x + 3,19231

Na polu korelacji budujemy linię regresji.

Podstawiając wartości x z kolumny 2 do równania regresji, otrzymujemy obliczone (kolumna 7) i porównujemy je z danymi y, co znajduje odzwierciedlenie w kolumnie 8. Swoją drogą poprawność obliczeń potwierdza zbieżność średnich wartości y i.

Współczynnikkorelacja liniowa ocenia bliskość związku między cechami x i y i oblicza się ją za pomocą wzoru

Współczynnik kątowy regresji bezpośredniej a (w x) charakteryzuje kierunek zidentyfikowanegozależnościznaki: dla a>0 są takie same, dla a<0- противоположны. Jest absolutny wartość - miara zmiany charakterystyki wypadkowej, gdy charakterystyka czynnikowa zmienia się o jednostkę miary.

Swobodny człon regresji bezpośredniej ujawnia kierunek, a jego wartość bezwzględna jest ilościową miarą wpływu wszystkich innych czynników na wynikową charakterystykę.

Jeśli< 0, to zasób czynnika charakterystycznego dla pojedynczego obiektu jest wykorzystywany w mniejszym stopniu i kiedy>0 Zwiększą skuteczność niż średnia dla całego zbioru obiektów.

Przeprowadźmy analizę poregresyjną.

Współczynnik przy x regresji bezpośredniej wynosi 3,57692 >0, zatem wraz ze wzrostem (spadkiem) wielkości produkcji wzrasta (maleje) zużycie energii elektrycznej. Zwiększenie produkcji o 1 tys. sztuk. daje średni wzrost zużycia energii elektrycznej o 3,57692 tys. kWh.

2. Swobodny wyraz regresji bezpośredniej wynosi 3,19231, zatem wpływ innych czynników zwiększa siłę wpływu produkcji produktu na zużycie energii elektrycznej w pomiar absolutny o 3,19231 tys. kWh.

3. Współczynnik korelacji wynoszący 0,8235 wskazuje na bardzo ścisłą zależność zużycia energii elektrycznej od uzysku produktu.

Według równania Model regresjiłatwo przewidywać. W tym celu do równania regresji podstawiamy wartości x – wielkość produkcji – i prognozujemy zużycie energii elektrycznej. W takim przypadku wartości x można przyjmować nie tylko w danym zakresie, ale także poza nim.

Zróbmy prognozę możliwego zużycia energii w zakładzie o wielkości produkcji 4,5 tys. sztuk.

3,57692*4,5 + 3,19231= 19,288 45 tys. kWh.

WYKAZ WYKORZYSTANYCH ŹRÓDEŁ

1. Zacharenkow S.N. Statystyki społeczno-gospodarcze: podręcznik i przewodnik praktyczny. -Mn.: BSEU, 2002.

2. Efimova M.R., Petrova E.V., Rumyantsev V.N. Ogólna teoria statystyki. - M.: INFRA - M., 2000.

3. Eliseeva I.I. Statystyka. - M.: Prospekt, 2002.

4. Ogólna teoria statystyki / Ogólne. wyd. OE Baszyna, AA Spirina. - M.: Finanse i statystyka, 2000.

5. Statystyka społeczno-ekonomiczna: edukacyjna i praktyczna. zasiłek / Zakharenkov S.N. i inne - Mn.: Uniwersytet Państwowy w Erewaniu, 2004.

6. Statystyka społeczno-gospodarcza: Podręcznik. dodatek. / wyd. Niesterowicz S.R. - Mn.: BSEU, 2003.

7. Teslyuk I.E., Tarlovskaya V.A., Terlizhenko N. Statystyka - Mińsk, 2000.

8. Kharchenko L.P. Statystyka. - M.: INFRA - M, 2002.

9. Kharchenko L.P., Dolzhenkova V.G., Ionin V.G. Statystyka. - M.: INFRA - M, 1999.

10. Statystyka gospodarcza / wyd. Yu.N. Iwanowa - M., 2000.

Opublikowano na Allbest.ru

...

Podobne dokumenty

    Obliczanie średniej arytmetycznej dla szeregu rozkładów przedziałowych. Definicja indeks ogólny fizyczny wolumen obrotów handlowych. Analiza bezwzględnej zmiany całkowitego kosztu produkcji ze względu na zmiany wolumenu fizycznego. Obliczanie współczynnika zmienności.

    test, dodano 19.07.2010

    Istota handlu hurtowego, detalicznego i publicznego. Wzory do obliczania jednostkowych i zbiorczych wskaźników obrotu. Obliczanie charakterystyk szeregu rozkładów przedziałowych - średnia arytmetyczna, moda i mediana, współczynnik zmienności.

    praca na kursie, dodano 05.10.2013

    Obliczenie planowanej i rzeczywistej wielkości sprzedaży, procentu wykonania planu, bezwzględnej zmiany obrotów. Wyznaczanie wzrostu bezwzględnego, średniego tempa wzrostu i przyrostu dochodów pieniężnych. Obliczanie średnich strukturalnych: mody, mediany, kwartyle.

    test, dodano 24.02.2012

    Szeregi przedziałowe rozkładu banków według wolumenu zysku. Znalezienie postaci i mediany wynikowego szeregu rozkładu przedziałowego metoda graficzna i według obliczeń. Obliczanie charakterystyk szeregów rozkładów przedziałowych. Obliczanie średniej arytmetycznej.

    test, dodano 15.12.2010

    Wzory do wyznaczania wartości średnich szeregu przedziałowego - mody, mediany, dyspersja. Obliczanie wskaźników analitycznych szeregów dynamicznych z wykorzystaniem schematów łańcuchowych i podstawowych, szybkości wzrostu i przyrostów. Koncepcja skonsolidowanego wskaźnika kosztów, cen, wydatków i obrotów.

    praca na kursie, dodano 27.02.2011

    Koncepcja i cel, porządek i zasady konstruowania serii wariacyjnej. Analiza jednorodności danych w grupach. Wskaźniki zmienności (fluktuacji) cechy. Wyznaczanie średniego odchylenia liniowego i kwadratowego, współczynnika oscylacji i zmienności.

    test, dodano 26.04.2010

    Pojęcie trybu i mediany jako typowe charakterystyki, tryb i kryteria ich ustalania. Znajdowanie formy i mediany w szeregach dyskretnych i przedziałowych. Kwartyle i decyle jako dodatkowe cechy zmienności szeregi statystyczne.

    test, dodano 11.09.2010

    Konstrukcja szeregu rozkładów przedziałowych w oparciu o charakterystykę grupowania. Charakterystyka odchylenia rozkładu częstotliwości od kształtu symetrycznego, obliczanie kurtozy i wskaźników asymetrii. Analiza wskaźników bilans lub oświadczenie o dochodach.

    test, dodano 19.10.2014

    Zamiana szeregów empirycznych na dyskretne i przedziałowe. Wyznaczanie wartości średniej szeregu dyskretnego na podstawie jego właściwości. Obliczenia z wykorzystaniem dyskretnego szeregu modów, mediany, wskaźników zmienności (rozproszenie, odchylenie, współczynnik oscylacji).

    test, dodano 17.04.2011

    Konstrukcja szeregu statystycznego rozkładu organizacji. Graficzne wyznaczanie wartości postaci i mediany. Bliskość połączenie korelacyjne za pomocą współczynnika determinacji. Wyznaczanie błędu próby średniej liczby pracowników.

Przykład rozwiązania testu ze statystyki matematycznej

Problem 1

Wstępne dane : uczniowie pewnej 30-osobowej grupy zdali egzamin z przedmiotu „Informatyka”. Oceny otrzymywane przez uczniów układają się w następujący ciąg liczbowy:

I. Stwórzmy serię wariacyjną

M X

w X

M X nak

w X nak

Całkowity:

II. Graficzne przedstawienie informacji statystycznych.

III. Charakterystyka numeryczna próbki.

1. Średnia arytmetyczna

2. Średnia geometryczna

3. Moda

4. Mediana

222222333333333 | 3 34444444445555

5. Wariancja próbki

7. Współczynnik zmienności

8. Asymetria

9. Współczynnik asymetrii

10. Nadmiar

11. Współczynnik Kurtozy

Problem 2

Wstępne dane : Uczniowie jakiejś grupy napisali test końcowy. Grupa liczy 30 osób. Punkty zdobyte przez uczniów tworzą następujący ciąg liczb

Rozwiązanie

I. Ponieważ cecha przyjmuje wiele różnych wartości, skonstruujemy dla niej szereg wariacji przedziałowych. Aby to zrobić, najpierw ustaw wartość interwału H. Skorzystajmy ze wzoru Stangera

Stwórzmy skalę interwałową. W tym przypadku za górną granicę pierwszego przedziału przyjmiemy wartość określoną wzorem:

Górne granice kolejnych przedziałów wyznaczamy za pomocą następującego powtarzalnego wzoru:

, Następnie

Kończymy konstruowanie skali przedziałowej, gdyż górna granica kolejnego przedziału stała się większa lub równa maksymalnej wartości próbki
.

II. Graficzne przedstawienie serii zmian interwałowych

III. Charakterystyka numeryczna próbki

Aby określić cechy liczbowe próbki, skompilujemy tabelę pomocniczą

Suma:

1. Średnia arytmetyczna

2. Średnia geometryczna

3. Moda

4. Mediana

10 11 12 12 13 13 13 13 14 14 14 14 15 15 15 |15 15 15 16 16 16 16 16 17 17 18 19 19 20 20

5. Wariancja próbki

6. Odchylenie standardowe próbki

7. Współczynnik zmienności

8. Asymetria

9. Współczynnik asymetrii

10. Nadmiar

11. Współczynnik Kurtozy

Problem 3

Stan : wartość podziału skali amperomierza wynosi 0,1 A. Odczyty są zaokrąglane do najbliższej pełnej części. Znajdź prawdopodobieństwo, że podczas odczytu zostanie popełniony błąd większy niż 0,02 A.

Rozwiązanie.

Błąd zaokrąglenia próbki można uznać za zmienną losową X, który jest równomiernie rozłożony w przedziale pomiędzy dwoma sąsiednimi podziałami całkowitymi. Jednolita gęstość dystrybucji

Gdzie
- długość przedziału zawierającego możliwe wartości X; poza tym przedziałem
W tym zadaniu długość przedziału zawierającego możliwe wartości wynosi X, jest równe 0,1, więc

Błąd odczytu przekroczy 0,02, jeśli będzie mieścił się w przedziale (0,02; 0,08). Następnie

Odpowiedź: R=0,6

Problem 4

Wstępne dane: oczekiwanie matematyczne i odchylenie standardowe charakterystyki o rozkładzie normalnym X odpowiednio równe 10 i 2. Znajdź prawdopodobieństwo, że w wyniku testu X przyjmie wartość zawartą w przedziale (12, 14).

Rozwiązanie.

Skorzystajmy ze wzoru

I częstotliwości teoretyczne

Rozwiązanie

Dla X niej wartość oczekiwana M(X) i wariancja D(X). Rozwiązanie. Znajdźmy dystrybuantę F(x) zmienna losowa... błąd próbkowania). Komponujmy wariacyjny wiersz Szerokość interwału będzie: Dla każdej wartości wiersz Obliczmy, ile...

  • Rozwiązanie: równanie rozłączne

    Rozwiązanie

    W postaci Aby znaleźć iloraz rozwiązania równanie niejednorodne pogódźmy się system Rozwiążmy powstały system... ; +47; +61; +10; -8. Zbuduj interwał wariacyjny wiersz. Podaj szacunki statystyczne średniej wartości...

  • Rozwiązanie: Obliczmy łańcuchowe i podstawowe przyrosty bezwzględne, stopy wzrostu, stopy wzrostu. Uzyskane wartości podsumowujemy w tabeli 1

    Rozwiązanie

    Wielkość produkcji. Rozwiązanie: Średnia arytmetyczna przedziału wariacyjny wiersz oblicza się w następujący sposób: dla... Marginalny błąd próbkowania z prawdopodobieństwem 0,954 (t=2) będzie: Δ w = t*μ = 2*0,0146 = 0,02927 Zdefiniujmy granice...

  • Rozwiązanie. Podpisać

    Rozwiązanie

    O doświadczenie zawodowe które i składający się próbka. Przykładowe średnie doświadczenie zawodowe... tych pracowników i składający się próbka. Średni czas trwania próby... 1,16, poziom istotności α = 0,05. Rozwiązanie. Wariacyjny wiersz tej próbki wygląda następująco: 0,71 ...

  • Program zajęć z biologii dla klas 10-11 Opracowała: Polikarpova S. V.

    Pracujący program treningowy

    Najprostsze schematy przejść” 5 L.r. " Rozwiązanie elementarne problemy genetyczne” 6 L.b. " Rozwiązanie elementarne problemy genetyczne” 7 L.b. „..., 110, 115, 112, 110. Komponować wariacyjny wiersz, rysować wariacyjny krzywej, znajdź średnią wartość cechy...

  • Dyskretna seria zmian jest tworzona dla dyskretnych charakterystyk.

    W celu skonstruowania dyskretnego szeregu zmienności należy wykonać następujące kroki: 1) ułożyć jednostki obserwacji w porządku rosnącym według badanej wartości cechy,

    2) określ wszystkie możliwe wartości atrybutu x i, ułóż je w kolejności rosnącej,

    wartość atrybutu, I .

    częstotliwość wartości atrybutu i oznaczać F I . Suma wszystkich częstości szeregu jest równa liczbie elementów w badanej populacji.

    Przykład 1 .

    Lista ocen uzyskanych przez studentów z egzaminów: 3; 4; 3; 5; 4; 2; 2; 4; 4; 3; 5; 2; 4; 5; 4; 3; 4; 3; 3; 4; 4; 2; 2; 5; 5; 4; 5; 2; 3; 4; 4; 3; 4; 5; 2; 5; 5; 4; 3; 3; 4; 2; 4; 4; 5; 4; 3; 5; 3; 5; 4; 4; 5; 4; 4; 5; 4; 5; 5; 5.

    Oto numer X - stopieńjest dyskretną zmienną losową, a wynikowa lista szacunków jestdane statystyczne (obserwowalne). .

      uporządkuj jednostki obserwacyjne w kolejności rosnącej badanej wielkości charakterystycznej:

    2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5.

    2) określ wszystkie możliwe wartości atrybutu x i, uporządkuj je w kolejności rosnącej:

    W tym przykładzie wszystkie szacunki można podzielić na cztery grupy o następujących wartościach: 2; 3; 4; 5.

    Nazywa się wartość zmiennej losowej odpowiadającej określonej grupie obserwowanych danych wartość atrybutu, opcję (opcję) i oznacz x I .

    Nazywa się liczbą, która pokazuje, ile razy odpowiednia wartość cechy występuje w pewnej liczbie obserwacji częstotliwość wartości atrybutu i oznaczać F I .

    Dla naszego przykładu

    wynik 2 występuje - 8 razy,

    wynik 3 występuje - 12 razy,

    wynik 4 występuje - 23 razy,

    wynik 5 występuje - 17 razy.

    W sumie jest 60 ocen.

    4) zapisz otrzymane dane w tabeli składającej się z dwóch wierszy (kolumn) - x i oraz fi i.

    Na podstawie tych danych można skonstruować dyskretny szereg zmian

    Dyskretne serie zmian – jest to tabela, w której wskazane są występujące wartości badanej cechy jako poszczególne wartości w kolejności rosnącej oraz ich częstotliwości

    1. Konstrukcja szeregu zmian przedziałowych

    Oprócz dyskretnych szeregów wariacyjnych często spotyka się metodę grupowania danych, taką jak przedziałowy szereg wariacyjny.

    Szereg przedziałowy buduje się, jeśli:

      znak ma ciągły charakter zmian;

      Było dużo wartości dyskretnych (ponad 10)

      częstotliwości wartości dyskretnych są bardzo małe (nie przekraczają 1-3 przy stosunkowo dużej liczbie jednostek obserwacyjnych);

      wiele dyskretnych wartości cechy o tych samych częstotliwościach.

    Seria wariacji przedziałowych to sposób grupowania danych w postaci tabeli składającej się z dwóch kolumn (wartości cechy w postaci przedziału wartości i częstotliwości każdego przedziału).

    w odróżnieniu dyskretna seria wartości atrybutu serii przedziałów są reprezentowane nie przez pojedyncze wartości, ale przez przedział wartości („od - do”).

    Liczba pokazująca, ile jednostek obserwacyjnych przypada na każdy wybrany przedział, nazywa się częstotliwość wartości atrybutu i oznaczać F I . Suma wszystkich częstości szeregu jest równa liczbie elementów (jednostek obserwacji) w badanej populacji.

    Jeżeli jednostka ma wartość charakterystyczną równą Górna granica interwału, to należy go przypisać do kolejnego interwału.

    Na przykład dziecko o wzroście 100 cm wpadnie do drugiego przedziału, a nie do pierwszego; a dziecko o wzroście 130 cm wpadnie do ostatniego przedziału, a nie do trzeciego.

    Na podstawie tych danych można skonstruować szereg zmian przedziałowych.

    Każdy przedział ma dolną granicę (xn), górną granicę (xw) i szerokość interwału ( I).

    Granica przedziału to wartość atrybutu leżąca na granicy dwóch przedziałów.

    wzrost dziecka (cm)

    wzrost dziecka (cm)

    ilość dzieci

    ponad 130

    Jeżeli przedział ma górną i dolną granicę, wówczas nazywa się go przerwa zamknięta. Jeśli przedział ma tylko dolną lub tylko górną granicę, to jest to - przerwa otwarta. Otwarty może być tylko pierwszy lub ostatni interwał. W powyższym przykładzie ostatni przedział jest otwarty.

    Szerokość interwału (I) – różnica pomiędzy górną i dolną granicą.

    I = x n - x cale

    Przyjmuje się, że szerokość przedziału otwartego jest taka sama jak szerokość sąsiedniego przedziału zamkniętego.

    wzrost dziecka (cm)

    ilość dzieci

    Szerokość odstępu (i)

    dla obliczeń 130+20=150

    20 (ponieważ szerokość sąsiedniego przedziału zamkniętego wynosi 20)

    Wszystkie serie interwałowe dzielą się na serie interwałowe o równych odstępach i serie interwałowe o nierównych odstępach . W rzędach rozmieszczonych w równych odstępach szerokość wszystkich odstępów jest taka sama. W szeregach przedziałowych o nierównych odstępach szerokość odstępów jest inna.

    W rozważanym przykładzie - szereg przedziałowy o nierównych odstępach.

    Jeśli badana zmienna losowa ma charakter ciągły, wówczas ranking i grupowanie obserwowanych wartości często nie pozwala na identyfikację cechy charakteru zmianę jego wartości. Wyjaśnia to fakt, że poszczególne wartości zmiennej losowej mogą różnić się od siebie tak mało, jak jest to pożądane, dlatego w sumie obserwowanych danych rzadko mogą wystąpić identyczne wartości wielkości, a częstotliwości warianty niewiele się od siebie różnią.

    Niepraktyczne jest również konstruowanie szeregu dyskretnego dla dyskretnej zmiennej losowej, czyli liczby możliwa wartość który jest świetny. W takich przypadkach powinieneś budować szereg zmian interwałowych dystrybucje.

    Aby skonstruować taką serię, cały przedział zmienności obserwowanych wartości zmiennej losowej dzieli się na serię częściowe interwały i zliczanie częstotliwości występowania wartości wartości w każdym przedziale cząstkowym.

    Interwał seria odmian wywołać uporządkowany zbiór przedziałów różnych wartości zmiennej losowej z odpowiednimi częstotliwościami lub względnymi częstotliwościami wartości zmiennej przypadającej na każdą z nich.

    Aby zbudować serię interwałową potrzebujesz:

    1. definiować rozmiar częściowe przerwy;
    2. definiować szerokość interwały;
    3. ustaw go dla każdego interwału szczyt I dolna granica ;
    4. pogrupuj wyniki obserwacji.

    1 . Kwestię wyboru liczby i szerokości przedziałów grupujących należy rozstrzygać w każdym konkretnym przypadku na podstawie cele badania, tom próbki i stopień zmienności charakterystyczny w próbce.

    Przybliżona liczba interwałów k można oszacować jedynie na podstawie wielkości próby N w jeden z następujących sposobów:

    • według formuły Sturges : k = 1 + 3,32 log n ;
    • korzystając z tabeli 1.

    Tabela 1

    2 . Generalnie preferowane są przestrzenie o równej szerokości. Aby określić szerokość odstępów H Oblicz:

    • zakres zmienności R - przykładowe wartości: R = x maks. - x min ,

    Gdzie xmaks I xmin - maksymalne i minimalne opcje pobierania próbek;

    • szerokość każdego interwału H wyznaczany za pomocą następującego wzoru: h = R/k .

    3 . Konkluzja pierwsza przerwa x godz1 dobiera się tak, aby opcja minimalnej próbki xmin spadł mniej więcej w połowie tego przedziału: x h1 = x min - 0,5 godz .

    Interwały pośrednie uzyskuje się przez dodanie długości przedziału częściowego do końca poprzedniego przedziału H :

    x hi = x hi-1 + godz.

    Budowa skali przedziałowej w oparciu o obliczenie granic przedziałów trwa aż do wartości x cześć spełnia zależność:

    x cześć< x max + 0,5·h .

    4 . Zgodnie ze skalą przedziałową grupuje się wartości charakterystyczne – dla każdego przedziału cząstkowego obliczana jest suma częstotliwości n ja opcja zawarta w I interwał. W tym przypadku przedział obejmuje wartości zmiennej losowej, które są większe lub równe dolnej granicy i mniejsze niż górna granica przedziału.

    Wielokąt i histogram

    Dla przejrzystości konstruuje się różne wykresy rozkładu statystycznego.

    Na podstawie danych dyskretnego szeregu zmian konstruują wielokąt częstotliwości lub częstotliwości względne.

    Wielokąt częstotliwości x 1 ; nr 1 ), (x 2 ; nr 2 ), ..., (x k ; n k ). Aby skonstruować wielokąt częstotliwości, opcje są wykreślane na osi odciętych. x ja , a na rzędnej - odpowiednie częstotliwości n ja . Punkty ( x ja ; n ja ) łączy się odcinkami prostymi i uzyskuje się wielokąt częstotliwości (ryc. 1).

    Wielokąt częstotliwości względnych nazywana linią łamaną, której odcinki łączą punkty ( x 1 ; W 1 ), (x 2 ; W 2 ), ..., (x k ; tydz ). Aby skonstruować wielokąt częstotliwości względnych, opcje są wykreślane na osi odciętych x ja , a na rzędnej - odpowiadające im częstotliwości względne W ja . Punkty ( x ja ; W ja ) są połączone odcinkami prostymi i uzyskuje się wielokąt częstotliwości względnych.

    Gdy znak ciągły warto budować histogram .

    Histogram częstotliwości nazywana figurą schodkową składającą się z prostokątów, których podstawy są częściowymi odcinkami długości H , a wysokości są równe stosunkowi n i/godz (gęstość częstotliwości).

    Aby skonstruować histogram częstotliwości, na osi odciętych rozmieszczone są częściowe odstępy, a nad nimi w pewnej odległości narysowane są segmenty równoległe do osi odciętych n i/godz .



    Nowość na stronie

    >

    Najbardziej popularny