Dom Stomatologia dziecięca Do sprawdzenia istotności statystycznej stosuje się równanie regresji. Ocena znaczenia równania regresji i jego współczynników

Do sprawdzenia istotności statystycznej stosuje się równanie regresji. Ocena znaczenia równania regresji i jego współczynników

Ocena znaczenia równania regresja wielokrotna

Konstrukcja empirycznego równania regresji jest początkowym etapem analizy ekonometrycznej. Bardzo rzadko pierwsze równanie regresji zbudowane na próbie jest zadowalające pod względem pewnych cech. Dlatego następny najważniejsze zadanie Analiza ekonometryczna jest badaniem jakości równania regresji. W ekonometrii przyjęto ugruntowany schemat takiej weryfikacji.

Zatem sprawdzenie jakości statystycznej oszacowanego równania regresji odbywa się za pomocą następujące wskazówki:

· sprawdzenie znaczenia równania regresji;

· badanie znaczenie statystyczne współczynniki równania regresji;

· sprawdzenie właściwości danych, których wykonalność założono przy estymacji równania (sprawdzenie wykonalności przesłanek OLS).

Badanie istotności równania regresji wielokrotnej, a także regresji sparowanej przeprowadza się za pomocą testu Fishera. W w tym przypadku(w przeciwieństwie do regresji parami) stawiana jest hipoteza zerowa H 0że wszystkie współczynniki regresji są równe zeru ( b 1=0, b 2=0, … , b m=0). Kryterium Fishera wyznacza się za pomocą następującego wzoru:

Gdzie D fakt - wariancja czynnikowa wyjaśniona regresją, na jeden stopień swobody; D ost - dyspersja resztkowa na stopień swobody; R2- współczynnik wielokrotne określenie; T X w równaniu regresji (w sparowanym regresja liniowa T= 1); P - liczba obserwacji.

Otrzymaną wartość testu F porównuje się z wartością z tabeli na pewnym poziomie istotności. Jeżeli jego rzeczywista wartość jest większa niż wartość z tabeli, wówczas hipoteza Ale odrzuca się nieistotność równania regresji i przyjmuje się alternatywną hipotezę o jego istotności statystycznej.

Korzystając z kryterium Fishera, można ocenić znaczenie nie tylko równania regresji jako całości, ale także znaczenie dodatkowego uwzględnienia każdego czynnika w modelu. Taka ocena jest konieczna, aby nie obciążać modelu czynnikami, które nie mają istotnego wpływu na wynik. Dodatkowo, ponieważ model składa się z kilku czynników, można je do niego wprowadzać w różnej kolejności, a ponieważ pomiędzy czynnikami istnieje korelacja, znaczenie uwzględnienia w modelu tego samego czynnika może być różne w zależności od kolejności, w jakiej wprowadzane są do niego czynniki.

Aby ocenić znaczenie uwzględnienia w modelu dodatkowego czynnika, oblicza się częściowe kryterium Fishera Fxi. Polega ona na porównaniu wzrostu wariancji czynnikowej w wyniku włączenia dodatkowego czynnika do modelu z wariancją resztową na jeden stopień swobody dla regresji jako całości. Dlatego formuła obliczeniowa prywatny test F gdyż czynnik będzie miał postać:

Gdzie R 2 yx 1 x 2… xi… xp - współczynnik wielokrotnej determinacji dla modelu pełnego zbioru P czynniki ; R 2 yx 1 x 2… x i -1 x i +1… xp- współczynnik determinacji wielokrotnej dla modelu, który nie uwzględnia czynnika x ja;P- liczba obserwacji; T- liczba parametrów czynników X w równaniu regresji.

Rzeczywistą wartość częściowego testu Fishera porównuje się z wartością tabelaryczną na poziomie istotności 0,05 lub 0,1 i odpowiadających im liczbach stopni swobody. Jeśli rzeczywista wartość F.xi przekracza Stół F, następnie dodatkowe włączenie czynnika x ja do modelu jest uzasadniony statystycznie, a „czysty” współczynnik regresji b ja na czynnik x ja istotne statystycznie. Jeśli F.xi mniej Stół F, wówczas dodatkowe uwzględnienie czynnika w modelu nie zwiększa znacząco udziału wyjaśnionej zmienności w wyniku y, dlatego też włączenie go do modelu nie ma sensu, współczynnik regresji dla tego czynnika jest w tym przypadku nieistotny statystycznie.

Stosując częściowy test Fishera, można przetestować istotność wszystkich współczynników regresji przy założeniu, że każdy odpowiadający im czynnik x ja jest wprowadzany do równania regresji wielokrotnej jako ostatni, a wszystkie inne czynniki zostały już uwzględnione w modelu wcześniej.

Ocena znaczenia „czystych” współczynników regresji b ja Przez Test t-Studenta można przeprowadzić bez obliczania prywatnego F-kryteria. W tym przypadku, podobnie jak w przypadku regresji sparowanej, wzór stosuje się dla każdego czynnika

t bi = b ja / m bi ,

Gdzie b ja- współczynnik „czystej” regresji ze współczynnikiem x ja ; m bi- błąd standardowy współczynnika regresji b ja .

Do oceny istotności i istotności współczynnika korelacji wykorzystuje się test t-Studenta.

Średni błąd współczynnika korelacji oblicza się za pomocą wzoru:

N
i na podstawie błędu obliczane jest kryterium t:

Obliczoną wartość testu t porównuje się z wartością tabelaryczną znalezioną w tabeli rozkładu Studenta na poziomie istotności 0,05 lub 0,01 i liczbie stopni swobody n-1. Jeżeli obliczona wartość testu t jest większa niż wartość z tabeli, wówczas współczynnik korelacji uznaje się za istotny.

W przypadku zależności krzywoliniowej do oceny istotności zależności korelacyjnej i równania regresji stosuje się test F. Oblicza się go według wzoru:

Lub

gdzie η jest współczynnikiem korelacji; n – liczba obserwacji; m – liczba parametrów w równaniu regresji.

Obliczoną wartość F porównuje się z tabelaryczną dla przyjętego poziomu istotności α (0,05 lub 0,01) oraz liczb stopni swobody k 1 =m-1 i k 2 =n-m. Jeżeli obliczona wartość F jest większa od tabeli, zależność uznaje się za istotną.

Istotność współczynnika regresji ustala się za pomocą testu t-Studenta, który oblicza się ze wzoru:

gdzie σ 2 i i jest wariancją współczynnika regresji.

Oblicza się go według wzoru:

gdzie k jest liczbą cech czynnika w równaniu regresji.

Współczynnik regresji uważa się za istotny, jeżeli t a 1 ≥t cr. t cr znajduje się w tabeli punktów krytycznych rozkładu Studenta na przyjętym poziomie istotności i liczbie stopni swobody k=n-1.

4.3 Analiza korelacji i regresji w programie Excel

Przeprowadźmy analizę korelacji i regresji zależności pomiędzy plonem a kosztami pracy w przeliczeniu na 1 kwintal ziarna. Aby to zrobić, otwórz arkusz Excel i wpisz wartości cechy współczynnika w komórkach A1:A30 plon roślin zbożowych, w komórkach B1:B30 wartością otrzymanej cechy jest koszt pracy na 1 kwintal ziarna. W menu Narzędzia wybierz opcję Analiza danych. Klikając lewym przyciskiem myszy na ten element, otworzymy narzędzie Regresja. Kliknij przycisk OK, a na ekranie pojawi się okno dialogowe Regresja. W polu Przedział wejściowy Y wprowadź wartości charakterystyki wynikowej (podświetlając komórki B1:B30), w polu Przedział wejściowy X wprowadź wartości charakterystyki współczynnikowej (podświetlając komórki A1:A30). Zaznacz poziom prawdopodobieństwa 95% i wybierz Nowy arkusz. Kliknij przycisk OK. Na arkuszu pojawia się tabela „WNIOSEK WYNIKÓW”, która przedstawia wyniki obliczeń parametrów równania regresji, współczynnika korelacji i innych wskaźników pozwalających określić istotność współczynnika korelacji oraz parametrów równania regresji.

PODSUMOWANIE WYNIKÓW

Statystyka regresji

Liczba mnoga R

Plac R

Znormalizowany R-kwadrat

Standardowy błąd

Obserwacje

Analiza wariancji

Znaczenie F

Regresja

Szanse

Standardowy błąd

statystyka t

Wartość P

Dolne 95%

Najlepsze 95%

Dolne 95,0%

Górne 95,0%

Przecięcie Y

Zmienna X 1

W tej tabeli „wielokrotne R” to współczynnik korelacji, „R-kwadrat” to współczynnik determinacji. „Współczynniki: przecięcie Y” - wolny człon równania regresji 2.836242; „Zmienna X1” – współczynnik regresji -0,06654. Istnieją również wartości testu F Fishera 74,9876, testu t-Studenta 14,18042, „Błąd standardowy 0,112121”, które są niezbędne do oceny istotności współczynnika korelacji, parametrów równania regresji i całego równania.

Na podstawie danych w tabeli skonstruujemy równanie regresji: y x ​​= 2,836-0,067x. Współczynnik regresji a 1 = -0,067 oznacza, że ​​wraz ze wzrostem plonu ziarna o 1 c/ha koszty pracy w przeliczeniu na 1 c ziarna zmniejszają się o 0,067 roboczogodzin.

Współczynnik korelacji wynosi r=0,85>0,7, zatem związek pomiędzy badanymi cechami w tej populacji jest bliski. Współczynnik determinacji r 2 = 0,73 pokazuje, że 73% zmienności cechy efektywnej (koszty pracy na 1 kwintal ziarna) wynika z działania cechy czynnikowej (plon ziarna).

W tabeli punktów krytycznych rozkładu Fishera-Snedecora znajdujemy wartość krytyczną testu F na poziomie istotności 0,05 oraz liczbę stopni swobody k 1 =m-1=2-1=1 i k 2 = n-m=30-2=28, równa się 4,21. Ponieważ obliczona wartość kryterium jest większa od wartości tabelarycznej (F=74,9896>4,21), równanie regresji uznaje się za istotne.

Aby ocenić istotność współczynnika korelacji, obliczmy test t-Studenta:

W
W tablicy punktów krytycznych rozkładu Studenta wartość krytyczną testu t przy poziomie istotności 0,05 i liczbie stopni swobody n-1=30-1=29 wynosi ona 2,0452. Ponieważ obliczona wartość jest większa niż wartość z tabeli, współczynnik korelacji jest istotny.

Oszacowanie istotności parametrów równania regresji

Istotność parametrów równania regresji liniowej ocenia się za pomocą testu Studenta:

Jeśli T oblicz. > T cr, wówczas przyjmuje się hipotezę główną ( H o), wskazując istotność statystyczną parametrów regresji;

Jeśli T oblicz.< T cr, wówczas akceptowana jest hipoteza alternatywna ( H 1), wskazując na statystyczną nieistotność parametrów regresji.

Gdzie ja , m b– błędy standardowe parametrów A I B:

(2.19)

(2.20)

Wartość krytyczną (tabelaryczną) kryterium wyznacza się za pomocą tablic statystycznych rozkładu Studenta (Załącznik B) lub za pomocą tablic Przewyższać(sekcja kreatora funkcji „Statystyczne”):

T cr = STUDARSOBR( α=1-P; k=n-2), (2.21)

Gdzie k=n-2 reprezentuje również liczbę stopni swobody .

Ocenę istotności statystycznej można zastosować także do współczynnika korelacji liniowej

Gdzie Pan– błąd standardowy w wyznaczaniu wartości współczynnika korelacji r yx

(2.23)

Poniżej znajdują się opcje zadań praktycznych i Praca laboratoryjna na tematy drugiej części.

Pytania testowe do sekcji 2

1. Wskaż główne elementy modelu ekonometrycznego i ich istotę.

2. Zasadnicza treść etapów badań ekonometrycznych.

3. Istota podejść do wyznaczania parametrów regresji liniowej.

4. Istota i specyfika stosowania metody najmniejszych kwadratów przy wyznaczaniu parametrów równania regresji.

5. Jakie wskaźniki służą do oceny bliskości związku między badanymi czynnikami?

6. Esencja współczynnik liniowy korelacje.

7. Istota współczynnika determinacji.

8. Istota i główne cechy procedur oceny adekwatności (istotność statystyczna) modele regresji.

9. Ocena adekwatności modeli regresji liniowej za pomocą współczynnika aproksymacji.

10. Istota podejścia do oceny adekwatności modeli regresji z wykorzystaniem kryterium Fishera. Definicja empirycznego i wartości krytyczne kryterium.

11. Istota pojęcia „analiza wariancji” w odniesieniu do badań ekonometrycznych.

12. Istota i główne cechy procedury oceny istotności parametrów równanie liniowe regresja.

13. Możliwości wykorzystania rozkładu Studenta przy ocenie istotności parametrów równania regresji liniowej.

14. Jakie jest zadanie prognozowania pojedynczych wartości badanego zjawiska społeczno-gospodarczego?

1. Konstruować pole korelacyjne i formułować założenia dotyczące postaci równania na związek badanych czynników;

2. Zapisz podstawowe równania metody najmniejszych kwadratów, dokonaj niezbędnych przekształceń, sporządź tabelę obliczeń pośrednich i określ parametry równania regresji liniowej;

3. Sprawdź poprawność wykonanych obliczeń za pomocą standardowe procedury i funkcje arkusze kalkulacyjne Przewyższać.

4. Analizować wyniki, formułować wnioski i rekomendacje.

1. Obliczanie wartości współczynnika korelacji liniowej;

2. Budowa stołu analiza wariancji;

3. Oszacowanie współczynnika determinacji;

4. Sprawdź poprawność obliczeń korzystając ze standardowych procedur i funkcji arkuszy kalkulacyjnych Excel.

5. Analizować wyniki, formułować wnioski i rekomendacje.

4. Dokonać ogólnej oceny adekwatności wybranego równania regresji;

1. Ocena adekwatności równania na podstawie wartości współczynnika aproksymacji;

2. Ocena adekwatności równania na podstawie wartości współczynnika determinacji;

3. Ocena adekwatności równania za pomocą kryterium Fishera;

4. Dokonać ogólnej oceny adekwatności parametrów równania regresji;

5. Sprawdź poprawność obliczeń korzystając ze standardowych procedur i funkcji arkuszy kalkulacyjnych Excel.

6. Analizować wyniki, formułować wnioski i rekomendacje.

1. Korzystanie ze standardowych procedur Kreatora funkcji arkusza kalkulacyjnego Excel (z sekcji „Matematyczne” i „Statystyczne”);

2. Przygotowanie danych i możliwości wykorzystania funkcji REGLINP;

3. Przygotowanie danych i możliwości wykorzystania funkcji „PREDYKCJA”.

1. Stosowanie standardowych procedur pakietu analizy danych arkusza kalkulacyjnego Excel;

2. Przygotowanie danych i cechy stosowania procedury „REGRESJA”;

3. Interpretacja i synteza danych z tabeli analizy regresji;

4. Interpretacja i synteza danych z analizy tabeli wariancji;

5. Interpretacja i uogólnienie danych z tabeli do oceny istotności parametrów równania regresji;

Wykonując prace laboratoryjne w oparciu o jedną z opcji, należy wykonać następujące szczegółowe zadania:

1. Wybierz postać równania zależności badanych czynników;

2. Wyznaczać parametry równania regresji;

3. Oceniać ścisły związek badanych czynników;

4. Ocenić adekwatność wybranego równania regresji;

5. Oceniać istotność statystyczną parametrów równania regresji.

6. Sprawdź poprawność obliczeń korzystając ze standardowych procedur i funkcji arkuszy kalkulacyjnych Excel.

7. Analizować wyniki, formułować wnioski i rekomendacje.

Zadania do pracy praktycznej i laboratoryjnej na temat „Sparowana regresja liniowa i korelacja w badaniach ekonometrycznych”.

opcja 1 Opcja 2 Opcja 3 Opcja 4 Opcja 5
X y X y X y X y X y
Opcja 6 Opcja 7 Opcja 8 Opcja 9 Opcja 10
X y X y X y X y X y

W badaniach społeczno-ekonomicznych często konieczna jest praca na ograniczonej populacji lub na danych próbnych. Dlatego po parametrach matematycznych równania regresji należy ocenić je i równanie jako całość pod kątem istotności statystycznej, tj. należy upewnić się, że powstałe równanie i jego parametry powstają pod wpływem czynników nielosowych.

Przede wszystkim ocenia się istotność statystyczną równania jako całości. Ocenę zazwyczaj przeprowadza się za pomocą testu F Fishera. Obliczenie kryterium F opiera się na zasadzie dodawania wariancji. Mianowicie ogólna charakterystyka dyspersji – wynik = dyspersja współczynnikowa + dyspersja resztkowa.

Aktualna cena

Cena teoretyczna
Konstruując równanie regresji, można obliczyć teoretyczną wartość charakterystyki wyniku, tj. obliczane za pomocą równania regresji z uwzględnieniem jego parametrów.

Wartości te będą charakteryzowały atrybut wyniku, powstały pod wpływem czynników uwzględnionych w analizie.

Zawsze występują rozbieżności (reszty) pomiędzy rzeczywistymi wartościami atrybutu wyniku a wartościami obliczonymi na podstawie równania regresji, spowodowane wpływem innych czynników nieuwzględnionych w analizie.

Różnica między teoretycznymi i rzeczywistymi wartościami atrybutu wyniku nazywana jest resztami. Ogólna zmienność cechy wyniku:

Zmienność atrybutu wyniku, spowodowaną zmianą charakterystyki czynników objętych analizą, ocenia się poprzez porównanie teoretycznych wartości wyników. charakterystyki i jej wartości średnich. Zmienność resztkowa poprzez porównanie teoretycznych i rzeczywistych wartości wynikowej charakterystyki. Wariancja całkowita, resztkowa i rzeczywista mają różną liczbę stopni swobody.

Ogólny, P- liczba jednostek w badanej populacji

Rzeczywisty, P- liczba czynników uwzględnionych w analizie

Pozostały

Test F Fishera oblicza się jako stosunek do , i oblicza się dla jednego stopnia swobody.

Stosowanie testu F Fishera do oszacowania istotności statystycznej równania regresji jest bardzo logiczne. - oto wynik. charakterystyka, zdeterminowana czynnikami uwzględnionymi w analizie, tj. jest to część wyjaśnionego wyniku. podpisać. - jest to (odmiana) atrybutu wyniku spowodowana czynnikami, których wpływ nie jest brany pod uwagę, tj. nieuwzględnione w analizie.

To. Test F ma na celu ocenę istotne nadmiar ponad. Jeżeli nie jest znacząco niższa od , a tym bardziej, jeśli przekracza , to w analizie nie uwzględnia się tych czynników, które faktycznie wpływają na cechę wyniku.

Test F Fishera przedstawiono w tabeli, a wartość rzeczywistą porównano z wartością tabelaryczną. Jeśli , to równanie regresji uważa się za istotne statystycznie. Jeżeli natomiast równanie nie jest istotne statystycznie i nie da się go zastosować w praktyce, istotność równania jako całości wskazuje na istotność statystyczną wskaźników korelacji.

Po oszacowaniu równania jako całości należy ocenić istotność statystyczną parametrów równania. Oceny tej dokonuje się za pomocą statystyki t-Studenta. Statystykę t oblicza się jako stosunek parametrów równania (modulo) do ich standardowego błędu średniokwadratowego. Jeżeli estymowany jest model jednoczynnikowy, to obliczane są 2 statystyki.

We wszystkich programach komputerowych obliczenie błędu standardowego i statystyki t parametrów odbywa się poprzez obliczenie samych parametrów. Tabela statystyk T. Jeżeli wartość wynosi , to parametr uznaje się za istotny statystycznie, tj. powstają pod wpływem czynników nielosowych.

Obliczanie statystyki t zasadniczo oznacza testowanie hipotezy zerowej, że parametr jest nieistotny, tj. jego równość do zera. W przypadku modelu jednoczynnikowego oceniane są 2 hipotezy: oraz

Poziom istotności przyjęcia hipotezy zerowej zależy od poziomu przyjętej hipotezy prawdopodobieństwo pewności. Jeśli więc badacz ustawi poziom prawdopodobieństwa na 95%, zostanie wyliczony akceptowalny poziom istotności, zatem jeśli poziom istotności wynosi ≥ 0,05, to jest on akceptowany, a parametry uznawane za nieistotne statystycznie. Jeśli , to alternatywa jest odrzucana i akceptowana: oraz .

Pakiety oprogramowania statystycznego zapewniają również poziom istotności dla akceptowania hipotez zerowych. Ocena znaczenia równania regresji i jego parametrów może dać następujące wyniki:

Po pierwsze, równanie jako całość jest istotne (zgodnie z testem F) i wszystkie parametry równania są również istotne statystycznie. Oznacza to, że powstałe równanie można wykorzystać do uwzględnienia obu decyzje zarządcze i do prognozowania.

Po drugie, zgodnie z testem F równanie jest istotne statystycznie, ale przynajmniej jeden z parametrów równania nie jest istotny. Równanie może służyć do podejmowania decyzji zarządczych dotyczących analizowanych czynników, ale nie może być wykorzystywane do prognozowania.

Po trzecie, równanie nie jest istotne statystycznie, czyli zgodnie z testem F równanie jest istotne, ale wszystkie parametry otrzymanego równania nie są istotne. Równania nie można używać w żadnym celu.

Aby równanie regresji mogło być uznane za model zależności pomiędzy atrybutem wyniku i atrybutem czynnika, konieczne jest, aby wszystkie najważniejsze czynniki, ustalenie wyniku tak, aby sensowna interpretacja parametrów równania odpowiadała teoretycznym powiązaniom w badanym zjawisku. Współczynnik determinacji R2 musi wynosić > 0,5.

Konstruując równanie regresji wielokrotnej, wskazane jest dokonanie oceny z wykorzystaniem tzw. skorygowanego współczynnika determinacji (R 2). Wartość R2 (jak również korelacja) rośnie wraz z liczbą czynników uwzględnianych w analizie. Wartość współczynnika jest szczególnie przeszacowana w małych populacjach. Aby stłumić negatywny wpływ, R 2 i korelacje koryguje się biorąc pod uwagę liczbę stopni swobody, tj. liczba swobodnie zmieniających się elementów, jeśli uwzględni się pewne czynniki.

Skorygowany współczynnik determinacji

P–wielkość populacji/liczba obserwacji

k– liczba czynników uwzględnionych w analizie

n-1– liczba stopni swobody

(1-R2)- wartość reszty/niewyjaśnionej wariancji wynikowej charakterystyki

Zawsze mniej R2. na podstawie których można porównać szacunki równań z różne liczby analizowane czynniki.

34. Problemy badania szeregów czasowych.

Szeregi czasowe nazywane są szeregami czasowymi lub szeregami czasowymi. Szereg czasowy to uporządkowana w czasie sekwencja wskaźników charakteryzujących dane zjawisko (wielkość PKB od 90 do 98). Celem badania szeregów czasowych jest określenie wzorca rozwoju badanego zjawiska (głównego trendu) i na tej podstawie prognoza. Z definicji RD wynika, że ​​każdy szereg składa się z dwóch elementów: czasu t oraz poziomu szeregu (tych konkretnych wartości wskaźnika, na podstawie których budowany jest szereg RD). Szeregami DR mogą być 1) momenty – serie, których wskaźniki rejestrowane są w danym momencie, w określonym dniu, 2) przedziały – serie, których wskaźniki uzyskiwane są przez pewien okres czasu (1. populacja Petersburg, 2. wielkość PKB za ten okres). Podział szeregów na momentowe i przedziałowe jest konieczny, gdyż od tego zależy specyfika obliczania niektórych wskaźników szeregów DR. Sumowanie poziomów seria interwałowa daje sensownie interpretowalny wynik, czego nie można powiedzieć o sumowaniu poziomów szeregów momentów, gdyż te ostatnie zawierają wielokrotne zliczanie. Najważniejszym problemem w analizie szeregów czasowych jest problem porównywalności poziomów szeregów. Koncepcja ta jest bardzo różnorodna. Poziomy muszą być porównywalne pod względem metod obliczeniowych oraz pod względem terytorium i zasięgu jednostek populacji. Jeżeli szereg DR jest skonstruowany w ujęciu kosztowym, wówczas wszystkie poziomy należy przedstawić lub obliczyć w porównywalnych cenach. Konstruując szeregi przedziałowe, poziomy muszą charakteryzować identyczne okresy czasu. Konstruując szeregi momentów, poziomy muszą być rejestrowane w tym samym dniu. Seria DR może być kompletna lub niekompletna. W oficjalnych publikacjach używane są niekompletne wiersze (1980,1985,1990,1995,1996,1997,1998,1999...). Kompleksowa analiza RD obejmuje badanie następujących punktów:

1. obliczenie wskaźników zmian poziomów RD

2. obliczenie średnich wskaźników ROW

3.identyfikacja głównego trendu serii, budowanie modeli trendów

4. ocena autokorelacji w RD, konstrukcja modeli autoregresyjnych

5. Korelacja RD (badanie powiązań pomiędzy szeregami m/y DR)

6. Prognozowanie drogi kołowania.

35. Wskaźniki zmian poziomów szeregów czasowych .

W ogólna perspektywa RowD można przedstawić:

y – poziom DR, t – moment lub okres czasu, do którego należy poziom (wskaźnik), n – długość szeregu DR (liczba okresów). badając szereg dynamiki, oblicza się następujące wskaźniki: 1. wzrost bezwzględny, 2. współczynnik wzrostu (tempo wzrostu), 3. przyspieszenie, 4. współczynnik wzrostu (tempo wzrostu), 5. całkowita wartość wzrost o 1%. Obliczanymi wskaźnikami mogą być: 1. łańcuchowy – uzyskiwany poprzez porównanie każdego poziomu szeregu z bezpośrednio poprzedzającym go, 2. podstawowy – uzyskiwany poprzez porównanie z poziomem wybranym jako podstawa porównania (o ile nie określono inaczej, I poziom za podstawę przyjmuje się szereg). 1. Łańcuch bezwzględnych wzrostów:. Pokazuje, ile mniej więcej. Bezwzględne wzrosty łańcuchowe nazywane są wskaźnikami tempa zmian poziomów szereg czasowy. Podstawowy wzrost bezwzględny: . Jeżeli poziomy serii są wskaźnikami względnymi wyrażonymi w %, wówczas bezwzględny wzrost wyraża się w punktach zmiany. 2. tempo wzrostu (tempo wzrostu): Oblicza się go jako stosunek poziomów szeregu do poziomów bezpośrednio poprzedzających (współczynniki wzrostu łańcucha) lub do poziomu przyjętego za podstawę porównania (podstawowe współczynniki wzrostu): . Charakteryzuje, ile razy każdy poziom serii > lub< предшествующего или базисного. На основе коэффициентов роста рассчитываются темпы роста. Это коэффициенты роста, выраженные в %ах: 3. na podstawie bezwzględnych wzrostów obliczany jest wskaźnik - przyspieszenie wzrostu absolutnego: . Przyspieszenie to bezwzględny wzrost bezwzględnych wzrostów. Ocenia, jak zmieniają się same zyski, niezależnie od tego, czy są stabilne, czy przyspieszają (rosną). 4. tempo wzrostu jest stosunkiem wzrostu do bazy porównania. Wyrażone w %: ; . Stopa wzrostu to stopa wzrostu minus 100%. Pokazuje, jaki procent danego poziomu szeregu wynosi > lub< предшествующего либо базисного. 5. абсолютное значение 1% прироста. Рассчитывается как отношение абсолютного прироста к темпу прироста, т.е.: - сотая доля предыдущего уровня. Все эти показатели рассчитываются для оценки степени изменения уровней ряда. Цепные коэффициенты и темпы роста называются показателями интенсивности изменения уровней ДРядов.

2. Obliczanie średnich wskaźników RD Obliczane są średnie poziomy wierszy, średnie bezwzględne wzrosty, średnie stopy wzrostu i średnie stopy wzrostu. Wskaźniki średnie obliczane są w celu podsumowania informacji i umożliwienia porównania poziomów i wskaźników ich zmiany w różnych szeregach. 1. poziom środkowego rzędu a) dla przedziałowych szeregów czasowych oblicza się przy użyciu prostej średniej arytmetycznej: , gdzie n jest liczbą poziomów w szeregu czasowym; b) dla serii momentów średni poziom oblicza się za pomocą specjalnego wzoru, który nazywa się średnią chronologiczną: . 2. średni bezwzględny wzrost obliczone na podstawie bezwzględnych wzrostów łańcucha w oparciu o prostą średnią arytmetyczną:

. 3. Średnie tempo wzrostu obliczone na podstawie współczynników wzrostu łańcucha przy zastosowaniu wzoru średniej geometrycznej: . Komentując średnie wskaźniki szeregu DR należy wskazać 2 punkty: okres charakteryzujący analizowany wskaźnik oraz przedział czasu, dla którego zbudowano szereg DR. 4. Średnie tempo wzrostu: . 5. średnie tempo wzrostu: .

Analiza regresji to statystyczna metoda badań, która pozwala wykazać zależność konkretnego parametru od jednej lub większej liczby zmiennych niezależnych. W erze przedkomputerowej jego użycie było dość trudne, szczególnie w przypadku dużych ilości danych. Dziś, nauczywszy się budować regresję w Excelu, możesz rozwiązać złożone problemy statystyczne w ciągu zaledwie kilku minut. Poniżej konkretne przykłady z dziedziny ekonomii.

Rodzaje regresji

Samo to pojęcie zostało wprowadzone do matematyki w 1886 roku. Regresja ma miejsce:

  • liniowy;
  • paraboliczny;
  • stateczny;
  • wykładniczy;
  • hiperboliczny;
  • wskazujący;
  • logarytmiczny.

Przykład 1

Rozważmy problem określenia zależności liczby członków zespołu, którzy odeszli, od przeciętnego wynagrodzenia w 6 przedsiębiorstwach przemysłowych.

Zadanie. W sześciu przedsiębiorstwach analizowaliśmy średnią miesięczną wynagrodzenie oraz liczbę pracowników, którzy odeszli z powodu fakultatywnie. W formie tabelarycznej mamy:

Liczba osób, które zrezygnowały

Wynagrodzenie

30 000 rubli

35 000 rubli

40 000 rubli

45 000 rubli

50 000 rubli

55 000 rubli

60 000 rubli

Dla zadania określenia zależności liczby odchodzących pracowników od przeciętnego wynagrodzenia w 6 przedsiębiorstwach model regresji ma postać równania Y = a 0 + a 1 x 1 +...+a k x k, gdzie x i są zmienne wpływające, a i to współczynniki regresji, a k to liczba czynników.

W przypadku tego problemu Y jest wskaźnikiem odchodzenia pracowników, a czynnikiem wpływającym jest wynagrodzenie, które oznaczamy przez X.

Wykorzystanie możliwości procesora arkuszy kalkulacyjnych Excel

Analizę regresji w programie Excel należy poprzedzić zastosowaniem wbudowanych funkcji do istniejących danych tabelarycznych. Jednak do tych celów lepiej jest skorzystać z bardzo przydatnego dodatku „Analytic Pack”. Aby go aktywować, potrzebujesz:

  • z zakładki „Plik” przejdź do sekcji „Opcje”;
  • w oknie, które zostanie otwarte, wybierz wiersz „Dodatki”;
  • kliknij przycisk „Przejdź” znajdujący się poniżej, po prawej stronie linii „Zarządzanie”;
  • zaznacz pole przy nazwie „Pakiet analityczny” i potwierdź swoje działania klikając „OK”.

Jeśli wszystko zostało wykonane poprawnie, wymagany przycisk pojawi się po prawej stronie zakładki „Dane”, znajdującej się nad arkuszem Excel.

w Excelu

Teraz, gdy mamy pod ręką wszystkie niezbędne wirtualne narzędzia do przeprowadzania obliczeń ekonometrycznych, możemy przystąpić do rozwiązywania naszego problemu. Dla tego:

  • kliknąć na przycisk „Analiza danych”;
  • w oknie, które zostanie otwarte, kliknij przycisk „Regresja”;
  • w zakładce, która się pojawi, wprowadź zakres wartości dla Y (liczba odchodzących pracowników) i dla X (ich wynagrodzenia);
  • Nasze działania potwierdzamy wciśnięciem przycisku „Ok”.

W rezultacie program automatycznie wypełni nowy arkusz kalkulacyjny danymi analizy regresji. Notatka! Excel umożliwia ręczne ustawienie preferowanej w tym celu lokalizacji. Może to być na przykład ten sam arkusz, w którym znajdują się wartości Y i X, lub nawet nowy skoroszyt specjalnie zaprojektowany do przechowywania takich danych.

Analiza wyników regresji dla R-kwadrat

W programie Excel dane uzyskane podczas przetwarzania danych w rozważanym przykładzie mają postać:

Przede wszystkim należy zwrócić uwagę na wartość R-kwadrat. Reprezentuje współczynnik determinacji. W tym przykładzie R-kwadrat = 0,755 (75,5%), czyli obliczone parametry modelu wyjaśniają zależność pomiędzy rozpatrywanymi parametrami w 75,5%. Im wyższa wartość współczynnika determinacji, tym lepiej wybrany model jest dostosowany do konkretnego zadania. Za prawidłowy opisuje się sytuację rzeczywistą, gdy wartość R-kwadrat jest większa niż 0,8. Jeśli R-kwadrat<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

Analiza szans

Liczba 64,1428 pokazuje, jaka będzie wartość Y, jeśli wszystkie zmienne xi w rozważanym modelu zostaną wyzerowane. Inaczej mówiąc, można postawić tezę, że na wartość analizowanego parametru wpływają także inne czynniki, które nie są opisane w konkretnym modelu.

Kolejny współczynnik -0,16285, znajdujący się w komórce B18, pokazuje wagę wpływu zmiennej X na Y. Oznacza to, że przeciętne miesięczne wynagrodzenie pracowników w rozpatrywanym modelu wpływa na liczbę osób rezygnujących z wagi -0,16285, tj. stopień jego wpływu jest całkowicie niewielki. Znak „-” wskazuje, że współczynnik jest ujemny. To oczywiste, bo każdy wie, że im wyższe wynagrodzenie w przedsiębiorstwie, tym mniej osób wyraża chęć rozwiązania umowy o pracę lub odejścia.

Regresja wielokrotna

Termin ten odnosi się do równania zależności z kilkoma zmiennymi niezależnymi postaci:

y=f(x 1 +x 2 +…x m) + ε, gdzie y jest charakterystyką wypadkową (zmienna zależna), a x 1, x 2,…x m to charakterystyka czynnikowa (zmienne niezależne).

Oszacowanie parametrów

W przypadku regresji wielokrotnej (MR) przeprowadza się ją metodą najmniejszych kwadratów (OLS). Dla równań liniowych postaci Y = a + b 1 x 1 +…+b m x m + ε konstruujemy układ równań normalnych (patrz niżej)

Aby zrozumieć zasadę tej metody, rozważmy przypadek dwuczynnikowy. Mamy wówczas sytuację opisaną wzorem

Stąd otrzymujemy:

gdzie σ jest wariancją odpowiedniej cechy odzwierciedloną w indeksie.

OLS ma zastosowanie do równania MR w znormalizowanej skali. W tym przypadku otrzymujemy równanie:

w którym t y, t x 1, … t xm są zmiennymi standaryzowanymi, dla których wartości średnie są równe 0; β i to standaryzowane współczynniki regresji, a odchylenie standardowe wynosi 1.

Należy pamiętać, że wszystkie β i w tym przypadku są określone jako znormalizowane i scentralizowane, dlatego ich porównanie między sobą uważa się za prawidłowe i dopuszczalne. Ponadto zwyczajowo selekcjonuje się czynniki poprzez odrzucanie tych o najniższych wartościach βi.

Problem z użyciem równania regresji liniowej

Załóżmy, że mamy tabelę dynamiki cen konkretnego produktu N w ciągu ostatnich 8 miesięcy. Należy podjąć decyzję o celowości zakupu jego partii w cenie 1850 rubli/t.

numer miesiąca

nazwa miesiąca

cena produktu N

1750 rubli za tonę

1755 rubli za tonę

1767 rubli za tonę

1760 rubli za tonę

1770 rubli za tonę

1790 rubli za tonę

1810 rubli za tonę

1840 rubli za tonę

Aby rozwiązać ten problem w edytorze arkuszy kalkulacyjnych Excel, należy skorzystać z narzędzia „Analiza danych”, znanego już z przedstawionego powyżej przykładu. Następnie wybierz sekcję „Regresja” i ustaw parametry. Należy pamiętać, że w polu „Przedział wejściowy Y” należy wpisać zakres wartości zmiennej zależnej (w tym przypadku ceny towarów w poszczególnych miesiącach roku), a w „Przedział wejściowy X” - dla zmiennej niezależnej (numer miesiąca). Potwierdź akcję, klikając „OK”. Na nowym arkuszu (jeśli tak wskazano) uzyskujemy dane do regresji.

Korzystając z nich konstruujemy równanie liniowe postaci y=ax+b, gdzie parametry a i b są współczynnikami prostej z nazwą numeru miesiąca oraz współczynnikami i liniami „przecięcia Y” z arkusza z wyniki analizy regresji. Zatem równanie regresji liniowej (LR) dla zadania 3 zapisuje się jako:

Cena produktu N = 11,714* numer miesiąca + 1727,54.

lub w notacji algebraicznej

y = 11,714 x + 1727,54

Analiza wyników

Aby zdecydować, czy otrzymane równanie regresji liniowej jest adekwatne, stosuje się współczynniki korelacji wielokrotnej (MCC) i determinacji, a także test Fishera i test t-Studenta. W arkuszu kalkulacyjnym Excel z wynikami regresji nazywane są one odpowiednio statystyką wielokrotną R, statystyką R-kwadrat, statystyką F i statystyką t.

KMC R umożliwia ocenę bliskości związku probabilistycznego pomiędzy zmiennymi niezależnymi i zależnymi. Jego wysoka wartość wskazuje na dość silny związek pomiędzy zmiennymi „Numer miesiąca” i „Cena produktu N w rublach za 1 tonę”. Jednak natura tej zależności pozostaje nieznana.

Kwadrat współczynnika determinacji R2 (RI) jest liczbową charakterystyką proporcji całkowitego rozrzutu i pokazuje rozrzut której części danych eksperymentalnych, tj. wartości zmiennej zależnej odpowiadają równaniu regresji liniowej. W rozpatrywanym problemie wartość ta wynosi 84,8%, co oznacza, że ​​dane statystyczne są opisywane z dużą dokładnością przez wynikową SD.

Statystyka F, zwana także testem Fishera, służy do oceny istotności zależności liniowej, obalając lub potwierdzając hipotezę o jej istnieniu.

(Test Studenta) pomaga ocenić istotność współczynnika przy nieznanym lub wolnym członie zależności liniowej. Jeżeli wartość testu t > tcr, wówczas hipoteza o nieistotności wolnego składnika równania liniowego zostaje odrzucona.

W rozpatrywanym problemie dla terminu wolnego, korzystając z narzędzi Excela, uzyskano, że t = 169,20903, a p = 2,89E-12, czyli mamy zerowe prawdopodobieństwo, że poprawna hipoteza o nieistotności terminu wolnego zostanie odrzucona . Dla współczynnika dla nieznanego t=5,79405 i p=0,001158. Innymi słowy, prawdopodobieństwo odrzucenia prawidłowej hipotezy o nieistotności współczynnika dla niewiadomej wynosi 0,12%.

Można zatem argumentować, że otrzymane równanie regresji liniowej jest wystarczające.

Problem możliwości nabycia pakietu akcji

Regresję wielokrotną w programie Excel wykonuje się przy użyciu tego samego narzędzia analizy danych. Rozważmy konkretny problem aplikacji.

Zarząd spółki NNN musi podjąć decyzję o celowości zakupu 20% udziałów w MMM JSC. Koszt pakietu (SP) to 70 milionów dolarów amerykańskich. Specjaliści NNN zebrali dane na temat podobnych transakcji. Postanowiono wycenić wartość pakietu akcji według takich parametrów, wyrażonych w milionach dolarów amerykańskich, jak:

  • zobowiązania (VK);
  • roczny wolumen obrotu (VO);
  • należności (VD);
  • koszt środków trwałych (COF).

Dodatkowo wykorzystuje się parametr zaległości płacowych przedsiębiorstwa (V3 P) w tysiącach dolarów amerykańskich.

Rozwiązanie wykorzystujące procesor arkuszy kalkulacyjnych Excel

Przede wszystkim należy utworzyć tabelę danych źródłowych. To wygląda tak:

  • wywołaj okno „Analiza danych”;
  • wybierz sekcję „Regresja”;
  • W polu „Przedział wejściowy Y” należy wpisać zakres wartości zmiennych zależnych z kolumny G;
  • Kliknij na ikonę z czerwoną strzałką znajdującą się po prawej stronie okna „Przedział wprowadzania X” i zaznacz na arkuszu zakres wszystkich wartości z kolumn B, C, D, F.

Zaznacz element „Nowy arkusz” i kliknij „OK”.

Uzyskaj analizę regresji dla zadanego problemu.

Badanie wyników i wnioski

„Zbieramy” równanie regresji z zaokrąglonych danych przedstawionych powyżej w arkuszu kalkulacyjnym Excel:

SP = 0,103*SOF + 0,541*VO - 0,031*VK +0,405*VD +0,691*VZP - 265,844.

W bardziej znanej formie matematycznej można to zapisać jako:

y = 0,103*x1 + 0,541*x2 - 0,031*x3 +0,405*x4 +0,691*x5 - 265,844

Dane dla MMM SA przedstawia tabela:

Podstawiając je do równania regresji, otrzymujemy liczbę 64,72 miliona dolarów amerykańskich. Oznacza to, że nie warto kupować akcji MMM JSC, gdyż ich wartość wynosząca 70 mln dolarów jest mocno zawyżona.

Jak widać, zastosowanie arkusza kalkulacyjnego Excel i równania regresji pozwoliło na podjęcie świadomej decyzji co do możliwości przeprowadzenia bardzo konkretnej transakcji.

Teraz już wiesz, czym jest regresja. Omówione powyżej przykłady Excela pomogą Ci rozwiązać praktyczne problemy z zakresu ekonometrii.



Nowość na stronie

>

Najbardziej popularny