Dom Dječija stomatologija Regresiona jednačina se koristi za testiranje statističke značajnosti. Procjena značaja jednačine regresije i njenih koeficijenata

Regresiona jednačina se koristi za testiranje statističke značajnosti. Procjena značaja jednačine regresije i njenih koeficijenata

Procjena značaja jednačine višestruka regresija

Konstrukcija empirijske regresione jednadžbe je početna faza ekonometrijske analize. Prva regresiona jednadžba konstruirana iz uzorka je vrlo rijetko zadovoljavajuća u smislu određenih karakteristika. Stoga sljedeći najvažniji zadatak Ekonometrijska analiza je test kvaliteta regresione jednadžbe. U ekonometriji je usvojena dobro uspostavljena šema za takvu provjeru.

Dakle, provjera statističkog kvaliteta procijenjene regresione jednačine se vrši pomoću sljedeća uputstva:

· provjera značaja jednačine regresije;

· pregled statistički značaj koeficijenti jednadžbe regresije;

· provjera svojstava podataka čija je izvodljivost pretpostavljena prilikom procjene jednačine (provjera izvodljivosti premisa OLS).

Testiranje značaja jednačine višestruke regresije, kao i uparene regresije, provodi se Fisherovim testom. IN u ovom slučaju(za razliku od regresije u paru) postavlja se nulta hipoteza H 0 da su svi koeficijenti regresije jednaki nuli ( b 1=0, b 2=0, … , b m=0). Fisherov kriterijum je određen sljedećom formulom:

Gdje Dčinjenica - varijansa faktora objašnjena regresijom, po jednom stepenu slobode; D ost - rezidualna disperzija po stepenu slobode; R 2- koeficijent višestruka odlučnost; T X u jednadžbi regresije (u paru linearna regresija T= 1); P - broj zapažanja.

Rezultirajuća vrijednost F-testa se upoređuje sa vrijednošću u tabeli na određenom nivou značajnosti. Ako je njegova stvarna vrijednost veća od vrijednosti u tabeli, onda je hipoteza Ali odbacuje se beznačajnost jednačine regresije, a prihvata se alternativna hipoteza o njenoj statističkoj značajnosti.

Koristeći Fisherov kriterij, možete procijeniti značaj ne samo regresione jednačine u cjelini, već i značaj dodatnog uključivanja svakog faktora u model. Takva procjena je neophodna kako se model ne bi opterećivao faktorima koji nemaju značajan uticaj na rezultat. Osim toga, budući da se model sastoji od više faktora, oni se u njega mogu uvoditi u različitim nizovima, a budući da postoji korelacija između faktora, značaj uključivanja istog faktora u model može varirati ovisno o redoslijedu u kojem se faktori se unose u njega.

Da bi se procijenila važnost uključivanja dodatnog faktora u model, izračunat je parcijalni Fisherov kriterij Fxi. Zasniva se na poređenju povećanja faktorske varijanse zbog uključivanja dodatnog faktora u model sa zaostalom varijansom po jednom stepenu slobode za regresiju kao celinu. Dakle, formula za izračunavanje privatni F-test jer će faktor imati sljedeći oblik:

Gdje R 2 yx 1 x 2… xi… xp - koeficijent višestruke determinacije za model punog skupa P faktori ; R 2 yx 1 x 2… x i -1 x i +1… xp- koeficijent višestruke determinacije za model koji ne uključuje faktor x i;P- broj zapažanja; T- broj parametara za faktore x u jednadžbi regresije.

Stvarna vrijednost Fišerovog parcijalnog testa se upoređuje sa tabelarnom na nivou značajnosti od 0,05 ili 0,1 i odgovarajućim brojevima stepeni slobode. Ako je stvarna vrijednost F xi premašuje F stol, zatim dodatno uključivanje faktora x i u model je statistički opravdan, a koeficijent „čiste“ regresije b i kod faktora x i statistički značajno. Ako F xi manje F stol, onda dodatno uključivanje faktora u model ne povećava značajno udio objašnjene varijacije u rezultatu y, te stoga njegovo uključivanje u model nema smisla, koeficijent regresije za ovaj faktor u ovom slučaju je statistički beznačajan.

Koristeći Fisherov parcijalni test, možete testirati značajnost svih regresijskih koeficijenata pod pretpostavkom da svaki odgovarajući faktor x i se u jednadžbu višestruke regresije unosi posljednji, a svi ostali faktori su već bili uključeni u model ranije.

Procjena značaja „čistih“ koeficijenata regresije b i By Studentov t test može se izvesti bez računanja privatnih F-kriterijumi. U ovom slučaju, kao i kod uparene regresije, formula se primjenjuje za svaki faktor

t bi = b i / m bi ,

Gdje b i- koeficijent “čiste” regresije sa faktorom x i ; m bi- standardna greška koeficijenta regresije b i .

Za procjenu značajnosti i značajnosti koeficijenta korelacije koristi se Studentov t-test.

Prosječna greška koeficijenta korelacije nalazi se pomoću formule:

N
a na osnovu greške izračunava se t-kriterijum:

Izračunata vrijednost t-testa se upoređuje sa tabeliranom vrijednošću koja se nalazi u Studentovoj tabeli raspodjele na nivou značajnosti od 0,05 ili 0,01 i broju stupnjeva slobode n-1. Ako je izračunata vrijednost t-testa veća od vrijednosti u tabeli, tada se koeficijent korelacije smatra značajnim.

U slučaju krivolinijskog odnosa, F-test se koristi za procjenu značaja korelacijske veze i jednačine regresije. Izračunava se po formuli:

ili

gdje je η odnos korelacije; n – broj zapažanja; m – broj parametara u jednadžbi regresije.

Izračunata F vrijednost se upoređuje sa tabeliranom za prihvaćeni nivo značajnosti α (0,05 ili 0,01) i brojeve stepena slobode k 1 =m-1 i k 2 =n-m. Ako izračunata F vrijednost prelazi tabelu, odnos se smatra značajnom.

Značajnost koeficijenta regresije utvrđuje se pomoću Studentovog t-testa, koji se izračunava pomoću formule:

gdje je σ 2 i i varijansa koeficijenta regresije.

Izračunava se po formuli:

gdje je k broj faktorskih karakteristika u jednadžbi regresije.

Koeficijent regresije se smatra značajnim ako je t a 1 ≥t cr. t cr se nalazi u tabeli kritičnih tačaka Studentove distribucije na prihvaćenom nivou značajnosti i broju stepena slobode k=n-1.

4.3 Korelaciona i regresijska analiza u Excelu

Napravimo korelaciju i regresionu analizu odnosa između prinosa i troškova rada po 1 kvintalu zrna. Da biste to učinili, otvorite Excel list i unesite vrijednosti faktorske karakteristike u ćelije A1:A30 prinos žitarica, u ćelijama B1:B30, vrijednost rezultirajuće karakteristike je trošak rada po 1 kvintalu zrna. U meniju Alati izaberite opciju Analiza podataka. Lijevim klikom na ovu stavku otvorit ćemo alat Regresija. Kliknite na dugme OK i dijaloški okvir Regresija će se pojaviti na ekranu. U polje Ulazni interval Y unesite vrijednosti rezultujuće karakteristike (istaknute ćelije B1:B30), u polje Input interval X unesite vrijednosti faktorske karakteristike (istaknute ćelije A1:A30). Označite nivo vjerovatnoće od 95% i odaberite Novi radni list. Kliknite na dugme OK. Na radnom listu se pojavljuje tabela “ZAKLJUČAK REZULTATA” koja prikazuje rezultate izračunavanja parametara regresione jednačine, koeficijenta korelacije i drugih pokazatelja koji vam omogućavaju da odredite značaj koeficijenta korelacije i parametara jednačine regresije.

ZAKLJUČAK REZULTATA

Statistika regresije

Množina R

R-kvadrat

Normalizirani R-kvadrat

Standardna greška

Zapažanja

Analiza varijanse

Značaj F

Regresija

Odds

Standardna greška

t-statistika

P-vrijednost

donjih 95%

Top 95%

Donjih 95,0%

Top 95,0%

Y-raskrsnica

Varijabla X 1

U ovoj tabeli, “Multiple R” je koeficijent korelacije, “R-squared” je koeficijent determinacije. “Koeficijenti: Y-presjek” - slobodni član regresione jednačine 2,836242; “Varijabla X1” – koeficijent regresije -0,06654. Tu su i vrijednosti Fisherovog F-testa 74,9876, Studentovog t-testa 14,18042, „Standardna greška 0,112121“, koje su neophodne za procjenu značaja koeficijenta korelacije, parametara jednačine regresije i cijele jednačine.

Na osnovu podataka u tabeli, konstruisaćemo jednadžbu regresije: y x ​​= 2,836-0,067x. Koeficijent regresije a 1 = -0,067 znači da se sa povećanjem prinosa zrna za 1 c/ha troškovi rada po 1 c zrna smanjuju za 0,067 čovjek-sati.

Koeficijent korelacije je r=0,85>0,7, stoga je veza između proučavanih karakteristika u ovoj populaciji bliska. Koeficijent determinacije r 2 =0,73 pokazuje da je 73% varijacije efektivnog svojstva (troškovi rada po 1 kvintalu zrna) uzrokovano djelovanjem faktorskog svojstva (prinos zrna).

U tabeli kritičnih tačaka Fisher-Snedecorove distribucije nalazimo kritičnu vrijednost F-testa na nivou značajnosti 0,05 i broju stupnjeva slobode k 1 =m-1=2-1=1 i k 2 =n-m=30-2=28, jednako je 4,21. Budući da je izračunata vrijednost kriterija veća od tabelarne (F=74,9896>4,21), jednačina regresije se smatra značajnom.

Da bismo procijenili značaj koeficijenta korelacije, izračunajmo Studentov t-test:

IN
U tabeli kritičnih tačaka Studentove distribucije nalazimo kritičnu vrednost t-testa na nivou značajnosti 0,05 i broj stepena slobode n-1=30-1=29, jednak je 2,0452. Pošto je izračunata vrijednost veća od vrijednosti u tabeli, koeficijent korelacije je značajan.

Procjena značaja parametara regresijske jednačine

Značaj parametara jednačine linearne regresije procjenjuje se pomoću Studentovog testa:

Ako t calc. > t cr, tada se prihvata glavna hipoteza ( H o), što ukazuje na statističku značajnost parametara regresije;

Ako t calc.< t cr, tada je alternativna hipoteza prihvaćena ( H 1), što ukazuje na statističku beznačajnost parametara regresije.

Gdje m a , m b– standardne greške parametara a I b:

(2.19)

(2.20)

Kritična (tabelarna) vrijednost kriterija nalazi se pomoću statističkih tabela Studentove distribucije (Dodatak B) ili korištenjem tabela Excel(odjeljak čarobnjaka „Statistička” funkcija):

t cr = STUDARSOBR( α=1-P; k=n-2), (2.21)

Gdje k=n-2 takođe predstavlja broj stepeni slobode .

Procjena statističke značajnosti može se primijeniti i na koeficijent linearne korelacije

Gdje gospodin– standardna greška u određivanju vrijednosti koeficijenta korelacije r yx

(2.23)

Ispod su opcije za zadatke za praktične i laboratorijski rad na temu drugog odeljka.

Pitanja za samotestiranje za odjeljak 2

1. Navedite glavne komponente ekonometrijskog modela i njihovu suštinu.

2. Glavni sadržaj faza ekonometrijskog istraživanja.

3. Suština pristupa određivanju parametara linearne regresije.

4. Suština i osobenosti primjene metode najmanjih kvadrata prilikom određivanja parametara jednadžbe regresije.

5. Koji indikatori se koriste za procjenu bliskosti odnosa između faktora koji se proučavaju?

6. Esencija linearni koeficijent korelacije.

7. Suština koeficijenta determinacije.

8. Suština i glavne karakteristike postupaka za procjenu adekvatnosti (statistički značaj) regresijski modeli.

9. Procjena adekvatnosti modela linearne regresije koeficijentom aproksimacije.

10. Suština pristupa procjeni adekvatnosti regresionih modela primjenom Fisherovog kriterija. Definicija empirijskog i kritične vrijednosti kriterijum.

11. Suština koncepta „analize varijanse“ u odnosu na ekonometrijska istraživanja.

12. Suština i glavne karakteristike postupka za procjenu značaja parametara linearna jednačina regresija.

13. Osobine korištenja Studentove distribucije pri procjeni značajnosti parametara jednačine linearne regresije.

14. Koji je zadatak predviđanja pojedinačnih vrijednosti socio-ekonomskog fenomena koji se proučava?

1. Konstruisati korelaciono polje i formulisati pretpostavku o obliku jednačine za odnos faktora koji se proučavaju;

2. Zapisati osnovne jednačine metode najmanjih kvadrata, izvršiti potrebne transformacije, napraviti tabelu za međuproračune i odrediti parametre jednačine linearne regresije;

3. Provjerite ispravnost izvršenih proračuna pomoću standardne procedure i funkcije tabele Excel.

4. Analizirati rezultate, formulisati zaključke i preporuke.

1. Izračunavanje vrijednosti koeficijenta linearne korelacije;

2. Pravljenje stola analiza varijanse;

3. Procjena koeficijenta determinacije;

4. Provjerite ispravnost proračuna koristeći standardne procedure i funkcije Excel tabela.

5. Analizirati rezultate, formulisati zaključke i preporuke.

4. Izvršiti opštu ocjenu adekvatnosti odabrane regresione jednačine;

1. Procjena adekvatnosti jednačine na osnovu vrijednosti koeficijenta aproksimacije;

2. Procjena adekvatnosti jednačine na osnovu vrijednosti koeficijenta determinacije;

3. Procjena adekvatnosti jednačine po Fišerovom kriterijumu;

4. Izvršiti opštu ocjenu adekvatnosti parametara regresione jednačine;

5. Provjerite ispravnost proračuna koristeći standardne procedure i funkcije Excel tabela.

6. Analizirati rezultate, formulisati zaključke i preporuke.

1. Korišćenje standardnih procedura čarobnjaka za funkcije Excel tabela (iz odeljka „Matematički” i „Statistički”);

2. Priprema podataka i karakteristike korištenja funkcije LINEST;

3. Priprema podataka i karakteristike korištenja funkcije “PREDIKCIJA”.

1. Korištenje standardnih procedura paketa za analizu podataka iz Excel tabela;

2. Priprema podataka i karakteristike primjene procedure „REGRESIJA“;

3. Interpretacija i sinteza podataka iz tabele regresione analize;

4. Interpretacija i sinteza podataka iz analize tabele varijanse;

5. Interpretacija i generalizacija podataka iz tabele za procjenu značajnosti parametara regresione jednačine;

Prilikom izvođenja laboratorijskog rada na osnovu jedne od opcija, morate izvršiti sljedeće specifične zadatke:

1. Odabrati oblik jednačine za odnos faktora koji se proučavaju;

2. Odrediti parametre regresione jednačine;

3. Procijeniti blisku vezu između faktora koji se proučavaju;

4. Procijeniti adekvatnost odabrane regresione jednačine;

5. Procijeniti statističku značajnost parametara regresione jednačine.

6. Provjerite ispravnost proračuna koristeći standardne procedure i funkcije Excel tabela.

7. Analizirati rezultate, formulisati zaključke i preporuke.

Zadaci za praktičan i laboratorijski rad na temu “Uparena linearna regresija i korelacija u ekonometrijskom istraživanju”.

Opcija 1 Opcija 2 Opcija 3 Opcija 4 Opcija 5
x y x y x y x y x y
Opcija 6 Opcija 7 Opcija 8 Opcija 9 Opcija 10
x y x y x y x y x y

U socio-ekonomskim istraživanjima često je potrebno raditi u ograničenoj populaciji ili sa podacima iz uzorka. Dakle, nakon matematičkih parametara regresione jednačine, potrebno ih je i jednadžbu u cjelini procijeniti na statističku značajnost, tj. potrebno je osigurati da se rezultirajuća jednačina i njeni parametri formiraju pod utjecajem neslučajnih faktora.

Prije svega, procjenjuje se statistička značajnost jednačine u cjelini. Evaluacija se obično provodi korištenjem Fisherovog F testa. Proračun F-kriterijuma zasniva se na pravilu sabiranja varijansi. Naime, opća disperziona karakteristika-rezultat = faktor disperzija + rezidualna disperzija.

Stvarna cijena

Teorijska cijena
Konstruiranjem regresione jednadžbe možete izračunati teorijsku vrijednost karakteristike rezultata, tj. izračunato pomoću regresione jednadžbe uzimajući u obzir njene parametre.

Ove vrijednosti će karakterizirati rezultat-atribut, formiran pod utjecajem faktora uključenih u analizu.

Uvijek postoje neslaganja (reziduali) između stvarnih vrijednosti atributa rezultata i onih izračunatih na osnovu jednadžbe regresije, zbog utjecaja drugih faktora koji nisu uključeni u analizu.

Razlika između teorijske i stvarne vrijednosti atributa rezultata naziva se reziduali. Opća varijacija rezultatne osobine:

Varijacija atributa rezultata, uzrokovana varijacijama u karakteristikama faktora uključenih u analizu, procjenjuje se poređenjem teorijskih vrijednosti rezultata. karakteristika i njene prosječne vrijednosti. Preostala varijacija kroz poređenje teoretskih i stvarnih vrijednosti rezultirajuće karakteristike. Ukupna varijansa, rezidualna i stvarna imaju različite brojeve stupnjeva slobode.

general, P- broj jedinica u populaciji koja se proučava

stvarni, P- broj faktora uključenih u analizu

Ostatak

Fišerov F test se izračunava kao odnos prema , i izračunava se za jedan stepen slobode.

Korištenje Fisher F testa kao procjene statističke važnosti regresione jednačine je vrlo logično. - ovo je rezultat. karakteristika, određena faktorima uključenim u analizu, tj. ovo je proporcija objašnjenog rezultata. sign. - ovo je (varijacija) atributa rezultata uzrokovana faktorima čiji se uticaj ne uzima u obzir, tj. nije uključeno u analizu.

To. F-test je dizajniran za evaluaciju značajan višak preko . Ako nije značajno niži od , a još više ako prelazi , onda analiza ne uključuje one faktore koji stvarno utiču na atribut rezultata.

Fisherov F test je tabelarno, stvarna vrijednost se upoređuje sa tabeliranom vrijednošću. Ako je , tada se jednačina regresije smatra statistički značajnom. Ako, naprotiv, jednačina nije statistički značajna i ne može se koristiti u praksi, značajnost jednačine u cjelini ukazuje na statističku značajnost pokazatelja korelacije.

Nakon procjene jednačine u cjelini, potrebno je ocijeniti statističku značajnost parametara jednačine. Ova procjena se provodi korištenjem Studentove t-statistike. T-statistika se izračunava kao omjer parametara jednadžbe (modulo) i njihove standardne srednje kvadratne greške. Ako se procjenjuje jednofaktorski model, tada se izračunavaju 2 statistike.

U svim kompjuterskim programima izračunavanje standardne greške i t-statistike za parametre se vrši uz proračun samih parametara. Tabelarno prikazana T-statistika. Ako je vrijednost , tada se parametar smatra statistički značajnim, tj. nastala pod uticajem neslučajnih faktora.

Izračunavanje t-statistike u suštini znači testiranje nulte hipoteze da je parametar beznačajan, tj. njegova jednakost na nulu. Jednofaktorskim modelom procjenjuju se 2 hipoteze: i

Nivo značajnosti prihvatanja nulte hipoteze zavisi od nivoa prihvaćene verovatnoća poverenja. Dakle, ako istraživač postavi nivo vjerovatnoće na 95%, izračunat će se nivo značajnosti prihvatljivosti, dakle, ako je nivo značajnosti ≥ 0,05, onda je prihvaćen i parametri se smatraju statistički beznačajnim. Ako je , tada se alternativa odbija i prihvaća: i .

Statistički softverski paketi takođe daju nivo značajnosti za prihvatanje nulte hipoteze. Procjena značaja regresione jednadžbe i njenih parametara može dati sljedeće rezultate:

Prvo, jednačina u cjelini je značajna (prema F-testu) i svi parametri jednačine su također statistički značajni. To znači da se rezultirajuća jednačina može koristiti za uzimanje oba upravljačke odluke, i za predviđanje.

Drugo, prema F-testu, jednačina je statistički značajna, ali barem jedan od parametara jednačine nije značajan. Jednačina se može koristiti za donošenje upravljačkih odluka u vezi sa faktorima koji se analiziraju, ali se ne može koristiti za predviđanje.

Treće, jednačina nije statistički značajna, odnosno prema F-testu jednačina je značajna, ali svi parametri rezultirajuće jednačine nisu značajni. Jednačina se ne može koristiti ni u koju svrhu.

Da bi se jednačina regresije prepoznala kao model odnosa između atributa rezultat i faktora atributa, potrebno je da svi najvažniji faktori, određujući rezultat, tako da smislena interpretacija parametara jednačine odgovara teorijski zasnovanim vezama u fenomenu koji se proučava. Koeficijent determinacije R2 mora biti > 0,5.

Prilikom konstruisanja jednačine višestruke regresije, preporučljivo je izvršiti procjenu korištenjem takozvanog prilagođenog koeficijenta determinacije (R 2). Vrijednost R2 (kao i korelacija) raste sa brojem faktora uključenih u analizu. Vrijednost koeficijenta je posebno precijenjena u malim populacijama. Da bi se suzbio negativan uticaj, R 2 i korelacije se prilagođavaju uzimajući u obzir broj stepeni slobode, tj. broj slobodno promjenjivih elemenata kada su uključeni određeni faktori.

Prilagođeni koeficijent determinacije

P– veličina populacije/broj opažanja

k– broj faktora uključenih u analizu

n-1– broj stepeni slobode

(1-R 2)- vrijednost ostatka/neobjašnjive varijanse rezultirajuće karakteristike

Uvek manje R 2. na osnovu može se uporediti procjene jednačina sa različiti brojevi analiziranih faktora.

34. Problemi proučavanja vremenskih serija.

Vremenske serije se nazivaju vremenske serije ili vremenske serije. Vremenska serija je vremenski poređani niz indikatora koji karakterišu određenu pojavu (obim BDP-a od 90 do 98). Svrha proučavanja vremenskih serija je identifikovanje obrasca razvoja fenomena koji se proučava (glavni trend) i prognoza na osnovu toga. Iz definicije RD proizilazi da se svaka serija sastoji od dva elementa: vremena t i nivoa serije (one specifične vrijednosti indikatora na osnovu kojih se RD serija gradi). DR serije mogu biti 1) trenutak - serije čiji se pokazatelji evidentiraju u određenom trenutku, na određeni datum, 2) interval - serije čiji se pokazatelji dobijaju za određeni vremenski period (1. populacija Sankt Peterburg, 2. obim BDP-a za period). Podjela serija na momentne i intervalne je neophodna, jer to određuje specifičnosti izračunavanja nekih pokazatelja DR serija. Sumiranje nivoa intervalne serije daje rezultat koji se može interpretirati sa smislom, što se ne može reći o sabiranju nivoa trenutnih serija, budući da potonji sadrže ponovljeno brojanje. Najvažniji problem u analizi vremenskih serija je problem uporedivosti nivoa serija. Ovaj koncept je veoma raznolik. Nivoi moraju biti uporedivi u pogledu metoda obračuna iu pogledu teritorije i obuhvata populacijskih jedinica. Ako je serija DR konstruisana u terminima troškova, onda svi nivoi moraju biti prikazani ili izračunati u uporedivim cenama. Prilikom konstruiranja intervalnih serija, nivoi moraju karakterizirati identične periode vremena. Kada se konstruiše serija trenutaka, nivoi se moraju evidentirati na isti datum. DR serija može biti potpuna ili nepotpuna. Nepotpuni redovi se koriste u službenim publikacijama (1980,1985,1990,1995,1996,1997,1998,1999...). Sveobuhvatna analiza RD uključuje proučavanje sljedećih tačaka:

1. izračunavanje indikatora promjena nivoa RD

2. izračunavanje prosječnih RD indikatora

3. identifikacija glavnog trenda serije, izgradnja trend modela

4. procjena autokorelacije u RD, konstrukcija autoregresivnih modela

5. RD korelacija (proučavanje veza između m/y DR serije)

6. predviđanje rulne staze.

35. Indikatori promjena nivoa vremenskih serija .

IN opšti pogled Red se može predstaviti:

y – nivo DR, t – trenutak ili vremenski period kojem nivo (indikator) pripada, n – dužina DR serije (broj perioda). pri proučavanju niza dinamike računaju se sljedeći pokazatelji: 1. apsolutni rast, 2. koeficijent rasta (stopa rasta), 3. ubrzanje, 4. koeficijent rasta (stopa rasta), 5. apsolutna vrijednost povećanje od 1%. Izračunati indikatori mogu biti: 1. lančani - dobijeni poređenjem svakog nivoa serije sa prethodnim, 2. osnovni - dobijeni poređenjem sa nivoom odabranim kao osnova za poređenje (osim ako nije posebno navedeno, 1. nivo serije serija se uzima kao osnova). 1. Apsolutna povećanja lanca:. Pokazuje koliko više ili manje. Lančana apsolutna povećanja nazivaju se indikatorima stope promjene nivoa vremenske serije. Osnovni apsolutni rast: . Ako su nivoi serije relativni indikatori izraženi u %, tada se apsolutno povećanje izražava u tačkama promjene. 2. stopa rasta (stopa rasta): Izračunava se kao omjer nivoa serije prema prethodnim (lančani koeficijenti rasta), odnosno prema nivou koji se uzima kao osnova poređenja (osnovni koeficijenti rasta): . Karakterizira koliko puta svaki nivo serije > ili< предшествующего или базисного. На основе коэффициентов роста рассчитываются темпы роста. Это коэффициенты роста, выраженные в %ах: 3. na osnovu apsolutnih povećanja, indikator se izračunava - ubrzanje apsolutnog rasta: . Ubrzanje je apsolutno povećanje apsolutnih povećanja. Procjenjuje kako se sami dobici mijenjaju, da li su stabilni ili se ubrzavaju (povećavaju). 4. stopa rasta je omjer rasta u odnosu na bazu poređenja. Izraženo u %: ; . Stopa rasta je stopa rasta minus 100%. Pokazuje koliki je % dati nivo reda > ili< предшествующего либо базисного. 5. абсолютное значение 1% прироста. Рассчитывается как отношение абсолютного прироста к темпу прироста, т.е.: - сотая доля предыдущего уровня. Все эти показатели рассчитываются для оценки степени изменения уровней ряда. Цепные коэффициенты и темпы роста называются показателями интенсивности изменения уровней ДРядов.

2. Izračunavanje prosječnih RD indikatora Izračunavaju se prosječni nivoi redova, prosječna apsolutna povećanja, prosječne stope rasta i prosječne stope rasta. Prosječni indikatori se izračunavaju kako bi se sumirale informacije i omogućilo upoređivanje nivoa i indikatora njihove promjene u različitim serijama. 1. nivo srednjeg reda a) za intervalne vremenske serije izračunava se korišćenjem jednostavne aritmetičke sredine: , gde je n broj nivoa u vremenskoj seriji; b) za trenutne serije, prosječni nivo se izračunava korištenjem specifične formule, koja se naziva hronološki prosjek: . 2. prosječno apsolutno povećanje izračunato na osnovu apsolutnih povećanja lanca na osnovu jednostavnog aritmetičkog prosjeka:

. 3. Prosječna stopa rasta izračunato na osnovu koeficijenata rasta lanca koristeći formulu geometrijske sredine: . Kada se komentarišu prosječni pokazatelji serije DR, potrebno je naznačiti 2 tačke: period koji karakteriše analizirani indikator i vremenski interval za koji je DR serija izgrađena. 4. Prosječna stopa rasta: . 5. prosječna stopa rasta: .

Regresiona analiza je statistička metoda istraživanja koja vam omogućava da pokažete ovisnost određenog parametra o jednoj ili više nezavisnih varijabli. U predkompjuterskoj eri, njegova upotreba je bila prilično teška, posebno kada su u pitanju velike količine podataka. Danas, nakon što ste naučili kako izgraditi regresiju u Excelu, možete riješiti složene statističke probleme za samo nekoliko minuta. U nastavku su dati konkretni primjeri iz oblasti ekonomije.

Vrste regresije

Ovaj koncept je uveden u matematiku 1886. Regresija se dešava:

  • linearno;
  • parabolični;
  • sedate;
  • eksponencijalni;
  • hiperbolično;
  • demonstrativna;
  • logaritamski.

Primjer 1

Razmotrimo problem utvrđivanja zavisnosti broja članova tima koji su odustali od prosječne plate u 6 industrijskih preduzeća.

Zadatak. U šest preduzeća analizirali smo prosječne mjesečne plate i broj zaposlenih koji su otišli zbog po volji. U tabelarnom obliku imamo:

Broj ljudi koji su odustali

Plata

30.000 rubalja

35.000 rubalja

40.000 rubalja

45.000 rubalja

50.000 rubalja

55.000 rubalja

60.000 rubalja

Za zadatak utvrđivanja zavisnosti broja radnika koji napuštaju rad od prosječne plate u 6 preduzeća, regresijski model ima oblik jednačine Y = a 0 + a 1 x 1 +...+a k x k, gdje su x i uticajne varijable, a i su koeficijenti regresije, a k je broj faktora.

Za ovaj problem Y je indikator otpuštanja zaposlenih, a faktor uticaja je plata koju označavamo sa X.

Korištenje mogućnosti Excel procesora proračunskih tablica

Regresionoj analizi u Excelu mora prethoditi primjena ugrađenih funkcija na postojeće tabelarne podatke. Međutim, u ove svrhe bolje je koristiti vrlo koristan dodatak „Analysis Pack“. Da biste ga aktivirali potrebno vam je:

  • sa kartice “Datoteka” idite na odjeljak “Opcije”;
  • u prozoru koji se otvori odaberite redak "Dodaci";
  • kliknite na dugme „Idi“ koje se nalazi ispod, desno od linije „Upravljanje“;
  • označite polje pored naziva „Paket analize“ i potvrdite svoje radnje klikom na „U redu“.

Ako je sve urađeno kako treba, potrebno dugme će se pojaviti na desnoj strani kartice „Podaci“, koja se nalazi iznad Excel radnog lista.

u Excelu

Sada kada imamo sve potrebne virtuelne alate pri ruci za izvođenje ekonometrijskih proračuna, možemo početi rješavati naš problem. Za ovo:

  • Kliknite na dugme „Analiza podataka“;
  • u prozoru koji se otvori kliknite na dugme "Regresija";
  • u kartici koja se pojavi unesite raspon vrijednosti za Y (broj zaposlenih koji su napustili) i za X (njihove plate);
  • Svoje radnje potvrđujemo pritiskom na dugme „Ok“.

Kao rezultat, program će automatski popuniti novu tabelu podacima regresione analize. Bilješka! Excel vam omogućava da ručno postavite željenu lokaciju za ovu svrhu. Na primjer, ovo može biti isti list na kojem se nalaze Y i X vrijednosti, ili čak nova radna knjiga posebno dizajnirana za pohranjivanje takvih podataka.

Analiza rezultata regresije za R-kvadrat

U Excelu podaci dobijeni tokom obrade podataka u razmatranom primjeru imaju oblik:

Prije svega, obratite pažnju na vrijednost R-kvadrata. Predstavlja koeficijent determinacije. U ovom primjeru, R-kvadrat = 0,755 (75,5%), tj. izračunati parametri modela objašnjavaju odnos između parametara koji se razmatraju za 75,5%. Što je veća vrijednost koeficijenta determinacije, to je odabrani model pogodniji za određeni zadatak. Smatra se da ispravno opisuje stvarnu situaciju kada je vrijednost R-kvadrata iznad 0,8. Ako je R-kvadrat<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

Analiza kvota

Broj 64.1428 pokazuje kolika će biti vrijednost Y ako se sve varijable xi u modelu koji razmatramo resetujemo na nulu. Drugim riječima, može se tvrditi da na vrijednost analiziranog parametra utiču i drugi faktori koji nisu opisani u konkretnom modelu.

Sledeći koeficijent -0,16285, koji se nalazi u ćeliji B18, pokazuje težinu uticaja varijable X na Y. To znači da prosečna mesečna plata zaposlenih u okviru modela koji se razmatra utiče na broj onih koji odustaju sa ponderom od -0,16285, tj. stepen njenog uticaja je potpuno mali. Znak "-" označava da je koeficijent negativan. To je očigledno, jer svi znaju da što je veća plata u preduzeću, to manje ljudi izražava želju za raskidom ugovora o radu ili davanjem otkaza.

Višestruka regresija

Ovaj termin se odnosi na jednadžbu odnosa sa nekoliko nezavisnih varijabli oblika:

y=f(x 1 +x 2 +…x m) + ε, gdje je y rezultantna karakteristika (zavisna varijabla), a x 1, x 2,…x m su faktorske karakteristike (nezavisne varijable).

Procjena parametara

Za višestruku regresiju (MR) provodi se metodom najmanjih kvadrata (OLS). Za linearne jednadžbe oblika Y = a + b 1 x 1 +…+b m x m + ε konstruiramo sistem normalnih jednačina (vidi dolje)

Da biste razumjeli princip metode, razmotrite slučaj sa dva faktora. Tada imamo situaciju opisanu formulom

Odavde dobijamo:

gdje je σ varijansa odgovarajuće karakteristike prikazane u indeksu.

OLS je primjenjiv na MR jednačinu na standardiziranoj skali. U ovom slučaju dobijamo jednačinu:

u kojima su t y, t x 1, … t xm standardizirane varijable, za koje su prosječne vrijednosti jednake 0; β i su standardizirani koeficijenti regresije, a standardna devijacija je 1.

Imajte na umu da su svi β i u ovom slučaju specificirani kao normalizirani i centralizirani, stoga se njihovo međusobno poređenje smatra ispravnim i prihvatljivim. Osim toga, uobičajeno je da se faktori odstranjuju odbacivanjem onih s najnižim vrijednostima βi.

Problem Korištenje jednadžbe linearne regresije

Pretpostavimo da imamo tabelu dinamike cijena za određeni proizvod N u posljednjih 8 mjeseci. Potrebno je donijeti odluku o preporučljivosti kupovine njegove serije po cijeni od 1850 rubalja/t.

broj mjeseca

naziv mjeseca

cijena proizvoda N

1750 rubalja po toni

1755 rubalja po toni

1767 rubalja po toni

1760 rubalja po toni

1770 rubalja po toni

1790 rubalja po toni

1810 rubalja po toni

1840 rubalja po toni

Da biste riješili ovaj problem u Excel procesoru proračunskih tablica, trebate koristiti alat „Analiza podataka“, već poznat iz gore prikazanog primjera. Zatim odaberite odjeljak "Regresija" i postavite parametre. Mora se imati na umu da se u polje „Input interval Y“ mora unijeti raspon vrijednosti za zavisnu varijablu (u ovom slučaju cijene za robu u određenim mjesecima u godini), au „Input interval X“ - za nezavisnu varijablu (broj mjeseca). Potvrdite radnju klikom na “OK”. Na novom listu (ako je tako naznačeno) dobijamo podatke za regresiju.

Koristeći ih, konstruišemo linearnu jednačinu oblika y=ax+b, gde su parametri a i b koeficijenti prave sa nazivom broja meseca i koeficijenti i prave „Y-presek“ sa lista sa rezultate regresione analize. Dakle, jednadžba linearne regresije (LR) za zadatak 3 se piše kao:

Cijena proizvoda N = 11.714* broj mjeseca + 1727.54.

ili u algebarskoj notaciji

y = 11,714 x + 1727,54

Analiza rezultata

Da bi se odlučilo da li je rezultirajuća jednačina linearne regresije adekvatna, koriste se koeficijenti višestruke korelacije (MCC) i determinacije, kao i Fisherov test i Student t test. U Excel tabeli sa rezultatima regresije oni se nazivaju višestruki R, R-kvadrat, F-statistika i t-statistika, respektivno.

KMC R omogućava procjenu bliskosti vjerovatnoće veze između nezavisnih i zavisnih varijabli. Njegova visoka vrijednost ukazuje na prilično jaku vezu između varijabli „Broj mjeseci“ i „Cijena proizvoda N u rubljama po 1 toni“. Međutim, priroda ovog odnosa ostaje nepoznata.

Kvadrat koeficijenta determinacije R2 (RI) je numerička karakteristika udjela ukupnog rasipa i pokazuje čiji dio eksperimentalnih podataka, tj. vrijednosti zavisne varijable odgovaraju jednadžbi linearne regresije. U problemu koji se razmatra, ova vrijednost je jednaka 84,8%, odnosno statistički podaci se opisuju sa visokim stepenom tačnosti rezultujućim SD.

F-statistika, koja se naziva i Fišerov test, koristi se za procenu značaja linearnog odnosa, pobijajući ili potvrđujući hipotezu o njegovom postojanju.

(Studentov test) pomaže da se proceni značaj koeficijenta sa nepoznatim ili slobodnim članom linearne veze. Ako je vrijednost t-testa > tcr, hipoteza o beznačajnosti slobodnog člana linearne jednačine se odbacuje.

U zadatku koji se razmatra za slobodni termin, korišćenjem Excel alata, dobijeno je da je t = 169,20903, a p = 2,89E-12, odnosno da imamo nultu verovatnoću da će tačna hipoteza o beznačajnosti slobodnog člana biti odbačena . Za koeficijent za nepoznatu t=5,79405, i p=0,001158. Drugim riječima, vjerovatnoća da će tačna hipoteza o beznačajnosti koeficijenta za nepoznatu biti odbačena je 0,12%.

Stoga se može tvrditi da je rezultirajuća jednačina linearne regresije adekvatna.

Problem izvodljivosti kupovine paketa akcija

Višestruka regresija u Excelu se izvodi pomoću istog alata za analizu podataka. Razmotrimo konkretan problem aplikacije.

Menadžment kompanije NNN mora odlučiti o preporučljivosti kupovine 20% udjela u MMM ad. Cijena paketa (SP) je 70 miliona američkih dolara. Stručnjaci NNN-a prikupili su podatke o sličnim transakcijama. Odlučeno je da se vrijednost udjela procijeni prema takvim parametrima, izraženim u milionima američkih dolara, kao što su:

  • obaveze prema dobavljačima (VK);
  • godišnji obim prometa (VO);
  • potraživanja (VD);
  • trošak osnovnih sredstava (COF).

Pored toga, koristi se parametar: zaostale plate preduzeća (V3 P) u hiljadama američkih dolara.

Rješenje korištenjem Excel procesora proračunskih tablica

Prije svega, trebate kreirati tabelu izvornih podataka. izgleda ovako:

  • pozovite prozor „Analiza podataka“;
  • odaberite odjeljak "Regresija";
  • U polje „Input interval Y“ unesite raspon vrijednosti zavisnih varijabli iz stupca G;
  • Kliknite na ikonu sa crvenom strelicom desno od prozora „Input interval X“ i označite raspon svih vrijednosti ​​iz kolona B, C, D, F na listu.

Označite stavku „Novi radni list“ i kliknite na „U redu“.

Nabavite regresionu analizu za dati problem.

Studija rezultata i zaključaka

"Skupljamo" jednadžbu regresije iz zaokruženih podataka prikazanih gore u Excel tabeli:

SP = 0,103*SOF + 0,541*VO - 0,031*VK +0,405*VD +0,691*VZP - 265,844.

U poznatijem matematičkom obliku, može se napisati kao:

y = 0,103*x1 + 0,541*x2 - 0,031*x3 +0,405*x4 +0,691*x5 - 265,844

Podaci za MMM dd prikazani su u tabeli:

Zamijenivši ih u jednadžbu regresije, dobijamo cifru od 64,72 miliona američkih dolara. To znači da se akcije MMM ad ne vrede kupovati, jer je njihova vrednost od 70 miliona američkih dolara prilično naduvana.

Kao što vidite, upotreba Excel tabele i regresione jednačine omogućila je donošenje informisane odluke u vezi izvodljivosti vrlo specifične transakcije.

Sada znate šta je regresija. Primjeri u Excelu o kojima smo gore govorili pomoći će vam da riješite praktične probleme u oblasti ekonometrije.



Novo na sajtu

>

Najpopularniji