Domov Dětská stomatologie K testování statistické významnosti se používá regresní rovnice. Posouzení významu regresní rovnice a jejích koeficientů

K testování statistické významnosti se používá regresní rovnice. Posouzení významu regresní rovnice a jejích koeficientů

Posouzení významu rovnice vícenásobná regrese

Sestavení empirické regresní rovnice je počáteční fází ekonometrické analýzy. Úplně první regresní rovnice sestrojená ze vzorku je velmi zřídka uspokojivá z hlediska určitých charakteristik. Proto další nejdůležitější úkol Ekonometrická analýza je testem kvality regresní rovnice. V ekonometrii bylo přijato dobře zavedené schéma takového ověřování.

Kontrola statistické kvality odhadnuté regresní rovnice se tedy provádí pomocí následující pokyny:

· kontrola významnosti regresní rovnice;

· vyšetření statistická významnost koeficienty regresní rovnice;

· kontrola vlastností dat, jejichž proveditelnost byla předpokládána při odhadu rovnice (kontrola proveditelnosti prostor OLS).

Testování významnosti vícenásobné regresní rovnice, stejně jako párové regrese, se provádí pomocí Fisherova testu. V v tomto případě(na rozdíl od párové regrese) je předložena nulová hypotéza H 0že všechny regresní koeficienty jsou rovné nule ( b 1=0, b 2=0, … , b m=0). Fisherovo kritérium je určeno následujícím vzorcem:

Kde D fakt - rozptyl faktoru vysvětlený regresí, na jeden stupeň volnosti; D ost - zbytková disperze na stupeň volnosti; R 2- koeficient vícenásobné určení; T X v regresní rovnici (v páru lineární regrese T= 1); P - počet pozorování.

Výsledná hodnota F-testu se porovnává s tabulkovou hodnotou na určité hladině významnosti. Pokud je jeho skutečná hodnota větší než tabulková hodnota, pak hypotéza Ale je zamítnuta nevýznamnost regresní rovnice a je přijata alternativní hypotéza o její statistické významnosti.

Pomocí Fisherova kritéria můžete vyhodnotit význam nejen regresní rovnice jako celku, ale také význam dodatečného zahrnutí každého faktoru do modelu. Takové posouzení je nutné, aby nebyl model zatížen faktory, které nemají významný vliv na výsledek. Kromě toho, protože se model skládá z několika faktorů, mohou být do něj zavedeny v různých sekvencích, a protože mezi faktory existuje korelace, význam zahrnutí stejného faktoru do modelu se může lišit v závislosti na sekvenci, ve které se vnášejí se do něj faktory.

Pro posouzení významnosti zahrnutí dalšího faktoru do modelu se vypočítá dílčí Fisherovo kritérium Fxi. Je založena na porovnání nárůstu rozptylu faktorů v důsledku zahrnutí dalšího faktoru do modelu se zbytkovým rozptylem na jeden stupeň volnosti pro regresi jako celek. Proto výpočetní vzorec soukromý F-test protože faktor bude mít následující tvar:

Kde R 2 yx 1 x 2… xi… xp - koeficient vícenásobného určení pro úplný model P faktory ; R 2 yx 1 x 2… x i -1 x i +1… xp- koeficient vícenásobného určení pro model, který neobsahuje faktor x i;P- počet pozorování; T- počet parametrů pro faktory X v regresní rovnici.

Skutečná hodnota Fisherova dílčího testu je porovnána s tabulkovou na hladině významnosti 0,05 nebo 0,1 a odpovídajícím počtům stupňů volnosti. Pokud je skutečná hodnota F xi přesahuje F stůl, pak dodatečné zahrnutí faktoru x i do modelu je statisticky zdůvodněn a „čistý“ regresní koeficient b i v faktoru x i statisticky významný. Li F xi méně F stůl, pak dodatečné zahrnutí faktoru do modelu významně nezvýší podíl vysvětlené variace na výsledku y, a proto jeho zahrnutí do modelu nedává smysl, regresní koeficient pro tento faktor je v tomto případě statisticky nevýznamný.

Pomocí Fisherova dílčího testu můžete otestovat významnost všech regresních koeficientů za předpokladu, že každý odpovídající faktor x i se do rovnice vícenásobné regrese zadává jako poslední a všechny ostatní faktory již byly do modelu zahrnuty dříve.

Posouzení významnosti „čistých“ regresních koeficientů b i Podle Studentův t test lze provést bez výpočtu soukromých F-kritéria. V tomto případě, stejně jako u párové regrese, se vzorec použije pro každý faktor

t bi = b i / m bi ,

Kde b i- koeficient „čisté“ regrese s faktorem x i ; m bi- směrodatná chyba regresního koeficientu b i .

Pro posouzení významnosti a významnosti korelačního koeficientu se používá Studentův t-test.

Průměrná chyba korelačního koeficientu se zjistí pomocí vzorce:

N
a na základě chyby se vypočítá t-kritérium:

Vypočtená hodnota t-testu je porovnána s tabulkovou hodnotou zjištěnou ve Studentově distribuční tabulce na hladině významnosti 0,05 nebo 0,01 a počtu stupňů volnosti n-1. Pokud je vypočtená hodnota t-testu větší než tabulková hodnota, pak je korelační koeficient považován za významný.

V případě křivočarého vztahu se F-test používá k posouzení významnosti korelačního vztahu a regresní rovnice. Vypočítá se podle vzorce:

nebo

kde η je korelační poměr; n – počet pozorování; m – počet parametrů v regresní rovnici.

Vypočtená hodnota F je porovnána s tabulkovou hodnotou pro přijatou hladinu významnosti α (0,05 nebo 0,01) a počty stupňů volnosti k 1 =m-1 ak 2 =n-m. Pokud vypočtená hodnota F přesahuje tabulkovou hodnotu, je vztah považován za významný.

Významnost regresního koeficientu se stanoví pomocí Studentova t-testu, který se vypočítá podle vzorce:

kde σ 2 a i je rozptyl regresního koeficientu.

Vypočítá se podle vzorce:

kde k je počet faktorových charakteristik v regresní rovnici.

Regresní koeficient se považuje za významný, pokud t a 1 ≥t cr. t cr se nachází v tabulce kritických bodů Studentova rozdělení na akceptované hladině významnosti a počtu stupňů volnosti k=n-1.

4.3 Korelační a regresní analýza v Excelu

Proveďme korelační a regresní analýzu vztahu mezi výnosem a mzdovými náklady na 1 cent obilí. Chcete-li to provést, otevřete list aplikace Excel a zadejte hodnoty charakteristiky faktoru do buněk A1:A30 výnos obilných plodin, v buňkách B1:B30, hodnota výsledné charakteristiky je cena práce na 1 quintal obilí. V nabídce Nástroje vyberte možnost Analýza dat. Kliknutím levým tlačítkem myši na tuto položku otevřeme nástroj Regrese. Klepněte na tlačítko OK a na obrazovce se zobrazí dialogové okno Regrese. Do pole Vstupní interval Y zadejte hodnoty výsledné charakteristiky (zvýraznění buněk B1:B30), do pole Vstupní interval X zadejte hodnoty faktorové charakteristiky (zvýraznění buněk A1:A30). Označte úroveň pravděpodobnosti 95 % a vyberte Nový list. Klepněte na tlačítko OK. Na pracovním listu se objeví tabulka „ZÁVĚR VÝSLEDKŮ“, která zobrazuje výsledky výpočtu parametrů regresní rovnice, korelačního koeficientu a dalších ukazatelů, které umožňují určit významnost korelačního koeficientu a parametrů regresní rovnice.

ZÁVĚR VÝSLEDKŮ

Regresní statistika

Množné číslo R

R-čtverec

Normalizovaná R-kvadrát

Standardní chyba

Pozorování

Analýza rozptylu

Význam F

Regrese

Kurzy

Standardní chyba

t-statistika

P-hodnota

Dolních 95 %

Nejlepších 95 %

Dolních 95,0 %

Nejlepších 95,0 %

Y-průsečík

Proměnná X1

V této tabulce je „Multiple R“ korelační koeficient, „R-squared“ je koeficient determinace. „Koeficienty: průsečík Y“ - volný člen regresní rovnice 2,836242; „Proměnná X1“ – regresní koeficient -0,06654. Dále jsou zde uvedeny hodnoty Fisherova F-testu 74,9876, Studentova t-testu 14,18042, „Standardní chyba 0,112121“, které jsou nezbytné pro posouzení významnosti korelačního koeficientu, parametrů regresní rovnice a celé rovnice.

Na základě údajů v tabulce sestrojíme regresní rovnici: y x ​​​​= 2,836-0,067x. Regresní koeficient a 1 = -0,067 znamená, že při zvýšení výnosu zrna o 1 c/ha klesnou mzdové náklady na 1 c zrna o 0,067 člověkohodin.

Korelační koeficient je r=0,85>0,7, proto je vztah mezi studovanými charakteristikami v této populaci úzký. Koeficient determinace r 2 =0,73 ukazuje, že 73 % variace efektivního znaku (náklady práce na 1 quintal zrna) je způsobeno působením faktoru znaku (výnos zrna).

V tabulce kritických bodů Fisher-Snedecorova rozdělení nalezneme kritickou hodnotu F-testu na hladině významnosti 0,05 a počtu stupňů volnosti k 1 =m-1=2-1=1 ak 2 =n-m=30-2=28 se rovná 4,21. Vzhledem k tomu, že vypočtená hodnota kritéria je větší než ta tabelovaná (F=74,9896>4,21), považuje se regresní rovnice za významnou.

Pro posouzení významnosti korelačního koeficientu vypočítejme Studentův t-test:

V
V tabulce kritických bodů Studentova rozdělení nalezneme kritickou hodnotu t-testu na hladině významnosti 0,05 a počtu stupňů volnosti n-1=30-1=29, je roven 2,0452. Vzhledem k tomu, že vypočtená hodnota je větší než tabulková hodnota, je korelační koeficient významný.

Odhad významnosti parametrů regresní rovnice

Významnost parametrů lineární regresní rovnice se posuzuje pomocí Studentova testu:

Li t calc. > t cr, pak je hlavní hypotéza přijata ( H o), udávající statistickou významnost regresních parametrů;

Li t calc.< t cr, pak je přijata alternativní hypotéza ( H 1), což ukazuje na statistickou nevýznamnost regresních parametrů.

Kde m a , m b– standardní chyby parametrů A A b:

(2.19)

(2.20)

Kritická (tabulková) hodnota kritéria se zjistí pomocí statistických tabulek Studentského rozdělení (příloha B) nebo pomocí tabulek Vynikat(část průvodce funkcí „Statistika“):

t cr = STUDARSOBR( a = 1-P; k=n-2), (2.21)

Kde k=n-2 také představuje počet stupňů volnosti .

Posouzení statistické významnosti lze aplikovat i na lineární korelační koeficient

Kde m r– směrodatná chyba při určování hodnot korelačního koeficientu r yx

(2.23)

Níže jsou uvedeny možnosti úkolů pro praktické a laboratorní práce k tématům druhého oddílu.

Samotestovací otázky pro sekci 2

1. Uveďte hlavní součásti ekonometrického modelu a jejich podstatu.

2. Hlavní náplň etap ekonometrického výzkumu.

3. Podstata přístupů ke stanovení parametrů lineární regrese.

4. Podstata a zvláštnosti aplikace metody nejmenší čtverce při stanovení parametrů regresní rovnice.

5. Jaké indikátory se používají k posouzení těsnosti vztahu mezi zkoumanými faktory?

6. Esence lineární koeficient korelace.

7. Podstata koeficientu determinace.

8. Podstata a hlavní rysy postupů hodnocení přiměřenosti (statistická významnost) regresní modely.

9. Posouzení adekvátnosti lineárních regresních modelů pomocí aproximačního koeficientu.

10. Podstata přístupu k hodnocení adekvátnosti regresních modelů pomocí Fisherova kritéria. Definice empirických a kritické hodnoty kritérium.

11. Podstata pojmu „analýza rozptylu“ ve vztahu k ekonometrickému výzkumu.

12. Podstata a hlavní rysy postupu hodnocení významnosti parametrů lineární rovnice regrese.

13. Vlastnosti použití Studentova rozdělení při posuzování významnosti parametrů lineární regresní rovnice.

14. Co je úkolem prognózování jednotlivých hodnot zkoumaného socioekonomického jevu?

1. Sestrojte korelační pole a formulujte předpoklad o tvaru rovnice pro vztah zkoumaných faktorů;

2. Zapište základní rovnice metody nejmenších čtverců, proveďte potřebné transformace, sestavte tabulku pro mezivýpočty a určete parametry rovnice lineární regrese;

3. Zkontrolujte správnost provedených výpočtů pomocí standardní postupy a funkcí tabulky Vynikat.

4. Analyzujte výsledky, formulujte závěry a doporučení.

1. Výpočet hodnoty lineárního korelačního koeficientu;

2. Stavba stolu analýza rozptylu;

3. Odhad koeficientu determinace;

4. Zkontrolujte správnost výpočtů pomocí standardních postupů a funkcí excelových tabulek.

5. Analyzujte výsledky, formulujte závěry a doporučení.

4. Proveďte obecné posouzení adekvátnosti zvolené regresní rovnice;

1. Posouzení přiměřenosti rovnice na základě hodnot aproximačního koeficientu;

2. Posouzení přiměřenosti rovnice na základě hodnot koeficientu determinace;

3. Posouzení přiměřenosti rovnice pomocí Fisherova kritéria;

4. Proveďte obecné posouzení přiměřenosti parametrů regresní rovnice;

5. Zkontrolujte správnost výpočtů pomocí standardních postupů a funkcí excelových tabulek.

6. Analyzujte výsledky, formulujte závěry a doporučení.

1. Použití standardních postupů Průvodce funkcemi tabulkového procesoru Excel (z částí „Matematické“ a „Statistické“);

2. Příprava dat a vlastnosti použití funkce LINREGRESE;

3. Příprava dat a vlastnosti použití funkce „PREDICTION“.

1. Použití standardních postupů tabulkového procesoru Excel;

2. Příprava dat a vlastnosti aplikace procedury „REGRESE“;

3. Interpretace a syntéza dat tabulky regresní analýzy;

4. Interpretace a syntéza dat z analýzy rozptylové tabulky;

5. Interpretace a zobecnění dat z tabulky pro posouzení významnosti parametrů regresní rovnice;

Při provádění laboratorních prací na základě jedné z možností musíte splnit následující konkrétní úkoly:

1. Vyberte tvar rovnice pro vztah zkoumaných faktorů;

2. Určete parametry regresní rovnice;

3. Posoudit úzký vztah zkoumaných faktorů;

4. Posoudit přiměřenost zvolené regresní rovnice;

5. Posuďte statistickou významnost parametrů regresní rovnice.

6. Zkontrolujte správnost výpočtů pomocí standardních postupů a funkcí excelových tabulek.

7. Analyzujte výsledky, formulujte závěry a doporučení.

Úkoly k praktické a laboratorní práci na téma „Párová lineární regrese a korelace v ekonometrickém výzkumu“.

Možnost 1 Možnost 2 Možnost 3 Možnost 4 Možnost 5
X y X y X y X y X y
Možnost 6 Možnost 7 Možnost 8 Možnost 9 Možnost 10
X y X y X y X y X y

V socioekonomickém výzkumu je často nutné pracovat v omezené populaci nebo se vzorovými daty. Po matematických parametrech regresní rovnice je tedy nutné vyhodnotit je i rovnici jako celek pro statistickou významnost, tzn. je nutné dbát na to, aby výsledná rovnice a její parametry vznikaly pod vlivem nenáhodných faktorů.

Nejprve se posuzuje statistická významnost rovnice jako celku. Hodnocení se typicky provádí pomocí Fisherova F testu. Výpočet F-kritéria je založen na pravidle sčítání rozptylů. Konkrétně obecná disperzní charakteristika-výsledek = faktorová disperze + zbytková disperze.

Skutečná cena

Teoretická cena
Sestrojením regresní rovnice můžete vypočítat teoretickou hodnotu výsledné charakteristiky, tzn. vypočítané pomocí regresní rovnice s přihlédnutím k jejím parametrům.

Tyto hodnoty budou charakterizovat výsledný atribut, vytvořený pod vlivem faktorů zahrnutých do analýzy.

Vždy existují nesrovnalosti (zbytky) mezi skutečnými hodnotami výsledného atributu a hodnotami vypočítanými na základě regresní rovnice v důsledku vlivu dalších faktorů nezahrnutých do analýzy.

Rozdíl mezi teoretickými a skutečnými hodnotami výsledného atributu se nazývá rezidua. Obecná variace výsledného znaku:

Odchylka ve výsledném atributu, způsobená odchylkami v charakteristikách faktorů zahrnutých do analýzy, se posuzuje prostřednictvím srovnání teoretických hodnot výsledků. charakteristika a její průměrné hodnoty. Zbytková variace porovnáním teoretických a skutečných hodnot výsledné charakteristiky. Celkový rozptyl, zbytkový a skutečný mají různé počty stupňů volnosti.

Všeobecné, P- počet jednotek ve studované populaci

Aktuální, P- počet faktorů zahrnutých do analýzy

Reziduální

Fisherův F test se vypočítá jako poměr k , a vypočítá se pro jeden stupeň volnosti.

Použití Fisherova F testu jako odhadu statistické významnosti regresní rovnice je velmi logické. - toto je výsledek. charakteristika, určená faktory zahrnutými do analýzy, tzn. toto je podíl na vysvětleném výsledku. podepsat. - jedná se o (variaci) výsledného atributu způsobenou faktory, jejichž vliv se nebere v úvahu, tzn. nejsou zahrnuty do analýzy.

Že. F-test je určen k vyhodnocení významný přebytek přes . Pokud není výrazně nižší než , a ještě více, pokud překračuje , pak analýza nezahrnuje ty faktory, které skutečně ovlivňují výsledný atribut.

Fisherův F test je tabelován, skutečná hodnota je porovnávána s tabelovanou hodnotou. Jestliže , pak je regresní rovnice považována za statisticky významnou. Pokud naopak rovnice není statisticky významná a nelze ji v praxi použít, udává významnost rovnice jako celku statistickou významnost korelačních ukazatelů.

Po odhadu rovnice jako celku je nutné vyhodnotit statistickou významnost parametrů rovnice. Toto hodnocení se provádí pomocí Studentovy t-statistiky. T-statistika se vypočítá jako poměr parametrů rovnice (modulo) k jejich standardní střední kvadratické chybě. Pokud se odhaduje jednofaktorový model, pak se vypočítají 2 statistiky.

Ve všech počítačových programech se výpočet standardní chyby a t-statistiky pro parametry provádí s výpočtem samotných parametrů. T-statistika tabulková. Pokud je hodnota , pak je parametr považován za statisticky významný, tzn. vzniklé pod vlivem nenáhodných faktorů.

Výpočet t-statistiky v podstatě znamená testování nulové hypotézy, že parametr je nevýznamný, tzn. jeho rovnost na nulu. S jednofaktorovým modelem se posuzují 2 hypotézy: a

Úroveň významnosti přijetí nulové hypotézy závisí na úrovni přijaté pravděpodobnost spolehlivosti. Pokud tedy výzkumník nastaví hladinu pravděpodobnosti na 95 %, vypočítá se hladina akceptační významnosti, pokud je tedy hladina významnosti ≥ 0,05, pak je akceptována a parametry jsou považovány za statisticky nevýznamné. Pokud , pak je alternativa zamítnuta a přijata: a .

Statistické softwarové balíčky také poskytují úroveň významnosti pro přijímání nulových hypotéz. Posouzením významnosti regresní rovnice a jejích parametrů lze získat následující výsledky:

Jednak je významná rovnice jako celek (podle F-testu) a statisticky významné jsou i všechny parametry rovnice. To znamená, že výslednou rovnici lze použít pro obojí manažerská rozhodnutí a pro předpovědi.

Za druhé, podle F-testu je rovnice statisticky významná, ale alespoň jeden z parametrů rovnice není významný. Rovnici lze použít k rozhodování managementu ohledně analyzovaných faktorů, ale nelze ji použít pro prognózování.

Za třetí, rovnice není statisticky významná, nebo podle F-testu je rovnice významná, ale všechny parametry výsledné rovnice nejsou významné. Rovnici nelze použít k žádnému účelu.

Aby mohla být regresní rovnice uznána jako model vztahu mezi atributem výsledek a atributem faktoru, je nutné, aby všechny nejdůležitější faktory, stanovení výsledku tak, aby smysluplná interpretace parametrů rovnice odpovídala teoreticky podloženým souvislostem ve studovaném jevu. Koeficient determinace R2 musí být > 0,5.

Při konstrukci vícenásobné regresní rovnice je vhodné provést posouzení pomocí tzv. upraveného koeficientu determinace (R 2). Hodnota R2 (stejně jako korelace) roste s počtem faktorů zahrnutých do analýzy. Hodnota koeficientu je nadhodnocena zejména u malých populací. Pro potlačení negativního vlivu jsou R 2 a korelace upraveny s ohledem na počet stupňů volnosti, tzn. počet volně se měnících prvků, když jsou zahrnuty určité faktory.

Upravený koeficient determinace

P–velikost populace/počet pozorování

k– počet faktorů zahrnutých do analýzy

n-1– počet stupňů volnosti

(1-R 2)- hodnota zbytku/nevysvětleného rozptylu výsledné charakteristiky

Vždy méně R 2. na základě lze porovnávat odhady rovnic s různá čísla analyzované faktory.

34. Problémy studia časových řad.

Časové řady se nazývají časové řady nebo časové řady. Časová řada je časově uspořádaná posloupnost ukazatelů charakterizujících konkrétní jev (objem HDP od 90 do 98). Účelem studia časových řad je identifikovat vzorec vývoje zkoumaného jevu (hlavní trend) a na tomto základě předpovědět. Z definice RD vyplývá, že jakákoliv řada se skládá ze dvou prvků: čas t a úroveň řady (tyto konkrétní hodnoty ukazatele, na jejichž základě je řada RD postavena). Řady DR mohou být 1) moment - řada, jejíž ukazatele jsou zaznamenány v čase, k určitému datu, 2) interval - řada, jejíž ukazatele jsou získávány za určité časové období (1. populace hl. Petrohrad, 2. objem HDP za období). Rozdělení řad na momentové a intervalové je nutné, protože to určuje specifika výpočtu některých ukazatelů řad DR. Součet úrovní intervalové řady dává smysluplně interpretovatelný výsledek, což nelze říci o sčítání úrovní momentových řad, protože ty obsahují opakované počítání. Nejdůležitějším problémem při analýze časových řad je problém srovnatelnosti úrovní řad. Tento koncept je velmi rozmanitý. Úrovně musí být srovnatelné z hlediska metod výpočtu a z hlediska území a pokrytí jednotek obyvatelstva. Pokud je řada DR konstruována z hlediska nákladů, musí být všechny úrovně prezentovány nebo kalkulovány ve srovnatelných cenách. Při konstrukci intervalových řad musí úrovně charakterizovat shodné časové úseky. Při konstrukci momentových řad musí být hladiny zaznamenány ke stejnému datu. Řada DR může být úplná nebo neúplná. Neúplné řádky se používají v oficiálních publikacích (1980,1985,1990,1995,1996,1997,1998,1999...). Komplexní analýza RD zahrnuje studium následujících bodů:

1. výpočet indikátorů změn úrovní RD

2. výpočet průměrných ukazatelů RD

3. identifikace hlavního trendu série, budování trendových modelů

4. posouzení autokorelace u RD, konstrukce autoregresních modelů

5. RD korelace (studium souvislostí mezi m/r řadami DR)

6. předpověď pojezdové dráhy.

35. Indikátory změn úrovní časových řad .

V obecný pohled RowD může být reprezentován:

y – úroveň DR, t – okamžik nebo časový úsek, ke kterému úroveň (ukazatel) náleží, n – délka řady DR (počet period). při studiu řady dynamik se počítají tyto ukazatele: 1. absolutní růst, 2. koeficient růstu (rychlost růstu), 3. zrychlení, 4. koeficient růstu (rychlost růstu), 5. absolutní hodnota 1% nárůst. Vypočtené ukazatele mohou být: 1. řetězové - získané porovnáním každé úrovně řady s bezprostředně předcházející, 2. základní - získané porovnáním s úrovní zvolenou jako základ pro srovnání (pokud není výslovně uvedeno, 1. úroveň řady série je brána jako základ). 1. Absolutní nárůsty řetězce:. Ukazuje, o kolik více či méně. Řetězcové absolutní nárůsty se nazývají indikátory rychlosti změny úrovní časové řady. Základní absolutní růst: . Pokud jsou úrovně řady relativními ukazateli vyjádřenými v %, pak je absolutní nárůst vyjádřen v bodech změny. 2. tempo růstu (tempo růstu): Vypočítá se jako poměr úrovní řady k bezprostředně předcházejícím (koeficienty růstu řetězce), nebo k úrovni brané jako základ pro srovnání (základní koeficienty růstu): . Charakterizuje, kolikrát každá úroveň série > nebo< предшествующего или базисного. На основе коэффициентов роста рассчитываются темпы роста. Это коэффициенты роста, выраженные в %ах: 3. na základě absolutních přírůstků se ukazatel vypočítá - zrychlení absolutního růstu: . Zrychlení je absolutní nárůst absolutních nárůstů. Hodnotí, jak se mění samotné zisky, zda jsou stabilní nebo akcelerující (rostoucí). 4. rychlost růstu je poměr růstu ke srovnávací základně. Vyjádřen v %: ; . Tempo růstu je tempo růstu mínus 100 %. Ukazuje, kolik % je daná úroveň série > nebo< предшествующего либо базисного. 5. абсолютное значение 1% прироста. Рассчитывается как отношение абсолютного прироста к темпу прироста, т.е.: - сотая доля предыдущего уровня. Все эти показатели рассчитываются для оценки степени изменения уровней ряда. Цепные коэффициенты и темпы роста называются показателями интенсивности изменения уровней ДРядов.

2. Výpočet průměrných ukazatelů RD Počítají se průměrné úrovně řádků, průměrné absolutní nárůsty, průměrné rychlosti růstu a průměrné rychlosti růstu. Průměrné ukazatele jsou počítány s cílem sumarizovat informace a umožnit srovnání úrovní a ukazatelů jejich změny napříč různými řadami. 1. úroveň střední řady a) pro intervalovou časovou řadu se počítá pomocí jednoduchého aritmetického průměru: , kde n je počet úrovní v časové řadě; b) pro momentové řady se průměrná úroveň vypočítá pomocí specifického vzorce, který se nazývá chronologický průměr: . 2. průměrný absolutní nárůst vypočítané na základě řetězových absolutních nárůstů na základě jednoduchého aritmetického průměru:

. 3. Průměrná rychlost růstu vypočítané na základě koeficientů růstu řetězce pomocí vzorce geometrického průměru: . Při komentování průměrných ukazatelů řady DR je nutné uvést 2 body: období, které charakterizuje analyzovaný ukazatel a časový interval, pro který byla řada DR sestavena. 4. Průměrná rychlost růstu: . 5. průměrné tempo růstu: .

Regresní analýza je statistická výzkumná metoda, která umožňuje ukázat závislost určitého parametru na jedné nebo více nezávislých proměnných. V předpočítačové době bylo jeho použití poměrně obtížné, zejména pokud šlo o velké objemy dat. Dnes, když jste se naučili vytvářet regresi v Excelu, můžete vyřešit složité statistické problémy za pár minut. Níže uvádíme konkrétní příklady z oblasti ekonomie.

Typy regrese

Tento pojem sám byl zaveden do matematiky v roce 1886. Regrese se děje:

  • lineární;
  • parabolický;
  • usedlý;
  • exponenciální;
  • hyperbolický;
  • demonstrativní;
  • logaritmický.

Příklad 1

Uvažujme problém stanovení závislosti počtu odcházejících členů týmu na průměrné mzdě v 6 průmyslových podnicích.

Úkol. U šesti podniků jsme analyzovali průměr měsíčně mzdy a počet zaměstnanců, kteří odešli z důvodu na přání. V tabulkové podobě máme:

Počet lidí, kteří skončili

Plat

30 000 rublů

35 000 rublů

40 000 rublů

45 000 rublů

50 000 rublů

55 000 rublů

60 000 rublů

Pro úlohu stanovení závislosti počtu odcházejících pracovníků na průměrné mzdě v 6 podnicích má regresní model tvar rovnice Y = a 0 + a 1 x 1 +...+a k x k, kde x i je ovlivňující proměnné, a i jsou regresní koeficienty a k je počet faktorů.

U tohoto problému je Y ukazatelem odcházejících zaměstnanců a ovlivňujícím faktorem je mzda, kterou označujeme X.

Využití možností tabulkového procesoru Excel

Regresní analýze v Excelu musí předcházet aplikace vestavěných funkcí na existující tabulková data. Pro tyto účely je však lepší použít velmi užitečný doplněk „Analysis Pack“. K jeho aktivaci potřebujete:

  • na kartě „Soubor“ přejděte do části „Možnosti“;
  • v okně, které se otevře, vyberte řádek „Doplňky“;
  • klikněte na tlačítko „Přejít“ umístěné níže, vpravo od řádku „Správa“;
  • zaškrtněte políčko vedle názvu „Analytický balíček“ a potvrďte své akce kliknutím na „OK“.

Pokud je vše provedeno správně, zobrazí se požadované tlačítko na pravé straně karty „Data“, která se nachází nad pracovním listem aplikace Excel.

v Excelu

Nyní, když máme po ruce všechny potřebné virtuální nástroje k provádění ekonometrických výpočtů, můžeme začít řešit náš problém. Pro tohle:

  • Klikněte na tlačítko „Analýza dat“;
  • v okně, které se otevře, klikněte na tlačítko „Regrese“;
  • na zobrazené kartě zadejte rozsah hodnot pro Y (počet odcházejících zaměstnanců) a pro X (jejich platy);
  • Naše akce potvrdíme stisknutím tlačítka „OK“.

Výsledkem je, že program automaticky vyplní novou tabulku daty regresní analýzy. Poznámka! Excel umožňuje ručně nastavit umístění, které pro tento účel preferujete. Může to být například stejný list, kde jsou umístěny hodnoty Y a X, nebo dokonce nový sešit speciálně navržený pro ukládání takových dat.

Analýza výsledků regrese pro R-kvadrát

V Excelu mají data získaná při zpracování dat v uvažovaném příkladu tvar:

Nejprve byste měli věnovat pozornost hodnotě R-squared. Představuje koeficient determinace. V tomto příkladu R-kvadrát = 0,755 (75,5 %), tj. vypočtené parametry modelu vysvětlují vztah mezi uvažovanými parametry ze 75,5 %. Čím vyšší je hodnota koeficientu determinace, tím je zvolený model vhodnější pro konkrétní úlohu. Za správný popis reálné situace se považuje, když je hodnota R-kvadrátu nad 0,8. Pokud R-kvadrát<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

Analýza šancí

Číslo 64,1428 ukazuje, jaká bude hodnota Y, pokud se všechny proměnné xi v modelu, o kterém uvažujeme, vynulují. Jinými slovy, lze tvrdit, že hodnotu analyzovaného parametru ovlivňují i ​​další faktory, které nejsou popsány v konkrétním modelu.

Další koeficient -0,16285 umístěný v buňce B18 ukazuje váhu vlivu proměnné X na Y. To znamená, že průměrná měsíční mzda zaměstnanců v rámci uvažovaného modelu ovlivňuje počet odcházejících s váhou -0,16285, tzn. míra jeho vlivu je zcela malá. Znaménko "-" znamená, že koeficient je záporný. To je zřejmé, protože každý ví, že čím vyšší je plat v podniku, tím méně lidí vyjadřuje přání ukončit pracovní smlouvu nebo ukončit pracovní poměr.

Vícenásobná regrese

Tento termín odkazuje na vztahovou rovnici s několika nezávislými proměnnými ve tvaru:

y=f(x 1 +x 2 +…x m) + ε, kde y je výsledná charakteristika (závislá proměnná) a x 1, x 2,…x m jsou faktorové charakteristiky (nezávislé proměnné).

Odhad parametrů

U vícenásobné regrese (MR) se provádí metodou nejmenších čtverců (OLS). Pro lineární rovnice tvaru Y = a + b 1 x 1 +…+b m x m + ε sestrojíme soustavu normálních rovnic (viz níže)

Abyste pochopili princip metody, zvažte dvoufaktorový případ. Pak máme situaci popsanou vzorcem

Odtud dostáváme:

kde σ je rozptyl odpovídajícího znaku vyjádřený v indexu.

OLS je použitelný pro rovnici MR na standardizovaném měřítku. V tomto případě dostaneme rovnici:

kde t y, t x 1, … t xm jsou standardizované proměnné, pro které jsou průměrné hodnoty rovny 0; β i jsou standardizované regresní koeficienty a směrodatná odchylka je 1.

Upozorňujeme, že všechna β i jsou v tomto případě specifikována jako normalizovaná a centralizovaná, proto je jejich vzájemné srovnání považováno za správné a přijatelné. Kromě toho je obvyklé vyloučit faktory vyřazením těch s nejnižšími hodnotami βi.

Problém s lineární regresní rovnicí

Předpokládejme, že máme tabulku dynamiky cen pro konkrétní produkt N za posledních 8 měsíců. Je nutné rozhodnout o vhodnosti nákupu šarže za cenu 1850 rublů/t.

číslo měsíce

název měsíce

cena produktu N

1750 rublů za tunu

1755 rublů za tunu

1767 rublů za tunu

1760 rublů za tunu

1770 rublů za tunu

1790 rublů za tunu

1810 rublů za tunu

1840 rublů za tunu

Chcete-li tento problém vyřešit v tabulkovém procesoru Excel, musíte použít nástroj „Analýza dat“, který je již znám z výše uvedeného příkladu. Dále vyberte sekci „Regrese“ a nastavte parametry. Je třeba pamatovat na to, že v poli „Interval vstupu Y“ je třeba zadat rozsah hodnot pro závislou proměnnou (v tomto případě ceny zboží v konkrétních měsících roku) a v poli „Interval vstupu X“ - pro nezávislou proměnnou (číslo měsíce). Potvrďte akci kliknutím na „OK“. Na novém listu (pokud je to uvedeno) získáme data pro regresi.

Pomocí nich sestrojíme lineární rovnici tvaru y=ax+b, kde parametry a a b jsou koeficienty úsečky s názvem čísla měsíce a koeficienty a úsečky „Y-průsečík“ z listu s výsledky regresní analýzy. Rovnice lineární regrese (LR) pro úlohu 3 je tedy zapsána jako:

Cena produktu N = 11,714* číslo měsíce + 1727,54.

nebo v algebraickém zápisu

y = 11,714 x + 1727,54

Analýza výsledků

Pro rozhodnutí, zda je výsledná lineární regresní rovnice adekvátní, se používají koeficienty vícenásobné korelace (MCC) a stanovení, dále Fisherův test a Studentův t test. V excelové tabulce s výsledky regrese se nazývají více R, R-statistika, F-statistika a t-statistika.

KMC R umožňuje posoudit blízkost pravděpodobnostního vztahu mezi nezávislými a závislými proměnnými. Jeho vysoká hodnota ukazuje na poměrně silnou vazbu mezi proměnnými „Počet měsíce“ a „Cena produktu N v rublech za 1 tunu“. Povaha tohoto vztahu však zůstává neznámá.

Druhá mocnina koeficientu determinace R2 (RI) je číselnou charakteristikou podílu celkového rozptylu a ukazuje rozptyl té které části experimentálních dat, tzn. hodnoty závislé proměnné odpovídají lineární regresní rovnici. V uvažovaném problému je tato hodnota rovna 84,8 %, tj. statistická data jsou s vysokou mírou přesnosti popsána výsledným SD.

F-statistika, nazývaná také Fisherův test, se používá k hodnocení významnosti lineárního vztahu, vyvracejícího nebo potvrzujícího hypotézu o jeho existenci.

(Studentův test) pomáhá vyhodnotit významnost koeficientu s neznámým nebo volným členem lineárního vztahu. Pokud je hodnota t-testu > tcr, pak je hypotéza o nevýznamnosti volného členu lineární rovnice zamítnuta.

V uvažované úloze pro volný termín bylo pomocí nástrojů Excelu získáno, že t = 169,20903 a p = 2,89E-12, tj. máme nulovou pravděpodobnost, že správná hypotéza o nevýznamnosti volného termínu bude zamítnuta. . Pro koeficient pro neznámou t=5,79405 a p=0,001158. Jinými slovy, pravděpodobnost, že bude zamítnuta správná hypotéza o nevýznamnosti koeficientu pro neznámou, je 0,12 %.

Lze tedy tvrdit, že výsledná lineární regresní rovnice je adekvátní.

Problém proveditelnosti nákupu balíku akcií

Vícenásobná regrese v Excelu se provádí pomocí stejného nástroje pro analýzu dat. Podívejme se na konkrétní aplikační problém.

O vhodnosti koupě 20% podílu v MMM as musí rozhodnout vedení společnosti NNN. Cena balíčku (SP) je 70 milionů amerických dolarů. Specialisté NNN shromáždili data o podobných transakcích. Bylo rozhodnuto ohodnotit hodnotu balíku akcií podle takových parametrů, vyjádřených v milionech amerických dolarů, jako:

  • závazky (VK);
  • roční objem obratu (VO);
  • pohledávky (VD);
  • náklady na fixní aktiva (COF).

Dále se používá parametr nedoplatků na mzdách podniku (V3 P) v tisících amerických dolarů.

Řešení pomocí tabulkového procesoru Excel

Nejprve je potřeba vytvořit tabulku zdrojových dat. Vypadá to takto:

  • vyvolejte okno „Analýza dat“;
  • vyberte sekci „Regrese“;
  • Do pole „Interval vstupu Y“ zadejte rozsah hodnot závislých proměnných ze sloupce G;
  • Klikněte na ikonu s červenou šipkou vpravo od okna „Input interval X“ a zvýrazněte rozsah všech hodnot ze sloupců B, C, D, F na listu.

Označte položku „Nový list“ a klikněte na „OK“.

Získejte regresní analýzu pro daný problém.

Studium výsledků a závěrů

„Shromáždíme“ regresní rovnici ze zaokrouhlených dat uvedených výše v tabulce Excel:

SP = 0,103*SOF + 0,541*VO - 0,031*VK +0,405*VD +0,691*VZP - 265,844.

Ve známější matematické formě to lze napsat jako:

y = 0,103*x1 + 0,541*x2 - 0,031*x3 +0,405*x4 +0,691*x5 - 265,844

Údaje pro MMM JSC jsou uvedeny v tabulce:

Pokud je dosadíme do regresní rovnice, dostaneme číslo 64,72 milionů amerických dolarů. To znamená, že akcie MMM JSC se nevyplatí kupovat, protože jejich hodnota 70 milionů amerických dolarů je značně nadsazená.

Jak vidíte, použití excelové tabulky a regresní rovnice umožnilo učinit informované rozhodnutí o proveditelnosti velmi specifické transakce.

Nyní víte, co je regrese. Výše uvedené příklady Excelu vám pomohou vyřešit praktické problémy v oblasti ekonometrie.



Novinka na webu

>

Nejoblíbenější