Ev Hijyen Regresyon denklemi parametrelerinin tahmini. Doğrusal Regresyon Parametrelerinin Tahmini

Regresyon denklemi parametrelerinin tahmini. Doğrusal Regresyon Parametrelerinin Tahmini

Regresyon denklemi her zaman bağlantının yakınlığının bir göstergesi ile desteklenir. Kullanma doğrusal regresyon böyle bir gösterge doğrusal korelasyon katsayısı r yt'dir. Formülün farklı modifikasyonları var doğrusal katsayı korelasyonlar.

Doğrusal korelasyon katsayısının değerinin, söz konusu özellikler arasındaki bağlantının yakınlığını doğrusal biçimde değerlendirdiği unutulmamalıdır. Bu nedenle yakınlık mutlak değer Doğrusal korelasyon katsayısının sıfır olması, özellikler arasında bağlantı olmadığı anlamına gelmez.

Seçimin kalitesini değerlendirmek için doğrusal fonksiyon Belirleme katsayısı olarak adlandırılan doğrusal korelasyon katsayısı r yt 2'nin karesi hesaplanır. Belirleme katsayısı, etkili özelliğin t'deki varyansının, etkili özelliğin toplam varyansındaki regresyonla açıklanan oranını karakterize eder.

Doğrusal olmayan regresyon denklemi, aşağıdaki gibi doğrusal bağımlılık, bir korelasyon göstergesi, yani korelasyon endeksi R ile desteklenir.

Daha fazla polinom gibi ikinci dereceden bir parabol yüksek sipariş doğrusallaştırıldığında denklemin biçimini alır çoklu regresyon. Açıklanana göre doğrusal değilse değişken denklem Doğrusallaştırma sırasındaki regresyon, ikili regresyonun doğrusal bir denklemi şeklini alır, daha sonra ilişkinin yakınlığını değerlendirmek için, değeri bu durumda korelasyon indeksi ile çakışacak olan doğrusal bir korelasyon katsayısı kullanılabilir.

Denklemin doğrusal forma dönüştürülmesi bağımlı değişken içerdiğinde durum farklıdır. Bu durumda, dönüştürülmüş özellik değerlerine dayanan doğrusal korelasyon katsayısı, ilişkinin yakınlığına ilişkin yalnızca yaklaşık bir tahmin verir ve korelasyon indeksi ile sayısal olarak örtüşmez. Evet, için güç fonksiyonu

logaritmik olarak doğrusal denkleme geçtikten sonra

lny = lna + blnx

x ve y değişkenlerinin gerçek değerleri için değil, logaritmaları yani r lnylnx için doğrusal bir korelasyon katsayısı bulunabilir. Buna göre, değerinin karesi, kare sapmaların faktör toplamının toplama oranını karakterize edecektir, ancak y için değil, logaritmaları için:

Bu arada, korelasyon indeksi hesaplanırken, logaritmaları değil, y karakteristiğinin karesel sapmalarının toplamları kullanılır. Bu amaçla ortaya çıkan özelliğin teorik değerleri, yani denklemle hesaplanan değerin ve kalan kareler toplamının antilogaritması olarak belirlenir.

R 2 yx hesaplamasının paydası, gerçek y değerlerinin ortalama değerlerinden kare sapmalarının toplamını içerir ve r 2 lnxlny paydası hesaplamaya katılır. Söz konusu göstergelerin payları ve paydaları buna göre farklılık gösterir:

  • - korelasyon indeksinde ve
  • - korelasyon katsayısında.

Sonuçların benzerliği ve bilgisayar programları kullanılarak yapılan hesaplamaların basitliği nedeniyle, doğrusal olmayan fonksiyonlar için bağlantının yakınlığını karakterize etmek amacıyla doğrusal korelasyon katsayısı yaygın olarak kullanılır.

Doğrusal olmayan fonksiyonlarda R ve r veya R ve r değerlerinin y karakteristiğinin değerinin dönüşümü ile yakınlığına rağmen, özelliklerin doğrusal bağımlılığı ile aynı korelasyon katsayısının karakterize ettiği unutulmamalıdır. regresyon, eğer özelliklerin doğrusal bir bağımlılığı ile, bir ve aynı korelasyon katsayısının hem regresyonu karakterize etmesi hem de o zaman y=j(x) fonksiyonu için eğrisel bir bağımlılık ile regresyon x için eşit olmadığı unutulmamalıdır. =f(y).

Korelasyon indeksinin hesaplanması faktör oranını kullandığından ve toplam tutar sapmaların karesi, belirleme katsayısı ile aynı anlama gelir. Özel çalışmalarda doğrusal olmayan ilişkilere ilişkin değere belirleme indeksi adı verilir.

Korelasyon endeksinin anlamlılığının değerlendirilmesi, korelasyon katsayısının güvenilirliğinin değerlendirilmesi ile aynı şekilde gerçekleştirilir.

Korelasyon indeksi, Fisher F testi kullanılarak genel doğrusal olmayan regresyon denkleminin önemini test etmek için kullanılır.

M değeri, karelerin faktör toplamı için serbestlik derecesi sayısını ve (n - m - 1) - artık kareler toplamı için serbestlik derecesi sayısını karakterize eder.

Bir güç fonksiyonu için m = 1 ve F kriterinin formülü, doğrusal bağımlılıkla aynı formu alır:

İkinci dereceden bir parabol için

y = a 0 + a 1 x + a 2 x 2 +em = 2

F kriteri tabloda da hesaplanabilir varyans analizi doğrusal fonksiyon için gösterildiği gibi regresyon sonuçları.

Belirleme indeksi, doğrusal bir fonksiyonun kullanılma olasılığını doğrulamak için belirleme katsayısı ile karşılaştırılabilir. Regresyon çizgisinin eğriliği ne kadar büyük olursa, belirleme katsayısı o kadar az belirleme endeksi olur. Bu göstergelerin benzerliği, regresyon denkleminin biçimini karmaşıklaştırmaya gerek olmadığı ve doğrusal bir fonksiyonun kullanılabileceği anlamına gelir.

Uygulamada, belirleme endeksi ile belirleme katsayısı arasındaki fark 0,1'i geçmezse, ilişkinin doğrusal bir formu olduğu varsayımının haklı olduğu kabul edilir.

Eğer t gerçek >t tablosu ise, dikkate alınan korelasyon göstergeleri arasındaki farklar anlamlıdır ve doğrusal olmayan regresyonun doğrusal bir fonksiyon denklemiyle değiştirilmesi imkansızdır. Pratik olarak, eğer t değeri< 2, то различия между R yx и r yx несущественны, и, следовательно, возможно применение линейной регрессии, даже если есть предположения о некоторой нелинейности рассматриваемых соотношений признаков фактора и результата.

Korelasyon analizi.

Eşleştirilmiş Regresyon Denklemi.

Grafik yöntemini kullanma.

Bu yöntem, incelenen ekonomik göstergeler arasındaki bağlantı biçimini görsel olarak tasvir etmek için kullanılır. Bunu yapmak için, dikdörtgen bir koordinat sisteminde bir grafik çizilir, elde edilen Y karakteristiğinin bireysel değerleri ordinat ekseni boyunca çizilir ve X faktör karakteristiğinin bireysel değerleri apsis ekseni boyunca çizilir.

Sonuç ve faktör özelliklerinin puan kümesine denir korelasyon alanı.

Korelasyon alanına dayanarak bir hipotez ileri sürülebilir (örneğin nüfus) X ve Y'nin tüm olası değerleri arasındaki ilişkinin doğrusal olduğu.

Doğrusal regresyon denklemi: y = bx + a + ε

Burada ε rastgele bir hatadır (sapma, bozulma).

Rastgele bir hatanın varlığının nedenleri:

1. Regresyon modeline anlamlı açıklayıcı değişkenlerin dahil edilememesi;

2. Değişkenlerin toplanması. Örneğin, toplam tüketim fonksiyonu bir denemedir genel ifade Bireysel harcama kararlarının toplamı. Bu yalnızca farklı parametrelere sahip bireysel ilişkilerin bir tahminidir.

3. Model yapısının yanlış tanımlanması;

4. Yanlış işlevsel belirtim;

5. Ölçüm hataları.

Her spesifik gözlem i için sapmalar ε i rastgele olduğundan ve örnekteki değerleri bilinmediğinden, o zaman:

1) x i ve y i gözlemlerinden yalnızca α ve β parametrelerinin tahminleri elde edilebilir

2) α ve β parametrelerinin tahminleri Regresyon modeli sırasıyla doğası gereği rastgele olan a ve b değerleridir, çünkü rastgele bir örneğe karşılık gelir;

Daha sonra tahmin regresyon denklemi (örnek verilerden oluşturulan) y = bx + a + ε formuna sahip olacaktır; burada e i, ε i hatalarının gözlemlenen değerleridir (tahminlerdir) ve a ve b sırasıyla tahminlerdir. bulunması gereken regresyon modelinin α ve β parametreleri.

α ve β parametrelerini tahmin etmek için en küçük kareler yöntemi (en küçük kareler yöntemi) kullanılır. Yöntem en küçük kareler regresyon denkleminin parametrelerinin en iyi (tutarlı, etkili ve tarafsız) tahminlerini verir.

Ancak yalnızca rastgele terim (ε) ve bağımsız değişken (x) ile ilgili belirli önermeler karşılanırsa.

OLS kriteri resmi olarak şu şekilde yazılabilir:

S = ∑(y ben - y * i) 2 → dak

Normal denklem sistemi.

a n + b∑x = ∑y

a∑x + b∑x 2 = ∑y x

Verilerimiz için denklem sistemi şu şekildedir:

15a + 186,4b = 17,01

186,4 a + 2360,9 b = 208,25

İfade ettiğimiz ilk denklemden A ve ikinci denklemde yerine koyalım:

Ampirik regresyon katsayılarını elde ediyoruz: b = -0,07024, a = 2,0069

Regresyon denklemi (ampirik regresyon denklemi):

y = -0,07024 x + 2,0069

Ampirik regresyon katsayıları A Ve B sadece teorik katsayılar βi'nin tahminleridir ve denklemin kendisi yalnızca dikkate alınan değişkenlerin davranışındaki genel eğilimi yansıtır.

Regresyon parametrelerini hesaplamak için bir hesaplama tablosu oluşturacağız (Tablo 1)

1. Regresyon denklemi parametreleri.

Örnek anlamına gelir.

Örnek farklılıklar:

Standart sapma

1.1. Korelasyon katsayısı

Kovaryans.

Bağlantı yakınlığının göstergesini hesaplıyoruz. Bu gösterge, aşağıdaki formülle hesaplanan örnek doğrusal korelasyon katsayısıdır:

Doğrusal korelasyon katsayısı –1 ile +1 arasında değerler alır.

Karakteristikler arasındaki bağlantılar zayıf ve güçlü (yakın) olabilir. Kriterleri Chaddock ölçeğine göre değerlendirilir:

0.1 < r xy < 0.3: слабая;

0.3 < r xy < 0.5: умеренная;

0.5 < r xy < 0.7: заметная;

0.7 < r xy < 0.9: высокая;

0.9 < r xy < 1: весьма высокая;

Örneğimizde Y özelliği ile X faktörü arasındaki ilişki yüksek ve terstir.

Ek olarak doğrusal çift korelasyon katsayısı, regresyon katsayısı b aracılığıyla belirlenebilir:

1.2. Regresyon denklemi(regresyon denkleminin tahmini).

Doğrusal regresyon denklemi y = -0,0702 x + 2,01'dir

Doğrusal bir regresyon denkleminin katsayılarına ekonomik anlam verilebilir.

Regresyon katsayısı b = -0,0702, etkin göstergedeki (y ölçü birimi cinsinden) ortalama değişimi, ölçüm birimi başına x faktörünün değerindeki artış veya azalışla gösterir. Bu örnekte 1 birimlik artışla y ortalama -0,0702 azalmaktadır.

a = 2,01 katsayısı resmi olarak y'nin tahmin edilen düzeyini gösterir, ancak yalnızca x = 0'ın örnek değerlere yakın olması durumunda.

Ancak x=0, x'in örnek değerlerinden uzaksa, o zaman birebir yorum yanlış sonuçlara yol açabilir ve regresyon çizgisi gözlemlenen örnek değerleri oldukça doğru bir şekilde tanımlasa bile bunun da olacağının garantisi yoktur. sola veya sağa tahmin yaparken durum böyle olabilir.

Uygun x değerlerini regresyon denkleminde yerine koyarak, her gözlem için performans göstergesi y(x)'in hizalanmış (tahmin edilen) değerlerini belirleyebiliriz.

Y ve x arasındaki ilişki, regresyon katsayısı b'nin işaretini belirler (eğer > 0 ise - doğrudan ilişki, aksi takdirde - ters). Örneğimizde bağlantı terstir.

1.3. Esneklik katsayısı.

Sonuç göstergesi y ile faktör özelliği x'in ölçüm birimlerinde bir fark varsa, faktörlerin sonuç özelliği üzerindeki etkisini doğrudan değerlendirmek için regresyon katsayılarının (örnek b) kullanılması önerilmez.

Bu amaçlar için esneklik katsayıları ve beta katsayıları hesaplanır.

Ortalama esneklik katsayısı E, sonucun toplamda ortalama yüzde kaç oranında değişeceğini gösterir. en faktör değiştiğinde ortalama değerinden X ortalama değerinin %1'i kadar.

Esneklik katsayısı aşağıdaki formülle bulunur:

Esneklik katsayısı 1'den küçüktür. Dolayısıyla X %1 değişirse Y de %1'den az değişecektir. Başka bir deyişle X'in Y üzerindeki etkisi anlamlı değildir.

Beta katsayısı

Beta katsayısı faktör karakteristiği standart sapma değeri kadar değiştiğinde, kalan bağımsız değişkenlerin değeri sabit bir seviyede sabitlendiğinde, ortaya çıkan özelliğin ortalama değerinin standart sapma değerinin ne kadar değişeceğini gösterir:

Onlar. x'te S x standart sapması kadar bir artış, Y'nin ortalama değerinde 0,82 standart sapma S y kadar bir azalmaya yol açacaktır.

1.4. Yaklaşım hatası.

Mutlak yaklaşım hatasını kullanarak regresyon denkleminin kalitesini değerlendirelim. Ortalama yaklaşım hatası - hesaplanan değerlerin gerçek değerlerden ortalama sapması:

%5-%7 aralığındaki bir yaklaşım hatası, regresyon denkleminin orijinal verilere iyi bir şekilde uyduğunu gösterir.

Hata %7'den az olduğundan bu denklem regresyon olarak kullanılabilir.

Doğrusal regresyon, formun bir denklemini bulmaya gelir

İlk ifade verilen faktör değerlerine izin verir X Ortaya çıkan özelliğin teorik değerlerini, faktörün gerçek değerlerini değiştirerek hesaplayın X. Grafikte teorik değerler regresyon çizgisini temsil eden düz bir çizgi üzerinde yer almaktadır.

Doğrusal regresyonun yapısı, parametrelerinin tahmin edilmesine bağlıdır - A Ve B. Doğrusal regresyon parametrelerini tahmin etmeye yönelik klasik yaklaşım, en küçük kareler yöntemi (LSM).

Minimumu bulmak için, her bir parametre için toplamın (4) kısmi türevlerini hesaplamak gerekir - A Ve B- ve bunları sıfıra eşitleyin.

(5)

Haydi dönüştürelim, elde edelim normal denklem sistemi:

(6)

Bu sistemde N-örneklem büyüklüğü, miktarlar orijinal verilerden kolayca hesaplanır. Sistemi buna göre çözüyoruz A Ve B, şunu elde ederiz:

(7)

. (8)

İfade (7) başka bir biçimde yazılabilir:

(9)

Nerede özellik kovaryansı, faktör dağılımı X.

Parametre B isminde regresyon katsayısı. Değeri, faktördeki bir birimlik değişiklikle sonuçtaki ortalama değişimi gösterir. Regresyon katsayısının açık bir ekonomik yorumunun mümkün olması Doğrusal Denklem Ekonometrik çalışmalarda regresyon oldukça yaygındır.

Resmi olarak A- Anlam sen en x=0. Eğer X sıfır değeri yoktur ve olamaz, o zaman serbest terimin bu yorumu A mantıklı değil. Parametre A ekonomik içeriği olmayabilir. Bunu ekonomik olarak yorumlamaya çalışmak saçmalığa yol açabilir, özellikle de A< 0. Интерпретировать можно лишь знак при параметре A. Eğer A> 0 ise sonuçtaki göreceli değişim, faktördeki değişimden daha yavaş gerçekleşir. Bu göreceli değişiklikleri karşılaştıralım:

< при > 0, > 0

Bazen ortalamadan sapmalar için doğrusal bir ikili regresyon denklemi yazılır:

Nerede , . Bu durumda serbest terim sıfıra eşit olur ve bu da ifade (10)'a yansır. Bu gerçek geometrik değerlendirmelerden kaynaklanmaktadır: aynı düz çizgi (3) regresyon denklemine karşılık gelir, ancak sapmalardaki regresyonu tahmin ederken koordinatların orijini koordinatların olduğu noktaya hareket eder. Bu durumda ifade (8)'de her iki toplam da sıfıra eşit olacaktır, bu da serbest terimin sıfıra eşitliğini gerektirecektir.

Örnek olarak, tek tip ürün üreten bir grup işletme için maliyet fonksiyonunu ele alalım.



Masa 1.

Ürün çıktısı bin birim() Üretim maliyetleri, milyon ruble()
31,1
67,9
141,6
104,7
178,4
104,7
141,6
Toplam: 22 770,0

Normal denklem sistemi şöyle görünecektir:

Bunu çözersek şunu elde ederiz a= -5,79, b=36,84.

Regresyon denklemi:

Değerleri denklemde yerine koyma X, teorik değerleri bulalım sen(tablonun son sütunu).

Büyüklük A ekonomik olarak hiçbir anlamı yok. Değişkenler ise X Ve sen ortalama seviyelerden sapmalar cinsinden ifade edilirse, grafikteki regresyon çizgisi koordinatların orijininden geçecektir. Regresyon katsayısı tahmini değişmeyecektir:

, Nerede , .

Başka bir örnek olarak formun tüketim fonksiyonunu düşünün:

,

burada C tüketimdir, sen-gelir, K,L... seçenekler. Bu doğrusal regresyon denklemi genellikle bilanço denklemiyle birlikte kullanılır:

,

Nerede BEN– yatırımın büyüklüğü, R- tasarruf.

Basitlik açısından, gelirin tüketim ve yatırıma harcandığını varsayalım. Böylece denklem sistemi dikkate alınır:

Bilanço eşitliğinin varlığı, regresyon katsayısının değeri üzerinde birden büyük olamayacak kısıtlamalar getirir; .

Tüketim fonksiyonunun şöyle olduğunu varsayalım:

.

Regresyon katsayısı tüketim eğilimini karakterize etmektedir. Her bin ruble gelirin ortalama 650 rublesinin tüketime, 350 rublesinin ise harcandığını gösteriyor. yatırım yaptı. Yatırım büyüklüğünün gelir üzerindeki regresyonunu hesaplarsak; , o zaman regresyon denklemi şöyle olacaktır: . Bu denklemin tüketim fonksiyonundan türetildiği için tanımlanmasına gerek yoktur. Bu iki denklemin regresyon katsayıları eşitlikle ilişkilidir:

Regresyon katsayısı birden büyük çıkarsa, o zaman sadece gelir değil tasarruflar da tüketime harcanır.



Çarpanı hesaplamak için tüketim fonksiyonundaki regresyon katsayısı kullanılır:

Burada M≈2,86, yani ek yatırım 1 bin ruble. Açık uzun vadeli diğer şeyler eşit olmak kaydıyla 2,86 bin ruble ek gelir elde edecek.

Doğrusal regresyonda doğrusal korelasyon katsayısı bağlantının yakınlığının bir göstergesi olarak görev yapar. R:

Değerleri şu sınırlar dahilindedir: . Eğer B> 0, o zaman ne zaman B< 0 . Örneğe göre bu, üretim maliyetlerinin çıktı hacmine çok yakın bir bağımlılığı anlamına gelir.

Doğrusal bir fonksiyona uyma kalitesini değerlendirmek için hesaplayın determinasyon katsayısı doğrusal korelasyon katsayısının karesi olarak r2. Ortaya çıkan özelliğin varyans payını karakterize eder sen ortaya çıkan özelliğin toplam varyansındaki regresyonla açıklanır:

Değer varyansın payını karakterize eder sen modelde dikkate alınmayan diğer faktörlerin etkisinden kaynaklanmaktadır.

Örnekte. Regresyon denklemi varyansın %98,2'sini açıklamaktadır ve diğer faktörler %1,8'ini açıklamaktadır, bu artık varyanstır.

OLS'nin ön koşulları (Gauss-Markov koşulları)

Yukarıda da belirtildiği gibi aralarındaki bağlantı sen Ve X ikili regresyonda işlevsel değil, korelasyoneldir. Bu nedenle parametre tahminleri A Ve Böyle rastgele değişkenlerözellikleri önemli ölçüde rastgele bileşen ε'nin özelliklerine bağlıdır. En küçük kareleri kullanarak en iyi sonuçları elde etmek için rastgele sapmaya (Gauss-Markov koşulları) ilişkin aşağıdaki önkoşulların karşılanması gerekir:

1 0 . Beklenen değer tüm gözlemler için rastgele sapma sıfırdır: .

20. Rastgele sapmaların varyansı sabittir: .

Bu önkoşulun yapılabilirliğine denir eş varyanslılık(sapma varyansının sabitliği). Bu önermenin imkansızlığına denir değişen varyans(sapma varyansının tutarsızlığı)

otuz. Rastgele sapmalar e ben Ve e jşunlar için birbirinden bağımsızdır:

Bu durumun yapılabilirliğine denir otokorelasyonun olmaması.

4 0. Rastgele varyans açıklayıcı değişkenlerden bağımsız olmalıdır.

Tipik olarak, eğer belirli bir modeldeki açıklayıcı değişkenler rastgele değilse bu koşul otomatik olarak karşılanır. Ayrıca bu önkoşulun ekonometrik modeller için uygulanabilirliği ilk üçüne kıyasla o kadar kritik değildir.

Belirtilen ön koşullar yerine getirilirse, o zaman Gauss teoremi-Markova: OLS kullanılarak elde edilen tahminler (7) ve (8), tüm doğrusal tarafsız tahminler sınıfında en küçük varyansa sahiptir. .

Dolayısıyla, Gauss-Markov koşulları karşılanırsa, (7) ve (8) tahminleri yalnızca regresyon katsayılarının tarafsız tahminleri değil aynı zamanda en etkili olanlardır; değerlere göre doğrusal olan bu parametrelerin diğer tahminleriyle karşılaştırıldığında en küçük dağılıma sahiptir sen ben.

Regresyon analizini kullanan yetkin bir araştırmacıyı beceriksiz bir araştırmacıdan ayıran şey, Gauss-Markov koşullarının öneminin anlaşılmasıdır. Bu koşullar sağlanmıyorsa araştırmacının bunun farkında olması gerekir. Düzeltici eylem mümkünse analistin bunu yapabilmesi gerekir. Durum düzeltilemezse araştırmacı bunun sonuçları ne kadar ciddi şekilde etkileyebileceğini değerlendirebilmelidir.

Bir regresyon denklemi kullanarak tahmin yapmak için regresyon katsayılarını ve denklemlerini hesaplamanız gerekir. Ve burada tahminin doğruluğunu etkileyen başka bir sorun daha var. Bu genellikle herkesin olmadığı gerçeğinde yatmaktadır. olası değerler değişkenler X ve Y, yani Tahmin problemlerinde ortak dağılımların genel popülasyonu bilinmemekte, sadece bu genel popülasyondan bir örnek bilinmektedir. Sonuç olarak, tahmin yaparken, rastgele bileşene ek olarak, başka bir hata kaynağı da ortaya çıkar - numunenin genel popülasyona eksik yazışmasından kaynaklanan hatalar ve regresyon denkleminin katsayılarının belirlenmesinde ortaya çıkan hatalar.

Yani nüfusun bilinmemesi nedeniyle, kesin değerler katsayılar ve regresyon denklemleri belirlenemez. Bu bilinmeyen popülasyondan bir örnek kullanılarak yalnızca gerçek katsayıların tahminleri elde edilebilir.

Böyle bir değiştirme sonucunda tahmin hatalarının minimum düzeyde olması için değerlendirmenin, elde edilen tarafsız ve verimli değerleri garanti eden bir yöntem kullanılarak yapılması gerekir. Yöntem, aynı popülasyondan yeni örneklerle birkaç kez tekrarlandığında koşul sağlanırsa tarafsız tahminler sağlar. Yöntem, aynı popülasyondan yeni örneklerle birkaç kez tekrarlandığında a ve b katsayılarının minimum dağılımı sağlanırsa etkili tahminler sağlar; koşullar sağlanır ve yerine getirilir.

Olasılık teorisinde, en küçük kareler yöntemi uygulanarak örnek verilere dayalı doğrusal regresyon denkleminin katsayılarının verimliliğinin ve tarafsız tahminlerinin sağlandığı bir teorem kanıtlanmıştır.

En küçük kareler yönteminin özü aşağıdaki gibidir. Her örnek nokta için formun bir denklemi yazılır . Daha sonra hesaplanan ve gerçek değerler arasındaki hata bulunur. Bu tür değerleri bulma ve tüm n noktalar için minimum karesel hataların toplamını sağlayan optimizasyon probleminin çözümü, yani. arama sorununa çözüm , katsayıların tarafsız ve etkili tahminlerini verir ve . Eşleştirilmiş doğrusal regresyon durumunda bu çözüm şu şekildedir:

Bir örneklemden bu şekilde elde edilen genel popülasyon için regresyon katsayılarının gerçek değerlerinin tarafsız ve etkili tahminlerinin, bir kez uygulandığında hatalara karşı hiçbir şekilde garanti vermediğine dikkat edilmelidir. Garanti, bu işlemin aynı popülasyondan diğer örneklerle tekrar tekrar tekrarlanması sonucunda, diğer yöntemlere kıyasla daha az miktarda hatanın garanti edilmesi ve bu hataların yayılmasının minimum düzeyde olmasıdır.

Regresyon denkleminin elde edilen katsayıları, regresyon çizgisinin konumunu belirler; orijinal numunenin noktalarından oluşan bulutun ana eksenidir. Her iki katsayının da çok kesin bir anlamı vardır. Katsayı değeri gösterir, ancak çoğu durumda anlamlı değildir, ayrıca çoğu zaman da anlamlı değildir, bu nedenle katsayıya ilişkin verilen yorumun dikkatli kullanılması gerekir. Anlamın daha evrensel bir yorumu aşağıdaki gibidir. Eğer öyleyse, bağımsız değişkendeki göreceli değişim (yüzde değişim) her zaman bağımlı değişkendeki göreceli değişimden daha azdır.

Katsayı, bağımsız değişkenin bir birim değişmesi durumunda bağımlı değişkenin kaç birim değişeceğini gösterir. Katsayı genellikle regresyon katsayısı olarak adlandırılır ve 'den daha önemli olduğu vurgulanır. Özellikle bağımlı ve bağımsız değişkenlerin değerleri yerine ortalama değerlerinden sapmalarını alırsak regresyon denklemi şu şekle dönüştürülür: . Başka bir deyişle, dönüştürülmüş koordinat sisteminde herhangi bir regresyon çizgisi koordinatların orijininden geçer (Şekil 13) ve herhangi bir katsayı yoktur.

Şekil 13. Dönüştürülen koordinat sistemindeki regresyon bağımlılığının konumu.

Regresyon denkleminin parametreleri bize bağımlı ve bağımsız değişkenlerin birbirleriyle nasıl ilişkili olduğunu söyler ancak ilişkinin yakınlık derecesi hakkında bize hiçbir şey söylemez. veri bulutunun ana ekseninin konumunu gösterir, ancak bağlantının sıkılık derecesi (bulutun ne kadar dar veya geniş olduğu) hakkında hiçbir şey söylemez.

Bölge bölgeleri için 200X'e ait veriler sağlanmaktadır.

Bölge numarası Sağlıklı bir kişinin günlük kişi başına ortalama geçim ücreti, rub., x Ortalama günlük ücret, rub., y
1 78 133
2 82 148
3 87 134
4 79 154
5 89 162
6 106 195
7 67 139
8 88 158
9 73 152
10 87 162
11 76 159
12 115 173

Egzersiz yapmak:

1. Bir korelasyon alanı oluşturun ve bağlantının şekli hakkında bir hipotez formüle edin.

2. Doğrusal regresyon denkleminin parametrelerini hesaplayın

4. Ortalama (genel) esneklik katsayısını kullanarak, faktör ile sonuç arasındaki ilişkinin gücüne ilişkin karşılaştırmalı bir değerlendirme yapın.

7. Faktörün tahmin değeri ortalama seviyesinden %10 oranında artarsa ​​sonucun tahmin değerini hesaplayınız. Önem düzeyi için tahmin güven aralığını belirleyin.

Çözüm:

Haydi karar verelim bu görev Excel'i kullanarak.

1. Mevcut x ve y verilerini karşılaştırarak, örneğin bunları x faktörünün artan sırasına göre sıralayarak, kişi başına düşen ortalama geçim seviyesindeki bir artış günlük ortalamayı arttırdığında, özellikler arasında doğrudan bir ilişkinin varlığı gözlemlenebilir. maaş. Buna dayanarak, özellikler arasındaki ilişkinin doğrudan olduğu ve düz çizgi denklemiyle tanımlanabileceği varsayımında bulunabiliriz. Aynı sonuç grafiksel analize dayanarak da doğrulanmaktadır.

Bir korelasyon alanı oluşturmak için Excel PPP'yi kullanabilirsiniz. Başlangıç ​​verilerini sırayla girin: önce x, sonra y.

Veri içeren hücrelerin alanını seçin.

Ardından şunu seçin: Ekle / Dağılım Grafiği / İşaretçilerle DağılımŞekil 1'de gösterildiği gibi.

Şekil 1 Korelasyon alanının yapısı

Korelasyon alanının analizi, noktalar neredeyse düz bir çizgide yer aldığından doğrusala yakın bir bağımlılığın varlığını gösterir.

2. Doğrusal regresyon denkleminin parametrelerini hesaplamak
Yerleşik istatistiksel işlevi kullanalım DÜZ.

Bunun için:

1) Analiz edilen verileri içeren mevcut bir dosyayı açın;
2) Regresyon istatistiklerinin sonuçlarını görüntülemek için 5x2'lik boş hücre alanını (5 satır, 2 sütun) seçin.
3) Etkinleştir İşlev Sihirbazı: ana menüde seçin Formüller / Ekleme İşlevi.
4) Pencerede Kategori alıyorsun İstatistiksel, işlev penceresinde - DÜZ. Düğmeye bas TAMAMŞekil 2'de gösterildiği gibi;

Şekil 2 İşlev Sihirbazı İletişim Kutusu

5) Fonksiyon argümanlarını doldurun:

Bilinen değerler

X'in bilinen değerleri

Devamlı - Boole değeri denklemde serbest bir terimin varlığını veya yokluğunu gösteren; Sabit = 1 ise serbest terim olağan şekilde hesaplanır, Sabit = 0 ise serbest terim 0'dır;

İstatistik- regresyon analizine ilişkin ek bilgilerin görüntülenip görüntülenmeyeceğini belirten mantıksal bir değer. İstatistik = 1 ise, o zaman Ek Bilgiler görüntülenirse, İstatistik = 0 ise yalnızca denklem parametrelerinin tahminleri görüntülenir.

Düğmeye bas TAMAM;

Şekil 3 LINEST Fonksiyon Bağımsız Değişkenleri İletişim Kutusu

6) Final masasının ilk elemanı seçilen alanın sol üst hücresinde görünecektir. Tablonun tamamını açmak için düğmeye basın ve ardından tuş kombinasyonuna ++ .

Ek regresyon istatistikleri aşağıdaki diyagramda gösterilen sıraya göre yayınlanacaktır:

Katsayı değeri b Bir değerin katsayısı
Standart hata b Standart hata a
Standart hata y
F istatistiği
Regresyon kareler toplamı

Şekil 4 DOT fonksiyonunu hesaplamanın sonucu

Regresyon seviyesini elde ettik:

Sonuç olarak: Kişi başına düşen ortalama geçim seviyesinde 1 ruble artışla. ortalama günlük ücret ortalama 0,92 ruble artıyor.

%52 varyasyon anlamına gelir ücretler(y) x faktörünün (kişi başına ortalama geçim düzeyi) değişimi ve %48'in modelde yer almayan diğer faktörlerin etkisiyle açıklanmaktadır.

Hesaplanan belirleme katsayısı kullanılarak korelasyon katsayısı hesaplanabilir: .

Bağlantı yakın olarak değerlendirilir.

4. Ortalama (genel) esneklik katsayısını kullanarak faktörün sonuç üzerindeki etkisinin gücünü belirleriz.

Düz bir çizgi denklemi için ortalama (toplam) esneklik katsayısını aşağıdaki formülü kullanarak belirleriz:

X değerlerine sahip hücrelerin alanını seçip seçerek ortalama değerleri bulacağız. Formüller / Otomatik Toplam / Ortalama ve aynısını y'nin değerleriyle de yapacağız.

Şekil 5 Ortalama fonksiyon değerlerinin ve argümanının hesaplanması

Yani kişi başına ortalama yaşam maliyeti ortalama değerinden %1 oranında değişirse ortalama günlük ücret ortalama %0,51 oranında değişecektir.

Bir veri analizi aracı kullanma Regresyon mevcut:
- regresyon istatistiklerinin sonuçları,
- varyans analizinin sonuçları,
- sonuçlar güvenilirlik aralığı,
- artıklar ve regresyon çizgisi uydurma grafikleri,
- artıklar ve normal olasılık.

Prosedür aşağıdaki gibidir:

1) erişimi kontrol edin Analiz paketi. Ana menüde şunu seçin: Dosya/Seçenekler/Eklentiler.

2) Açılır listede KontrolÖğeyi seçin Excel eklentileri ve düğmeye basın Gitmek.

3) Pencerede Eklentiler kutuyu kontrol et Analiz paketi ve ardından düğmeye tıklayın TAMAM.

Eğer Analiz paketi alan listesinde yok Mevcut eklentiler, düğmesine basın Gözden geçirmek Bir arama gerçekleştirmek için.

Analiz paketinin bilgisayarınızda kurulu olmadığını belirten bir mesaj alırsanız tıklayın. Evet yüklemek için.

4) Ana menüde şunu seçin: Veri / Veri Analizi / Analiz Araçları / Regresyon ve ardından düğmeye tıklayın TAMAM.

5) Veri giriş ve çıkış parametreleri iletişim kutusunu doldurun:

Giriş aralığı Y- sonuç niteliğinin verilerini içeren aralık;

Giriş aralığı X- faktör karakteristiğinin verilerini içeren aralık;

Etiketler- ilk satırın sütun adlarını içerip içermediğini gösteren bir işaret;

Sabit - sıfır- denklemde serbest bir terimin varlığını veya yokluğunu gösteren bir işaret;

Çıkış aralığı- gelecekteki aralığın sol üst hücresini belirtmek yeterlidir;

6) Yeni çalışma sayfası - yeni sayfa için isteğe bağlı bir ad belirleyebilirsiniz.

Daha sonra düğmeye tıklayın TAMAM.

Şekil 6 Regresyon aracına ilişkin parametrelerin girilmesine yönelik iletişim kutusu

Problem verilerine ilişkin regresyon analizi sonuçları Şekil 7'de sunulmaktadır.

Şekil 7 Regresyon aracını kullanmanın sonucu

5. Kullanarak değerlendirelim ortalama hata Denklemlerin yaklaşım kalitesi. Şekil 8'de sunulan regresyon analizinin sonuçlarını kullanalım.

Şekil 8 “Kalanların Çekilmesi” regresyon aracının kullanılmasının sonucu

Şekil 9’daki gibi yeni bir tablo oluşturalım. C sütununda hesaplıyoruz bağıl hata formülü kullanarak yaklaşımlar:

Şekil 9 Ortalama yaklaşım hatasının hesaplanması

Ortalama yaklaşım hatası aşağıdaki formül kullanılarak hesaplanır:

Oluşturulan modelin kalitesi %8 - 10'u geçmediğinden iyi olarak değerlendirilmektedir.

6. Tablo c'den regresyon istatistikleri(Şekil 4) Fisher'in F testinin gerçek değerini yazıyoruz:

Çünkü %5 anlamlılık düzeyinde, regresyon denkleminin anlamlı olduğu sonucuna varabiliriz (ilişki kanıtlanmıştır).

8. Değerlendirme İstatistiksel anlamlılık Regresyon parametrelerini Öğrenci t istatistiklerini kullanarak ve her göstergenin güven aralığını hesaplayarak gerçekleştireceğiz.

Göstergeler ile sıfır arasındaki istatistiksel olarak önemsiz bir fark hakkında H 0 hipotezini öne sürdük:

.

serbestlik derecesi sayısı için

Şekil 7'de gerçek t-istatistik değerleri verilmiştir:

Korelasyon katsayısı için t testi iki şekilde hesaplanabilir:

Yöntem I:

Nerede - korelasyon katsayısının rastgele hatası.

Hesaplama için verileri Şekil 7'deki tablodan alacağız.

Yöntem II:

Gerçek t-istatistik değerleri tablo değerlerini aşıyor:

Bu nedenle H 0 hipotezi reddedilir, yani regresyon parametreleri ve korelasyon katsayısı tesadüfen sıfırdan farklı değildir, ancak istatistiksel olarak anlamlıdır.

a parametresi için güven aralığı şu şekilde tanımlanır:

a parametresi için Şekil 7'de gösterilen %95 limitleri şöyleydi:

Regresyon katsayısı için güven aralığı şu şekilde tanımlanır:

Regresyon katsayısı b için Şekil 7'de gösterilen %95 limitleri şöyleydi:

Güven aralıklarının üst ve alt sınırlarının analizi, olasılık ile şu sonuca varır: a ve b parametreleri belirtilen sınırlar dahilinde olduğundan sıfır değer almaz; istatistiksel olarak anlamsız değildir ve sıfırdan önemli ölçüde farklı değildir.

7. Regresyon denkleminin elde edilen tahminleri, onun tahmin için kullanılmasına olanak sağlar. Tahmin edilen yaşam maliyeti ise:

O zaman yaşam maliyetinin tahmin edilen değeri şöyle olacaktır:

Tahmin hatasını aşağıdaki formülü kullanarak hesaplıyoruz:

Nerede

Ayrıca Excel PPP'yi kullanarak varyansı da hesaplayacağız. Bunun için:

1) Etkinleştir İşlev Sihirbazı: ana menüde seçin Formüller / Ekleme İşlevi.

3) Faktör karakteristiğinin sayısal verilerini içeren aralığı doldurun. Tıklamak TAMAM.

Şekil 10 Varyansın hesaplanması

Varyans değerini aldık

Serbestlik derecesi başına kalan varyansı hesaplamak için Şekil 7'de gösterildiği gibi varyans analizinin sonuçlarını kullanacağız.

Y'nin bireysel değerlerini 0,95 olasılıkla tahmin etmek için güven aralıkları şu ifadeyle belirlenir:

Aralık, öncelikle gözlem hacminin küçük olması nedeniyle oldukça geniştir. Genel olarak ortalama aylık maaş tahmininin güvenilir olduğu ortaya çıktı.

Sorunun durumu şu kaynaktan alınmıştır: Workshop on ekonometri: Proc. harçlık / I.I. Eliseeva, S.V. Kurysheva, N.M. Gordeenko ve diğerleri; Ed. I.I. Eliseeva. - M .: Finans ve İstatistik, 2003. - 192 s .: hasta.



Sitede yeni

>

En popüler