Rumah Kebersihan Estimasi parameter persamaan regresi. Estimasi Parameter Regresi Linier

Estimasi parameter persamaan regresi. Estimasi Parameter Regresi Linier

Persamaan regresi selalu dilengkapi dengan indikator keeratan hubungan. Menggunakan regresi linier indikator tersebut adalah koefisien korelasi linier r yt. Ada berbagai modifikasi formula koefisien linier korelasi.

Perlu diingat bahwa nilai koefisien korelasi linier menilai keeratan hubungan antar karakteristik yang dipertimbangkan dalam bentuk liniernya. Oleh karena itu kedekatan nilai mutlak koefisien korelasi linier ke nol bukan berarti tidak ada hubungan antar karakteristik.

Untuk menilai kualitas seleksi fungsi linear kuadrat dari koefisien korelasi linier r yt 2, yang disebut koefisien determinasi, dihitung. Koefisien determinasi mencirikan proporsi varians dari karakteristik efektif pada t yang dijelaskan oleh regresi dalam total varians dari karakteristik efektif.

Persamaan regresi nonlinier, seperti pada ketergantungan linier, dilengkapi dengan indikator korelasi yaitu indeks korelasi R.

Parabola orde kedua, seperti polinomial lebih banyak pesanan tinggi, jika dilinearisasi, berbentuk persamaan regresi berganda. Jika nonlinier relatif terhadap penjelasan persamaan variabel regresi pada saat linierisasi berbentuk persamaan linier regresi berpasangan, kemudian untuk menilai keeratan hubungan dapat digunakan koefisien korelasi linier yang nilainya dalam hal ini akan bertepatan dengan indeks korelasi.

Berbeda halnya ketika transformasi persamaan menjadi bentuk linier melibatkan variabel terikat. Dalam hal ini, koefisien korelasi linier berdasarkan nilai fitur yang ditransformasikan hanya memberikan perkiraan perkiraan kedekatan hubungan dan tidak sesuai secara numerik dengan indeks korelasi. Ya untuk fungsi daya

setelah beralih ke persamaan linier logaritmik

lny = lna + blnx

koefisien korelasi linier dapat dicari bukan untuk nilai sebenarnya dari variabel x dan y, tetapi untuk logaritmanya, yaitu r lnylnx. Oleh karena itu, kuadrat nilainya akan mencirikan rasio jumlah faktor deviasi kuadrat terhadap total, tetapi tidak untuk y, tetapi untuk logaritmanya:

Sedangkan dalam menghitung indeks korelasi, yang digunakan adalah penjumlahan kuadrat deviasi karakteristik y, bukan logaritmanya. Untuk itu ditentukan nilai teoritis dari sifat yang dihasilkan, yaitu sebagai antilogaritma dari nilai yang dihitung dengan persamaan dan jumlah sisa kuadrat sebagai.

Penyebut perhitungan R 2 yx melibatkan jumlah total deviasi kuadrat nilai aktual y dari nilai rata-ratanya, dan penyebut r 2 lnxlny ikut serta dalam perhitungan. Pembilang dan penyebut indikator yang dipertimbangkan berbeda-beda:

  • - dalam indeks korelasi dan
  • - dalam koefisien korelasi.

Karena kesamaan hasil dan kesederhanaan perhitungan menggunakan program komputer, koefisien korelasi linier banyak digunakan untuk mengkarakterisasi keeratan hubungan fungsi nonlinier.

Terlepas dari kedekatan nilai R dan r atau R dan r dalam fungsi nonlinier dengan transformasi nilai karakteristik y, harus diingat bahwa jika, dengan ketergantungan linier karakteristik, koefisien korelasi yang sama mencirikan regresi, harus diingat bahwa jika, dengan ketergantungan linier dari karakteristik, koefisien korelasi yang sama mencirikan regresi keduanya dan, karena, maka dengan ketergantungan lengkung untuk fungsi y=j(x) tidak sama dengan regresi x =f(kamu).

Karena perhitungan indeks korelasi menggunakan rasio faktor dan jumlah total simpangan kuadrat, maka mempunyai arti yang sama dengan koefisien determinasi. Dalam kajian khusus, nilai hubungan nonlinier disebut indeks determinasi.

Penilaian signifikansi indeks korelasi dilakukan dengan cara yang sama seperti penilaian reliabilitas koefisien korelasi.

Indeks korelasi digunakan untuk menguji signifikansi persamaan regresi nonlinier secara keseluruhan dengan menggunakan uji Fisher F.

Nilai m mencirikan jumlah derajat kebebasan untuk jumlah faktor kuadrat, dan (n - m - 1) - jumlah derajat kebebasan untuk jumlah sisa kuadrat.

Untuk fungsi pangkat m = 1 dan rumus kriteria F berbentuk sama dengan ketergantungan linier:

Untuk parabola derajat kedua

y = a 0 + a 1 x + a 2 x 2 +em = 2

Kriteria F juga dapat dihitung dalam tabel analisis varians hasil regresi, seperti yang ditunjukkan untuk fungsi linier.

Indeks determinasi dapat dibandingkan dengan koefisien determinasi untuk membenarkan kemungkinan penggunaan fungsi linier. Semakin besar kelengkungan garis regresi maka koefisien determinasi indeks determinasinya semakin kecil. Kesamaan indikator-indikator tersebut berarti tidak perlu memperumit bentuk persamaan regresi dan dapat digunakan fungsi linier.

Dalam prakteknya, jika selisih antara indeks determinasi dan koefisien determinasi tidak melebihi 0,1, maka asumsi bentuk hubungan linier dianggap dapat dibenarkan.

Jika t fakta > t tabel, maka perbedaan antara indikator korelasi yang dipertimbangkan adalah signifikan dan tidak mungkin mengganti regresi nonlinier dengan persamaan fungsi linier. Praktisnya, jika nilainya t< 2, то различия между R yx и r yx несущественны, и, следовательно, возможно применение линейной регрессии, даже если есть предположения о некоторой нелинейности рассматриваемых соотношений признаков фактора и результата.

Analisis korelasi.

Persamaan Regresi Berpasangan.

Menggunakan metode grafis.

Metode ini digunakan untuk menggambarkan secara visual bentuk hubungan antar indikator ekonomi yang diteliti. Untuk melakukan ini, grafik digambar dalam sistem koordinat persegi panjang, nilai individual dari karakteristik resultan Y diplot sepanjang sumbu ordinat, dan nilai individual dari karakteristik faktor X diplot sepanjang sumbu absis.

Himpunan titik-titik karakteristik resultan dan faktor disebut bidang korelasi.

Berdasarkan bidang korelasinya, dapat diajukan hipotesis (untuk populasi) bahwa hubungan antara semua kemungkinan nilai X dan Y adalah linier.

Persamaan regresi liniernya adalah y = bx + a + ε

Di sini ε adalah kesalahan acak (deviasi, gangguan).

Alasan adanya kesalahan acak:

1. Kegagalan memasukkan variabel penjelas yang signifikan ke dalam model regresi;

2. Agregasi variabel. Misalnya, fungsi konsumsi total adalah suatu usaha ekspresi umum agregat keputusan pembelanjaan individu. Ini hanyalah perkiraan hubungan individu yang memiliki parameter berbeda.

3. Deskripsi struktur model yang salah;

4. Spesifikasi fungsional yang salah;

5. Kesalahan pengukuran.

Karena deviasi i untuk setiap observasi spesifik i bersifat acak dan nilainya dalam sampel tidak diketahui, maka:

1) dari pengamatan x i dan y i hanya dapat diperoleh estimasi parameter α dan β

2) Estimasi parameter α dan β model regresi masing-masing adalah nilai a dan b yang bersifat acak, karena sesuai dengan sampel acak;

Maka persamaan regresi penduga (dibangun dari data sampel) akan berbentuk y = bx + a + ε, di mana e i adalah nilai pengamatan (perkiraan) dari kesalahan ε i , dan a dan b masing-masing merupakan perkiraan parameter α dan β model regresi yang harus ditemukan.

Untuk memperkirakan parameter α dan β digunakan metode kuadrat terkecil (least square method). metode kuadrat terkecil memberikan estimasi terbaik (konsisten, efisien dan tidak bias) terhadap parameter persamaan regresi.

Tetapi hanya jika premis tertentu terpenuhi mengenai suku acak (ε) dan variabel bebas (x).

Secara formal kriteria OLS dapat dituliskan sebagai berikut:

S = ∑(y i - y * i) 2 → menit

Sistem persamaan normal.

a n + b∑x = ∑y

a∑x + b∑x 2 = ∑yx

Untuk data kami, sistem persamaan memiliki bentuk

15a + 186,4b = 17,01

186,4 a + 2360,9 b = 208,25

Dari persamaan pertama kita nyatakan A dan substitusikan ke persamaan kedua:

Kami memperoleh koefisien regresi empiris: b = -0,07024, a = 2,0069

Persamaan regresi (persamaan regresi empiris):

kamu = -0,07024 x + 2,0069

Koefisien regresi empiris A Dan B hanyalah perkiraan koefisien teoretis β i, dan persamaan itu sendiri hanya mencerminkan tren umum perilaku variabel yang dipertimbangkan.

Untuk menghitung parameter regresi, kita akan membuat tabel perhitungan (Tabel 1)

1. Parameter persamaan regresi.

Contoh artinya.

Varians sampel:

Deviasi standar

1.1. Koefisien korelasi

Kovarian.

Kami menghitung indikator kedekatan koneksi. Indikator ini merupakan koefisien korelasi linier sampel, yang dihitung dengan rumus:

Koefisien korelasi linier mengambil nilai dari –1 hingga +1.

Hubungan antar karakteristik bisa lemah dan kuat (dekat). Kriteria mereka dinilai pada skala Chaddock:

0.1 < r xy < 0.3: слабая;

0.3 < r xy < 0.5: умеренная;

0.5 < r xy < 0.7: заметная;

0.7 < r xy < 0.9: высокая;

0.9 < r xy < 1: весьма высокая;

Dalam contoh kita, hubungan antara sifat Y dan faktor X adalah tinggi dan berbanding terbalik.

Selain itu, koefisien korelasi pasangan linier dapat ditentukan melalui koefisien regresi b:

1.2. Persamaan regresi(estimasi persamaan regresi).

Persamaan regresi liniernya adalah y = -0,0702 x + 2,01

Koefisien persamaan regresi linier dapat diberi arti ekonomis.

Koefisien regresi b = -0,0702 menunjukkan rata-rata perubahan indikator efektif (dalam satuan pengukuran y) dengan kenaikan atau penurunan nilai faktor x per satuan pengukurannya. Dalam contoh ini, dengan kenaikan 1 satuan, y turun rata-rata sebesar -0,0702.

Koefisien a = 2,01 secara formal menunjukkan tingkat prediksi y, namun hanya jika x = 0 mendekati nilai sampel.

Tetapi jika x=0 jauh dari nilai sampel x, interpretasi literal dapat memberikan hasil yang salah, dan bahkan jika garis regresi menggambarkan nilai sampel yang diamati dengan cukup akurat, tidak ada jaminan bahwa hal ini juga akan terjadi. menjadi kasus ketika melakukan ekstrapolasi ke kiri atau ke kanan.

Dengan mensubstitusi nilai x yang sesuai ke dalam persamaan regresi, kita dapat menentukan nilai selaras (prediksi) dari indikator kinerja y(x) untuk setiap observasi.

Hubungan antara y dan x menentukan tanda koefisien regresi b (jika > 0 - hubungan langsung, sebaliknya - terbalik). Dalam contoh kita, koneksinya terbalik.

1.3. Koefisien elastisitas.

Tidak disarankan menggunakan koefisien regresi (dalam contoh b) untuk menilai secara langsung pengaruh faktor terhadap karakteristik yang dihasilkan jika terdapat perbedaan satuan pengukuran indikator resultan y dan karakteristik faktor x.

Untuk tujuan ini, koefisien elastisitas dan koefisien beta dihitung.

Koefisien elastisitas rata-rata E menunjukkan berapa persentase rata-rata perubahan hasil agregat pada dari nilai rata-ratanya ketika faktor tersebut berubah X sebesar 1% dari nilai rata-ratanya.

Koefisien elastisitas dicari dengan rumus:

Koefisien elastisitasnya kurang dari 1. Oleh karena itu, jika X berubah sebesar 1%, Y akan berubah kurang dari 1%. Dengan kata lain pengaruh X terhadap Y tidak signifikan.

Koefisien beta

Koefisien beta menunjukkan pada bagian mana dari nilai simpangan bakunya nilai rata-rata karakteristik yang dihasilkan akan berubah bila karakteristik faktor tersebut berubah sebesar nilai simpangan bakunya dengan nilai variabel bebas yang tersisa ditetapkan pada tingkat yang konstan:

Itu. kenaikan x sebesar simpangan baku S x akan menyebabkan penurunan nilai rata-rata Y sebesar 0,82 simpangan baku S y .

1.4. Kesalahan perkiraan.

Mari kita evaluasi kualitas persamaan regresi menggunakan kesalahan perkiraan absolut. Kesalahan perkiraan rata-rata - penyimpangan rata-rata nilai yang dihitung dari nilai sebenarnya:

Kesalahan perkiraan antara 5%-7% menunjukkan kesesuaian persamaan regresi dengan data asli.

Karena errornya kurang dari 7%, persamaan ini dapat digunakan sebagai regresi.

Regresi linier bertujuan untuk menemukan persamaan bentuk

Ekspresi pertama memungkinkan nilai faktor tertentu X menghitung nilai teoritis dari karakteristik yang dihasilkan dengan mensubstitusikan nilai sebenarnya dari faktor tersebut ke dalamnya X. Pada grafik, nilai teoritis terletak pada garis lurus yang mewakili garis regresi.

Konstruksi regresi linier dilakukan untuk memperkirakan parameternya - A Dan B. Pendekatan klasik untuk memperkirakan parameter regresi linier didasarkan pada metode kuadrat terkecil (LSM).

Untuk mencari nilai minimum, perlu menghitung turunan parsial dari jumlah (4) untuk setiap parameter - A Dan B- dan samakan dengan nol.

(5)

Mari bertransformasi, kita dapat sistem persamaan normal:

(6)

Dalam sistem ini N- ukuran sampel, jumlahnya mudah dihitung dari data asli. Kami memecahkan sistem sehubungan dengan A Dan B, kita mendapatkan:

(7)

. (8)

Ekspresi (7) dapat ditulis dalam bentuk lain:

(9)

Di mana kovarians sifat, dispersi faktor X.

Parameter B ditelepon koefisien regresi. Nilainya menunjukkan rata-rata perubahan hasil dengan perubahan faktor sebesar satu satuan. Kemungkinan interpretasi ekonomi yang jelas terhadap koefisien regresi telah dibuat persamaan linier regresi cukup umum dalam studi ekonometrik.

Secara formal A- arti kamu pada x=0. Jika X tidak dan tidak dapat bernilai nol, maka penafsiran ini merupakan istilah bebas A tidak masuk akal. Parameter A mungkin tidak memiliki konten ekonomi. Upaya untuk menafsirkannya secara ekonomi dapat menimbulkan absurditas, terutama bila A< 0. Интерпретировать можно лишь знак при параметре A. Jika A> 0, maka perubahan relatif hasil terjadi lebih lambat dibandingkan perubahan faktor. Mari kita bandingkan perubahan relatif ini:

< при > 0, > 0

Terkadang persamaan regresi linier berpasangan ditulis untuk penyimpangan dari mean:

Di mana , . Dalam hal ini, suku bebasnya sama dengan nol, yang tercermin dalam ekspresi (10). Fakta ini mengikuti pertimbangan geometris: garis lurus yang sama (3) berhubungan dengan persamaan regresi, tetapi ketika memperkirakan regresi dalam deviasi, titik asal koordinat berpindah ke titik dengan koordinat . Dalam hal ini, dalam ekspresi (8) kedua jumlahnya akan sama dengan nol, yang berarti suku bebasnya sama dengan nol.

Mari kita perhatikan, sebagai contoh, untuk sekelompok perusahaan yang memproduksi satu jenis produk, fungsi biaya



Meja 1.

Output produk ribuan unit() Biaya produksi, juta rubel()
31,1
67,9
141,6
104,7
178,4
104,7
141,6
Jumlah: 22 770,0

Sistem persamaan normal akan terlihat seperti:

Memecahkannya, kita dapatkan a= -5,79, b=36,84.

Persamaan regresinya adalah:

Mengganti nilai ke dalam persamaan X, mari kita cari nilai teoritisnya kamu(kolom terakhir tabel).

Besarnya A tidak masuk akal secara ekonomi. Jika variabel X Dan kamu dinyatakan dalam penyimpangan dari tingkat rata-rata, maka garis regresi pada grafik akan melewati titik asal koordinat. Estimasi koefisien regresi tidak akan berubah:

, Di mana , .

Sebagai contoh lain, perhatikan fungsi konsumsi dalam bentuk:

,

di mana C adalah konsumsi, kamu-penghasilan, K,L- pilihan. Persamaan regresi linier ini biasanya digunakan bersamaan dengan persamaan neraca:

,

Di mana SAYA– ukuran investasi, R- tabungan.

Untuk mempermudah, asumsikan bahwa pendapatan dibelanjakan untuk konsumsi dan investasi. Dengan demikian, sistem persamaan dianggap:

Adanya kesetaraan neraca memberikan batasan pada nilai koefisien regresi, yang tidak boleh lebih besar dari satu, yaitu. .

Misalkan fungsi konsumsinya adalah:

.

Koefisien regresi mencirikan kecenderungan mengkonsumsi. Ini menunjukkan bahwa dari setiap seribu rubel pendapatan, rata-rata 650 rubel dihabiskan untuk konsumsi, dan 350 rubel. diinvestasikan. Jika kita menghitung regresi ukuran investasi terhadap pendapatan, yaitu. , maka persamaan regresinya adalah . Persamaan ini tidak perlu didefinisikan karena diturunkan dari fungsi konsumsi. Koefisien regresi kedua persamaan ini dihubungkan dengan persamaan:

Jika koefisien regresi lebih besar dari satu, maka tidak hanya pendapatan, tetapi juga tabungan yang dibelanjakan untuk konsumsi.



Koefisien regresi pada fungsi konsumsi digunakan untuk menghitung pengganda:

Di Sini M≈2.86, jadi investasi tambahannya adalah 1.000 rubel. pada jangka panjang akan menghasilkan, jika hal-hal lain dianggap sama, penghasilan tambahan sebesar 2,86 ribu rubel.

Dalam regresi linier, koefisien korelasi linier berperan sebagai indikator keeratan hubungan R:

Nilai-nilainya berada dalam batas-batas: . Jika B> 0, lalu kapan B< 0 . Berdasarkan contoh, hal ini berarti ketergantungan biaya produksi yang sangat erat terhadap volume output.

Untuk menilai kualitas pemasangan fungsi linier, hitunglah koefisien determinasi sebagai kuadrat dari koefisien korelasi linier r 2. Ini mencirikan bagian varians dari karakteristik yang dihasilkan kamu dijelaskan dengan regresi varians total dari sifat yang dihasilkan:

Nilai tersebut mencirikan bagian varians kamu, disebabkan oleh pengaruh faktor lain yang tidak diperhitungkan dalam model.

Dalam contoh. Persamaan regresi menjelaskan 98,2% varians, dan faktor lain menyumbang 1,8%, ini adalah varians sisa.

Prasyarat OLS (kondisi Gauss-Markov)

Seperti disebutkan di atas, hubungan antara kamu Dan X dalam regresi berpasangan tidak fungsional, tetapi korelasional. Oleh karena itu, estimasi parameter A Dan B adalah variabel acak, yang sifat-sifatnya sangat bergantung pada sifat-sifat komponen acak ε. Untuk mendapatkan hasil terbaik dengan menggunakan kuadrat terkecil, prasyarat mengenai deviasi acak (kondisi Gauss – Markov) berikut harus dipenuhi:

1 0 . Nilai yang diharapkan deviasi acak adalah nol untuk semua observasi: .

20. Varians deviasi acak adalah konstan: .

Kelayakan prasyarat ini disebut homoskedastisitas(keteguhan varian deviasi). Ketidakmungkinan premis ini disebut heteroskedastisitas(ketidakkekalan varian deviasi)

tiga puluh. Penyimpangan acak aku Dan j independen satu sama lain untuk:

Kelayakan kondisi ini disebut tidak adanya autokorelasi.

4 0 . Varians acak harus tidak bergantung pada variabel penjelas.

Biasanya, kondisi ini terpenuhi secara otomatis jika variabel penjelas dalam model tertentu tidak acak. Selain itu, kelayakan prasyarat model ekonometrik ini tidak begitu penting dibandingkan dengan tiga prasyarat pertama.

Jika prasyarat yang ditentukan terpenuhi, maka teorema Gauss-Markova: Estimasi (7) dan (8) yang diperoleh dengan menggunakan OLS memiliki varian terkecil di kelas semua estimasi linier tak bias .

Jadi, jika kondisi Gauss-Markov terpenuhi, estimasi (7) dan (8) tidak hanya merupakan estimasi koefisien regresi yang tidak bias, tetapi juga yang paling efektif, yaitu. memiliki dispersi terkecil dibandingkan dengan estimasi lain dari parameter ini yang linier terhadap nilainya kamu aku.

Pemahaman tentang pentingnya kondisi Gauss-Markovlah yang membedakan peneliti yang kompeten yang menggunakan analisis regresi dari peneliti yang tidak kompeten. Jika kondisi ini tidak terpenuhi, peneliti harus menyadari hal ini. Jika tindakan korektif memungkinkan, maka analis harus dapat mengambil tindakan tersebut. Jika situasinya tidak dapat diperbaiki, peneliti harus dapat menilai seberapa serius hal ini dapat mempengaruhi hasil.

Untuk memprediksi menggunakan persamaan regresi, Anda perlu menghitung koefisien dan persamaan regresi. Dan di sini ada masalah lain yang mempengaruhi keakuratan peramalan. Itu terletak pada kenyataan bahwa biasanya tidak semua orang nilai yang mungkin variabel X dan Y, yaitu populasi umum distribusi gabungan dalam masalah peramalan tidak diketahui, hanya sampel dari populasi umum ini yang diketahui. Akibatnya, ketika meramalkan, selain komponen acak, sumber kesalahan lain muncul - kesalahan yang disebabkan oleh ketidaklengkapan korespondensi sampel dengan populasi umum dan kesalahan yang diakibatkannya dalam menentukan koefisien persamaan regresi.

Dengan kata lain, karena populasinya tidak diketahui, nilai yang tepat koefisien dan persamaan regresi tidak dapat ditentukan. Dengan menggunakan sampel dari populasi yang tidak diketahui ini, seseorang hanya dapat memperoleh estimasi koefisien dan yang sebenarnya.

Agar kesalahan prediksi akibat penggantian tersebut menjadi minimal, maka penilaian harus dilakukan dengan metode yang menjamin diperoleh nilai yang tidak bias dan efisien. Metode ini memberikan perkiraan yang tidak bias jika, ketika diulang beberapa kali dengan sampel baru dari populasi yang sama, kondisinya terpenuhi. Metode ini memberikan perkiraan yang efektif jika, ketika diulang beberapa kali dengan sampel baru dari populasi yang sama, dispersi minimum dari koefisien a dan b dapat dipastikan, yaitu. kondisi dan terpenuhi.

Dalam teori probabilitas, sebuah teorema telah dibuktikan yang menyatakan bahwa efisiensi dan estimasi koefisien persamaan regresi linier yang tidak bias berdasarkan data sampel dipastikan dengan menerapkan metode kuadrat terkecil.

Inti dari metode kuadrat terkecil adalah sebagai berikut. Untuk setiap titik sampel, persamaan bentuknya ditulis . Kemudian ditemukan kesalahan antara nilai yang dihitung dan nilai sebenarnya. Solusi dari masalah optimasi untuk menemukan nilai-nilai tersebut dan yang memberikan jumlah minimum kesalahan kuadrat untuk semua n titik, yaitu. solusi untuk masalah pencarian , memberikan estimasi koefisien dan . Untuk kasus regresi linier berpasangan, solusinya berbentuk:

Perlu dicatat bahwa estimasi yang tidak bias dan efektif dari nilai sebenarnya dari koefisien regresi untuk populasi umum yang diperoleh dengan cara ini dari suatu sampel sama sekali tidak menjamin terhadap kesalahan ketika diterapkan satu kali. Jaminannya adalah, sebagai hasil dari pengulangan berulang-ulang operasi ini dengan sampel lain dari populasi yang sama, dijamin jumlah kesalahan yang lebih kecil dibandingkan metode lain dan penyebaran kesalahan ini akan minimal.

Koefisien persamaan regresi yang diperoleh menentukan posisi garis regresi, yang merupakan sumbu utama awan yang dibentuk oleh titik-titik sampel asli. Kedua koefisien tersebut mempunyai arti yang sangat pasti. Koefisien menunjukkan nilai pada , namun dalam banyak kasus hal ini tidak masuk akal; selain itu, seringkali juga tidak masuk akal; oleh karena itu, penafsiran koefisien yang diberikan harus digunakan dengan hati-hati. Penafsiran makna yang lebih universal adalah sebagai berikut. Jika , maka perubahan relatif variabel bebas (persentase perubahan) selalu lebih kecil dari perubahan relatif variabel terikat.

Koefisien menunjukkan berapa satuan perubahan variabel terikat apabila variabel bebas berubah sebesar satu satuan. Koefisien sering disebut koefisien regresi, dengan penekanan bahwa koefisien tersebut lebih penting daripada . Secara khusus, jika alih-alih nilai variabel terikat dan bebas kita mengambil penyimpangannya dari nilai rata-ratanya, maka persamaan regresi diubah menjadi bentuk . Dengan kata lain, dalam sistem koordinat yang ditransformasikan, setiap garis regresi melewati titik asal koordinat (Gbr. 13) dan tidak ada koefisien.

Gambar 13. Posisi ketergantungan regresi pada sistem koordinat yang ditransformasikan.

Parameter persamaan regresi memberi tahu kita bagaimana variabel dependen dan independen berhubungan satu sama lain, tetapi tidak memberi tahu kita apa pun tentang derajat kedekatan hubungan tersebut, yaitu. menunjukkan posisi sumbu utama awan data, tetapi tidak menjelaskan apa pun tentang tingkat kekencangan koneksi (seberapa sempit atau lebar awan tersebut).

Untuk wilayah wilayah, disediakan data 200X.

Nomor wilayah Rata-rata upah hidup per kapita per hari untuk satu orang berbadan sehat, gosok., x Gaji harian rata-rata, gosok., y
1 78 133
2 82 148
3 87 134
4 79 154
5 89 162
6 106 195
7 67 139
8 88 158
9 73 152
10 87 162
11 76 159
12 115 173

Latihan:

1. Membangun bidang korelasi dan merumuskan hipotesis tentang bentuk hubungannya.

2. Menghitung parameter persamaan regresi linier

4. Dengan menggunakan koefisien elastisitas rata-rata (umum), berikan penilaian komparatif mengenai kekuatan hubungan antara faktor dan hasilnya.

7. Hitung nilai prediksi hasil jika nilai prediksi faktor meningkat 10% dari rata-ratanya. Tentukan interval kepercayaan perkiraan untuk tingkat signifikansi.

Larutan:

Mari kita putuskan tugas ini menggunakan Excel.

1. Dengan membandingkan data x dan y yang tersedia, misalnya, mengurutkannya berdasarkan faktor x, kita dapat mengamati adanya hubungan langsung antara karakteristik, ketika peningkatan rata-rata tingkat subsisten per kapita meningkatkan rata-rata harian gaji. Berdasarkan hal tersebut dapat kita asumsikan bahwa hubungan antar sifat bersifat langsung dan dapat digambarkan dengan persamaan garis lurus. Kesimpulan yang sama dikonfirmasi berdasarkan analisis grafis.

Untuk membangun bidang korelasi, Anda bisa menggunakan Excel PPP. Masukkan data awal secara berurutan: pertama x, lalu y.

Pilih area sel yang berisi data.

Lalu pilih: Sisipkan / Sebarkan Plot / Sebarkan dengan Spidol seperti yang ditunjukkan pada Gambar 1.

Gambar 1 Konstruksi bidang korelasi

Analisis bidang korelasi menunjukkan adanya ketergantungan yang mendekati bujursangkar, karena titik-titiknya terletak hampir pada satu garis lurus.

2. Untuk menghitung parameter persamaan regresi linier
Mari gunakan fungsi statistik bawaan GARIS.

Untuk ini:

1) Buka file yang ada berisi data yang dianalisis;
2) Pilih area sel kosong berukuran 5x2 (5 baris, 2 kolom) untuk menampilkan hasil statistik regresi.
3) Aktifkan Penyihir Fungsi: di menu utama pilih Rumus / Sisipkan Fungsi.
4) Di jendela Kategori kamu mengambil Statistik, di jendela fungsi - GARIS. Klik tombolnya OKE seperti yang ditunjukkan pada Gambar 2;

Gambar 2 Kotak Dialog Wizard Fungsi

5) Isi argumen fungsi:

Nilai yang diketahui untuk

Nilai x yang diketahui

Konstan - nilai boolean, yang menunjukkan ada tidaknya suku bebas dalam persamaan; jika Konstanta = 1, maka suku bebasnya dihitung dengan cara biasa, jika Konstanta = 0, maka suku bebasnya adalah 0;

Statistik- nilai logika yang menunjukkan apakah akan menampilkan informasi tambahan pada analisis regresi atau tidak. Jika Statistik = 1, maka informasi tambahan ditampilkan, jika Statistik = 0, maka hanya perkiraan parameter persamaan yang ditampilkan.

Klik tombolnya OKE;

Gambar 3 Kotak Dialog Argumen Fungsi LINEST

6) Elemen pertama dari tabel akhir akan muncul di sel kiri atas area yang dipilih. Untuk membuka seluruh tabel, tekan tombol , lalu ke kombinasi tombol ++ .

Statistik regresi tambahan akan ditampilkan dalam urutan yang ditunjukkan pada diagram berikut:

Nilai koefisien b Koefisien suatu nilai
Kesalahan standarb Kesalahan standar a
Kesalahan standar y
F-statistik
Jumlah regresi kuadrat

Gambar 4 Hasil perhitungan fungsi LINEST

Kami mendapatkan tingkat regresi:

Kami menyimpulkan: Dengan peningkatan rata-rata tingkat subsisten per kapita sebesar 1 gosok. upah harian rata-rata meningkat rata-rata 0,92 rubel.

Berarti 52% variasi upah(y) dijelaskan oleh variasi faktor x - rata-rata tingkat subsisten per kapita, dan 48% - oleh pengaruh faktor lain yang tidak termasuk dalam model.

Dengan menggunakan koefisien determinasi yang dihitung, koefisien korelasi dapat dihitung: .

Keterhubungannya dinilai dekat.

4. Dengan menggunakan koefisien elastisitas rata-rata (umum), kita menentukan kekuatan pengaruh faktor terhadap hasil.

Untuk persamaan garis lurus, kita menentukan koefisien elastisitas rata-rata (total) dengan menggunakan rumus:

Kita akan mencari nilai rata-rata dengan memilih luas sel dengan nilai x dan memilih Rumus / JumlahOtomatis / Rata-rata, dan kita akan melakukan hal yang sama dengan nilai y.

Gambar 5 Perhitungan nilai rata-rata fungsi dan argumennya

Jadi, jika rata-rata biaya hidup per kapita berubah sebesar 1% dari nilai rata-ratanya, maka rata-rata upah harian akan berubah rata-rata sebesar 0,51%.

Menggunakan alat analisis data Regresi tersedia:
- hasil statistik regresi,
- hasil analisis varians,
- hasil interval kepercayaan,
- grafik kesesuaian garis residu dan regresi,
- residu dan probabilitas normal.

Prosedurnya adalah sebagai berikut:

1) periksa akses ke Paket analisis. Di menu utama, pilih: File/Opsi/Add-on.

2) Dalam daftar tarik-turun Kontrol pilih barang Add-in Excel dan tekan tombolnya Pergi.

3) Di jendela Pengaya centang kotaknya Paket analisis lalu klik tombolnya OKE.

Jika Paket analisis tidak ada dalam daftar lapangan Add-on yang tersedia, tekan tombolnya Tinjauan untuk melakukan pencarian.

Jika Anda menerima pesan yang menunjukkan bahwa paket analisis tidak diinstal pada komputer Anda, klik Ya untuk menginstalnya.

4) Di menu utama, pilih: Data / Analisis Data / Alat Analisis / Regresi lalu klik tombolnya OKE.

5) Isi kotak dialog parameter input dan output data:

Interval masukan Y- rentang yang berisi data atribut yang dihasilkan;

Interval masukan X- rentang yang berisi data karakteristik faktor;

Tag- sebuah bendera yang menunjukkan apakah baris pertama berisi nama kolom atau tidak;

Konstan - nol- bendera yang menunjukkan ada tidaknya suku bebas dalam persamaan;

Interval keluaran- cukup dengan menunjukkan sel kiri atas rentang masa depan;

6) Lembar kerja baru - Anda dapat menentukan nama sembarang untuk lembar baru.

Kemudian klik tombolnya OKE.

Gambar 6 Kotak dialog untuk memasukkan parameter alat Regresi

Hasil analisis regresi data permasalahan disajikan pada Gambar 7.

Gambar 7 Hasil penggunaan alat regresi

5. Mari kita evaluasi dengan menggunakan kesalahan rata-rata kualitas perkiraan persamaan. Mari kita gunakan hasil analisis regresi yang disajikan pada Gambar 8.

Gambar 8 Hasil penggunaan alat regresi “Penarikan sisa”

Mari kita buat tabel baru seperti yang ditunjukkan pada Gambar 9. Di kolom C kita menghitung Kesalahan relatif perkiraan menurut rumus:

Gambar 9 Perhitungan kesalahan perkiraan rata-rata

Kesalahan perkiraan rata-rata dihitung menggunakan rumus:

Kualitas model yang dibangun dinilai baik karena tidak melebihi 8 - 10%.

6. Dari tabel c statistik regresi(Gambar 4) kita tuliskan nilai sebenarnya dari uji F Fisher:

Karena pada tingkat signifikansi 5%, maka dapat disimpulkan bahwa persamaan regresi tersebut signifikan (terbukti hubungannya).

8. Evaluasi signifikansi statistik Kami akan melakukan parameter regresi menggunakan statistik-t Student dan dengan menghitung interval kepercayaan setiap indikator.

Kami mengajukan hipotesis H 0 tentang perbedaan yang tidak signifikan secara statistik antara indikator dan nol:

.

untuk jumlah derajat kebebasan

Gambar 7 memiliki nilai t-statistik aktual:

Uji-t untuk koefisien korelasi dapat dihitung dengan dua cara:

Metode I:

Di mana - kesalahan acak dari koefisien korelasi.

Data untuk perhitungan akan kita ambil dari tabel pada Gambar 7.

Metode II:

Nilai t-statistik sebenarnya melebihi nilai tabel:

Oleh karena itu hipotesis H 0 ditolak, yaitu parameter regresi dan koefisien korelasi tidak kebetulan berbeda dari nol, tetapi signifikan secara statistik.

Interval kepercayaan untuk parameter a didefinisikan sebagai

Untuk parameter a, batas 95% seperti pada Gambar 7 adalah:

Interval kepercayaan untuk koefisien regresi didefinisikan sebagai

Untuk koefisien regresi b, batas 95% seperti pada Gambar 7 adalah:

Analisis batas atas dan batas bawah interval kepercayaan mengarah pada kesimpulan bahwa dengan probabilitas parameter a dan b, karena berada dalam batas yang ditentukan, tidak mengambil nilai nol, mis. secara statistik tidak signifikan dan berbeda secara signifikan dari nol.

7. Estimasi persamaan regresi yang diperoleh memungkinkan untuk digunakan dalam peramalan. Jika perkiraan biaya hidup adalah:

Maka perkiraan nilai biaya hidup adalah:

Kami menghitung kesalahan perkiraan menggunakan rumus:

Di mana

Kami juga akan menghitung varians menggunakan Excel PPP. Untuk ini:

1) Aktifkan Penyihir Fungsi: di menu utama pilih Rumus / Sisipkan Fungsi.

3) Isikan range yang berisi data numerik karakteristik faktor. Klik OKE.

Gambar 10 Perhitungan varians

Kami mendapat nilai varians

Untuk menghitung variance residual per derajat kebebasan, kita akan menggunakan hasil analisis variance seperti pada Gambar 7.

Interval kepercayaan untuk memprediksi nilai individu y dengan probabilitas 0,95 ditentukan oleh ekspresi:

Intervalnya cukup lebar, terutama karena kecilnya volume pengamatan. Secara umum, perkiraan gaji bulanan rata-rata dapat diandalkan.

Kondisi soal diambil dari: Workshop ekonometrika: Proc. tunjangan / I.I. Eliseeva, S.V. Kurysheva, N.M. Gordeenko dan lainnya; Ed. aku. Eliseeva. - M.: Keuangan dan Statistik, 2003. - 192 hal.: sakit.



Baru di situs

>

Paling populer