Rumah stomatitis Melakukan analisis regresi. Metode statistik matematika

Melakukan analisis regresi. Metode statistik matematika

Analisis regresi dan korelasi adalah metode penelitian statistik. Ini adalah cara paling umum untuk menunjukkan ketergantungan suatu parameter pada satu atau lebih variabel independen.

Di bawah secara spesifik contoh praktis Mari kita lihat dua analisis yang sangat populer di kalangan ekonom. Kami juga akan memberikan contoh memperoleh hasil dengan menggabungkannya.

Analisis Regresi di Excel

Menunjukkan pengaruh beberapa nilai (independen, independen) terhadap variabel dependen. Misalnya, bagaimana jumlah penduduk yang aktif secara ekonomi bergantung pada jumlah perusahaan, ukurannya upah dan parameter lainnya. Atau: bagaimana investasi asing, harga energi, dll mempengaruhi tingkat PDB.

Hasil analisis memungkinkan Anda untuk mengidentifikasi prioritas. Dan berdasarkan faktor-faktor utama tersebut, memprediksi, merencanakan pengembangan kawasan prioritas, dan mengambil keputusan pengelolaan.

Regresi terjadi:

  • linier (y = a + bx);
  • parabola (y = a + bx + cx 2);
  • eksponensial (y = a * exp(bx));
  • pangkat (y = a*x^b);
  • hiperbolik (y = b/x + a);
  • logaritma (y = b * 1n(x) + a);
  • eksponensial (y = a * b^x).

Mari kita lihat contoh pembuatan model regresi di Excel dan menginterpretasikan hasilnya. Mari kita ambil jenis regresi linier.

Tugas. Di 6 perusahaan, rata-rata gaji bulanan dan jumlah karyawan yang berhenti dianalisis. Perlu diketahui ketergantungan jumlah pegawai yang berhenti terhadap gaji rata-rata.

Model regresi linier memiliki bentuk berikut:

Y = a 0 + a 1 x 1 +…+a k x k.

Dimana a adalah koefisien regresi, x adalah variabel yang mempengaruhi, k adalah banyaknya faktor.

Dalam contoh kita, Y adalah indikator berhentinya karyawan. Faktor yang mempengaruhi adalah upah (x).

Excel memiliki fungsi bawaan yang bisa membantu Anda menghitung parameter model regresi linier. Namun add-on “Paket Analisis” akan melakukan ini lebih cepat.

Kami mengaktifkan alat analisis yang kuat:

Setelah diaktifkan, add-on akan tersedia di tab Data.

Sekarang mari kita lakukan analisis regresi itu sendiri.



Pertama-tama, kita memperhatikan R-kuadrat dan koefisiennya.

R-squared adalah koefisien determinasi. Dalam contoh kita – 0,755, atau 75,5%. Artinya parameter model yang dihitung menjelaskan 75,5% hubungan antar parameter yang diteliti. Semakin tinggi koefisien determinasi maka semakin baik model tersebut. Bagus - di atas 0,8. Buruk – kurang dari 0,5 (analisis seperti itu hampir tidak dapat dianggap masuk akal). Dalam contoh kita – “tidak buruk”.

Koefisien 64,1428 menunjukkan berapa Y jika seluruh variabel dalam model yang dipertimbangkan sama dengan 0. Artinya, nilai parameter yang dianalisis juga dipengaruhi oleh faktor lain yang tidak dijelaskan dalam model.

Koefisien -0,16285 menunjukkan bobot variabel X terhadap Y. Artinya, rata-rata gaji bulanan dalam model ini mempengaruhi jumlah orang yang berhenti merokok dengan bobot -0,16285 (tingkat pengaruhnya kecil). Tanda “-” menunjukkan dampak negatif: semakin tinggi gaji, semakin sedikit orang yang berhenti. Itu adil.



Analisis Korelasi di Excel

Analisis korelasi membantu mengetahui apakah terdapat hubungan antar indikator dalam satu atau dua sampel. Misalnya antara waktu pengoperasian suatu mesin dengan biaya perbaikan, harga peralatan dan lama pengoperasian, tinggi dan berat badan anak, dll.

Jika terdapat keterkaitan, maka apakah kenaikan salah satu parameter menyebabkan peningkatan (korelasi positif) atau penurunan (negatif) parameter lainnya. Analisis korelasi membantu analis menentukan apakah nilai suatu indikator dapat digunakan untuk memprediksi arti yang mungkin lain.

Koefisien korelasi dilambangkan dengan r. Bervariasi dari +1 hingga -1. Klasifikasi korelasi untuk daerah yang berbeda akan berbeda. Ketika koefisiennya 0 ketergantungan linier tidak ada antar sampel.

Mari kita lihat cara mencari koefisien korelasi menggunakan Excel.

Untuk mencari koefisien berpasangan digunakan fungsi CORREL.

Tujuan: Mengetahui apakah ada hubungan antara waktu pengoperasian mesin bubut dengan biaya pemeliharaannya.

Tempatkan kursor di sel mana pun dan tekan tombol fx.

  1. Pada kategori “Statistik”, pilih fungsi CORREL.
  2. Argumen “Array 1” - rentang nilai pertama – waktu pengoperasian mesin: A2:A14.
  3. Argumen “Array 2” - rentang nilai kedua – biaya perbaikan: B2:B14. Klik Oke.

Untuk menentukan jenis koneksi, Anda perlu melihat angka absolut koefisiennya (setiap bidang kegiatan memiliki skalanya sendiri).

Untuk analisis korelasi beberapa parameter (lebih dari 2), akan lebih mudah menggunakan "Analisis Data" (add-on "Paket Analisis"). Anda perlu memilih korelasi dari daftar dan menentukan array. Semua.

Koefisien yang dihasilkan akan ditampilkan dalam matriks korelasi. Seperti ini:

Analisis korelasi dan regresi

Dalam praktiknya, kedua teknik ini sering digunakan bersamaan.

Contoh:


Sekarang data analisis regresi sudah terlihat.

Tujuan utama analisis regresi terdiri dari penentuan bentuk komunikasi analitis dimana perubahan karakteristik efektif disebabkan oleh pengaruh satu atau lebih karakteristik faktor, dan himpunan semua faktor lain yang juga mempengaruhi karakteristik efektif diambil sebagai nilai konstan dan rata-rata.
Masalah Analisis Regresi:
a) Membangun bentuk ketergantungan. Mengenai sifat dan bentuk hubungan antar fenomena, dibedakan antara regresi linier positif dan nonlinier serta regresi linier negatif dan nonlinier.
b) Menentukan fungsi regresi dalam bentuk persamaan matematis dari satu jenis atau lainnya dan menetapkan pengaruh variabel penjelas terhadap variabel terikat.
c) Evaluasi Bukan nilai-nilai yang diketahui variabel tak bebas. Dengan menggunakan fungsi regresi, Anda dapat mereproduksi nilai variabel terikat dalam interval nilai tertentu dari variabel penjelas (yaitu, menyelesaikan masalah interpolasi) atau mengevaluasi jalannya proses di luar interval yang ditentukan (yaitu, memecahkan masalah ekstrapolasi). Hasilnya adalah perkiraan nilai variabel terikat.

Regresi berpasangan merupakan persamaan hubungan antara dua variabel y dan x: , dimana y adalah variabel terikat (atribut resultan); x adalah variabel penjelas independen (faktor fitur).

Ada regresi linier dan nonlinier.
Regresi linier: y = a + bx + ε
Regresi nonlinier dibagi menjadi dua kelas: regresi nonlinier terhadap variabel penjelas yang dimasukkan dalam analisis, tetapi linier terhadap parameter taksiran, dan regresi nonlinier terhadap parameter taksiran.
Regresi yang nonlinier pada variabel penjelas:

Regresi yang nonlinier terhadap parameter yang diestimasi: Konstruksi persamaan regresi dilakukan untuk memperkirakan parameternya. Untuk memperkirakan parameter regresi linier dalam parameter, gunakan metode kuadrat terkecil(MNC). Metode kuadrat terkecil memungkinkan untuk memperoleh estimasi parameter di mana jumlah deviasi kuadrat dari nilai aktual karakteristik resultan y dari nilai teoritis adalah minimal, yaitu.
.
Untuk persamaan linier dan nonlinier yang dapat direduksi menjadi persamaan linier, selesaikan sistem selanjutnya mengenai a dan b:

Anda dapat menggunakan rumus siap pakai yang mengikuti sistem ini:

Kedekatan hubungan antara fenomena yang diteliti dinilai koefisien linier korelasi berpasangan untuk regresi linier:

dan indeks korelasi - untuk regresi nonlinier:

Kualitas model yang dibangun akan dinilai berdasarkan koefisien (indeks) determinasi, serta rata-rata kesalahan aproksimasi.
Kesalahan perkiraan rata-rata - penyimpangan rata-rata nilai yang dihitung dari nilai sebenarnya:
.
Batas nilai yang diperbolehkan tidak lebih dari 8-10%.
Koefisien elastisitas rata-rata menunjukkan berapa persentase rata-rata hasil y akan berubah dari nilai rata-ratanya ketika faktor x berubah sebesar 1% dari nilai rata-ratanya:
.

Tujuan analisis varians adalah untuk menganalisis varians variabel terikat:
,
Di mana - jumlah total penyimpangan kuadrat;
- jumlah deviasi kuadrat akibat regresi (“dijelaskan” atau “faktorial”);
- jumlah sisa deviasi kuadrat.
Porsi varians yang dijelaskan oleh regresi dalam varians total dari karakteristik resultan y dicirikan oleh koefisien (indeks) determinasi R2:

Koefisien determinasi merupakan kuadrat dari koefisien atau indeks korelasi.

Uji F - menilai kualitas persamaan regresi - terdiri dari pengujian hipotesis No tentang tidak signifikannya statistik persamaan regresi dan indikator keeratan hubungan. Untuk melakukan hal ini, dilakukan perbandingan antara fakta F aktual dan nilai kritis (tabel) F tabel dari kriteria F Fisher. F fakta ditentukan dari perbandingan nilai faktor dan varians sisa yang dihitung per derajat kebebasan:
,
dimana n adalah jumlah unit populasi; m adalah jumlah parameter untuk variabel x.
F tabel adalah nilai maksimum yang mungkin dari kriteria di bawah pengaruh faktor acak pada derajat kebebasan dan tingkat signifikansi tertentu a. Tingkat signifikansi a adalah kemungkinan ditolaknya hipotesis yang benar, asalkan hipotesis itu benar. Biasanya a diambil sama dengan 0,05 atau 0,01.
Jika F tabel< F факт, то Н о - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если F табл >F fakta, maka hipotesis H o tidak ditolak dan persamaan regresi tidak signifikan dan tidak dapat diandalkan diakui.
Untuk tarif signifikansi statistik koefisien regresi dan korelasi, uji-t Student dan interval kepercayaan untuk setiap indikator dihitung. Sebuah hipotesis diajukan tentang sifat acak dari indikator, yaitu. tentang perbedaan signifikan mereka dari nol. Penilaian signifikansi koefisien regresi dan korelasi menggunakan uji-t Student dilakukan dengan membandingkan nilainya dengan besarnya kesalahan acak:
; ; .
Kesalahan acak parameter regresi linier dan koefisien korelasi ditentukan dengan rumus:



Membandingkan nilai aktual dan kritis (tabel) dari t-statistik - t tabel dan t fakta - kita menerima atau menolak hipotesis H o.
Hubungan antara uji F Fisher dan statistik t Student dinyatakan dengan persamaan

Jika t tabel< t факт то H o отклоняется, т.е. a, b и не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х. Если t табл >Fakta bahwa hipotesis H o tidak ditolak dan sifat acak dari pembentukan a, b atau diakui.
Untuk menghitung interval kepercayaan, kita menentukan kesalahan maksimum D untuk setiap indikator:
, .
Rumus untuk menghitung interval kepercayaan adalah sebagai berikut:
; ;
; ;
Jika nol berada dalam interval kepercayaan, mis. Jika batas bawah negatif dan batas atas positif, maka parameter taksiran dianggap nol, karena tidak dapat mengambil nilai positif dan negatif secara bersamaan.
Nilai perkiraan ditentukan dengan mensubstitusikan nilai (perkiraan) yang sesuai ke dalam persamaan regresi. Kesalahan standar rata-rata perkiraan dihitung:
,
Di mana
dan sedang dibangun interval kepercayaan ramalan:
; ;
Di mana .

Contoh solusi

Tugas No.1. Untuk tujuh wilayah wilayah Ural pada tahun 199X, diketahui nilai dua karakteristik.
Tabel 1.
Diperlukan: 1. Untuk mengkarakterisasi ketergantungan y pada x, hitung parameter fungsi berikut:
a) linier;
b) pangkat (Anda harus terlebih dahulu melakukan prosedur linierisasi variabel dengan mengambil logaritma kedua bagian);
c) demonstratif;
d) hiperbola sama sisi (Anda juga perlu mengetahui cara melakukan pra-linearisasi model ini).
2. Evaluasi setiap model secara menyeluruh kesalahan rata-rata perkiraan dan uji F Fisher.

Solusi (Opsi No. 1)

Untuk menghitung parameter a dan b regresi linier (penghitungan dapat dilakukan dengan menggunakan kalkulator).
menyelesaikan sistem persamaan normal untuk A Dan B:
Berdasarkan data awal, kami menghitung :
kamu X yx x 2 kamu 2 dan saya
aku 68,8 45,1 3102,88 2034,01 4733,44 61,3 7,5 10,9
2 61,2 59,0 3610,80 3481,00 3745,44 56,5 4,7 7,7
3 59,9 57,2 3426,28 3271,84 3588,01 57,1 2,8 4,7
4 56,7 61,8 3504,06 3819,24 3214,89 55,5 1,2 2,1
5 55,0 58,8 3234,00 3457,44 3025,00 56,5 -1,5 2,7
6 54,3 47,2 2562,96 2227,84 2948,49 60,5 -6,2 11,4
7 49,3 55,2 2721,36 3047,04 2430,49 57,8 -8,5 17,2
Total 405,2 384,3 22162,34 21338,41 23685,76 405,2 0,0 56,7
Menikahi. arti (Jumlah/n) 57,89 54,90 3166,05 3048,34 3383,68 X X 8,1
S 5,74 5,86 X X X X X X
hal 2 32,92 34,34 X X X X X X


Persamaan regresi: kamu = 76,88 - 0,35X. Dengan peningkatan upah harian rata-rata sebesar 1 gosok. porsi pengeluaran untuk pembelian produk makanan menurun rata-rata 0,35 poin persentase.
Mari kita hitung koefisien korelasi pasangan linier:

Koneksinya moderat, terbalik.
Mari kita tentukan koefisien determinasi:

Variasi hasil sebesar 12,7% dijelaskan oleh variasi faktor x. Mengganti nilai sebenarnya ke dalam persamaan regresi X, mari kita tentukan nilai teoretis (yang dihitung). . Mari kita cari nilai rata-rata kesalahan perkiraan:

Rata-rata, nilai yang dihitung menyimpang dari nilai sebenarnya sebesar 8,1%.
Mari kita hitung kriteria F:

sejak 1< F < ¥ , Seharusnya dipertimbangkan F -1 .
Nilai yang dihasilkan menunjukkan perlunya menerima hipotesis Tapi oh sifat acak dari ketergantungan yang teridentifikasi dan ketidakberartian statistik dari parameter persamaan dan indikator kedekatan hubungan.
1b. Pembangunan model pangkat didahului dengan prosedur linierisasi variabel. Pada contoh, linearisasi dilakukan dengan mengambil logaritma dari kedua ruas persamaan:


Di manaY=lg(y), X=lg(x), C=lg(a).

Untuk perhitungan kami menggunakan data pada tabel. 1.3.

Tabel 1.3

Y X YX Y2 X 2 dan saya
1 1,8376 1,6542 3,0398 3,3768 2,7364 61,0 7,8 60,8 11,3
2 1,7868 1,7709 3,1642 3,1927 3,1361 56,3 4,9 24,0 8,0
3 1,7774 1,7574 3,1236 3,1592 3,0885 56,8 3,1 9,6 5,2
4 1,7536 1,7910 3,1407 3,0751 3,2077 55,5 1,2 1,4 2,1
5 1,7404 1,7694 3,0795 3,0290 3,1308 56,3 -1,3 1,7 2,4
6 1,7348 1,6739 2,9039 3,0095 2,8019 60,2 -5,9 34,8 10,9
7 1,6928 1,7419 2,9487 2,8656 3,0342 57,4 -8,1 65,6 16,4
Total 12,3234 12,1587 21,4003 21,7078 21,1355 403,5 1,7 197,9 56,3
Nilai rata-rata 1,7605 1,7370 3,0572 3,1011 3,0194 X X 28,27 8,0
σ 0,0425 0,0484 X X X X X X X
σ 2 0,0018 0,0023 X X X X X X X

Mari kita hitung C dan b:


Kami mendapatkan persamaan linier: .
Setelah melakukan potensiasi, kita mendapatkan:

Mengganti nilai aktual ke dalam persamaan ini X, kami memperoleh nilai teoritis dari hasilnya. Dengan menggunakannya, kami akan menghitung indikator: keketatan koneksi - indeks korelasi dan kesalahan perkiraan rata-rata

Kinerja model power-law menunjukkan sedikit lebih baik fungsi linear menggambarkan hubungan tersebut.

1c. Membangun persamaan kurva eksponensial

didahului dengan prosedur linierisasi variabel dengan mengambil logaritma kedua ruas persamaan:

Untuk perhitungan kami menggunakan data tabel.

Y X Yx Y2 x 2 dan saya
1 1,8376 45,1 82,8758 3,3768 2034,01 60,7 8,1 65,61 11,8
2 1,7868 59,0 105,4212 3,1927 3481,00 56,4 4,8 23,04 7,8
3 1,7774 57,2 101,6673 3,1592 3271,84 56,9 3,0 9,00 5,0
4 1,7536 61,8 108,3725 3,0751 3819,24 55,5 1,2 1,44 2,1
5 1,7404 58,8 102,3355 3,0290 3457,44 56,4 -1,4 1,96 2,5
6 1,7348 47,2 81,8826 3,0095 2227,84 60,0 -5,7 32,49 10,5
7 1,6928 55,2 93,4426 2,8656 3047,04 57,5 -8,2 67,24 16,6
Total 12,3234 384,3 675,9974 21,7078 21338,41 403,4 -1,8 200,78 56,3
Menikahi. zn. 1,7605 54,9 96,5711 3,1011 3048,34 X X 28,68 8,0
σ 0,0425 5,86 X X X X X X X
σ 2 0,0018 34,339 X X X X X X X

Nilai parameter regresi A dan DI DALAM berjumlah:


Persamaan linier yang dihasilkan adalah: . Mari kita potensikan persamaan yang dihasilkan dan menuliskannya dalam bentuk biasa:

Kami akan mengevaluasi kedekatan hubungan melalui indeks korelasi:

Selama belajar, siswa sangat sering menjumpai berbagai macam persamaan. Salah satunya - persamaan regresi - dibahas dalam artikel ini. Persamaan jenis ini digunakan secara khusus untuk menggambarkan ciri-ciri hubungan antar parameter matematika. Tipe ini persamaan digunakan dalam statistik dan ekonometrika.

Definisi regresi

Dalam matematika, regresi berarti besaran tertentu yang menggambarkan ketergantungan nilai rata-rata suatu kumpulan data terhadap nilai besaran lain. Persamaan regresi menunjukkan, sebagai fungsi dari suatu karakteristik tertentu, nilai rata-rata dari karakteristik lainnya. Fungsi regresi mempunyai bentuk persamaan sederhana y = x, di mana y bertindak sebagai variabel terikat, dan x sebagai variabel bebas (faktor fitur). Faktanya, regresi dinyatakan sebagai y = f (x).

Apa saja jenis hubungan antar variabel?

Secara umum, ada dua jenis hubungan yang berlawanan: korelasi dan regresi.

Yang pertama ditandai dengan kesetaraan variabel bersyarat. Dalam hal ini, tidak diketahui secara pasti variabel mana yang bergantung pada variabel lainnya.

Jika tidak ada persamaan antara variabel-variabel dan syarat-syarat yang menyatakan variabel mana yang bersifat penjelas dan mana yang terikat, maka kita dapat berbicara tentang adanya hubungan tipe kedua. Untuk membangun persamaan regresi linier, perlu diketahui jenis hubungan apa yang diamati.

Jenis regresi

Saat ini, ada 7 jenis regresi yang berbeda: hiperbolik, linier, berganda, nonlinier, berpasangan, invers, linier logaritmik.

Hiperbolik, linier dan logaritmik

Persamaan regresi linier digunakan dalam statistik untuk menjelaskan dengan jelas parameter persamaan. Sepertinya y = c+t*x+E. Persamaan hiperbolik berbentuk hiperbola beraturan y = c + m / x + E. Persamaan linier logaritma menyatakan hubungan menggunakan fungsi logaritma: In y = In c + m * In x + In E.

Berganda dan nonlinier

Dua lagi tipe kompleks Regresi bersifat berganda dan non-linier. Persamaannya regresi berganda dinyatakan dengan fungsi y = f(x 1, x 2 ...x c) + E. Dalam situasi ini, y berperan sebagai variabel terikat, dan x berperan sebagai variabel penjelas. Variabel E bersifat stokastik, yang mencakup pengaruh faktor-faktor lain dalam persamaan. Persamaan nonlinier regresi agak kontroversial. Di satu sisi, relatif terhadap indikator-indikator yang diperhitungkan tidak linier, namun di sisi lain dalam peran indikator penilaian bersifat linier.

Jenis regresi terbalik dan berpasangan

Invers adalah jenis fungsi yang perlu dikonversi tampilan linier. Dalam sebagian besar program aplikasi tradisional, ia memiliki bentuk fungsi y = 1/c + m*x+E. Persamaan regresi berpasangan menunjukkan hubungan antar data sebagai fungsi dari y = f (x) + E. Sama seperti persamaan lainnya, y bergantung pada x, dan E merupakan parameter stokastik.

Konsep korelasi

Ini merupakan indikator yang menunjukkan adanya hubungan antara dua fenomena atau proses. Kekuatan hubungan dinyatakan sebagai koefisien korelasi. Nilainya berfluktuasi dalam interval [-1;+1]. Indikator negatif menunjukkan ketersediaan masukan, positif - tentang garis lurus. Jika koefisien bernilai 0, maka tidak ada hubungan. Bagaimana nilai lebih dekat menuju 1 - semakin kuat hubungan antar parameter; semakin dekat ke 0 - semakin lemah.

Metode

Metode parametrik korelasi dapat menilai kekuatan hubungan. Mereka digunakan berdasarkan estimasi distribusi untuk mempelajari parameter yang mematuhi hukum distribusi normal.

Parameter persamaan regresi linier diperlukan untuk mengidentifikasi jenis ketergantungan, fungsi persamaan regresi dan mengevaluasi indikator rumus hubungan yang dipilih. Bidang korelasi digunakan sebagai metode identifikasi koneksi. Untuk melakukan ini, semua data yang ada harus digambarkan secara grafis. Semua data yang diketahui harus diplot dalam sistem koordinat dua dimensi persegi panjang. Ini adalah bagaimana bidang korelasi terbentuk. Nilai faktor pendeskripsi ditandai sepanjang sumbu absis, sedangkan nilai faktor terikat ditandai sepanjang sumbu ordinat. Jika terdapat hubungan fungsional antar parameter, maka parameter tersebut disusun dalam bentuk garis.

Jika koefisien korelasi data tersebut kurang dari 30%, kita dapat membicarakannya secara praktis ketidakhadiran total komunikasi. Jika antara 30% dan 70%, maka ini menunjukkan adanya hubungan sedang-dekat. Indikator 100% adalah bukti koneksi fungsional.

Persamaan regresi nonlinier, seperti halnya persamaan linier, harus dilengkapi dengan indeks korelasi (R).

Korelasi untuk Regresi Berganda

Koefisien determinasi adalah eksponen kuadrat korelasi ganda. Ia berbicara tentang hubungan erat antara kumpulan indikator yang disajikan dengan karakteristik yang diteliti. Ini juga dapat berbicara tentang sifat pengaruh parameter terhadap hasil. Persamaan regresi berganda diestimasi menggunakan indikator ini.

Untuk menghitung indikator korelasi berganda, perlu dihitung indeksnya.

Metode kuadrat terkecil

Metode ini merupakan salah satu cara untuk memperkirakan faktor regresi. Esensinya adalah meminimalkan jumlah simpangan kuadrat yang diperoleh dari ketergantungan faktor pada fungsi.

Persamaan regresi linier berpasangan dapat diestimasi dengan menggunakan metode seperti itu. Jenis persamaan ini digunakan ketika hubungan linier berpasangan terdeteksi antar indikator.

Parameter Persamaan

Setiap parameter fungsi regresi linier memiliki arti tertentu. Persamaan regresi linier berpasangan memuat dua parameter: c dan m. Parameter m menunjukkan perubahan rata-rata indikator akhir fungsi y, dengan syarat variabel x berkurang (meningkat) sebesar satu satuan konvensional. Jika variabel x sama dengan nol, maka fungsinya sama dengan parameter c. Jika variabel x tidak nol, maka faktor c tidak mempunyai arti ekonomis. Satu-satunya pengaruh terhadap fungsi tersebut adalah tanda di depan faktor c. Jika ada yang minus maka bisa dikatakan perubahan hasilnya lambat dibandingkan faktornya. Jika ada nilai tambah, maka ini menunjukkan percepatan perubahan hasil.

Setiap parameter yang mengubah nilai persamaan regresi dapat dinyatakan melalui persamaan. Misalnya faktor c berbentuk c = y - mx.

Data yang dikelompokkan

Ada kondisi tugas di mana semua informasi dikelompokkan berdasarkan atribut x, tetapi untuk kelompok tertentu nilai rata-rata yang sesuai dari indikator dependen ditunjukkan. Dalam hal ini, nilai rata-rata mencirikan bagaimana indikator yang bergantung pada x berubah. Dengan demikian, informasi yang dikelompokkan membantu menemukan persamaan regresi. Ini digunakan sebagai analisis hubungan. Namun, metode ini mempunyai kelemahan. Sayangnya, indikator rata-rata sering kali dipengaruhi oleh fluktuasi eksternal. Fluktuasi ini tidak mencerminkan pola hubungan; mereka hanya menutupi “kegaduhan” yang ada. Rata-rata menunjukkan pola hubungan yang jauh lebih buruk dibandingkan persamaan regresi linier. Namun, mereka dapat digunakan sebagai dasar untuk menemukan persamaan. Dengan mengalikan jumlah populasi individu dengan rata-rata yang bersangkutan, kita dapat memperoleh jumlah y dalam kelompok tersebut. Selanjutnya, Anda perlu menjumlahkan semua jumlah yang diterima dan menemukan indikator akhir y. Sedikit lebih sulit melakukan perhitungan dengan indikator penjumlahan xy. Jika intervalnya kecil, kita dapat mengambil kondisional indikator x untuk semua unit (dalam grup) menjadi sama. Anda harus mengalikannya dengan jumlah y untuk mengetahui jumlah hasil kali x dan y. Selanjutnya, semua jumlah dijumlahkan dan diperoleh jumlah total xy.

Persamaan regresi berpasangan berganda: menilai pentingnya suatu hubungan

Seperti yang telah dibahas sebelumnya, regresi berganda memiliki fungsi berbentuk y = f (x 1,x 2,…,x m)+E. Paling sering, persamaan seperti itu digunakan untuk menyelesaikan masalah penawaran dan permintaan suatu produk, pendapatan bunga atas pembelian kembali saham, dan untuk mempelajari penyebab dan jenis fungsi biaya produksi. Persamaan ini juga digunakan secara aktif dalam berbagai studi dan penghitungan makroekonomi, namun pada tingkat mikroekonomi, persamaan ini lebih jarang digunakan.

Tugas utama regresi berganda adalah membangun model data yang berisi sejumlah besar informasi untuk menentukan lebih lanjut apa pengaruh masing-masing faktor secara individu dan totalitas terhadap indikator yang perlu dimodelkan dan koefisiennya. Persamaan regresi dapat mempunyai nilai yang sangat beragam. Dalam hal ini, untuk menilai hubungan, biasanya digunakan dua jenis fungsi: linier dan nonlinier.

Fungsi linier digambarkan dalam bentuk hubungan berikut: y = a 0 + a 1 x 1 + a 2 x 2,+ ... + a m x m. Dalam hal ini, a2, am dianggap sebagai koefisien regresi “murni”. Mereka diperlukan untuk mengkarakterisasi perubahan rata-rata parameter y dengan perubahan (penurunan atau peningkatan) pada setiap parameter x yang sesuai sebanyak satu unit, dengan kondisi nilai stabil dari indikator lainnya.

Persamaan nonlinier, misalnya, berbentuk fungsi pangkat y=ax 1 b1 x 2 b2 ...x m bm. Dalam hal ini, indikator b 1, b 2 ..... b m disebut koefisien elastisitas, indikator tersebut menunjukkan bagaimana hasilnya akan berubah (berapa%) dengan peningkatan (penurunan) indikator yang sesuai x sebesar 1% dan dengan indikator stabil dari faktor-faktor lain.

Faktor-faktor apa saja yang perlu dipertimbangkan saat membuat regresi berganda

Untuk membangun regresi berganda dengan benar, perlu diketahui faktor-faktor mana yang harus mendapat perhatian khusus.

Penting untuk memahami sifat hubungan antara faktor-faktor ekonomi dan apa yang dimodelkan. Faktor-faktor yang perlu dimasukkan harus memenuhi kriteria berikut:

  • Harus tunduk pada pengukuran kuantitatif. Untuk menggunakan faktor yang menggambarkan kualitas suatu objek, bagaimanapun juga, faktor tersebut harus diberikan bentuk kuantitatif.
  • Seharusnya tidak ada interkorelasi faktor, atau hubungan fungsional. Tindakan seperti itu paling sering mengarah pada konsekuensi yang tidak dapat diubah- sistem persamaan biasa menjadi tidak bersyarat, dan ini menyebabkan perkiraannya tidak dapat diandalkan dan tidak jelas.
  • Dalam kasus indikator korelasi yang sangat besar, tidak ada cara untuk mengetahui pengaruh faktor-faktor yang terisolasi terhadap hasil akhir indikator, oleh karena itu, koefisien menjadi tidak dapat diinterpretasikan.

Metode konstruksi

Ada jumlah yang banyak metode dan teknik yang menjelaskan bagaimana faktor dapat dipilih untuk suatu persamaan. Namun, semua metode ini didasarkan pada pemilihan koefisien dengan menggunakan indikator korelasi. Diantaranya adalah:

  • Metode eliminasi.
  • Metode peralihan.
  • Analisis regresi bertahap.

Metode pertama melibatkan menyaring semua koefisien dari total set. Metode kedua melibatkan pengenalan banyak faktor tambahan. Nah, yang ketiga adalah penghapusan faktor-faktor yang sebelumnya digunakan untuk persamaan tersebut. Masing-masing metode ini memiliki hak untuk hidup. Mereka memiliki pro dan kontra, namun mereka semua dapat menyelesaikan masalah menghilangkan indikator yang tidak perlu dengan cara mereka sendiri. Biasanya, hasil yang diperoleh dari masing-masing metode cukup mirip.

Metode analisis multivariat

Metode penentuan faktor tersebut didasarkan pada pertimbangan kombinasi individu dari karakteristik yang saling terkait. Ini termasuk analisis diskriminan, pengenalan bentuk, analisis komponen utama, dan analisis cluster. Selain itu juga terdapat analisis faktor, namun muncul karena berkembangnya metode komponen. Semuanya berlaku dalam keadaan tertentu, dengan syarat dan faktor tertentu.

Di hadapan koneksi korelasi Antara tanda faktor dan tanda hasil, dokter sering kali harus menentukan seberapa besar nilai suatu tanda dapat berubah ketika tanda lainnya berubah menjadi satuan pengukuran yang diterima secara umum atau yang ditetapkan oleh peneliti sendiri.

Misalnya bagaimana perubahan berat badan anak sekolah kelas 1 (perempuan atau laki-laki) jika tinggi badannya bertambah 1 cm?Untuk itu digunakan metode analisis regresi.

Metode analisis regresi paling sering digunakan untuk mengembangkan skala dan standar normatif perkembangan fisik.

  1. Definisi Regresi. Regresi adalah fungsi yang memungkinkan, dari nilai rata-rata suatu karakteristik, untuk menentukan nilai rata-rata karakteristik lain yang berkorelasi dengan karakteristik pertama.

    Untuk tujuan ini, koefisien regresi dan sejumlah parameter lainnya digunakan. Misalnya, Anda bisa menghitung jumlahnya masuk angin rata-rata pada nilai tertentu dari suhu udara rata-rata bulanan pada periode musim gugur-musim dingin.

  2. Penentuan koefisien regresi. Koefisien regresi adalah nilai absolut dimana, rata-rata, nilai suatu karakteristik berubah ketika karakteristik terkait lainnya berubah sebesar satuan pengukuran tertentu.
  3. Rumus koefisien regresi. R y/x = r xy x (σ y / σ x)
    dimana R у/х - koefisien regresi;
    r xy - koefisien korelasi antara karakteristik x dan y;
    (σ y dan σ x) - standar deviasi karakteristik x dan y.

    Dalam contoh kita;
    σ x = 4,6 (deviasi standar suhu udara pada periode musim gugur-musim dingin;
    σ y = 8,65 (standar deviasi jumlah penyakit menular dan penyakit flu).
    Jadi, R y/x adalah koefisien regresi.
    R у/х = -0,96 x (4,6 / 8,65) = 1,8, mis. ketika suhu udara rata-rata bulanan (x) turun 1 derajat, jumlah rata-rata penyakit menular dan pilek (y) pada periode musim gugur-musim dingin akan berubah sebesar 1,8 kasus.

  4. Persamaan regresi. y = M y + R y/x (x - M x)
    dimana y adalah nilai rata-rata suatu karakteristik, yang harus ditentukan ketika nilai rata-rata karakteristik lainnya berubah (x);
    x adalah nilai rata-rata yang diketahui dari karakteristik lain;
    R y/x - koefisien regresi;
    M x, M y - nilai rata-rata karakteristik x dan y yang diketahui.

    Misalnya, jumlah rata-rata penyakit menular dan pilek (y) dapat ditentukan tanpa pengukuran khusus pada nilai rata-rata suhu udara rata-rata bulanan (x). Jadi, jika x = - 9°, R y/x = 1,8 penyakit, M x = -7°, M y = 20 penyakit, maka y = 20 + 1,8 x (9-7) = 20 + 3 ,6 = 23,6 penyakit.
    Persamaan ini diterapkan pada kasus hubungan linier antara dua karakteristik (x dan y).

  5. Tujuan Persamaan Regresi. Persamaan regresi digunakan untuk membuat garis regresi. Yang terakhir ini memungkinkan, tanpa pengukuran khusus, untuk menentukan nilai rata-rata (y) dari satu karakteristik jika nilai (x) dari karakteristik lain berubah. Berdasarkan data ini, grafik dibuat - Garis regresi, yang dapat digunakan untuk menentukan jumlah rata-rata pilek pada setiap nilai suhu rata-rata bulanan dalam kisaran antara nilai perhitungan jumlah pilek.
  6. Sigma Regresi (rumus).
    dimana σ Rу/х - sigma (deviasi standar) regresi;
    σ y - simpangan baku dari karakteristik y;
    r xy - koefisien korelasi antara karakteristik x dan y.

    Jadi, jika σ y - standar deviasi jumlah pilek = 8,65; r xy - koefisien korelasi antara jumlah pilek (y) dan rata-rata suhu udara bulanan pada periode musim gugur-musim dingin (x) adalah - 0,96, maka

  7. Penugasan sigma regresi. Memberikan gambaran tentang ukuran keanekaragaman karakteristik yang dihasilkan (y).

    Misalnya, ia mencirikan keragaman jumlah pilek pada nilai tertentu dari rata-rata suhu udara bulanan pada periode musim gugur-musim dingin. Dengan demikian, rata-rata jumlah penyakit pilek pada suhu udara x 1 = -6° dapat berkisar antara 15,78 penyakit hingga 20,62 penyakit.
    Pada x 2 = -9°, rata-rata jumlah penyakit pilek berkisar antara 21,18 penyakit hingga 26,02 penyakit, dan seterusnya.

    Sigma regresi digunakan untuk membangun skala regresi, yang mencerminkan penyimpangan nilai karakteristik yang dihasilkan dari nilai rata-rata yang diplot pada garis regresi.

  8. Data diperlukan untuk menghitung dan merencanakan skala regresi
    • koefisien regresi - R у/х;
    • persamaan regresi - y = M y + R y/x (x-M x);
    • sigma regresi - σ Rx/y
  9. Urutan perhitungan dan representasi grafis dari skala regresi.
    • tentukan koefisien regresi menggunakan rumus (lihat paragraf 3). Misalnya, penting untuk menentukan seberapa besar rata-rata perubahan berat badan (pada usia tertentu tergantung jenis kelamin) jika tinggi rata-rata akan berubah sebesar 1 cm.
    • dengan menggunakan rumus persamaan regresi (lihat poin 4), tentukan berapa, misalnya berat badan rata-rata (y, y 2, y 3 ...) * untuk nilai tinggi badan tertentu (x, x 2, x 3 . ..) .
      ________________
      * Nilai "y" harus dihitung untuk setidaknya tiga nilai "x" yang diketahui.

      Sementara itu, diketahui nilai rata-rata berat badan dan tinggi badan (M x, dan M y) untuk umur dan jenis kelamin tertentu.

    • hitung sigma regresi, mengetahui nilai yang sesuai dari σ y dan r xy dan memasukkan nilainya ke dalam rumus (lihat paragraf 6).
    • berdasarkan nilai yang diketahui x 1, x 2, x 3 dan nilai rata-rata yang sesuai y 1, y 2 y 3, serta nilai terkecil (y - σ rу/х) dan terbesar (y + σ rу /х) nilai (y) membangun skala regresi.

      Untuk merepresentasikan skala regresi secara grafis, nilai x, x2, x3 (sumbu ordinat) terlebih dahulu ditandai pada grafik, yaitu. dibangun garis regresi, misalnya ketergantungan berat badan (y) terhadap tinggi badan (x).

      Kemudian pada titik-titik yang bersesuaian y 1, y 2, y 3 ditandai nilai numerik sigma regresi, yaitu temukan yang terkecil pada grafik dan nilai tertinggi kamu 1, kamu 2, kamu 3.

  10. Penggunaan praktis skala regresi. Skala dan standar normatif sedang dikembangkan, khususnya untuk pembangunan fisik. Dengan menggunakan skala standar, Anda dapat memberikan penilaian individual terhadap perkembangan anak. Dalam hal ini, perkembangan fisik dinilai harmonis jika, misalnya, pada tinggi badan tertentu, berat badan anak berada dalam satu sigma regresi ke rata-rata satuan berat badan yang dihitung - (y) untuk tinggi badan tertentu (x) ( y ± 1 σ Ry/x).

    Perkembangan fisik dianggap tidak harmonis ditinjau dari berat badan apabila berat badan anak untuk tinggi badan tertentu berada dalam sigma regresi kedua: (y ± 2 σ Ry/x)

    Perkembangan fisik akan sangat tidak harmonis akibat kelebihan dan kekurangan berat badan jika berat badan untuk tinggi badan tertentu berada dalam sigma regresi ketiga (y ± 3 σ Ry/x).

Menurut hasilnya penelitian statistik Perkembangan fisik anak laki-laki umur 5 tahun diketahui rata-rata tinggi badan (x) 109 cm dan berat badan rata-rata (y) 19 kg. Koefisien korelasi antara tinggi badan dan berat badan adalah +0,9, standar deviasi disajikan dalam tabel.

Diperlukan:

  • menghitung koefisien regresi;
  • dengan menggunakan persamaan regresi, tentukan berapa perkiraan berat badan anak laki-laki umur 5 tahun yang tinggi badannya sama dengan x1 = 100 cm, x2 = 110 cm, x3 = 120 cm;
  • menghitung sigma regresi, membuat skala regresi, dan menyajikan hasil penyelesaiannya secara grafis;
  • menarik kesimpulan yang tepat.

Kondisi masalah dan hasil penyelesaiannya disajikan dalam tabel ringkasan.

Tabel 1

Kondisi permasalahan Hasil pemecahan masalah
persamaan regresi sigma regresi skala regresi (berat badan yang diharapkan (dalam kg))
M σ rxy R kamu/x X kamu σ Rx/y y - σ Rу/х y + σ Rу/х
1 2 3 4 5 6 7 8 9 10
Tinggi (x) 109 cm ± 4,4cm +0,9 0,16 100cm 17,56kg ± 0,35kg 17,21kg 17,91kg
Massa tubuh (y) 19kg ± 0,8kg 110 cm 19,16kg 18,81kg 19,51kg
120 cm 20,76kg 20,41kg 21,11kg

Larutan.

Kesimpulan. Dengan demikian, skala regresi dalam nilai berat badan yang dihitung memungkinkan Anda menentukannya pada nilai tinggi badan atau perkiraan lainnya perkembangan individu anak. Untuk melakukan ini, kembalikan garis tegak lurus terhadap garis regresi.

  1. Vlasov V.V. Epidemiologi. - M.: GEOTAR-MED, 2004. - 464 hal.
  2. Lisitsyn Yu.P. Kesehatan masyarakat dan kesehatan. Buku teks untuk universitas. - M.: GEOTAR-MED, 2007. - 512 hal.
  3. Medis V.A., Yuryev V.K. Mata kuliah kuliah kesehatan masyarakat dan kesehatan: Bagian 1. Kesehatan masyarakat. - M.: Kedokteran, 2003. - 368 hal.
  4. Minyaev V.A., Vishnyakov N.I. dan lain-lain Organisasi kedokteran sosial dan kesehatan (Manual dalam 2 volume). - SPb., 1998. -528 hal.
  5. Kucherenko V.Z., Agarkov N.M. dan lain-lain Organisasi kebersihan dan kesehatan sosial ( tutorial) - Moskow, 2000. - 432 hal.
  6. S.Glanz. Statistik medis dan biologis. Terjemahan dari bahasa Inggris - M., Praktika, 1998. - 459 hal.

Analisis regresi mendasari pembuatan sebagian besar model ekonometrik, termasuk model estimasi biaya. Untuk membangun model penilaian, metode ini dapat digunakan jika jumlah analog (objek pembanding) dan jumlah faktor biaya (elemen pembanding) saling berhubungan sebagai berikut: P> (5 -g-10) x Ke, itu. harus ada analog 5-10 kali lebih banyak daripada faktor biaya. Persyaratan yang sama untuk rasio jumlah data dan jumlah faktor juga berlaku untuk tugas lain: membangun hubungan antara biaya dan parameter konsumen objek; pembenaran prosedur penghitungan indeks korektif; mengidentifikasi tren harga; membangun hubungan antara keausan dan perubahan faktor-faktor yang mempengaruhi; memperoleh ketergantungan untuk menghitung standar biaya, dll. Kepatuhan terhadap persyaratan ini diperlukan untuk mengurangi kemungkinan bekerja dengan sampel data yang tidak memenuhi persyaratan distribusi normal variabel acak.

Hubungan regresi hanya mencerminkan tren rata-rata perubahan variabel yang dihasilkan, misalnya biaya, dari perubahan satu atau lebih variabel faktor, misalnya lokasi, jumlah ruangan, luas, lantai, dll. Inilah perbedaan antara hubungan regresi dan hubungan fungsional, di mana nilai variabel yang dihasilkan ditentukan secara ketat untuk nilai variabel faktor tertentu.

Adanya hubungan regresi/antara yang dihasilkan pada dan variabel faktor x hal ..., xk(faktor) menunjukkan bahwa hubungan ini ditentukan tidak hanya oleh pengaruh variabel faktor yang dipilih, tetapi juga oleh pengaruh variabel, ada yang umumnya tidak diketahui, ada pula yang tidak dapat dinilai dan diperhitungkan:

Pengaruh variabel yang tidak diperhitungkan ditunjukkan oleh suku kedua persamaan ini ?, yang disebut kesalahan perkiraan.

Jenis ketergantungan regresi berikut ini dibedakan:

  • ? regresi berpasangan - hubungan antara dua variabel (resultan dan faktor);
  • ? regresi berganda - hubungan antara satu variabel hasil dan dua atau lebih variabel faktor yang termasuk dalam penelitian.

Tugas utama analisis regresi adalah kuantisasi keeratan hubungan antar variabel (dalam regresi berpasangan) dan banyak variabel (dalam regresi berganda). Keeratan hubungan tersebut secara kuantitatif dinyatakan dengan koefisien korelasi.

Penggunaan analisis regresi memungkinkan untuk menetapkan pola pengaruh faktor-faktor utama (karakteristik hedonis) terhadap indikator yang diteliti, baik secara keseluruhan maupun masing-masing secara terpisah. Menggunakan analisis regresi sebagai metode statistik matematika, pertama, dimungkinkan untuk menemukan dan mendeskripsikan bentuk ketergantungan analitis dari variabel yang dihasilkan (dicari) terhadap variabel faktor dan, kedua, untuk menilai kedekatan ketergantungan tersebut.

Dengan memecahkan masalah pertama, model regresi matematis diperoleh, yang dengannya indikator yang diinginkan kemudian dihitung untuk nilai faktor tertentu. Memecahkan masalah kedua memungkinkan kita untuk menetapkan keandalan hasil yang dihitung.

Dengan demikian, analisis regresi dapat didefinisikan sebagai seperangkat prosedur formal (matematis) yang dirancang untuk mengukur kedekatan, arah, dan ekspresi analitis dari bentuk hubungan antara variabel yang dihasilkan dan variabel faktor, yaitu. keluaran dari analisis tersebut harus berupa model statistik yang ditentukan secara struktural dan kuantitatif dalam bentuk:

Di mana kamu - nilai rata-rata variabel yang dihasilkan (indikator yang diinginkan, misalnya biaya, sewa, tingkat kapitalisasi) sebesar P pengamatannya; x - nilai variabel faktor (/faktor biaya); Ke - jumlah variabel faktor.

Fungsi f(x aku ,...,x lc), menggambarkan ketergantungan variabel yang dihasilkan terhadap faktor faktor disebut persamaan regresi (fungsi). Istilah "regresi" (regresi (Latin) - mundur, kembali ke sesuatu) dikaitkan dengan kekhususan salah satu masalah spesifik yang diselesaikan pada tahap pembentukan metode, dan saat ini tidak mencerminkan keseluruhan esensi metode, tapi tetap digunakan.

Analisis regresi di kasus umum mencakup langkah-langkah berikut:

  • ? membentuk sampel benda-benda homogen dan mengumpulkan informasi awal tentang benda-benda tersebut;
  • ? pemilihan faktor utama yang mempengaruhi variabel yang dihasilkan;
  • ? memeriksa sampel untuk normalitas menggunakan X 2 atau uji binomial;
  • ? penerimaan hipotesis tentang bentuk komunikasi;
  • ? pemrosesan matematika data;
  • ? memperoleh model regresi;
  • ? penilaian indikator statistiknya;
  • ? perhitungan verifikasi menggunakan model regresi;
  • ? analisis hasil.

Urutan operasi yang ditentukan terjadi ketika mempelajari hubungan berpasangan antara variabel faktor dan satu variabel resultan, dan hubungan berganda antara variabel resultan dan beberapa variabel faktorial.

Penggunaan analisis regresi membebankan persyaratan tertentu pada informasi awal:

  • ? sampel statistik objek harus homogen secara fungsional dan struktural-teknologi;
  • ? cukup banyak;
  • ? indikator biaya yang diteliti - variabel yang dihasilkan (harga, biaya, pengeluaran) - harus dibawa ke kondisi yang sama untuk perhitungannya untuk semua objek sampel;
  • ? variabel faktor harus diukur dengan cukup akurat;
  • ? variabel faktor harus independen atau minimal dependen.

Persyaratan homogenitas dan kelengkapan sampel bertentangan: semakin ketat pemilihan objek berdasarkan homogenitasnya, semakin kecil sampel yang diperoleh, dan sebaliknya, untuk memperbesar sampel perlu memasukkan objek yang tidak terlalu mirip. satu sama lain.

Setelah data sekelompok objek homogen terkumpul, selanjutnya dianalisis untuk membentuk bentuk hubungan antara variabel yang dihasilkan dan variabel faktor dalam bentuk garis regresi teoritis. Proses menemukan garis regresi teoretis terdiri dari pemilihan kurva perkiraan yang masuk akal dan menghitung koefisien persamaannya. Garis regresi adalah kurva halus (dalam kasus tertentu garis lurus) yang menggambarkan penggunaan fungsi matematika tren umum ketergantungan yang dipelajari dan menghaluskan emisi yang tidak teratur dan acak dari pengaruh faktor-faktor samping.

Untuk menampilkan ketergantungan regresi berpasangan dalam tugas penilaian, fungsi berikut paling sering digunakan: linier - kamu - sebuah 0 + ars + s kekuatan - kamu - aj&i + s indikatif - kamu - eksponensial linier - kamu - a 0 + ap* + c. Di Sini - e kesalahan perkiraan yang disebabkan oleh tindakan faktor acak yang tidak terhitung.

Dalam fungsi ini, y adalah variabel yang dihasilkan; x - variabel faktor (faktor); A 0 , a r a 2 - parameter model regresi, koefisien regresi.

Model eksponensial linier termasuk dalam kelas yang disebut model hibrid dengan bentuk:

Di mana

dimana x (saya = 1, /) - nilai faktor;

bt (saya = 0, /) - koefisien persamaan regresi.

Dalam persamaan ini komponennya A, B Dan Z sesuai dengan biaya masing-masing komponen aset yang dinilai, misalnya, biaya sebidang tanah dan biaya perbaikan, dan parameter Q adalah hal yang umum. Hal ini dirancang untuk menyesuaikan nilai seluruh komponen aset yang dinilai berdasarkan faktor umum yang mempengaruhi, seperti lokasi.

Nilai faktor-faktor yang berada dalam pangkat koefisien yang bersesuaian adalah variabel biner (0 atau 1). Faktor-faktor yang menjadi dasar derajat adalah variabel diskrit atau kontinu.

Faktor-faktor yang berhubungan dengan koefisien perkalian juga bersifat kontinu atau diskrit.

Spesifikasi biasanya dilakukan dengan menggunakan pendekatan empiris dan mencakup dua tahap:

  • ? memplot titik-titik bidang regresi pada grafik;
  • ? analisis grafis (visual) dari jenis kurva perkiraan yang mungkin.

Jenis kurva regresi tidak selalu dapat dipilih dengan segera. Untuk menentukannya, plot terlebih dahulu titik-titik bidang regresi berdasarkan data aslinya. Kemudian secara visual tarik garis sepanjang posisi titik-titik tersebut, coba cari tahu pola kualitatif keterhubungannya: pertumbuhan seragam atau penurunan seragam, pertumbuhan (penurunan) dengan peningkatan (penurunan) laju dinamika, pendekatan mulus terhadap suatu titik tertentu. tingkat.

Pendekatan empiris ini dilengkapi dengan analisis logis, dimulai dari gagasan yang telah diketahui tentang sifat ekonomi dan fisik dari faktor-faktor yang diteliti serta pengaruh timbal baliknya.

Misalnya diketahui ketergantungan dari variabel yang dihasilkan adalah indikator ekonomi(harga, sewa) dari sejumlah variabel faktor – faktor pembentuk harga (jarak dari pusat pemukiman, luas, dll) bersifat non-linier, dan dapat digambarkan secara ketat dengan pangkat, eksponensial atau fungsi kuadrat. Namun untuk perubahan faktor dalam rentang kecil, hasil yang dapat diterima dapat diperoleh dengan menggunakan fungsi linier.

Namun, jika masih tidak mungkin untuk segera membuat pilihan pasti atas salah satu fungsi, maka dua atau tiga fungsi dipilih, parameternya dihitung, dan kemudian, dengan menggunakan kriteria yang sesuai untuk kedekatan koneksi, fungsi tersebut akhirnya terpilih.

Secara teori, proses regresi untuk mencari bentuk kurva disebut spesifikasi model, dan koefisiennya - kalibrasi model.

Jika diketahui variabel y yang dihasilkan bergantung pada beberapa variabel faktor (faktor) x ( , x 2 , ..., xk, kemudian mereka menggunakan model regresi berganda. Biasanya, tiga bentuk komunikasi ganda digunakan: linier - y - a 0 + axxx + a^x 2 + ... + akxk, indikatif - y - a 0 a*Saya axt- axb, kekuatan - kamu - dan 0 x x ix 2 a 2. .x^atau kombinasinya.

Fungsi eksponensial dan fungsi pangkat lebih universal karena mendekati hubungan nonlinier, yang sebagian besar dipelajari dalam penilaian ketergantungan. Selain itu, mereka dapat digunakan ketika menilai objek dan dalam metode pemodelan statistik dalam penilaian massal, dan dalam metode perbandingan langsung dalam penilaian individu ketika menetapkan faktor koreksi.

Pada tahap kalibrasi, parameter model regresi dihitung dengan menggunakan metode kuadrat terkecil yang intinya adalah jumlah simpangan kuadrat dari nilai hitung variabel yang dihasilkan. pada., yaitu. dihitung menggunakan persamaan kopling yang dipilih, dari nilai sebenarnya harus minimal:

Nilai j) (.dan kamu. oleh karena itu diketahui Q adalah fungsi dari koefisien persamaan saja. Untuk menemukan minimumnya S Anda perlu mengambil turunan parsial Q dengan koefisien persamaan dan menyamakannya dengan nol:

Hasilnya, kita memperoleh sistem persamaan normal, yang jumlahnya sama dengan jumlah koefisien determinasi persamaan regresi yang diinginkan.

Misalkan kita perlu mencari koefisiennya persamaan linier y - a 0 + ars. Jumlah simpangan kuadrat berbentuk:

/=1

Bedakan fungsinya Q dengan koefisien yang tidak diketahui sebuah 0 dan dan samakan turunan parsialnya dengan nol:

Setelah transformasi kita mendapatkan:

Di mana P - jumlah nilai aktual asli pada mereka (jumlah analog).

Prosedur yang diberikan untuk menghitung koefisien persamaan regresi juga berlaku untuk ketergantungan nonlinier, jika ketergantungan ini dapat dilinearisasi, yaitu. mengarah ke bentuk linier dengan menggunakan perubahan variabel. Fungsi pangkat dan eksponensial setelah logaritma dan perubahan variabel yang sesuai memperoleh bentuk linier. Misalnya, fungsi pangkat setelah logaritma berbentuk: In y = 1p 0 +ax 1 jam. Setelah mengganti variabel kamu- Di dalam kamu, aku 0 - Di dalam dan No.X- Di x kita mendapatkan fungsi linier

Y=A 0 + cijX, koefisiennya ditemukan dengan cara yang dijelaskan di atas.

Metode kuadrat terkecil juga digunakan untuk menghitung koefisien model regresi berganda. Jadi, sistem persamaan normal untuk menghitung fungsi linier dengan dua variabel Xj Dan x 2 setelah serangkaian transformasi terlihat seperti ini:

Biasanya sistem ini persamaan diselesaikan dengan menggunakan metode aljabar linier. Jamak fungsi daya menghasilkan bentuk linier dengan mengambil logaritma dan mengubah variabel dengan cara yang sama seperti fungsi pangkat berpasangan.

Saat menggunakan model hybrid, koefisien regresi berganda ditemukan menggunakan prosedur numerik dari metode pendekatan berturut-turut.

Untuk menentukan pilihan akhir dari beberapa persamaan regresi, perlu dilakukan uji kekuatan hubungan pada setiap persamaan, yang diukur dengan koefisien korelasi, varians, dan koefisien variasi. Tes Student dan Fisher juga dapat digunakan untuk evaluasi. Semakin besar kedekatan hubungan yang ditunjukkan suatu kurva, semakin disukai kurva tersebut, jika semua hal lain dianggap sama.

Jika masalah kelas ini diselesaikan ketika perlu untuk menetapkan ketergantungan indikator biaya pada faktor biaya, maka keinginan untuk memperhitungkan sebanyak mungkin faktor yang mempengaruhi dan dengan demikian membangun model regresi berganda yang lebih akurat dapat dimengerti. . Namun, perluasan jumlah faktor tersebut terhambat oleh dua keterbatasan obyektif. Pertama, untuk membangun model regresi berganda, diperlukan sampel objek yang jauh lebih besar daripada untuk membangun model berpasangan. Secara umum diterima bahwa jumlah objek dalam sampel harus melebihi jumlahnya P faktor setidaknya 5-10 kali. Oleh karena itu, untuk membangun model dengan tiga faktor yang mempengaruhi, perlu mengumpulkan sampel sekitar 20 objek dengan kumpulan nilai faktor yang berbeda. Kedua, faktor-faktor yang dipilih untuk model dalam pengaruhnya terhadap indikator biaya harus cukup independen satu sama lain. Hal ini tidak mudah untuk dipastikan, karena sampel biasanya menggabungkan objek-objek yang termasuk dalam keluarga yang sama, yang mana terdapat perubahan alami dalam banyak faktor dari satu objek ke objek lainnya.

Kualitas model regresi biasanya diperiksa menggunakan indikator statistik berikut.

Standar deviasi kesalahan persamaan regresi (kesalahan estimasi):

Di mana P - ukuran sampel (jumlah analog);

Ke - sejumlah faktor (faktor biaya);

Kesalahan, tidak dapat dijelaskan persamaan regresi(Gbr. 3.2);

kamu. - nilai sebenarnya dari variabel yang dihasilkan (misalnya biaya); kamu - nilai terhitung dari variabel hasil.

Indikator ini disebut juga kesalahan standar estimasi (kesalahan RMS). Pada gambar, titik menunjukkan nilai sampel tertentu, simbol menunjukkan garis nilai rata-rata sampel, dan garis putus-putus yang miring merupakan garis regresi.


Beras. 3.2.

Standar deviasi kesalahan estimasi mengukur besarnya deviasi nilai aktual y dari nilai perhitungan terkait pada( , diperoleh dengan menggunakan model regresi. Jika sampel yang menjadi dasar model tunduk pada hukum distribusi normal, maka dapat dikatakan bahwa 68% dari nilai riil pada berada dalam jangkauan pada ± &e dari garis regresi, dan 95% berada dalam kisaran tersebut pada ± 2d e. Indikator ini nyaman karena merupakan satuan pengukuran sg? cocok dengan satuan pengukurannya pada,. Dalam hal ini dapat digunakan untuk menunjukkan keakuratan hasil yang diperoleh dalam proses penilaian. Misalnya, dalam sertifikat nilai Anda dapat menunjukkan bahwa nilai pasar diperoleh dengan menggunakan model regresi V dengan kemungkinan 95% berada dalam kisaran dari (V -2d,.) sebelum (y + 2d s).

Koefisien variasi variabel yang dihasilkan:

Di mana kamu - nilai rata-rata dari variabel yang dihasilkan (Gbr. 3.2).

Dalam analisis regresi, koefisien variasi var adalah deviasi standar hasilnya, dinyatakan sebagai persentase dari nilai rata-rata variabel yang dihasilkan. Koefisien variasi dapat berfungsi sebagai kriteria kualitas prediktif model regresi yang dihasilkan: semakin kecil nilainya var, semakin tinggi kualitas prediktif model tersebut. Penggunaan koefisien variasi lebih disukai daripada indikator &e, karena merupakan indikator relatif. Saat menggunakan indikator ini dalam praktiknya, disarankan untuk tidak menggunakan model yang koefisien variasinya melebihi 33%, karena dalam hal ini tidak dapat dikatakan bahwa data sampel tunduk pada hukum distribusi normal.

Koefisien determinasi (koefisien korelasi berganda kuadrat):

Indikator ini digunakan untuk menganalisis kualitas model regresi yang dihasilkan secara keseluruhan. Hal ini menunjukkan berapa persentase varians pada variabel yang dihasilkan yang dijelaskan oleh pengaruh seluruh variabel faktor yang dimasukkan dalam model. Koefisien determinasi selalu berada pada kisaran nol sampai satu. Semakin dekat nilai koefisien determinasi dengan kesatuan, maka model yang lebih baik menggambarkan seri data asli. Koefisien determinasi dapat direpresentasikan secara berbeda:

Berikut error yang dijelaskan oleh model regresi,

A - kesalahan, tidak dapat dijelaskan

model regresi. Dari sudut pandang ekonomi, kriteria ini memungkinkan kita untuk menilai berapa persentase variasi harga yang dijelaskan oleh persamaan regresi.

Batas pasti penerimaan indikator tersebut R 2 Tidak mungkin untuk menentukan secara spesifik untuk semua kasus. Baik ukuran sampel maupun interpretasi persamaan yang bermakna harus diperhitungkan. Sebagai aturan, ketika mempelajari data tentang objek dengan tipe yang sama, diperoleh pada waktu yang kira-kira sama, nilainya R 2 tidak melebihi level 0,6-0,7. Jika semua kesalahan perkiraan adalah nol, mis. ketika hubungan antara variabel resultan dan faktor adalah fungsional, maka R 2 =1.

Koefisien determinasi yang disesuaikan:

Kebutuhan untuk memperkenalkan koefisien determinasi yang disesuaikan dijelaskan oleh fakta bahwa dengan bertambahnya jumlah faktor Ke koefisien determinasi biasa hampir selalu meningkat, tetapi jumlah derajat kebebasannya berkurang (hal - k- 1). Penyesuaian yang dimasukkan selalu mengurangi nilainya R2, karena (P - 1) > (p-k- 1). Akibatnya, nilainya R 2 CKOf) bahkan mungkin menjadi negatif. Artinya nilainya R 2 mendekati nol sebelum penyesuaian dan proporsi varians variabel dijelaskan menggunakan persamaan regresi pada sangat kecil.

Dari kedua pilihan model regresi yang berbeda nilai koefisien determinasi yang disesuaikan, namun mempunyai kriteria kualitas lain yang sama baik, maka pilihan dengan nilai koefisien determinasi yang disesuaikan lebih besar lebih disukai. Koefisien determinasi tidak disesuaikan jika (p - k): k> 20.

Koefisien Fisher:

Kriteria ini digunakan untuk menilai signifikansi koefisien determinasi. Jumlah sisa kuadrat mewakili ukuran kesalahan prediksi menggunakan regresi nilai biaya yang diketahui kamu.. Perbandingannya dengan jumlah kuadrat regresi menunjukkan berapa kali ketergantungan regresi memprediksi hasil lebih baik daripada rata-rata pada. Ada tabel nilai kritis FR Koefisien Fisher, tergantung pada jumlah derajat kebebasan pembilangnya - Ke, penyebut v 2 = hal - k- 1 dan tingkat signifikansi a. Jika dihitung nilai uji Fisher FR lagi nilai tabel, maka hipotesis tentang tidak pentingnya koefisien determinasi, yaitu. tentang ketidaksesuaian antara hubungan yang tertanam dalam persamaan regresi dengan hubungan yang sebenarnya ada, dengan probabilitas p = 1 - a ditolak.

Kesalahan perkiraan rata-rata(persentase deviasi rata-rata) dihitung sebagai perbedaan relatif rata-rata, yang dinyatakan sebagai persentase, antara nilai aktual dan nilai yang dihitung dari variabel yang dihasilkan:

Bagaimana nilainya lebih sedikit indikator ini, semakin baik kualitas prediktif model tersebut. Jika indikator ini tidak lebih tinggi dari 7%, model tersebut sangat akurat. Jika 8 > 15% menunjukkan akurasi model yang kurang memuaskan.

Kesalahan standar koefisien regresi:

dimana (/I) -1 .- elemen diagonal matriks (X G X)~ 1k - sejumlah faktor;

X- matriks nilai variabel faktor:

X 7 - matriks nilai variabel faktor yang ditransposisikan;

(ZhL) _| - matriks invers dari matriks.

Semakin kecil indikator-indikator ini untuk setiap koefisien regresi, semakin andal estimasi koefisien regresi tersebut.

Tes siswa (t-statistik):

Kriteria ini memungkinkan Anda mengukur tingkat reliabilitas (signifikansi) hubungan yang ditentukan oleh koefisien regresi tertentu. Jika nilai yang dihitung T. lebih besar dari nilai tabel

T av, dimana v - p - k - 1 adalah banyaknya derajat kebebasan, maka hipotesis bahwa koefisien ini tidak signifikan secara statistik ditolak dengan probabilitas (100 - a)%. Ada tabel khusus distribusi / yang memungkinkan, berdasarkan tingkat signifikansi tertentu a dan jumlah derajat kebebasan v, untuk menentukan nilai kritis kriteria. Nilai a yang paling umum digunakan adalah 5%.

Multikolinearitas, yaitu. Pengaruh hubungan timbal balik antar variabel faktor menyebabkan kebutuhan untuk puas dengan jumlah variabel yang terbatas. Jika hal ini tidak diperhitungkan, Anda mungkin akan mendapatkan model regresi yang tidak logis. Untuk menghindari dampak negatif multikolinearitas, koefisien korelasi berpasangan dihitung sebelum membangun model regresi berganda r xjxj antar variabel yang dipilih X. Dan X

Di Sini XjX; - nilai rata-rata hasil kali dua variabel faktor;

XjXj- produk dari nilai rata-rata dua variabel faktor;

Estimasi varians variabel faktor x..

Dua variabel dianggap regresi terkait satu sama lain (yaitu kolinear) jika koefisien korelasi berpasangannya dalam nilai absolut lebih besar dari 0,8. Dalam hal ini, salah satu variabel tersebut harus dikeluarkan dari pertimbangan.

Untuk memperluas kemampuan analisis ekonomi dari model regresi yang dihasilkan, rata-rata koefisien elastisitas, ditentukan dengan rumus:

Di mana Xj- nilai rata-rata variabel faktor yang bersangkutan;

kamu - nilai rata-rata dari variabel yang dihasilkan; aku - koefisien regresi untuk variabel faktor yang bersangkutan.

Koefisien elastisitas menunjukkan berapa persentase rata-rata nilai variabel yang dihasilkan akan berubah ketika variabel faktor berubah sebesar 1%, yaitu. bagaimana variabel yang dihasilkan bereaksi terhadap perubahan variabel faktor. Misalnya, bagaimana reaksi harga meter persegi? m area apartemen pada jarak dari pusat kota.

Dari sudut pandang analisis signifikansi koefisien regresi tertentu, estimasi akan berguna koefisien determinasi parsial:

Berikut perkiraan varians yang dihasilkan

variabel. Koefisien ini menunjukkan berapa persentase variasi variabel yang dihasilkan dijelaskan oleh variasi variabel faktor ke-i yang termasuk dalam persamaan regresi.

  • Ciri-ciri hedonis dipahami sebagai ciri-ciri suatu benda yang mencerminkan sifat-sifatnya yang berguna (berharga) dari sudut pandang pembeli dan penjual.


Baru di situs

>

Paling populer