Rumah Prostetik dan implantasi Metode titik kuadrat terkecil. Di mana metode kuadrat terkecil digunakan?

Metode titik kuadrat terkecil. Di mana metode kuadrat terkecil digunakan?

Contoh.

Data eksperimen tentang nilai variabel X Dan pada diberikan dalam tabel.

Sebagai hasil dari penyelarasannya, suatu fungsi diperoleh

Menggunakan metode kuadrat terkecil , perkirakan data ini dengan ketergantungan linier y=kapak+b(temukan parameter A Dan B). Cari tahu mana di antara dua garis yang lebih baik (dalam pengertian metode kuadrat terkecil) yang menyelaraskan data eksperimen. Buatlah gambar.

Inti dari metode kuadrat terkecil (LSM).

Tugasnya adalah menemukan koefisien ketergantungan linier di mana fungsi dua variabel berada A Dan B mengambil nilai terkecil. Artinya, diberikan A Dan B jumlah simpangan kuadrat data eksperimen dari garis lurus yang ditemukan akan menjadi yang terkecil. Inilah inti dari metode kuadrat terkecil.

Jadi, penyelesaian contohnya adalah mencari titik ekstrem dari suatu fungsi dua variabel.

Menurunkan rumus untuk mencari koefisien.

Sebuah sistem dua persamaan dengan dua hal yang tidak diketahui dikompilasi dan diselesaikan. Menemukan turunan parsial suatu fungsi oleh variabel A Dan B, kita menyamakan turunan ini dengan nol.

Kami menyelesaikan sistem persamaan yang dihasilkan menggunakan metode apa pun (misalnya dengan metode substitusi atau metode Cramer) dan mendapatkan rumus mencari koefisien menggunakan metode kuadrat terkecil (LSM).

Diberikan A Dan B fungsi mengambil nilai terkecil. Bukti dari fakta ini diberikan di bawah dalam teks di akhir halaman.

Itulah keseluruhan metode kuadrat terkecil. Rumus untuk mencari parameter A berisi jumlah,,, dan parameter N- jumlah data eksperimen. Kami menyarankan untuk menghitung nilai jumlah ini secara terpisah. Koefisien B ditemukan setelah perhitungan A.

Saatnya mengingat contoh aslinya.

Larutan.

Dalam contoh kita n=5. Kami mengisi tabel untuk kemudahan menghitung jumlah yang termasuk dalam rumus koefisien yang diperlukan.

Nilai pada baris keempat tabel diperoleh dengan mengalikan nilai baris ke-2 dengan nilai baris ke-3 untuk setiap angka. Saya.

Nilai pada baris kelima tabel diperoleh dengan mengkuadratkan nilai pada baris ke-2 untuk setiap angka Saya.

Nilai di kolom terakhir tabel adalah jumlah nilai di seluruh baris.

Kami menggunakan rumus metode kuadrat terkecil untuk mencari koefisien A Dan B. Kami mengganti nilai yang sesuai dari kolom terakhir tabel ke dalamnya:

Karena itu, kamu = 0,165x+2,184- perkiraan garis lurus yang diinginkan.

Masih mencari tahu garis yang mana kamu = 0,165x+2,184 atau lebih mendekati data aslinya, yaitu membuat estimasi menggunakan metode kuadrat terkecil.

Estimasi kesalahan metode kuadrat terkecil.

Untuk melakukan ini, Anda perlu menghitung jumlah deviasi kuadrat dari data asli dari garis-garis ini Dan , nilai yang lebih kecil menunjukkan garis yang lebih mendekati data asli dalam pengertian metode kuadrat terkecil.

Sejak , maka lurus kamu = 0,165x+2,184 lebih mendekati data aslinya.

Ilustrasi grafis metode kuadrat terkecil (LS).

Semuanya terlihat jelas di grafik. Garis merah adalah garis lurus yang ditemukan kamu = 0,165x+2,184, garis biru adalah , titik merah muda adalah data asli.

Dalam praktiknya, ketika memodelkan berbagai proses - khususnya, ekonomi, fisik, teknis, sosial - metode tertentu untuk menghitung perkiraan nilai fungsi dari nilai yang diketahui pada titik tetap tertentu banyak digunakan.

Masalah perkiraan fungsi seperti ini sering muncul:

    ketika membuat rumus perkiraan untuk menghitung nilai besaran karakteristik dari proses yang diteliti menggunakan data tabel yang diperoleh sebagai hasil percobaan;

    dalam integrasi numerik, diferensiasi, solusi persamaan diferensial dll.;

    jika perlu, hitung nilai fungsi pada titik tengah interval yang dipertimbangkan;

    ketika menentukan nilai besaran karakteristik suatu proses di luar interval yang dipertimbangkan, khususnya ketika meramalkan.

Jika, untuk memodelkan proses tertentu yang ditentukan oleh tabel, kita membangun sebuah fungsi yang kira-kira menggambarkan proses ini berdasarkan metode kuadrat terkecil, maka itu akan disebut fungsi aproksimasi (regresi), dan masalah membangun fungsi aproksimasi itu sendiri akan disebut masalah perkiraan.

Artikel ini membahas tentang kemampuan paket MS Excel untuk menyelesaikan masalah jenis ini, selain itu juga memberikan metode dan teknik untuk membangun (membuat) regresi untuk fungsi tabulasi (yang merupakan dasar analisis regresi).

Excel memiliki dua opsi untuk membuat regresi.

    Menambahkan regresi (garis tren) yang dipilih ke diagram yang dibuat berdasarkan tabel data untuk karakteristik proses yang diteliti (hanya tersedia jika diagram telah dibuat);

    Menggunakan fungsi statistik bawaan pada lembar kerja Excel, memungkinkan Anda memperoleh regresi (garis tren) langsung dari tabel data sumber.

Menambahkan garis tren ke grafik

Untuk tabel data yang menjelaskan suatu proses dan diwakili oleh diagram, Excel memiliki alat analisis regresi efektif yang memungkinkan Anda untuk:

    membangun berdasarkan metode kuadrat terkecil dan menambahkan lima jenis regresi ke diagram, yang memodelkan proses yang diteliti dengan berbagai tingkat akurasi;

    tambahkan persamaan regresi yang dibangun ke diagram;

    menentukan tingkat kesesuaian regresi yang dipilih dengan data yang ditampilkan pada grafik.

Berdasarkan data grafik, Excel memungkinkan Anda memperoleh jenis regresi linier, polinomial, logaritmik, pangkat, eksponensial, yang ditentukan oleh persamaan:

kamu = kamu(x)

dimana x adalah variabel bebas yang sering mengambil nilai barisan bilangan asli (1; 2; 3; ...) dan menghasilkan, misalnya, hitungan mundur waktu dari proses yang diteliti (karakteristik).

1 . Regresi linier baik untuk memodelkan karakteristik yang nilainya naik atau turun dengan laju yang konstan. Ini adalah model yang paling sederhana untuk dibangun untuk proses yang sedang dipelajari. Itu dibangun sesuai dengan persamaan:

kamu = mx + b

dimana m adalah garis singgung sudut kemiringan regresi linier ke sumbu absis; b - koordinat titik potong regresi linier dengan sumbu ordinat.

2 . Garis tren polinomial berguna untuk menggambarkan karakteristik yang memiliki beberapa titik ekstrem yang berbeda (maksimum dan minimum). Pilihan derajat polinomial ditentukan oleh jumlah ekstrem dari karakteristik yang dipelajari. Jadi, polinomial derajat kedua dapat menggambarkan suatu proses yang hanya memiliki satu maksimum atau minimum; polinomial derajat ketiga - tidak lebih dari dua ekstrem; polinomial derajat keempat - tidak lebih dari tiga ekstrem, dll.

Dalam hal ini, garis tren dibangun sesuai dengan persamaan:

kamu = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

dimana koefisien c0, c1, c2,... c6 adalah konstanta yang nilainya ditentukan selama konstruksi.

3 . Garis tren logaritmik berhasil digunakan ketika memodelkan karakteristik yang nilainya awalnya berubah dengan cepat dan kemudian stabil secara bertahap.

y = c ln(x) + b

4 . Garis tren hukum pangkat memberikan hasil yang baik jika nilai hubungan yang diteliti dicirikan oleh perubahan laju pertumbuhan yang konstan. Contoh ketergantungan tersebut adalah grafik gerak dipercepat beraturan sebuah mobil. Jika terdapat nilai nol atau negatif pada data, Anda tidak dapat menggunakan garis tren pangkat.

Dibangun sesuai dengan persamaan:

kamu = cxb

dimana koefisien b, c adalah konstanta.

5 . Garis tren eksponensial harus digunakan ketika laju perubahan data terus meningkat. Untuk data yang mengandung nilai nol atau negatif, pendekatan jenis ini juga tidak berlaku.

Dibangun sesuai dengan persamaan:

y = c ebx

dimana koefisien b, c adalah konstanta.

Saat memilih garis Tren Unggul secara otomatis menghitung nilai R2, yang mencirikan keandalan perkiraan: daripada nilai lebih dekat R2 ke kesatuan, semakin andal garis tren mendekati proses yang diteliti. Jika perlu, nilai R2 selalu dapat ditampilkan pada grafik.

Ditentukan dengan rumus:

Untuk menambahkan garis tren ke rangkaian data:

    mengaktifkan bagan berdasarkan serangkaian data, yaitu klik di dalam area bagan. Item Diagram akan muncul di menu utama;

    setelah mengklik item ini, sebuah menu akan muncul di layar di mana Anda harus memilih perintah Tambahkan garis tren.

Tindakan yang sama dapat dengan mudah diterapkan dengan menggerakkan penunjuk tetikus ke grafik yang sesuai dengan salah satu rangkaian data dan mengklik kanan; Di menu konteks yang muncul, pilih perintah Tambahkan garis tren. Kotak dialog Garis Tren akan muncul di layar dengan tab Type terbuka (Gbr. 1).

Setelah ini Anda perlu:

Pilih tipe garis tren yang diperlukan pada tab Type (tipe Linear dipilih secara default). Untuk tipe Polinomial, pada kolom Derajat, tentukan derajat polinomial yang dipilih.

1 . Bidang Seri yang dibangun mencantumkan semua seri data dalam bagan yang dimaksud. Untuk menambahkan garis tren ke seri data tertentu, pilih namanya di bidang Seri yang dibangun.

Jika perlu, dengan membuka tab Parameter (Gbr. 2), Anda dapat mengatur parameter berikut untuk garis tren:

    ubah nama garis tren di bidang Nama kurva perkiraan (dihaluskan).

    atur jumlah periode (maju atau mundur) untuk perkiraan di bidang Prakiraan;

    menampilkan persamaan garis tren di area diagram, yang mana Anda harus mengaktifkan kotak centang tampilkan persamaan pada diagram;

    tampilkan nilai keandalan perkiraan R2 di area diagram, yang mana Anda harus mengaktifkan kotak centang Tempatkan nilai keandalan perkiraan pada diagram (R^2);

    atur titik perpotongan garis tren dengan sumbu Y, yang mana Anda harus mengaktifkan kotak centang untuk perpotongan kurva dengan sumbu Y pada suatu titik;

    Klik tombol OK untuk menutup kotak dialog.

Untuk mulai mengedit garis tren yang sudah digambar, ada tiga cara:

    gunakan perintah Selected trend line dari menu Format, setelah sebelumnya memilih garis tren;

    pilih perintah Format garis tren dari menu konteks, yang dipanggil dengan mengklik kanan pada garis tren;

    klik dua kali pada garis tren.

Kotak dialog Format Garis Tren akan muncul di layar (Gbr. 3), berisi tiga tab: Tampilan, Jenis, Parameter, dan konten dari dua tab terakhir sepenuhnya bertepatan dengan tab serupa pada kotak dialog Garis Tren (Gbr. 1 -2). Pada tab View, Anda dapat mengatur jenis garis, warna dan ketebalannya.

Untuk menghapus garis tren yang sudah digambar, pilih garis tren yang akan dihapus dan tekan tombol Hapus.

Keuntungan dari alat analisis regresi yang dipertimbangkan adalah:

    relatif mudahnya membuat garis tren pada grafik tanpa membuat tabel data untuknya;

    daftar jenis garis tren yang diusulkan cukup luas, dan daftar ini mencakup jenis regresi yang paling umum digunakan;

    kemampuan untuk memprediksi perilaku proses yang diteliti dengan sejumlah langkah maju dan mundur secara sewenang-wenang (dalam batas akal sehat);

    kemampuan memperoleh persamaan garis tren dalam bentuk analitis;

    kemungkinan, jika perlu, untuk memperoleh penilaian atas keandalan perkiraan.

Kerugiannya antara lain sebagai berikut:

    konstruksi garis tren hanya dilakukan jika terdapat diagram yang dibangun di atas serangkaian data;

    proses menghasilkan deret data untuk karakteristik yang diteliti berdasarkan persamaan garis tren yang diperoleh agak berantakan: persamaan regresi yang diperlukan diperbarui dengan setiap perubahan nilai deret data asli, tetapi hanya dalam area diagram , ketika seri data, yang dihasilkan berdasarkan persamaan garis tren lama, tetap tidak berubah;

    Dalam laporan PivotChart, mengubah tampilan bagan atau laporan PivotTable terkait tidak mempertahankan garis tren yang ada, artinya sebelum Anda menggambar garis tren atau memformat laporan PivotChart, Anda harus memastikan bahwa tata letak laporan memenuhi persyaratan yang diperlukan.

Garis tren dapat digunakan untuk melengkapi rangkaian data yang disajikan pada bagan seperti grafik, histogram, bagan area datar yang tidak terstandarisasi, bagan batang, bagan sebar, bagan gelembung, dan bagan saham.

Anda tidak dapat menambahkan garis tren ke rangkaian data dalam diagram 3D, normalisasi, radar, lingkaran, dan donat.

Menggunakan fungsi bawaan Excel

Excel juga memiliki alat analisis regresi untuk merencanakan garis tren di luar area grafik. Ada sejumlah fungsi lembar kerja statistik yang bisa Anda gunakan untuk tujuan ini, namun semuanya hanya memungkinkan Anda membuat regresi linier atau eksponensial.

Excel memiliki beberapa fungsi untuk membangun regresi linier, khususnya:

    KECENDERUNGAN;

  • LERENG dan POTONG.

Serta beberapa fungsi untuk membangun garis tren eksponensial, khususnya:

    LGRFPRIBL.

Perlu diperhatikan bahwa teknik pembuatan regresi menggunakan fungsi TREND dan GROWTH hampir sama. Hal yang sama juga berlaku pada pasangan fungsi LINEST dan LGRFPRIBL. Untuk keempat fungsi ini, pembuatan tabel nilai menggunakan fitur Excel seperti rumus array, yang agak mengacaukan proses pembuatan regresi. Perhatikan juga bahwa konstruksi regresi linier, menurut pendapat kami, paling mudah dilakukan dengan menggunakan fungsi SLOPE dan INTERCEPT, di mana fungsi pertama menentukan kemiringan regresi linier, dan fungsi kedua menentukan segmen yang dicegat oleh regresi pada y -sumbu.

Keuntungan alat fungsi bawaan untuk analisis regresi adalah:

    proses yang cukup sederhana dan seragam untuk menghasilkan rangkaian data dari karakteristik yang diteliti untuk semua fungsi statistik bawaan yang menentukan garis tren;

    metodologi standar untuk membangun garis tren berdasarkan seri data yang dihasilkan;

    kemampuan untuk memprediksi perilaku proses yang diteliti dengan jumlah langkah maju atau mundur yang diperlukan.

Kerugiannya termasuk fakta bahwa Excel tidak memiliki fungsi bawaan untuk membuat jenis garis tren lainnya (kecuali linier dan eksponensial). Keadaan ini seringkali tidak memungkinkan untuk memilih model yang cukup akurat dari proses yang diteliti, serta memperoleh perkiraan yang mendekati kenyataan. Selain itu, saat menggunakan fungsi TREND dan GROWTH, persamaan garis tren tidak diketahui.

Perlu dicatat bahwa penulis tidak bermaksud menyajikan analisis regresi dengan tingkat kelengkapan apa pun. Tugas utamanya adalah menunjukkan, dengan menggunakan contoh spesifik, kemampuan paket Excel saat memecahkan masalah perkiraan; mendemonstrasikan alat efektif apa yang dimiliki Excel untuk membuat regresi dan perkiraan; mengilustrasikan bagaimana masalah tersebut dapat diselesaikan dengan relatif mudah bahkan oleh pengguna yang tidak memiliki pengetahuan luas tentang analisis regresi.

Contoh pemecahan masalah tertentu

Mari kita lihat pemecahan masalah tertentu menggunakan alat Excel yang terdaftar.

Masalah 1

Dengan tabel data keuntungan suatu usaha angkutan motor tahun 1995-2002. Anda perlu melakukan hal berikut:

    Buatlah diagram.

    Tambahkan garis tren linier dan polinomial (kuadrat dan kubik) ke grafik.

    Dengan menggunakan persamaan garis tren, dapatkan data tabel keuntungan perusahaan untuk setiap garis tren tahun 1995-2004.

    Buatlah perkiraan keuntungan perusahaan untuk tahun 2003 dan 2004.

Solusi dari masalah tersebut

    Dalam rentang sel A4:C11 lembar kerja Excel, masukkan lembar kerja yang ditunjukkan pada Gambar. 4.

    Setelah memilih rentang sel B4:C11, kami membuat diagram.

    Kami mengaktifkan diagram yang dibuat dan, sesuai dengan metode yang dijelaskan di atas, setelah memilih jenis garis tren di kotak dialog Garis Tren (lihat Gambar 1), kami secara bergantian menambahkan garis tren linier, kuadrat, dan kubik ke diagram. Di kotak dialog yang sama, buka tab Parameter (lihat Gambar 2), di bidang Nama kurva perkiraan (dihaluskan), masukkan nama tren yang ditambahkan, dan di bidang Perkiraan maju untuk: periode, atur nilai 2, karena direncanakan membuat perkiraan keuntungan untuk dua tahun ke depan. Untuk menampilkan persamaan regresi dan nilai reliabilitas aproksimasi R2 pada area diagram, aktifkan kotak centang tampilkan persamaan di layar dan tempatkan nilai reliabilitas aproksimasi (R^2) pada diagram. Untuk persepsi visual yang lebih baik, kami mengubah jenis, warna dan ketebalan garis tren yang dibuat, untuk itu kami menggunakan tab Tampilan pada kotak dialog Format Garis Tren (lihat Gambar 3). Diagram yang dihasilkan dengan garis tren tambahan ditunjukkan pada Gambar. 5.

    Memperoleh data tabel keuntungan perusahaan untuk setiap garis tren tahun 1995-2004. Mari kita gunakan persamaan garis tren yang disajikan pada Gambar. 5. Untuk melakukan ini, dalam sel rentang D3:F3, masukkan informasi teks tentang jenis garis tren yang dipilih: Tren linier, Tren kuadrat, Tren kubik. Selanjutnya, masukkan rumus regresi linier di sel D4 dan, dengan menggunakan penanda isian, salin rumus ini dengan referensi relatif ke rentang sel D5:D13. Perlu dicatat bahwa setiap sel dengan rumus regresi linier dari rentang sel D4:D13 memiliki argumen sel yang sesuai dari rentang A4:A13. Demikian pula, untuk regresi kuadratik, isikan rentang sel E4:E13, dan untuk regresi kubik, isikan rentang sel F4:F13. Dengan demikian, perkiraan laba perusahaan untuk tahun 2003 dan 2004 telah disusun. menggunakan tiga tren. Tabel nilai yang dihasilkan ditunjukkan pada Gambar. 6.

Masalah 2

    Buatlah diagram.

    Tambahkan garis tren logaritmik, pangkat, dan eksponensial ke grafik.

    Turunkan persamaan garis tren yang diperoleh, serta nilai reliabilitas dari pendekatan R2 untuk masing-masing garis tersebut.

    Dengan menggunakan persamaan garis tren, dapatkan data tabel laba perusahaan untuk setiap garis tren tahun 1995-2002.

    Buatlah perkiraan laba perusahaan untuk tahun 2003 dan 2004 dengan menggunakan garis tren berikut.

Solusi dari masalah tersebut

Mengikuti metodologi yang diberikan dalam menyelesaikan masalah 1, kita memperoleh diagram dengan garis tren logaritmik, pangkat, dan eksponensial ditambahkan ke dalamnya (Gbr. 7). Selanjutnya, dengan menggunakan persamaan garis tren yang diperoleh, kita mengisi tabel nilai laba perusahaan, termasuk nilai prediksi untuk tahun 2003 dan 2004. (Gbr. 8).

Pada Gambar. 5 dan gambar. terlihat bahwa model dengan tren logaritmik memiliki nilai reliabilitas aproksimasi yang paling rendah

R2 = 0,8659

Nilai R2 tertinggi sesuai dengan model dengan tren polinomial: kuadrat (R2 = 0,9263) dan kubik (R2 = 0,933).

Masalah 3

Dengan tabel data laba suatu usaha angkutan motor tahun 1995-2002 yang diberikan pada tugas 1, maka perlu dilakukan langkah-langkah sebagai berikut.

    Dapatkan seri data untuk garis tren linier dan eksponensial menggunakan fungsi TREND dan GROW.

    Dengan menggunakan fungsi TREND dan GROWTH, buatlah perkiraan laba perusahaan untuk tahun 2003 dan 2004.

    Buatlah diagram untuk data asli dan rangkaian data yang dihasilkan.

Solusi dari masalah tersebut

Mari kita gunakan lembar kerja untuk Soal 1 (lihat Gambar 4). Mari kita mulai dengan fungsi TREND:

    pilih rentang sel D4:D11, yang harus diisi dengan nilai fungsi TREND yang sesuai dengan data laba perusahaan yang diketahui;

    Panggil perintah Fungsi dari menu Sisipkan. Pada kotak dialog Function Wizard yang muncul, pilih fungsi TREND dari kategori Statistik, lalu klik tombol OK. Operasi yang sama dapat dilakukan dengan mengklik tombol (Sisipkan Fungsi) pada toolbar standar.

    Pada kotak dialog Argumen Fungsi yang muncul, masukkan rentang sel C4:C11 di bidang Known_values_y; di bidang Known_values_x - rentang sel B4:B11;

    Untuk membuat rumus yang dimasukkan menjadi rumus array, gunakan kombinasi tombol ++ .

Rumus yang kita masukkan pada formula bar akan terlihat seperti: =(TREND(C4:C11,B4:B11)).

Hasilnya, rentang sel D4:D11 diisi dengan nilai fungsi TREND yang sesuai (Gbr. 9).

Membuat perkiraan laba perusahaan untuk tahun 2003 dan 2004. diperlukan:

    pilih rentang sel D12:D13 di mana nilai prediksi fungsi TREND akan dimasukkan.

    panggil fungsi TREND dan di kotak dialog Argumen Fungsi yang muncul, masukkan di bidang Diketahui_nilai_y - rentang sel C4:C11; di bidang Known_values_x - rentang sel B4:B11; dan di bidang New_values_x - rentang sel B12:B13.

    ubah rumus ini menjadi rumus array menggunakan kombinasi tombol Ctrl + Shift + Enter.

    Rumus yang dimasukkan akan terlihat seperti: =(TREND(C4:C11;B4:B11;B12:B13)), dan rentang sel D12:D13 akan diisi dengan nilai prediksi fungsi TREND (lihat Gambar. 9).

Seri data diisi dengan cara yang sama menggunakan fungsi GROWTH, yang digunakan dalam analisis dependensi nonlinier dan bekerja dengan cara yang persis sama seperti TREND liniernya.

Gambar 10 menunjukkan tabel dalam mode tampilan rumus.

Untuk data awal dan rangkaian data yang diperoleh, diagramnya ditunjukkan pada Gambar. sebelas.

Masalah 4

Dengan tabel data penerimaan permohonan jasa oleh dinas pengiriman suatu perusahaan angkutan motor untuk periode tanggal 1 sampai dengan tanggal 11 bulan berjalan, perlu dilakukan tindakan sebagai berikut.

    Dapatkan rangkaian data untuk regresi linier: menggunakan fungsi SLOPE dan INTERCEPT; menggunakan fungsi LINEST.

    Dapatkan serangkaian data untuk regresi eksponensial menggunakan fungsi LGRFPRIBL.

    Dengan menggunakan fungsi di atas, buat perkiraan penerimaan aplikasi ke layanan pengiriman untuk periode tanggal 12 hingga 14 bulan berjalan.

    Buat diagram untuk seri data asli dan yang diterima.

Solusi dari masalah tersebut

Perhatikan bahwa, tidak seperti fungsi TREND dan GROWTH, tidak ada satu pun fungsi yang tercantum di atas (SLOPE, INTERCEPT, LINEST, LGRFPRIB) yang merupakan regresi. Fungsi-fungsi ini hanya memainkan peran pendukung, menentukan parameter regresi yang diperlukan.

Untuk regresi linier dan eksponensial yang dibangun menggunakan fungsi SLOPE, INTERCEPT, LINEST, LGRFPRIB, kemunculan persamaannya selalu diketahui, berbeda dengan regresi linier dan eksponensial yang berhubungan dengan fungsi TREND dan GROWTH.

1 . Mari kita buat regresi linier dengan persamaan:

kamu = mx+b

menggunakan fungsi SLOPE dan INTERCEPT, dengan kemiringan regresi m ditentukan oleh fungsi SLOPE, dan suku bebas b oleh fungsi INTERCEPT.

Untuk melakukan ini, kami melakukan tindakan berikut:

    masukkan tabel asli ke dalam cell range A4:B14;

    nilai parameter m akan ditentukan di sel C19. Pilih fungsi Kemiringan dari kategori Statistik; masukkan rentang sel B4:B14 di bidang nilai_yang diketahui dan rentang sel A4:A14 di bidang nilai_yang diketahui_x. Rumusnya akan dimasukkan pada sel C19: =SLOPE(B4:B14,A4:A14);

    Dengan menggunakan teknik serupa, nilai parameter b di sel D19 ditentukan. Dan isinya akan terlihat seperti: =SEGMENT(B4:B14,A4:A14). Jadi, nilai parameter m dan b yang diperlukan untuk membuat regresi linier masing-masing akan disimpan di sel C19, D19;

    Selanjutnya masukkan rumus regresi linier pada sel C4 dengan bentuk: =$C*A4+$D. Dalam rumus ini, sel C19 dan D19 ditulis dengan referensi absolut (alamat sel tidak boleh berubah selama kemungkinan penyalinan). Tanda referensi absolut $ dapat diketik dari keyboard atau menggunakan tombol F4, setelah menempatkan kursor pada alamat sel. Dengan menggunakan gagang isian, salin rumus ini ke dalam rentang sel C4:C17. Kami memperoleh seri data yang diperlukan (Gbr. 12). Karena jumlah permintaan adalah bilangan bulat, Anda harus mengatur format angka dengan jumlah desimal ke 0 pada tab Angka di jendela Format Sel.

2 . Sekarang mari kita buat regresi linier yang diberikan oleh persamaan:

kamu = mx+b

menggunakan fungsi LINEST.

Untuk ini:

    Masukkan fungsi LINEST sebagai rumus array pada cell range C20:D20: =(LINEST(B4:B14,A4:A14)). Hasilnya, kita memperoleh nilai parameter m di sel C20, dan nilai parameter b di sel D20;

    masukkan rumus di sel D4: =$C*A4+$D;

    salin rumus ini menggunakan penanda isian ke dalam rentang sel D4:D17 dan dapatkan seri data yang diinginkan.

3 . Kami membangun regresi eksponensial dengan persamaan:

menggunakan fungsi LGRFPRIBL dilakukan dengan cara yang sama:

    Pada cell range C21:D21 kita masukkan fungsi LGRFPRIBL sebagai rumus array: =( LGRFPRIBL (B4:B14,A4:A14)). Dalam hal ini, nilai parameter m akan ditentukan di sel C21, dan nilai parameter b akan ditentukan di sel D21;

    rumusnya dimasukkan ke dalam sel E4: =$D*$C^A4;

    menggunakan penanda isian, rumus ini disalin ke rentang sel E4:E17, tempat rangkaian data untuk regresi eksponensial akan ditempatkan (lihat Gambar 12).

Pada Gambar. Gambar 13 menunjukkan tabel di mana Anda dapat melihat fungsi yang kami gunakan dengan rentang sel yang diperlukan, serta rumusnya.

Besarnya R 2 ditelepon koefisien determinasi.

Tugas membangun ketergantungan regresi adalah mencari vektor koefisien m model (1) di mana koefisien R mengambil nilai maksimum.

Untuk menilai signifikansi R digunakan uji F Fisher yang dihitung dengan menggunakan rumus

Di mana N- ukuran sampel (jumlah percobaan);

k adalah jumlah koefisien model.

Jika F melebihi beberapa nilai kritis untuk data tersebut N Dan k dan probabilitas kepercayaan diterima, maka nilai R dianggap signifikan. Tabel nilai-nilai kritis F diberikan dalam buku referensi statistik matematika.

Dengan demikian, signifikansi R tidak hanya ditentukan oleh nilainya, tetapi juga oleh rasio antara jumlah percobaan dan jumlah koefisien (parameter) model. Memang benar, rasio korelasi n=2 untuk model linier sederhana sama dengan 1 (satu garis lurus selalu dapat ditarik melalui 2 titik pada sebuah bidang). Namun, jika data eksperimen adalah variabel acak, nilai R seperti itu harus dipercaya dengan sangat hati-hati. Biasanya, untuk mendapatkan R yang signifikan dan regresi yang andal, mereka berupaya memastikan bahwa jumlah eksperimen secara signifikan melebihi jumlah koefisien model (n>k).

Untuk membangun model regresi linier, Anda memerlukan:

1) siapkan daftar n baris dan m kolom yang berisi data eksperimen (kolom berisi nilai keluaran Y harus menjadi yang pertama atau terakhir dalam daftar); Sebagai contoh, mari kita ambil data dari tugas sebelumnya, tambahkan kolom bernama “Nomor Periode.”, beri nomor pada nomor periode dari 1 hingga 12. (ini akan menjadi nilainya X)

2) masuk ke menu Data/Analisis Data/Regresi

Jika item "Analisis Data" di menu "Alat" tidak ada, maka Anda harus membuka item "Add-In" di menu yang sama dan mencentang kotak "Paket Analisis".

3) di kotak dialog "Regresi", atur:

· interval masukan Y;

· interval masukan X;

· interval keluaran - sel kiri atas interval di mana hasil perhitungan akan ditempatkan (disarankan untuk menempatkannya pada lembar kerja baru);

4) klik "OK" dan analisis hasilnya.

Yang mana yang paling banyak ditemukan aplikasi yang luas dalam berbagai bidang ilmu pengetahuan dan kegiatan praktis. Bisa fisika, kimia, biologi, ekonomi, sosiologi, psikologi, dan lain sebagainya. Atas kehendak takdir, saya sering kali harus berurusan dengan perekonomian, oleh karena itu hari ini saya akan mengatur untuk Anda perjalanan ke negara menakjubkan bernama Ekonometrika=) ...Bagaimana bisa kamu tidak menginginkannya?! Di sana sangat bagus – Anda hanya perlu mengambil keputusan! ...Tetapi yang mungkin Anda inginkan adalah mempelajari cara memecahkan masalah metode kuadrat terkecil. Dan terutama pembaca yang rajin akan belajar menyelesaikannya tidak hanya secara akurat, tetapi juga SANGAT CEPAT ;-) Tapi pertama-tama pernyataan umum mengenai permasalahan tersebut+ contoh terlampir:

Mari kita pelajari indikator-indikator dalam suatu mata pelajaran tertentu yang memiliki ekspresi kuantitatif. Pada saat yang sama, ada banyak alasan untuk percaya bahwa indikator bergantung pada indikatornya. Asumsi ini dapat berupa hipotesis ilmiah atau berdasarkan akal sehat dasar. Namun, mari kita kesampingkan ilmu pengetahuan dan jelajahi area yang lebih menarik, yaitu toko kelontong. Mari kita nyatakan dengan:

– area ritel toko kelontong, m2,
– omset tahunan toko kelontong, juta rubel.

Jelas sekali bahwa semakin besar area toko, dalam banyak kasus, omzetnya akan semakin besar.

Misalkan setelah melakukan observasi/eksperimen/perhitungan/menari dengan rebana kita mempunyai data numerik:

Dengan toko kelontong, saya pikir semuanya jelas: - ini adalah area toko pertama, - omset tahunannya, - area toko ke-2, - omset tahunannya, dll. Omong-omong, sama sekali tidak perlu memiliki akses ke materi rahasia - penilaian omset perdagangan yang cukup akurat dapat diperoleh melalui statistik matematika. Namun, jangan sampai teralihkan, kursus spionase komersial sudah berbayar =)

Data tabel juga dapat ditulis dalam bentuk titik-titik dan digambarkan dalam bentuk yang sudah dikenal sistem kartesius .

Kami akan menjawab pertanyaan penting: Berapa banyak poin yang dibutuhkan untuk penelitian kualitatif?

Lebih besar lebih baik. Set minimum yang dapat diterima terdiri dari 5-6 poin. Selain itu, jika jumlah datanya kecil, hasil yang “anomali” tidak dapat dimasukkan ke dalam sampel. Jadi, misalnya, sebuah toko elit kecil dapat memperoleh penghasilan yang jauh lebih besar daripada “rekan-rekannya”, sehingga menimbulkan distorsi pola umum, itulah yang perlu Anda temukan!

Sederhananya, kita perlu memilih suatu fungsi, jadwal yang melewati sedekat mungkin dengan titik-titik tersebut . Fungsi ini disebut memperkirakan (perkiraan - perkiraan) atau fungsi teoritis . Secara umum, “pesaing” yang jelas segera muncul di sini - polinomial tingkat tinggi, yang grafiknya melewati SEMUA titik. Namun opsi ini rumit dan seringkali salah. (karena grafik akan “berputar” sepanjang waktu dan tidak mencerminkan tren utama).

Dengan demikian, fungsi yang dicari harus cukup sederhana dan pada saat yang sama mencerminkan ketergantungan secara memadai. Seperti yang Anda duga, salah satu metode untuk menemukan fungsi tersebut disebut metode kuadrat terkecil. Pertama, mari kita lihat esensinya pandangan umum. Misalkan beberapa fungsi mendekati data eksperimen:


Bagaimana cara mengevaluasi keakuratan perkiraan ini? Mari kita hitung juga perbedaan (penyimpangan) antara eksperimen dan makna fungsional (kami mempelajari gambarnya). Pikiran pertama yang terlintas dalam pikiran adalah memperkirakan seberapa besar jumlahnya, namun masalahnya adalah perbedaannya bisa negatif (Misalnya, ) dan penyimpangan-penyimpangan akibat penjumlahan tersebut akan saling meniadakan. Oleh karena itu, sebagai perkiraan keakuratan perkiraan, perlu diambil jumlahnya modul penyimpangan:

atau runtuh: (jika ada yang tidak tahu: – ini adalah ikon penjumlahan, dan – variabel tambahan “penghitung”, yang mengambil nilai dari 1 hingga ).

Mendekatkan titik percobaan berbagai fungsi, kami akan menerima arti yang berbeda, dan tentunya, jika jumlah ini lebih kecil, fungsi tersebut lebih akurat.

Metode seperti itu ada dan disebut metode modulus terkecil. Namun, dalam praktiknya, hal ini menjadi lebih luas metode kuadrat terkecil, di mana kemungkinan nilai negatif dihilangkan bukan dengan modul, tetapi dengan mengkuadratkan deviasi:

, setelah itu upaya diarahkan untuk memilih fungsi sedemikian rupa sehingga jumlah simpangan kuadrat adalah sekecil mungkin. Sebenarnya dari sinilah nama metode tersebut berasal.

Dan sekarang kita akan kembali ke hal lain poin penting: seperti disebutkan di atas, fungsi yang dipilih harusnya cukup sederhana - tetapi ada juga banyak fungsi seperti itu: linier , hiperbolis, eksponensial, logaritma, kuadrat dll. Dan tentunya di sini saya ingin langsung “mengurangi bidang kegiatan”. Kelas fungsi manakah yang harus saya pilih untuk penelitian? Primitif, tapi teknik yang efektif:

– Cara termudah adalah dengan menggambarkan titik pada gambar dan menganalisis lokasinya. Jika mereka cenderung berjalan dalam garis lurus, maka Anda harus mencarinya persamaan suatu garis Dengan nilai optimal Dan . Dengan kata lain, tugasnya adalah mencari koefisien TERSEBUT sehingga jumlah simpangan kuadratnya paling kecil.

Jika titik-titiknya letaknya, misalnya sepanjang hiperbola, maka jelaslah bahwa fungsi linier akan memberikan perkiraan yang buruk. Dalam hal ini, kami mencari koefisien yang paling “menguntungkan” untuk persamaan hiperbola – yang memberikan jumlah kuadrat minimum .

Sekarang perhatikan bahwa dalam kedua kasus yang sedang kita bicarakan fungsi dua variabel, yang argumennya parameter ketergantungan yang dicari:

Dan pada dasarnya kita perlu memecahkan masalah standar - temukan fungsi minimum dua variabel.

Mari kita ingat contoh kita: misalkan titik "penyimpanan" cenderung terletak pada garis lurus dan ada banyak alasan untuk meyakini hal itu ketergantungan linier omset dari ruang ritel. Mari kita cari koefisien TERSEBUT “a” dan “menjadi” sehingga merupakan jumlah deviasi kuadrat adalah yang terkecil. Semuanya seperti biasa - pertama Turunan parsial orde pertama. Berdasarkan aturan linearitas Anda dapat membedakannya tepat di bawah ikon penjumlahan:

Jika Anda ingin menggunakan informasi ini untuk esai atau makalah - Saya akan sangat berterima kasih atas tautan dalam daftar sumber; Anda akan menemukan perhitungan terperinci seperti itu di beberapa tempat:

Mari buat sistem standar:

Kami mengurangi setiap persamaan dengan "dua" dan, sebagai tambahan, "memecah" jumlahnya:

Catatan : menganalisis secara mandiri mengapa “a” dan “be” dapat dikeluarkan dari ikon penjumlahan. Ngomong-ngomong, secara formal ini bisa dilakukan dengan penjumlahan

Mari kita menulis ulang sistem dalam bentuk “terapan”:

setelah itu algoritma untuk memecahkan masalah kita mulai muncul:

Tahukah kita koordinat titik-titik tersebut? Kita tahu. Jumlah bisakah kita menemukannya? Dengan mudah. Mari kita buat yang paling sederhana sistem dua persamaan linear dalam dua hal yang tidak diketahui(“a” dan “menjadi”). Kami memecahkan sistem, misalnya, metode Cramer, sebagai hasilnya kita memperoleh titik stasioner. Memeriksa kondisi cukup untuk ekstrem, kita dapat memverifikasi bahwa pada titik ini fungsinya mencapai dengan tepat minimum. Pemeriksaan tersebut melibatkan perhitungan tambahan dan oleh karena itu kami akan meninggalkannya di belakang layar (jika perlu, bingkai yang hilang dapat dilihat). Kami menarik kesimpulan akhir:

Fungsi jalan terbaik (setidaknya dibandingkan dengan fungsi linier lainnya) mendekatkan titik percobaan . Secara kasar, grafiknya mendekati titik-titik ini. Dalam tradisi ekonometrika fungsi perkiraan yang dihasilkan juga disebut persamaan regresi linier berpasangan .

Masalah yang sedang dipertimbangkan sangat penting secara praktis. Dalam contoh situasi kita, Persamaan. memungkinkan Anda memprediksi perputaran perdagangan apa ("Igrek") toko akan memiliki nilai tertentu dari area penjualan (satu atau lain arti dari "x"). Ya, ramalan yang dihasilkan hanya berupa ramalan, namun dalam banyak kasus ternyata cukup akurat.

Saya hanya akan menganalisis satu masalah dengan bilangan "nyata", karena tidak ada kesulitan di dalamnya - semua perhitungan ada pada levelnya kurikulum sekolah kelas 7-8. Dalam 95 persen kasus, Anda akan diminta untuk mencari fungsi linier saja, tetapi di akhir artikel saya akan menunjukkan bahwa tidak sulit lagi mencari persamaan hiperbola optimal, eksponensial, dan beberapa fungsi lainnya.

Faktanya, yang tersisa hanyalah mendistribusikan barang yang dijanjikan - sehingga Anda dapat belajar memecahkan contoh-contoh tersebut tidak hanya secara akurat, tetapi juga dengan cepat. Kami mempelajari standar dengan cermat:

Tugas

Dari hasil mempelajari hubungan antara dua indikator, diperoleh pasangan angka sebagai berikut:

Dengan menggunakan metode kuadrat terkecil, temukan fungsi linier yang paling mendekati fungsi empiris (berpengalaman) data. Buatlah gambar untuk membuat titik-titik percobaan dan grafik fungsi aproksimasi dalam sistem koordinat persegi panjang Cartesian . Temukan jumlah deviasi kuadrat antara nilai empiris dan teoritis. Cari tahu apakah fiturnya lebih baik (dari sudut pandang metode kuadrat terkecil) mendekatkan titik percobaan.

Harap dicatat bahwa arti “x” adalah wajar, dan ini memiliki arti makna yang khas, yang akan saya bicarakan nanti; tapi tentu saja bisa juga pecahan. Selain itu, bergantung pada konten tugas tertentu, nilai "X" dan "permainan" bisa negatif seluruhnya atau sebagian. Ya, kami telah diberi tugas yang “tak berwajah”, dan kami memulainya larutan:

Kemungkinan fungsi optimal kami temukan sebagai solusi untuk sistem:

Agar pencatatan lebih ringkas maka variabel “counter” dapat dihilangkan, karena sudah jelas bahwa penjumlahan dilakukan dari 1 sampai .

Lebih mudah untuk menghitung jumlah yang diperlukan dalam bentuk tabel:


Penghitungan dapat dilakukan pada mikrokalkulator, tetapi lebih baik menggunakan Excel - lebih cepat dan tanpa kesalahan; tonton video singkatnya:

Jadi, kita mendapatkan yang berikut ini sistem:

Di sini Anda dapat mengalikan persamaan kedua dengan 3 dan kurangi suku ke-2 dari persamaan ke-1 dengan suku. Tapi ini adalah keberuntungan - dalam praktiknya, sistem seringkali bukan sebuah anugerah, dan dalam kasus seperti itu sistem menyelamatkan metode Cramer:
, yang berarti sistem memiliki solusi unik.

Mari kita periksa. Saya memahami bahwa Anda tidak menginginkannya, tetapi mengapa melewatkan kesalahan yang tidak dapat dilewatkan sama sekali? Mari kita substitusikan solusi yang ditemukan ke dalam sisi kiri setiap persamaan sistem:

Ruas kanan persamaan yang bersesuaian diperoleh, yang berarti sistem diselesaikan dengan benar.

Jadi, fungsi aproksimasi yang diinginkan: – dari semua fungsi linier Dialah yang paling mendekati data eksperimen.

Berbeda dengan lurus ketergantungan omset toko terhadap luasnya, ketergantungan yang ditemukan adalah balik (prinsip “semakin banyak, semakin sedikit”), dan fakta ini langsung terungkap dari sisi negatifnya lereng. Fungsi memberitahu kita bahwa dengan kenaikan suatu indikator tertentu sebesar 1 satuan, maka nilai indikator terikatnya menurun rata-rata sebesar 0,65 unit. Seperti kata pepatah, semakin tinggi harga soba, semakin sedikit penjualannya.

Untuk memplot grafik fungsi aproksimasi, kita mencari dua nilainya:

dan jalankan gambarnya:


Garis lurus yang dibangun disebut garis tren (yaitu, garis tren linier, yaitu dalam kasus umum suatu tren belum tentu berupa garis lurus). Semua orang pasti familiar dengan ungkapan “menjadi tren”, dan menurut saya istilah ini tidak memerlukan komentar tambahan.

Mari kita hitung jumlah simpangan kuadrat antara nilai empiris dan teoritis. Secara geometris, ini adalah jumlah kuadrat panjang segmen “raspberry”. (dua di antaranya sangat kecil sehingga tidak terlihat).

Mari kita rangkum perhitungannya dalam sebuah tabel:


Sekali lagi, ini dapat dilakukan secara manual; untuk berjaga-jaga, saya akan memberikan contoh untuk poin pertama:

tetapi jauh lebih efektif melakukannya dengan cara yang sudah diketahui:

Kami ulangi sekali lagi: Apa arti dari hasil yang diperoleh? Dari semua fungsi linier fungsi kamu indikatornya paling kecil, yaitu dalam keluarganya merupakan perkiraan terbaik. Dan di sini, omong-omong, pertanyaan terakhir dari masalah ini bukanlah suatu kebetulan: bagaimana jika fungsi eksponensial yang diusulkan apakah lebih baik mendekatkan titik percobaan?

Mari kita cari jumlah simpangan kuadrat yang sesuai - untuk membedakannya, saya akan menyatakannya dengan huruf "epsilon". Tekniknya sama persis:


Dan sekali lagi, untuk berjaga-jaga, perhitungan untuk poin pertama:

Di Excel kami menggunakan fungsi standar pengalaman (sintaks dapat ditemukan di Bantuan Excel).

Kesimpulan: , yang berarti bahwa fungsi eksponensial mendekati titik-titik eksperimen lebih buruk daripada garis lurus .

Namun di sini perlu dicatat bahwa yang “lebih buruk” adalah belum berarti, apa yang salah. Sekarang saya telah membuat grafiknya Fungsi eksponensial– dan itu juga melewati dekat titik - sedemikian rupa sehingga tanpa penelitian analitis sulit untuk mengatakan fungsi mana yang lebih akurat.

Ini menyimpulkan solusinya, dan saya kembali ke pertanyaan tentang nilai alami dari argumen tersebut. DI DALAM berbagai penelitian, sebagai aturan, “X” alami secara ekonomi atau sosiologis digunakan untuk memberi nomor bulan, tahun, atau interval waktu lain yang setara. Misalnya saja permasalahan berikut ini.

Metode kuadrat terkecil

Metode kuadrat terkecil ( OLS, OLS, Kuadrat Terkecil Biasa) - salah satu metode dasar analisis regresi untuk memperkirakan parameter model regresi yang tidak diketahui menggunakan data sampel. Metode ini didasarkan pada minimalisasi jumlah kuadrat sisa regresi.

Perlu diperhatikan bahwa metode kuadrat terkecil itu sendiri dapat disebut sebagai metode untuk menyelesaikan suatu masalah pada suatu luasan jika penyelesaiannya terletak pada atau memenuhi beberapa kriteria untuk meminimalkan jumlah kuadrat dari beberapa fungsi dari variabel yang diperlukan. Oleh karena itu, metode kuadrat terkecil juga dapat digunakan untuk perkiraan representasi (perkiraan) suatu fungsi tertentu dengan fungsi lain (yang lebih sederhana), ketika menemukan himpunan besaran yang memenuhi persamaan atau batasan, yang jumlahnya melebihi jumlah besaran tersebut. , dll.

Inti dari MNC

Biarkan beberapa model (parametrik) dari hubungan probabilistik (regresi) antara variabel (yang dijelaskan) diberikan kamu dan banyak faktor (variabel penjelas) X

di mana adalah vektor parameter model yang tidak diketahui

- kesalahan model acak.

Biarlah ada juga contoh observasi terhadap nilai-nilai variabel tersebut. Misalkan bilangan observasi (). Lalu adalah nilai-nilai variabel pada observasi ke-th. Kemudian, untuk nilai parameter b tertentu, dimungkinkan untuk menghitung nilai teoritis (model) dari variabel y yang dijelaskan:

Besar kecilnya residu tergantung pada nilai parameter b.

Inti dari metode kuadrat terkecil (biasa, klasik) adalah mencari parameter b yang jumlah kuadrat residunya (eng. Jumlah Sisa Kuadrat) akan menjadi minimal:

Secara umum, masalah ini dapat diselesaikan dengan metode optimasi numerik (minimisasi). Dalam hal ini yang mereka bicarakan kuadrat terkecil nonlinier(NLS atau NLLS - Bahasa Inggris) Kuadrat Terkecil Non-Linear). Dalam banyak kasus, solusi analitis dapat diperoleh. Untuk menyelesaikan masalah minimalisasi, perlu mencari titik stasioner dari fungsi tersebut dengan mendiferensiasikannya terhadap parameter b yang tidak diketahui, menyamakan turunannya dengan nol dan menyelesaikan sistem persamaan yang dihasilkan:

Jika kesalahan acak model terdistribusi normal, memiliki varian yang sama, dan tidak berkorelasi, estimasi parameter OLS sama dengan estimasi kemungkinan maksimum (MLM).

OLS dalam kasus model linier

Biarkan ketergantungan regresi menjadi linier:

Membiarkan kamu adalah vektor kolom pengamatan variabel yang dijelaskan, dan merupakan matriks pengamatan faktor (baris-baris matriks tersebut merupakan vektor nilai faktor dalam pengamatan ini, dalam kolom - vektor nilai faktor tertentu dalam semua pengamatan). Representasi matriks dari model linier adalah:

Maka vektor estimasi variabel yang dijelaskan dan vektor residu regresi akan sama

Dengan demikian, jumlah kuadrat dari sisa regresi akan sama dengan

Membedakan fungsi ini terhadap vektor parameter dan menyamakan turunannya dengan nol, kita memperoleh sistem persamaan (dalam bentuk matriks):

.

Solusi dari sistem persamaan ini memberikan rumus umum Estimasi OLS untuk model linier:

Untuk tujuan analitis, representasi terakhir dari rumus ini berguna. Jika dalam model regresi data terpusat, maka dalam representasi ini matriks pertama mempunyai arti matriks kovarians sampel faktor, dan matriks kedua merupakan vektor kovarians faktor dengan variabel terikat. Kalau selain datanya juga dinormalisasi untuk UMK (yaitu, pada akhirnya terstandarisasi), maka matriks pertama mempunyai arti matriks korelasi sampel faktor, vektor kedua - vektor korelasi sampel faktor dengan variabel terikat.

Properti penting dari estimasi OLS untuk model dengan konstan- garis regresi yang dibangun melewati pusat gravitasi data sampel, sehingga persamaan terpenuhi:

Secara khusus, dalam kasus ekstrim, ketika satu-satunya regressor adalah sebuah konstanta, kita menemukan bahwa estimasi OLS dari satu-satunya parameter (konstanta itu sendiri) sama dengan nilai rata-rata dari variabel yang dijelaskan. Artinya, mean aritmatika, yang dikenal dengan nya properti yang bagus dari hukum bilangan besar, juga merupakan estimasi kuadrat terkecil - ini memenuhi kriteria jumlah minimum deviasi kuadrat darinya.

Contoh: regresi paling sederhana (berpasangan).

Dalam kasus regresi linier berpasangan, rumus perhitungannya disederhanakan (Anda dapat melakukannya tanpa aljabar matriks):

Properti penduga OLS

Pertama-tama, kami mencatat bahwa untuk model linier, estimasi OLS adalah perkiraan linier, sebagai berikut dari rumus di atas. Untuk estimasi OLS yang tidak bias, hal ini perlu dan cukup untuk dilakukan kondisi yang paling penting analisis regresi: tergantung pada faktor-faktornya, ekspektasi matematis dari kesalahan acak harus sama dengan nol. Keadaan ini, khususnya, puas jika

  1. nilai yang diharapkan kesalahan acak adalah nol, dan
  2. faktor dan kesalahan acak adalah variabel acak independen.

Kondisi kedua - kondisi eksogenitas faktor - bersifat mendasar. Jika properti ini tidak terpenuhi, maka kita dapat berasumsi bahwa hampir semua estimasi akan sangat tidak memuaskan: estimasi tersebut bahkan tidak akan konsisten (yaitu, bahkan sejumlah besar data tidak memungkinkan kita memperoleh estimasi berkualitas tinggi dalam kasus ini. ). Dalam kasus klasik, asumsi yang lebih kuat dibuat mengenai determinisme faktor, dibandingkan dengan kesalahan acak, yang secara otomatis berarti bahwa kondisi eksogenitas terpenuhi. Dalam kasus umum, untuk konsistensi estimasi, cukup memenuhi kondisi eksogenitas bersama dengan konvergensi matriks ke beberapa matriks non-singular seiring dengan bertambahnya ukuran sampel hingga tak terhingga.

Agar, selain konsistensi dan ketidakbiasannya, pendugaan kuadrat terkecil (biasa) juga efektif (yang terbaik di kelas pendugaan tak bias linier), sifat tambahan kesalahan acak harus dipenuhi:

Asumsi ini dapat dirumuskan untuk matriks kovarians dari vektor kesalahan acak

Model linier yang memenuhi kondisi ini disebut klasik. Estimasi OLS untuk regresi linier klasik adalah estimasi yang tidak bias, konsisten, dan paling efektif di kelas semua estimasi linier yang tidak bias (dalam literatur bahasa Inggris, singkatan tersebut terkadang digunakan BIRU (Penaksir Tak Berbasis Linier Terbaik) - estimasi linier tidak bias terbaik; dalam sastra Rusia, teorema Gauss-Markov lebih sering dikutip). Seperti yang mudah ditunjukkan, matriks kovarians dari vektor estimasi koefisien akan sama dengan:

OLS yang digeneralisasi

Metode kuadrat terkecil memungkinkan generalisasi yang luas. Daripada meminimalkan jumlah kuadrat dari residu, kita dapat meminimalkan beberapa bentuk kuadrat pasti positif dari vektor residu, dimana terdapat matriks bobot pasti positif simetris. Kuadrat terkecil konvensional adalah kasus khusus dari pendekatan ini, di mana matriks bobot berbanding lurus dengan matriks identitas. Seperti diketahui dari teori matriks (atau operator) simetris, untuk matriks tersebut terjadi dekomposisi. Oleh karena itu, fungsi tertentu dapat direpresentasikan sebagai berikut, yaitu fungsi ini dapat direpresentasikan sebagai jumlah kuadrat dari beberapa “sisa” yang ditransformasikan. Dengan demikian, kita dapat membedakan kelas metode kuadrat terkecil - metode LS (Kuadrat Terkecil).

Telah dibuktikan (teorema Aitken) bahwa untuk model regresi linier umum (di mana tidak ada batasan yang dikenakan pada matriks kovarians kesalahan acak), yang paling efektif (di kelas estimasi linier tidak bias) adalah apa yang disebut estimasi. Kuadrat Terkecil yang digeneralisasi (GLS - Kuadrat Terkecil yang Digeneralisasi)- Metode LS dengan matriks bobot sama dengan matriks kovarians terbalik kesalahan acak: .

Dapat ditunjukkan bahwa rumus estimasi GLS terhadap parameter model linier berbentuk

Oleh karena itu, matriks kovarians dari perkiraan ini akan sama dengan

Padahal, inti dari OLS terletak pada transformasi (linier) tertentu (P) dari data asli dan penerapan OLS biasa pada data yang diubah. Tujuan dari transformasi ini adalah agar pada data yang ditransformasi kesalahan acaknya sudah memenuhi asumsi klasik.

OLS tertimbang

Dalam kasus matriks bobot diagonal (dan oleh karena itu matriks kovarians kesalahan acak), kita memiliki apa yang disebut Kuadrat Terkecil Tertimbang (WLS). DI DALAM pada kasus ini jumlah kuadrat tertimbang dari residu model diminimalkan, yaitu setiap observasi menerima “bobot” yang berbanding terbalik dengan varian kesalahan acak dalam observasi ini: . Faktanya, data ditransformasikan dengan memberi bobot pada pengamatan (dibagi dengan jumlah yang sebanding dengan yang diharapkan deviasi standar kesalahan acak), dan OLS biasa diterapkan pada data berbobot.

Beberapa kasus khusus penggunaan MNC dalam praktiknya

Perkiraan ketergantungan linier

Mari kita perhatikan kasus ketika, sebagai hasil dari mempelajari ketergantungan besaran skalar tertentu pada besaran skalar tertentu (Ini bisa berupa, misalnya, ketergantungan tegangan pada kuat arus: , di mana adalah nilai konstan, resistansi dari konduktor), pengukuran besaran-besaran ini dilakukan, sebagai akibatnya nilai-nilai dan nilai-nilai yang sesuai diperoleh. Data pengukuran harus dicatat dalam sebuah tabel.

Meja. Hasil pengukuran.

Pengukuran no.
1
2
3
4
5
6

Pertanyaannya adalah: nilai koefisien manakah yang dapat dipilih untuk menggambarkan ketergantungan dengan paling baik? Menurut metode kuadrat terkecil, nilai ini harus sedemikian rupa sehingga jumlah simpangan kuadrat nilai dari nilai

sangat minim

Jumlah deviasi kuadrat memiliki satu ekstrem - minimum, yang memungkinkan kita menggunakan rumus ini. Mari kita cari dari rumus ini nilai koefisiennya. Untuk melakukan ini, kami mengubah sisi kirinya sebagai berikut:

Rumus terakhir memungkinkan kita menemukan nilai koefisien yang diperlukan dalam soal.

Cerita

Sebelum awal XIX V. ilmuwan tidak memiliki aturan tertentu untuk menyelesaikan sistem persamaan yang jumlah persamaannya lebih sedikit daripada jumlah persamaannya; Sampai saat itu, teknik-teknik pribadi digunakan yang bergantung pada jenis persamaan dan kecerdasan kalkulator, dan oleh karena itu kalkulator yang berbeda, berdasarkan data observasi yang sama, muncul. berbagai kesimpulan. Gauss (1795) bertanggung jawab atas penerapan pertama metode ini, dan Legendre (1805) secara independen menemukan dan menerbitkannya di bawah nama modern(fr. Méthode des moindres quarrés ) . Laplace menghubungkan metode ini dengan teori probabilitas, dan ahli matematika Amerika Adrain (1808) mempertimbangkan penerapan teori probabilitasnya. Metode ini tersebar luas dan ditingkatkan melalui penelitian lebih lanjut oleh Encke, Bessel, Hansen dan lain-lain.

Penggunaan alternatif OLS

Ide metode kuadrat terkecil juga dapat digunakan dalam kasus lain yang tidak berhubungan langsung dengan analisis regresi. Faktanya adalah jumlah kuadrat adalah salah satu ukuran kedekatan yang paling umum untuk vektor (metrik Euclidean dalam ruang berdimensi terbatas).

Salah satu penerapannya adalah untuk “menyelesaikan” sistem persamaan linear, di mana jumlah persamaan nomor lebih banyak variabel

dimana matriksnya bukan persegi, melainkan persegi panjang.

Sistem persamaan seperti itu, dalam kasus umum, tidak mempunyai solusi (jika pangkat sebenarnya lebih besar dari jumlah variabel). Oleh karena itu, sistem ini hanya dapat “diselesaikan” dalam arti memilih vektor yang meminimalkan “jarak” antara vektor dan . Untuk melakukan ini, Anda dapat menerapkan kriteria meminimalkan jumlah selisih kuadrat dari kiri dan bagian yang tepat persamaan sistem, yaitu. Sangat mudah untuk menunjukkan bahwa pemecahan masalah minimalisasi ini akan membawa pada solusi sistem selanjutnya persamaan

Metode kuadrat terkecil

Metode kuadrat terkecil ( OLS, OLS, Kuadrat Terkecil Biasa) - salah satu metode dasar analisis regresi untuk memperkirakan parameter model regresi yang tidak diketahui menggunakan data sampel. Metode ini didasarkan pada minimalisasi jumlah kuadrat sisa regresi.

Perlu diperhatikan bahwa metode kuadrat terkecil itu sendiri dapat disebut sebagai metode untuk menyelesaikan suatu masalah pada suatu luasan jika penyelesaiannya terletak pada atau memenuhi beberapa kriteria untuk meminimalkan jumlah kuadrat dari beberapa fungsi dari variabel yang diperlukan. Oleh karena itu, metode kuadrat terkecil juga dapat digunakan untuk perkiraan representasi (perkiraan) suatu fungsi tertentu dengan fungsi lain (yang lebih sederhana), ketika menemukan himpunan besaran yang memenuhi persamaan atau batasan, yang jumlahnya melebihi jumlah besaran tersebut. , dll.

Inti dari MNC

Biarkan beberapa model (parametrik) dari hubungan probabilistik (regresi) antara variabel (yang dijelaskan) diberikan kamu dan banyak faktor (variabel penjelas) X

di mana adalah vektor parameter model yang tidak diketahui

- kesalahan model acak.

Biarlah ada juga contoh observasi terhadap nilai-nilai variabel tersebut. Misalkan bilangan observasi (). Lalu adalah nilai-nilai variabel pada observasi ke-th. Kemudian, untuk nilai parameter b tertentu, dimungkinkan untuk menghitung nilai teoritis (model) dari variabel y yang dijelaskan:

Besar kecilnya residu tergantung pada nilai parameter b.

Inti dari metode kuadrat terkecil (biasa, klasik) adalah mencari parameter b yang jumlah kuadrat residunya (eng. Jumlah Sisa Kuadrat) akan menjadi minimal:

Secara umum, masalah ini dapat diselesaikan dengan metode optimasi numerik (minimisasi). Dalam hal ini yang mereka bicarakan kuadrat terkecil nonlinier(NLS atau NLLS - Bahasa Inggris) Kuadrat Terkecil Non-Linear). Dalam banyak kasus, solusi analitis dapat diperoleh. Untuk menyelesaikan masalah minimalisasi, perlu mencari titik stasioner dari fungsi tersebut dengan mendiferensiasikannya terhadap parameter b yang tidak diketahui, menyamakan turunannya dengan nol dan menyelesaikan sistem persamaan yang dihasilkan:

Jika kesalahan acak model terdistribusi normal, memiliki varian yang sama, dan tidak berkorelasi, estimasi parameter OLS sama dengan estimasi kemungkinan maksimum (MLM).

OLS dalam kasus model linier

Biarkan ketergantungan regresi menjadi linier:

Membiarkan kamu adalah vektor kolom pengamatan dari variabel yang dijelaskan, dan merupakan matriks pengamatan faktor (baris-baris matriks adalah vektor-vektor nilai faktor dalam suatu pengamatan tertentu, kolom-kolom tersebut adalah vektor nilai-nilai suatu faktor tertentu dalam semua pengamatan). Representasi matriks dari model linier adalah:

Maka vektor estimasi variabel yang dijelaskan dan vektor residu regresi akan sama

Dengan demikian, jumlah kuadrat dari sisa regresi akan sama dengan

Membedakan fungsi ini terhadap vektor parameter dan menyamakan turunannya dengan nol, kita memperoleh sistem persamaan (dalam bentuk matriks):

.

Penyelesaian sistem persamaan ini memberikan rumus umum estimasi kuadrat terkecil untuk model linier:

Untuk tujuan analitis, representasi terakhir dari rumus ini berguna. Jika dalam model regresi data terpusat, maka dalam representasi ini matriks pertama mempunyai arti matriks kovarians sampel faktor, dan matriks kedua merupakan vektor kovarians faktor dengan variabel terikat. Kalau selain datanya juga dinormalisasi untuk UMK (yaitu, pada akhirnya terstandarisasi), maka matriks pertama mempunyai arti matriks korelasi sampel faktor, vektor kedua - vektor korelasi sampel faktor dengan variabel terikat.

Properti penting dari estimasi OLS untuk model dengan konstan- garis regresi yang dibangun melewati pusat gravitasi data sampel, sehingga persamaan terpenuhi:

Secara khusus, dalam kasus ekstrim, ketika satu-satunya regressor adalah sebuah konstanta, kita menemukan bahwa estimasi OLS dari satu-satunya parameter (konstanta itu sendiri) sama dengan nilai rata-rata dari variabel yang dijelaskan. Artinya, mean aritmatika, yang dikenal karena sifat-sifatnya yang baik dari hukum bilangan besar, juga merupakan estimasi kuadrat terkecil - mean ini memenuhi kriteria jumlah minimum deviasi kuadrat dari mean tersebut.

Contoh: regresi paling sederhana (berpasangan).

Dalam kasus regresi linier berpasangan, rumus perhitungannya disederhanakan (Anda dapat melakukannya tanpa aljabar matriks):

Properti penduga OLS

Pertama-tama, kami mencatat bahwa untuk model linier, estimasi OLS adalah estimasi linier, sebagai berikut dari rumus di atas. Untuk estimasi OLS yang tidak bias, kondisi analisis regresi yang paling penting harus dan cukup dipenuhi: ekspektasi matematis dari kesalahan acak, tergantung pada faktornya, harus sama dengan nol. Kondisi ini khususnya terpenuhi jika

  1. ekspektasi matematis dari kesalahan acak adalah nol, dan
  2. faktor dan kesalahan acak adalah variabel acak independen.

Kondisi kedua - kondisi eksogenitas faktor - bersifat mendasar. Jika properti ini tidak terpenuhi, maka kita dapat berasumsi bahwa hampir semua estimasi akan sangat tidak memuaskan: estimasi tersebut bahkan tidak akan konsisten (yaitu, bahkan sejumlah besar data tidak memungkinkan kita memperoleh estimasi berkualitas tinggi dalam kasus ini. ). Dalam kasus klasik, asumsi yang lebih kuat dibuat mengenai determinisme faktor, dibandingkan dengan kesalahan acak, yang secara otomatis berarti bahwa kondisi eksogenitas terpenuhi. Dalam kasus umum, untuk konsistensi estimasi, cukup memenuhi kondisi eksogenitas bersama dengan konvergensi matriks ke beberapa matriks non-singular seiring dengan bertambahnya ukuran sampel hingga tak terhingga.

Agar, selain konsistensi dan ketidakbiasannya, pendugaan kuadrat terkecil (biasa) juga efektif (yang terbaik di kelas pendugaan tak bias linier), sifat tambahan kesalahan acak harus dipenuhi:

Asumsi ini dapat dirumuskan untuk matriks kovarians dari vektor kesalahan acak

Model linier yang memenuhi kondisi ini disebut klasik. Estimasi OLS untuk regresi linier klasik adalah estimasi yang tidak bias, konsisten, dan paling efektif di kelas semua estimasi linier yang tidak bias (dalam literatur bahasa Inggris, singkatan tersebut terkadang digunakan BIRU (Penaksir Tak Berbasis Linier Terbaik) - estimasi linier tidak bias terbaik; dalam sastra Rusia, teorema Gauss-Markov lebih sering dikutip). Seperti yang mudah ditunjukkan, matriks kovarians dari vektor estimasi koefisien akan sama dengan:

OLS yang digeneralisasi

Metode kuadrat terkecil memungkinkan generalisasi yang luas. Daripada meminimalkan jumlah kuadrat dari residu, kita dapat meminimalkan beberapa bentuk kuadrat pasti positif dari vektor residu, dimana terdapat matriks bobot pasti positif simetris. Kuadrat terkecil konvensional adalah kasus khusus dari pendekatan ini, di mana matriks bobot berbanding lurus dengan matriks identitas. Seperti diketahui dari teori matriks (atau operator) simetris, untuk matriks tersebut terjadi dekomposisi. Oleh karena itu, fungsi tertentu dapat direpresentasikan sebagai berikut, yaitu fungsi ini dapat direpresentasikan sebagai jumlah kuadrat dari beberapa “sisa” yang ditransformasikan. Dengan demikian, kita dapat membedakan kelas metode kuadrat terkecil - metode LS (Kuadrat Terkecil).

Telah dibuktikan (teorema Aitken) bahwa untuk model regresi linier umum (di mana tidak ada batasan yang dikenakan pada matriks kovarians kesalahan acak), yang paling efektif (di kelas estimasi linier tidak bias) adalah apa yang disebut estimasi. Kuadrat Terkecil yang digeneralisasi (GLS - Kuadrat Terkecil yang Digeneralisasi)- Metode LS dengan matriks bobot sama dengan matriks kovarians terbalik kesalahan acak: .

Dapat ditunjukkan bahwa rumus estimasi GLS terhadap parameter model linier berbentuk

Oleh karena itu, matriks kovarians dari perkiraan ini akan sama dengan

Padahal, inti dari OLS terletak pada transformasi (linier) tertentu (P) dari data asli dan penerapan OLS biasa pada data yang diubah. Tujuan dari transformasi ini adalah agar pada data yang ditransformasi kesalahan acaknya sudah memenuhi asumsi klasik.

OLS tertimbang

Dalam kasus matriks bobot diagonal (dan oleh karena itu matriks kovarians kesalahan acak), kita memiliki apa yang disebut Kuadrat Terkecil Tertimbang (WLS). Dalam hal ini, jumlah kuadrat tertimbang dari residu model diminimalkan, yaitu setiap observasi menerima “bobot” yang berbanding terbalik dengan varian kesalahan acak dalam observasi ini: . Faktanya, data ditransformasikan dengan melakukan pembobotan observasi (dibagi dengan jumlah yang sebanding dengan perkiraan deviasi standar kesalahan acak), dan OLS biasa diterapkan pada data berbobot.

Beberapa kasus khusus penggunaan MNC dalam praktiknya

Perkiraan ketergantungan linier

Mari kita perhatikan kasus ketika, sebagai hasil dari mempelajari ketergantungan besaran skalar tertentu pada besaran skalar tertentu (Ini bisa berupa, misalnya, ketergantungan tegangan pada kuat arus: , di mana adalah nilai konstan, resistansi dari konduktor), pengukuran besaran-besaran ini dilakukan, sebagai akibatnya nilai-nilai dan nilai-nilai yang sesuai diperoleh. Data pengukuran harus dicatat dalam sebuah tabel.

Meja. Hasil pengukuran.

Pengukuran no.
1
2
3
4
5
6

Pertanyaannya adalah: nilai koefisien manakah yang dapat dipilih untuk menggambarkan ketergantungan dengan paling baik? Menurut metode kuadrat terkecil, nilai ini harus sedemikian rupa sehingga jumlah simpangan kuadrat nilai dari nilai

sangat minim

Jumlah deviasi kuadrat memiliki satu ekstrem - minimum, yang memungkinkan kita menggunakan rumus ini. Mari kita cari dari rumus ini nilai koefisiennya. Untuk melakukan ini, kami mengubah sisi kirinya sebagai berikut:

Rumus terakhir memungkinkan kita menemukan nilai koefisien yang diperlukan dalam soal.

Cerita

Sampai awal abad ke-19. ilmuwan tidak memiliki aturan tertentu untuk menyelesaikan sistem persamaan yang jumlah persamaannya lebih sedikit daripada jumlah persamaannya; Sampai saat itu, teknik pribadi digunakan yang bergantung pada jenis persamaan dan kecerdasan kalkulator, dan oleh karena itu kalkulator yang berbeda, berdasarkan data pengamatan yang sama, menghasilkan kesimpulan yang berbeda. Gauss (1795) adalah orang pertama yang menggunakan metode ini, dan Legendre (1805) secara independen menemukan dan menerbitkannya dengan nama modernnya (bahasa Prancis. Méthode des moindres quarrés ) . Laplace menghubungkan metode ini dengan teori probabilitas, dan ahli matematika Amerika Adrain (1808) mempertimbangkan penerapan teori probabilitasnya. Metode ini tersebar luas dan ditingkatkan melalui penelitian lebih lanjut oleh Encke, Bessel, Hansen dan lain-lain.

Penggunaan alternatif OLS

Ide metode kuadrat terkecil juga dapat digunakan dalam kasus lain yang tidak berhubungan langsung dengan analisis regresi. Faktanya adalah jumlah kuadrat adalah salah satu ukuran kedekatan yang paling umum untuk vektor (metrik Euclidean dalam ruang berdimensi terbatas).

Salah satu penerapannya adalah “solusi” sistem persamaan linier yang jumlah persamaannya lebih besar daripada jumlah variabelnya.

dimana matriksnya bukan persegi, melainkan persegi panjang.

Sistem persamaan seperti itu, dalam kasus umum, tidak mempunyai solusi (jika pangkat sebenarnya lebih besar dari jumlah variabel). Oleh karena itu, sistem ini hanya dapat “diselesaikan” dalam arti memilih vektor yang meminimalkan “jarak” antara vektor dan . Untuk melakukan ini, Anda dapat menerapkan kriteria meminimalkan jumlah kuadrat selisih antara ruas kiri dan kanan persamaan sistem, yaitu. Mudah untuk menunjukkan bahwa menyelesaikan masalah minimisasi ini akan menghasilkan penyelesaian sistem persamaan berikut

Jika beberapa kuantitas fisik bergantung pada besaran lain, maka ketergantungan ini dapat dipelajari dengan mengukur y pada nilai x yang berbeda. Dari hasil pengukuran diperoleh sejumlah nilai:

x 1, x 2, ..., x i, ..., x n;

kamu 1 , kamu 2 , ..., kamu aku , ... , kamu n .

Berdasarkan data percobaan tersebut, dimungkinkan untuk membuat grafik ketergantungan y = ƒ(x). Kurva yang dihasilkan memungkinkan untuk menilai bentuk fungsi ƒ(x). Namun, koefisien konstanta yang masuk ke dalam fungsi ini masih belum diketahui. Mereka dapat ditentukan dengan menggunakan metode kuadrat terkecil. Titik percobaan biasanya tidak terletak tepat pada kurva. Metode kuadrat terkecil mensyaratkan jumlah kuadrat simpangan titik-titik percobaan dari kurva, yaitu. 2 adalah yang terkecil.

Dalam praktiknya, metode ini paling sering (dan paling sederhana) digunakan dalam kasus hubungan linier, yaitu. Kapan

kamu = kx atau kamu = a + bx.

Ketergantungan linier sangat luas dalam fisika. Dan meskipun hubungannya nonlinier, mereka biasanya mencoba membuat grafik untuk mendapatkan garis lurus. Misalnya, jika indeks bias kaca n diasumsikan berhubungan dengan panjang gelombang cahaya λ melalui relasi n = a + b/λ 2, maka ketergantungan n pada λ -2 diplot pada grafik.

Pertimbangkan ketergantungannya kamu = kx(garis lurus yang melalui titik asal). Mari kita buat nilai φ dari jumlah kuadrat simpangan titik-titik kita dari garis lurus

Nilai φ selalu positif dan semakin kecil semakin dekat titik kita dengan garis lurus. Metode kuadrat terkecil menyatakan bahwa nilai k harus dipilih sedemikian rupa sehingga φ mempunyai nilai minimum


atau
(19)

Perhitungan menunjukkan bahwa error root-mean-square dalam menentukan nilai k adalah sama dengan

, (20)
di mana n adalah jumlah pengukuran.

Sekarang mari kita pertimbangkan lebih jauh kasus keras, ketika poin harus memenuhi rumus kamu = a + bx(garis lurus yang tidak melalui titik asal).

Tugasnya adalah menemukan, jika diberi himpunan nilai x i , y i nilai-nilai terbaik a dan b.

Mari kita buat lagi bentuk kuadrat φ, sama dengan jumlahnya deviasi kuadrat titik x i, y i dari garis lurus

dan carilah nilai a dan b yang mempunyai nilai minimum φ

;

.

.

Solusi bersama dari persamaan ini memberikan

(21)

Kesalahan akar rata-rata kuadrat penentuan a dan b adalah sama

(23)

.  (24)

Saat memproses hasil pengukuran menggunakan metode ini, akan lebih mudah untuk meringkas semua data dalam sebuah tabel di mana semua jumlah yang termasuk dalam rumus (19)(24) telah dihitung sebelumnya. Bentuk tabel tersebut diberikan pada contoh di bawah ini.

Contoh 1. Persamaan dasar dinamika dipelajari gerakan rotasiε = M/J (garis yang melalui titik asal). Pada nilai momen M yang berbeda, percepatan sudut suatu benda diukur. Hal ini diperlukan untuk menentukan momen inersia suatu benda. Hasil pengukuran momen gaya dan percepatan sudut tercantum pada kolom kedua dan ketiga tabel 5.

Tabel 5
N M, Nm , s -1 M 2 ε - km (ε - km) 2
1 1.44 0.52 2.0736 0.7488 0.039432 0.001555
2 3.12 1.06 9.7344 3.3072 0.018768 0.000352
3 4.59 1.45 21.0681 6.6555 -0.08181 0.006693
4 5.90 1.92 34.81 11.328 -0.049 0.002401
5 7.45 2.56 55.5025 19.072 0.073725 0.005435
– – 123.1886 41.1115 – 0.016436

Dengan menggunakan rumus (19) kita menentukan:

.

Untuk menentukan akar rata-rata kesalahan kuadrat, kita menggunakan rumus (20)

0.005775kg-1 · M -2 .

Menurut rumus (18) yang kita miliki

; .

S J = (2,996 0,005775)/0,3337 = 0,05185 kg m2.

Setelah menetapkan reliabilitas P = 0,95, dengan menggunakan tabel koefisien Student untuk n = 5, kita menemukan t = 2,78 dan menentukan kesalahan mutlakΔJ = 2,78 0,05185 = 0,1441 ≈ 0,2 kg m2.

Mari kita tulis hasilnya dalam bentuk:

J = (3,0 ± 0,2) kg m2;


Contoh 2. Mari kita hitung koefisien suhu hambatan logam menggunakan metode kuadrat terkecil. Resistansi bergantung secara linier pada suhu

R t = R 0 (1 + α t°) = R 0 + R 0 α t°.

Suku bebas menentukan hambatan R 0 pada suhu 0 ° C, dan koefisien kemiringan adalah hasil kali koefisien suhu dan hambatan R 0 .

Hasil pengukuran dan perhitungan disajikan pada tabel ( lihat tabel 6).

Tabel 6
N t°, s r, Ohm t-¯t (t-¯t) 2 (t-¯t)r r - bt - a (r - bt - a) 2 .10 -6
1 23 1.242 -62.8333 3948.028 -78.039 0.007673 58.8722
2 59 1.326 -26.8333 720.0278 -35.581 -0.00353 12.4959
3 84 1.386 -1.83333 3.361111 -2.541 -0.00965 93.1506
4 96 1.417 10.16667 103.3611 14.40617 -0.01039 107.898
5 120 1.512 34.16667 1167.361 51.66 0.021141 446.932
6 133 1.520 47.16667 2224.694 71.69333 -0.00524 27.4556
515 8.403 – 8166.833 21.5985 – 746.804
∑/n 85.83333 1.4005 – – – – –

Dengan menggunakan rumus (21), (22) kita tentukan

R 0 = ¯ R- α R 0 ¯ t = 1,4005 - 0,002645 85,83333 = 1,1735 Ohm.

Mari kita temukan kesalahan dalam definisi α. Karena , maka menurut rumus (18) kita mempunyai:

.

Menggunakan rumus (23), (24) yang kita miliki

;

0.014126 Ohm.

Setelah menetapkan reliabilitas ke P = 0,95, dengan menggunakan tabel koefisien Student untuk n = 6, kita menemukan t = 2,57 dan menentukan kesalahan absolut Δα = 2,57 0,000132 = 0,000338 derajat -1.

= (23 ± 4) 10 -4 memanggil-1 pada P = 0,95.


Contoh 3. Jari-jari kelengkungan lensa harus ditentukan menggunakan cincin Newton. Jari-jari cincin Newton r m diukur dan jumlah cincin m ditentukan. Jari-jari cincin Newton berhubungan dengan jari-jari kelengkungan lensa R dan nomor cincin melalui persamaan

r 2 m = mλR - 2d 0 R,

dimana d 0 ketebalan celah antara lensa dan pelat bidang sejajar (atau deformasi lensa),

λ panjang gelombang cahaya datang.

= (600 ± 6) nm;
r 2 m = kamu;
m = x;
λR = b;
-2d 0 R = a,

maka persamaannya akan berbentuk kamu = a + bx.

.

Hasil pengukuran dan perhitungan dimasukkan ke dalam tabel 7.

Tabel 7
N x = m kamu = r 2, 10 -2 mm 2 m -¯m (m -¯m) 2 (m -¯ m)y y - bx - a, 10 -4 (y - bx - a) 2 , 10 -6
1 1 6.101 -2.5 6.25 -0.152525 12.01 1.44229
2 2 11.834 -1.5 2.25 -0.17751 -9.6 0.930766
3 3 17.808 -0.5 0.25 -0.08904 -7.2 0.519086
4 4 23.814 0.5 0.25 0.11907 -1.6 0.0243955
5 5 29.812 1.5 2.25 0.44718 3.28 0.107646
6 6 35.760 2.5 6.25 0.894 3.12 0.0975819
21 125.129 – 17.5 1.041175 – 3.12176
∑/n 3.5 20.8548333 – – – – –



Baru di situs

>

Paling populer