Rumah Prostetik dan implantasi Kaedah kuasa dua terkecil titik. Di manakah kaedah kuasa dua terkecil digunakan?

Kaedah kuasa dua terkecil titik. Di manakah kaedah kuasa dua terkecil digunakan?

Contoh.

Data eksperimen tentang nilai pembolehubah X Dan di diberikan dalam jadual.

Hasil daripada penjajaran mereka, fungsi itu diperolehi

menggunakan kaedah petak terkecil , anggaran data ini dengan pergantungan linear y=ax+b(cari parameter A Dan b). Ketahui yang mana antara dua baris yang lebih baik (dalam erti kata kaedah kuasa dua terkecil) menjajarkan data eksperimen. Buat lukisan.

Intipati kaedah kuasa dua terkecil (LSM).

Tugasnya adalah untuk mencari pekali pergantungan linear di mana fungsi dua pembolehubah A Dan b mengambil nilai terkecil. Iaitu, diberi A Dan b jumlah sisihan kuasa dua data eksperimen daripada garis lurus yang ditemui akan menjadi yang terkecil. Ini ialah titik keseluruhan kaedah kuasa dua terkecil.

Oleh itu, penyelesaian contoh datang kepada mencari ekstrem fungsi dua pembolehubah.

Menerbitkan formula untuk mencari pekali.

Sistem dua persamaan dengan dua tidak diketahui disusun dan diselesaikan. Mencari terbitan separa bagi suatu fungsi oleh pembolehubah A Dan b, kita samakan derivatif ini kepada sifar.

Kami menyelesaikan sistem persamaan yang terhasil menggunakan sebarang kaedah (contohnya dengan kaedah penggantian atau kaedah Cramer) dan dapatkan formula untuk mencari pekali menggunakan kaedah kuasa dua terkecil (LSM).

Diberi A Dan b fungsi mengambil nilai terkecil. Bukti fakta ini diberikan di bawah dalam teks di penghujung halaman.

Itulah keseluruhan kaedah kuasa dua terkecil. Formula untuk mencari parameter a mengandungi jumlah ,,, dan parameter n- jumlah data eksperimen. Kami mengesyorkan untuk mengira nilai amaun ini secara berasingan. Pekali b ditemui selepas pengiraan a.

Sudah tiba masanya untuk mengingati contoh asal.

Penyelesaian.

Dalam contoh kita n=5. Kami mengisi jadual untuk kemudahan mengira jumlah yang termasuk dalam formula pekali yang diperlukan.

Nilai dalam baris keempat jadual diperoleh dengan mendarabkan nilai baris ke-2 dengan nilai baris ke-3 untuk setiap nombor i.

Nilai dalam baris kelima jadual diperoleh dengan mengkuadratkan nilai dalam baris ke-2 untuk setiap nombor i.

Nilai dalam lajur terakhir jadual adalah jumlah nilai di seluruh baris.

Kami menggunakan formula kaedah kuasa dua terkecil untuk mencari pekali A Dan b. Kami menggantikan nilai yang sepadan dari lajur terakhir jadual kepada mereka:

Oleh itu, y = 0.165x+2.184- garis lurus anggaran yang dikehendaki.

Ia kekal untuk mengetahui yang mana satu baris y = 0.165x+2.184 atau lebih baik menghampiri data asal, iaitu membuat anggaran menggunakan kaedah kuasa dua terkecil.

Anggaran ralat kaedah kuasa dua terkecil.

Untuk melakukan ini, anda perlu mengira jumlah sisihan kuasa dua bagi data asal daripada baris ini Dan , nilai yang lebih kecil sepadan dengan garis yang lebih baik menghampiri data asal dalam erti kata kaedah kuasa dua terkecil.

Sejak , kemudian lurus y = 0.165x+2.184 lebih baik menghampiri data asal.

Ilustrasi grafik kaedah kuasa dua terkecil (LS).

Semuanya jelas kelihatan pada graf. Garis merah ialah garis lurus yang ditemui y = 0.165x+2.184, garis biru ialah , titik merah jambu adalah data asal.

Dalam amalan, apabila memodelkan pelbagai proses - khususnya, ekonomi, fizikal, teknikal, sosial - satu atau kaedah lain untuk mengira nilai anggaran fungsi daripada nilai yang diketahui pada titik tetap tertentu digunakan secara meluas.

Masalah penghampiran fungsi jenis ini sering timbul:

    apabila membina formula anggaran untuk mengira nilai kuantiti ciri proses yang dikaji menggunakan data jadual yang diperoleh hasil daripada eksperimen;

    dalam pengamiran berangka, pembezaan, penyelesaian persamaan pembezaan dan lain-lain.;

    jika perlu untuk mengira nilai fungsi pada titik perantaraan selang yang dipertimbangkan;

    apabila menentukan nilai kuantiti ciri proses di luar selang yang dipertimbangkan, khususnya semasa meramal.

Jika, untuk memodelkan proses tertentu yang ditentukan oleh jadual, kami membina fungsi yang lebih kurang menerangkan proses ini berdasarkan kaedah kuasa dua terkecil, ia akan dipanggil fungsi penghampiran (regresi), dan masalah membina fungsi penghampiran itu sendiri akan dipanggil. masalah anggaran.

Artikel ini membincangkan keupayaan pakej MS Excel untuk menyelesaikan masalah jenis ini, di samping itu, ia menyediakan kaedah dan teknik untuk membina (mencipta) regresi untuk fungsi jadual (yang merupakan asas analisis regresi).

Excel mempunyai dua pilihan untuk membina regresi.

    Menambah regresi terpilih ( garis trend- garis arah aliran) ke dalam gambar rajah yang dibina berdasarkan jadual data untuk ciri proses yang sedang dikaji (hanya tersedia jika terdapat gambar rajah yang dibina);

    Menggunakan fungsi statistik terbina dalam lembaran kerja Excel, membolehkan anda memperoleh regresi (garisan aliran) terus daripada jadual data sumber.

Menambah garis arah aliran pada carta

Untuk jadual data yang menerangkan proses dan diwakili oleh gambar rajah, Excel mempunyai alat analisis regresi yang berkesan yang membolehkan anda:

    bina berdasarkan kaedah kuasa dua terkecil dan tambahkan lima jenis regresi pada rajah, yang memodelkan proses yang dikaji dengan pelbagai darjah ketepatan;

    tambahkan persamaan regresi yang dibina pada rajah;

    tentukan tahap kesesuaian regresi yang dipilih dengan data yang dipaparkan pada carta.

Berdasarkan data carta, Excel membolehkan anda memperoleh jenis regresi linear, polinomial, logaritma, kuasa, eksponen, yang ditentukan oleh persamaan:

y = y(x)

di mana x ialah pembolehubah bebas yang sering mengambil nilai jujukan nombor asli (1; 2; 3; ...) dan menghasilkan, sebagai contoh, kira detik masa proses yang dikaji (ciri).

1 . Regresi linear adalah baik untuk memodelkan ciri-ciri yang nilainya meningkat atau menurun pada kadar yang tetap. Ini adalah model paling mudah untuk dibina untuk proses yang dikaji. Ia dibina mengikut persamaan:

y = mx + b

di mana m ialah tangen bagi sudut kecondongan regresi linear kepada paksi absis; b - koordinat titik persilangan regresi linear dengan paksi ordinat.

2 . Garis arah aliran polinomial berguna untuk menerangkan ciri yang mempunyai beberapa ekstrem yang berbeza (maksima dan minima). Pilihan darjah polinomial ditentukan oleh bilangan ekstrem ciri yang dikaji. Oleh itu, polinomial darjah kedua boleh menggambarkan proses yang hanya mempunyai satu maksimum atau minimum; polinomial darjah ketiga - tidak lebih daripada dua ekstrem; polinomial darjah keempat - tidak lebih daripada tiga ekstrem, dsb.

Dalam kes ini, garis arah aliran dibina mengikut persamaan:

y = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

di mana pekali c0, c1, c2,... c6 adalah pemalar yang nilainya ditentukan semasa pembinaan.

3 . Garis arah aliran logaritma berjaya digunakan apabila memodelkan ciri-ciri yang nilainya pada mulanya berubah dengan cepat dan kemudian secara beransur-ansur stabil.

y = c ln(x) + b

4 . Garis arah aliran undang-undang kuasa memberikan hasil yang baik jika nilai hubungan yang dikaji dicirikan oleh perubahan berterusan dalam kadar pertumbuhan. Contoh pergantungan sedemikian ialah graf pergerakan seragam kereta. Jika terdapat sifar atau nilai negatif dalam data, anda tidak boleh menggunakan garis aliran kuasa.

Dibina mengikut persamaan:

y = c xb

di mana pekali b, c ialah pemalar.

5 . Garis arah aliran eksponen harus digunakan apabila kadar perubahan dalam data terus meningkat. Untuk data yang mengandungi nilai sifar atau negatif, anggaran jenis ini juga tidak berkenaan.

Dibina mengikut persamaan:

y = c ebx

di mana pekali b, c ialah pemalar.

Apabila memilih garis arah aliran, Excel secara automatik mengira nilai R2, yang mencirikan kebolehpercayaan anggaran: daripada nilai yang lebih dekat R2 kepada perpaduan, lebih pasti garis aliran menghampiri proses yang dikaji. Jika perlu, nilai R2 sentiasa boleh dipaparkan pada carta.

Ditentukan oleh formula:

Untuk menambah garis arah aliran pada siri data:

    aktifkan carta berdasarkan satu siri data, iaitu klik dalam kawasan carta. Item Rajah akan muncul dalam menu utama;

    Selepas mengklik pada item ini, menu akan muncul pada skrin di mana anda harus memilih arahan Add trend line.

Tindakan yang sama boleh dilaksanakan dengan mudah dengan menggerakkan penuding tetikus ke atas graf yang sepadan dengan salah satu siri data dan klik kanan; Dalam menu konteks yang muncul, pilih arahan Tambah garis arah aliran. Kotak dialog Trend Line akan muncul pada skrin dengan tab Type dibuka (Gamb. 1).

Selepas ini anda perlukan:

Pilih jenis garis arah aliran yang diperlukan pada tab Jenis (jenis Linear dipilih secara lalai). Untuk jenis Polinomial, dalam medan Ijazah, nyatakan darjah polinomial yang dipilih.

1 . Medan Dibina pada siri menyenaraikan semua siri data dalam carta yang dipersoalkan. Untuk menambah garis aliran pada siri data tertentu, pilih namanya dalam medan siri Terbina.

Jika perlu, dengan pergi ke tab Parameter (Gamb. 2), anda boleh menetapkan parameter berikut untuk garis arah aliran:

    tukar nama garis arah aliran dalam Nama medan lengkung yang hampir (dilicinkan).

    tetapkan bilangan tempoh (ke hadapan atau ke belakang) untuk ramalan dalam medan Ramalan;

    paparkan persamaan garis arah aliran dalam kawasan rajah, yang mana anda harus mendayakan persamaan tunjukkan pada kotak semak rajah;

    paparkan nilai kebolehpercayaan anggaran R2 dalam kawasan rajah, yang mana anda harus membolehkan kotak semak Letakkan nilai kebolehpercayaan anggaran pada rajah (R^2);

    tetapkan titik persilangan garis arah aliran dengan paksi Y, yang mana anda harus mendayakan kotak semak untuk persilangan lengkung dengan paksi Y pada satu titik;

    Klik butang OK untuk menutup kotak dialog.

Untuk mula mengedit garis arah aliran yang telah dilukis, terdapat tiga cara:

    gunakan arahan garis aliran Terpilih daripada menu Format, setelah memilih garis aliran sebelum ini;

    pilih arahan Format garis aliran daripada menu konteks, yang dipanggil dengan mengklik kanan pada garis aliran;

    klik dua kali pada garis arah aliran.

Kotak dialog Format Garisan Trend akan muncul pada skrin (Gamb. 3), mengandungi tiga tab: Lihat, Jenis, Parameter dan kandungan dua yang terakhir bertepatan sepenuhnya dengan tab yang serupa pada kotak dialog Trend Line (Gamb. 1). -2). Pada tab Paparan, anda boleh menetapkan jenis garisan, warna dan ketebalannya.

Untuk memadam garis aliran yang telah dilukis, pilih garis arah aliran untuk dipadamkan dan tekan kekunci Padam.

Kelebihan alat analisis regresi yang dipertimbangkan ialah:

    kemudahan relatif untuk membina garis arah aliran pada carta tanpa membuat jadual data untuknya;

    senarai jenis garis aliran yang dicadangkan yang agak luas, dan senarai ini termasuk jenis regresi yang paling biasa digunakan;

    keupayaan untuk meramalkan kelakuan proses yang dikaji oleh bilangan langkah ke hadapan dan juga ke belakang yang sewenang-wenangnya (dalam had akal);

    keupayaan untuk mendapatkan persamaan garis arah aliran dalam bentuk analisis;

    kemungkinan, jika perlu, untuk mendapatkan penilaian kebolehpercayaan anggaran.

Kelemahan termasuk yang berikut:

    pembinaan garis aliran dijalankan hanya jika terdapat gambar rajah yang dibina pada satu siri data;

    proses penjanaan siri data untuk ciri yang dikaji berdasarkan persamaan garis arah aliran yang diperolehi untuknya agak berantakan: persamaan regresi yang diperlukan dikemas kini dengan setiap perubahan dalam nilai siri data asal, tetapi hanya dalam kawasan rajah , manakala siri data, dijana berdasarkan persamaan garis arah aliran lama, kekal tidak berubah;

    Dalam laporan Carta Pangsi, menukar paparan carta atau laporan Jadual Pangsi yang berkaitan tidak mengekalkan garis arah aliran sedia ada, bermakna sebelum anda melukis garis arah aliran atau sebaliknya memformat laporan Carta Pangsi, anda harus memastikan bahawa reka letak laporan memenuhi keperluan yang diperlukan.

Garis arah aliran boleh digunakan untuk menambah siri data yang dibentangkan pada carta seperti graf, histogram, carta kawasan tidak piawai rata, carta bar, carta serakan, carta gelembung dan carta saham.

Anda tidak boleh menambah garis arah aliran pada siri data dalam carta 3D, ternormal, radar, pai dan donat.

Menggunakan fungsi terbina dalam Excel

Excel juga mempunyai alat analisis regresi untuk memplot garis arah aliran di luar kawasan carta. Terdapat beberapa fungsi lembaran kerja statistik yang boleh anda gunakan untuk tujuan ini, tetapi kesemuanya hanya membenarkan anda membina regresi linear atau eksponen.

Excel mempunyai beberapa fungsi untuk membina regresi linear, khususnya:

    TREND;

  • CERUN dan POTONG.

Serta beberapa fungsi untuk membina garis aliran eksponen, khususnya:

    LGRFPRIBL.

Perlu diingatkan bahawa teknik untuk membina regresi menggunakan fungsi TREND dan GROWTH adalah hampir sama. Perkara yang sama boleh dikatakan mengenai pasangan fungsi LINEST dan LGRFPRIBL. Untuk empat fungsi ini, mencipta jadual nilai menggunakan ciri Excel seperti formula tatasusunan, yang agak mengganggu proses membina regresi. Mari kita perhatikan juga bahawa pembinaan regresi linear, pada pendapat kami, paling mudah dicapai menggunakan fungsi CERUN dan INTERCEPT, di mana yang pertama menentukan kecerunan regresi linear, dan yang kedua menentukan segmen yang dipintas oleh regresi pada paksi-y.

Kelebihan alat fungsi terbina dalam untuk analisis regresi ialah:

    proses yang agak mudah dan seragam untuk menjana siri data bagi ciri yang dikaji untuk semua fungsi statistik terbina dalam yang mentakrifkan garis arah aliran;

    metodologi standard untuk membina garis aliran berdasarkan siri data yang dijana;

    keupayaan untuk meramalkan tingkah laku proses yang dikaji dengan bilangan langkah yang diperlukan ke hadapan atau ke belakang.

Kelemahannya termasuk fakta bahawa Excel tidak mempunyai fungsi terbina dalam untuk mencipta jenis garis arah aliran (kecuali linear dan eksponen) yang lain. Keadaan ini selalunya tidak membenarkan memilih model yang cukup tepat bagi proses yang dikaji, serta mendapatkan ramalan yang hampir dengan realiti. Di samping itu, apabila menggunakan fungsi TREND dan GROWTH, persamaan garis aliran tidak diketahui.

Perlu diingatkan bahawa penulis tidak menetapkan untuk membentangkan kursus analisis regresi dengan sebarang tahap kesempurnaan. Tugas utamanya adalah untuk menunjukkan, menggunakan contoh khusus, keupayaan pakej Excel semasa menyelesaikan masalah anggaran; tunjukkan alat berkesan yang ada pada Excel untuk membina regresi dan ramalan; menggambarkan bagaimana masalah sedemikian boleh diselesaikan dengan agak mudah walaupun oleh pengguna yang tidak mempunyai pengetahuan yang luas tentang analisis regresi.

Contoh penyelesaian masalah tertentu

Mari lihat menyelesaikan masalah khusus menggunakan alat Excel yang disenaraikan.

Masalah 1

Dengan jadual data mengenai keuntungan perusahaan pengangkutan motor untuk 1995-2002. anda perlu melakukan perkara berikut:

    Bina gambar rajah.

    Tambahkan garis arah aliran linear dan polinomial (kuadrat dan kubik) pada carta.

    Menggunakan persamaan garis arah aliran, dapatkan data jadual tentang keuntungan perusahaan untuk setiap garis arah aliran untuk 1995-2004.

    Buat ramalan untuk keuntungan perusahaan untuk tahun 2003 dan 2004.

Penyelesaian masalah

    Dalam julat sel A4:C11 lembaran kerja Excel, masukkan lembaran kerja yang ditunjukkan dalam Rajah. 4.

    Setelah memilih julat sel B4:C11, kami membina gambar rajah.

    Kami mengaktifkan gambar rajah yang dibina dan, mengikut kaedah yang diterangkan di atas, selepas memilih jenis garis arah aliran dalam kotak dialog Garis Aliran (lihat Rajah 1), kami secara bergilir-gilir menambah garis arah aliran linear, kuadratik dan kubik pada rajah. Dalam kotak dialog yang sama, buka tab Parameter (lihat Rajah 2), dalam medan Nama lengkung yang menghampiri (dilicinkan), masukkan nama arah aliran yang ditambah dan dalam medan Ramalan ke hadapan untuk: tempoh, tetapkan nilai 2, kerana ia dirancang untuk membuat ramalan keuntungan untuk dua tahun akan datang. Untuk memaparkan persamaan regresi dan nilai kebolehpercayaan anggaran R2 dalam kawasan rajah, dayakan persamaan tunjukkan pada kotak semak skrin dan letakkan nilai kebolehpercayaan anggaran (R^2) pada rajah. Untuk persepsi visual yang lebih baik, kami menukar jenis, warna dan ketebalan garis arah aliran yang dibina, yang mana kami menggunakan tab Lihat kotak dialog Format Garisan Aliran (lihat Rajah 3). Gambar rajah yang terhasil dengan garis aliran tambahan ditunjukkan dalam Rajah. 5.

    Untuk mendapatkan data jadual tentang keuntungan perusahaan bagi setiap garis arah aliran untuk 1995-2004. Mari kita gunakan persamaan garis arah aliran yang dibentangkan dalam Rajah. 5. Untuk melakukan ini, dalam sel julat D3:F3, masukkan maklumat teks tentang jenis garis arah aliran yang dipilih: Aliran linear, Aliran kuadratik, Aliran padu. Seterusnya, masukkan formula regresi linear dalam sel D4 dan, menggunakan penanda isian, salin formula ini dengan rujukan relatif kepada julat sel D5:D13. Perlu diingat bahawa setiap sel dengan formula regresi linear daripada julat sel D4:D13 mempunyai sebagai hujah sel yang sepadan daripada julat A4:A13. Begitu juga, untuk regresi kuadratik, isikan julat sel E4:E13, dan untuk regresi kubik, isikan julat sel F4:F13. Oleh itu, ramalan untuk keuntungan perusahaan untuk tahun 2003 dan 2004 telah disusun. menggunakan tiga trend. Jadual nilai yang terhasil ditunjukkan dalam Rajah. 6.

Masalah 2

    Bina gambar rajah.

    Tambahkan garis aliran logaritma, kuasa dan eksponen pada carta.

    Terbitkan persamaan garis aliran yang diperolehi, serta nilai kebolehpercayaan anggaran R2 untuk setiap satu daripadanya.

    Menggunakan persamaan garis arah aliran, dapatkan data jadual tentang keuntungan perusahaan untuk setiap garis arah aliran untuk 1995-2002.

    Buat ramalan keuntungan syarikat untuk tahun 2003 dan 2004 menggunakan garis arah aliran ini.

Penyelesaian masalah

Mengikuti metodologi yang diberikan dalam menyelesaikan masalah 1, kami memperoleh gambar rajah dengan garis aliran logaritma, kuasa dan eksponen ditambah kepadanya (Rajah 7). Seterusnya, menggunakan persamaan garis arah aliran yang diperolehi, kami mengisi jadual nilai untuk keuntungan perusahaan, termasuk nilai ramalan untuk tahun 2003 dan 2004. (Gamb. 8).

Dalam Rajah. 5 dan rajah. dapat dilihat bahawa model dengan aliran logaritma sepadan dengan nilai kebolehpercayaan anggaran yang paling rendah

R2 = 0.8659

Nilai tertinggi R2 sepadan dengan model dengan trend polinomial: kuadratik (R2 = 0.9263) dan padu (R2 = 0.933).

Masalah 3

Dengan jadual data mengenai keuntungan perusahaan pengangkutan motor untuk 1995-2002, diberikan dalam tugasan 1, anda mesti melakukan langkah berikut.

    Dapatkan siri data untuk garis aliran linear dan eksponen menggunakan fungsi TREND dan GROW.

    Menggunakan fungsi TREND dan GROWTH, buat ramalan keuntungan perusahaan untuk tahun 2003 dan 2004.

    Bina gambar rajah untuk data asal dan siri data yang terhasil.

Penyelesaian masalah

Mari gunakan lembaran kerja untuk Masalah 1 (lihat Rajah 4). Mari kita mulakan dengan fungsi TREND:

    pilih julat sel D4:D11, yang harus diisi dengan nilai-nilai fungsi TREND yang sepadan dengan data yang diketahui mengenai keuntungan perusahaan;

    Panggil arahan Fungsi dari menu Sisipkan. Dalam kotak dialog Wizard Fungsi yang muncul, pilih fungsi TREND daripada kategori Statistik, dan kemudian klik butang OK. Operasi yang sama boleh dilakukan dengan mengklik butang (Sisipkan Fungsi) pada bar alat standard.

    Dalam kotak dialog Argumen Fungsi yang muncul, masukkan julat sel C4:C11 dalam medan Known_values_y; dalam medan Known_values_x - julat sel B4:B11;

    Untuk menjadikan formula yang dimasukkan menjadi formula tatasusunan, gunakan kombinasi kekunci + + .

Formula yang kami masukkan dalam bar formula akan kelihatan seperti: =(TREND(C4:C11,B4:B11)).

Akibatnya, julat sel D4:D11 diisi dengan nilai yang sepadan bagi fungsi TREND (Rajah 9).

Untuk membuat ramalan keuntungan perusahaan untuk tahun 2003 dan 2004. perlu:

    pilih julat sel D12:D13 di mana nilai yang diramalkan oleh fungsi TREND akan dimasukkan.

    panggil fungsi TREND dan dalam kotak dialog Fungsi Argumen yang muncul, masukkan julat sel C4:C11 dalam medan Known_values_y; dalam medan Known_values_x - julat sel B4:B11; dan dalam medan New_values_x - julat sel B12:B13.

    tukar formula ini menjadi formula tatasusunan menggunakan kombinasi kekunci Ctrl + Shift + Enter.

    Formula yang dimasukkan akan kelihatan seperti: =(TREND(C4:C11;B4:B11;B12:B13)), dan julat sel D12:D13 akan diisi dengan nilai ramalan fungsi TREND (lihat Rajah. 9).

Siri data diisi dengan cara yang sama menggunakan fungsi GROWTH, yang digunakan dalam analisis kebergantungan tak linear dan berfungsi dengan cara yang sama seperti TREND rakan linearnya.

Rajah 10 menunjukkan jadual dalam mod paparan formula.

Untuk data awal dan siri data yang diperoleh, rajah ditunjukkan dalam Rajah. sebelas.

Masalah 4

Dengan jadual data mengenai penerimaan permohonan untuk perkhidmatan oleh perkhidmatan penghantaran perusahaan pengangkutan motor untuk tempoh dari 1 hingga 11 bulan semasa, anda mesti melakukan tindakan berikut.

    Dapatkan siri data untuk regresi linear: menggunakan fungsi SLOPE dan INTERCEPT; menggunakan fungsi LINEST.

    Dapatkan satu siri data untuk regresi eksponen menggunakan fungsi LGRFPRIBL.

    Menggunakan fungsi di atas, buat ramalan tentang penerimaan permohonan kepada perkhidmatan penghantaran untuk tempoh dari 12 hingga 14 bulan semasa.

    Buat gambar rajah untuk siri data asal dan diterima.

Penyelesaian masalah

Ambil perhatian bahawa, tidak seperti fungsi TREND dan GROWTH, tiada satu pun fungsi yang disenaraikan di atas (CERUN, INTERCEPT, LINEST, LGRFPRIB) adalah regresi. Fungsi ini hanya memainkan peranan sokongan, menentukan parameter regresi yang diperlukan.

Untuk regresi linear dan eksponen yang dibina menggunakan fungsi SLOPE, INTERCEPT, LINEST, LGRFPRIB, penampilan persamaannya sentiasa diketahui, berbeza dengan regresi linear dan eksponen yang sepadan dengan fungsi TREND dan GROWTH.

1 . Mari kita bina regresi linear dengan persamaan:

y = mx+b

menggunakan fungsi SLOPE dan INTERCEPT, dengan cerun regresi m ditentukan oleh fungsi SLOPE, dan istilah bebas b oleh fungsi INTERCEPT.

Untuk melakukan ini, kami melakukan tindakan berikut:

    masukkan jadual asal ke dalam julat sel A4:B14;

    nilai parameter m akan ditentukan dalam sel C19. Pilih fungsi Cerun daripada kategori Statistik; masukkan julat sel B4:B14 dalam medan_values_y yang diketahui dan julat sel A4:A14 dalam medan_values_x yang diketahui. Formula akan dimasukkan dalam sel C19: =SLOPE(B4:B14,A4:A14);

    Menggunakan teknik yang sama, nilai parameter b dalam sel D19 ditentukan. Dan kandungannya akan kelihatan seperti: =SEGMEN(B4:B14,A4:A14). Oleh itu, nilai parameter m dan b yang diperlukan untuk membina regresi linear akan disimpan dalam sel C19, D19, masing-masing;

    Seterusnya, masukkan formula regresi linear dalam sel C4 dalam bentuk: =$C*A4+$D. Dalam formula ini, sel C19 dan D19 ditulis dengan rujukan mutlak (alamat sel tidak boleh berubah semasa kemungkinan penyalinan). Tanda rujukan mutlak $ boleh ditaip sama ada dari papan kekunci atau menggunakan kekunci F4, selepas meletakkan kursor pada alamat sel. Menggunakan pemegang isian, salin formula ini ke dalam julat sel C4:C17. Kami memperoleh siri data yang diperlukan (Rajah 12). Disebabkan oleh fakta bahawa bilangan permintaan adalah integer, anda harus menetapkan format nombor dengan bilangan tempat perpuluhan kepada 0 pada tab Nombor pada tetingkap Format Sel.

2 . Sekarang mari kita bina regresi linear yang diberikan oleh persamaan:

y = mx+b

menggunakan fungsi LINEST.

Untuk ini:

    Masukkan fungsi LINEST sebagai formula tatasusunan dalam julat sel C20:D20: =(LINEST(B4:B14,A4:A14)). Hasilnya, kami memperoleh nilai parameter m dalam sel C20, dan nilai parameter b dalam sel D20;

    masukkan formula dalam sel D4: =$C*A4+$D;

    salin formula ini menggunakan penanda isian ke dalam julat sel D4:D17 dan dapatkan siri data yang dikehendaki.

3 . Kami membina regresi eksponen dengan persamaan:

menggunakan fungsi LGRFPRIBL ia dilakukan dengan cara yang sama:

    Dalam julat sel C21:D21 kita masukkan fungsi LGRFPRIBL sebagai formula tatasusunan: =( LGRFPRIBL (B4:B14,A4:A14)). Dalam kes ini, nilai parameter m akan ditentukan dalam sel C21, dan nilai parameter b akan ditentukan dalam sel D21;

    formula dimasukkan ke dalam sel E4: =$D*$C^A4;

    menggunakan penanda isian, formula ini disalin ke julat sel E4:E17, di mana siri data untuk regresi eksponen akan ditempatkan (lihat Rajah 12).

Dalam Rajah. Rajah 13 menunjukkan jadual di mana anda boleh melihat fungsi yang kami gunakan dengan julat sel yang diperlukan, serta formula.

Magnitud R 2 dipanggil pekali penentuan.

Tugas membina pergantungan regresi adalah untuk mencari vektor pekali m model (1) di mana pekali R mengambil nilai maksimum.

Untuk menilai kepentingan R, ujian F Fisher digunakan, dikira menggunakan formula

di mana n- saiz sampel (bilangan eksperimen);

k ialah bilangan pekali model.

Jika F melebihi beberapa nilai kritikal untuk data n Dan k dan kebarangkalian keyakinan yang diterima, maka nilai R dianggap signifikan. Meja nilai kritikal F diberikan dalam buku rujukan tentang statistik matematik.

Oleh itu, kepentingan R ditentukan bukan sahaja oleh nilainya, tetapi juga oleh nisbah antara bilangan eksperimen dan bilangan pekali (parameter) model. Sesungguhnya, nisbah korelasi untuk n=2 untuk model linear ringkas adalah sama dengan 1 (satu garis lurus sentiasa boleh dilukis melalui 2 titik pada satah). Walau bagaimanapun, jika data eksperimen adalah pembolehubah rawak, nilai R sedemikian harus dipercayai dengan sangat berhati-hati. Biasanya, untuk mendapatkan R yang ketara dan regresi yang boleh dipercayai, mereka berusaha untuk memastikan bahawa bilangan eksperimen dengan ketara melebihi bilangan pekali model (n>k).

Untuk membina model regresi linear anda perlukan:

1) sediakan senarai n baris dan m lajur yang mengandungi data eksperimen (lajur yang mengandungi nilai output Y mestilah sama ada yang pertama atau yang terakhir dalam senarai); Sebagai contoh, mari kita ambil data daripada tugas sebelumnya, menambah lajur yang dipanggil "No Tempoh.", nomborkan nombor tempoh dari 1 hingga 12. (ini akan menjadi nilai X)

2) pergi ke menu Data/Analisis Data/Regression

Jika item "Analisis Data" dalam menu "Alat" tiada, maka anda harus pergi ke item "Tambahan" dalam menu yang sama dan tandai kotak pilihan "Pakej analisis".

3) dalam kotak dialog "Regression", tetapkan:

· selang input Y;

· selang input X;

· selang keluaran - sel kiri atas selang di mana keputusan pengiraan akan diletakkan (adalah disyorkan untuk meletakkannya pada lembaran kerja baharu);

4) klik "Ok" dan analisis keputusan.

Yang paling banyak jumpa aplikasi yang luas dalam pelbagai bidang sains dan aktiviti amali. Ini boleh jadi fizik, kimia, biologi, ekonomi, sosiologi, psikologi, dan sebagainya dan sebagainya. Dengan kehendak takdir, saya sering perlu berurusan dengan ekonomi, dan oleh itu hari ini saya akan mengaturkan untuk anda perjalanan ke negara yang menakjubkan yang dipanggil Ekonometrik=) ...Macam mana awak boleh tak nak?! Ia sangat bagus di sana - anda hanya perlu membuat keputusan! ...Tetapi apa yang anda pasti mahu ialah belajar cara menyelesaikan masalah kaedah kuasa dua terkecil. Dan terutamanya pembaca yang rajin akan belajar untuk menyelesaikannya bukan sahaja dengan tepat, tetapi juga SANGAT CEPAT ;-) Tetapi pertama sekali pernyataan umum masalah+ contoh yang disertakan:

Katakan dalam bidang subjek tertentu, penunjuk yang mempunyai ungkapan kuantitatif dikaji. Pada masa yang sama, terdapat setiap sebab untuk mempercayai bahawa penunjuk bergantung pada penunjuk. Andaian ini boleh sama ada hipotesis saintifik atau berdasarkan akal sehat asas. Walau bagaimanapun, mari kita tinggalkan sains dan terokai lebih banyak kawasan yang menyelerakan - iaitu, kedai runcit. Mari kita nyatakan dengan:

– kawasan runcit kedai runcit, persegi,
– perolehan tahunan kedai runcit, juta rubel.

Adalah jelas bahawa semakin besar kawasan kedai, semakin besar dalam kebanyakan kes perolehannya.

Katakan bahawa selepas menjalankan pemerhatian/eksperimen/pengiraan/tarian dengan rebana kita mempunyai data berangka yang boleh kita gunakan:

Dengan kedai runcit, saya fikir semuanya jelas: - ini adalah kawasan kedai pertama, - perolehan tahunannya, - kawasan kedai ke-2, - perolehan tahunannya, dsb. Dengan cara ini, sama sekali tidak perlu untuk mempunyai akses kepada bahan terperingkat - penilaian yang agak tepat mengenai perolehan perdagangan boleh diperolehi melalui statistik matematik. Namun, jangan terganggu, kursus pengintipan komersial sudah dibayar =)

Data jadual juga boleh ditulis dalam bentuk titik dan digambarkan dalam bentuk biasa Sistem kartesian .

Kami akan menjawab soalan penting: Berapa banyak mata yang diperlukan untuk kajian kualitatif?

Lebih besar lebih bagus. Set minimum yang boleh diterima terdiri daripada 5-6 mata. Di samping itu, apabila jumlah data adalah kecil, keputusan "anomali" tidak boleh dimasukkan ke dalam sampel. Jadi, sebagai contoh, kedai elit kecil boleh memperoleh pesanan yang lebih besar daripada "rakan sekerjanya", dengan itu memesongkan corak umum, itulah yang anda perlu cari!

Secara ringkasnya, kita perlu memilih fungsi, jadual yang melepasi sedekat mungkin dengan mata . Fungsi ini dipanggil menghampiri (hampiran - anggaran) atau fungsi teori . Secara umumnya, "pesaing" yang jelas muncul dengan serta-merta di sini - polinomial darjah tinggi, yang grafnya melalui SEMUA titik. Tetapi pilihan ini adalah rumit dan selalunya tidak betul. (memandangkan graf akan "gelung" sepanjang masa dan kurang menggambarkan arah aliran utama).

Oleh itu, fungsi yang dicari hendaklah agak mudah dan pada masa yang sama mencerminkan pergantungan secukupnya. Seperti yang anda mungkin rasa, salah satu kaedah untuk mencari fungsi sedemikian dipanggil kaedah kuasa dua terkecil. Pertama, mari kita lihat intipatinya Pandangan umum. Biarkan beberapa fungsi anggaran data percubaan:


Bagaimana untuk menilai ketepatan anggaran ini? Mari kita juga mengira perbezaan (penyimpangan) antara eksperimen dan makna fungsional (kami mengkaji lukisan itu). Pemikiran pertama yang terlintas di fikiran adalah untuk menganggarkan berapa besar jumlahnya, tetapi masalahnya ialah perbezaannya boleh menjadi negatif (Sebagai contoh, ) dan penyelewengan akibat penjumlahan tersebut akan membatalkan satu sama lain. Oleh itu, sebagai anggaran ketepatan anggaran, ia memohon untuk mengambil jumlahnya modul penyelewengan:

atau runtuh: (sekiranya sesiapa tidak tahu: – ini ialah ikon jumlah, dan – pembolehubah "pembilang" tambahan, yang mengambil nilai dari 1 hingga ).

Merapatkan mata percubaan pelbagai fungsi, kami akan terima makna yang berbeza, dan jelas sekali, apabila jumlah ini lebih kecil, fungsi itu lebih tepat.

Kaedah sedemikian wujud dan ia dipanggil kaedah modulus terkecil. Walau bagaimanapun, dalam amalan ia telah menjadi lebih meluas kaedah kuasa dua terkecil, di mana kemungkinan nilai negatif dihapuskan bukan oleh modul, tetapi dengan mengkuadratkan sisihan:

, selepas itu usaha ditujukan untuk memilih fungsi supaya jumlah sisihan kuasa dua adalah sekecil mungkin. Sebenarnya, dari sinilah nama kaedah itu berasal.

Dan sekarang kita akan kembali kepada sesuatu yang lain perkara penting: seperti yang dinyatakan di atas, fungsi yang dipilih mestilah agak mudah - tetapi terdapat juga banyak fungsi sedemikian: linear , hiperbola, eksponen, logaritma, kuadratik dan lain-lain. Dan, sudah tentu, di sini saya ingin segera "mengurangkan bidang aktiviti." Kelas fungsi manakah yang harus saya pilih untuk penyelidikan? Primitif, tetapi teknik yang berkesan:

– Cara paling mudah ialah menggambarkan titik pada lukisan dan menganalisis lokasi mereka. Jika mereka cenderung untuk berlari dalam garis lurus, maka anda harus mencari persamaan garis Dengan nilai optimum Dan . Dalam erti kata lain, tugasnya adalah untuk mencari pekali TERSEBUT supaya jumlah sisihan kuasa dua adalah yang terkecil.

Jika titik terletak, sebagai contoh, sepanjang hiperbola, maka jelaslah jelas bahawa fungsi linear akan memberikan penghampiran yang lemah. Dalam kes ini, kami sedang mencari pekali yang paling "menguntungkan" untuk persamaan hiperbola – yang memberikan jumlah minimum kuasa dua .

Sekarang ambil perhatian bahawa dalam kedua-dua kes yang kita bicarakan fungsi dua pembolehubah, yang hujahnya parameter pergantungan yang dicari:

Dan pada asasnya kita perlu menyelesaikan masalah standard - cari fungsi minimum dua pembolehubah.

Mari kita ingat contoh kita: andaikan bahawa titik "kedai" cenderung terletak dalam garis lurus dan terdapat banyak sebab untuk mempercayai bahawa pergantungan linear perolehan daripada ruang runcit. Mari cari pekali SEPERTI “a” dan “be” sedemikian rupa sehingga jumlah sisihan kuasa dua adalah yang terkecil. Semuanya seperti biasa - pertama Derivatif separa pesanan pertama. mengikut peraturan lineariti Anda boleh membezakan betul-betul di bawah ikon jumlah:

Kalau nak guna maklumat ini untuk esei atau kerja kursus - Saya akan sangat berterima kasih untuk pautan dalam senarai sumber anda akan menemui pengiraan terperinci di beberapa tempat:

Mari buat sistem standard:

Kami mengurangkan setiap persamaan dengan "dua" dan, sebagai tambahan, "memecahkan" jumlah:

Catatan : menganalisis secara bebas mengapa “a” dan “be” boleh diambil di luar ikon jumlah. By the way, secara rasmi ini boleh dilakukan dengan jumlah

Mari kita tulis semula sistem dalam bentuk "digunakan":

selepas itu algoritma untuk menyelesaikan masalah kami mula muncul:

Adakah kita tahu koordinat titik-titik tersebut? Kami tahu. Jumlah bolehkah kita mencarinya? Dengan mudah. Mari buat yang paling mudah sistem dua persamaan linear dalam dua yang tidak diketahui(“a” dan “menjadi”). Kami menyelesaikan sistem, contohnya, kaedah Cramer, akibatnya kita memperoleh titik pegun. Menyemak keadaan yang mencukupi untuk ekstrem, kita boleh mengesahkan bahawa pada ketika ini fungsi mencapai tepat minimum. Semakan itu melibatkan pengiraan tambahan dan oleh itu kami akan meninggalkannya di belakang tabir (jika perlu, bingkai yang hilang boleh dilihat). Kami membuat kesimpulan akhir:

Fungsi cara yang paling baik (sekurang-kurangnya berbanding dengan mana-mana fungsi linear lain) membawa mata eksperimen lebih dekat . Secara kasarnya, grafnya melepasi sedekat mungkin ke titik-titik ini. Dalam tradisi ekonometrik fungsi anggaran yang terhasil juga dipanggil persamaan regresi linear berpasangan .

Masalah yang sedang dipertimbangkan adalah sangat penting. Dalam situasi contoh kami, Pers. membolehkan anda meramalkan perolehan dagangan ("Ig") kedai akan mempunyai pada satu atau lain nilai kawasan jualan (satu atau satu lagi makna "x"). Ya, ramalan yang dihasilkan hanya akan menjadi ramalan, tetapi dalam banyak kes ia akan menjadi agak tepat.

Saya akan menganalisis hanya satu masalah dengan nombor "sebenar", kerana tidak ada kesulitan di dalamnya - semua pengiraan berada pada tahap kurikulum sekolah 7-8 darjah. Dalam 95 peratus kes, anda akan diminta untuk mencari hanya fungsi linear, tetapi pada penghujung artikel saya akan menunjukkan bahawa tidak lebih sukar untuk mencari persamaan hiperbola optimum, eksponen dan beberapa fungsi lain.

Malah, yang tinggal hanyalah mengedarkan barang yang dijanjikan - supaya anda boleh belajar menyelesaikan contoh sedemikian bukan sahaja dengan tepat, tetapi juga dengan cepat. Kami mengkaji dengan teliti piawaian:

Tugasan

Hasil daripada mengkaji hubungan antara dua penunjuk, pasangan nombor berikut diperolehi:

Menggunakan kaedah kuasa dua terkecil, cari fungsi linear yang paling sesuai dengan empirikal (berpengalaman) data. Buat lukisan untuk membina titik eksperimen dan graf bagi fungsi penghampiran dalam sistem koordinat segi empat tepat Cartesan . Cari jumlah sisihan kuasa dua antara nilai empirikal dan teori. Ketahui sama ada ciri itu lebih baik (dari sudut pandangan kaedah kuasa dua terkecil) mendekatkan mata eksperimen.

Sila ambil perhatian bahawa makna "x" adalah semula jadi, dan ini mempunyai makna bermakna ciri, yang akan saya bincangkan kemudian; tetapi mereka, sudah tentu, juga boleh menjadi pecahan. Di samping itu, bergantung pada kandungan tugas tertentu, kedua-dua nilai "X" dan "permainan" boleh menjadi negatif sepenuhnya atau sebahagiannya. Nah, kami telah diberi tugas "tidak berwajah", dan kami memulakannya penyelesaian:

Kemungkinan fungsi optimum kami dapati sebagai penyelesaian kepada sistem:

Untuk tujuan rakaman yang lebih padat, pembolehubah "pembilang" boleh diabaikan, kerana sudah jelas bahawa penjumlahan dijalankan dari 1 hingga .

Adalah lebih mudah untuk mengira jumlah yang diperlukan dalam bentuk jadual:


Pengiraan boleh dilakukan pada mikrokalkulator, tetapi lebih baik menggunakan Excel - lebih cepat dan tanpa ralat; tonton video pendek:

Oleh itu, kami mendapat yang berikut sistem:

Di sini anda boleh mendarabkan persamaan kedua dengan 3 dan tolak sebutan ke-2 daripada sebutan persamaan pertama dengan sebutan. Tetapi ini adalah nasib - dalam amalan, sistem selalunya bukan hadiah, dan dalam kes sedemikian ia menjimatkan kaedah Cramer:
, yang bermaksud sistem mempunyai penyelesaian yang unik.

Jom semak. Saya faham bahawa anda tidak mahu, tetapi mengapa melangkau ralat yang tidak boleh dilepaskan? Mari kita gantikan penyelesaian yang ditemui ke dalam sebelah kiri setiap persamaan sistem:

Bahagian sebelah kanan persamaan yang sepadan diperolehi, yang bermaksud bahawa sistem diselesaikan dengan betul.

Oleh itu, fungsi anggaran yang dikehendaki: – daripada semua fungsi linear Dialah yang terbaik menghampiri data eksperimen.

Tidak seperti lurus pergantungan pusing ganti kedai pada kawasannya, pergantungan yang didapati ialah terbalik (prinsip "lebih banyak, lebih sedikit"), dan fakta ini segera didedahkan oleh yang negatif cerun. Fungsi memberitahu kita bahawa dengan peningkatan dalam penunjuk tertentu sebanyak 1 unit, nilai penunjuk bergantung berkurangan purata sebanyak 0.65 unit. Seperti yang mereka katakan, semakin tinggi harga soba, semakin kurang ia dijual.

Untuk memplot graf fungsi penghampiran, kita dapati dua nilainya:

dan laksanakan lukisan:


Garis lurus yang dibina dipanggil garis aliran (iaitu, garis arah aliran linear, iaitu dalam kes am trend tidak semestinya garis lurus). Semua orang biasa dengan ungkapan "berada dalam trend," dan saya fikir istilah ini tidak memerlukan ulasan tambahan.

Mari kita hitung jumlah sisihan kuasa dua antara nilai empirikal dan teori. Secara geometri, ini ialah jumlah kuasa dua panjang segmen "raspberi". (dua daripadanya sangat kecil sehingga tidak kelihatan).

Mari kita ringkaskan pengiraan dalam jadual:


Sekali lagi, ia boleh dilakukan secara manual untuk berjaga-jaga, saya akan memberikan contoh untuk perkara pertama:

tetapi ia adalah lebih berkesan untuk melakukannya dengan cara yang telah diketahui:

Kami ulangi sekali lagi: Apakah maksud keputusan yang diperolehi? daripada semua fungsi linear fungsi y penunjuk adalah yang terkecil, iaitu, dalam keluarganya ia adalah anggaran terbaik. Dan di sini, dengan cara itu, soalan terakhir masalah itu tidak sengaja: bagaimana jika fungsi eksponen yang dicadangkan adakah lebih baik untuk mendekatkan mata eksperimen?

Mari cari jumlah sisihan kuasa dua yang sepadan - untuk membezakannya, saya akan menandakannya dengan huruf "epsilon". Tekniknya betul-betul sama:


Dan sekali lagi, untuk berjaga-jaga, pengiraan untuk mata pertama:

Dalam Excel kita menggunakan fungsi standard EXP (sintaks boleh didapati dalam Bantuan Excel).

Kesimpulan: , yang bermaksud bahawa fungsi eksponen menghampiri titik eksperimen lebih buruk daripada garis lurus .

Tetapi di sini perlu diperhatikan bahawa "lebih teruk" adalah belum bermakna lagi, apa salahnya. Sekarang saya telah membina graf ini fungsi eksponen– dan ia juga melepasi hampir dengan mata - sehinggakan tanpa kajian analitik sukar untuk mengatakan fungsi mana yang lebih tepat.

Ini menyimpulkan penyelesaian, dan saya kembali kepada persoalan nilai semula jadi hujah. DALAM pelbagai kajian, sebagai peraturan, ekonomi atau sosiologi, "X" semula jadi digunakan untuk nombor bulan, tahun atau selang masa yang sama lain. Pertimbangkan, sebagai contoh, masalah berikut.

Kaedah kuasa dua terkecil

Kaedah kuasa dua terkecil ( OLS, OLS, Kuasa Dua Terkecil Biasa) - salah satu kaedah asas analisis regresi untuk menganggar parameter yang tidak diketahui model regresi menggunakan data sampel. Kaedah ini adalah berdasarkan meminimumkan jumlah kuasa dua sisa regresi.

Perlu diingatkan bahawa kaedah kuasa dua terkecil itu sendiri boleh dipanggil kaedah untuk menyelesaikan masalah di mana-mana kawasan jika penyelesaiannya terletak pada atau memenuhi beberapa kriteria untuk meminimumkan jumlah kuasa dua beberapa fungsi pembolehubah yang diperlukan. Oleh itu, kaedah kuasa dua terkecil juga boleh digunakan untuk perwakilan anggaran (penghampiran) fungsi tertentu oleh fungsi lain (lebih mudah), apabila mencari set kuantiti yang memenuhi persamaan atau kekangan, bilangan yang melebihi bilangan kuantiti ini , dan lain-lain.

Intipati MNC

Biarkan beberapa model (parametrik) hubungan kebarangkalian (regresi) antara pembolehubah (diterangkan) diberikan y dan banyak faktor (pembolehubah penjelasan) x

di mana ialah vektor parameter model yang tidak diketahui

- ralat model rawak.

Biarkan terdapat juga pemerhatian sampel nilai-nilai pembolehubah ini. Biarkan nombor pemerhatian (). Kemudian ialah nilai pembolehubah dalam pemerhatian ke. Kemudian, untuk nilai parameter b yang diberikan, adalah mungkin untuk mengira nilai teori (model) pembolehubah yang dijelaskan y:

Saiz sisa bergantung kepada nilai parameter b.

Intipati kaedah kuasa dua terkecil (biasa, klasik) adalah untuk mencari parameter b yang mana jumlah kuasa dua baki (eng. Jumlah Baki Kuasa Dua) akan menjadi minimum:

Dalam kes umum, masalah ini boleh diselesaikan dengan kaedah pengoptimuman berangka (pengurangan). Dalam kes ini mereka bercakap tentang kuasa dua terkecil tak linear(NLS atau NLLS - Bahasa Inggeris) Kuasa Dua Terkecil Bukan Linear). Dalam banyak kes adalah mungkin untuk mendapatkan penyelesaian analitikal. Untuk menyelesaikan masalah pengecilan, adalah perlu untuk mencari titik pegun fungsi dengan membezakannya berkenaan dengan parameter yang tidak diketahui b, menyamakan derivatif kepada sifar dan menyelesaikan sistem persamaan yang terhasil:

Jika ralat rawak model diedarkan secara normal, mempunyai varians yang sama dan tidak berkorelasi, anggaran parameter OLS adalah sama dengan anggaran kemungkinan maksimum (MLM).

OLS dalam kes model linear

Biarkan pergantungan regresi menjadi linear:

biarlah y ialah vektor lajur pemerhatian pembolehubah yang dijelaskan, dan merupakan matriks pemerhatian faktor (baris matriks ialah vektor nilai faktor dalam pemerhatian ini, dalam lajur - vektor nilai faktor tertentu dalam semua pemerhatian). Perwakilan matriks model linear mempunyai bentuk:

Kemudian vektor anggaran pembolehubah yang dijelaskan dan vektor sisa regresi akan sama

Oleh itu, jumlah kuasa dua baki regresi akan sama dengan

Membezakan fungsi ini berkenaan dengan vektor parameter dan menyamakan derivatif kepada sifar, kami memperoleh sistem persamaan (dalam bentuk matriks):

.

Penyelesaian sistem persamaan ini memberi formula am Anggaran OLS untuk model linear:

Untuk tujuan analisis, perwakilan terakhir formula ini berguna. Jika dalam model regresi data berpusat, maka dalam perwakilan ini matriks pertama mempunyai maksud matriks kovarians sampel faktor, dan yang kedua ialah vektor kovarians faktor dengan pembolehubah bersandar. Jika di samping itu data juga dinormalkan kepada MSE (iaitu, akhirnya diseragamkan), maka matriks pertama mempunyai makna matriks korelasi sampel faktor, vektor kedua - vektor korelasi sampel faktor dengan pembolehubah bersandar.

Sifat penting anggaran OLS untuk model dengan tetap- garis regresi yang dibina melalui pusat graviti data sampel, iaitu, kesamaan dipenuhi:

Khususnya, dalam kes yang melampau, apabila satu-satunya regressor ialah pemalar, kami mendapati anggaran OLS bagi satu-satunya parameter (pemalar itu sendiri) adalah sama dengan nilai purata pembolehubah yang dijelaskan. Iaitu, min aritmetik, yang terkenal dengannya sifat yang baik daripada undang-undang nombor besar, juga merupakan anggaran kuasa dua terkecil - ia memenuhi kriteria jumlah minimum sisihan kuasa dua daripadanya.

Contoh: regresi termudah (berpasangan).

Dalam kes regresi linear berpasangan, formula pengiraan dipermudahkan (anda boleh lakukan tanpa algebra matriks):

Sifat penganggar OLS

Pertama sekali, kami perhatikan bahawa untuk model linear anggaran OLS adalah anggaran linear, seperti berikut daripada formula di atas. Untuk anggaran OLS yang tidak berat sebelah, adalah perlu dan mencukupi untuk dilaksanakan syarat yang paling penting analisis regresi: bersyarat pada faktor, jangkaan matematik ralat rawak mestilah sama dengan sifar. syarat ini, khususnya, berpuas hati jika

  1. nilai yang dijangkakan ralat rawak adalah sifar, dan
  2. faktor dan ralat rawak adalah pembolehubah rawak bebas.

Syarat kedua - keadaan eksogeniti faktor - adalah asas. Jika harta ini tidak dipenuhi, maka kita boleh mengandaikan bahawa hampir mana-mana anggaran akan menjadi sangat tidak memuaskan: mereka tidak akan konsisten (iaitu, walaupun jumlah data yang sangat besar tidak membenarkan kami mendapatkan anggaran berkualiti tinggi dalam kes ini ). Dalam kes klasik, andaian yang lebih kuat dibuat tentang penentuan faktor, berbanding ralat rawak, yang secara automatik bermakna syarat eksogenitas dipenuhi. Dalam kes umum, untuk ketekalan anggaran, adalah memadai untuk memenuhi keadaan eksogen bersama-sama dengan penumpuan matriks kepada beberapa matriks bukan tunggal apabila saiz sampel meningkat kepada infiniti.

Agar, sebagai tambahan kepada ketekalan dan tidak berat sebelah, anggaran kuasa dua terkecil (biasa) juga berkesan (yang terbaik dalam kelas anggaran tidak berat sebelah linear), sifat tambahan ralat rawak mesti dipenuhi:

Andaian ini boleh dirumuskan untuk matriks kovarians bagi vektor ralat rawak

Model linear yang memenuhi syarat ini dipanggil klasik. Anggaran OLS untuk regresi linear klasik adalah anggaran tidak berat sebelah, konsisten dan anggaran paling berkesan dalam kelas semua anggaran tidak berat sebelah linear (dalam kesusasteraan Inggeris, singkatan kadangkala digunakan BIRU (Penganggar Tanpa Basis Linear Terbaik) - anggaran tidak berat sebelah linear terbaik; dalam kesusasteraan Rusia teorem Gauss-Markov lebih kerap disebut). Seperti yang mudah ditunjukkan, matriks kovarians bagi vektor anggaran pekali akan sama dengan:

OLS umum

Kaedah kuasa dua terkecil membolehkan generalisasi luas. Daripada meminimumkan jumlah kuasa dua baki, seseorang boleh meminimumkan beberapa bentuk kuadratik pasti positif vektor baki, di mana beberapa matriks berat pasti positif simetri. Kuasa dua terkecil konvensional adalah kes khas pendekatan ini, di mana matriks berat adalah berkadar dengan matriks identiti. Seperti yang diketahui dari teori matriks simetri (atau operator), untuk matriks sedemikian terdapat penguraian. Akibatnya, fungsi yang ditentukan boleh diwakili seperti berikut, iaitu, fungsi ini boleh diwakili sebagai jumlah kuasa dua beberapa "baki" yang diubah. Oleh itu, kita boleh membezakan kelas kaedah kuasa dua terkecil - kaedah LS (Kuasa Dua Terkecil).

Telah dibuktikan (teorem Aitken) bahawa untuk model regresi linear umum (di mana tiada sekatan dikenakan pada matriks kovarians ralat rawak), yang paling berkesan (dalam kelas anggaran tidak berat sebelah linear) ialah anggaran yang dipanggil. Kuasa Dua Terkecil umum (GLS - Kuasa Dua Terkecil Umum)- Kaedah LS dengan matriks berat sama dengan matriks kovarians songsang ralat rawak: .

Ia boleh ditunjukkan bahawa formula untuk anggaran GLS bagi parameter model linear mempunyai bentuk

Matriks kovarians anggaran ini sewajarnya akan sama dengan

Sebenarnya, intipati OLS terletak pada transformasi (linear) tertentu (P) data asal dan penggunaan OLS biasa pada data yang diubah. Tujuan transformasi ini ialah untuk data yang diubah, ralat rawak sudah memenuhi andaian klasik.

OLS berwajaran

Dalam kes matriks berat pepenjuru (dan oleh itu matriks kovarians ralat rawak), kita mempunyai apa yang dipanggil Kuasa Dua Terkecil berwajaran (WLS). DALAM dalam kes ini jumlah wajaran kuasa dua baki model diminimumkan, iaitu, setiap cerapan menerima "berat" yang berkadar songsang dengan varians ralat rawak dalam pemerhatian ini: . Malah, data diubah dengan menimbang pemerhatian (membahagikan dengan jumlah yang berkadar dengan jangkaan sisihan piawai ralat rawak), dan OLS biasa digunakan pada data berwajaran.

Beberapa kes khas menggunakan MNC dalam amalan

Pengiraan pergantungan linear

Mari kita pertimbangkan kes apabila, sebagai hasil daripada mengkaji pergantungan kuantiti skalar tertentu pada kuantiti skalar tertentu (Ini mungkin, sebagai contoh, pergantungan voltan pada kekuatan arus: , di mana adalah nilai malar, rintangan konduktor), pengukuran kuantiti ini telah dijalankan, akibatnya nilai dan nilai sepadannya. Data ukuran mesti direkodkan dalam jadual.

Jadual. Hasil pengukuran.

Nombor pengukuran
1
2
3
4
5
6

Persoalannya ialah: apakah nilai pekali yang boleh dipilih untuk menggambarkan pergantungan dengan terbaik? Mengikut kaedah kuasa dua terkecil, nilai ini hendaklah sedemikian rupa sehingga jumlah sisihan kuasa dua nilai daripada nilai

adalah minimum

Jumlah sisihan kuasa dua mempunyai satu ekstrem - minimum, yang membolehkan kita menggunakan formula ini. Mari kita cari daripada formula ini nilai pekali. Untuk melakukan ini, kami mengubah bahagian kirinya seperti berikut:

Formula terakhir membolehkan kita mencari nilai pekali, iaitu apa yang diperlukan dalam masalah.

cerita

Sebelum ini awal XIX V. saintis tidak mempunyai peraturan tertentu untuk menyelesaikan sistem persamaan di mana bilangan yang tidak diketahui adalah kurang daripada bilangan persamaan; Sehingga masa itu, teknik persendirian digunakan yang bergantung pada jenis persamaan dan kebijaksanaan kalkulator, dan oleh itu kalkulator yang berbeza, berdasarkan data pemerhatian yang sama, datang ke pelbagai kesimpulan. Gauss (1795) bertanggungjawab untuk aplikasi pertama kaedah, dan Legendre (1805) secara bebas menemui dan menerbitkannya di bawah nama moden(fr. Kaedah des moindres quarrés ). Laplace mengaitkan kaedah itu dengan teori kebarangkalian, dan ahli matematik Amerika Adrain (1808) menganggap aplikasi teori kebarangkaliannya. Kaedah ini meluas dan ditambah baik oleh penyelidikan lanjut oleh Encke, Bessel, Hansen dan lain-lain.

Penggunaan alternatif OLS

Idea kaedah kuasa dua terkecil juga boleh digunakan dalam kes lain yang tidak berkaitan secara langsung dengan analisis regresi. Hakikatnya ialah jumlah segi empat sama adalah salah satu ukuran kedekatan yang paling biasa untuk vektor (metrik Euclidean dalam ruang dimensi terhingga).

Satu aplikasi adalah untuk "menyelesaikan" sistem persamaan linear, di mana bilangan persamaan lebih banyak nombor pembolehubah

di mana matriksnya bukan segi empat sama, tetapi bersaiz segi empat tepat.

Sistem persamaan sedemikian, dalam kes umum, tidak mempunyai penyelesaian (jika pangkat sebenarnya lebih besar daripada bilangan pembolehubah). Oleh itu, sistem ini boleh "diselesaikan" hanya dalam erti kata memilih vektor sedemikian untuk meminimumkan "jarak" antara vektor dan . Untuk melakukan ini, anda boleh menggunakan kriteria meminimumkan jumlah perbezaan kuasa dua kiri dan bahagian yang betul persamaan sistem, iaitu. Adalah mudah untuk menunjukkan bahawa menyelesaikan masalah pengecilan ini membawa kepada penyelesaian sistem seterusnya persamaan

Kaedah kuasa dua terkecil

Kaedah kuasa dua terkecil ( OLS, OLS, Kuasa Dua Terkecil Biasa) - salah satu kaedah asas analisis regresi untuk menganggar parameter yang tidak diketahui model regresi menggunakan data sampel. Kaedah ini adalah berdasarkan meminimumkan jumlah kuasa dua sisa regresi.

Perlu diingatkan bahawa kaedah kuasa dua terkecil itu sendiri boleh dipanggil kaedah untuk menyelesaikan masalah di mana-mana kawasan jika penyelesaiannya terletak pada atau memenuhi beberapa kriteria untuk meminimumkan jumlah kuasa dua beberapa fungsi pembolehubah yang diperlukan. Oleh itu, kaedah kuasa dua terkecil juga boleh digunakan untuk perwakilan anggaran (penghampiran) fungsi tertentu oleh fungsi lain (lebih mudah), apabila mencari set kuantiti yang memenuhi persamaan atau kekangan, bilangan yang melebihi bilangan kuantiti ini , dan lain-lain.

Intipati MNC

Biarkan beberapa model (parametrik) hubungan kebarangkalian (regresi) antara pembolehubah (diterangkan) diberikan y dan banyak faktor (pembolehubah penjelasan) x

di mana ialah vektor parameter model yang tidak diketahui

- ralat model rawak.

Biarkan terdapat juga pemerhatian sampel nilai-nilai pembolehubah ini. Biarkan nombor pemerhatian (). Kemudian ialah nilai pembolehubah dalam pemerhatian ke. Kemudian, untuk nilai parameter b yang diberikan, adalah mungkin untuk mengira nilai teori (model) pembolehubah yang dijelaskan y:

Saiz sisa bergantung kepada nilai parameter b.

Intipati kaedah kuasa dua terkecil (biasa, klasik) adalah untuk mencari parameter b yang mana jumlah kuasa dua baki (eng. Jumlah Baki Kuasa Dua) akan menjadi minimum:

Dalam kes umum, masalah ini boleh diselesaikan dengan kaedah pengoptimuman berangka (pengurangan). Dalam kes ini mereka bercakap tentang kuasa dua terkecil tak linear(NLS atau NLLS - Bahasa Inggeris) Kuasa Dua Terkecil Bukan Linear). Dalam banyak kes adalah mungkin untuk mendapatkan penyelesaian analitikal. Untuk menyelesaikan masalah pengecilan, adalah perlu untuk mencari titik pegun fungsi dengan membezakannya berkenaan dengan parameter yang tidak diketahui b, menyamakan derivatif kepada sifar dan menyelesaikan sistem persamaan yang terhasil:

Jika ralat rawak model diedarkan secara normal, mempunyai varians yang sama dan tidak berkorelasi, anggaran parameter OLS adalah sama dengan anggaran kemungkinan maksimum (MLM).

OLS dalam kes model linear

Biarkan pergantungan regresi menjadi linear:

biarlah y ialah vektor lajur pemerhatian bagi pembolehubah yang dijelaskan, dan merupakan matriks pemerhatian faktor (baris matriks ialah vektor nilai faktor dalam pemerhatian tertentu, lajur ialah vektor nilai faktor tertentu dalam semua pemerhatian). Perwakilan matriks model linear mempunyai bentuk:

Kemudian vektor anggaran pembolehubah yang dijelaskan dan vektor sisa regresi akan sama

Oleh itu, jumlah kuasa dua baki regresi akan sama dengan

Membezakan fungsi ini berkenaan dengan vektor parameter dan menyamakan derivatif kepada sifar, kami memperoleh sistem persamaan (dalam bentuk matriks):

.

Penyelesaian sistem persamaan ini memberikan formula umum untuk anggaran kuasa dua terkecil untuk model linear:

Untuk tujuan analisis, perwakilan terakhir formula ini berguna. Jika dalam model regresi data berpusat, maka dalam perwakilan ini matriks pertama mempunyai maksud matriks kovarians sampel faktor, dan yang kedua ialah vektor kovarians faktor dengan pembolehubah bersandar. Jika di samping itu data juga dinormalkan kepada MSE (iaitu, akhirnya diseragamkan), maka matriks pertama mempunyai makna matriks korelasi sampel faktor, vektor kedua - vektor korelasi sampel faktor dengan pembolehubah bersandar.

Sifat penting anggaran OLS untuk model dengan tetap- garis regresi yang dibina melalui pusat graviti data sampel, iaitu, kesamaan dipenuhi:

Khususnya, dalam kes yang melampau, apabila satu-satunya regressor ialah pemalar, kami mendapati anggaran OLS bagi satu-satunya parameter (pemalar itu sendiri) adalah sama dengan nilai purata pembolehubah yang dijelaskan. Maksudnya, min aritmetik, yang terkenal dengan sifat baiknya daripada undang-undang nombor besar, juga merupakan anggaran kuasa dua terkecil - ia memenuhi kriteria jumlah minimum sisihan kuasa dua daripadanya.

Contoh: regresi termudah (berpasangan).

Dalam kes regresi linear berpasangan, formula pengiraan dipermudahkan (anda boleh lakukan tanpa algebra matriks):

Sifat penganggar OLS

Pertama sekali, kami ambil perhatian bahawa untuk model linear, anggaran OLS ialah anggaran linear, seperti berikut daripada formula di atas. Untuk anggaran OLS yang tidak berat sebelah, adalah perlu dan mencukupi untuk memenuhi syarat analisis regresi yang paling penting: jangkaan matematik ralat rawak, bersyarat pada faktor, mestilah sama dengan sifar. Keadaan ini, khususnya, berpuas hati jika

  1. jangkaan matematik ralat rawak adalah sifar, dan
  2. faktor dan ralat rawak adalah pembolehubah rawak bebas.

Syarat kedua - keadaan eksogeniti faktor - adalah asas. Jika harta ini tidak dipenuhi, maka kita boleh mengandaikan bahawa hampir mana-mana anggaran akan menjadi sangat tidak memuaskan: mereka tidak akan konsisten (iaitu, walaupun jumlah data yang sangat besar tidak membenarkan kami mendapatkan anggaran berkualiti tinggi dalam kes ini ). Dalam kes klasik, andaian yang lebih kuat dibuat tentang penentuan faktor, berbanding ralat rawak, yang secara automatik bermakna syarat eksogenitas dipenuhi. Dalam kes umum, untuk ketekalan anggaran, adalah memadai untuk memenuhi keadaan eksogen bersama-sama dengan penumpuan matriks kepada beberapa matriks bukan tunggal apabila saiz sampel meningkat kepada infiniti.

Agar, sebagai tambahan kepada ketekalan dan tidak berat sebelah, anggaran kuasa dua terkecil (biasa) juga berkesan (yang terbaik dalam kelas anggaran tidak berat sebelah linear), sifat tambahan ralat rawak mesti dipenuhi:

Andaian ini boleh dirumuskan untuk matriks kovarians bagi vektor ralat rawak

Model linear yang memenuhi syarat ini dipanggil klasik. Anggaran OLS untuk regresi linear klasik adalah anggaran tidak berat sebelah, konsisten dan anggaran paling berkesan dalam kelas semua anggaran tidak berat sebelah linear (dalam kesusasteraan Inggeris, singkatan kadangkala digunakan BIRU (Penganggar Tanpa Basis Linear Terbaik) - anggaran tidak berat sebelah linear terbaik; dalam kesusasteraan Rusia teorem Gauss-Markov lebih kerap disebut). Seperti yang mudah ditunjukkan, matriks kovarians bagi vektor anggaran pekali akan sama dengan:

OLS umum

Kaedah kuasa dua terkecil membolehkan generalisasi luas. Daripada meminimumkan jumlah kuasa dua baki, seseorang boleh meminimumkan beberapa bentuk kuadratik pasti positif vektor baki, di mana beberapa matriks berat pasti positif simetri. Kuasa dua terkecil konvensional adalah kes khas pendekatan ini, di mana matriks berat adalah berkadar dengan matriks identiti. Seperti yang diketahui dari teori matriks simetri (atau operator), untuk matriks sedemikian terdapat penguraian. Akibatnya, fungsi yang ditentukan boleh diwakili seperti berikut, iaitu, fungsi ini boleh diwakili sebagai jumlah kuasa dua beberapa "baki" yang diubah. Oleh itu, kita boleh membezakan kelas kaedah kuasa dua terkecil - kaedah LS (Kuasa Dua Terkecil).

Telah dibuktikan (teorem Aitken) bahawa untuk model regresi linear umum (di mana tiada sekatan dikenakan pada matriks kovarians ralat rawak), yang paling berkesan (dalam kelas anggaran tidak berat sebelah linear) ialah anggaran yang dipanggil. Kuasa Dua Terkecil umum (GLS - Kuasa Dua Terkecil Umum)- Kaedah LS dengan matriks berat sama dengan matriks kovarians songsang ralat rawak: .

Ia boleh ditunjukkan bahawa formula untuk anggaran GLS bagi parameter model linear mempunyai bentuk

Matriks kovarians anggaran ini sewajarnya akan sama dengan

Sebenarnya, intipati OLS terletak pada transformasi (linear) tertentu (P) data asal dan penggunaan OLS biasa pada data yang diubah. Tujuan transformasi ini ialah untuk data yang diubah, ralat rawak sudah memenuhi andaian klasik.

OLS berwajaran

Dalam kes matriks berat pepenjuru (dan oleh itu matriks kovarians ralat rawak), kita mempunyai apa yang dipanggil Kuasa Dua Terkecil berwajaran (WLS). Dalam kes ini, jumlah wajaran kuasa dua baki model diminimumkan, iaitu, setiap cerapan menerima "berat" yang berkadar songsang dengan varians ralat rawak dalam pemerhatian ini: . Malah, data diubah dengan menimbang pemerhatian (membahagikan dengan jumlah yang berkadar dengan anggaran sisihan piawai ralat rawak), dan OLS biasa digunakan pada data berwajaran.

Beberapa kes khas menggunakan MNC dalam amalan

Pengiraan pergantungan linear

Mari kita pertimbangkan kes apabila, sebagai hasil daripada mengkaji pergantungan kuantiti skalar tertentu pada kuantiti skalar tertentu (Ini mungkin, sebagai contoh, pergantungan voltan pada kekuatan arus: , di mana adalah nilai malar, rintangan konduktor), pengukuran kuantiti ini telah dijalankan, akibatnya nilai dan nilai sepadannya. Data ukuran mesti direkodkan dalam jadual.

Jadual. Hasil pengukuran.

Nombor pengukuran
1
2
3
4
5
6

Persoalannya ialah: apakah nilai pekali yang boleh dipilih untuk menggambarkan pergantungan dengan terbaik? Mengikut kaedah kuasa dua terkecil, nilai ini hendaklah sedemikian rupa sehingga jumlah sisihan kuasa dua nilai daripada nilai

adalah minimum

Jumlah sisihan kuasa dua mempunyai satu ekstrem - minimum, yang membolehkan kita menggunakan formula ini. Mari kita cari daripada formula ini nilai pekali. Untuk melakukan ini, kami mengubah bahagian kirinya seperti berikut:

Formula terakhir membolehkan kita mencari nilai pekali, iaitu apa yang diperlukan dalam masalah.

cerita

Sehingga awal abad ke-19. saintis tidak mempunyai peraturan tertentu untuk menyelesaikan sistem persamaan di mana bilangan yang tidak diketahui adalah kurang daripada bilangan persamaan; Sehingga masa itu, teknik persendirian digunakan yang bergantung pada jenis persamaan dan pada kecerdasan kalkulator, dan oleh itu kalkulator yang berbeza, berdasarkan data pemerhatian yang sama, membuat kesimpulan yang berbeza. Gauss (1795) adalah yang pertama menggunakan kaedah itu, dan Legendre (1805) secara bebas menemui dan menerbitkannya di bawah nama modennya (Perancis. Kaedah des moindres quarrés ). Laplace mengaitkan kaedah itu dengan teori kebarangkalian, dan ahli matematik Amerika Adrain (1808) menganggap aplikasi teori kebarangkaliannya. Kaedah ini meluas dan ditambah baik oleh penyelidikan lanjut oleh Encke, Bessel, Hansen dan lain-lain.

Penggunaan alternatif OLS

Idea kaedah kuasa dua terkecil juga boleh digunakan dalam kes lain yang tidak berkaitan secara langsung dengan analisis regresi. Hakikatnya ialah jumlah segi empat sama adalah salah satu ukuran kedekatan yang paling biasa untuk vektor (metrik Euclidean dalam ruang dimensi terhingga).

Satu aplikasi ialah "penyelesaian" sistem persamaan linear di mana bilangan persamaan lebih besar daripada bilangan pembolehubah

di mana matriksnya bukan segi empat sama, tetapi bersaiz segi empat tepat.

Sistem persamaan sedemikian, dalam kes umum, tidak mempunyai penyelesaian (jika pangkat sebenarnya lebih besar daripada bilangan pembolehubah). Oleh itu, sistem ini boleh "diselesaikan" hanya dalam erti kata memilih vektor sedemikian untuk meminimumkan "jarak" antara vektor dan . Untuk melakukan ini, anda boleh menggunakan kriteria meminimumkan jumlah kuasa dua perbezaan antara sisi kiri dan kanan persamaan sistem, iaitu. Adalah mudah untuk menunjukkan bahawa menyelesaikan masalah pengecilan ini membawa kepada penyelesaian sistem persamaan berikut

Jika ada kuantiti fizikal bergantung kepada kuantiti lain, maka pergantungan ini boleh dikaji dengan mengukur y pada nilai x yang berbeza. Hasil daripada pengukuran, beberapa nilai diperoleh:

x 1, x 2, ..., x i, ..., x n;

y 1 , y 2 , ..., y i , ... , y n .

Berdasarkan data eksperimen sedemikian, adalah mungkin untuk membina graf kebergantungan y = ƒ(x). Lengkung yang terhasil memungkinkan untuk menilai bentuk fungsi ƒ(x). Walau bagaimanapun, pekali malar yang memasuki fungsi ini masih tidak diketahui. Mereka boleh ditentukan menggunakan kaedah kuasa dua terkecil. Titik eksperimen, sebagai peraturan, tidak terletak tepat pada lengkung. Kaedah kuasa dua terkecil memerlukan jumlah kuasa dua sisihan titik eksperimen daripada lengkung, i.e. 2 adalah yang terkecil.

Dalam amalan, kaedah ini paling kerap (dan paling mudah) digunakan dalam kes hubungan linear, i.e. Bila

y = kx atau y = a + bx.

Kebergantungan linear sangat meluas dalam fizik. Dan walaupun perhubungan itu bukan linear, mereka biasanya cuba membina graf sedemikian rupa untuk mendapatkan garis lurus. Sebagai contoh, jika diandaikan bahawa indeks biasan kaca n berkaitan dengan panjang gelombang cahaya λ oleh hubungan n = a + b/λ 2, maka pergantungan n pada λ -2 diplotkan pada graf.

Pertimbangkan kebergantungan y = kx(garis lurus yang melalui asal). Mari kita susun nilai φ hasil tambah kuasa dua sisihan titik kita daripada garis lurus

Nilai φ sentiasa positif dan ternyata lebih kecil semakin dekat titik kita dengan garis lurus. Kaedah kuasa dua terkecil menyatakan bahawa nilai untuk k harus dipilih supaya φ mempunyai minimum


atau
(19)

Pengiraan menunjukkan bahawa ralat punca-min-kuasa dua dalam menentukan nilai k adalah sama dengan

, (20)
di mana n ialah bilangan ukuran.

Sekarang mari kita pertimbangkan sedikit lagi kes keras, apabila mata mesti memenuhi formula y = a + bx(garis lurus tidak melalui asal).

Tugasnya adalah untuk mencari, diberi satu set nilai x i , y i nilai terbaik a dan b.

Mari kita susun semula bentuk kuadratik φ, sama dengan jumlah sisihan kuasa dua titik x i, y i daripada garis lurus

dan cari nilai a dan b yang mana φ mempunyai minimum

;

.

.

Penyelesaian bersama persamaan ini memberi

(21)

Punca ralat purata kuasa dua bagi penentuan a dan b adalah sama

(23)

.  (24)

Apabila memproses keputusan pengukuran menggunakan kaedah ini, adalah mudah untuk meringkaskan semua data dalam jadual di mana semua amaun yang termasuk dalam formula (19)(24) dikira secara awal. Bentuk jadual ini diberikan dalam contoh di bawah.

Contoh 1. Persamaan asas dinamik telah dikaji pergerakan putaranε = M/J (garisan yang melalui asalan). Pada nilai yang berbeza pada masa M, pecutan sudut ε badan tertentu diukur. Ia diperlukan untuk menentukan momen inersia badan ini. Keputusan pengukuran momen daya dan pecutan sudut disenaraikan dalam lajur kedua dan ketiga jadual 5.

Jadual 5
n M, N m ε, s -1 M 2 M ε ε - kM (ε - kM) 2
1 1.44 0.52 2.0736 0.7488 0.039432 0.001555
2 3.12 1.06 9.7344 3.3072 0.018768 0.000352
3 4.59 1.45 21.0681 6.6555 -0.08181 0.006693
4 5.90 1.92 34.81 11.328 -0.049 0.002401
5 7.45 2.56 55.5025 19.072 0.073725 0.005435
– – 123.1886 41.1115 – 0.016436

Menggunakan formula (19) kita tentukan:

.

Untuk menentukan punca ralat min kuasa dua, kami menggunakan formula (20)

0.005775kg-1 · m -2 .

Mengikut formula (18) yang kita ada

; .

S J = (2.996 0.005775)/0.3337 = 0.05185 kg m2.

Setelah menetapkan kebolehpercayaan P = 0.95, menggunakan jadual pekali Pelajar untuk n = 5, kita dapati t = 2.78 dan tentukan kesilapan mutlakΔJ = 2.78 0.05185 = 0.1441 ≈ 0.2 kg m2.

Mari tulis keputusan dalam borang:

J = (3.0 ± 0.2) kg m2;


Contoh 2. Mari kita hitung pekali suhu rintangan logam menggunakan kaedah kuasa dua terkecil. Rintangan bergantung secara linear pada suhu

R t = R 0 (1 + α t°) = R 0 + R 0 α t°.

Istilah bebas menentukan rintangan R 0 pada suhu 0 ° C, dan pekali cerun adalah hasil darab pekali suhu α dan rintangan R 0 .

Keputusan pengukuran dan pengiraan diberikan dalam jadual ( lihat jadual 6).

Jadual 6
n t°, s r, Ohm t-¯ t (t-¯t) 2 (t-¯t)r r - bt - a (r - bt - a) 2 .10 -6
1 23 1.242 -62.8333 3948.028 -78.039 0.007673 58.8722
2 59 1.326 -26.8333 720.0278 -35.581 -0.00353 12.4959
3 84 1.386 -1.83333 3.361111 -2.541 -0.00965 93.1506
4 96 1.417 10.16667 103.3611 14.40617 -0.01039 107.898
5 120 1.512 34.16667 1167.361 51.66 0.021141 446.932
6 133 1.520 47.16667 2224.694 71.69333 -0.00524 27.4556
515 8.403 – 8166.833 21.5985 – 746.804
∑/n 85.83333 1.4005 – – – – –

Menggunakan formula (21), (22) kita tentukan

R 0 = ¯ R- α R 0 ¯ t = 1.4005 - 0.002645 85.83333 = 1.1735 Ohm.

Mari cari ralat dalam takrifan α. Oleh kerana , maka mengikut formula (18) kita mempunyai:

.

Menggunakan formula (23), (24) kita ada

;

0.014126 Ohm.

Setelah menetapkan kebolehpercayaan kepada P = 0.95, menggunakan jadual pekali Pelajar untuk n = 6, kita dapati t = 2.57 dan tentukan ralat mutlak Δα = 2.57 0.000132 = 0.000338 darjah -1.

α = (23 ± 4) 10 -4 hujan batu-1 pada P = 0.95.


Contoh 3. Ia diperlukan untuk menentukan jejari kelengkungan kanta menggunakan gelang Newton. Jejari gelang Newton r m diukur dan bilangan gelang m ini ditentukan. Jejari gelang Newton berkaitan dengan jejari kelengkungan kanta R dan nombor gelang mengikut persamaan.

r 2 m = mλR - 2d 0 R,

dengan d 0 ketebalan jurang antara kanta dan plat selari satah (atau ubah bentuk kanta),

λ panjang gelombang cahaya kejadian.

λ = (600 ± 6) nm;
r 2 m = y;
m = x;
λR = b;
-2d 0 R = a,

maka persamaan akan mengambil bentuk y = a + bx.

.

Keputusan pengukuran dan pengiraan dimasukkan ke dalam jadual 7.

Jadual 7
n x = m y = r 2, 10 -2 mm 2 m -m (m -m) 2 (m -¯ m)y y - bx - a, 10 -4 (y - bx - a) 2 , 10 -6
1 1 6.101 -2.5 6.25 -0.152525 12.01 1.44229
2 2 11.834 -1.5 2.25 -0.17751 -9.6 0.930766
3 3 17.808 -0.5 0.25 -0.08904 -7.2 0.519086
4 4 23.814 0.5 0.25 0.11907 -1.6 0.0243955
5 5 29.812 1.5 2.25 0.44718 3.28 0.107646
6 6 35.760 2.5 6.25 0.894 3.12 0.0975819
21 125.129 – 17.5 1.041175 – 3.12176
∑/n 3.5 20.8548333 – – – – –



Baru di tapak

>

Paling popular