Rumah Bau dari mulut Menilai kepentingan persamaan regresi kepada pekali penentuan. Regresi dalam Excel: persamaan, contoh

Menilai kepentingan persamaan regresi kepada pekali penentuan. Regresi dalam Excel: persamaan, contoh

Untuk menguji kepentingan, nisbah pekali regresi dan sisihan piawainya dianalisis. Nisbah ini ialah taburan Pelajar, iaitu, untuk menentukan kepentingan kita menggunakan ujian-t:

- RMS daripada penyebaran sisa;

- jumlah sisihan daripada nilai purata

Jika t ras. > tab t. , maka pekali b i adalah bererti.

Selang keyakinan ditentukan oleh formula:

PROSEDUR PELAKSANAAN KERJA

    Ambil data awal mengikut pilihan kerja (mengikut nombor pelajar dalam jurnal). Objek kawalan statik dengan dua input ditentukan X 1 , X 2 dan satu pintu keluar Y. Satu eksperimen pasif telah dijalankan di fasiliti tersebut dan sampel sebanyak 30 mata diperolehi yang mengandungi nilai X 1 , X 2 Dan Y bagi setiap eksperimen.

    Buka fail baharu dalam Excel 2007. Masukkan maklumat awal ke dalam lajur jadual asal - nilai pembolehubah input X 1 , X 2 dan pembolehubah keluaran Y.

    Sediakan dua lajur tambahan untuk memasukkan nilai yang dikira Y dan sisa.

    Panggil program "Regression": Data / Analisis Data / Regresi.

nasi. 1. Kotak dialog Analisis Data.

    Masukkan alamat data sumber ke dalam kotak dialog "Regression":

    selang input Y, selang input X (2 lajur),

    tetapkan tahap kebolehpercayaan kepada 95%,

    dalam pilihan "Selang keluaran", nyatakan sel kiri atas tempat data analisis regresi dikeluarkan (sel pertama pada halaman ke-2 lembaran kerja),

    dayakan pilihan "Baki" dan "Graf Baki",

    Klik OK untuk memulakan analisis regresi.

nasi. 2. Kotak dialog regresi.

    Excel akan memaparkan 4 jadual dan 2 graf pergantungan sisa pada pembolehubah X1 Dan X2.

    Format jadual "Output jumlah" - kembangkan lajur dengan nama data output, buat 3 angka bererti selepas titik perpuluhan dalam lajur kedua.

    Format jadual " Analisis varians» - menjadikan kuantiti mudah dibaca dan difahami angka penting selepas koma, pendekkan nama pembolehubah dan laraskan lebar lajur.

    Format jadual pekali persamaan - pendekkan nama pembolehubah dan laraskan lebar lajur jika perlu, jadikan bilangan digit bererti lebih mudah dibaca dan difahami, alih keluar 2 lajur terakhir (nilai dan susun atur jadual).

    Pindahkan data daripada jadual "Output Baki" ke lajur yang disediakan bagi jadual sumber, kemudian padamkan jadual "Output Baki" (pilihan "masukkan khas").

    Masukkan anggaran pekali yang diperoleh ke dalam jadual sumber.

    Tarik jadual keputusan ke bahagian atas halaman.

    Bina carta di bawah jadual Yexp, Ypengiraan dan ralat ramalan (baki).

    Format carta baki. Menggunakan graf yang terhasil, nilaikan ketepatan model berdasarkan input X1, X2.

    Cetak keputusan analisis regresi.

    Fahami keputusan analisis regresi.

    Sediakan laporan kerja.

CONTOH PRESTASI KERJA

Kaedah untuk melaksanakan analisis regresi dalam EXCEL dibentangkan dalam Rajah 3-5.

nasi. 3. Contoh analisis regresi dalam pakej EXCEL.


Rajah.4. Plot baki boleh ubah X1, X2

nasi. 5. Carta Yexp,Ypengiraan dan ralat ramalan (baki).

Menurut analisis regresi, kita boleh mengatakan:

1. Persamaan regresi yang diperoleh menggunakan Excel mempunyai bentuk:

    Pekali penentuan:

Variasi keputusan sebanyak 46.5% dijelaskan oleh variasi faktor.

    Ujian F am menguji hipotesis tentang kepentingan statistik bagi persamaan regresi. Analisis dilakukan dengan membandingkan nilai sebenar dan jadual ujian Fisher F.

Oleh kerana nilai sebenar melebihi jadual
, maka kami membuat kesimpulan bahawa persamaan regresi yang terhasil adalah signifikan secara statistik.

    Pekali pelbagai korelasi:

    b 0 :

t tab. (29, 0.975)=2.05

b 0 :

Selang keyakinan:

    Kami tentukan selang keyakinan untuk pekali b 1 :

Menyemak kepentingan pekali b 1 :

t dis. > tab t. , pekali b 1 adalah signifikan

Selang keyakinan:

    Tentukan selang keyakinan bagi pekali b 2 :

Ujian keertian untuk pekali b 2 :

Tentukan selang keyakinan:

PILIHAN TUGAS

Jadual 2. Pilihan tugas

Pilihan No.

Tanda berkesan Y i

Y 1

Y 1

Y 1

Y 1

Y 1

Y 1

Y 1

Y 1

Y 1

Y 1

Y 2

Y 2

Y 2

Y 2

Y 2

Faktor No. X i

Faktor No. X i

Sambungan Jadual 1

Pilihan No.

Tanda berkesan Y i

Y 2

Y 2

Y 2

Y 2

Y 2

Y 3

Y 3

Y 3

Y 3

Y 3

Y 3

Y 3

Y 3

Y 3

Y 3

Faktor No. X i

Faktor No. X i

Jadual 3. Data awal

Y 1

Y 2

Y 3

X 1

X 2

X 3

X 4

X 5

SOALAN UNTUK KAWALAN DIRI

    Masalah analisis regresi.

    Prasyarat untuk analisis regresi.

    Persamaan asas analisis varians.

    Apakah yang ditunjukkan oleh nisbah F Fisher?

    Bagaimanakah nilai jadual bagi kriteria Fisher ditentukan?

    Apakah yang ditunjukkan oleh pekali penentuan?

    Bagaimana untuk menentukan kepentingan pekali regresi?

    Bagaimana untuk menentukan selang keyakinan pekali regresi?

    Bagaimana untuk menentukan nilai ujian-t yang dikira?

    Bagaimana untuk menentukan nilai jadual ujian-t?

    Rumuskan idea utama analisis varians; untuk menyelesaikan masalah apakah yang paling berkesan?

    Apakah premis teori asas analisis varians?

    Uraikan jumlah sisihan kuasa dua kepada komponen dalam ANOVA.

    Bagaimana untuk mendapatkan anggaran varians daripada jumlah sisihan kuasa dua?

    Bagaimanakah bilangan darjah kebebasan yang diperlukan diperolehi?

    Bagaimanakah ralat piawai ditentukan?

    Terangkan reka bentuk analisis dua faktor bagi varians.

    Bagaimanakah klasifikasi silang berbeza daripada klasifikasi hierarki?

    Apakah perbezaan antara data seimbang?

Laporan disediakan dalam penyunting teks Word pada kertas A4 GOST 6656-76 (210x297 mm) dan mengandungi:

    Nama kerja makmal.

    Matlamat kerja.

  1. Hasil pengiraan.

MASA DIBENARKAN UNTUK SIAP

KERJA MAKMAL

Persediaan untuk bekerja - 0.5 akademik. Jam.

Penyelesaian kerja - 0.5 akademik. Jam.

Pengiraan komputer – 0.5 akademik. Jam.

Reka bentuk kerja – 0.5 akademik. Jam.

kesusasteraan

    Pengenalpastian objek kawalan. / A. D. Semenov, D. V. Artamonov, A. V. Bryukhachev. Tutorial. - Penza: PSU, 2003. - 211 p.

    Asas analisis statistik. Bengkel kaedah statistik dan penyelidikan operasi menggunakan pakej STATISTIK dan EXCEL. / Vukolov E.A. Tutorial. - M.: FORUM, 2008. - 464 p.

    Asas teori pengenalpastian objek kawalan. / A.A. Ignatiev, S.A. Ignatiev. Tutorial. - Saratov: SSTU, 2008. - 44 p.

    Teori kebarangkalian dan statistik matematik dalam contoh dan tugasan menggunakan EXCEL. / G.V. Gorelova, I.A. Katsko. - Rostov n/d: Phoenix, 2006.- 475 p.

    Matlamat 2

    Konsep Asas 2

    Perintah kerja 6

    Contoh kerja 9

    Soalan untuk mengawal diri 13

    Masa yang diperuntukkan untuk menyiapkan kerja 14

    Selepas menilai individu tersebut kepentingan statistik Bagi setiap pekali regresi, kepentingan keseluruhan pekali biasanya dianalisis, i.e. keseluruhan persamaan secara keseluruhan. Analisis ini dijalankan atas dasar menguji hipotesis tentang kepentingan umum hipotesis tentang kesamaan serentak kepada sifar semua pekali regresi untuk pembolehubah penjelasan:

    H 0: b 1 = b 2 = ... = b m = 0.

    Sekiranya hipotesis ini tidak ditolak, maka disimpulkan bahawa jumlah pengaruh semua m pembolehubah penjelasan X 1, X 2, ..., X m model ke atas pembolehubah bersandar Y boleh dianggap tidak signifikan secara statistik, dan kualiti keseluruhan. daripada persamaan regresi boleh dianggap rendah.

    Hipotesis ini diuji berdasarkan analisis varians membandingkan varians yang dijelaskan dan baki.

    H 0: (varian yang dijelaskan) = (varians sisa),

    H 1: (varian yang dijelaskan) > (varians sisa).

    F-statistik dibina:

    di mana – varians dijelaskan oleh regresi;

    – serakan baki (jumlah sisihan kuasa dua dibahagikan dengan bilangan darjah kebebasan n-m-1). Apabila andaian OLS dipenuhi, statistik F yang dibina mempunyai taburan Fisher dengan darjah kebebasan n1 = m, n2 = n–m–1. Oleh itu, jika pada tahap keertian yang diperlukan a F diperhatikan > F a ; m; n - m -1 = F a (di mana F a ; m ; n - m -1 ialah titik kritikal taburan Fisher), maka H 0 ditolak memihak kepada H 1 . Ini bermakna bahawa varians yang dijelaskan oleh regresi adalah jauh lebih besar daripada varians sisa, dan oleh itu, persamaan regresi secara kualitatif menggambarkan dinamik perubahan dalam pembolehubah bersandar Y. Jika F diperhatikan< F a ; m ; n - m -1 = F кр. , то нет основания для отклонения Н 0 . Значит, объясненная дисперсия соизмерима с дисперсией, вызванной случайными факторами. Это дает основание считать, что совокупное влияние объясняющих переменных модели несущественно, а следовательно, общее качество модели невысоко.

    Walau bagaimanapun, dalam amalan, bukannya hipotesis ini, hipotesis yang berkait rapat tentang kepentingan statistik bagi pekali penentuan R2 lebih kerap diuji:



    H 0: R 2 > 0.

    Untuk menguji hipotesis ini, statistik F berikut digunakan:

    . (8.20)

    Nilai F, jika andaian OLS dipenuhi dan jika H 0 adalah benar, mempunyai taburan Fisher yang serupa dengan taburan statistik F (8.19). Sesungguhnya, membahagikan pengangka dan penyebut pecahan dalam (8.19) dengan jumlah keseluruhan sisihan kuasa dua dan mengetahui bahawa ia terpecah kepada jumlah sisihan kuasa dua yang dijelaskan oleh regresi, dan jumlah baki sisihan kuasa dua (ini adalah akibat, seperti yang akan ditunjukkan kemudian, sistem persamaan normal)

    ,

    kami mendapat formula (8.20):

    Daripada (8.20) adalah jelas bahawa eksponen F dan R 2 adalah sama atau tidak sama dengan sifar pada masa yang sama. Jika F = 0, maka R 2 = 0, dan garis regresi Y = adalah yang terbaik mengikut kuasa dua terkecil, dan, oleh itu, nilai Y tidak bergantung secara linear pada X 1, X 2, ..., X m . Untuk menguji hipotesis nol H 0: F = 0 pada tahap keertian tertentu a, nilai kritikal F cr = F a didapati daripada jadual titik kritikal taburan Fisher; m; n - m -1 . Hipotesis nol ditolak jika F > F cr. Ini bersamaan dengan fakta bahawa R 2 > 0, i.e. R 2 adalah signifikan secara statistik.

    Analisis statistik F membolehkan kita membuat kesimpulan bahawa untuk menerima hipotesis bahawa semua pekali regresi linear secara serentak sama dengan sifar, pekali penentuan R2 tidak sepatutnya berbeza dengan ketara daripada sifar. Nilai kritikalnya berkurangan apabila bilangan cerapan meningkat dan boleh menjadi kecil sewenang-wenangnya.

    Biarkan, sebagai contoh, apabila menganggar regresi dengan dua pembolehubah penjelasan X 1 i, X 2 i untuk 30 pemerhatian, R 2 = 0.65. Kemudian

    Fob = = 25.07.

    Menggunakan jadual titik kritikal taburan Fisher, kita dapati F 0.05; 2; 27 = 3.36; F 0.01; 2; 27 = 5.49. Oleh kerana F diperhatikan = 25.07 > F cr kedua-duanya pada 5% dan pada aras keertian 1%, hipotesis nol ditolak dalam kedua-dua kes.

    Jika dalam keadaan yang sama R 2 = 0.4, maka

    F obs = = 9.

    Anggapan bahawa hubungan itu tidak penting juga ditolak di sini.

    Ambil perhatian bahawa dalam kes regresi berpasangan, menguji hipotesis nol untuk statistik-F adalah bersamaan dengan menguji hipotesis nol untuk statistik-t.

    pekali korelasi. Dalam kes ini, statistik F adalah sama dengan kuasa dua statistik-t. Pekali R2 memperoleh kepentingan bebas dalam kes regresi linear berganda.

    8.6. Analisis varians untuk menguraikan jumlah sisihan kuasa dua. Darjah kebebasan untuk jumlah sisihan kuasa dua yang sepadan

    Mari kita gunakan teori yang digariskan di atas untuk regresi linear berpasangan.

    Selepas persamaan regresi linear ditemui, kepentingan kedua-dua persamaan secara keseluruhan dan parameter individunya dinilai.

    Kepentingan persamaan regresi secara keseluruhan dinilai menggunakan ujian Fisher F. Dalam kes ini, hipotesis nol dikemukakan bahawa pekali regresi adalah sama dengan sifar, i.e. b = 0, dan oleh itu faktor x tidak mempunyai kesan ke atas keputusan y.

    Pengiraan langsung ujian-F didahului oleh analisis varians. Tempat pusat di dalamnya diduduki oleh penguraian jumlah sisihan kuasa dua pembolehubah y daripada nilai purata kepada dua bahagian - "diterangkan" dan "tidak dijelaskan":

    Persamaan (8.21) adalah akibat daripada sistem persamaan normal yang diterbitkan dalam salah satu topik sebelumnya.

    Bukti ungkapan (8.21).

    Ia kekal untuk membuktikan bahawa sebutan terakhir adalah sama dengan sifar.

    Jika anda menambah semua persamaan dari 1 hingga n

    y i = a+b×x i +e i , (8.22)

    maka kita dapat åy i = a×å1+b×åx i +åe i . Oleh kerana åe i =0 dan å1 =n, kita dapat

    Kemudian .

    Jika kita menolak persamaan (8.23) daripada ungkapan (8.22), kita memperoleh

    Hasilnya kita dapat

    Jumlah terakhir adalah sama dengan sifar disebabkan oleh sistem dua persamaan normal.

    Jumlah jumlah sisihan kuasa dua nilai individu ciri berkesan y daripada nilai purata disebabkan oleh pengaruh banyak sebab. Marilah kita membahagikan keseluruhan set sebab secara bersyarat kepada dua kumpulan: faktor x yang dikaji dan faktor lain. Jika faktor tidak mempunyai pengaruh ke atas keputusan, maka garis regresi adalah selari dengan OX dan paksi. Kemudian keseluruhan varians ciri yang terhasil adalah disebabkan oleh pengaruh faktor lain dan jumlah jumlah sisihan kuasa dua akan bertepatan dengan baki. Jika faktor lain tidak mempengaruhi keputusan, maka y berkaitan secara fungsi dengan x dan jumlah baki kuasa dua ialah sifar. Dalam kes ini, jumlah sisihan kuasa dua yang dijelaskan oleh regresi bertepatan dengan jumlah jumlah kuasa dua.

    Oleh kerana tidak semua titik medan korelasi terletak pada garis regresi, serakan mereka sentiasa berlaku kerana pengaruh faktor x, i.e. regresi y pada x, dan disebabkan oleh sebab lain (variasi yang tidak dapat dijelaskan). Kesesuaian garis regresi untuk ramalan bergantung pada berapa banyak daripada jumlah variasi dalam sifat y diambil kira oleh variasi yang dijelaskan. Jelas sekali, jika jumlah sisihan kuasa dua disebabkan oleh regresi adalah lebih besar daripada jumlah baki kuasa dua, maka persamaan regresi adalah signifikan secara statistik dan faktor x mempunyai kesan yang signifikan terhadap ciri y. Ini bersamaan dengan fakta bahawa pekali penentuan akan menghampiri perpaduan.

    Sebarang jumlah kuasa dua dikaitkan dengan bilangan darjah kebebasan (df – darjah kebebasan), dengan bilangan kebebasan variasi bebas sesuatu ciri. Bilangan darjah kebebasan adalah berkaitan dengan bilangan unit populasi n dan bilangan pemalar yang ditentukan daripadanya. Berhubung dengan masalah yang dikaji, bilangan darjah kebebasan harus menunjukkan berapa banyak sisihan bebas daripada n yang mungkin diperlukan untuk membentuk jumlah kuasa dua tertentu. Oleh itu, untuk jumlah jumlah kuasa dua, (n-1) sisihan bebas diperlukan, kerana dalam set n unit, selepas mengira purata, hanya (n-1) bilangan sisihan berbeza dengan bebas. Sebagai contoh, kita mempunyai satu siri nilai y: 1,2,3,4,5. Purata daripadanya ialah 3, dan kemudian n sisihan daripada purata ialah: -2, -1, 0, 1, 2. Oleh kerana , hanya empat sisihan berbeza secara bebas, dan sisihan kelima boleh ditentukan jika empat sebelumnya adalah diketahui.

    Apabila mengira jumlah dijelaskan atau faktor kuasa dua nilai teori (dikira) bagi ciri yang terhasil digunakan

    Maka jumlah sisihan kuasa dua disebabkan oleh regresi linear adalah sama dengan

    Oleh kerana, untuk isipadu cerapan dalam x dan y, jumlah faktor kuasa dua dalam regresi linear hanya bergantung pada pemalar regresi b, maka jumlah kuasa dua ini hanya mempunyai satu darjah kebebasan.

    Terdapat kesamaan antara bilangan darjah kebebasan jumlah, faktor dan jumlah baki sisihan kuasa dua. Bilangan darjah kebebasan jumlah baki kuasa dua dalam regresi linear ialah n-2. Bilangan darjah kebebasan bagi jumlah kuasa dua ditentukan oleh bilangan unit ciri pembolehubah, dan kerana kita menggunakan purata yang dikira daripada data sampel, kita kehilangan satu darjah kebebasan, i.e. df jumlah = n–1.

    Jadi, kita mempunyai dua persamaan:

    Membahagikan setiap jumlah kuasa dua dengan bilangan darjah kebebasan yang sepadan, kita memperoleh purata kuasa dua sisihan, atau, yang sama, serakan setiap satu darjah kebebasan D.

    ;

    ;

    .

    Mentakrifkan varians dengan satu darjah kebebasan membawa varians kepada bentuk yang setanding. Membandingkan faktor dan varians baki setiap darjah kebebasan, kami memperoleh nilai ujian Fisher F

    di mana F-kriteria untuk menguji hipotesis nol H 0: D fakta = D rehat.

    Jika hipotesis nol adalah benar, maka faktor dan varians baki tidak berbeza antara satu sama lain. Untuk H 0, penolakan adalah perlu supaya serakan faktor melebihi serakan sisa beberapa kali. Ahli statistik Inggeris Snedecor membangunkan jadual nilai kritikal nisbah-F pada pelbagai tahap kepentingan hipotesis nol dan pelbagai nombor darjah kebebasan. Nilai jadual Ujian-F ialah nilai maksimum nisbah varians yang boleh berlaku jika ia berbeza secara kebetulan untuk tahap kebarangkalian tertentu hipotesis nol. Nilai nisbah-F yang dikira dianggap boleh dipercayai jika ia lebih besar daripada nilai jadual. Jika F fakta > F jadual, maka hipotesis nol H 0: D fakta = D berehat tentang ketiadaan sambungan antara ciri-ciri ditolak dan kesimpulan dibuat tentang kepentingan sambungan ini.

    Jika F adalah fakta< F табл, то вероятность нулевой гипотезы H 0: D факт = D ост выше заданного уровня (например, 0,05) и она не может быть отклонена без серьёзного риска сделать неправильный вывод о наличии связи. В этом случае уравнение регрессии считается статистически незначимым. Гипотеза H 0 не отклоняется.

    Dalam contoh ini daripada Bab 3:

    = 131200 -7*144002 = 30400 – jumlah jumlah kuasa dua;

    1057.878*(135.43-7*(3.92571) 2) = 28979.8 – jumlah faktor kuasa dua;

    =30400-28979.8 = 1420.197 – jumlah baki kuasa dua;

    D fakta = 28979.8;

    D rehat = 1420.197/(n-2) = 284.0394;

    F fakta =28979.8/284.0394 = 102.0274;

    F a =0.05; 2; 5 =6.61; F a =0.01; 2; 5 = 16.26.

    Oleh kerana F fakta > F jadual pada kedua-dua aras keertian 1% dan 5%, kita boleh membuat kesimpulan bahawa persamaan regresi adalah signifikan (hubungan telah terbukti).

    Nilai ujian F adalah berkaitan dengan pekali penentuan. Jumlah faktor bagi sisihan kuasa dua boleh diwakili sebagai

    ,

    dan jumlah baki kuasa dua sebagai

    .

    Kemudian nilai ujian-F boleh dinyatakan sebagai

    .

    Penilaian signifikan regresi biasanya diberikan dalam bentuk analisis jadual varians

    , nilainya dibandingkan dengan nilai jadual pada aras keertian tertentu α dan bilangan darjah kebebasan (n-2).
    Sumber Variasi Bilangan darjah kebebasan Jumlah sisihan kuasa dua Penyerakan setiap darjah kebebasan Nisbah F
    sebenar Jadual pada a=0.05
    Umum
    Dijelaskan 28979,8 28979,8 102,0274 6,61
    Baki 1420,197 284,0394

    100 RUR bonus untuk pesanan pertama

    Pilih jenis pekerjaan Kerja siswazah Kerja kursus Esei Disertasi sarjana Laporan amalan Kajian Laporan Artikel Ujian Monograf Penyelesaian Masalah Rancangan Perniagaan Jawapan kepada Soalan Kerja kreatif Karya Lukisan Esei Terjemahan Persembahan Menaip Lain-lain Meningkatkan keunikan teks Tesis Sarjana. Kerja makmal Bantuan dalam talian

    Ketahui harganya

    Selepas persamaan regresi linear ditemui, penilaian kepentingan sebagai persamaan secara umum dan individunya parameter. Semak kepentingan persamaan regresi- bermaksud untuk menentukan sama ada ia sepadan model matematik, menyatakan hubungan antara pembolehubah, data eksperimen, dan sama ada pembolehubah penjelasan yang termasuk dalam persamaan (satu atau lebih) mencukupi untuk menerangkan pembolehubah bersandar. Untuk mempunyai pertimbangan umum tentang kualiti model daripada sisihan relatif bagi setiap pemerhatian, tentukan ralat anggaran purata: Ralat purata anggaran tidak boleh melebihi 8-10%.

    Kepentingan persamaan regresi secara keseluruhan dinilai berdasarkan F-Kriteria nelayan, yang didahului oleh analisis varians. Menurut idea asas analisis varians, jumlah jumlah sisihan kuasa dua pembolehubah y daripada purata y diuraikan kepada dua bahagian – “dijelaskan” dan “tidak dijelaskan”: di manakah jumlah jumlah sisihan kuasa dua; – jumlah sisihan kuasa dua dijelaskan oleh regresi (atau jumlah faktor sisihan kuasa dua); – jumlah baki sisihan kuasa dua, mencirikan pengaruh faktor yang tidak diambil kira dalam model. Mentakrifkan varians dengan satu darjah kebebasan membawa varians kepada bentuk yang setanding. Membandingkan faktor dan sisa serakan setiap satu darjah kebebasan, kami memperoleh nilainya F-Kriteria pemancing: Nilai sebenar F-Kriteria Fisher dibandingkan dengan

    nilai jadual F jadual (a; k 1; k 2) pada tahap keertian a dan darjah kebebasan k 1 = m Dan k 2= n-m-1.Dalam kes ini, jika nilai sebenar F- kriteria adalah lebih besar daripada satu jadual, maka kepentingan statistik persamaan secara keseluruhannya diiktiraf.

    Untuk regresi linear berpasangan m=1, oleh itu

    Magnitud F-kriteria berkaitan dengan pekali penentuan R2; ia boleh dikira menggunakan formula berikut:

    Dalam regresi linear berpasangan, kepentingan bukan sahaja persamaan secara keseluruhan, tetapi juga individunya. parameter. Untuk tujuan ini, untuk setiap parameter ralat piawainya ditentukan: m b Dan m a. Ralat piawai pekali regresi ditentukan oleh formula: , Di mana

    Nilai ralat standard bersama dengan t–Pengagihan pelajar di n-2 darjah kebebasan digunakan untuk menguji kepentingan pekali regresi dan untuk mengira selang keyakinannya. Untuk menilai kepentingan pekali regresi, nilainya dibandingkan dengan ralat piawainya, i.e. nilai sebenar ditentukan t-Ujian-t pelajar: yang kemudiannya dibandingkan dengan nilai jadual pada aras keertian tertentu a dan bilangan darjah kebebasan (n-2). Selang keyakinan untuk pekali regresi ditakrifkan sebagai b± t jadual × mb. Oleh kerana tanda pekali regresi menunjukkan peningkatan dalam ciri berkesan y dengan peningkatan dalam tanda-faktor x(b>0), penurunan dalam ciri berkesan dengan peningkatan dalam tanda-faktor ( b<0) или его независимость от независимой переменной (b=0), maka sempadan selang keyakinan untuk pekali regresi tidak seharusnya mengandungi keputusan bercanggah, contohnya, -1.5 £ b£0.8. Notasi jenis ini menunjukkan bahawa nilai sebenar pekali regresi pada masa yang sama mengandungi nilai positif dan negatif dan juga sifar, yang tidak boleh berlaku.

    Kesalahan biasa parameter a ditentukan oleh formula: Prosedur untuk menilai kepentingan parameter ini tidak berbeza daripada yang dibincangkan di atas untuk pekali regresi. Dikira t-kriteria: , nilainya dibandingkan dengan nilai jadual di n- 2 darjah kebebasan.


    Regresi Berpasangan mewakili regresi antara dua pembolehubah

    -y dan x, i.e. jenis model + E

    di mana di- tanda paduan, iaitu pembolehubah bersandar; X- faktor tanda.

    Regresi linear berkurang kepada mencari persamaan bentuk atau

    Persamaan bentuk membenarkan, memandangkan nilai faktor x, untuk mendapatkan nilai teori bagi ciri paduan dengan menggantikan nilai sebenar faktor x ke dalamnya.

    Pembinaan regresi linear adalah untuk menganggar parameternya a dan b.

    Anggaran parameter regresi linear boleh didapati menggunakan kaedah yang berbeza.

    1.

    2.

    Parameter b dipanggil pekali regresi. Nilainya menunjukkan

    perubahan purata dalam keputusan dengan perubahan faktor satu unit.

    Secara formal A- maksudnya di pada x = 0. Jika faktor tanda

    tidak dan tidak boleh mempunyai nilai sifar, maka di atas

    tafsiran ahli bebas, A tidak masuk akal. Parameter, A Mungkin

    tidak mempunyai kandungan ekonomi. Percubaan untuk ekonomi

    mentafsir parameter, A boleh membawa kepada tidak masuk akal, terutamanya apabila A < 0.

    Hanya tanda parameter boleh ditafsirkan A. Jika A > 0,

    maka perubahan relatif dalam keputusan adalah lebih perlahan daripada perubahan

    menyemak kualiti parameter yang ditemui dan keseluruhan model secara keseluruhan:

    -Penilaian kepentingan pekali regresi (b) dan pekali korelasi

    -Menilai kepentingan keseluruhan persamaan regresi. Pekali penentuan

    Persamaan regresi sentiasa ditambah dengan penunjuk kedekatan sambungan. Pada

    menggunakan regresi linear, penunjuk sedemikian ialah

    pekali korelasi linear r xy . Ada yang berbeza

    pengubahsuaian formula pekali korelasi linear.

    Pekali korelasi linear berada dalam had: -1≤ .r xy

    ≤ 1. Lebih-lebih lagi, lebih dekat r kepada 0, semakin lemah korelasi dan sebaliknya, semakin lemah

    Semakin hampir r kepada 1 atau -1, semakin kuat korelasi, i.e. pergantungan x dan y adalah hampir dengan

    linear. Jika r tepat =1 atau -1 semua titik terletak pada garis lurus yang sama.

    Jika pekali regresi b>0 kemudian 0 ≤. r xy≤ 1 dan

    sebaliknya bagi b<0 -1≤.r xy≤0. Coef.

    korelasi mencerminkan darjah pergantungan linear m / y kuantiti jika ada

    pergantungan yang jelas dari jenis lain.

    Untuk menilai kualiti pemasangan fungsi linear, kuasa dua linear

    pekali korelasi

    Dipanggil pekali penentuan. Pekali penentuan

    mencirikan bahagian varians atribut terhasil y yang dijelaskan

    regresi. Nilai yang sepadan

    mencirikan bahagian varians y, disebabkan oleh pengaruh orang lain yang tidak diketahui

    dalam model faktor.

    MNC membenarkan mendapatkan anggaran parameter tersebut A Dan b, yang

    jumlah sisihan kuasa dua nilai sebenar ciri yang terhasil

    (y) daripada dikira (teori)

    minimum:

    Dengan kata lain, daripada

    daripada keseluruhan set baris, garis regresi pada graf dipilih supaya jumlahnya

    segi empat sama jarak menegak antara titik dan garis ini akan menjadi

    yang minimum.

    Menyelesaikan sistem persamaan normal

    PENILAIAN KEPENTINGAN PARAMETER REGRESI LINEAR.

    Penilaian kepentingan persamaan regresi secara keseluruhan diberikan menggunakan ujian-F

    Fisher. Dalam kes ini, hipotesis nol dikemukakan bahawa pekali regresi adalah sama dengan

    sifar, iaitu b = 0, dan oleh itu faktor X tidak menyediakan

    pengaruh ke atas hasilnya u.

    Pengiraan segera bagi ujian-F didahului dengan analisis varians.

    Tempat pusat di dalamnya diduduki oleh pengembangan jumlah sisihan kuasa dua

    pembolehubah di daripada nilai purata di kepada dua bahagian -

    "dijelaskan" dan "tidak dijelaskan":

    Jumlah jumlah sisihan kuasa dua

    Jumlah persegi

    penyimpangan dijelaskan oleh regresi

    Jumlah baki sisihan kuasa dua.

    Sebarang jumlah sisihan kuasa dua adalah berkaitan dengan bilangan darjah kebebasan , T.

    iaitu dengan bilangan kebebasan variasi bebas sesuatu ciri. Bilangan darjah kebebasan adalah berkaitan dengan bilangan unit populasi n dan bilangan pemalar yang ditentukan daripadanya. Berhubung dengan masalah yang dikaji, bilangan darjah kebebasan harus menunjukkan berapa banyak sisihan bebas daripada P mungkin diperlukan untuk

    pembentukan jumlah kuasa dua tertentu.

    Penyerakan setiap darjah kebebasan D.

    Nisbah-F (ujian-F):

    Jika hipotesis nol adalah benar, maka varians faktor dan baki adalah tidak

    berbeza antara satu sama lain. Untuk H 0 penolakan adalah perlu mengikut urutan

    serakan faktor melebihi serakan sisa beberapa kali. Inggeris

    Ahli statistik Snedekor membangunkan jadual nilai kritikal F-nisbah

    pada tahap kepentingan hipotesis nol yang berbeza dan bilangan darjah yang berbeza

    kebebasan. Nilai jadual ujian F ialah nilai maksimum nisbah

    penyebaran, yang boleh berlaku apabila ia menyimpang secara rawak untuk sesuatu

    tahap kebarangkalian hipotesis nol. Nilai nisbah F yang dikira

    dianggap boleh dipercayai jika o lebih besar daripada jadual. Dalam kes ini, sifar

    hipotesis tentang ketiadaan perkaitan antara tanda ditolak dan kesimpulan dibuat tentang

    kepentingan sambungan ini: F fakta > F jadual N 0

    ditolak.

    Jika nilai ternyata kurang daripada jadual F fakta ‹, F jadual

    Maka kebarangkalian hipotesis nol adalah lebih tinggi daripada tahap tertentu dan ia tidak boleh

    ditolak tanpa risiko serius untuk membuat kesimpulan yang salah tentang kewujudan hubungan. DALAM

    Dalam kes ini, persamaan regresi dianggap tidak signifikan secara statistik. Tetapi

    tidak menyimpang.


    Maklumat berkaitan.


    Setelah menilai parameter a Dan b, kami telah memperoleh persamaan regresi yang dengannya kami boleh menganggarkan nilai y mengikut nilai yang diberikan x. Adalah wajar untuk mempercayai bahawa nilai pengiraan pembolehubah bersandar tidak akan bertepatan dengan nilai sebenar, kerana garis regresi menerangkan hubungan hanya secara purata, secara umum. Makna individu bertaburan di sekelilingnya. Oleh itu, kebolehpercayaan nilai yang dikira yang diperoleh daripada persamaan regresi sebahagian besarnya ditentukan oleh penyerakan nilai yang diperhatikan di sekeliling garis regresi. Dalam amalan, sebagai peraturan, varians ralat tidak diketahui dan dianggarkan daripada pemerhatian serentak dengan parameter regresi a Dan b. Adalah agak logik untuk mengandaikan bahawa anggaran itu berkaitan dengan jumlah kuasa dua sisa regresi. Kuantiti ialah anggaran sampel serakan gangguan yang terkandung dalam model teori . Ia boleh ditunjukkan bahawa untuk model regresi berpasangan

    di mana adalah sisihan nilai sebenar pembolehubah bersandar daripada nilai yang dikira.

    Jika , maka untuk semua pemerhatian nilai sebenar pembolehubah bersandar bertepatan dengan nilai yang dikira (teori) . Secara grafik, ini bermakna garis regresi teori (garisan yang dibina menggunakan fungsi) melalui semua titik medan korelasi, yang hanya boleh dilakukan dengan sambungan yang berfungsi dengan ketat. Oleh itu, tanda berkesan di adalah sepenuhnya disebabkan oleh pengaruh faktor tersebut X.

    Biasanya dalam amalan terdapat beberapa taburan titik medan korelasi berbanding garis regresi teori, iaitu sisihan data empirikal daripada yang teori. Penyerakan ini disebabkan oleh kedua-dua pengaruh faktor X, iaitu regresi y Oleh X, (varians sedemikian dipanggil dijelaskan, kerana ia dijelaskan oleh persamaan regresi), dan oleh tindakan sebab lain (variasi yang tidak dapat dijelaskan, rawak). Magnitud sisihan ini adalah asas untuk mengira penunjuk kualiti persamaan.

    Mengikut prinsip asas analisis varians, jumlah jumlah sisihan kuasa dua bagi pembolehubah bersandar y daripada nilai purata boleh diuraikan kepada dua komponen: dijelaskan oleh persamaan regresi dan tidak dijelaskan:

    ,

    di manakah nilai y, dikira mengikut persamaan.

    Mari kita cari nisbah jumlah sisihan kuasa dua yang dijelaskan oleh persamaan regresi kepada jumlah jumlah kuasa dua:

    , di mana

    . (7.6)

    Nisbah bahagian varians yang dijelaskan oleh persamaan regresi kepada jumlah varians ciri yang terhasil dipanggil pekali penentuan. Nilai tidak boleh melebihi perpaduan dan nilai maksimum ini hanya akan dicapai pada , i.e. apabila setiap sisihan adalah sifar dan oleh itu semua titik pada plot serakan terletak tepat pada garis lurus.

    Pekali penentuan mencirikan bahagian varians yang dijelaskan oleh regresi dalam jumlah varians pembolehubah bersandar . Oleh itu, nilai mencirikan bahagian variasi (penyebaran) y, tidak dijelaskan oleh persamaan regresi, dan oleh itu disebabkan oleh pengaruh faktor lain yang tidak diambil kira dalam model. Lebih dekat dengan perpaduan, lebih tinggi kualiti model.



    Dalam regresi linear berpasangan, pekali penentuan sama dengan segi empat sama beregu pekali linear korelasi: .

    Punca pekali penentuan ini ialah pekali korelasi berganda (indeks), atau nisbah korelasi teori.

    Untuk mengetahui sama ada nilai pekali penentuan yang diperoleh semasa menganggar regresi benar-benar menggambarkan hubungan sebenar antara y Dan x semak kepentingan persamaan yang dibina secara keseluruhan dan parameter individu. Menguji kepentingan persamaan regresi membolehkan anda mengetahui sama ada persamaan regresi sesuai untuk kegunaan praktikal, seperti ramalan atau tidak.

    Pada masa yang sama, hipotesis utama dikemukakan mengenai ketidakpentingan persamaan secara keseluruhan, yang secara rasmi mengurangkan kepada hipotesis bahawa parameter regresi adalah sama dengan sifar, atau, apa yang sama, bahawa pekali penentuan adalah sama. kepada sifar:. Hipotesis alternatif tentang kepentingan persamaan ialah hipotesis bahawa parameter regresi tidak sama dengan sifar atau pekali penentuan tidak sama dengan sifar: .

    Untuk menguji kepentingan model regresi, gunakan F- Kriteria Fisher, dikira sebagai nisbah jumlah kuasa dua (setiap satu pembolehubah bebas) kepada jumlah baki kuasa dua (setiap satu darjah kebebasan):

    , (7.7)

    di mana k– bilangan pembolehubah bebas.

    Selepas membahagikan pengangka dan penyebut hubungan (7.7) dengan jumlah jumlah sisihan kuasa dua pembolehubah bersandar, F- kriteria boleh dinyatakan secara setara berdasarkan pekali:

    .

    Jika hipotesis nol adalah benar, maka varians yang dijelaskan oleh persamaan regresi dan varians yang tidak dapat dijelaskan (sisa) tidak berbeza antara satu sama lain.

    Anggaran nilai F- kriteria dibandingkan dengan nilai kritikal, yang bergantung kepada bilangan pembolehubah bebas k, dan pada bilangan darjah kebebasan (n-k-1). Nilai jadual (kritikal). F- kriteria ialah nilai maksimum nisbah varians yang boleh berlaku jika ia mencapah secara rawak untuk tahap kebarangkalian tertentu hipotesis nol. Jika nilai yang dikira F- kriteria adalah lebih besar daripada satu jadual pada tahap kepentingan tertentu, maka hipotesis nol tentang ketiadaan hubungan ditolak dan kesimpulan dibuat tentang kepentingan hubungan ini, i.e. model itu dianggap penting.

    Untuk model regresi berpasangan

    .

    Dalam regresi linear, kepentingan bukan sahaja persamaan secara keseluruhan, tetapi juga pekali individunya biasanya dinilai. Untuk melakukan ini, ralat standard setiap parameter ditentukan. Ralat piawai pekali regresi parameter ditentukan oleh formula:

    , (7.8)

    (7.9)

    Ralat piawai pekali regresi atau sisihan piawai yang dikira menggunakan formula (7.8,7.9), sebagai peraturan, diberikan dalam keputusan pengiraan model regresi dalam pakej statistik.

    Berdasarkan kepada punca ralat purata kuasa dua bagi pekali regresi, kepentingan pekali ini disemak menggunakan skema biasa untuk menguji hipotesis statistik.

    Hipotesis utama ialah pekali regresi "benar" berbeza secara tidak ketara daripada sifar. Hipotesis alternatif dalam kes ini ialah hipotesis yang bertentangan, iaitu, bahawa parameter regresi "benar" tidak sama dengan sifar. Hipotesis ini diuji menggunakan t- statistik yang mempunyai t-Pengagihan pelajar:

    Kemudian nilai yang dikira t- statistik dibandingkan dengan nilai kritikal t- statistik ditentukan daripada jadual taburan Pelajar. Nilai kritikal ditentukan bergantung pada tahap keertian α dan bilangan darjah kebebasan, yang sama dengan (n-k-1), n ​​- bilangan pemerhatian, k- bilangan pembolehubah bebas. Dalam kes regresi berpasangan linear, bilangan darjah kebebasan ialah (P- 2). Nilai kritikal juga boleh dikira pada komputer menggunakan fungsi terbina dalam STUDARCOVER dalam pakej Excel.

    Jika nilai yang dikira t- statistik adalah lebih daripada kritikal, maka hipotesis utama ditolak dan dipercayai bahawa dengan kebarangkalian (1-α) pekali regresi "benar" adalah berbeza dengan ketara daripada sifar, iaitu pengesahan statistik kewujudan pergantungan linear pembolehubah yang sepadan.

    Jika nilai yang dikira t- statistik adalah kurang daripada kritikal, maka tidak ada sebab untuk menolak hipotesis utama, iaitu pekali regresi "benar" tidak berbeza dengan ketara daripada sifar pada tahap keertian. α . Dalam kes ini, faktor yang sepadan dengan pekali ini harus dikecualikan daripada model.

    Kepentingan pekali regresi boleh diwujudkan dengan membina selang keyakinan. Selang keyakinan untuk parameter regresi a Dan b ditakrifkan seperti berikut:

    ,

    ,

    di mana ditentukan daripada jadual taburan Pelajar untuk aras keertian α dan bilangan darjah kebebasan (P- 2) untuk regresi berpasangan.

    Oleh kerana pekali regresi dalam kajian ekonometrik mempunyai tafsiran ekonomi yang jelas, selang keyakinan tidak seharusnya mengandungi sifar. Nilai sebenar pekali regresi tidak boleh serentak mengandungi nilai positif dan negatif, termasuk sifar, jika tidak, kita mendapat hasil yang bercanggah apabila mentafsir pekali secara ekonomi, yang tidak boleh berlaku. Oleh itu, pekali adalah signifikan jika selang keyakinan yang terhasil tidak meliputi sifar.

    Contoh 7.4. Mengikut contoh 7.1:

    a) Bina model regresi linear berpasangan kebergantungan keuntungan pada jualan pada harga jualan menggunakan perisian pemprosesan data.

    b) Menilai kepentingan persamaan regresi secara keseluruhan menggunakan F- Kriteria Fisher di α=0.05.

    c) Menilai kepentingan pekali model regresi menggunakan t-Ujian pelajar di α=0.05 Dan α=0.1.

    Untuk menjalankan analisis regresi kami menggunakan perisian pejabat standard. program EXCEL. Kami akan membina model regresi menggunakan alat REGRESSION bagi tetapan ANALYSIS PACKAGE (Gamb. 7.5), yang dilancarkan seperti berikut:

    Analisis Data PerkhidmatanREGRESSIONOK.

    Rajah 7.5. Menggunakan alat REGRESSION

    Dalam kotak dialog REGRESSION, dalam medan Input interval Y, anda mesti memasukkan alamat julat sel yang mengandungi pembolehubah bersandar. Dalam medan Input interval X, anda perlu memasukkan alamat satu atau lebih julat yang mengandungi nilai pembolehubah bebas. Kotak semak Label dalam baris pertama ditetapkan kepada aktif jika pengepala lajur juga dipilih. Dalam Rajah. 7.6. menunjukkan borang skrin untuk mengira model regresi menggunakan alat REGRESSION.

    nasi. 7.6. Membina model regresi berpasangan menggunakan

    Alat REGRESSION

    Hasil daripada alat REGRESSION, protokol analisis regresi berikut dihasilkan (Rajah 7.7).

    nasi. 7.7. Protokol Analisis Regresi

    Persamaan untuk pergantungan keuntungan daripada jualan pada harga jualan mempunyai bentuk:

    Kami akan menilai kepentingan persamaan regresi menggunakan F- Ujian Fisher. Maknanya F- Kami akan mengambil kriteria Fisher daripada jadual "Analisis Varians" dalam protokol EXCEL (Rajah 7.7.). Anggaran nilai F- kriteria 53.372. Nilai jadual F- kriteria pada tahap keertian α=0.05 dan bilangan darjah kebebasan ialah 4.964. Kerana , maka persamaan itu dianggap penting.

    Nilai yang dikira t Ujian-t pelajar untuk pekali persamaan regresi ditunjukkan dalam jadual keputusan (Rajah 7.7). Nilai jadual t-Ujian t pelajar pada aras keertian α=0.05 dan 10 darjah kebebasan ialah 2.228. Untuk pekali regresi a, oleh itu pekali a tidak ketara. Untuk pekali regresi b, oleh itu, pekali b ketara



Baru di tapak

>

Paling popular