Rumah Bau dari mulut Pekali korelasi berbilang dan pekali penentuan berbilang. Korelasi Linear Berbilang

Pekali korelasi berbilang dan pekali penentuan berbilang. Korelasi Linear Berbilang

Mari kita mula-mula cuba mencari jawapan kepada setiap soalan yang telah kami kenal pasti dalam situasi di mana model kausal kami hanya mengandungi dua pembolehubah bebas.

Kolerasi berbilang R dan pekali penentuan R2

Untuk menganggar hubungan agregat semua pembolehubah tidak bersandar dengan pembolehubah bersandar, gunakan pekali berbilang R korelasi. Perbezaan antara pekali korelasi berganda R daripada pekali korelasi bivariat G ialah ia hanya boleh positif. Untuk dua pembolehubah bebas ia boleh dianggarkan seperti berikut:

Pekali korelasi berganda juga boleh ditentukan dengan menganggarkan pekali regresi separa yang membentuk persamaan (9.1). Untuk dua pembolehubah, persamaan ini jelas akan mengambil bentuk berikut:

(9.2)

Jika pembolehubah bebas kita diubah menjadi unit piawai taburan normal, atau taburan Z, persamaan (9.2) jelas akan mengambil bentuk berikut:

(9.3)

Dalam persamaan (9.3), pekali β menandakan nilai piawai bagi pekali regresi DALAM.

Pekali regresi piawai sendiri boleh dikira menggunakan formula berikut:

Sekarang formula untuk mengira pekali korelasi berganda akan kelihatan seperti ini:

Satu lagi cara untuk menganggarkan pekali korelasi R ialah pengiraan pekali korelasi bivariat r antara nilai pembolehubah bersandar Y dan nilai sepadan yang dikira berdasarkan persamaan regresi linear(9.2). Dengan kata lain, nilai R boleh dinilai seperti berikut:

Bersama dengan pekali ini, kita boleh menganggarkan, seperti dalam kes regresi mudah, nilainya R 2, yang juga biasanya dilambangkan sebagai pekali penentuan. Sama seperti dalam situasi menilai hubungan antara dua pembolehubah, pekali penentuan R 2 menunjukkan berapa peratus varians pembolehubah bersandar Y , iaitu , ternyata berkaitan dengan serakan semua pembolehubah tidak bersandar – . Dengan kata lain, pekali penentuan boleh dinilai seperti berikut:

Kita juga boleh menganggarkan peratusan varians baki dalam pembolehubah bersandar yang tidak dikaitkan dengan mana-mana pembolehubah bebas 1 – R 2. Punca kuasa dua daripada nilai ini, i.e. kuantiti , sama seperti dalam kes korelasi bivariat, dipanggil pekali pengasingan.

Bahagian korelasi

Pekali penentuan R Rajah 2 menunjukkan berapa peratus varians dalam pembolehubah bersandar yang boleh dikaitkan dengan varians dalam semua pembolehubah tidak bersandar yang termasuk dalam model kausal. Semakin besar pekali ini, semakin ketara model kausal yang kami kemukakan. Jika pekali ini ternyata tidak terlalu besar, maka sumbangan pembolehubah yang kita kaji kepada jumlah varians pembolehubah bersandar juga ternyata tidak signifikan. Walau bagaimanapun, dalam amalan, selalunya perlu untuk menganggarkan bukan sahaja jumlah sumbangan semua pembolehubah, tetapi juga sumbangan individu bagi setiap pembolehubah bebas yang sedang kita pertimbangkan. Sumbangan sedemikian boleh ditakrifkan sebagai bahagian korelasi.

Seperti yang kita ketahui, dalam kes korelasi bivariat, peratusan varians dalam pembolehubah bersandar yang dikaitkan dengan varians dalam pembolehubah bebas boleh ditandakan sebagai r 2. Walau bagaimanapun, sebahagian daripada varians ini dalam kes mengkaji kesan beberapa pembolehubah bebas adalah secara serentak disebabkan oleh varians pembolehubah bebas, yang kami gunakan sebagai kawalan. Hubungan ini jelas ditunjukkan dalam Rajah. 9.1.

nasi. 9.1. Nisbah varians bergantung (Y ) dan dua bebas (X 1DanX 2) pembolehubah dalam analisis korelasi dengan dua pembolehubah bebas

Seperti yang ditunjukkan dalam Rajah. 9.1, semua varians Y , dikaitkan dengan dua pembolehubah bebas kami, terdiri daripada tiga bahagian, berlabel a, b Dan Dengan. bahagian A Dan b kelainan Y tergolong secara berasingan dalam varians dua pembolehubah bebas - X 1 dan X 2. Pada masa yang sama, serakan bahagian c secara serentak menghubungkan kedua-dua serakan pembolehubah bersandar Y dan serakan dua pembolehubah kami. X. Oleh itu, untuk menilai hubungan pembolehubah X 1 dengan pembolehubah Y, yang bukan disebabkan oleh pengaruh pembolehubah X 2 setiap pembolehubah Y , perlu daripada kuantiti R" 2 tolak nilai korelasi kuasa dua Y Dengan X 2:

(9.6)

Dengan cara yang sama, kita boleh menganggarkan bahagian korelasi Y dengan X 2, yang bukan disebabkan oleh korelasinya dengan X 1.

(9.7)

Magnitud sr dalam persamaan (9.6) dan (9.7) adalah yang kita cari bahagian korelasi.

Korelasi bahagian juga boleh ditakrifkan dari segi korelasi bivariat biasa:

Dalam cara lain, korelasi sebahagian dipanggil korelasi separuh separa. Nama ini bermaksud bahawa apabila mengira korelasi, kesan pembolehubah bebas kedua dihapuskan berkenaan dengan nilai pembolehubah bebas pertama, tetapi tidak dihapuskan berkenaan dengan pembolehubah bersandar. Kesan X 1 dilaraskan menggunakan nilai X 2, jadi pekali korelasi tidak dikira antara Y Dan X 1 dan antara Y dan , dan nilai dikira berdasarkan nilai X 2 seperti yang dibincangkan dalam bab tentang regresi linear mudah (lihat subseksyen 7.4.2). Oleh itu, hubungan berikut ternyata sah:

Bagi menilai korelasi satu pembolehubah tidak bersandar dengan pembolehubah bersandar tanpa adanya pengaruh pembolehubah tidak bersandar yang lain terhadap kedua-dua pembolehubah bebas itu sendiri dan pembolehubah bersandar, konsep korelasi separa digunakan dalam analisis regresi.

Perkaitan separa

persendirian, atau separa, korelasi ditentukan dalam statistik matematik melalui perkadaran varians pembolehubah bersandar yang dikaitkan dengan varians pembolehubah bebas yang diberikan, berhubung dengan keseluruhan varians pembolehubah bersandar ini, tidak mengira bahagian itu yang dikaitkan dengan varians yang lain. pembolehubah bebas. Secara formal, untuk kes dua pembolehubah bebas, ini boleh dinyatakan seperti berikut:

Kolerasi separa menghargai diri mereka sendiri pr boleh didapati berdasarkan nilai korelasi bivariat:

Oleh itu, korelasi separa boleh ditakrifkan sebagai korelasi bivariat biasa antara nilai larasan kedua-dua pembolehubah bersandar dan bebas. Pembetulan itu sendiri dijalankan mengikut nilai pembolehubah bebas yang bertindak sebagai kawalan. Dengan kata lain, korelasi separa antara pembolehubah bersandar Y dan pembolehubah bebas X i boleh ditakrifkan sebagai korelasi biasa antara nilai dan nilai , dengan nilai dan diramalkan berdasarkan nilai pembolehubah bebas kedua X 2.

Pekali korelasi berbilang digunakan sebagai ukuran tahap kedekatan hubungan statistik antara penunjuk yang terhasil (pembolehubah bersandar) y dan satu set pembolehubah penjelasan (tidak bersandar) atau, dengan kata lain, menilai keakraban pengaruh faktor bersama terhadap keputusan.

Pekali korelasi berganda boleh dikira menggunakan beberapa formula 5, termasuk:

    menggunakan matriks pekali korelasi pasangan

, (3.18)

di mana  r- penentu matriks pekali korelasi pasangan y,
,

r 11 - penentu matriks korelasi antara faktor
;

. (3.19)

Untuk model di mana terdapat dua pembolehubah bebas, formula (3.18) dipermudahkan

. (3.20)

Kuasa dua pekali korelasi berganda ialah pekali penentuan R 2. Seperti regresi berpasangan, R 2 menunjukkan kualiti model regresi dan mencerminkan bahagian jumlah variasi ciri yang terhasil y dijelaskan oleh perubahan dalam fungsi regresi f(x) (lihat 2.4). Di samping itu, pekali penentuan boleh didapati menggunakan formula

. (3.21)

Walau bagaimanapun, penggunaan R 2 sekiranya regresi berganda adalah tidak betul sepenuhnya, kerana pekali penentuan meningkat apabila menambah regressor pada model. Ini kerana varians baki berkurangan apabila pembolehubah tambahan diperkenalkan. Dan jika bilangan faktor menghampiri bilangan cerapan, maka varians baki akan sama dengan sifar, dan pekali korelasi berganda, dan oleh itu pekali penentuan, akan mendekati satu, walaupun pada hakikatnya hubungan antara faktor dan hasilnya. dan kuasa penjelasan bagi persamaan regresi mungkin jauh lebih rendah.

Untuk mendapatkan penilaian yang mencukupi tentang seberapa baik variasi ciri yang terhasil dijelaskan oleh variasi beberapa ciri faktor, mereka menggunakan pekali penentuan terlaras

(3.22)

Pekali penentuan terlaras sentiasa kurang R 2. Lebih-lebih lagi, tidak seperti R 2, yang sentiasa positif,
juga boleh mengambil nilai negatif.

Contoh (sambungan contoh 1). Mari kita hitung pekali korelasi berganda mengikut formula (3.20):

Nilai pekali korelasi berganda, bersamaan dengan 0.8601, menunjukkan hubungan yang kukuh antara kos pengangkutan dan berat kargo dan jarak pengangkutannya.

Pekali penentuan adalah sama dengan: R 2 =0,7399.

Pekali penentuan terlaras dikira menggunakan formula (3.22):

=0,7092.

Perhatikan bahawa nilai pekali penentuan terlaras berbeza daripada nilai pekali penentuan.

Oleh itu, 70.9% daripada variasi dalam pembolehubah bersandar (kos pengangkutan) dijelaskan oleh variasi dalam pembolehubah bebas (berat kargo dan jarak pengangkutan). Baki 29.1% daripada variasi dalam pembolehubah bersandar dijelaskan oleh faktor-faktor yang tidak diambil kira dalam model.

Nilai pekali penentuan terlaras agak besar, oleh itu, kami dapat mengambil kira dalam model faktor paling penting yang menentukan kos pengangkutan. 

Pekali korelasi berganda bagi tiga pembolehubah adalah penunjuk keakraban hubungan linear antara salah satu ciri (huruf indeks sebelum tanda sempang) dan gabungan dua ciri lain (huruf indeks selepas sempang):

; (12.7)

(12.8)

Formula ini memudahkan untuk mengira pekali korelasi berbilang apabila nilai yang diketahui pekali korelasi pasangan r xy, r xz dan r yz.

Pekali R tidak negatif dan sentiasa berjulat dari 0 hingga 1. Semasa anda menghampiri R Untuk satu, tahap sambungan linear antara tiga ciri meningkat. Antara pekali korelasi berganda, cth. R y-xz, dan pekali korelasi dua pasangan r yx Dan r yz terdapat hubungan berikut: setiap pekali berpasangan tidak boleh melebihi nilai mutlak R y-xz.

Pekali korelasi berganda kuasa dua R 2 dipanggil pekali penentuan berbilang. Ia menunjukkan bahagian variasi dalam pembolehubah bersandar di bawah pengaruh faktor yang dikaji.

Kepentingan pelbagai korelasi dinilai oleh
F–kriteria:

, (12.9)

n- saiz sampel,

k– bilangan ciri; dalam kes kita k = 3.

Nilai teori F– kriteria diambil daripada jadual permohonan untuk ν 1 = k–1 dan ν 2 = n–k darjah kebebasan dan tahap kepentingan yang diterima. Hipotesis nol bahawa pekali korelasi berganda dalam populasi adalah sama dengan sifar ( H0:R= 0) diterima jika F fakta.< F табл . dan ditolak jika F fakta. ≥ F jadual.

Tamat kerja -

Topik ini tergolong dalam bahagian:

perangkaan matematik

Institusi pendidikan.. Gomel Universiti Negeri.. dinamakan sempena Francis Skaryna Yu M Zhuchenko..

Jika anda memerlukan bahan tambahan mengenai topik ini, atau anda tidak menemui apa yang anda cari, kami mengesyorkan menggunakan carian dalam pangkalan data kerja kami:

Apa yang akan kami lakukan dengan bahan yang diterima:

Jika bahan ini berguna kepada anda, anda boleh menyimpannya ke halaman anda di rangkaian sosial:

Semua topik dalam bahagian ini:

Tutorial
untuk pelajar universiti yang belajar dalam bidang kepakaran 1-31 01 01 “Biology” Gomel 2010

Subjek dan kaedah statistik matematik
Subjek statistik matematik ialah kajian tentang sifat fenomena jisim dalam biologi, ekonomi, teknologi dan bidang lain. Fenomena ini biasanya dipersembahkan sebagai kompleks kerana kepelbagaian (variasi)

Konsep peristiwa rawak
Induksi statistik atau inferens statistik, sebagai yang utama komponen kaedah untuk mengkaji fenomena jisim, mempunyai mereka sendiri ciri tersendiri. Kesimpulan statistik dibuat dengan berangka

Kebarangkalian kejadian rawak
Ciri berangka bagi peristiwa rawak yang mempunyai sifat bahawa untuk mana-mana siri ujian yang cukup besar kekerapan kejadian hanya berbeza sedikit daripada ciri ini dipanggil

Mengira Kebarangkalian
Selalunya terdapat keperluan untuk menambah dan mendarab kebarangkalian secara serentak. Sebagai contoh, anda perlu menentukan kebarangkalian mendapat 5 mata apabila membaling 2 dadu pada masa yang sama. Jumlah yang diperlukan mungkin

Konsep pembolehubah rawak
Setelah mentakrifkan konsep kebarangkalian dan menjelaskan sifat utamanya, mari kita teruskan untuk mempertimbangkan salah satu konsep yang paling penting bagi teori kebarangkalian - konsep pembolehubah rawak. Mari kita anggap itu sebagai hasilnya

Pembolehubah rawak diskret
Pembolehubah rawak adalah diskret jika set nilai yang mungkin adalah terhingga, atau sekurang-kurangnya boleh dikira. Katakan pembolehubah rawak X boleh mengambil nilai x1

Pembolehubah rawak berterusan
Berbeza dengan pembolehubah rawak diskret yang dibincangkan dalam subseksyen sebelumnya, populasi nilai yang mungkin pembolehubah rawak berterusan bukan sahaja tidak terhingga, tetapi juga tidak boleh

Jangkaan dan varians
Selalunya terdapat keperluan untuk mencirikan taburan pembolehubah rawak menggunakan satu atau dua penunjuk berangka yang menyatakan sifat paling penting bagi taburan ini. Kepada yang demikian

Detik-detik
Apa yang dipanggil momen taburan pembolehubah rawak adalah sangat penting dalam statistik matematik. Dalam jangkaan matematik, nilai besar pembolehubah rawak tidak diambil kira dengan secukupnya.

Taburan binomial dan ukuran kebarangkalian
Dalam topik ini kita akan mempertimbangkan jenis utama taburan pembolehubah rawak diskret. Mari kita andaikan bahawa kebarangkalian berlakunya beberapa peristiwa rawak A semasa satu percubaan adalah sama dengan

Taburan segi empat tepat (seragam).
Taburan segi empat tepat (seragam) - jenis paling ringkas pengagihan berterusan. Jika pembolehubah rawak X boleh mengambil sebarang nilai nyata dalam selang (a, b), di mana a dan b adalah nyata

Taburan normal
Taburan normal memainkan peranan asas dalam statistik matematik. Ini tidak sedikit pun secara tidak sengaja: dalam realiti objektif, pelbagai tanda sering dijumpai

Taburan lognormal
Pembolehubah rawak Y mempunyai taburan lognormal dengan parameter μ dan σ jika pembolehubah rawak X = lnY mempunyai taburan normal dengan parameter yang sama μ dan &

Nilai purata
Daripada semua sifat kumpulan, tahap purata, diukur dengan nilai purata atribut, mempunyai kepentingan teori dan praktikal yang paling besar. Nilai purata ciri adalah konsep yang sangat mendalam,

Sifat am purata
Untuk penggunaan nilai purata yang betul, adalah perlu untuk mengetahui sifat penunjuk ini: lokasi median, keabstrakan dan kesatuan jumlah tindakan. Mengikut nilai berangkanya

Min aritmetik
Purata aritmetik, yang mempunyai sifat umum nilai purata, mempunyai ciri tersendiri, yang boleh dinyatakan dengan formula berikut:

Kedudukan purata (purata bukan parametrik)
Kedudukan purata ditentukan untuk ciri yang kaedah pengukuran kuantitatif masih belum ditemui. Mengikut tahap manifestasi tanda-tanda sedemikian, objek boleh disusun, iaitu terletak

Purata aritmetik berwajaran
Biasanya, untuk mengira purata aritmetik, semua nilai atribut ditambah dan jumlah yang terhasil dibahagikan dengan bilangan pilihan. Dalam kes ini, setiap nilai yang disertakan dalam jumlah itu meningkatkannya dengan penuh

Min segi empat sama
Punca purata kuasa dua dikira menggunakan formula: , (6.5) Ia adalah sama dengan punca kuasa dua hasil tambah.

Median
Median ialah nilai ciri yang membahagikan keseluruhan kumpulan kepada dua bahagian yang sama: satu bahagian mempunyai nilai ciri kurang daripada median, dan satu lagi mempunyai nilai yang lebih besar. Sebagai contoh, jika anda mempunyai

Purata geometri
Untuk mendapatkan min geometri bagi kumpulan dengan n data, anda perlu mendarab semua pilihan dan mengekstrak daripada produk yang terhasil akar ke-n darjah:

Maksud harmonik
Min harmonik dikira menggunakan formula. (6.14) Untuk lima pilihan: 1, 4, 5, 5 Rabu

Bilangan darjah kebebasan
Bilangan darjah kebebasan adalah sama dengan bilangan unsur varieti bebas dalam kumpulan itu. Ia sama dengan bilangan semua elemen pembelajaran yang tersedia tanpa bilangan sekatan kepelbagaian. Sebagai contoh, untuk penyelidikan

Pekali variasi
Sisihan piawai– kuantiti yang dinamakan, dinyatakan dalam unit ukuran yang sama dengan min aritmetik. Oleh itu, sebagai perbandingan tanda yang berbeza, dinyatakan dalam unit berbeza daripada

Had dan skop
Untuk menilai secara cepat dan kasar tahap kepelbagaian, penunjuk paling mudah sering digunakan: lim = (min ¸ max) – had, iaitu yang terkecil dan nilai tertinggi tanda, p =

Sisihan ternormal
Biasanya, tahap perkembangan sesuatu sifat ditentukan dengan mengukurnya dan dinyatakan dengan nombor bernama tertentu: 3 kg berat, 15 cm panjang, 20 cangkuk pada sayap lebah, 4% lemak dalam susu, 15 kg keratan

Purata dan sigma daripada jumlah kumpulan
Kadangkala adalah perlu untuk menentukan min dan sigma untuk taburan ringkasan yang terdiri daripada beberapa taburan. Dalam kes ini, bukan pengedaran itu sendiri diketahui, tetapi hanya purata dan sigmanya.

Kecondongan (skewness) dan kecuraman (kurtosis) keluk taburan
Untuk sampel besar (n > 100), dua lagi statistik dikira. Kecondongan lengkung dipanggil asimetri:

Siri variasi
Apabila bilangan kumpulan yang dikaji bertambah, corak dalam kepelbagaian yang dalam kumpulan kecil disembunyikan oleh bentuk rawak manifestasinya menjadi semakin jelas.

Histogram dan lengkung variasi
Histogram ialah siri variasi, dibentangkan dalam bentuk rajah di mana nilai frekuensi yang berbeza diwakili oleh ketinggian bar yang berbeza. Histogram taburan data ditunjukkan dalam p

Kebolehpercayaan perbezaan dalam pengagihan
Hipotesis statistik ialah andaian khusus tentang taburan kebarangkalian yang mendasari sampel data yang diperhatikan. Peperiksaan hipotesis statistik adalah satu proses penerimaan

Kriteria untuk kecondongan dan kurtosis
Beberapa ciri tumbuhan, haiwan dan mikroorganisma, apabila menggabungkan objek ke dalam kumpulan, memberikan taburan yang berbeza dengan ketara daripada biasa. Dalam kes di mana ada

Populasi dan sampel
Seluruh susunan individu bagi kategori tertentu dipanggil populasi umum. Kelantangan penduduk ditentukan oleh objektif kajian. Jika ada spesies liar yang sedang dikaji

Keterwakilan
Kajian langsung ke atas sekumpulan objek terpilih menyediakan, pertama sekali, bahan utama dan ciri-ciri sampel itu sendiri. Semua data sampel dan penunjuk ringkasan adalah berkaitan

Kesilapan keterwakilan dan kesilapan penyelidikan lain
Anggaran parameter umum menggunakan penunjuk sampel mempunyai ciri tersendiri. Sebahagian tidak dapat mencirikan keseluruhan sepenuhnya, jadi ciri-ciri populasi umum

Sempadan amanah
Ia adalah perlu untuk menentukan magnitud ralat representasi untuk menggunakan penunjuk sampel juga untuk mencari kemungkinan nilai parameter umum. Proses ini dipanggil o

Prosedur penilaian am
Tiga kuantiti yang diperlukan untuk menilai parameter umum - penunjuk sampel (), kriteria kebolehpercayaan

Anggaran min aritmetik
Anggaran nilai purata bertujuan untuk menetapkan nilai purata umum untuk kategori objek yang dikaji. Ralat perwakilan yang diperlukan untuk tujuan ini ditentukan oleh formula:

Anggaran perbezaan min
Sesetengah kajian mengambil perbezaan dua ukuran sebagai data utama. Ini mungkin berlaku apabila setiap individu dalam sampel dikaji dalam dua negeri - atau dalam pada umur yang berbeza, atau hlm

Anggaran perbezaan min yang tidak boleh dipercayai dan boleh dipercayai
Keputusan kajian sampel sedemikian yang tiada anggaran pasti parameter umum boleh diperolehi (atau lebih besar daripada sifar, atau kurang daripada, atau sama dengan sifar) dipanggil tidak boleh dipercayai.

Anggaran perbezaan antara cara am
Dalam penyelidikan biologi, perbezaan antara dua kuantiti adalah sangat penting. Secara perbezaan, perbandingan dibuat antara populasi, ras, baka, varieti, garisan, keluarga, kumpulan eksperimen dan kawalan yang berbeza (kaedah gr

Kriteria kebolehpercayaan perbezaan
Lebih-lebih lagi sangat penting, yang penting bagi penyelidik untuk mendapatkan perbezaan yang boleh dipercayai, terdapat keperluan untuk menguasai kaedah yang memungkinkan untuk menentukan sama ada hasilnya boleh dipercayai, secara realistik

Keterwakilan dalam kajian ciri kualitatif
Ciri kualitatif biasanya tidak mempunyai gradasi manifestasi: ia sama ada terdapat atau tidak terdapat pada setiap individu, contohnya, jantina, polledness, kehadiran atau ketiadaan beberapa ciri, kecacatan

Kebolehpercayaan perbezaan saham
Kebolehpercayaan perbezaan dalam perkadaran sampel ditentukan dengan cara yang sama seperti perbezaan dalam min: (10.34)

Pekali korelasi
Banyak kajian memerlukan pemeriksaan pelbagai sifat dalam perkaitan mereka. Jika anda menjalankan kajian sedemikian berhubung dengan dua ciri, anda akan melihat bahawa kebolehubahan satu ciri tidak

Ralat pekali korelasi
Seperti mana-mana nilai sampel, pekali korelasi mempunyai ralat keterwakilan sendiri, dikira untuk sampel besar menggunakan formula:

Kebolehpercayaan pekali korelasi sampel
Kriteria untuk pekali korelasi sampel ditentukan oleh formula: (11.9) di mana:

Had keyakinan pekali korelasi
Had keyakinan nilai umum pekali korelasi ialah secara umum mengikut formula:

Kebolehpercayaan perbezaan antara dua pekali korelasi
Kebolehpercayaan perbezaan dalam pekali korelasi ditentukan dengan cara yang sama seperti kebolehpercayaan perbezaan min, mengikut formula biasa

Persamaan Regresi Lurus
Kolerasi garis lurus adalah berbeza kerana dengan bentuk sambungan ini, setiap perubahan yang sama dalam ciri pertama sepadan dengan perubahan yang pasti sepenuhnya dan juga sama secara purata dalam ciri lain.

Ralat dalam elemen persamaan regresi linear
Dalam persamaan regresi linear mudah: y = a + bx, tiga ralat keterwakilan timbul. 1 Ralat pekali regresi:

Pekali korelasi separa
Pekali separa korelasi ialah penunjuk yang mengukur tahap konjugasi dua ciri dengan nilai malar ketiga. perangkaan matematik membolehkan anda mewujudkan korelasi

Persamaan regresi berbilang linear
Persamaan matematik untuk hubungan linear antara tiga pembolehubah dipanggil berbilang persamaan linear satah regresi. Ia mempunyai bentuk umum berikut:

Hubungan korelasi
Jika hubungan antara fenomena yang dikaji menyimpang dengan ketara daripada linear, yang mudah diwujudkan daripada graf, maka pekali korelasi tidak sesuai sebagai ukuran sambungan. Dia boleh menunjukkan ketidakhadiran

Sifat hubungan korelasi
Nisbah korelasi mengukur tahap korelasi dalam sebarang bentuk. Di samping itu, hubungan korelasi mempunyai beberapa sifat lain yang sangat menarik dalam statistik

Ralat keterwakilan hubungan korelasi
Formula yang tepat untuk ralat keterwakilan hubungan korelasi belum lagi dibangunkan. Formula yang biasanya diberikan dalam buku teks mempunyai kelemahan yang tidak boleh selalu diabaikan. Formula ini tidak mengajar

Kriteria Lineariti Korelasi
Untuk menentukan tahap penghampiran pergantungan melengkung kepada pergantungan rectilinear, kriteria F digunakan, dikira dengan formula:

Kompleks penyebaran
Kompleks penyebaran ialah satu set penggredan dengan data yang terlibat dalam kajian dan purata data untuk setiap penggredan (purata separa) dan untuk keseluruhan kompleks (purata keseluruhan).

Pengaruh statistik
Pengaruh statistik adalah refleksi dalam kepelbagaian atribut yang terhasil daripada kepelbagaian faktor (penggredannya) yang dianjurkan dalam kajian. Untuk menilai pengaruh faktor neo

Pengaruh faktorial
Pengaruh faktorial ialah pengaruh statistik mudah atau gabungan faktor-faktor yang dikaji. Dalam kompleks faktor tunggal, pengaruh mudah satu faktor dikaji di bawah keadaan organisasi tertentu.

Kompleks penyebaran satu faktor
Analisis varians dibangunkan dan diperkenalkan ke dalam amalan penyelidikan pertanian dan biologi oleh saintis Inggeris R. A. Fisher, yang menemui undang-undang taburan nisbah min kuasa dua.

Kompleks penyebaran pelbagai faktor
Idea yang jelas tentang model matematik analisis varians memudahkan pemahaman tentang operasi pengiraan yang diperlukan, terutamanya apabila memproses data daripada eksperimen multivariate di mana lebih banyak

Transformasi
Penggunaan yang Betul analisis varians untuk memproses bahan eksperimen mengandaikan kehomogenan varians merentas varian (sampel), normal atau hampir dengan taburan normal dalam

Penunjuk kekuatan pengaruh
Menentukan kekuatan pengaruh berdasarkan keputusannya diperlukan dalam biologi, pertanian, dan perubatan untuk memilih yang paling cara yang berkesan kesan, untuk dos agen fizikal dan kimia - st.

Ralat keterwakilan penunjuk utama kekuatan pengaruh
Formula ralat yang tepat untuk penunjuk utama kekuatan pengaruh masih belum ditemui. Dalam kompleks satu faktor, apabila ralat keterwakilan ditentukan hanya untuk satu penunjuk faktorial

Hadkan nilai penunjuk pengaruh
Penunjuk utama kekuatan pengaruh adalah sama dengan bahagian satu penggal daripada jumlah keseluruhan istilah. Di samping itu, penunjuk ini sama dengan segi empat sama hubungan korelasi. Atas dua sebab ini, penunjuk kuasa

Kebolehpercayaan pengaruh
Penunjuk utama kuasa pengaruh yang diperolehi dalam sampel kajian, mencirikan, pertama sekali, tahap pengaruh yang sebenarnya menunjukkan dirinya dalam kumpulan objek yang dikaji

Analisis Diskriminasi
Analisis diskriminasi adalah salah satu kaedah analisis statistik multivariate. Tujuan analisis diskriminasi adalah untuk, berdasarkan pengukuran pelbagai ciri (ciri, pasangan)

Pernyataan masalah, kaedah penyelesaian, batasan
Katakan terdapat n objek dengan ciri m. Hasil daripada pengukuran, setiap objek dicirikan oleh vektor x1 ... xm, m >1. Cabarannya ialah

Andaian dan Had
Analisis diskriminasi "berfungsi" jika beberapa andaian dipenuhi. Andaian bahawa kuantiti yang boleh diperhatikan—ciri yang boleh diukur bagi sesuatu objek—mempunyai taburan normal. ini

Algoritma Analisis Diskriminasi
Penyelesaian kepada masalah diskriminasi (analisis diskriminasi) terdiri daripada membahagikan keseluruhan ruang sampel (set realisasi semua pembolehubah rawak multidimensi yang sedang dipertimbangkan) kepada nombor tertentu

Analisis kluster
Analisis kluster menyatukan pelbagai prosedur, digunakan untuk pengelasan. Hasil daripada menggunakan prosedur ini, set awal objek dibahagikan kepada kelompok atau kumpulan

Kaedah analisis kelompok
Dalam amalan, kaedah pengelompokan aglomeratif biasanya dilaksanakan. Biasanya, sebelum pengelasan bermula, data diseragamkan (purata ditolak dan dibahagikan dengan punca kuasa dua.

Algoritma analisis kelompok
Analisis kluster ialah satu set kaedah untuk mengklasifikasikan pemerhatian atau objek multidimensi berdasarkan mentakrifkan konsep jarak antara objek dan kemudian mengenal pasti kumpulan daripadanya, &

7.1. Analisis Regresi Linear terdiri daripada memilih graf untuk satu set pemerhatian menggunakan kaedah petak terkecil. Analisis regresi membolehkan kami mewujudkan hubungan berfungsi antara beberapa pembolehubah rawak Y dan ada yang mempengaruhi Y nilai X. Pergantungan ini dipanggil persamaan regresi. Ada yang mudah ( y=m*x+b) dan jamak ( y=m 1 *x 1 +m 2 *x 2 +... + m k *x k +b) regresi jenis linear dan bukan linear.
Untuk menilai tahap hubungan antara kuantiti, ia digunakan Pekali korelasi berbilang Pearson R(nisbah korelasi), yang boleh mengambil nilai dari 0 hingga 1. R=0 jika tiada hubungan antara kuantiti, dan R=1 jika terdapat hubungan fungsi antara kuantiti. Dalam kebanyakan kes, R mengambil nilai perantaraan daripada 0 hingga 1. Nilainya R 2 dipanggil pekali penentuan.
Tugas membina pergantungan regresi adalah untuk mencari vektor pekali M model regresi linear berganda, di mana pekali R mengambil nilai maksimum.
Untuk menilai kepentingan R berlaku Ujian F Fisher, dikira dengan formula:

di mana n– bilangan eksperimen; k– bilangan pekali model. Jika F melebihi beberapa nilai kritikal untuk data n Dan k dan diterima kebarangkalian keyakinan, kemudian nilai R dianggap penting.

7.2. alat Regresi daripada Pakej analisis membolehkan anda mengira data berikut:

· kemungkinan fungsi linear regresi– kaedah kuasa dua terkecil; jenis fungsi regresi ditentukan oleh struktur data sumber;

· pekali penentuan dan kuantiti yang berkaitan(meja Statistik regresi);

· jadual varians dan statistik kriteria untuk menguji kepentingan regresi(meja Analisis varians);

· sisihan piawai dan ciri statistiknya yang lain untuk setiap pekali regresi, membolehkan anda menyemak kepentingan pekali ini dan membina selang keyakinan untuknya;

· nilai fungsi regresi dan sisa– perbezaan antara nilai awal pembolehubah Y dan nilai pengiraan fungsi regresi (jadual Pengeluaran baki);

· kebarangkalian sepadan dengan nilai pembolehubah Y yang dipesan dalam tertib menaik(meja Keluaran kebarangkalian).

7.3. Hubungi alat pemilihan melalui Data > Analisis Data > Regresi.

7.4. Di padang Selang input Y masukkan alamat julat yang mengandungi nilai pembolehubah bersandar Y. Julat mesti terdiri daripada satu lajur.
Di padang Selang input X masukkan alamat julat yang mengandungi nilai pembolehubah X. Julat mesti terdiri daripada satu atau lebih lajur, tetapi tidak lebih daripada 16 lajur. Jika dinyatakan dalam medan Selang input Y Dan Selang input X julat termasuk pengepala lajur, maka anda perlu menyemak kotak pilihan Tag– pengepala ini akan digunakan dalam jadual output yang dihasilkan oleh alat Regresi.
Kotak pilihan Malar - sifar harus diwujudkan jika persamaan regresi mempunyai pemalar b dipaksa sama dengan sifar.
Pilihan Tahap kebolehpercayaan ditetapkan apabila perlu untuk membina selang keyakinan untuk pekali regresi dengan tahap keyakinan selain daripada 0.95, yang digunakan secara lalai. Selepas menyemak kotak pilihan Tahap kebolehpercayaan Medan input menjadi tersedia di mana nilai tahap keyakinan baharu dimasukkan.
Di kawasan Lebihan makanan Terdapat empat pilihan: Lebihan makanan, Baki piawai, Carta imbangan Dan Jadual pemilihan. Jika sekurang-kurangnya satu daripadanya dipasang, jadual akan muncul dalam hasil output Pengeluaran baki, yang akan memaparkan nilai fungsi regresi dan sisa - perbezaan antara nilai awal pembolehubah Y dan nilai pengiraan fungsi regresi. Di kawasan Kebarangkalian biasa Terdapat satu pilihan – ; pemasangannya menjana jadual dalam hasil output Keluaran kebarangkalian dan membawa kepada pembinaan graf yang sepadan.


7.5. Tetapkan parameter mengikut gambar. Pastikan nilai Y ialah pembolehubah pertama (termasuk sel dengan nama) dan nilai X ialah dua pembolehubah lain (termasuk sel dengan nama). klik okey.

7.6. Dalam jadual Statistik regresi Data berikut disediakan.

Jamak R– punca pekali penentuan R 2 diberikan dalam baris seterusnya. Nama lain untuk penunjuk ini ialah indeks korelasi, atau pekali korelasi berganda.

R-segi empat– pekali penentuan R 2 ; dikira sebagai nisbah jumlah regresi kuasa dua(sel C12) kepada jumlah kuasa dua(sel C14).

Biasa R-kuasa dua dikira dengan formula

di mana n ialah bilangan nilai pembolehubah Y, k ialah bilangan lajur dalam selang input pembolehubah X.

Kesalahan biasa– punca varians baki (sel D13).

Pemerhatian– bilangan nilai pembolehubah Y.

7.7. DALAM Jadual penyebaran dalam lajur SS jumlah kuasa dua diberikan dalam lajur df– bilangan darjah kebebasan. dalam lajur CIK– penyebaran. Dalam barisan Regresi dalam lajur f Nilai statistik kriteria dikira untuk menguji kepentingan regresi. Nilai ini dikira sebagai nisbah varians regresi kepada varians baki (sel D12 dan D13). Dalam lajur Kepentingan F kebarangkalian nilai yang diperolehi bagi statistik kriteria dikira. Jika kebarangkalian ini kurang daripada, sebagai contoh, 0.05 (tahap keertian yang diberikan), maka hipotesis tentang tidak signifikan regresi (iaitu, hipotesis bahawa semua pekali fungsi regresi adalah sama dengan sifar) ditolak dan regresi adalah dianggap penting. Dalam contoh ini, regresi tidak penting.

7.8. Dalam jadual berikut, dalam lajur Kemungkinan, nilai pengiraan pekali fungsi regresi ditulis, manakala dalam baris persimpangan Y nilai istilah bebas ditulis b. Dalam lajur Kesalahan biasa Sisihan piawai bagi pekali dikira.
Dalam lajur t-statistik Nisbah nilai pekali kepada sisihan piawainya direkodkan. Ini adalah nilai-nilai statistik kriteria untuk menguji hipotesis tentang kepentingan pekali regresi.
Dalam lajur P-Nilai aras keertian yang sepadan dengan nilai statistik kriteria dikira. Jika aras keertian yang dikira adalah kurang daripada aras keertian yang ditentukan (contohnya, 0.05). maka hipotesis bahawa pekali berbeza dengan ketara daripada sifar diterima; jika tidak, hipotesis bahawa pekali berbeza secara tidak ketara daripada sifar diterima. Dalam contoh ini, hanya pekali b berbeza dengan ketara daripada sifar, selebihnya - tidak ketara.
Dalam lajur Bawah 95% Dan 95% teratas sempadan selang keyakinan dengan tahap keyakinan 0.95 diberikan. Sempadan ini dikira menggunakan formula
Rendah 95% = Pekali - Ralat Piawai * t α;
Atas 95% = Pekali + Ralat Piawai * t α.
Di sini t α– kuantiti pesanan α Taburan t pelajar dengan (n-k-1) darjah kebebasan. DALAM dalam kes ini α = 0.95. Sempadan selang keyakinan dalam lajur dikira dengan cara yang sama Bawah 90.0% Dan 90.0% teratas.

7.9. Pertimbangkan jadual Pengeluaran baki daripada hasil keluaran. Jadual ini muncul dalam hasil output hanya apabila sekurang-kurangnya satu pilihan dalam kawasan itu ditetapkan Lebihan makanan kotak dialog Regresi.

Dalam lajur Pemerhatian nombor siri nilai pembolehubah diberikan Y.
Dalam lajur Diramalkan Y nilai-nilai fungsi regresi y i = f(x i) dikira untuk nilai-nilai pembolehubah tersebut X, yang sepadan dengan nombor siri i dalam lajur Pemerhatian.
Dalam lajur Lebihan makanan mengandungi perbezaan (sisa) ε i =Y-y i, dan lajur Baki piawai– sisa ternormal, yang dikira sebagai nisbah ε i / s ε. dengan s ε ialah sisihan piawai bagi baki. Kuasa dua nilai s ε dikira menggunakan formula

di manakah purata baki. Nilai boleh dikira sebagai nisbah dua nilai daripada jadual serakan: jumlah sisa kuasa dua (sel C13) dan darjah kebebasan dari baris Jumlah(sel B14).

7.10. Mengikut nilai jadual Pengeluaran baki dua jenis graf dibina: carta baki Dan jadual pemilihan(jika pilihan yang sesuai ditetapkan dalam kawasan Lebihan makanan kotak dialog Regresi). Ia dibina untuk setiap komponen pembolehubah X secara berasingan.

hidup carta imbangan baki dipaparkan, i.e. perbezaan antara nilai asal Y dan dikira daripada fungsi regresi bagi setiap nilai komponen pembolehubah X.

hidup jadual pemilihan memaparkan kedua-dua nilai Y asal dan nilai fungsi regresi yang dikira untuk setiap nilai komponen pembolehubah X.

7.11. Jadual terakhir hasil output ialah jadual Keluaran kebarangkalian. Ia muncul jika dalam kotak dialog Regresi pilihan dipasang Plot kebarangkalian biasa.
Nilai lajur Persentil dikira seperti berikut. Langkah dikira h = (1/n)*100%, nilai pertama ialah h/2, yang kedua adalah sama 100-j/2. Bermula dari nilai kedua, setiap nilai berikutnya adalah sama dengan yang sebelumnya, yang mana satu langkah ditambah h.
Dalam lajur Y nilai pembolehubah diberikan Y, diisih mengikut tertib menaik. Berdasarkan data dalam jadual ini, yang dipanggil graf taburan normal. Ia membolehkan anda menilai secara visual tahap kelinearan hubungan antara pembolehubah X Dan Y.


8. D analisis varians

8.1. Pakej analisis membenarkan tiga jenis analisis varians. Pilihan instrumen tertentu ditentukan oleh bilangan faktor dan bilangan sampel dalam set data yang sedang dikaji.
digunakan untuk menguji hipotesis bahawa min dua atau lebih sampel kepunyaan populasi yang sama adalah serupa.
ANOVA dua hala dengan ulangan adalah pilihan yang lebih kompleks analisis univariate, termasuk lebih daripada satu sampel untuk setiap kumpulan data.
ANOVA dua hala tanpa ulangan ialah analisis varians dua hala yang tidak termasuk lebih daripada satu sampel bagi setiap kumpulan. Ia digunakan untuk menguji hipotesis bahawa min dua atau lebih sampel adalah sama (sampel tergolong dalam populasi yang sama).

8.2. ANOVA sehala

8.2.1. Mari sediakan data untuk analisis. Buat helaian baharu dan salin lajur padanya A, B, C, D. Keluarkan dua baris pertama. Data yang disediakan boleh digunakan untuk menjalankan Analisis varians sehala.

8.2.2. Hubungi alat pemilihan melalui Data > Analisis Data > ANOVA Sehala. Isi mengikut gambar. klik okey.

8.2.3. Pertimbangkan jadual Keputusan: Semak- bilangan ulangan, Jumlah– jumlah nilai penunjuk mengikut baris, Penyerakan– varians separa penunjuk.

8.2.4. Jadual Analisis varians: lajur pertama Sumber Variasi mengandungi nama penyebaran, SS– jumlah sisihan kuasa dua, df- darjah kebebasan, CIK– persegi purata, Ujian-F taburan F sebenar. P-nilai– kebarangkalian bahawa varians yang dihasilkan semula oleh persamaan adalah sama dengan varians baki. Ia menetapkan kebarangkalian bahawa penentuan kuantitatif yang diperolehi hubungan antara faktor dan hasilnya boleh dianggap rawak. F-kritikal ialah nilai F teoritikal, yang kemudiannya dibandingkan dengan F sebenar.

8.2.5. Hipotesis nol kesaksamaan jangkaan matematik daripada semua sampel diterima jika ketaksamaan Ujian-F < F-kritikal. hipotesis ini harus ditolak. Dalam kes ini, nilai purata sampel berbeza dengan ketara.

DALAM statistik regresi pekali korelasi berganda ditunjukkan (Plural R) dan keazaman (R-kuadrat) antara Y dan susunan ciri faktor (yang bertepatan dengan nilai yang diperoleh sebelum ini dalam analisis korelasi)

Bahagian tengah meja (Analisis Varians) diperlukan untuk menguji kepentingan persamaan regresi.

Bahagian bawah meja - tepat

anggaran akhir bi bagi pekali regresi am bi, menguji kepentingan dan anggaran selangnya.

Anggaran vektor pekali b (lajur Kemungkinan):

Kemudian anggaran persamaan regresi mempunyai bentuk:

Adalah perlu untuk menyemak kepentingan persamaan regresi dan pekali regresi yang terhasil.

Mari kita semak kepentingan persamaan regresi pada tahap b=0.05, i.e. hipotesis H0: в1=в2=в3=…=вk=0. Untuk melakukan ini, nilai pemerhatian statistik F dikira:

Excel menunjukkan ini dalam keputusan analisis varians:

QR=527.4296; Qost=1109.8673 =>

Dalam lajur F nilai ditunjukkan Fboleh diperhatikan.

Daripada jadual taburan F atau menggunakan fungsi statistik terbina dalam FTEMUKAN untuk aras keertian b=0.05 dan bilangan darjah kebebasan pengangka n1=k=4 dan penyebut n2=n-k-1=45 kita dapati nilai kritikal bagi statistik-F sama dengan

Fcr = 2.578739184

Oleh kerana nilai pemerhatian statistik F melebihi nilai kritikalnya 8.1957 > 2.7587, hipotesis tentang kesamaan vektor pekali ditolak dengan kebarangkalian ralat 0.05. Akibatnya, sekurang-kurangnya satu elemen vektor b=(b1,b2,b3,b4)T adalah berbeza dengan ketara daripada sifar.

Mari kita semak kepentingan pekali individu bagi persamaan regresi, i.e. hipotesis .

Menguji kepentingan pekali regresi dijalankan berdasarkan statistik-t untuk aras keertian.

Nilai-nilai yang diperhatikan bagi statistik-t ditunjukkan dalam jadual keputusan dalam lajur t-statistik.

Pekali (bi)

t-statistik (tob)

persimpangan Y

Pembolehubah X5

Pembolehubah X7

Pembolehubah X10

Pembolehubah X15

Ia mesti dibandingkan dengan nilai kritikal tcr yang ditemui untuk aras keertian b=0.05 dan bilangan darjah kebebasan n=n – k - 1.

Untuk melakukan ini, kami menggunakan fungsi statistik Excel terbina dalam STUDISPOBR, dengan memasukkan ke dalam menu yang dicadangkan kebarangkalian b = 0.05 dan bilangan darjah kebebasan n = n–k-1 = 50-4-1 = 45. (Anda boleh mencari nilai tcr dari jadual statistik matematik.

Kami mendapat tcr = 2.014103359.

Bagi nilai pemerhatian bagi statistik-t adalah kurang daripada kritikal dalam nilai mutlak 2.0141>|-0.0872|, 2.0141>|0.2630|, 2.0141>|0.7300|, 2.0141>|-1.6629 |.

Akibatnya, hipotesis bahawa pekali ini sama dengan sifar tidak ditolak dengan kebarangkalian ralat 0.05, i.e. pekali yang sepadan adalah tidak ketara.

Bagi nilai statistik t yang diperhatikan adalah lebih besar nilai kritikal modulo |3.7658|>2.0141, oleh itu, hipotesis H0 ditolak, iaitu. - ketara

Kepentingan pekali regresi juga disemak oleh lajur berikut dalam jadual yang terhasil:

Kolum hlm-maksudnya menunjukkan kepentingan parameter model pada aras sempadan 5%, iaitu. jika p≤0.05, maka pekali yang sepadan dianggap signifikan, jika p>0.05, maka tidak signifikan.

Dan lajur terakhir - lebih rendah 95% Dan atas 95% Dan bawah 98% Dan 98% teratas - ini adalah anggaran selang pekali regresi dengan tahap kebolehpercayaan yang ditentukan untuk r = 0.95 (sentiasa dikeluarkan) dan r = 0.98 (dikeluarkan apabila kebolehpercayaan tambahan yang sepadan ditetapkan).

Jika lebih rendah dan had atas mempunyai tanda yang sama (sifar tidak termasuk dalam selang keyakinan), maka pekali regresi yang sepadan dianggap penting, jika tidak - tidak ketara

Seperti yang boleh dilihat daripada jadual, untuk pekali b3 nilai-p p=0.0005<0,05 и доверительные интервалы не включают ноль, т.е. по всем проверочным критериям этот коэффициент является значимым.

Menurut algoritma analisis regresi berperingkat dengan pengecualian regresi tidak ketara, pada peringkat seterusnya adalah perlu untuk mengecualikan daripada pertimbangan pembolehubah yang mempunyai pekali regresi tidak ketara.

Dalam kes apabila beberapa pekali tidak ketara dikenal pasti semasa penilaian regresi, yang pertama dikecualikan daripada persamaan regresi ialah regresi yang mana statistik t () adalah minimum dalam nilai mutlak. Menurut prinsip ini, pada peringkat seterusnya adalah perlu untuk mengecualikan pembolehubah X5, yang mempunyai pekali regresi yang tidak ketara b2

II PERINGKAT ANALISIS REGRESI.

Model ini termasuk ciri faktor X7, X10, X15, dan tidak termasuk X5.

KESIMPULAN KEPUTUSAN

Statistik regresi

Jamak R

R-segi empat

Biasa R-kuasa dua

Kesalahan biasa

Pemerhatian

Analisis varians

(bilangan darjah kebebasan n)

(jumlah sisihan kuasa dua Q)

(min segi empat sama MS=SS/n)

(Fobs = MSR/MSost)

Kepentingan F

Regresi

Kemungkinan

Kesalahan biasa

t-statistik

P-Nilai

95% teratas (bimax)

Rendah 98% (bimin)

persimpangan Y

Pembolehubah X7

Pembolehubah X10

Pembolehubah X15



Baru di tapak

>

Paling popular