Rumah Kaviti oral Pekali korelasi. Pekali korelasi berganda dan pekali penentuan

Pekali korelasi. Pekali korelasi berganda dan pekali penentuan


  1. Menilai kualiti model yang dibina. Adakah kualiti model bertambah baik berbanding model faktor tunggal? Beri penilaian impak faktor penting pada keputusan menggunakan pekali keanjalan, - dan -pekali.
Untuk menilai kualiti model berbilang yang dipilih (6), sama dengan perenggan 1.4 masalah ini, kami menggunakan pekali penentuan R- segi empat sama, sederhana ralat relatif penghampiran dan F-Kriteria nelayan.

Pekali penentuan R-kuadrat akan diambil daripada keputusan "Regression" (jadual "Statistik regresi" untuk model (6)).

Akibatnya, variasi (perubahan) dalam harga sebuah apartmen Y Menurut persamaan ini, 76.77% dijelaskan oleh variasi bandar di rantau ini X 1 , bilangan bilik di apartmen X 2 dan ruang kediaman X 4 .

Kami menggunakan data asal Y i dan sisa yang ditemui oleh alat Regresi (jadual "Output baki" untuk model (6)). Mari kita hitung ralat relatif dan cari nilai purata
.

PENARIKAN BALIK


Pemerhatian

Diramalkan Y

Lebihan makanan

Rel. ralat

1

45,95089273

-7,95089273

20,92340192

2

86,10296493

-23,90296493

38,42920407

3

94,84442678

30,15557322

24,12445858

4

84,17648426

-23,07648426

37,76838667

5

40,2537216

26,7462784

39,91981851

6

68,70572376

24,29427624

26,12287768

7

143,7464899

-25,7464899

21,81905923

8

106,0907598

25,90924022

19,62821228

9

135,357993

-42,85799303

46,33296544

10

114,4792566

-9,47925665

9,027863476

11

41,48765602

0,512343975

1,219866607

12

103,2329236

21,76707636

17,41366109

13

130,3567798

39,64322022

23,3195413

14

35,41901876

2,580981242

6,7920559

15

155,4129693

-24,91296925

19,0903979

16

84,32108188

0,678918123

0,798727204

17

98,0552279

-0,055227902

0,056355002

18

144,2104618

-16,21046182

12,66442329

19

122,8677535

-37,86775351

44,55029825

20

100,0221225

59,97787748

37,48617343

21

53,27196558

6,728034423

11,21339071

22

35,06605378

5,933946225

14,47303957

23

114,4792566

-24,47925665

27,19917406

24

113,1343153

-30,13431529

36,30640396

25

40,43190991

4,568090093

10,15131132

26

39,34427892

-0,344278918

0,882766457

27

144,4794501

-57,57945009

66,25943623

28

56,4827667

-16,4827667

41,20691675

29

95,38240332

-15,38240332

19,22800415

30

228,6988826

-1,698882564

0,748406416

31

222,8067278

12,19327221

5,188626473

32

38,81483144

1,185168555

2,962921389

33

48,36325811

18,63674189

27,81603267

34

126,6080021

-3,608002113

2,933335051

35

84,85052935

15,14947065

15,14947065

36

116,7991162

-11,79911625

11,23725357

37

84,17648426

-13,87648426

19,73895342

38

113,9412801

-31,94128011

38,95278062

39

215,494184

64,50581599

23,03779142

40

141,7795953

58,22040472

29,11020236

Purata

101,2375

22,51770962

Menggunakan lajur ralat relatif, kami mencari nilai purata =22.51% (menggunakan fungsi AVERAGE).

Perbandingan menunjukkan bahawa 22.51%>7%. Akibatnya, ketepatan model tidak memuaskan.

Dengan menggunakan F – Kriteria Fisher Mari kita semak kepentingan model secara keseluruhan. Untuk melakukan ini, kami akan menulis daripada hasil menggunakan alat "Regression" (jadual "analisis varians" untuk model (6)) F= 39,6702.

Menggunakan fungsi FRIST kita mencari nilai F cr =3.252 untuk tahap keertian α = 5%, dan bilangan darjah kebebasan k 1 = 2 , k 2 = 37 .

F> F cr, oleh itu, persamaan model (6) adalah signifikan, penggunaannya adalah wajar, pembolehubah bersandar Y diterangkan dengan baik oleh pembolehubah faktor yang termasuk dalam model (6) X 1 , X 2. Dan X 4 .

Selain itu menggunakan t –Ujian t pelajar Mari kita semak kepentingan pekali individu model.

t–Statistik untuk pekali persamaan regresi diberikan dalam keputusan alat “Regression”. Nilai berikut diperoleh untuk model yang dipilih (6):


Kemungkinan

Kesalahan biasa

t-statistik

P-Nilai

Bawah 95%

95% teratas

Bawah 95.0%

95.0% teratas

persimpangan Y

-5,643572321

12,07285417

-0,46745966

0,642988

-30,1285

18,84131

-30,1285

18,84131

X4

2,591405557

0,461440597

5,61590284

2.27E-06

1,655561

3,52725

1,655561

3,52725

X1

6,85963077

9,185748512

0,74676884

0,460053

-11,7699

25,48919

-11,7699

25,48919

X2

-1,985156991

7,795346067

-0,25465925

0,800435

-17,7949

13,82454

-17,7949

13,82454

Nilai kritikal t cr didapati untuk tahap keertian α=5% dan bilangan darjah kebebasan k=40–2–1=37 . t cr =2.026 (fungsi STUDAR).

Untuk peluang percuma α =–5.643 statistik ditakrifkan
, t cr Oleh itu, pekali bebas adalah tidak ketara dan boleh dikecualikan daripada model.

Untuk pekali regresi β 1 =6.859 statistik ditakrifkan
, β 1 tidak penting, ia dan faktor bandar serantau boleh dialih keluar daripada model.

Untuk pekali regresi β 2 =-1,985 statistik ditakrifkan
, t cr, oleh itu, pekali regresi β 2 tidak penting, ia dan faktor bilangan bilik di apartmen boleh dikecualikan daripada model.

Untuk pekali regresi β 4 =2.591 statistik ditakrifkan
, >t cr, oleh itu, pekali regresi β 4 adalah penting, ia dan faktor ruang tamu apartmen boleh dikekalkan dalam model.

Kesimpulan tentang kepentingan pekali model dibuat pada aras keertian α=5%. Melihat lajur P-nilai, kami perhatikan bahawa pekali bebas α boleh dianggap signifikan pada tahap 0.64 = 64%; pekali regresi β 1 – pada tahap 0.46 = 46%; pekali regresi β 2 – pada tahap 0.8 = 80%; dan pekali regresi β 4 – pada tahap 2.27E-06= 2.26691790951854E-06 = 0.0000002%.

Apabila pembolehubah faktor baru ditambah pada persamaan, pekali penentuan secara automatik meningkat R 2 dan berkurangan ralat purata anggaran, walaupun ini tidak selalu meningkatkan kualiti model. Oleh itu, untuk membandingkan kualiti model (3) dan model berbilang terpilih (6), kami menggunakan pekali penentuan ternormal.

Oleh itu, apabila menambah faktor "bandar wilayah" pada persamaan regresi X 1 dan faktor "bilangan bilik di apartmen" X 2 kualiti model telah merosot, yang memihak kepada faktor pengalih keluar X 1 dan X 2 daripada model.

Mari kita lakukan pengiraan selanjutnya.

Pekali keanjalan purata dalam kes model linear ditentukan oleh formula
.

Menggunakan fungsi AVERAGE kita dapati: S Y, dengan peningkatan hanya dalam faktor X 4 untuk salah seorang daripadanya sisihan piawai– meningkat sebanyak 0.914 S Y

Pekali Delta ditentukan oleh formula
.

Mari cari pekali korelasi pasangan menggunakan alat "Korelasi" pakej "Analisis Data" dalam Excel.


Y

X1

X2

X4

Y

1

X1

-0,01126

1

X2

0,751061

-0,0341

1

X4

0,874012

-0,0798

0,868524

1

Pekali penentuan ditentukan lebih awal dan bersamaan dengan 0.7677.

Mari kita hitung pekali delta:

;

Sejak Δ 1 1 Dan X 2 dipilih secara tidak betul dan mereka perlu dialih keluar daripada model. Ini bermakna mengikut persamaan model tiga faktor linear yang terhasil, perubahan dalam faktor yang terhasil Y(harga pangsapuri) adalah 104% dijelaskan oleh pengaruh faktor X 4 (kawasan kediaman apartmen), sebanyak 4% dipengaruhi oleh faktor X 2 (bilangan bilik), sebanyak 0.0859% dipengaruhi oleh faktor X 1 (bandar wilayah).

Analisis regresi ialah kaedah penyelidikan statistik yang membolehkan anda menunjukkan pergantungan parameter tertentu pada satu atau lebih pembolehubah bebas. Dalam era pra-komputer, penggunaannya agak sukar, terutamanya apabila ia melibatkan jumlah data yang besar. Hari ini, setelah mempelajari cara membina regresi dalam Excel, anda boleh menyelesaikan masalah statistik yang kompleks dalam beberapa minit sahaja. Di bawah adalah contoh khusus dari bidang ekonomi.

Jenis Regresi

Konsep ini sendiri telah diperkenalkan ke dalam matematik pada tahun 1886. Regresi berlaku:

  • linear;
  • parabola;
  • penenang;
  • eksponen;
  • hiperbola;
  • demonstratif;
  • logaritma.

Contoh 1

Mari kita pertimbangkan masalah menentukan pergantungan bilangan ahli pasukan yang berhenti pada gaji purata di 6 perusahaan perindustrian.

Tugasan. Di enam perusahaan kami menganalisis purata bulanan upah dan bilangan pekerja yang keluar kerana sesuka hati. Dalam bentuk jadual kami mempunyai:

Bilangan orang yang berhenti

Gaji

30,000 rubel

35,000 rubel

40,000 rubel

45,000 rubel

50,000 rubel

55,000 rubel

60,000 rubel

Untuk tugas menentukan kebergantungan bilangan pekerja yang berhenti kerja pada purata gaji di 6 perusahaan, model regresi mempunyai bentuk persamaan Y = a 0 + a 1 x 1 +...+a k x k, di mana x i ialah pembolehubah yang mempengaruhi, a i ialah pekali regresi, dan k ialah bilangan faktor.

Untuk masalah ini, Y ialah penunjuk berhenti pekerja, dan faktor yang mempengaruhi ialah gaji, yang kami nyatakan dengan X.

Menggunakan keupayaan pemproses hamparan Excel

Analisis regresi dalam Excel mesti didahului dengan menggunakan fungsi terbina dalam pada data jadual sedia ada. Walau bagaimanapun, untuk tujuan ini adalah lebih baik untuk menggunakan alat tambah "Pek Analisis" yang sangat berguna. Untuk mengaktifkannya anda perlu:

  • dari tab "Fail" pergi ke bahagian "Pilihan";
  • dalam tetingkap yang terbuka, pilih baris "Add-ons";
  • klik pada butang "Pergi" yang terletak di bawah, di sebelah kanan baris "Pengurusan";
  • tandai kotak di sebelah nama "Pakej analisis" dan sahkan tindakan anda dengan mengklik "Ok".

Jika semuanya dilakukan dengan betul, butang yang diperlukan akan muncul di sebelah kanan tab "Data", yang terletak di atas lembaran kerja Excel.

dalam Excel

Kini setelah kami mempunyai semua alat maya yang diperlukan untuk menjalankan pengiraan ekonometrik, kami boleh mula menyelesaikan masalah kami. Untuk ini:

  • Klik pada butang "Analisis Data";
  • dalam tetingkap yang terbuka, klik pada butang "Regression";
  • dalam tab yang muncul, masukkan julat nilai untuk Y (bilangan pekerja yang berhenti) dan untuk X (gaji mereka);
  • Kami mengesahkan tindakan kami dengan menekan butang "Ok".

Akibatnya, program akan mengisi hamparan baharu secara automatik dengan data analisis regresi. Catatan! Excel membolehkan anda menetapkan lokasi yang anda sukai secara manual untuk tujuan ini. Sebagai contoh, ini boleh menjadi helaian yang sama di mana nilai Y dan X berada, atau buku kerja baharu yang direka khusus untuk menyimpan data sedemikian.

Analisis keputusan regresi untuk R-kuadrat

Dalam Excel, data yang diperoleh semasa pemprosesan data dalam contoh yang sedang dipertimbangkan mempunyai bentuk:

Pertama sekali, anda harus memberi perhatian kepada nilai R-kuadrat. Ia mewakili pekali penentuan. Dalam contoh ini, R-square = 0.755 (75.5%), iaitu, parameter yang dikira model menerangkan hubungan antara parameter yang dipertimbangkan sebanyak 75.5%. Semakin tinggi nilai pekali penentuan, semakin sesuai model yang dipilih untuk tugas tertentu. Ia dianggap untuk menerangkan dengan betul keadaan sebenar apabila nilai R-square melebihi 0.8. Jika R-kuasa dua<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

Analisis Odds

Nombor 64.1428 menunjukkan nilai Y jika semua pembolehubah xi dalam model yang kita pertimbangkan ditetapkan semula kepada sifar. Dengan kata lain, boleh dikatakan bahawa nilai parameter yang dianalisis juga dipengaruhi oleh faktor lain yang tidak diterangkan dalam model tertentu.

Pekali seterusnya -0.16285, terletak dalam sel B18, menunjukkan berat pengaruh pembolehubah X pada Y. Ini bermakna purata gaji bulanan pekerja dalam model yang dipertimbangkan mempengaruhi bilangan berhenti dengan berat -0.16285, i.e. tahap pengaruhnya sangat kecil. Tanda "-" menunjukkan bahawa pekali adalah negatif. Ini jelas, kerana semua orang tahu bahawa semakin tinggi gaji di perusahaan, semakin sedikit orang yang menyatakan keinginan untuk menamatkan kontrak pekerjaan atau berhenti.

Regresi berganda

Istilah ini merujuk kepada persamaan hubungan dengan beberapa pembolehubah bebas dalam bentuk:

y=f(x 1 +x 2 +…x m) + ε, dengan y ialah ciri paduan (pembolehubah bersandar), dan x 1, x 2,…x m ialah ciri faktor (pembolehubah bebas).

Anggaran Parameter

Untuk regresi berganda (MR), ia dijalankan menggunakan kaedah petak terkecil(MNC). Untuk persamaan linear dalam bentuk Y = a + b 1 x 1 +…+b m x m + ε kita membina sistem persamaan normal (lihat di bawah)

Untuk memahami prinsip kaedah, pertimbangkan kes dua faktor. Kemudian kita mempunyai situasi yang diterangkan oleh formula

Dari sini kita dapat:

di mana σ ialah varians ciri sepadan yang ditunjukkan dalam indeks.

OLS boleh digunakan pada persamaan MR pada skala piawai. Dalam kes ini, kita mendapat persamaan:

di mana t y, t x 1, … t xm ialah pembolehubah piawai, yang mana nilai purata adalah sama dengan 0; β i ialah pekali regresi piawai, dan sisihan piawai ialah 1.

Sila ambil perhatian bahawa semua β i masuk dalam kes ini dinyatakan sebagai piawai dan berpusat, oleh itu perbandingan mereka antara satu sama lain dianggap betul dan boleh diterima. Di samping itu, adalah kebiasaan untuk menyaring faktor dengan membuang faktor yang mempunyai nilai βi terendah.

Masalah Menggunakan Persamaan Regresi Linear

Katakan kita mempunyai jadual dinamik harga untuk produk tertentu N sepanjang 8 bulan yang lalu. Ia adalah perlu untuk membuat keputusan mengenai kesesuaian untuk membeli satu kumpulan pada harga 1850 rubel/t.

nombor bulan

nama bulan

harga produk N

1750 rubel setiap tan

1755 rubel setiap tan

1767 rubel setiap tan

1760 rubel setiap tan

1770 rubel setiap tan

1790 rubel setiap tan

1810 rubel setiap tan

1840 rubel setiap tan

Untuk menyelesaikan masalah ini dalam pemproses hamparan Excel, anda perlu menggunakan alat "Analisis Data", yang telah diketahui daripada contoh yang dibentangkan di atas. Seterusnya, pilih bahagian "Regression" dan tetapkan parameter. Perlu diingat bahawa dalam medan "Selang input Y" julat nilai mesti dimasukkan untuk pembolehubah bersandar (dalam kes ini, harga barang dalam bulan tertentu dalam setahun), dan dalam "Selang input X" - untuk pembolehubah bebas (nombor bulan). Sahkan tindakan dengan mengklik "Ok". Pada helaian baharu (jika dinyatakan demikian) kami memperoleh data untuk regresi.

Menggunakannya, kami membina persamaan linear dalam bentuk y=ax+b, di mana parameter a dan b ialah pekali garisan dengan nama nombor bulan dan pekali dan garisan "Y-simpangan" dari helaian dengan keputusan analisis regresi. Oleh itu, persamaan regresi linear (LR) untuk tugasan 3 ditulis sebagai:

Harga produk N = 11.714* nombor bulan + 1727.54.

atau dalam tatatanda algebra

y = 11.714 x + 1727.54

Analisis keputusan

Untuk memutuskan sama ada persamaan regresi linear yang terhasil adalah mencukupi, pekali korelasi berganda (MCC) dan penentuan digunakan, serta ujian Fisher dan ujian t Pelajar. Dalam hamparan Excel dengan hasil regresi, ia dipanggil berbilang R, R-kuadrat, F-statistik dan t-statistik, masing-masing.

KMC R memungkinkan untuk menilai keakraban hubungan kebarangkalian antara pembolehubah bebas dan bersandar. Nilainya yang tinggi menunjukkan hubungan yang agak kuat antara pembolehubah "Bilangan bulan" dan "Harga produk N dalam rubel setiap 1 tan". Walau bagaimanapun, sifat hubungan ini masih tidak diketahui.

Kuasa dua pekali penentuan R2 (RI) ialah ciri berangka perkadaran jumlah serakan dan menunjukkan serakan bahagian mana data eksperimen, i.e. nilai pembolehubah bersandar sepadan dengan persamaan regresi linear. Dalam masalah yang sedang dipertimbangkan, nilai ini bersamaan dengan 84.8%, iaitu, data statistik diterangkan dengan tahap ketepatan yang tinggi oleh SD yang terhasil.

F-statistik, juga dipanggil ujian Fisher, digunakan untuk menilai kepentingan hubungan linear, menyangkal atau mengesahkan hipotesis kewujudannya.

(Ujian pelajar) membantu menilai kepentingan pekali dengan istilah yang tidak diketahui atau bebas bagi hubungan linear. Jika nilai ujian-t > t cr, maka hipotesis tentang ketidaksignifikan istilah bebas persamaan linear ditolak.

Dalam masalah yang sedang dipertimbangkan untuk istilah bebas, menggunakan alat Excel, didapati bahawa t = 169.20903, dan p = 2.89E-12, iaitu, kita mempunyai kebarangkalian sifar bahawa hipotesis yang betul tentang ketidaksignifikan istilah bebas akan ditolak . Untuk pekali untuk t=5.79405 yang tidak diketahui, dan p=0.001158. Dalam erti kata lain, kebarangkalian bahawa hipotesis yang betul tentang tidak signifikan pekali untuk yang tidak diketahui akan ditolak ialah 0.12%.

Oleh itu, boleh dikatakan bahawa persamaan regresi linear yang terhasil adalah memadai.

Masalah kebolehlaksanaan pembelian blok saham

Regresi berbilang dalam Excel dilakukan menggunakan alat Analisis Data yang sama. Mari kita pertimbangkan masalah aplikasi tertentu.

Pengurusan syarikat NNN mesti membuat keputusan mengenai kesesuaian untuk membeli 20% kepentingan dalam MMM JSC. Kos pakej (SP) ialah 70 juta dolar AS. Pakar NNN telah mengumpul data mengenai transaksi yang serupa. Ia telah memutuskan untuk menilai nilai blok saham mengikut parameter tersebut, dinyatakan dalam berjuta-juta dolar AS, seperti:

  • akaun belum bayar (VK);
  • volum pusing ganti tahunan (VO);
  • akaun belum terima (VD);
  • kos aset tetap (COF).

Di samping itu, parameter tunggakan gaji perusahaan (V3 P) dalam ribuan dolar AS digunakan.

Penyelesaian menggunakan pemproses hamparan Excel

Pertama sekali, anda perlu membuat jadual data sumber. Ia kelihatan seperti ini:

  • panggil tetingkap "Analisis Data";
  • pilih bahagian "Regression";
  • Dalam kotak "Selang input Y", masukkan julat nilai pembolehubah bersandar dari lajur G;
  • Klik pada ikon dengan anak panah merah di sebelah kanan tetingkap "Selang input X" dan serlahkan julat semua nilai dari lajur B, C, D, F pada helaian.

Tandai item "Lembaran kerja baharu" dan klik "Ok".

Dapatkan analisis regresi untuk masalah tertentu.

Kajian keputusan dan kesimpulan

Kami "mengumpul" persamaan regresi daripada data bulat yang dibentangkan di atas pada hamparan Excel:

SP = 0.103*SOF + 0.541*VO - 0.031*VK +0.405*VD +0.691*VZP - 265.844.

Dalam bentuk matematik yang lebih biasa, ia boleh ditulis sebagai:

y = 0.103*x1 + 0.541*x2 - 0.031*x3 +0.405*x4 +0.691*x5 - 265.844

Data untuk MMM JSC dibentangkan dalam jadual:

Menggantikannya ke dalam persamaan regresi, kita mendapat angka 64.72 juta dolar AS. Ini bermakna bahawa saham MMM JSC tidak berbaloi untuk dibeli, kerana nilainya sebanyak 70 juta dolar AS agak melambung.

Seperti yang anda lihat, penggunaan hamparan Excel dan persamaan regresi memungkinkan untuk membuat keputusan termaklum mengenai kebolehlaksanaan transaksi yang sangat spesifik.

Sekarang anda tahu apa itu regresi. Contoh Excel yang dibincangkan di atas akan membantu anda menyelesaikan masalah praktikal dalam bidang ekonometrik.

Apabila mengkaji fenomena kompleks, perlu mengambil kira lebih daripada dua faktor rawak. Pemahaman yang betul tentang sifat hubungan antara faktor-faktor ini hanya boleh diperoleh jika semua faktor rawak yang sedang dipertimbangkan diperiksa sekaligus. Kajian bersama tiga atau lebih faktor rawak akan membolehkan penyelidik mewujudkan lebih atau kurang andaian munasabah tentang kebergantungan sebab akibat antara fenomena yang dikaji. Bentuk mudah hubungan berbilang ialah hubungan linear antara tiga ciri. Faktor rawak ditandakan sebagai X 1 , X 2 dan X 3. Pekali korelasi berpasangan antara X 1 dan X 2 dilambangkan sebagai r 12, masing-masing antara X 1 dan X 3 - r 12, antara X 2 dan X 3 - r 23. Sebagai ukuran keakraban hubungan linear antara tiga ciri, pekali korelasi berganda digunakan, dilambangkan R 1 ּ 23, R 2 ּ 13 , R 3 ּ 12 dan pekali korelasi separa, dilambangkan r 12.3 , r 13.2 , r 23.1 .

Pekali korelasi berganda R 1.23 daripada tiga faktor adalah penunjuk keakraban hubungan linear antara salah satu faktor (indeks sebelum titik) dan gabungan dua faktor lain (indeks selepas titik).

Nilai pekali R sentiasa berada dalam julat dari 0 hingga 1. Apabila R menghampiri satu, tahap hubungan linear antara ketiga-tiga ciri meningkat.

Antara pekali korelasi berganda, cth. R 2 ּ 13 , dan dua pasangan pekali korelasi r 12 dan r 23 terdapat hubungan: setiap pekali berpasangan tidak boleh melebihi nilai mutlak R 2 ּ 13 .

Formula untuk mengira pekali korelasi berbilang apabila nilai yang diketahui pasangan korelasi pekali r 12, r 13 dan r 23 mempunyai bentuk:

Pekali korelasi berganda kuasa dua R 2 dipanggil pekali penentuan berbilang. Ia menunjukkan bahagian variasi dalam pembolehubah bersandar di bawah pengaruh faktor yang dikaji.

Kepentingan pelbagai korelasi dinilai oleh F-kriteria:

n – saiz sampel; k – bilangan faktor. Dalam kes kita k = 3.

hipotesis nol tentang kesamaan pekali korelasi berganda dalam populasi kepada sifar ( h o:r=0) diterima jika f f<f t, dan ditolak jika
f f ³ f T.

nilai teori f-kriteria ditentukan untuk v 1 = k- 1 dan v 2 = n - k darjah kebebasan dan tahap keertian yang diterima a (Lampiran 1).

Contoh pengiraan pekali korelasi berganda. Apabila mengkaji hubungan antara faktor, pekali korelasi pasangan diperolehi ( n =15): r 12 ==0.6; g 13 = 0.3; r 23 = - 0,2.

Ia adalah perlu untuk mengetahui pergantungan ciri tersebut X 2 daripada tanda X 1 dan X 3, iaitu kirakan pekali korelasi berganda:

Nilai jadual F-kriteria dengan n 1 = 2 dan n 2 = 15 – 3 = 12 darjah kebebasan dengan a = 0.05 F 0.05 = 3.89 dan pada a = 0.01 F 0,01 = 6,93.

Oleh itu, hubungan antara tanda R 2.13 = 0.74 adalah signifikan pada
1% aras keertian F f > F 0,01 .

Berdasarkan pekali penentuan berbilang R 2 = (0.74) 2 = 0.55, variasi sifat X 2 ialah 55% dikaitkan dengan kesan faktor yang dikaji, dan 45% daripada variasi (1-R 2) tidak dapat dijelaskan oleh pengaruh pembolehubah ini.

Persendirian korelasi linear

Pekali korelasi separa ialah penunjuk yang mengukur darjah konjugasi dua ciri.

Statistik matematik membolehkan anda mewujudkan korelasi antara dua ciri dengan nilai malar ketiga, tanpa menjalankan eksperimen khas, tetapi menggunakan pekali korelasi berpasangan r 12 , r 13 , r 23 .

Pekali korelasi separa dikira menggunakan formula:

Nombor sebelum titik menunjukkan ciri perhubungan yang sedang dikaji, dan nombor selepas titik menunjukkan pengaruh ciri mana yang dikecualikan (dihapuskan). Kriteria ralat dan kepentingan untuk korelasi separa ditentukan menggunakan formula yang sama seperti korelasi pasangan:

.

Nilai teori t- kriteria ditentukan untuk v = n– 2 darjah kebebasan dan tahap keertian yang diterima a (Lampiran 1).

Hipotesis nol bahawa pekali korelasi separa dalam populasi adalah sama dengan sifar ( H o: r= 0) diterima jika t f< t t, dan ditolak jika
t f ³ t T.

Pekali separa boleh mengambil nilai antara -1 dan +1. Persendirian pekali penentuan didapati dengan mengkuadratkan pekali korelasi separa:

D 12.3 = r 2 12ּ3 ; d 13.2 = r 2 13ּ2 ; d 23ּ1 = r 2 23ּ1 .

Menentukan tahap pengaruh separa faktor individu pada sifat berkesan sambil mengecualikan (menghapuskan) kaitannya dengan ciri lain yang memesongkan korelasi ini selalunya sangat menarik. Kadang-kadang ia berlaku bahawa dengan nilai tetap ciri yang dihapuskan, adalah mustahil untuk melihat pengaruh statistiknya terhadap kebolehubahan ciri lain. Untuk memahami teknik pengiraan pekali korelasi separa, pertimbangkan satu contoh. Terdapat tiga pilihan X, Y Dan Z. Untuk saiz sampel n= 180 pekali korelasi berpasangan ditentukan

r xy = 0,799; r xz = 0,57; r yz = 0,507.

Mari kita tentukan pekali korelasi separa:

Pekali korelasi separa antara parameter X Dan Y Z (r xyּz = 0.720) menunjukkan bahawa hanya sebahagian kecil daripada hubungan antara ciri-ciri ini dalam korelasi keseluruhan ( r xy= 0.799) adalah disebabkan oleh pengaruh ciri ketiga ( Z). Kesimpulan yang sama mesti dibuat mengenai pekali korelasi separa antara parameter X dan parameter Z dengan nilai parameter tetap Y (r X zּу = 0.318 dan r xz= 0.57). Terhadap, pekali separa korelasi antara parameter Y Dan Z dengan nilai parameter tetap X r yz ּ x= 0.105 adalah berbeza dengan ketara daripada pekali am korelasi r y z = 0.507. Daripada ini adalah jelas bahawa jika anda memilih objek dengan nilai parameter yang sama X, kemudian hubungan antara tanda Y Dan Z mereka akan mempunyai yang sangat lemah, kerana sebahagian besar daripada hubungan ini adalah disebabkan oleh variasi dalam parameter X.

Di bawah beberapa keadaan, pekali korelasi separa mungkin bertentangan dalam tanda dengan pasangan satu.

Sebagai contoh, apabila mengkaji hubungan antara ciri X, Y Dan Z- pekali korelasi berpasangan diperolehi (dengan n = 100): r xy = 0.6; r X z= 0,9;
r y z = 0,4.

Pekali korelasi separa tidak termasuk pengaruh ciri ketiga:

Daripada contoh itu jelas bahawa nilai pekali pasangan dan pekali korelasi separa berbeza dalam tanda.

Kaedah korelasi separa memungkinkan untuk mengira pekali korelasi separa tertib kedua. Pekali ini menunjukkan hubungan antara ciri pertama dan kedua dengan nilai malar ketiga dan keempat. Penentuan pekali separa tertib kedua adalah berdasarkan pekali separa tertib pertama menggunakan formula:

di mana r 12 . 4 , r 13 ּ4, r 23 ּ4 - pekali separa, nilainya ditentukan oleh formula pekali separa, menggunakan pekali korelasi pasangan r 12 , r 13 , r 14 , r 23 , r 24 , r 34 .

7.1. Analisis Regresi Linear terdiri daripada memasang graf pada set pemerhatian menggunakan kaedah kuasa dua terkecil. Analisis regresi membolehkan kita mewujudkan hubungan berfungsi antara beberapa pembolehubah rawak Y dan ada yang mempengaruhi Y nilai X. Pergantungan ini dipanggil persamaan regresi. Ada yang mudah ( y=m*x+b) dan jamak ( y=m 1 *x 1 +m 2 *x 2 +... + m k *x k +b) regresi jenis linear dan bukan linear.
Untuk menilai tahap hubungan antara kuantiti, ia digunakan Pekali korelasi berbilang Pearson R(nisbah korelasi), yang boleh mengambil nilai dari 0 hingga 1. R=0 jika tiada hubungan antara kuantiti, dan R=1 jika terdapat hubungan fungsi antara kuantiti. Dalam kebanyakan kes, R mengambil nilai perantaraan daripada 0 hingga 1. Nilainya R 2 dipanggil pekali penentuan.
Tugas membina pergantungan regresi adalah untuk mencari vektor pekali M model regresi linear berganda, di mana pekali R mengambil nilai maksimum.
Untuk menilai kepentingan R berlaku Ujian F Fisher, dikira dengan formula:

di mana n– bilangan eksperimen; k– bilangan pekali model. Jika F melebihi beberapa nilai kritikal untuk data n Dan k dan diterima kebarangkalian keyakinan, kemudian nilai R dianggap penting.

7.2. alat Regresi daripada Pakej analisis membolehkan anda mengira data berikut:

· kemungkinan fungsi linear regresi– kaedah kuasa dua terkecil; jenis fungsi regresi ditentukan oleh struktur data sumber;

· pekali penentuan dan kuantiti yang berkaitan(meja Statistik regresi);

· jadual varians dan statistik kriteria untuk menguji kepentingan regresi(meja Analisis varians );

· sisihan piawai dan ciri statistiknya yang lain untuk setiap pekali regresi, membolehkan anda menyemak kepentingan pekali ini dan membina untuknya selang keyakinan;

· nilai fungsi regresi dan sisa– perbezaan antara nilai awal pembolehubah Y dan nilai pengiraan fungsi regresi (jadual Pengeluaran baki);

· kebarangkalian sepadan dengan nilai pembolehubah Y yang dipesan dalam tertib menaik(meja Keluaran kebarangkalian).

7.3. Hubungi alat pemilihan melalui Data > Analisis Data > Regresi.

7.4. Di padang Selang input Y masukkan alamat julat yang mengandungi nilai pembolehubah bersandar Y. Julat mesti terdiri daripada satu lajur.
Di padang Selang input X masukkan alamat julat yang mengandungi nilai pembolehubah X. Julat mesti terdiri daripada satu atau lebih lajur, tetapi tidak lebih daripada 16 lajur. Jika dinyatakan dalam medan Selang input Y Dan Selang input X julat termasuk pengepala lajur, maka anda perlu menyemak kotak pilihan Tag– pengepala ini akan digunakan dalam jadual output yang dihasilkan oleh alat Regresi.
Kotak semak pilihan Malar - sifar harus diwujudkan jika persamaan regresi mempunyai pemalar b dipaksa sama dengan sifar.
Pilihan Tahap kebolehpercayaan ditetapkan apabila perlu untuk membina selang keyakinan untuk pekali regresi dengan tahap keyakinan selain daripada 0.95, yang digunakan secara lalai. Selepas menyemak kotak pilihan Tahap kebolehpercayaan Medan input menjadi tersedia di mana nilai tahap keyakinan baharu dimasukkan.
Di kawasan Lebihan makanan Terdapat empat pilihan: Lebihan makanan, Baki piawai, Carta imbangan Dan Jadual pemilihan. Jika sekurang-kurangnya satu daripadanya dipasang, jadual akan muncul dalam hasil output Pengeluaran baki, yang akan memaparkan nilai fungsi regresi dan sisa - perbezaan antara nilai awal pembolehubah Y dan nilai pengiraan fungsi regresi. Di kawasan Kebarangkalian biasa Terdapat satu pilihan – ; pemasangannya menjana jadual dalam hasil output Keluaran kebarangkalian dan membawa kepada pembinaan graf yang sepadan.


7.5. Tetapkan parameter mengikut gambar. Pastikan nilai Y ialah pembolehubah pertama (termasuk sel dengan nama) dan nilai X ialah dua pembolehubah lain (termasuk sel dengan nama). klik okey.

7.6. Dalam jadual Statistik regresi Data berikut disediakan.

Jamak R– punca pekali penentuan R 2 diberikan dalam baris seterusnya. Nama lain untuk penunjuk ini ialah indeks korelasi, atau pekali korelasi berganda.

R-segi empat– pekali penentuan R 2 ; dikira sebagai nisbah jumlah regresi kuasa dua(sel C12) kepada jumlah kuasa dua(sel C14).

Biasa R-kuasa dua dikira dengan formula

di mana n ialah bilangan nilai pembolehubah Y, k ialah bilangan lajur dalam selang input pembolehubah X.

Kesalahan biasa– punca varians baki (sel D13).

Pemerhatian– bilangan nilai pembolehubah Y.

7.7. DALAM Jadual penyebaran dalam lajur SS hasil tambah kuasa dua diberikan dalam lajur df– bilangan darjah kebebasan. dalam lajur CIK– penyebaran. Dalam barisan Regresi dalam lajur f Nilai statistik kriteria dikira untuk menguji kepentingan regresi. Nilai ini dikira sebagai nisbah varians regresi kepada varians baki (sel D12 dan D13). Dalam lajur Kepentingan F kebarangkalian nilai yang diperolehi bagi statistik kriteria dikira. Jika kebarangkalian ini kurang daripada, sebagai contoh, 0.05 (tahap keertian yang diberikan), maka hipotesis tentang ketidaksignifikan regresi (iaitu, hipotesis bahawa semua pekali fungsi regresi adalah sama dengan sifar) ditolak dan regresi adalah dianggap penting. Dalam contoh ini, regresi tidak penting.

7.8. Dalam jadual berikut, dalam lajur Kemungkinan, nilai pengiraan pekali fungsi regresi ditulis, manakala dalam baris persimpangan Y nilai istilah bebas ditulis b. Dalam lajur Kesalahan biasa Sisihan piawai pekali dikira.
Dalam lajur t-statistik Nisbah nilai pekali kepada sisihan piawainya direkodkan. Ini adalah nilai-nilai statistik kriteria untuk menguji hipotesis tentang kepentingan pekali regresi.
Dalam lajur P-Nilai aras keertian yang sepadan dengan nilai statistik kriteria dikira. Jika aras keertian yang dikira adalah kurang daripada aras keertian yang ditentukan (contohnya, 0.05). maka hipotesis bahawa pekali berbeza dengan ketara daripada sifar diterima; jika tidak, hipotesis bahawa pekali berbeza secara tidak ketara daripada sifar diterima. Dalam contoh ini, hanya pekali b berbeza dengan ketara daripada sifar, selebihnya - tidak ketara.
Dalam lajur Bawah 95% Dan 95% teratas sempadan selang keyakinan dengan tahap keyakinan 0.95 diberikan. Sempadan ini dikira menggunakan formula
Rendah 95% = Pekali - Ralat Piawai * t α;
Atas 95% = Pekali + Ralat Piawai * t α.
Di sini t α- kuantiti pesanan α Taburan t pelajar dengan (n-k-1) darjah kebebasan. Dalam kes ini α = 0.95. Sempadan selang keyakinan dalam lajur dikira dengan cara yang sama Bawah 90.0% Dan 90.0% teratas.

7.9. Pertimbangkan jadual Pengeluaran baki daripada hasil keluaran. Jadual ini muncul dalam hasil output hanya apabila sekurang-kurangnya satu pilihan dalam kawasan itu ditetapkan Lebihan makanan kotak dialog Regresi.

Dalam lajur Pemerhatian nombor siri nilai pembolehubah diberikan Y.
Dalam lajur Diramalkan Y nilai-nilai fungsi regresi y i = f(x i) dikira untuk nilai-nilai pembolehubah tersebut X, yang sepadan dengan nombor siri i dalam lajur Pemerhatian.
Dalam lajur Lebihan makanan mengandungi perbezaan (sisa) ε i =Y-y i, dan lajur Baki piawai– sisa ternormal, yang dikira sebagai nisbah ε i / s ε. dengan s ε ialah sisihan piawai bagi baki. Kuasa dua nilai s ε dikira menggunakan formula

di manakah purata baki. Nilai boleh dikira sebagai nisbah dua nilai daripada jadual serakan: jumlah sisa kuasa dua (sel C13) dan darjah kebebasan dari baris Jumlah(sel B14).

7.10. Mengikut nilai jadual Pengeluaran baki dua jenis graf dibina: carta baki Dan jadual pemilihan(jika pilihan yang sesuai ditetapkan dalam kawasan Lebihan makanan kotak dialog Regresi). Ia dibina untuk setiap komponen pembolehubah X secara berasingan.

hidup carta imbangan baki dipaparkan, i.e. perbezaan antara nilai asal Y dan dikira daripada fungsi regresi bagi setiap nilai komponen pembolehubah X.

hidup jadual pemilihan memaparkan kedua-dua nilai Y asal dan nilai fungsi regresi yang dikira untuk setiap nilai komponen pembolehubah X.

7.11. Jadual terakhir hasil output ialah jadual Keluaran kebarangkalian. Ia muncul jika dalam kotak dialog Regresi pilihan dipasang Plot kebarangkalian biasa.
Nilai lajur Persentil dikira seperti berikut. Langkah dikira h = (1/n)*100%, nilai pertama ialah h/2, yang terakhir adalah sama 100-j/2. Bermula dari nilai kedua, setiap nilai berikutnya adalah sama dengan yang sebelumnya, yang mana satu langkah ditambah h.
Dalam lajur Y nilai pembolehubah diberikan Y, diisih mengikut tertib menaik. Berdasarkan data dalam jadual ini, yang dipanggil jadual taburan normal . Ia membolehkan anda menilai secara visual tahap kelinearan hubungan antara pembolehubah X Dan Y.


8. D analisis varians

8.1. Pakej analisis membenarkan tiga jenis analisis varians. Pemilihan instrumen tertentu ditentukan oleh bilangan faktor dan bilangan sampel dalam set data yang dikaji.
digunakan untuk menguji hipotesis bahawa min dua atau lebih sampel kepunyaan sampel yang sama adalah serupa penduduk.
ANOVA dua hala dengan ulangan adalah pilihan yang lebih kompleks analisis univariate, termasuk lebih daripada satu sampel untuk setiap kumpulan data.
ANOVA dua hala tanpa ulangan ialah analisis varians dua hala yang tidak termasuk lebih daripada satu sampel bagi setiap kumpulan. Ia digunakan untuk menguji hipotesis bahawa min dua atau lebih sampel adalah sama (sampel tergolong dalam populasi yang sama).

8.2. ANOVA sehala

8.2.1. Mari sediakan data untuk analisis. Buat helaian baharu dan salin lajur padanya A, B, C, D. Keluarkan dua baris pertama. Data yang disediakan boleh digunakan untuk menjalankan Analisis varians sehala.

8.2.2. Hubungi alat pemilihan melalui Data > Analisis Data > ANOVA Sehala. Isi mengikut gambar. klik okey.

8.2.3. Pertimbangkan jadual Keputusan: Semak- bilangan ulangan, Jumlah– jumlah nilai penunjuk mengikut baris, Penyerakan– varians separa penunjuk.

8.2.4. Jadual Analisis varians: lajur pertama Sumber Variasi mengandungi nama penyebaran, SS– jumlah sisihan kuasa dua, df- darjah kebebasan, CIK– persegi purata, Ujian-F taburan F sebenar. P-nilai– kebarangkalian bahawa varians yang dihasilkan semula oleh persamaan adalah sama dengan varians baki. Ia menetapkan kebarangkalian bahawa penentuan kuantitatif yang diperolehi hubungan antara faktor dan hasilnya boleh dianggap rawak. F-kritikal ialah nilai F teori, yang kemudiannya dibandingkan dengan F sebenar.

8.2.5. Hipotesis nol kesaksamaan jangkaan matematik daripada semua sampel diterima jika ketaksamaan Ujian-F < F-kritikal. hipotesis ini harus ditolak. Dalam kes ini, nilai purata sampel berbeza dengan ketara.

Pembinaan regresi linear, penilaian parameternya dan kepentingannya boleh dilakukan dengan lebih cepat apabila menggunakan pakej Analisis Excel(Regression). Mari kita pertimbangkan tafsiran keputusan yang diperoleh dalam kes am (k pembolehubah penerangan) mengikut contoh 3.6.

Dalam jadual statistik regresi nilai berikut diberikan:

Pelbagai R – pekali korelasi berbilang;

R- segi empat sama– pekali penentuan R 2 ;

Dinormalisasi R - segi empat sama– diselaraskan R 2 diselaraskan untuk bilangan darjah kebebasan;

Kesalahan biasa– ralat piawai regresi S;

Pemerhatian – bilangan pemerhatian n.

Dalam jadual Analisis varians diberikan:

1. Lajur df - bilangan darjah kebebasan yang sama dengan

untuk rentetan Regresi df = k;

untuk rentetan Bakidf = nk – 1;

untuk rentetan Jumlahdf = n– 1.

2. Lajur SS – jumlah sisihan kuasa dua sama dengan

untuk rentetan Regresi ;

untuk rentetan Baki ;

untuk rentetan Jumlah .

3. Lajur CIK varians ditentukan oleh formula CIK = SS/df:

untuk rentetan Regresi– penyebaran faktor;

untuk rentetan Baki– varians sisa.

4. Lajur F – nilai yang dikira F-kriteria dikira menggunakan formula

F = CIK(regresi)/ CIK(baki).

5. Lajur Kepentingan F – nilai aras keertian yang sepadan dengan yang dikira F-statistik .

Kepentingan F= FDIST( F- statistik, df(regresi), df(baki)).

Jika kepentingan F < стандартного уровня значимости, то R 2 adalah signifikan secara statistik.

Kemungkinan Kesalahan biasa t-statistik P-nilai Bawah 95% 95% teratas
Y 65,92 11,74 5,61 0,00080 38,16 93,68
X 0,107 0,014 7,32 0,00016 0,0728 0,142

Jadual ini menunjukkan:

1. Kemungkinan– nilai pekali a, b.

2. Ralat piawai– ralat piawai pekali regresi S a, Sb.



3. t- perangkaan– nilai yang dikira t -kriteria yang dikira dengan formula:

t-statistik = Pekali/Ralat piawai.

4.R-nilai (kepentingan t) ialah nilai aras keertian yang sepadan dengan yang dikira t- perangkaan.

R-nilai = STUDIDIST(t-statistik, df(baki)).

Jika R-maksudnya< стандартного уровня значимости, то соответствующий коэффициент статистически значим.

5. 95% Bawah dan 95% Teratas– lebih rendah dan had atas 95% selang keyakinan untuk pekali persamaan regresi linear teori.

PENARIKAN BALIK
Pemerhatian Diramalkan y Sisa e
72,70 -29,70
82,91 -20,91
94,53 -4,53
105,72 5,27
117,56 12,44
129,70 19,29
144,22 20,77
166,49 24,50
268,13 -27,13

Dalam jadual PENARIKAN BALIK ditunjukkan:

dalam lajur Pemerhatian– nombor pemerhatian;

dalam lajur Diramalkan y – nilai dikira pembolehubah bersandar;

dalam lajur Lebihan makanan e – perbezaan antara nilai yang diperhatikan dan dikira bagi pembolehubah bersandar.

Contoh 3.6. Terdapat data (unit konvensional) mengenai kos makanan y dan pendapatan per kapita x untuk sembilan kumpulan keluarga:

x
y

Menggunakan hasil pakej analisis Excel (Regression), kami akan menganalisis pergantungan kos makanan terhadap pendapatan per kapita.

Keputusan analisis regresi biasanya ditulis dalam bentuk:

di mana ralat piawai bagi pekali regresi ditunjukkan dalam kurungan.

Pekali regresi A = 65,92 dan b= 0.107. Arah komunikasi antara y Dan x menentukan tanda pekali regresi b= 0.107, i.e. perkaitan adalah langsung dan positif. Pekali b= 0.107 menunjukkan bahawa dengan peningkatan dalam pendapatan per kapita sebanyak 1 konvensional. unit kos makanan meningkat sebanyak 0.107 unit konvensional. unit

Marilah kita menilai kepentingan pekali model yang terhasil. Kepentingan pekali ( a, b) disemak oleh t-ujian:

P-nilai ( a) = 0,00080 < 0,01 < 0,05

P-nilai ( b) = 0,00016 < 0,01 < 0,05,

oleh itu, pekali ( a, b) adalah signifikan pada aras 1%, dan lebih-lebih lagi pada aras signifikan 5%. Oleh itu, pekali regresi adalah signifikan dan model adalah memadai dengan data asal.

Keputusan anggaran regresi adalah serasi bukan sahaja dengan nilai yang diperolehi bagi pekali regresi, tetapi juga dengan set tertentu (selang keyakinan). Dengan kebarangkalian 95%, selang keyakinan bagi pekali adalah (38.16 – 93.68) untuk a dan (0.0728 – 0.142) untuk b.

Kualiti model dinilai oleh pekali penentuan R 2 .

Magnitud R 2 = 0.884 bermakna faktor pendapatan per kapita boleh menjelaskan 88.4% daripada variasi (scatter) dalam perbelanjaan makanan.

Kepentingan R 2 disemak oleh F- ujian: kepentingan F = 0,00016 < 0,01 < 0,05, следовательно, R 2 adalah signifikan pada tahap 1%, dan lebih-lebih lagi pada tahap keertian 5%.

Dalam kes regresi linear berpasangan, pekali korelasi boleh ditakrifkan sebagai . Nilai pekali korelasi yang diperoleh menunjukkan bahawa hubungan antara kos makanan dengan pendapatan per kapita adalah sangat rapat.



Baru di tapak

>

Paling popular