Rumah Lidah berlapis Koefisien korelasi digunakan untuk menguji signifikansi statistik. Uji: Menilai signifikansi koefisien regresi dan korelasi menggunakan uji f Student

Koefisien korelasi digunakan untuk menguji signifikansi statistik. Uji: Menilai signifikansi koefisien regresi dan korelasi menggunakan uji f Student

Sebagaimana telah berulang kali dikemukakan, untuk menarik kesimpulan statistik tentang ada tidaknya korelasi antar variabel yang diteliti, perlu dilakukan pengecekan signifikansi koefisien korelasi sampel. Karena keandalan karakteristik statistik, termasuk koefisien korelasi, bergantung pada ukuran sampel, mungkin timbul situasi ketika nilai koefisien korelasi sepenuhnya ditentukan oleh fluktuasi acak dalam sampel yang menjadi dasar penghitungannya. . Jika terdapat hubungan yang signifikan antar variabel, maka koefisien korelasinya harus berbeda signifikan dari nol. Jika tidak ada korelasi antar variabel yang diteliti, maka koefisien korelasi populasi sama dengan nol. Dalam penelitian praktis, biasanya didasarkan pada observasi sampel. Seperti karakteristik statistik lainnya, koefisien korelasi sampel adalah variabel acak, yaitu nilainya tersebar secara acak di sekitar parameter populasi dengan nama yang sama (nilai sebenarnya dari koefisien korelasi). Dengan tidak adanya korelasi antar variabel kamu dan x koefisien korelasi dalam populasi adalah nol. Namun karena sifat hamburan yang acak, situasi pada dasarnya mungkin terjadi ketika beberapa koefisien korelasi yang dihitung dari sampel dari populasi tertentu akan berbeda dari nol.

Dapatkah perbedaan yang diamati disebabkan oleh fluktuasi acak dalam sampel, atau apakah perbedaan tersebut mencerminkan perubahan signifikan dalam kondisi di mana hubungan antar variabel terbentuk? Jika nilai koefisien korelasi sampel masuk ke dalam zona pencar karena sifat acak dari indikator itu sendiri, maka ini bukan bukti tidak adanya hubungan. Yang paling bisa dikatakan adalah bahwa data observasi tidak menampik tidak adanya hubungan antar variabel. Tetapi jika nilai koefisien korelasi sampel berada di luar zona hamburan tersebut, maka disimpulkan bahwa nilai tersebut berbeda secara signifikan dari nol, dan kita dapat berasumsi bahwa antar variabel kamu dan x ada hubungan yang signifikan secara statistik. Kriteria yang digunakan untuk menyelesaikan masalah ini, berdasarkan distribusi berbagai statistik, disebut kriteria signifikansi.

Prosedur pengujian signifikansi diawali dengan perumusan hipotesis nol H0 . Secara umum tidak terdapat perbedaan yang signifikan antara parameter sampel dan parameter populasi. Hipotesis alternatif H1 adalah bahwa terdapat perbedaan yang signifikan antara parameter-parameter ini. Misalnya, saat menguji korelasi dalam suatu populasi, hipotesis nolnya adalah koefisien korelasi sebenarnya adalah nol ( H0: ρ = 0). Jika dari hasil pengujian ternyata hipotesis nol tidak dapat diterima, maka koefisien korelasi sampel RWow berbeda secara signifikan dari nol (hipotesis nol ditolak dan alternatif diterima H1). Dengan kata lain, anggapan bahwa variabel acak dalam populasi tidak berkorelasi harus dianggap tidak berdasar. Sebaliknya jika berdasarkan uji signifikansi hipotesis nol diterima, yaitu. RWow terletak pada zona hamburan acak yang diperbolehkan, maka tidak ada alasan untuk menganggap asumsi variabel yang tidak berkorelasi dalam populasi dipertanyakan.

Dalam uji signifikansi, peneliti menetapkan tingkat signifikansi α yang memberikan keyakinan praktis bahwa kesimpulan yang salah hanya akan diambil dalam kasus yang sangat jarang terjadi. Tingkat signifikansi menyatakan kemungkinan hipotesis nol H0 ditolak padahal itu benar. Jelasnya, masuk akal untuk memilih probabilitas ini sekecil mungkin.

Biarkan distribusi karakteristik sampel diketahui, yang merupakan estimasi parameter populasi yang tidak bias. Tingkat signifikansi yang dipilih sesuai dengan area yang diarsir di bawah kurva distribusi ini (lihat Gambar 24). Area yang tidak diarsir di bawah kurva distribusi menentukan probabilitasnya P = 1 - . Batas-batas segmen pada sumbu x di bawah daerah yang diarsir disebut nilai kritis, dan segmen-segmen itu sendiri membentuk daerah kritis, atau daerah penolakan hipotesis.

Dalam prosedur pengujian hipotesis, karakteristik sampel yang dihitung dari hasil observasi dibandingkan dengan nilai kritis yang sesuai. Dalam hal ini, kita harus membedakan antara area kritis satu sisi dan dua sisi. Bentuk penetapan wilayah kritis tergantung pada rumusan masalah dalam penelitian statistik. Wilayah kritis dua sisi diperlukan ketika, ketika membandingkan parameter sampel dan parameter populasi, perlu untuk memperkirakan nilai absolut dari perbedaan di antara keduanya, yaitu perbedaan positif dan negatif antara nilai yang diteliti adalah sebesar minat. Jika diperlukan untuk memastikan bahwa suatu nilai rata-rata lebih besar atau lebih kecil dari nilai rata-rata lainnya, maka wilayah kritis satu sisi (sisi kanan atau kiri) digunakan. Jelas terlihat bahwa untuk nilai kritis yang sama tingkat signifikansi bila menggunakan daerah kritis satu sisi lebih kecil dibandingkan bila menggunakan daerah kritis dua sisi. Jika distribusi karakteristik sampel simetris,

Beras. 24. Menguji hipotesis nol H0

maka tingkat signifikansi daerah kritis dua sisi adalah , dan daerah kritis satu sisi adalah (lihat Gambar 24). Mari kita batasi diri kita pada rumusan masalah secara umum. Informasi lebih rinci tentang landasan teori untuk menguji hipotesis statistik dapat ditemukan dalam literatur khusus. Di bawah ini kami hanya akan menunjukkan kriteria signifikansi untuk berbagai prosedur, tanpa memikirkan konstruksinya.

Dengan memeriksa signifikansi koefisien korelasi berpasangan, dapat diketahui ada tidaknya korelasi antara fenomena yang diteliti. Jika tidak ada hubungan, koefisien korelasi populasi adalah nol (ρ = 0). Prosedur pengujian dimulai dengan perumusan hipotesis nol dan hipotesis alternatif:

H0: perbedaan antara koefisien korelasi sampel R dan ρ = 0 tidak signifikan,

H1: perbedaan antara R dan ρ = 0 signifikan, dan karena itu antar variabel pada Dan X ada hubungan yang signifikan. Hipotesis alternatif menyiratkan bahwa kita perlu menggunakan wilayah kritis dua sisi.

Telah disebutkan di Bagian 8.1 bahwa koefisien korelasi sampel, dengan asumsi tertentu, dikaitkan dengan variabel acak T, mematuhi distribusi Siswa dengan F = n- 2 derajat kebebasan. Statistik dihitung dari hasil sampel

dibandingkan dengan nilai kritis yang ditentukan dari tabel distribusi Student pada tingkat signifikansi α tertentu DanF = n- 2 derajat kebebasan. Aturan penerapan kriterianya adalah sebagai berikut: if | T| >tf,A, maka hipotesis nol pada tingkat signifikansi α ditolak yaitu hubungan antar variabel signifikan; jika | T| ≤tf,A, maka hipotesis nol pada taraf signifikansi α diterima. Penyimpangan nilai R dari ρ = ​​0 dapat dikaitkan dengan variasi acak. Data sampel mencirikan hipotesis yang dipertimbangkan sebagai sangat mungkin dan masuk akal, yaitu hipotesis tidak adanya hubungan tidak menimbulkan keberatan.

Prosedur untuk menguji hipotesis jauh lebih disederhanakan jika kita menggunakan statistik T gunakan nilai kritis koefisien korelasi yang dapat ditentukan melalui kuantil distribusi Student dengan mensubstitusikan ke (8.38) T= tf, sebuah dan R= ρ F, A:

(8.39)

Terdapat tabel rinci nilai kritis, kutipannya diberikan dalam lampiran buku ini (lihat Tabel 6). Aturan pengujian hipotesis dalam hal ini adalah sebagai berikut: jika R> ρ F, dan kemudian kita dapat menyatakan bahwa hubungan antar variabel adalah signifikan. Jika Rrf,A, maka hasil observasi tersebut kita anggap konsisten dengan hipotesis tidak adanya hubungan.

Sebagaimana telah berulang kali dikemukakan, untuk menarik kesimpulan statistik tentang ada tidaknya korelasi antar variabel yang diteliti, perlu dilakukan pengecekan signifikansi koefisien korelasi sampel. Karena keandalan karakteristik statistik, termasuk koefisien korelasi, bergantung pada ukuran sampel, mungkin timbul situasi ketika nilai koefisien korelasi sepenuhnya ditentukan oleh fluktuasi acak dalam sampel yang menjadi dasar penghitungannya. . Jika terdapat hubungan yang signifikan antar variabel, maka koefisien korelasinya harus berbeda signifikan dari nol. Jika tidak ada korelasi antar variabel yang diteliti, maka koefisien korelasi populasi sama dengan nol. Dalam penelitian praktis, biasanya didasarkan pada observasi sampel. Seperti karakteristik statistik lainnya, koefisien korelasi sampel adalah variabel acak, yaitu nilainya tersebar secara acak di sekitar parameter populasi dengan nama yang sama (nilai sebenarnya dari koefisien korelasi). Jika tidak ada korelasi antar variabel, maka koefisien korelasinya dalam populasi sama dengan nol. Namun karena sifat hamburan yang acak, situasi pada dasarnya mungkin terjadi ketika beberapa koefisien korelasi yang dihitung dari sampel dari populasi tertentu akan berbeda dari nol.

Dapatkah perbedaan yang diamati disebabkan oleh fluktuasi acak dalam sampel, atau apakah perbedaan tersebut mencerminkan perubahan signifikan dalam kondisi di mana hubungan antar variabel terbentuk? Jika nilai koefisien korelasi sampel berada dalam zona hamburan,

karena sifat acak dari indikator itu sendiri, hal ini bukan merupakan bukti tidak adanya hubungan. Yang paling bisa dikatakan adalah bahwa data observasi tidak menampik tidak adanya hubungan antar variabel. Namun jika nilai koefisien korelasi sampel berada di luar zona hamburan tersebut, maka disimpulkan bahwa nilai tersebut berbeda secara signifikan dari nol, dan kita dapat berasumsi bahwa terdapat perbedaan statistik antar variabel. koneksi yang bermakna. Kriteria yang digunakan untuk menyelesaikan masalah ini, berdasarkan distribusi berbagai statistik, disebut kriteria signifikansi.

Prosedur uji signifikansi diawali dengan perumusan hipotesis nol, secara umum tidak terdapat perbedaan yang signifikan antara parameter sampel dengan parameter populasi. Hipotesis alternatifnya adalah terdapat perbedaan yang signifikan antara parameter-parameter ini. Misalnya, ketika menguji adanya korelasi dalam suatu populasi, hipotesis nolnya adalah bahwa koefisien korelasi sebenarnya adalah nol. Jika pengujian menghasilkan hipotesis nol tidak dapat diterima, maka koefisien korelasi sampel berbeda secara signifikan dari nol (nol hipotesis ditolak dan alternatifnya diterima. Dengan kata lain, asumsi bahwa variabel acak dalam populasi tidak berkorelasi harus dianggap tidak berdasar, dan sebaliknya, jika berdasarkan kriteria signifikansi, hipotesis nol diterima, yaitu berbohong di zona hamburan acak yang diperbolehkan, maka tidak ada alasan untuk menganggap asumsi bahwa variabel-variabel yang tidak berkorelasi dalam populasi patut dipertanyakan.

Dalam uji signifikansi, peneliti menetapkan tingkat signifikansi a yang memberikan keyakinan praktis bahwa kesimpulan yang salah hanya akan diambil dalam kasus yang sangat jarang terjadi. Tingkat signifikansi menyatakan kemungkinan hipotesis nol ditolak padahal hipotesis tersebut benar. Jelasnya, masuk akal untuk memilih probabilitas ini sekecil mungkin.

Biarkan distribusi karakteristik sampel diketahui, yang merupakan estimasi parameter populasi yang tidak bias. Tingkat signifikansi a yang dipilih sesuai dengan area yang diarsir di bawah kurva distribusi ini (lihat Gambar 24). Daerah yang tidak diarsir di bawah kurva distribusi menentukan probabilitas. Batas-batas segmen pada sumbu absis di bawah daerah yang diarsir disebut nilai kritis, dan segmen itu sendiri membentuk daerah kritis, atau daerah penolakan hipotesis.

Dalam prosedur pengujian hipotesis, karakteristik sampel yang dihitung dari hasil observasi dibandingkan dengan nilai kritis yang sesuai. Dalam hal ini, kita harus membedakan antara area kritis satu sisi dan dua sisi. Bentuk penetapan wilayah kritis tergantung pada rumusan masalah kapan penelitian statistik. Wilayah kritis dua sisi diperlukan ketika membandingkan parameter sampel dan parameter populasi

diperlukan untuk memperkirakan nilai absolut dari perbedaan di antara keduanya, yaitu perbedaan positif dan negatif antara besaran yang diteliti adalah yang menarik. Jika diperlukan untuk memastikan bahwa suatu nilai rata-rata lebih besar atau lebih kecil dari nilai rata-rata lainnya, maka wilayah kritis satu sisi (sisi kanan atau kiri) digunakan. Jelas terlihat bahwa untuk nilai kritis yang sama tingkat signifikansi bila menggunakan daerah kritis satu sisi lebih kecil dibandingkan bila menggunakan daerah kritis dua sisi.

Beras. 24. Pengujian Hipotesis Nol

Jika sebaran karakteristik sampel simetris, maka tingkat signifikansi daerah kritis dua sisi sama dengan a, dan daerah kritis satu sisi sama dengan y (lihat Gambar 24). Mari kita batasi diri kita pada rumusan masalah secara umum. Lebih detail dengan justifikasi teoritis tes tersebut hipotesis statistik kamu bisa bertemu di literatur khusus. Di bawah ini kami hanya akan menunjukkan kriteria signifikansinya berbagai prosedur, tanpa berhenti pada konstruksinya.

Dengan memeriksa signifikansi koefisien korelasi berpasangan, dapat diketahui ada tidaknya korelasi antara fenomena yang diteliti. Jika tidak ada hubungan maka koefisien korelasi populasi sama dengan nol. Prosedur verifikasi dimulai dengan perumusan hipotesis nol dan hipotesis alternatif:

Perbedaan antara koefisien korelasi sampel tidak signifikan,

Perbedaan di antara keduanya signifikan, sehingga terdapat hubungan yang signifikan antar variabelnya. Hipotesis alternatif menyiratkan bahwa kita perlu menggunakan wilayah kritis dua sisi.

Telah disebutkan di Bagian 8.1 bahwa koefisien korelasi sampel, berdasarkan premis tertentu, dikaitkan dengan variabel acak yang tunduk pada distribusi Student dengan derajat kebebasan. Statistik dihitung dari hasil sampel

dibandingkan dengan nilai kritis yang ditentukan dari tabel distribusi Student pada tingkat signifikansi a dan derajat kebebasan tertentu. Aturan penerapan kriteria tersebut adalah sebagai berikut: jika hipotesis nol ditolak pada tingkat signifikansi a, maka hubungan antar variabel signifikan; jika maka hipotesis nol pada tingkat signifikansi a diterima. Penyimpangan nilai dapat dikaitkan dengan variasi acak. Data sampel mencirikan hipotesis yang dipertimbangkan sebagai sangat mungkin dan masuk akal, yaitu hipotesis tentang tidak adanya hubungan tidak menimbulkan keberatan.

Prosedur pengujian hipotesis menjadi lebih sederhana jika, alih-alih statistik, kita menggunakan nilai kritis koefisien korelasi, yang dapat ditentukan melalui kuantil distribusi Student dengan mensubstitusikan ke dalam

Terdapat tabel rinci nilai kritis, kutipannya diberikan dalam lampiran buku ini (lihat Tabel 6). Aturan pengujian hipotesis dalam hal ini adalah sebagai berikut: jika demikian, kita dapat menyatakan bahwa hubungan antar variabel adalah signifikan. Jika demikian, kami menganggap hasil observasi tersebut konsisten dengan hipotesis tidak adanya hubungan.

Mari kita uji hipotesis tentang independensi produktivitas tenaga kerja dari tingkat mekanisasi kerja menurut data yang diberikan di bagian 4.1. Sebelumnya telah dihitung bahwa Dari (8.38) kita peroleh

Dengan menggunakan tabel distribusi Siswa, kami menemukan nilai kritis dari statistik ini: Karena kami menolak hipotesis nol, kesalahan hanya terjadi pada 5% kasus.

Hasil yang sama akan kita peroleh jika kita membandingkannya dengan nilai kritis koefisien korelasi yang diperoleh dari tabel terkait di

yang memiliki -distribusi dengan derajat kebebasan. Selanjutnya prosedur pemeriksaan signifikansi dilakukan serupa dengan prosedur sebelumnya dengan menggunakan -kriteria.

Contoh

Berdasarkan analisis ekonomi terhadap fenomena tersebut, kami berasumsi pada masyarakat umum terdapat hubungan yang kuat antara produktivitas tenaga kerja dan tingkat mekanisasi kerja. Misalnya, . Sebagai alternatif, dalam hal ini kita dapat mengajukan hipotesis bahwa koefisien korelasi sampel Jadi, kita harus menggunakan wilayah kritis satu sisi. Dari (8.40) berikut ini

Kami membandingkan nilai yang diperoleh dengan nilai kritis. Jadi, pada tingkat signifikansi 5%, kita dapat mengasumsikan adanya hubungan yang sangat erat antara karakteristik yang dipelajari, yaitu data awal memungkinkan kita untuk menganggap masuk akal bahwa

Signifikansi koefisien korelasi parsial diperiksa dengan cara yang sama. Hanya jumlah derajat kebebasannya yang berubah, yang menjadi sama dengan jumlah variabel penjelas. Nilai statistik dihitung menggunakan rumus

dibandingkan dengan nilai kritis a yang diperoleh dari tabel distribusi pada tingkat signifikansi a dan jumlah derajat kebebasan. Penerimaan atau penolakan hipotesis tentang signifikansi koefisien korelasi parsial dilakukan menurut aturan yang sama seperti yang dijelaskan di atas . Uji signifikansi juga dapat dilakukan dengan menggunakan nilai kritis koefisien korelasi menurut (8.39), serta menggunakan transformasi Fisher (8.40).

Contoh

Mari kita periksa keandalan statistik koefisien korelasi parsial dihitung pada bagian 4.5 pada tingkat signifikansi Di bawah ini, bersama dengan koefisien korelasi parsial, nilai statistik terhitung dan kritis yang sesuai diberikan

Karena hipotesis tentang signifikansi koefisien diterima, kami menyimpulkan: tingkat mekanisasi kerja mempunyai pengaruh yang signifikan terhadap produktivitas tenaga kerja, tidak termasuk pengaruh rata-rata usia pekerja (dan persentase rata-rata kepatuhan terhadap standar). Selisih dari nol dari koefisien yang tersisa

korelasi parsial dapat dikaitkan dengan fluktuasi acak dalam sampel, dan oleh karena itu dari fluktuasi tersebut kita tidak dapat mengatakan sesuatu yang pasti tentang pengaruh parsial variabel yang relevan.

Tentang pentingnya koefisien korelasi ganda dinilai dari hasil prosedur pemeriksaan signifikansi koefisien tekad ganda. Kami akan membahas ini lebih detail di bagian selanjutnya.

Pertanyaan yang sering menarik perhatian adalah: apakah dua koefisien korelasi berbeda secara signifikan satu sama lain? Saat menguji hipotesis ini, diasumsikan bahwa karakteristik populasi homogen yang sama dipertimbangkan; data mewakili hasil tes independen; koefisien korelasi yang sejenis digunakan, yaitu koefisien korelasi berpasangan atau koefisien korelasi parsial ketika mengecualikan jumlah variabel yang sama.

Volume kedua sampel yang koefisien korelasinya dihitung mungkin berbeda. Hipotesis nol: yaitu koefisien korelasi kedua populasi yang dipertimbangkan adalah sama. Hipotesis Alternatif: Hipotesis alternatif menyiratkan bahwa wilayah kritis dua arah harus digunakan. Dengan kata lain, Anda harus memeriksa apakah perbedaannya berbeda secara signifikan dari nol. Mari kita gunakan statistik yang memiliki distribusi mendekati normal:

dimana - hasil transformasi koefisien korelasi - volume sampel. Aturan pengujian: jika maka hipotesis ditolak; jika maka hipotesis diterima.

Jika diterima, nilainya

setelah dihitung ulang menggunakan (8.6) berfungsi sebagai ringkasan perkiraan koefisien korelasi. Selanjutnya hipotesis dapat diuji dengan menggunakan statistik

mempunyai distribusi normal.

Contoh

Perlu diketahui apakah kedekatan hubungan antara produktivitas tenaga kerja dan tingkat mekanisasi kerja berbeda di perusahaan-perusahaan dari industri yang sama yang berlokasi di berbagai wilayah negara. Mari kita bandingkan perusahaan yang berlokasi di dua wilayah. Misalkan koefisien korelasi salah satunya dihitung dengan menggunakan volume sampel (lihat Bagian 4.1). Untuk wilayah Lainnya dihitung menggunakan volume sampel

Setelah mengubah kedua koefisien korelasi menjadi nilai -, kita menghitung menggunakan (8.42) nilai statistik X:

Nilai kritis statistik pada adalah Dengan demikian, hipotesis diterima, yaitu berdasarkan sampel yang tersedia, kita tidak dapat menentukan perbedaan yang signifikan antara koefisien korelasi. Selain itu, kedua koefisien korelasi tersebut signifikan.

Dengan menggunakan (8.43) dan (8.6), kita memperoleh estimasi ringkasan koefisien korelasi untuk dua wilayah:

Terakhir, mari kita periksa hipotesis apakah estimasi ringkasan koefisien korelasi berbeda secara signifikan dari nol dengan menggunakan statistik (8.44):

Karena kita dapat menegaskan bahwa dalam masyarakat umum terdapat hubungan yang signifikan antara produktivitas tenaga kerja dan tingkat mekanisasi kerja.

Kriteria X dapat digunakan dalam berbagai aspek. Jadi, alih-alih berdasarkan wilayah, berbagai industri dapat dipertimbangkan, misalnya, ketika perlu untuk menentukan apakah ada perbedaan dalam kekuatan hubungan yang diteliti antara indikator ekonomi perusahaan milik dua industri yang berbeda.

Mari kita hitung, berdasarkan dua sampel volume, koefisien korelasi yang mencirikan hubungan erat antara produktivitas tenaga kerja dan tingkat mekanisasi kerja di perusahaan yang tergabung dalam dua industri (dua populasi umum). Dari (8.42) kita peroleh

Karena kami menolak hipotesis nol. Oleh karena itu, dapat dikatakan bahwa terdapat perbedaan yang signifikan dalam kedekatan hubungan antara produktivitas tenaga kerja dan tingkat mekanisasi kerja pada perusahaan-perusahaan yang tergabung dalam berbagai industri. Kita akan melanjutkan contoh ini di Bagian 8.7, di mana kita akan membandingkan garis regresi yang dibuat untuk dua populasi.

Menganalisis contoh-contoh di atas, kami yakin bahwa kami hanya mempertimbangkan perbedaan absolut dari koefisien korelasi yang dibandingkan

(ukuran sampel sama pada kedua kasus) tanpa memeriksa signifikansi perbedaan ini akan menghasilkan kesimpulan yang salah. Hal ini menegaskan perlunya menggunakan kriteria statistik ketika membandingkan koefisien korelasi.

Prosedur untuk membandingkan dua koefisien korelasi dapat digeneralisasikan menjadi jumlah yang lebih besar koefisien tunduk pada prasyarat di atas. Hipotesis persamaan koefisien korelasi antar variabel dinyatakan sebagai berikut: Diuji berdasarkan koefisien korelasi yang dihitung dari sampel volume dari populasi umum. koefisien korelasi dihitung ulang menjadi -nilai: Sejak di kasus umum tidak diketahui, kita mencari perkiraannya melalui rumus yang merupakan generalisasi dari (8.43).

Versi lengkap catatan ini (dengan rumus dan tabel) dapat diunduh dari halaman ini dalam format PDF. Teks yang ditempatkan pada halaman itu sendiri adalah ringkasan isi catatan ini dan kesimpulan yang paling penting.

Didedikasikan untuk para optimis statistik

Koefisien korelasi (CC) adalah salah satu statistik paling sederhana dan populer yang mengkarakterisasi hubungan antara variabel acak. Pada saat yang sama, CC memimpin dalam hal jumlah kesimpulan yang salah dan tidak berarti yang dibuat dengan bantuannya. Keadaan ini disebabkan oleh sudah mapannya praktik penyajian materi terkait korelasi dan ketergantungan korelasi.

Nilai QC besar, kecil dan “menengah”.

Ketika mempertimbangkan hubungan korelasi, konsep korelasi “kuat” (hampir tunggal) dan “lemah” (hampir nol) dibahas secara rinci, tetapi dalam praktiknya tidak ada satu pun yang pernah ditemui. Akibatnya, pertanyaan tentang interpretasi yang masuk akal atas nilai-nilai QC “menengah” yang umum dalam praktik masih belum jelas. Koefisien korelasi sama dengan 0.9 atau 0.8 , menginspirasi optimisme pada seorang pemula, tetapi nilai-nilai yang lebih rendah membingungkannya.

Seiring bertambahnya pengalaman, optimisme tumbuh, dan kini QC pun setara 0.7 atau 0.6 menyenangkan peneliti dan menginspirasi optimisme 0.5 Dan 0.4 . Jika peneliti terbiasa dengan metode pengujian hipotesis statistik, maka ambang batas nilai QC “baik” turun menjadi 0.3 atau 0.2 .

Memangnya, nilai CC mana yang sudah bisa dianggap “cukup besar” dan mana yang masih “terlalu kecil”? Ada dua jawaban yang bertentangan terhadap pertanyaan ini – optimis dan pesimis. Pertama mari kita pertimbangkan jawaban optimis (paling populer).

Signifikansi koefisien korelasi

Pilihan jawaban ini diberikan kepada kita oleh statistik klasik dan berhubungan dengan konsep signifikansi statistik KK. Di sini kami hanya akan mempertimbangkan situasi di mana korelasi positif menjadi perhatian (kasus korelasi negatif sangat mirip). Lagi kasus yang sulit, ketika hanya keberadaan korelasi yang diperiksa tanpa memperhitungkan tandanya, dalam praktiknya relatif jarang.

Jika untuk QC R ketimpangan terpenuhi r > r e (n), lalu mereka bilang itu KK signifikan secara statistik pada tingkat signifikansi e. Di Sini ulang (n)-- kuantil, dalam kaitannya dengan itu kita hanya akan tertarik pada fakta bahwa pada tingkat signifikansi tetap e nilainya cenderung nol seiring bertambahnya panjang N sampel. Ternyata dengan meningkatkan susunan data, signifikansi statistik QC dapat dicapai bahkan pada nilai yang sangat kecil. Akibatnya, jika Anda memiliki sampel yang cukup besar, Anda tergoda untuk mengakuinya dalam kasus CC sama, misalnya, 0.06 . Namun, akal sehat menyatakan bahwa kesimpulan tentang adanya korelasi yang signifikan kapan r=0,06 tidak mungkin benar untuk ukuran sampel apa pun. Masih memahami sifat kesalahannya. Untuk melakukan hal ini, mari kita lihat lebih dekat konsep signifikansi statistik.

Seperti biasa, ketika menguji hipotesis statistik, arti perhitungannya terletak pada pilihan hipotesis nol dan hipotesis alternatif. Saat memeriksa signifikansi CC, asumsi tersebut diambil sebagai hipotesis nol (r=0) di bawah hipotesis alternatif (r > 0)(ingat bahwa yang kami pertimbangkan di sini hanya situasi di mana korelasi positif adalah kepentingan). Tingkat signifikansi yang dapat dipilih secara bebas e menentukan kemungkinan apa yang disebut kesalahan tipe I ketika hipotesis nol benar ( r=0), namun ditolak oleh kriteria statistik (yaitu, kriteria tersebut secara keliru mengakui adanya korelasi yang signifikan). Dengan memilih tingkat signifikansi, kami menjamin kemungkinan kesalahan yang rendah, yaitu. kita hampir kebal terhadap fakta bahwa untuk sampel independen ( r=0) secara keliru mengakui adanya korelasi ( r > 0). Secara kasar, signifikansi koefisien korelasi hanya berarti kemungkinan besar berbeda dari nol.

Itulah sebabnya ukuran sampel dan nilai QC saling mengimbangi - sampel besar memungkinkan akurasi yang lebih besar dicapai dalam melokalisasi QC kecil sesuai dengan perkiraan sampelnya.

Jelas bahwa konsep signifikansi tidak menjawab pertanyaan awal tentang pemahaman kategori “besar/kecil” dalam kaitannya dengan nilai-nilai CC. Jawaban yang diberikan oleh kriteria signifikansi tidak memberi tahu kita apa pun tentang sifat-sifat korelasi, tetapi hanya memungkinkan kita untuk memverifikasi bahwa dengan kemungkinan besar ketidaksetaraan terpenuhi. r > 0. Pada saat yang sama, nilai CC sendiri mengandung informasi yang jauh lebih signifikan tentang sifat-sifat hubungan korelasi. Memang, CC sama signifikannya dengan 0.1 Dan 0.9 , berbeda secara signifikan dalam tingkat ekspresi hubungan korelasi yang sesuai, dan pernyataan tentang pentingnya CC r = 0,06 untuk praktiknya sama sekali tidak ada gunanya, karena dengan ukuran sampel berapa pun tidak perlu membicarakan korelasi apa pun di sini.

Akhirnya, kita dapat mengatakan bahwa dalam praktiknya, sifat apa pun dari hubungan korelasi dan bahkan keberadaannya tidak mengikuti signifikansi koefisien korelasi. Dari sudut pandang praktis, pilihan hipotesis alternatif yang digunakan ketika menguji signifikansi QC adalah salah, karena kasus r=0 Dan r>0 di kecil R dari sudut pandang praktis mereka tidak dapat dibedakan.

Faktanya, ketika dari pentingnya QC menyimpulkan keberadaan korelasi yang signifikan, membuat substitusi konsep yang benar-benar tidak tahu malu berdasarkan ambiguitas semantik dari kata "signifikansi". Signifikansi QC (sebuah konsep yang didefinisikan dengan jelas) secara menipu diubah menjadi “korelasi yang signifikan”, dan frasa ini, yang tidak memiliki definisi yang ketat, ditafsirkan sebagai sinonim untuk “korelasi yang diucapkan”.

Pemisahan varians

Mari kita pertimbangkan jawaban lain atas pertanyaan tentang nilai CC “kecil” dan “besar”. Pilihan jawaban ini dikaitkan dengan memperjelas makna regresi QC dan ternyata sangat berguna untuk praktik, meskipun kurang optimis dibandingkan kriteria signifikansi QC.

Menariknya, pembahasan makna regresi CC seringkali menemui kesulitan yang bersifat didaktik (atau lebih tepatnya psikologis). Mari kita mengomentarinya secara singkat. Setelah pengenalan CC secara formal dan penjelasan mengenai pengertian korelasi “kuat” dan “lemah”, maka dipandang perlu untuk mendalami pembahasan permasalahan filosofis tentang hubungan korelasi dan hubungan sebab-akibat. Pada saat yang sama, upaya yang kuat sedang dilakukan untuk menyangkal upaya (hipotetis!) yang menafsirkan hubungan korelasi sebagai hubungan sebab-akibat. Terhadap latar belakang ini, diskusi tentang masalah ketersediaan ketergantungan fungsional(termasuk regresi) antara kuantitas yang berkorelasi mulai tampak menghujat. Bagaimanapun, hanya ada satu langkah dari ketergantungan fungsional menuju hubungan sebab-akibat! Akibatnya, pertanyaan tentang makna regresi CC umumnya dihindari, begitu pula pertanyaan tentang sifat korelasi regresi linier.

Faktanya, semuanya sederhana di sini. Jika untuk variabel acak yang dinormalisasi (yaitu, memiliki ekspektasi nol dan varian satuan). X Dan Y ada hubungannya

Y = a + bX + N,

Di mana N-- beberapa variabel acak dengan ekspektasi nol (kebisingan tambahan), maka mudah untuk memverifikasinya sebuah = 0 Dan b = r. Ini adalah hubungan antara variabel acak X Dan Y disebut persamaan regresi linier.

Menghitung varians dari variabel acak Y Sangat mudah untuk mendapatkan ekspresi berikut:

D[Y] = b 2 D[X] + D[N].

Dalam ekspresi terakhir, suku pertama menentukan kontribusi variabel acak X ke dalam varians Y, dan istilah kedua adalah kontribusi kebisingan N ke dalam varians Y. Menggunakan ekspresi di atas untuk parameter B, mudah untuk menyatakan kontribusi variabel acak X Dan N melalui besarnya r =R(ingat bahwa kita sedang menghitung jumlahnya X Dan Y dinormalisasi, yaitu D[X] = D[Y] = 1):

b 2 D[X] = r 2

D[N] = 1 - r 2

Dengan memperhatikan rumus yang diperoleh, sering dikatakan demikian untuk variabel acak X Dan Y terkait persamaan regresi, besarnya r 2 menentukan proporsi varians suatu variabel acak Y, ditentukan secara linier oleh perubahan variabel acak X. Jadi, varians total dari variabel acak Y terurai menjadi dispersi, dikondisikan secara linear adanya hubungan regresi dan varians sisa, disebabkan oleh adanya kebisingan aditif.


Pertimbangkan diagram sebar dari variabel acak dua dimensi (X, Y). Kecil D[T] plot sebar merosot menjadi ketergantungan linier antara variabel acak, sedikit terdistorsi oleh gangguan tambahan (yaitu titik-titik pada plot sebar sebagian besar akan terkonsentrasi di dekat garis lurus X=Y). Kasus ini terjadi pada nilai-nilai R, mendekati modulus kesatuan. Dengan penurunan (nilai absolut) nilai CC, penyebaran komponen kebisingan N mulai memberikan kontribusi yang semakin besar terhadap penyebaran kuantitas Y dan kecil R plot sebar benar-benar kehilangan kemiripannya dengan garis lurus. Dalam hal ini, kita mempunyai awan titik-titik yang hamburannya terutama disebabkan oleh kebisingan. Kasus inilah yang diwujudkan pada nilai CC yang signifikan, tetapi nilai absolutnya kecil. Jelas bahwa dalam hal ini tidak perlu membicarakan korelasi apapun.

Sekarang mari kita lihat jawaban apa atas pertanyaan tentang nilai KK “besar” dan “kecil” yang ditawarkan kepada kita melalui interpretasi regresi KK. Pertama-tama, perlu ditekankan bahwa dispersi adalah ukuran paling alami dari dispersi nilai-nilai variabel acak. Sifat “kealamian” ini terdiri dari penjumlahan varians untuk variabel acak independen, tetapi sifat ini memiliki manifestasi yang sangat beragam, termasuk pemisahan varians yang ditunjukkan di atas menjadi varians terkondisi linier dan varians residu.

Jadi nilainya r 2 menentukan proporsi varian kuantitas Y, ditentukan secara linier oleh adanya hubungan regresi dengan variabel acak X. Pertanyaan tentang berapa proporsi varians yang ditentukan secara linier dapat dianggap sebagai tanda adanya korelasi yang nyata, tetap berada dalam hati nurani peneliti. Namun, menjadi jelas bahwa nilai koefisien korelasi yang kecil ( R< 0.3 ) memberikan proporsi kecil dari varians yang dapat dijelaskan secara linier sehingga tidak masuk akal untuk membicarakan korelasi yang jelas. Pada r > 0,5 kita dapat berbicara tentang adanya korelasi nyata antara kuantitas, dan waktu r > 0,7 korelasinya dapat dianggap signifikan.


Perkenalan. 2

1. Menilai signifikansi koefisien regresi dan korelasi menggunakan uji f Student. 3

2. Perhitungan signifikansi koefisien regresi dan korelasi menggunakan uji f Student. 6

Kesimpulan. 15

Setelah membangun persamaan regresi, perlu untuk memeriksa signifikansinya: dengan menggunakan kriteria khusus, tentukan apakah ada ketergantungan yang dihasilkan dinyatakan dengan persamaan regresi, acak, mis. dapatkah itu digunakan untuk tujuan peramalan dan analisis faktor? Dalam statistik, metode telah dikembangkan untuk menguji secara ketat signifikansi koefisien regresi dengan menggunakan analisis varians dan perhitungan kriteria khusus (misalnya kriteria F). Uji longgar dapat dilakukan dengan menghitung rata-rata deviasi linier relatif (ε), yang disebut kesalahan rata-rata perkiraan:

Sekarang mari kita beralih ke penilaian signifikansi koefisien regresi bj dan membangun interval kepercayaan untuk parameter model regresi Ru (J=l,2,..., p).

Blok 5 - penilaian signifikansi koefisien regresi berdasarkan nilai uji ^ Student. Nilai ta yang dihitung dibandingkan dengan nilai yang diizinkan

Blok 5 - penilaian signifikansi koefisien regresi berdasarkan nilai kriteria ^. Nilai t0n yang dihitung dibandingkan dengan nilai yang diizinkan 4,/, yang ditentukan dari tabel distribusi t untuk probabilitas kesalahan tertentu (a) dan jumlah derajat kebebasan (/).

Selain menguji signifikansi keseluruhan model, perlu dilakukan uji signifikansi koefisien regresi dengan menggunakan uji Student /. Nilai minimum koefisien regresi br harus sesuai dengan kondisi bifob- ^t, dimana bi adalah nilai koefisien persamaan regresi skala natural pada faktor i-c tanda; ah. - kesalahan kuadrat rata-rata dari setiap koefisien. ketidakterbandingan koefisien D dalam signifikansinya;

Analisis statistik lebih lanjut berkaitan dengan pengujian signifikansi koefisien regresi. Untuk melakukan ini, kami menemukan nilai kriteria ^ untuk koefisien regresi. Sebagai hasil perbandingannya, kriteria ^ terkecil ditentukan. Faktor yang koefisiennya sesuai dengan kriteria ^ terkecil dikeluarkan dari analisis lebih lanjut.

Untuk menilai signifikansi statistik dari koefisien regresi dan korelasi, uji-t Student dan interval kepercayaan masing-masing indikatornya. Sebuah hipotesis diajukan tentang sifat acak dari indikator, yaitu. tentang perbedaan signifikan mereka dari nol. Penilaian signifikansi koefisien regresi dan korelasi menggunakan uji f Student dilakukan dengan membandingkan nilainya dengan besarnya kesalahan acak:

Menilai signifikansi koefisien regresi murni menggunakan uji / Student sampai pada menghitung nilainya

Kualitas tenaga kerja merupakan ciri suatu tenaga kerja tertentu, yang mencerminkan derajat kompleksitas, intensitas (intensitas), kondisi dan signifikansinya bagi pembangunan ekonomi. Kt. diukur melalui sistem tarif yang memungkinkan pembedaan upah tergantung pada tingkat kualifikasi (kompleksitas pekerjaan), kondisi, tingkat keparahan tenaga kerja dan intensitasnya, serta pentingnya masing-masing industri dan produksi, wilayah, wilayah untuk pengembangan. perekonomian negara. Kt. menemukan ekspresi di upah pekerja, berkembang di pasar tenaga kerja di bawah pengaruh penawaran dan permintaan angkatan kerja(jenis pekerjaan tertentu). Kt. - strukturnya rumit

Skor yang diperoleh mengenai kepentingan relatif masing-masing konsekuensi ekonomi, sosial dan lingkungan dari suatu proyek selanjutnya memberikan dasar untuk membandingkan proyek-proyek alternatif dan pilihan-pilihannya dengan menggunakan “kriteria penilaian kompleks yang tidak berdimensi efisiensi sosial dan lingkungan-ekonomi” dari proyek Ek, dihitung (dalam skor signifikansi rata-rata) menggunakan rumus

Peraturan intra-industri menjamin perbedaan upah bagi pekerja di suatu industri tertentu, tergantung pada pentingnya jenis produksi tertentu dalam industri tertentu, pada kompleksitas dan kondisi kerja, serta pada bentuk remunerasi yang digunakan.

Penilaian pemeringkatan yang dihasilkan dari perusahaan yang dianalisis dalam kaitannya dengan perusahaan standar tanpa memperhitungkan pentingnya indikator individu bersifat komparatif. Saat membandingkan peringkat beberapa perusahaan peringkat tertinggi memiliki perusahaan dengan nilai minimum dari penilaian perbandingan yang diperoleh.

Memahami kualitas suatu produk sebagai ukuran kegunaannya menempatkannya secara praktis pertanyaan penting tentang pengukurannya. Solusinya dicapai dengan mempelajari pentingnya sifat-sifat individu dalam memenuhi kebutuhan tertentu. Signifikansi bahkan properti yang sama mungkin berbeda tergantung pada kondisi konsumsi produk. Akibatnya, kegunaan produk di keadaan yang berbeda kegunaannya berbeda-beda.

Pekerjaan tahap kedua adalah mempelajari data statistik dan mengidentifikasi hubungan dan interaksi indikator, menentukan signifikansi faktor individu dan alasan perubahan indikator umum.

Semua indikator yang dipertimbangkan digabungkan menjadi satu sedemikian rupa sehingga hasilnya adalah penilaian komprehensif terhadap semua aspek kegiatan perusahaan yang dianalisis, dengan mempertimbangkan kondisi kegiatannya, dengan mempertimbangkan tingkat signifikansi masing-masing indikator bagi berbagai jenis investor:

Koefisien regresi menunjukkan intensitas pengaruh faktor-faktor terhadap indikator kinerja. Jika standarisasi awal indikator faktor dilakukan, maka b0 sama dengan nilai rata-rata indikator efektif secara agregat. Koefisien b, b2 ..... bl menunjukkan berapa satuan tingkat penyimpangan indikator efektif dari nilai rata-ratanya jika nilai indikator faktor menyimpang dari rata-rata sama dengan nol per satu deviasi standar. Dengan demikian, koefisien regresi mencirikan tingkat signifikansi faktor individu terhadap peningkatan tingkat indikator kinerja. Nilai spesifik koefisien regresi ditentukan dari data empiris menurut metode kuadrat terkecil(sebagai hasil penyelesaian sistem persamaan normal).

2. Perhitungan signifikansi koefisien regresi dan korelasi menggunakan uji f Student

Mari kita pertimbangkan bentuk linier dari hubungan multifaktor tidak hanya sebagai yang paling sederhana, tetapi juga sebagai bentuk yang disediakan oleh paket perangkat lunak aplikasi untuk PC. Jika hubungan antara suatu faktor individu dengan atribut yang dihasilkan tidak linier, maka persamaan tersebut dilinearisasi dengan mengganti atau mentransformasikan nilai atribut faktor tersebut.

Bentuk umum persamaan regresi multivariat memiliki bentuk:


dimana k adalah banyaknya karakteristik faktor.

Untuk menyederhanakan sistem persamaan kuadrat terkecil yang diperlukan untuk menghitung parameter persamaan (8.32), biasanya diperkenalkan deviasi nilai individu semua karakteristik dari nilai rata-rata karakteristik ini.

Kami memperoleh sistem k persamaan kuadrat terkecil:

Memecahkan sistem ini, kita memperoleh nilai koefisien regresi murni bersyarat b. Suku bebas persamaan dihitung dengan rumus


Istilah “koefisien regresi murni bersyarat” berarti bahwa setiap nilai bj mengukur simpangan rata-rata agregat dari karakteristik yang dihasilkan dari nilai rata-ratanya ketika suatu faktor xj menyimpang dari nilai rata-ratanya dengan satuan pengukurannya dan dengan ketentuan bahwa semua faktor-faktor lain yang termasuk dalam persamaan regresi, ditetapkan pada nilai rata-rata, tidak berubah, tidak bervariasi.

Jadi, berbeda dengan koefisien regresi berpasangan, koefisien regresi murni bersyarat mengukur pengaruh suatu faktor, yang mengabstraksikan hubungan variasi faktor tersebut dengan variasi faktor lainnya. Jika persamaan regresi dapat memasukkan semua faktor yang mempengaruhi variasi karakteristik yang dihasilkan, maka nilai bj. dapat dianggap sebagai ukuran pengaruh murni suatu faktor. Tetapi karena sangat tidak mungkin untuk memasukkan semua faktor ke dalam persamaan, maka koefisien bj. tidak lepas dari campuran pengaruh faktor-faktor yang tidak termasuk dalam persamaan.

Tidak mungkin memasukkan semua faktor ke dalam persamaan regresi karena salah satu dari tiga alasan atau semuanya sekaligus, karena:

1) beberapa faktor mungkin tidak diketahui ilmu pengetahuan modern, pengetahuan tentang proses apa pun selalu tidak lengkap;

2) tidak ada informasi mengenai beberapa faktor teoritis yang diketahui atau tidak dapat diandalkan;

3) besarnya populasi yang diteliti (sampel) terbatas, sehingga memungkinkan untuk memasukkan sejumlah faktor ke dalam persamaan regresi.

Koefisien regresi murni bersyarat bj. adalah bilangan-bilangan bernama yang dinyatakan dalam satuan pengukuran yang berbeda dan oleh karena itu tidak dapat dibandingkan satu sama lain. Untuk mengubahnya menjadi indikator relatif yang sebanding, transformasi yang sama digunakan untuk memperoleh koefisien korelasi berpasangan. Nilai yang dihasilkan disebut koefisien standar regresi atau?-koefisien.


Koefisien faktor xj menentukan besarnya pengaruh variasi faktor xj terhadap variasi sifat yang dihasilkan y, yang diambil dari variasi penyerta faktor-faktor lain yang termasuk dalam persamaan regresi.

Koefisien regresi murni bersyarat berguna untuk dinyatakan dalam bentuk indikator koneksi dan koefisien elastisitas yang relatif sebanding:

Koefisien elastisitas faktor xj mengatakan bahwa ketika nilai suatu faktor tertentu menyimpang dari nilai rata-ratanya sebesar 1% dan mengabstraksikan penyimpangan yang menyertai faktor-faktor lain yang termasuk dalam persamaan, karakteristik yang dihasilkan akan menyimpang dari nilai rata-ratanya sebesar ej persen. dari kamu. Lebih sering, koefisien elastisitas ditafsirkan dan diterapkan dalam dinamika: dengan peningkatan faktor x sebesar 1% dari nilai rata-ratanya, karakteristik yang dihasilkan akan meningkat sebesar e.

Mari kita perhatikan penghitungan dan interpretasi persamaan regresi multifaktor dengan menggunakan 16 peternakan yang sama sebagai contoh (Tabel 8.1). Tanda yang dihasilkan adalah level pendapatan kotor dan tiga faktor yang mempengaruhinya disajikan pada tabel. 8.7.

Mari kita ingat sekali lagi bahwa untuk memperoleh indikator korelasi yang andal dan cukup akurat, diperlukan populasi yang lebih besar.


Tabel 8.7

Tingkat pendapatan kotor dan faktor-faktornya

Nomor pertanian

Pendapatan kotor, gosok./ra

Biaya tenaga kerja, hari kerja/ha x1

Bagian tanah subur,

Hasil susu per 1 ekor sapi,


Tabel 8.8 Indikator persamaan regresi


Variabel terikat: y

Koefisien regresi

Konstan-240.112905

Std. kesalahan terbaik. = 79.243276


Solusinya dilakukan dengan menggunakan program “Microstat” untuk PC. Berikut tabel hasil cetakannya: tabel. 8.7 memberikan nilai rata-rata dan deviasi standar dari semua karakteristik. Meja 8.8 berisi koefisien regresi dan penilaian probabilistiknya:

kolom pertama "var" - variabel, yaitu faktor; kolom kedua "koefisien regresi" - koefisien regresi murni bersyarat bj; kolom ketiga “std. errr" - kesalahan rata-rata dalam memperkirakan koefisien regresi; kolom keempat - nilai uji-t Student dengan 12 derajat kebebasan variasi; kolom kelima "prob" - probabilitas hipotesis nol relatif terhadap koefisien regresi;

kolom keenam "parsial r2" - koefisien determinasi parsial. Isi dan metodologi penghitungan indikator pada kolom 3-6 dibahas lebih lanjut pada Bab 8. “Konstanta” adalah suku bebas dari persamaan regresi a; "Std. kesalahan perkiraan.” - mean square error dalam memperkirakan karakteristik efektif menggunakan persamaan regresi. Persamaan diperoleh regresi berganda:


kamu = 2,26x1 - 4,31x2 + 0,166x3 - 240.


Artinya jumlah pendapatan kotor per 1 hektar lahan pertanian rata-rata meningkat sebesar 2,26 rubel. dengan peningkatan biaya tenaga kerja sebesar 1 jam/ha; turun rata-rata 4,31 rubel. dengan peningkatan pangsa lahan subur di lahan pertanian sebesar 1% dan meningkat sebesar 0,166 rubel. dengan peningkatan produksi susu per sapi sebesar 1 kg. Nilai negatif dari istilah bebas adalah hal yang wajar, dan, sebagaimana telah disebutkan dalam paragraf 8.2, tanda efektifnya adalah bahwa pendapatan kotor menjadi nol jauh sebelum faktor-faktor tersebut mencapai nilai nol, yang tidak mungkin dilakukan dalam produksi.

Nilai koefisien x^ yang negatif merupakan sinyal adanya masalah yang signifikan dalam perekonomian peternakan yang diteliti, di mana budidaya tanaman pangan tidak menguntungkan, dan hanya peternakan yang menguntungkan. Dengan metode pertanian yang rasional dan harga normal (kesetimbangan atau mendekatinya) untuk produk-produk di semua sektor, pendapatan tidak boleh berkurang, tetapi meningkat seiring dengan peningkatan bagian paling subur dari lahan pertanian - lahan subur.

Berdasarkan data dari dua baris tabel kedua dari belakang. 8.7 dan tabel. 8.8 kita menghitung koefisien p dan koefisien elastisitas menggunakan rumus (8.34) dan (8.35).

Baik variasi tingkat pendapatan maupun kemungkinan perubahan dinamikanya paling kuat dipengaruhi oleh faktor x3 - produktivitas sapi, dan yang paling lemah oleh x2 - pangsa lahan garapan. Nilai P2/ akan digunakan lebih lanjut (Tabel 8.9);


Tabel 8.9 Perbandingan pengaruh faktor-faktor terhadap tingkat pendapatan

Faktor xj


Jadi, kita peroleh bahwa koefisien ? dari faktor xj berkaitan dengan koefisien elastisitas faktor tersebut, sebagaimana koefisien variasi faktor tersebut berkaitan dengan koefisien variasi karakteristik yang dihasilkan. Karena, seperti terlihat dari baris terakhir tabel. 8.7, koefisien variasi semua faktor lebih kecil dari koefisien variasi karakteristik yang dihasilkan; semua?-koefisien lebih kecil dari koefisien elastisitas.

Mari kita perhatikan hubungan antara koefisien regresi berpasangan dan murni bersyarat dengan menggunakan faktor -с, sebagai contoh. berpasangan persamaan linier hubungan y dengan x berbentuk:


kamu = 3,886x1 – 243,2


Koefisien regresi murni bersyarat pada x1 hanya 58% dari koefisien regresi berpasangan. Sisanya sebesar 42% disebabkan oleh variasi x1 yang disertai dengan variasi faktor x2 x3, yang selanjutnya mempengaruhi sifat yang dihasilkan. Keterhubungan seluruh karakteristik dan koefisien regresi berpasangannya disajikan pada grafik keterhubungan (Gbr. 8.2).

Jika kita menjumlahkan estimasi pengaruh langsung dan tidak langsung variasi x1 pada y, yaitu produk koefisien regresi berpasangan di sepanjang “jalur” (Gbr. 8.2), kita mendapatkan: 2,26 + 12,55 0,166 + (-0,00128) (- 4,31) + (-0,00128) 17,00 0,166 = 4,344.

Nilai ini bahkan lebih besar lagi koefisien pasangan koneksi x1 dengan y. Akibatnya, pengaruh tidak langsung variasi x1 melalui faktor-faktor yang tidak termasuk dalam persamaan adalah kebalikannya, sehingga menghasilkan total:


1 Ayvazyan S.A., Mkhitaryan V.S. Statistika terapan dan dasar-dasar ekonometrik. Buku teks untuk universitas. - M.: UNITY, 2008, – 311 hal.

2 Johnston J. Metode ekonometrik. - M.: Statistika, 1980. – 282 detik.

3 Dougherty K. Pengantar ekonometrik. - M.: INFRA-M, 2004, – 354 hal.

4 Dreyer N., Smith G., Analisis regresi terapan. - M.: Keuangan dan Statistik, 2006, – 191 hal.

5 Magnus Y.R., Kartyshev P.K., Peresetsky A.A. Ekonometrika. Kursus awal.-M.: Delo, 2006, – 259 hal.

6 Workshop Ekonometri/Ed. I.I. Eliseeva. - M.: Keuangan dan Statistik, 2004, – 248 hal.

7 Ekonometrika/Ed. I.I. Eliseeva. - M.: Keuangan dan Statistik, 2004, – 541 hal.

8 Kremer N., Putko B. Ekonometrika. - M.: UNITY-DANA, 200, – 281 hal.



bimbingan belajar

Butuh bantuan mempelajari suatu topik?

Spesialis kami akan memberi saran atau memberikan layanan bimbingan belajar tentang topik yang Anda minati.
Kirimkan lamaran Anda menunjukkan topik saat ini untuk mengetahui kemungkinan mendapatkan konsultasi.

PEKERJAAN KURSUS

Topik: Analisis korelasi

Perkenalan

1. Analisis korelasi

1.1 Konsep korelasi

1.2 Klasifikasi umum korelasi

1.3 Bidang korelasi dan tujuan konstruksinya

1.4 Tahapan analisis korelasi

1.5 Koefisien korelasi

1.6 Koefisien korelasi Bravais-Pearson yang dinormalisasi

1.7 Koefisien korelasi peringkat pendekar tombak

1.8 Sifat dasar koefisien korelasi

1.9 Memeriksa signifikansi koefisien korelasi

1.10 Nilai-nilai kritis koefisien korelasi berpasangan

2. Merencanakan percobaan multifaktorial

2.1 Kondisi permasalahan

2.2 Penentuan pusat rencana (tingkat dasar) dan tingkat variasi faktor

2.3 Konstruksi matriks perencanaan

2.4 Memeriksa homogenitas dispersi dan kesetaraan pengukuran dalam rangkaian yang berbeda

2.5 Koefisien persamaan regresi

2.6 Varians reproduktifitas

2.7 Memeriksa signifikansi koefisien persamaan regresi

2.8 Memeriksa kecukupan persamaan regresi

Kesimpulan

Bibliografi

PERKENALAN

Perencanaan eksperimental adalah disiplin matematika dan statistik yang mempelajari metode organisasi rasional penelitian eksperimental- dari pilihan optimal faktor-faktor yang dipelajari dan penentuan rencana percobaan yang sebenarnya sesuai dengan tujuannya hingga metode analisis hasilnya. Perencanaan eksperimental dimulai dengan karya ahli statistik Inggris R. Fisher (1935), yang menekankan bahwa perencanaan eksperimental rasional memberikan peningkatan yang tidak kalah signifikannya dalam keakuratan perkiraan dibandingkan dengan pemrosesan hasil pengukuran yang optimal. Pada tahun 60an abad ke-20 ada teori modern merencanakan percobaan. Metodenya berkaitan erat dengan teori perkiraan fungsi dan pemrograman matematika. Rencana optimal dibangun dan propertinya dipelajari untuk berbagai model.

Perencanaan eksperimental – pemilihan rencana eksperimen yang memenuhi persyaratan tertentu, serangkaian tindakan yang bertujuan untuk mengembangkan strategi eksperimen (mulai dari memperoleh informasi apriori hingga memperoleh model matematika yang dapat diterapkan atau menentukan kondisi optimal). Ini adalah kontrol yang disengaja atas suatu eksperimen, yang dilaksanakan dalam kondisi pengetahuan yang tidak lengkap tentang mekanisme fenomena yang sedang dipelajari.

Dalam proses pengukuran, pengolahan data selanjutnya, serta formalisasi hasil dalam bentuk model matematika, timbul kesalahan dan sebagian informasi yang terkandung dalam data asli hilang. Penggunaan metode perencanaan eksperimental memungkinkan untuk menentukan kesalahan model matematika dan menilai kecukupannya. Jika keakuratan model tidak mencukupi, maka penggunaan metode perencanaan eksperimental memungkinkan modernisasi model matematika dengan eksperimen tambahan tanpa kehilangan informasi sebelumnya dan dengan biaya minimal.

Tujuan perencanaan suatu percobaan adalah untuk menemukan kondisi dan aturan untuk melakukan percobaan yang memungkinkan untuk memperoleh informasi yang andal dan dapat diandalkan tentang suatu objek dengan jumlah tenaga kerja paling sedikit, serta untuk menyajikan informasi ini dalam bentuk yang ringkas dan nyaman. dengan penilaian akurasi kuantitatif.

Di antara metode perencanaan utama yang digunakan pada berbagai tahap penelitian adalah:

Merencanakan eksperimen penyaringan, yang makna utamanya adalah pemilihan sekelompok faktor penting dari seluruh rangkaian faktor yang harus dipelajari lebih lanjut secara rinci;

Desain percobaan untuk ANOVA, yaitu menyusun rencana objek dengan mempertimbangkan faktor kualitatif;

Merencanakan percobaan regresi yang memungkinkan Anda memperoleh model regresi(polinomial dan lain-lain);

Merencanakan percobaan ekstrim yang tugas utamanya adalah optimalisasi percobaan objek penelitian;

Perencanaan saat mempelajari proses dinamis, dll.

Tujuan mempelajari disiplin ini adalah untuk mempersiapkan siswa untuk kegiatan produksi dan teknis dalam spesialisasi mereka dengan menggunakan metode teori perencanaan dan teknologi informasi modern.

Tujuan dari disiplin: belajar metode modern perencanaan, pengorganisasian dan optimalisasi percobaan ilmiah dan industri, pelaksanaan percobaan dan pengolahan hasil yang diperoleh.

1. ANALISIS KORELASI

1.1 Konsep korelasi

Seorang peneliti sering kali tertarik pada bagaimana dua variabel atau lebih berhubungan satu sama lain dalam satu atau lebih sampel yang diteliti. Misalnya, apakah tinggi badan dapat memengaruhi berat badan seseorang, atau apakah tekanan darah dapat memengaruhi kualitas produk?

Ketergantungan antar variabel seperti ini disebut korelasi, atau korelasi. Korelasi adalah perubahan yang konsisten pada dua karakteristik, yang mencerminkan fakta bahwa variabilitas suatu karakteristik sesuai dengan variabilitas karakteristik lainnya.

Misalnya, diketahui bahwa rata-rata ada perbedaan antara tinggi badan seseorang dan berat badannya. koneksi positif, dan semakin tinggi tinggi badan, semakin besar pula berat badan seseorang. Namun, ada pengecualian terhadap aturan ini jika relatif orang pendek memiliki kegemukan, dan sebaliknya, asthenics, dengan perawakan tinggi, memiliki berat badan rendah. Alasan pengecualian tersebut adalah karena setiap faktor biologis, fisiologis atau tanda psikologis ditentukan oleh pengaruh banyak faktor: lingkungan, genetik, sosial, lingkungan, dll.

Hubungan korelasi merupakan perubahan probabilistik yang hanya dapat dipelajari pada sampel yang representatif dengan menggunakan metode statistik matematika. Kedua istilah – hubungan korelasi dan ketergantungan korelasi – sering digunakan secara bergantian. Ketergantungan menyiratkan pengaruh, koneksi - setiap perubahan terkoordinasi yang dapat dijelaskan dengan ratusan alasan. Hubungan korelasi tidak dapat dianggap sebagai bukti hubungan sebab-akibat; hubungan tersebut hanya menunjukkan bahwa perubahan pada satu karakteristik biasanya disertai dengan perubahan tertentu pada karakteristik lainnya.

Ketergantungan korelasi - ini adalah perubahan yang memasukkan nilai suatu karakteristik ke dalam probabilitas terjadinya arti yang berbeda tanda lain.

Tugas analisis korelasi adalah menetapkan arah (positif atau negatif) dan bentuk (linier, nonlinier) hubungan antara berbagai karakteristik, mengukur kedekatannya, dan terakhir, memeriksa tingkat signifikansi koefisien korelasi yang diperoleh.

Hubungan korelasi bervariasi dalam bentuk, arah dan derajat (kekuatan) .

Bentuk hubungan korelasinya bisa linier atau lengkung. Misalnya, hubungan antara jumlah sesi pelatihan pada simulator dan jumlah masalah yang diselesaikan dengan benar dalam sesi kontrol mungkin bersifat langsung. Misalnya, hubungan antara tingkat motivasi dan efektivitas suatu tugas mungkin berbentuk kurva (Gambar 1). Dengan meningkatnya motivasi, efektivitas penyelesaian suatu tugas mula-mula meningkat, kemudian tercapai tingkat motivasi optimal, yang sesuai dengan efektivitas maksimum penyelesaian tugas; Peningkatan motivasi lebih lanjut disertai dengan penurunan efisiensi.

Gambar 1 - Hubungan antara efektivitas pemecahan masalah dan kekuatan kecenderungan motivasi

Secara arah, hubungan korelasi dapat bersifat positif (“langsung”) dan negatif (“terbalik”). Dengan korelasi linier positif, nilai yang lebih tinggi dari satu karakteristik berhubungan dengan nilai yang lebih tinggi dari karakteristik lainnya, dan nilai yang lebih rendah dari satu karakteristik berhubungan dengan nilai rendah lainnya (Gambar 2). Dengan korelasi negatif, hubungannya berbanding terbalik (Gambar 3). Dengan korelasi positif maka koefisien korelasinya adalah tanda positif, dengan korelasi negatif - tanda negatif.

Gambar 2 – Korelasi langsung

Gambar 3 – Korelasi terbalik


Gambar 4 – Tidak ada korelasi

Derajat, kekuatan atau keeratan korelasi ditentukan oleh nilai koefisien korelasi. Kekuatan sambungan tidak bergantung pada arahnya dan ditentukan oleh nilai mutlak koefisien korelasi.

1.2 Klasifikasi umum korelasi

Tergantung pada koefisien korelasinya, korelasi berikut dibedakan:

Kuat atau mendekati dengan koefisien korelasi r>0,70;

Rata-rata (pada 0,50

Sedang (pada 0,30

Lemah (pada 0,20

Sangat lemah (di r<0,19).

1.3 Bidang korelasi dan tujuan konstruksinya

Korelasi dipelajari berdasarkan data eksperimen, yaitu nilai terukur (xi, y i) dari dua karakteristik. Jika data eksperimennya sedikit, maka distribusi empiris dua dimensi direpresentasikan sebagai deret ganda nilai x i dan y i. Pada saat yang sama, ketergantungan korelasi antar karakteristik dapat dijelaskan dengan cara yang berbeda. Korespondensi antara argumen dan fungsi dapat diberikan melalui tabel, rumus, grafik, dll.

Analisis korelasi, seperti metode statistik lainnya, didasarkan pada penggunaan model probabilistik yang menggambarkan perilaku karakteristik yang diteliti pada populasi umum tertentu yang darinya diperoleh nilai eksperimen xi dan y i. Ketika mempelajari korelasi antara karakteristik kuantitatif, yang nilainya dapat diukur secara akurat dalam satuan skala metrik (meter, detik, kilogram, dll.), model populasi dua dimensi yang terdistribusi normal sangat sering diadopsi. Model seperti itu menampilkan hubungan antara variabel x i dan y i secara grafis dalam bentuk letak geometris titik-titik dalam sistem koordinat persegi panjang. Hubungan grafis ini juga disebut sebar atau bidang korelasi.
Model distribusi normal dua dimensi (bidang korelasi) memungkinkan kita memberikan interpretasi grafis yang jelas tentang koefisien korelasi, karena distribusi secara total bergantung pada lima parameter: μ x, μ y – nilai rata-rata (ekspektasi matematis); σ x,σ y – simpangan baku variabel acak X dan Y dan p – koefisien korelasi, yaitu ukuran hubungan antara variabel acak X dan Y.
Jika p = 0, maka nilai x i , y i yang diperoleh dari populasi normal dua dimensi terletak pada grafik pada koordinat x, y dalam luas yang dibatasi lingkaran (Gambar 5, a). Dalam hal ini tidak ada korelasi antara variabel acak X dan Y dan disebut tidak berkorelasi. Untuk distribusi normal dua dimensi, ketidaksesuaian secara simultan berarti independensi variabel acak X dan Y.



Baru di situs

>

Paling populer