Rumah Pemindahan Korelasi positif dan negatif di excel. Bagaimana melakukan korelasi di Excel

Korelasi positif dan negatif di excel. Bagaimana melakukan korelasi di Excel

DI DALAM penelitian ilmiah Seringkali ada kebutuhan untuk menemukan hubungan antara hasil dan variabel faktor (hasil panen dan jumlah curah hujan, tinggi dan berat badan seseorang dalam kelompok homogen berdasarkan jenis kelamin dan usia, denyut nadi dan suhu tubuh, dll.) .

Yang kedua adalah tanda-tanda yang berkontribusi terhadap perubahan yang terkait dengannya (yang pertama).

Konsep analisis korelasi

Berdasarkan uraian di atas, kita dapat mengatakan bahwa analisis korelasi adalah suatu metode yang digunakan untuk menguji hipotesis tentang signifikansi statistik dua variabel atau lebih jika peneliti dapat mengukurnya tetapi tidak dapat mengubahnya.

Ada definisi lain dari konsep yang dimaksud. Analisis korelasi adalah metode pemrosesan yang melibatkan mempelajari koefisien korelasi antar variabel. Dalam hal ini, koefisien korelasi antara satu pasang atau banyak pasang karakteristik dibandingkan untuk membangun hubungan statistik di antara keduanya. Analisis korelasi adalah suatu metode untuk mempelajari ketergantungan statistik antara variabel acak dengan adanya opsional yang bersifat fungsional yang ketat, di mana dinamika suatu variabel variabel acak mengarah pada dinamika ekspektasi matematis lain.

Konsep korelasi palsu

Saat melakukan analisis korelasi, perlu diingat bahwa analisis tersebut dapat dilakukan dalam kaitannya dengan serangkaian karakteristik apa pun, seringkali tidak masuk akal dalam kaitannya satu sama lain. Terkadang mereka tidak memiliki hubungan sebab akibat satu sama lain.

Dalam hal ini, mereka berbicara tentang korelasi yang salah.

Masalah analisis korelasi

Berdasarkan definisi di atas, dapat dirumuskan tugas metode yang dijelaskan sebagai berikut: memperoleh informasi tentang salah satu variabel yang dicari dengan menggunakan variabel lain; mengetahui keeratan hubungan antar variabel yang diteliti.

Analisis korelasi meliputi penentuan hubungan antara ciri-ciri yang diteliti, oleh karena itu tugas analisis korelasi dapat dilengkapi dengan hal-hal berikut:

  • identifikasi faktor-faktor yang mempunyai pengaruh paling besar terhadap karakteristik yang dihasilkan;
  • identifikasi penyebab koneksi yang belum dijelajahi sebelumnya;
  • konstruksi model korelasi dengan analisis parametriknya;
  • studi tentang pentingnya parameter komunikasi dan penilaian intervalnya.

Hubungan antara analisis korelasi dan regresi

Metode analisis korelasi seringkali tidak sebatas mencari keeratan hubungan antara besaran-besaran yang diteliti. Kadang-kadang dilengkapi dengan penyusunan persamaan regresi, yang diperoleh dengan menggunakan analisis dengan nama yang sama, dan yang mewakili gambaran ketergantungan korelasi antara karakteristik (fitur) yang dihasilkan dan faktor (faktor). Metode ini, bersama dengan analisis yang sedang dipertimbangkan, merupakan metode

Ketentuan untuk menggunakan metode ini

Faktor efektif bergantung pada satu hingga beberapa faktor. Metode analisis korelasi dapat digunakan apabila terdapat banyak pengamatan mengenai nilai efektif dan indikator faktor (faktor), sedangkan faktor yang diteliti harus bersifat kuantitatif dan tercermin dalam sumber tertentu. Yang pertama dapat ditentukan oleh hukum normal - dalam hal ini, hasil analisis korelasi adalah koefisien korelasi Pearson, atau jika karakteristiknya tidak mematuhi hukum ini, koefisien yang digunakan korelasi peringkat Pendekar tombak.

Aturan untuk memilih faktor analisis korelasi

Ketika menggunakan metode ini perlu diketahui faktor-faktor yang mempengaruhi indikator kinerja. Mereka dipilih dengan mempertimbangkan fakta bahwa harus ada hubungan sebab-akibat antara indikator-indikator tersebut. Dalam hal pembuatan model korelasi multifaktor, dipilih faktor-faktor yang memiliki pengaruh signifikan terhadap indikator yang dihasilkan, sedangkan faktor-faktor yang saling bergantung dengan koefisien korelasi berpasangan lebih dari 0,85 sebaiknya tidak dimasukkan dalam model korelasi, serta faktor-faktor tersebut. yang hubungannya dengan parameter yang dihasilkan tidak bersifat linier atau fungsional.

Menampilkan hasil

Hasil analisis korelasi dapat disajikan dalam bentuk teks dan grafik. Dalam kasus pertama mereka disajikan sebagai koefisien korelasi, dalam kasus kedua - dalam bentuk diagram sebar.

Dengan tidak adanya korelasi antar parameter, titik-titik pada diagram terletak secara kacau, derajat keterhubungan rata-rata dicirikan oleh tingkat keteraturan yang lebih besar dan dicirikan oleh jarak yang kurang lebih seragam dari tanda-tanda yang ditandai dari median. Sambungan kuat cenderung lurus dan pada r=1 plot titiknya berupa garis datar. Korelasi terbalik berbeda arah grafik dari kiri atas ke kanan bawah, korelasi langsung - dari kiri bawah ke sudut kanan atas.

Representasi 3D dari plot sebar

Selain tampilan plot sebar 2D tradisional, representasi grafis 3D dari analisis korelasi kini digunakan.

Matriks scatterplot juga digunakan, yang menampilkan semua plot berpasangan dalam satu gambar dalam format matriks. Untuk n variabel, matriksnya memuat n baris dan n kolom. Bagan yang terletak pada perpotongan baris ke-i dan kolom ke-j merupakan plot variabel Xi versus Xj. Jadi, setiap baris dan kolom adalah satu dimensi, satu sel menampilkan plot sebar dua dimensi.

Menilai kekencangan sambungan

Keeratan hubungan korelasi ditentukan oleh koefisien korelasi (r): kuat - r = ±0,7 hingga ±1, sedang - r = ±0,3 hingga ±0,699, lemah - r = 0 hingga ±0,299. Klasifikasi ini tidak ketat. Gambar tersebut menunjukkan diagram yang sedikit berbeda.

Contoh penggunaan metode analisis korelasi

Sebuah penelitian menarik dilakukan di Inggris. Hal ini dikhususkan untuk hubungan antara merokok dan kanker paru-paru, dan dilakukan melalui analisis korelasi. Pengamatan ini disajikan di bawah ini.

Data awal untuk analisis korelasi

Kelompok profesional

kematian

Petani, rimbawan dan nelayan

Penambang dan pekerja tambang

Produsen gas, kokas, dan bahan kimia

Produsen kaca dan keramik

Pekerja tungku, bengkel, pengecoran dan pabrik penggilingan

Pekerja listrik dan elektronik

Teknik dan profesi terkait

Industri pengerjaan kayu

Pekerja kulit

Pekerja tekstil

Produsen pakaian kerja

Pekerja di industri makanan, minuman dan tembakau

Produsen Kertas dan Cetak

Produsen produk lainnya

Pembangun

Pelukis dan dekorator

Pengemudi mesin stasioner, crane, dll.

Pekerja yang tidak termasuk di tempat lain

Pekerja transportasi dan komunikasi

Pekerja gudang, pemilik toko, pengepakan dan pekerja mesin pengisi

Pekerja kantor

Penjual

Pekerja olahraga dan rekreasi

Administrator dan manajer

Profesional, teknisi dan seniman

Kami memulai analisis korelasi. Lebih baik memulai solusi untuk kejelasan dengan metode grafis, untuk itu kita akan membuat diagram pencar.

Ini menunjukkan hubungan langsung. Namun, sulit untuk menarik kesimpulan yang jelas hanya berdasarkan metode grafis. Oleh karena itu, kami akan terus melakukan analisis korelasi. Contoh penghitungan koefisien korelasi disajikan di bawah ini.

Dengan menggunakan software (MS Excel akan dijelaskan sebagai contoh di bawah), kita menentukan koefisien korelasi yaitu 0,716 yang berarti adanya hubungan yang kuat antara parameter yang diteliti. Mari kita tentukan reliabilitas statistik dari nilai yang diperoleh menggunakan tabel yang sesuai, yang mana kita perlu mengurangi 2 dari 25 pasangan nilai, sebagai hasilnya kita mendapatkan 23 dan menggunakan baris ini dalam tabel kita menemukan r kritis untuk p = 0,01 (karena ini adalah data medis, ketergantungan yang lebih ketat, dalam kasus lain p=0,05 sudah cukup), yaitu 0,51 untuk analisis korelasi ini. Contoh tersebut menunjukkan bahwa r yang dihitung lebih besar dari r kritis, dan nilai koefisien korelasi dianggap dapat diandalkan secara statistik.

Menggunakan perangkat lunak saat melakukan analisis korelasi

Jenis pemrosesan data statistik yang dijelaskan dapat dilakukan dengan menggunakan perangkat lunak, khususnya MS Excel. Korelasi melibatkan penghitungan parameter berikut menggunakan fungsi:

1. Koefisien korelasi ditentukan dengan menggunakan fungsi CORREL (array1; array2). Array1,2 - sel interval nilai variabel resultan dan faktor.

Koefisien korelasi linier juga disebut koefisien korelasi Pearson, dan oleh karena itu, mulai dari Excel 2007, Anda bisa menggunakan fungsi dengan array yang sama.

Tampilan grafis analisis korelasi di Excel dilakukan menggunakan panel “Charts” dengan pilihan “Scatter Plot”.

Setelah menentukan data awal, kami mendapatkan grafik.

2. Menilai signifikansi koefisien korelasi berpasangan menggunakan uji-t Student. Nilai kriteria-t yang dihitung dibandingkan dengan nilai tabulasi (kritis) indikator ini dari tabel nilai parameter yang bersangkutan, dengan mempertimbangkan tingkat signifikansi yang ditentukan dan jumlah derajat kebebasan. Estimasi ini dilakukan dengan menggunakan fungsi STUDISCOVER(probabilitas; derajat_kebebasan_).

3. Matriks koefisien korelasi berpasangan. Analisis dilakukan dengan menggunakan alat Analisis Data yang mana dipilih Korelasi. Penilaian statistik koefisien korelasi berpasangan dilakukan dengan membandingkan nilai absolutnya dengan nilai tabulasi (kritis). Ketika koefisien korelasi berpasangan yang dihitung melebihi koefisien kritis, kita dapat mengatakan, dengan mempertimbangkan tingkat probabilitas tertentu, bahwa hipotesis nol tentang signifikansi hubungan linier tidak ditolak.

Akhirnya

Penggunaan metode analisis korelasi dalam penelitian ilmiah memungkinkan kita untuk mengetahui hubungan antar berbagai faktor dan indikator kinerja. Perlu diingat bahwa koefisien korelasi yang tinggi dapat diperoleh dari pasangan atau kumpulan data yang tidak masuk akal, dan oleh karena itu tipe ini analisis harus dilakukan pada kumpulan data yang cukup besar.

Setelah memperoleh nilai r yang dihitung, disarankan untuk membandingkannya dengan r kritis untuk memastikan keandalan statistik dari nilai tertentu. Analisis korelasi dapat dilakukan secara manual dengan menggunakan rumus, maupun dengan menggunakan software khususnya MS Excel. Di sini Anda juga dapat membuat diagram sebar untuk mewakili secara visual hubungan antara faktor-faktor analisis korelasi yang dipelajari dan karakteristik yang dihasilkan.

Dalam artikel hari ini kita akan bicara tentang bagaimana variabel dapat dihubungkan satu sama lain. Dengan menggunakan korelasi, kita dapat menentukan apakah terdapat hubungan antara variabel pertama dan kedua. Saya harap aktivitas ini sama menyenangkannya dengan aktivitas sebelumnya!

Korelasi mengukur kekuatan dan arah hubungan antara x dan y. Gambar tersebut menunjukkan Berbagai jenis korelasi berupa scatter plot pasangan terurut (x,y). Secara tradisional, variabel x ditempatkan pada sumbu horisontal, dan y - pada vertikal.

Grafik A adalah contoh korelasi linier positif: jika x bertambah, y juga bertambah, dan linier. Grafik B menunjukkan contoh korelasi linier negatif, dimana jika x bertambah, y berkurang secara linier. Pada grafik C kita melihat tidak ada korelasi antara x dan y. Variabel-variabel ini tidak saling mempengaruhi satu sama lain.

Terakhir, Grafik D merupakan contoh hubungan nonlinier antar variabel. Ketika x bertambah, y mula-mula berkurang, kemudian berubah arah dan bertambah.

Sisa artikel ini berfokus pada hubungan linear antara variabel dependen dan independen.

Koefisien korelasi

Koefisien korelasi, r, memberi kita kekuatan dan arah hubungan antara variabel bebas dan variabel terikat. Nilai r berkisar antara -1,0 dan +1,0. Jika r positif, maka hubungan antara x dan y adalah positif (grafik A pada gambar), dan jika r negatif, hubungannya juga negatif (grafik B). Koefisien korelasi yang mendekati nol menunjukkan tidak adanya hubungan antara x dan y (grafik C).

Kuat tidaknya hubungan antara x dan y ditentukan oleh apakah koefisien korelasinya mendekati -1,0 atau +-1,0. Pelajari gambar berikut.

Grafik A menunjukkan korelasi positif sempurna antara x dan y pada r = + 1,0. Grafik B - korelasi negatif ideal antara x dan y pada r = - 1.0. Grafik C dan D merupakan contoh lemahnya hubungan antara variabel terikat dan variabel bebas.

Koefisien korelasi, r, menentukan kekuatan dan arah hubungan antara variabel terikat dan bebas. Nilai r berkisar antara -1,0 (hubungan negatif kuat) hingga +1,0 (hubungan positif kuat). Ketika r = 0 tidak ada hubungan antara variabel x dan y.

Kita dapat menghitung koefisien korelasi sebenarnya menggunakan persamaan berikut:

Baiklah! Saya tahu persamaan ini terlihat seperti kumpulan simbol-simbol aneh yang menakutkan, namun sebelum kita panik, mari kita terapkan contoh nilai ujian pada persamaan tersebut. Katakanlah saya ingin menentukan apakah ada hubungan antara jumlah jam yang dicurahkan seorang siswa untuk mempelajari statistik dan nilai ujian akhir. Tabel di bawah ini akan membantu kita memecah persamaan ini menjadi beberapa perhitungan sederhana dan membuatnya lebih mudah dikelola.

Seperti yang Anda lihat, ada korelasi positif yang sangat kuat antara jumlah jam yang dicurahkan untuk mempelajari suatu mata pelajaran dan nilai ujian. Guru akan sangat senang mengetahui hal ini.

Apa manfaat menjalin hubungan antar variabel serupa? Pertanyaan bagus. Jika ditemukan adanya hubungan, kita dapat memprediksi hasil ujian berdasarkan jumlah jam yang dihabiskan untuk mempelajari mata pelajaran tersebut. Sederhananya, semakin kuat hubungannya, prediksi kita akan semakin akurat.

Menggunakan Excel untuk Menghitung Koefisien Korelasi

Saya yakin ketika Anda melihat perhitungan koefisien korelasi yang buruk ini, Anda akan sangat senang mengetahuinya program Unggul dapat melakukan semua pekerjaan ini untuk Anda menggunakan fungsi CORREL dengan karakteristik sebagai berikut:

CORREL (susunan 1; susunan 2),

array 1 = rentang data untuk variabel pertama,

array 2 = rentang data untuk variabel kedua.

Misalnya, gambar menunjukkan fungsi CORREL yang digunakan untuk menghitung koefisien korelasi untuk contoh nilai ujian.

Koefisien korelasi (atau koefisien linier korelasi) dilambangkan sebagai "r" (dalam kasus yang jarang terjadi sebagai "ρ") dan mencirikannya korelasi linier(yaitu, hubungan yang diberikan oleh suatu nilai dan arah) dari dua variabel atau lebih. Nilai koefisiennya terletak antara -1 dan +1, artinya korelasinya bisa positif dan negatif. Jika koefisien korelasinya -1, maka terdapat korelasi negatif sempurna; jika koefisien korelasinya +1 maka terjadi korelasi positif sempurna. Dalam kasus lain, terdapat korelasi positif, korelasi negatif, atau tidak ada korelasi antara dua variabel. Koefisien korelasi dapat dihitung secara manual, menggunakan kalkulator online gratis, atau menggunakan kalkulator grafik yang bagus.

Langkah

Menghitung koefisien korelasi secara manual

    Mengumpulkan data. Sebelum Anda mulai menghitung koefisien korelasi, pelajari pasangan angka yang diberikan. Sebaiknya dituliskan dalam tabel yang dapat diletakkan secara vertikal atau horizontal. Beri label setiap baris atau kolom dengan "x" dan "y".

    • Misalnya, diberikan empat pasang nilai (angka) dari variabel “x” dan “y”. Anda dapat membuat tabel berikut:
      • x || kamu
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  1. Hitung mean aritmatika dari "x". Caranya, jumlahkan semua nilai “x”, lalu bagi hasilnya dengan banyaknya nilai.

    • Dalam contoh kita, empat nilai variabel “x” diberikan. Untuk menghitung mean aritmatika dari "x", tambahkan nilai-nilai ini, lalu bagi jumlahnya dengan 4. Perhitungannya akan ditulis seperti ini:
    • μ x = (1 + 2 + 4 + 5) / 4 (\displaystyle \mu _(x)=(1+2+4+5)/4)
    • μ x = 12 / 4 (\displaystyle \mu _(x)=12/4)
    • μ x = 3 (\displaystyle \mu _(x)=3)
  2. Temukan mean aritmatika "y". Untuk melakukan ini, jalankan tindakan serupa, yaitu menjumlahkan semua nilai “y”, lalu membagi jumlahnya dengan banyaknya nilai.

    • Dalam contoh kita, empat nilai variabel “y” diberikan. Tambahkan nilai-nilai ini, lalu bagi jumlahnya dengan 4. Perhitungannya akan ditulis seperti ini:
    • μ y = (1 + 3 + 5 + 7) / 4 (\displaystyle \mu _(y)=(1+3+5+7)/4)
    • μ y = 16/4 (\displaystyle \mu _(y)=16/4)
    • μ y = 4 (\displaystyle \mu _(y)=4)
  3. Hitung simpangan baku "x". Setelah menghitung nilai rata-rata “x” dan “y”, carilah deviasi standar variabel-variabel ini. Simpangan baku dihitung menggunakan rumus berikut:

    • σ x = 1 n − 1 Σ (x − μ x) 2 (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(n-1))\Sigma (x-\mu _( x))^(2))))
    • σ x = 1 4 − 1 ∗ ((1 − 3) 2 + (2 − 3) 2 + (4 − 3) 2 + (5 − 3) 2) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(4-1))*((1-3)^(2)+(2-3)^(2)+(4-3)^(2)+(5-3) ^(2)))))
    • σ x = 1 3 ∗ (4 + 1 + 1 + 4) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(4+1+1+4)) ))
    • σ x = 1 3 ∗ (10) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(10))))
    • σ x = 10 3 (\displaystyle \sigma _(x)=(\sqrt (\frac (10)(3))))
    • σ x = 1, 83 (\displaystyle \sigma _(x)=1,83)
  4. Hitung simpangan baku "y". Ikuti langkah-langkah yang dijelaskan pada langkah sebelumnya. Gunakan rumus yang sama, tetapi gantikan nilai “y” ke dalamnya.

    • Dalam contoh kita, perhitungannya akan ditulis seperti ini:
    • σ y = 1 4 − 1 ∗ ((1 − 4) 2 + (3 − 4) 2 + (5 − 4) 2 + (7 − 4) 2) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(4-1))*((1-4)^(2)+(3-4)^(2)+(5-4)^(2)+(7-4) ^(2)))))
    • σ y = 1 3 ∗ (9 + 1 + 1 + 9) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(9+1+1+9)) ))
    • σ y = 1 3 ∗ (20) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(20))))
    • σ y = 20 3 (\displaystyle \sigma _(y)=(\sqrt (\frac (20)(3))))
    • σ y = 2,58 (\displaystyle \sigma _(y)=2,58)
  5. Tuliskan rumus dasar untuk menghitung koefisien korelasi. Rumus ini mencakup mean, simpangan baku, dan bilangan (n) pasangan bilangan untuk kedua variabel. Koefisien korelasi dilambangkan sebagai "r" (dalam kasus yang jarang terjadi sebagai "ρ"). Artikel ini menggunakan rumus untuk menghitung koefisien korelasi Pearson.

    • Di sini dan di sumber lain, kuantitas dapat ditetapkan secara berbeda. Misalnya, beberapa rumus berisi “ρ” dan “σ”, sedangkan rumus lainnya berisi “r” dan “s”. Beberapa buku teks memberikan rumus lain, tetapi rumus tersebut merupakan analogi matematika dari rumus di atas.
  6. Anda telah menghitung rata-rata dan deviasi standar kedua variabel, sehingga Anda dapat menggunakan rumus tersebut untuk menghitung koefisien korelasi. Ingatlah bahwa “n” adalah jumlah pasangan nilai untuk kedua variabel. Nilai besaran lain telah dihitung sebelumnya.

    • Dalam contoh kita, perhitungannya akan ditulis seperti ini:
    • ρ = (1 n − 1) Σ (x − μ x σ x) ∗ (y − μ y σ y) (\displaystyle \rho =\left((\frac (1)(n-1))\right) \Sigma \left((\frac (x-\mu _(x))(\sigma _(x)))\right)*\left((\frac (y-\mu _(y))(\sigma _(y)))\kanan))
    • ρ = (1 3) ∗ (\displaystyle \rho =\left((\frac (1)(3))\right)*)[ (1 − 3 1 , 83) ∗ (1 − 4 2 , 58) + (2 − 3 1 , 83) ∗ (3 − 4 2 , 58) (\displaystyle \left((\frac (1-3)( 1.83))\kanan)*\kiri((\frac (1-4)(2.58))\kanan)+\kiri((\frac (2-3)(1.83))\kanan) *\kiri((\ frak (3-4)(2.58))\kanan))
      + (4 − 3 1 , 83) ∗ (5 − 4 2 , 58) + (5 − 3 1 , 83) ∗ (7 − 4 2 , 58) (\displaystyle +\left((\frac (4-3 )(1.83))\kanan)*\kiri((\frac (5-4)(2.58))\kanan)+\kiri((\frac (5-3)(1.83))\ kanan)*\kiri( (\frac (7-4)(2.58))\kanan))]
    • ρ = (1 3) ∗ (6 + 1 + 1 + 6 4 , 721) (\displaystyle \rho =\left((\frac (1)(3))\right)*\left((\frac (6) +1+1+6)(4.721))\kanan))
    • ρ = (1 3) ∗ 2 , 965 (\displaystyle \rho =\left((\frac (1)(3))\right)*2,965)
    • ρ = (2 , 965 3) (\displaystyle \rho =\left((\frac (2,965)(3))\right))
    • ρ = 0,988 (\displaystyle \rho =0,988)
  7. Analisis hasilnya. Dalam contoh kita, koefisien korelasinya adalah 0,988. Nilai ini dalam beberapa hal mencirikan kumpulan pasangan angka ini. Perhatikan tanda dan besar nilainya.

    • Karena nilai koefisien korelasinya positif, maka terdapat korelasi positif antara variabel “x” dan “y”. Artinya, semakin besar nilai “x”, maka nilai “y” pun semakin meningkat.
    • Karena nilai koefisien korelasi sangat mendekati +1, maka nilai variabel “x” dan “y” sangat saling berhubungan. Jika Anda memplot titik-titik pada bidang koordinat, maka titik-titik tersebut akan terletak dekat dengan garis lurus tertentu.

    Menggunakan kalkulator online untuk menghitung koefisien korelasi

    1. Temukan kalkulator di Internet untuk menghitung koefisien korelasi. Koefisien ini cukup sering dihitung dalam statistik. Jika terdapat banyak pasangan angka, hampir tidak mungkin menghitung koefisien korelasi secara manual. Oleh karena itu, terdapat kalkulator online untuk menghitung koefisien korelasi. Di mesin pencari, masukkan “kalkulator koefisien korelasi” (tanpa tanda kutip).

    2. Masukkan datanya. Harap tinjau petunjuk di website untuk memastikan bahwa Anda memasukkan data (pasangan nomor) dengan benar. Sangatlah penting untuk memasukkan pasangan angka yang sesuai; jika tidak, Anda akan mendapatkan hasil yang salah. Ingatlah bahwa situs web yang berbeda memiliki format entri data yang berbeda.

      • Misalnya pada website http://ncalculators.com/statistics/correlation-coefisien-calculator.htm nilai variabel “x” dan “y” dimasukkan dalam dua garis horizontal. Nilai dipisahkan dengan koma. Artinya, dalam contoh kita, nilai “x” dimasukkan seperti ini: 1,2,4,5, dan nilai “y” seperti ini: 1,3,5,7.
      • Di situs lain, http://www.alcula.com/calculators/statistics/correlation-coefisien/, data dimasukkan secara vertikal; dalam hal ini, jangan bingung dengan pasangan angka yang bersesuaian.
    3. Hitung koefisien korelasinya. Setelah memasukkan data, cukup klik tombol “Hitung”, “Hitung” atau tombol serupa untuk mendapatkan hasilnya.

      Menggunakan kalkulator grafik

      1. Masukkan datanya. Ambil kalkulator grafik, masuk ke mode statistik dan pilih perintah Edit.

        • Kalkulator yang berbeda memerlukan penekanan tombol yang berbeda untuk ditekan. Artikel ini membahas kalkulator Texas Instruments TI-86.
        • Untuk beralih ke mode perhitungan statistik, tekan – Stat (di atas tombol “+”). Lalu tekan F2 – Sunting.
      2. Hapus data yang disimpan sebelumnya. Kebanyakan kalkulator menyimpan statistik yang Anda masukkan sampai Anda menghapusnya. Untuk menghindari kebingungan data lama dengan data baru, hapus dulu semua informasi yang tersimpan.

        • Gunakan tombol panah untuk memindahkan kursor dan menyorot judul "xStat". Kemudian tekan Clear dan Enter untuk menghapus semua nilai yang dimasukkan pada kolom xStat.
        • Gunakan tombol panah untuk menyorot judul "yStat". Kemudian tekan Clear dan Enter untuk menghapus semua nilai yang dimasukkan pada kolom yStat.
      3. Masukkan data awal. Gunakan tombol panah untuk memindahkan kursor ke sel pertama di bawah judul "xStat". Masukkan nilai pertama dan tekan Enter. “xStat (1) = __” akan ditampilkan di bagian bawah layar, di mana nilai yang dimasukkan akan muncul, bukan spasi. Setelah Anda menekan Enter, nilai yang dimasukkan akan muncul di tabel dan kursor akan berpindah ke baris berikutnya; ini akan menampilkan “xStat (2) = __” di bagian bawah layar.

        • Masukkan semua nilai untuk variabel "x".
        • Setelah memasukkan semua nilai variabel x, gunakan tombol panah untuk berpindah ke kolom yStat dan masukkan nilai variabel y.
        • Setelah semua pasangan angka dimasukkan, tekan Keluar untuk menghapus layar dan keluar dari mode penghitungan statistik.
      4. Hitung koefisien korelasinya. Ini mencirikan seberapa dekat data dengan garis tertentu. Kalkulator grafik dapat dengan cepat menentukan garis yang sesuai dan menghitung koefisien korelasi.

        • Klik Stat – Kalkulasi. Pada TI-86 Anda perlu menekan – –.
        • Pilih fungsi "Regresi Linier". Pada TI-86, tekan , yang diberi label "LinR". Layar akan menampilkan baris “LinR_” dengan kursor berkedip.
        • Sekarang masukkan nama dua variabel: xStat dan yStat.
          • Di TI-86, buka daftar nama; Untuk melakukannya, tekan – – .
          • Baris bawah layar akan menampilkan variabel yang tersedia. Pilih (Anda mungkin perlu menekan F1 atau F2 untuk melakukannya), masukkan koma, lalu pilih .
          • Tekan Enter untuk memproses data yang dimasukkan.
      5. Analisis hasil Anda. Dengan menekan Enter, informasi berikut akan ditampilkan di layar:

        • y = a + bx (\displaystyle y=a+bx): Ini adalah fungsi yang menggambarkan garis lurus. Perlu diketahui bahwa fungsi tersebut tidak ditulis dalam bentuk baku (y = kh + b).
        • a = (\gaya tampilan a=). Ini adalah koordinat “y” dari titik perpotongan garis dengan sumbu Y.
        • b = (\gaya tampilan b=). Ini adalah kemiringan garisnya.
        • corr = (\displaystyle (\text(corr))=). Ini adalah koefisien korelasi.
        • n = (\gaya tampilan n=). Ini adalah jumlah pasangan angka yang digunakan dalam perhitungan.

Analisis regresi dan korelasi adalah metode penelitian statistik. Ini adalah cara paling umum untuk menunjukkan ketergantungan suatu parameter pada satu atau lebih variabel independen.

Di bawah secara spesifik contoh praktis Mari kita lihat dua analisis yang sangat populer di kalangan ekonom. Kami juga akan memberikan contoh memperoleh hasil dengan menggabungkannya.

Analisis Regresi di Excel

Menunjukkan pengaruh beberapa nilai (independen, independen) terhadap variabel dependen. Misalnya, jumlah penduduk yang aktif secara ekonomi bergantung pada jumlah perusahaan, upah, dan parameter lainnya. Atau: bagaimana investasi asing, harga energi, dll mempengaruhi tingkat PDB.

Hasil analisis memungkinkan Anda untuk mengidentifikasi prioritas. Dan berdasarkan faktor-faktor utama tersebut, memprediksi, merencanakan pengembangan kawasan prioritas, dan mengambil keputusan pengelolaan.

Regresi terjadi:

  • linier (y = a + bx);
  • parabola (y = a + bx + cx 2);
  • eksponensial (y = a * exp(bx));
  • pangkat (y = a*x^b);
  • hiperbolik (y = b/x + a);
  • logaritma (y = b * 1n(x) + a);
  • eksponensial (y = a * b^x).

Mari kita lihat konstruksinya sebagai contoh model regresi di Excel dan interpretasi hasilnya. Mari kita ambil jenis regresi linier.

Tugas. Di 6 perusahaan, rata-rata bulanan gaji dan jumlah karyawan yang keluar. Perlu diketahui ketergantungan jumlah pegawai yang berhenti terhadap gaji rata-rata.

Model regresi linier memiliki bentuk berikut:

Y = a 0 + a 1 x 1 +…+a k x k.

Dimana a adalah koefisien regresi, x adalah variabel yang mempengaruhi, k adalah banyaknya faktor.

Dalam contoh kita, Y adalah indikator berhentinya karyawan. Faktor yang mempengaruhi adalah upah (x).

Excel memiliki fungsi bawaan yang bisa membantu Anda menghitung parameter model regresi linier. Namun add-on “Paket Analisis” akan melakukan ini lebih cepat.

Kami mengaktifkan alat analisis yang kuat:

Setelah diaktifkan, add-on akan tersedia di tab Data.

Sekarang mari kita lakukan analisis regresi itu sendiri.



Pertama-tama, kita memperhatikan R-kuadrat dan koefisiennya.

R-squared adalah koefisien determinasi. Dalam contoh kita – 0,755, atau 75,5%. Artinya parameter model yang dihitung menjelaskan 75,5% hubungan antar parameter yang diteliti. Semakin tinggi koefisien determinasi maka semakin baik model tersebut. Bagus - di atas 0,8. Buruk – kurang dari 0,5 (analisis seperti itu hampir tidak dapat dianggap masuk akal). Dalam contoh kita – “tidak buruk”.

Koefisien 64,1428 menunjukkan berapa Y jika seluruh variabel dalam model yang dipertimbangkan sama dengan 0. Artinya, nilai parameter yang dianalisis juga dipengaruhi oleh faktor lain yang tidak dijelaskan dalam model.

Koefisien -0,16285 menunjukkan bobot variabel X terhadap Y. Artinya, rata-rata gaji bulanan dalam model ini mempengaruhi jumlah orang yang berhenti merokok dengan bobot -0,16285 (tingkat pengaruhnya kecil). Tanda “-” menunjukkan dampak negatif: semakin tinggi gaji, semakin sedikit orang yang berhenti. Itu adil.



Analisis Korelasi di Excel

Analisis korelasi membantu mengetahui apakah terdapat hubungan antar indikator dalam satu atau dua sampel. Misalnya antara waktu pengoperasian suatu mesin dengan biaya perbaikan, harga peralatan dan lama pengoperasian, tinggi dan berat badan anak, dll.

Jika terdapat keterkaitan, maka apakah kenaikan salah satu parameter menyebabkan peningkatan (korelasi positif) atau penurunan (negatif) parameter lainnya. Analisis korelasi membantu analis menentukan apakah nilai suatu indikator dapat digunakan untuk memprediksi arti yang mungkin lain.

Koefisien korelasi dilambangkan dengan r. Bervariasi dari +1 hingga -1. Klasifikasi korelasi untuk daerah yang berbeda akan berbeda. Ketika koefisiennya 0 ketergantungan linier tidak ada antar sampel.

Mari kita lihat cara mencari koefisien korelasi menggunakan Excel.

Untuk mencari koefisien berpasangan digunakan fungsi CORREL.

Tujuan: Mengetahui apakah ada hubungan antara waktu pengoperasian mesin bubut dengan biaya pemeliharaannya.

Tempatkan kursor di sel mana pun dan tekan tombol fx.

  1. Pada kategori “Statistik”, pilih fungsi CORREL.
  2. Argumen “Array 1” - rentang nilai pertama – waktu pengoperasian mesin: A2:A14.
  3. Argumen “Array 2” - rentang nilai kedua – biaya perbaikan: B2:B14. Klik Oke.

Untuk menentukan jenis koneksi, Anda perlu melihat angka absolut koefisiennya (setiap bidang kegiatan memiliki skalanya sendiri).

Untuk analisis korelasi beberapa parameter (lebih dari 2), akan lebih mudah menggunakan “Analisis Data” (add-on “Paket Analisis”). Anda perlu memilih korelasi dari daftar dan menentukan array. Semua.

Koefisien yang dihasilkan akan ditampilkan dalam matriks korelasi. Seperti ini:

Analisis korelasi dan regresi

Dalam praktiknya, kedua teknik ini sering digunakan bersamaan.

Contoh:


Sekarang data analisis regresi sudah terlihat.

Karakteristik kuantitatif dari hubungan tersebut dapat diperoleh dengan menghitung koefisien korelasi.

Analisis Korelasi di Excel

Fungsinya sendiri punya bentuk umum CORREL(array1, array2). Di bidang “Array1”, masukkan koordinat rentang sel dari salah satu nilai, yang ketergantungannya harus ditentukan. Seperti yang Anda lihat, koefisien korelasi berupa angka muncul di sel yang kita pilih sebelumnya. Jendela dengan parameter analisis korelasi terbuka. Berbeda dengan metode sebelumnya, pada kolom “Input interval” kita memasukkan interval bukan setiap kolom secara terpisah, tetapi semua kolom yang ikut serta dalam analisis. Seperti yang Anda lihat, aplikasi Excel menawarkan dua metode analisis korelasi sekaligus.

Grafik korelasi di excel

6) Elemen pertama dari tabel akhir akan muncul di sel kiri atas area yang dipilih. Oleh karena itu hipotesis H0 ditolak, yaitu parameter regresi dan koefisien korelasi tidak berbeda secara acak dari nol, tetapi signifikan secara statistik. 7. Estimasi persamaan regresi yang diperoleh memungkinkan untuk digunakan dalam peramalan.

Cara menghitung koefisien korelasi di excel

Jika koefisiennya 0, berarti tidak ada hubungan antar nilai. Untuk menemukan hubungan antara variabel dan y, gunakan fungsi bawaan Microsoft Excel"KOREL". Misalnya, untuk "Array1" pilih nilai y, dan untuk "Array2" pilih nilai x. Hasilnya, Anda akan menerima koefisien korelasi yang dihitung oleh program. Selanjutnya, Anda perlu menghitung selisih antara setiap x dan xav, dan yav. Di sel yang dipilih tulis rumus x-x, kamu-. Jangan lupa menyematkan sel dengan rata-rata. Hasil yang diperoleh akan menjadi koefisien korelasi yang diinginkan.

Rumus penghitungan koefisien Pearson di atas menunjukkan betapa padat karya proses ini jika dilakukan secara manual. Kedua, mohon rekomendasi jenis analisis korelasi apa yang dapat digunakan untuk sampel berbeda dengan penyebaran data yang besar? Bagaimana saya dapat membuktikan secara statistik bahwa ada perbedaan yang signifikan antara kelompok berusia di atas 60 tahun dan kelompok lainnya?

DIY: Menghitung Korelasi Mata Uang Menggunakan Excel

Misalnya, kami menggunakan Microsoft Excel, tetapi program lain yang menggunakan rumus korelasi juga bisa digunakan. 7.Setelah ini, pilih sel dengan data EUR/USD. 9.Tekan Enter untuk menghitung koefisien korelasi untuk EUR/USD dan USD/JPY. Tidak ada gunanya memperbarui angka setiap hari (kecuali Anda terobsesi dengan korelasi mata uang).

Anda telah menghadapi kebutuhan untuk menghitung tingkat hubungan antara keduanya besaran statistik dan tentukan rumus korelasinya? Untuk melakukan ini, saya menggunakan fungsi CORREL - ada beberapa informasi tentangnya di sini. Ini mengembalikan tingkat korelasi antara dua rentang data. Secara teoritis, fungsi korelasi dapat disempurnakan dengan mengubahnya dari linier menjadi eksponensial atau logaritmik. Analisis data dan grafik korelasi dapat meningkatkan reliabilitasnya secara signifikan.

Misalkan sel B2 berisi koefisien korelasi itu sendiri, dan sel B3 berisi jumlah observasi lengkap. Apakah Anda memiliki kantor berbahasa Rusia? Omong-omong, saya juga menemukan kesalahan - signifikansi tidak dihitung untuk korelasi negatif. Jika kedua variabel bersifat metrik dan mempunyai distribusi normal, maka pilihan dibuat dengan benar. Dan apakah mungkin untuk mengkarakterisasi kriteria kesamaan kurva hanya dengan menggunakan satu CC? Anda tidak memiliki kesamaan "kurva", tetapi kesamaan dua deret, yang pada prinsipnya dapat digambarkan dengan kurva.



Baru di situs

>

Paling populer