Ev Kaldırma Excel'de pozitif ve negatif korelasyon. Excel'de korelasyon nasıl yapılır

Excel'de pozitif ve negatif korelasyon. Excel'de korelasyon nasıl yapılır

İÇİNDE bilimsel araştırma Genellikle sonuç ve faktör değişkenleri (mahsulün verimi ve yağış miktarı, cinsiyet ve yaşa göre homojen gruplardaki bir kişinin boyu ve ağırlığı, nabız hızı ve vücut sıcaklığı vb.) arasında bir bağlantı bulmaya ihtiyaç vardır. .

İkincisi, kendileriyle ilişkili olanlarda (birincisi) değişikliklere katkıda bulunan işaretlerdir.

Korelasyon analizi kavramı

Yukarıdakilerden yola çıkarak korelasyon analizinin aşağıdaki hipotezleri test etmek için kullanılan bir yöntem olduğunu söyleyebiliriz. İstatistiksel anlamlılık Araştırmacı bunları ölçebiliyor ancak değiştiremiyorsa iki veya daha fazla değişken.

Söz konusu kavramın başka tanımları da bulunmaktadır. Korelasyon analizi değişkenler arasındaki korelasyon katsayılarının incelenmesini içeren bir işleme yöntemidir. Bu durumda, bir veya daha fazla özellik çifti arasındaki korelasyon katsayıları karşılaştırılarak aralarında istatistiksel ilişkiler kurulur. Korelasyon analizi, rastgele değişkenler arasındaki istatistiksel bağımlılığı, katı bir fonksiyonel doğanın isteğe bağlı varlığıyla incelemek için bir yöntemdir; burada bir değişkenin dinamiği rastgele değişken dinamiklere yol açar matematiksel beklenti bir diğer.

Yanlış korelasyon kavramı

Korelasyon analizi yapılırken, genellikle birbiriyle ilişkili olarak saçma olan herhangi bir özellik kümesiyle ilişkili olarak yapılabileceğini dikkate almak gerekir. Bazen birbirleriyle nedensel bir bağlantı yoktur.

Bu durumda yanlış bir korelasyondan bahsediyorlar.

Korelasyon analizinin sorunları

Yukarıdaki tanımlara dayanarak, açıklanan yöntemin aşağıdaki görevleri formüle edilebilir: aranan değişkenlerden biri hakkında diğerini kullanarak bilgi elde etmek; Çalışılan değişkenler arasındaki ilişkinin yakınlığını belirler.

Korelasyon analizi, incelenen özellikler arasındaki ilişkinin belirlenmesini içerir ve bu nedenle korelasyon analizinin görevleri aşağıdakilerle desteklenebilir:

  • ortaya çıkan karakteristik üzerinde en büyük etkiye sahip olan faktörlerin belirlenmesi;
  • daha önce keşfedilmemiş bağlantı nedenlerinin belirlenmesi;
  • parametrik analizi ile bir korelasyon modelinin oluşturulması;
  • iletişim parametrelerinin öneminin ve aralık değerlendirmelerinin incelenmesi.

Korelasyon analizi ile regresyon arasındaki ilişki

Korelasyon analizi yöntemi çoğu zaman çalışılan nicelikler arasındaki ilişkinin yakınlığını bulmakla sınırlı değildir. Bazen aynı adı taşıyan analiz kullanılarak elde edilen ve sonuç ile faktör (faktör) özelliği (özellikler) arasındaki korelasyon bağımlılığının bir tanımını temsil eden regresyon denklemlerinin derlenmesiyle desteklenir. Bu yöntem, söz konusu analizle birlikte yöntemi oluşturur.

Yöntemi kullanma koşulları

Etkili faktörler bir veya birkaç faktöre bağlıdır. Etkin ve faktör göstergelerinin (faktörlerin) değeri hakkında çok sayıda gözlem varsa, korelasyon analizi yöntemi kullanılabilirken, incelenen faktörlerin niceliksel olması ve belirli kaynaklara yansıtılması gerekir. Birincisi normal yasa ile belirlenebilir - bu durumda korelasyon analizinin sonucu Pearson korelasyon katsayılarıdır veya özellikler bu yasaya uymuyorsa katsayı kullanılır sıra korelasyonu Mızrakçı.

Korelasyon analizi faktörlerini seçme kuralları

Kullanırken Bu method performans göstergelerini etkileyen faktörlerin belirlenmesi gerekmektedir. Göstergeler arasında neden-sonuç ilişkileri olması gerektiği dikkate alınarak seçilirler. Çok faktörlü korelasyon modeli oluşturulması durumunda, ortaya çıkan gösterge üzerinde anlamlı etkisi olan faktörler seçilirken, ikili korelasyon katsayısı 0,85'in üzerinde olan birbirine bağımlı faktörlerin yanı sıra korelasyon modeline dahil edilmemesi tercih edilir. sonuç parametresi ile olan ilişkinin doğrusal veya fonksiyonel karakterde olmadığı durum.

Sonuçlar görüntüleniyor

Korelasyon analizinin sonuçları metin ve grafik formlarında sunulabilir. İlk durumda, bir korelasyon katsayısı olarak, ikincisinde ise bir dağılım diyagramı şeklinde sunulurlar.

Parametreler arasında korelasyon olmadığında, diyagramdaki noktalar düzensiz bir şekilde yerleştirilir, ortalama bağlantı derecesi daha büyük bir düzen derecesi ile karakterize edilir ve işaretli işaretlerin medyandan az çok eşit bir mesafeyle karakterize edilir. Güçlü bir bağlantı düz olma eğilimindedir ve r=1'de nokta grafiği düz bir çizgidir. Ters korelasyon, grafiğin yönünde sol üstten sağ alta, doğrudan korelasyon - sol alttan sağ üst köşeye doğru farklılık gösterir.

Bir dağılım grafiğinin 3 boyutlu gösterimi

Geleneksel 2 boyutlu dağılım grafiği gösterimine ek olarak artık korelasyon analizinin 3 boyutlu grafik gösterimi de kullanılıyor.

Tüm eşleştirilmiş grafikleri matris formatında tek bir şekilde görüntüleyen bir dağılım grafiği matrisi de kullanılır. N değişken için matris n satır ve n sütun içerir. i'inci satır ile j'inci sütunun kesişiminde yer alan grafik, Xi ve Xj değişkenlerinin grafiğidir. Böylece, her satır ve sütun bir boyuttur; tek bir hücre, iki boyutlu bir dağılım grafiğini görüntüler.

Bağlantının sıkılığının değerlendirilmesi

Korelasyon bağlantısının yakınlığı korelasyon katsayısı (r) ile belirlenir: güçlü - r = ±0,7 ila ±1, orta - r = ±0,3 ila ±0,699, zayıf - r = 0 ila ±0,299. Bu sınıflandırma katı değildir. Şekil biraz farklı bir diyagramı göstermektedir.

Korelasyon analizi yöntemini kullanma örneği

İngiltere'de ilginç bir araştırma yapıldı. Sigara içme ile akciğer kanseri arasındaki bağlantıya adanmıştır ve korelasyon analizi yoluyla gerçekleştirilmiştir. Bu gözlem aşağıda sunulmuştur.

Korelasyon analizi için başlangıç ​​verileri

Profesyonel grup

ölüm

Çiftçiler, ormancılar ve balıkçılar

Madenciler ve taş ocağı işçileri

Gaz, kok ve kimyasal madde üreticileri

Cam ve seramik üreticileri

Fırın, demirhane, dökümhane ve haddehane işçileri

Elektrik ve elektronik çalışanları

Mühendislik ve ilgili meslekler

Ağaç işleme endüstrileri

Deri işçileri

Tekstil işçileri

İş kıyafeti üreticileri

Yiyecek, içecek ve tütün endüstrilerinde çalışanlar

Kağıt ve Baskı Üreticileri

Diğer ürünlerin üreticileri

İnşaatçılar

Ressamlar ve dekoratörler

Sabit motorların, vinçlerin vb. sürücüleri.

Başka yerde yer almayan işçiler

Ulaştırma ve iletişim çalışanları

Depo çalışanları, mağaza sahipleri, paketleyiciler ve dolum makinesi çalışanları

Ofis çalışanları

Satıcılar

Spor ve eğlence çalışanları

Yöneticiler ve yöneticiler

Profesyoneller, teknisyenler ve sanatçılar

Korelasyon analizine başlıyoruz. Netlik sağlamak için çözüme şununla başlamak daha iyidir: grafik yöntemi bunun için bir dağılım diyagramı oluşturacağız.

Doğrudan bir bağlantıyı gösterir. Ancak yalnızca grafiksel yönteme dayanarak kesin bir sonuca varmak zordur. Bu nedenle korelasyon analizi yapmaya devam edeceğiz. Korelasyon katsayısının hesaplanmasına ilişkin bir örnek aşağıda sunulmuştur.

Yazılım kullanarak (MS Excel aşağıda örnek olarak açıklanacaktır), 0,716 olan korelasyon katsayısını belirleriz, bu da incelenen parametreler arasında güçlü bir bağlantı anlamına gelir. Elde edilen değerin istatistiksel güvenilirliğini, 25 çift değerden 2 çıkarmamız gereken ilgili tabloyu kullanarak belirleyelim, sonuç olarak 23 elde ederiz ve tablodaki bu satırı kullanarak r'yi p = 0,01 için kritik buluruz (çünkü bunlar tıbbi verilerdir, daha katı bir bağımlılık, diğer durumlarda p=0,05 yeterlidir), bu korelasyon analizi için 0,51'dir. Örnek, hesaplanan r'nin kritik r'den daha büyük olduğunu ve korelasyon katsayısının değerinin istatistiksel olarak güvenilir kabul edildiğini gösterdi.

Korelasyon analizi yaparken yazılımı kullanma

Tanımlanan istatistiksel veri işleme türü kullanılarak gerçekleştirilebilir. yazılım, özellikle MS Excel. Korelasyon, işlevleri kullanarak aşağıdaki parametrelerin hesaplanmasını içerir:

1. Korelasyon katsayısı CORREL fonksiyonu (dizi1; dizi2) kullanılarak belirlenir. Dizi1,2 - sonuç ve faktör değişkenlerinin değer aralığının hücresi.

Doğrusal korelasyon katsayısı aynı zamanda Pearson korelasyon katsayısı olarak da adlandırılır ve bu nedenle Excel 2007'den başlayarak işlevi aynı dizilerle kullanabilirsiniz.

Excel'de korelasyon analizinin grafiksel gösterimi “Grafikler” paneli “Dağılım Grafiği” seçeneği kullanılarak yapılır.

Başlangıç ​​verilerini belirledikten sonra bir grafik elde ediyoruz.

2. Öğrenci t-testi kullanılarak ikili korelasyon katsayısının anlamlılığının değerlendirilmesi. T kriterinin hesaplanan değeri, belirtilen önem düzeyi ve serbestlik derecesi sayısı dikkate alınarak, söz konusu parametrenin karşılık gelen değer tablosundan bu göstergenin tablo halindeki (kritik) değeriyle karşılaştırılır. Bu tahmin STUDISCOVER(olasılık; serbestlik_derecesi) fonksiyonu kullanılarak gerçekleştirilir.

3. Çift korelasyon katsayılarının matrisi. Analiz, Korelasyonun seçildiği Veri Analizi aracı kullanılarak gerçekleştirilir. Çift korelasyon katsayılarının istatistiksel değerlendirmesi karşılaştırılarak gerçekleştirilir. mutlak değer tablo halinde (kritik) bir değere sahip. Hesaplanan ikili korelasyon katsayısı kritik değeri aştığında, verilen olasılık derecesi dikkate alınarak doğrusal ilişkinin anlamlılığına ilişkin sıfır hipotezinin reddedilmediğini söyleyebiliriz.

Nihayet

Korelasyon analizi yönteminin bilimsel araştırmalarda kullanılması, aralarındaki ilişkiyi belirlememize olanak sağlar. Çeşitli faktörler ve performans göstergeleri. Absürt bir veri çifti veya kümesinden yüksek bir korelasyon katsayısının elde edilebileceğini hesaba katmak gerekir ve bu nedenle bu tip Analiz yeterince geniş bir veri dizisi üzerinde gerçekleştirilmelidir.

Hesaplanan r değeri elde edildikten sonra, belirli bir değerin istatistiksel güvenilirliğini doğrulamak için bunun kritik r ile karşılaştırılması tavsiye edilir. Korelasyon analizi, formüller kullanılarak manuel olarak veya yazılım, özellikle MS Excel kullanılarak gerçekleştirilebilir. Burada ayrıca korelasyon analizinin çalışılan faktörleri ile ortaya çıkan karakteristik arasındaki ilişkiyi görsel olarak temsil etmek amacıyla bir dağılım diyagramı oluşturabilirsiniz.

Bugünkü yazımızda konuşacağız Değişkenlerin birbirleriyle nasıl ilişkilendirilebileceği hakkında. Korelasyonu kullanarak birinci ve ikinci değişken arasında bir ilişki olup olmadığını belirleyebiliriz. Umarım bu aktiviteyi de öncekiler kadar eğlenceli bulursunuz!

Korelasyon, x ve y arasındaki ilişkinin gücünü ve yönünü ölçer. Şekil gösterir Çeşitli türler sıralı çiftlerin (x, y) dağılım grafikleri biçimindeki korelasyonlar. Geleneksel olarak, x değişkeni yatay eksen ve y - dikeyde.

Grafik A pozitif doğrusal korelasyona bir örnektir: x arttıkça y de artar ve doğrusal olarak. Grafik B bize negatif doğrusal korelasyonun bir örneğini gösteriyor; burada x arttıkça y doğrusal olarak azalır. Grafik C'de x ile y arasında bir korelasyon olmadığını görüyoruz. Bu değişkenler hiçbir şekilde birbirini etkilemez.

Son olarak Grafik D, değişkenler arasındaki doğrusal olmayan ilişkilerin bir örneğidir. X arttıkça y önce azalır, sonra yön değiştirerek artar.

Makalenin geri kalanı bağımlı ve bağımsız değişkenler arasındaki doğrusal ilişkilere odaklanmaktadır.

Korelasyon katsayısı

Korelasyon katsayısı r, bağımsız ve bağımlı değişkenler arasındaki ilişkinin hem gücünü hem de yönünü bize sağlar. r'nin değerleri -1,0 ile +1,0 arasında değişmektedir. r pozitif olduğunda x ve y arasındaki ilişki pozitiftir (şekildeki A grafiği), r negatif olduğunda ilişki de negatiftir (B grafiği). Korelasyon katsayısının sıfıra yakın olması x ile y arasında bir ilişkinin olmadığını gösterir (grafik C).

X ve y arasındaki ilişkinin gücü, korelasyon katsayısının -1,0'a ya da +-1,0'a yakın olmasına göre belirlenir. Aşağıdaki çizimi inceleyin.

Grafik A, r = + 1.0'da x ve y arasında mükemmel bir pozitif korelasyonu göstermektedir. Grafik B - x ve y arasında r = - 1,0'da ideal negatif korelasyon. Grafik C ve D, bağımlı ve bağımsız değişkenler arasındaki daha zayıf ilişkilerin örnekleridir.

Korelasyon katsayısı r, bağımlı ve bağımsız değişkenler arasındaki ilişkinin hem gücünü hem de yönünü belirler. R değerleri -1,0 (güçlü negatif ilişki) ile +1,0 (güçlü pozitif ilişki) arasında değişir. r = 0 olduğunda x ve y değişkenleri arasında bağlantı yoktur.

Gerçek korelasyon katsayısını aşağıdaki denklemi kullanarak hesaplayabiliriz:

Güzel güzel! Bu denklemin tuhaf sembollerden oluşan korkutucu bir karmakarışık gibi göründüğünü biliyorum ama paniğe kapılmadan önce buna sınav notu örneğini uygulayalım. Diyelim ki bir öğrencinin istatistik çalışmaya ayırdığı saat sayısı ile final sınav puanı arasında bir ilişki olup olmadığını belirlemek istiyorum. Aşağıdaki tablo, bu denklemi birkaç basit hesaplamaya ayırmamıza ve bunları daha kolay yönetilebilir hale getirmemize yardımcı olacaktır.

Gördüğünüz gibi, bir konuya ayrılan saat sayısı ile sınav notu arasında çok güçlü bir pozitif korelasyon vardır. Öğretmenler bunu öğrenince çok mutlu olacaklar.

Benzer değişkenler arasında ilişki kurmanın faydası nedir? Harika bir soru. Bir ilişkinin mevcut olduğu tespit edilirse, konuyu incelemek için harcanan belirli saat sayısına dayanarak sınav sonuçlarını tahmin edebiliriz. Basitçe söylemek gerekirse, bağlantı ne kadar güçlü olursa tahminimiz o kadar doğru olur.

Korelasyon Katsayılarını Hesaplamak için Excel'i Kullanma

Eminim ki bu korkunç korelasyon katsayıları hesaplamalarına baktığınızda, bunu bilmek sizi gerçekten çok mutlu edecektir. Excel programı Aşağıdaki özelliklere sahip CORREL fonksiyonunu kullanarak tüm bu işleri sizin için yapabiliriz:

KORELASYON (dizi 1; dizi 2),

dizi 1 = ilk değişken için veri aralığı,

dizi 2 = ikinci değişken için veri aralığı.

Örneğin şekil, sınav notu örneği için korelasyon katsayısını hesaplamak için kullanılan CORREL fonksiyonunu göstermektedir.

Korelasyon katsayısı (veya doğrusal katsayı korelasyon) “r” (nadir durumlarda “ρ” olarak) ile gösterilir ve şunları karakterize eder: doğrusal korelasyon(yani, iki veya daha fazla değişkenin bir değeri ve yönü tarafından verilen bir ilişki). Katsayı değeri -1 ile +1 arasındadır, yani korelasyon hem pozitif hem de negatif olabilir. Korelasyon katsayısı -1 ise mükemmel bir negatif korelasyon vardır; Korelasyon katsayısı +1 ise mükemmel bir pozitif korelasyon vardır. Diğer durumlarda, iki değişken arasında pozitif bir korelasyon vardır, negatif bir korelasyon vardır veya hiç korelasyon yoktur. Korelasyon katsayısı, ücretsiz çevrimiçi hesap makineleri kullanılarak veya iyi bir grafik hesap makinesi kullanılarak manuel olarak hesaplanabilir.

Adımlar

Korelasyon katsayısının manuel olarak hesaplanması

    Veri topla. Korelasyon katsayısını hesaplamaya başlamadan önce verilen sayı çiftini inceleyin. Bunları dikey veya yatay olarak yerleştirilebilecek bir tabloya yazmak daha iyidir. Her satırı veya sütunu "x" ve "y" olarak etiketleyin.

    • Örneğin “x” ve “y” değişkenlerinin dört çift değeri (sayıları) verilmiştir. Aşağıdaki tabloyu oluşturabilirsiniz:
      • x || sen
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  1. "x"in aritmetik ortalamasını hesaplayın. Bunu yapmak için tüm "x" değerlerini toplayın ve ardından elde edilen sonucu değer sayısına bölün.

    • Örneğimizde “x” değişkeninin dört değeri verilmiştir. "x"in aritmetik ortalamasını hesaplamak için bu değerleri toplayın ve ardından toplamı 4'e bölün. Hesaplamalar şu şekilde yazılacaktır:
    • μ x = (1 + 2 + 4 + 5) / 4 (\displaystyle \mu _(x)=(1+2+4+5)/4)
    • μ x = 12 / 4 (\displaystyle \mu _(x)=12/4)
    • μ x = 3 (\displaystyle \mu _(x)=3)
  2. "y"nin aritmetik ortalamasını bulun. Bunu yapmak için çalıştırın benzer eylemler yani “y”nin tüm değerlerini toplayın ve ardından toplamı değer sayısına bölün.

    • Örneğimizde “y” değişkeninin dört değeri verilmiştir. Bu değerleri toplayın ve toplamı 4'e bölün. Hesaplamalar şu şekilde yazılacaktır:
    • μ y = (1 + 3 + 5 + 7) / 4 (\displaystyle \mu _(y)=(1+3+5+7)/4)
    • μ y = 16 / 4 (\displaystyle \mu _(y)=16/4)
    • μ y = 4 (\displaystyle \mu _(y)=4)
  3. "x"in standart sapmasını hesaplayın.“x” ve “y”nin ortalama değerlerini hesapladıktan sonra, Standart sapma bu değişkenler. Standart sapma aşağıdaki formül kullanılarak hesaplanır:

    • σ x = 1 n − 1 Σ (x − μ x) 2 (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(n-1))\Sigma (x-\mu _( x))^(2))))
    • σ x = 1 4 − 1 ∗ ((1 − 3) 2 + (2 − 3) 2 + (4 − 3) 2 + (5 − 3) 2) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(4-1))*((1-3)^(2)+(2-3)^(2)+(4-3)^(2)+(5-3) ^(2))))))
    • σ x = 1 3 ∗ (4 + 1 + 1 + 4) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(4+1+1+4)) ))
    • σ x = 1 3 ∗ (10) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(10))))
    • σ x = 10 3 (\displaystyle \sigma _(x)=(\sqrt (\frac (10)(3))))
    • σ x = 1, 83 (\displaystyle \sigma _(x)=1,83)
  4. "y"nin standart sapmasını hesaplayın.Önceki adımda açıklanan adımları izleyin. Aynı formülü kullanın, ancak "y" değerlerini yerine koyun.

    • Örneğimizde hesaplamalar şu şekilde yazılacaktır:
    • σ y = 1 4 − 1 ∗ ((1 − 4) 2 + (3 − 4) 2 + (5 − 4) 2 + (7 − 4) 2) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(4-1))*((1-4)^(2)+(3-4)^(2)+(5-4)^(2)+(7-4) ^(2))))))
    • σ y = 1 3 ∗ (9 + 1 + 1 + 9) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(9+1+1+9)) ))
    • σ y = 1 3 ∗ (20) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(20))))
    • σ y = 20 3 (\displaystyle \sigma _(y)=(\sqrt (\frac (20)(3))))
    • σ y = 2,58 (\displaystyle \sigma _(y)=2,58)
  5. Korelasyon katsayısını hesaplamak için temel formülü yazın. Bu formül, her iki değişken için ortalamaları, standart sapmaları ve sayı (n) çiftlerini içerir. Korelasyon katsayısı "r" (nadir durumlarda "ρ") olarak gösterilir. Bu makalede Pearson korelasyon katsayısını hesaplamak için bir formül kullanılmaktadır.

    • Burada ve diğer kaynaklarda miktarlar farklı şekilde belirtilmiş olabilir. Örneğin bazı formüller “ρ” ve “σ”yı içerirken bazıları “r” ve “s”yi içerir. Bazı ders kitapları başka formüller verir, ancak bunlar yukarıdaki formülün matematiksel benzerleridir.
  6. Her iki değişkenin ortalamasını ve standart sapmasını hesapladınız, böylece korelasyon katsayısını hesaplamak için formülü kullanabilirsiniz. "n"nin her iki değişken için de değer çiftlerinin sayısı olduğunu hatırlayın. Diğer miktarların değerleri daha önce hesaplanmıştı.

    • Örneğimizde hesaplamalar şu şekilde yazılacaktır:
    • ρ = (1 n − 1) Σ (x − μ x σ x) ∗ (y − μ y σ y) (\displaystyle \rho =\left((\frac (1)(n-1))\right) \Sigma \left((\frac (x-\mu _(x))(\sigma _(x)))\right)*\left((\frac (y-\mu _(y))(\sigma _(y))))\sağ))
    • ρ = (1 3) ∗ (\displaystyle \rho =\left((\frac (1)(3))\right)*)[ (1 − 3 1 , 83) ∗ (1 − 4 2 , 58) + (2 − 3 1 , 83) ∗ (3 − 4 2 , 58) (\displaystyle \left((\frac (1-3)( 1,83))\right)*\left((\frac (1-4)(2,58))\right)+\left((\frac (2-3)(1,83))\right) *\left((\ kesir (3-4)(2,58))\sağ))
      + (4 − 3 1 , 83) ∗ (5 − 4 2 , 58) + (5 − 3 1 , 83) ∗ (7 − 4 2 , 58) (\displaystyle +\left((\frac (4-3) )(1.83))\right)*\left((\frac (5-4)(2.58))\right)+\left((\frac (5-3)(1.83))\ right)*\left( (\frac (7-4)(2,58))\sağ))]
    • ρ = (1 3) ∗ (6 + 1 + 1 + 6 4 , 721) (\displaystyle \rho =\left((\frac (1)(3))\right)*\left((\frac (6) +1+1+6)(4,721))\sağ))
    • ρ = (1 3) ∗ 2 , 965 (\displaystyle \rho =\left((\frac (1)(3))\right)*2,965)
    • ρ = (2 , 965 3) (\displaystyle \rho =\left((\frac (2,965)(3))\right))
    • ρ = 0,988 (\displaystyle \rho =0,988)
  7. Sonucu analiz edin.Örneğimizde korelasyon katsayısı 0,988'dir. Bu değer bir şekilde bu sayı çiftleri kümesini karakterize eder. Değerin işaretine ve büyüklüğüne dikkat edin.

    • Korelasyon katsayısının değeri pozitif olduğundan “x” ve “y” değişkenleri arasında pozitif bir korelasyon vardır. Yani “x”in değeri arttıkça “y”nin değeri de artıyor.
    • Korelasyon katsayısının değeri +1'e çok yakın olduğundan “x” ve “y” değişkenlerinin değerleri birbiriyle oldukça ilişkilidir. Noktaları koordinat düzlemine çizerseniz, bunlar belirli bir düz çizgiye yakın konumlandırılacaktır.

    Korelasyon katsayısını hesaplamak için çevrimiçi hesap makinelerini kullanma

    1. Korelasyon katsayısını hesaplamak için internette bir hesap makinesi bulun. Bu katsayı istatistiklerde oldukça sık hesaplanır. Çok sayıda sayı çifti varsa korelasyon katsayısını manuel olarak hesaplamak neredeyse imkansızdır. Bu nedenle korelasyon katsayısını hesaplamak için çevrimiçi hesap makineleri vardır. Bir arama motoruna “korelasyon katsayısı hesaplayıcısı” yazın (tırnak işaretleri olmadan).

    2. Verileri girin. Verileri (sayı çiftlerini) doğru girdiğinizden emin olmak için lütfen web sitesindeki talimatları inceleyin. Uygun sayı çiftlerini girmek son derece önemlidir; aksi takdirde yanlış sonuç alırsınız. Farklı web sitelerinin farklı veri giriş formatlarına sahip olduğunu unutmayın.

      • Örneğin http://ncalculators.com/statistics/correlation-cothird-calculator.htm web sitesinde “x” ve “y” değişkenlerinin değerleri iki yatay çizgiye girilir. Değerler virgülle ayrılır. Yani örneğimizde “x” değerleri şu şekilde girilmektedir: 1,2,4,5, “y” değerleri ise şu şekilde: 1,3,5,7.
      • Başka bir site olan http://www.alcula.com/calculators/statistics/correlation-coactive/'de veriler dikey olarak girilir; bu durumda karşılık gelen sayı çiftlerini karıştırmayın.
    3. Korelasyon katsayısını hesaplayın. Verileri girdikten sonra sonucu almak için “Hesapla”, “Hesapla” veya benzeri tuşlara tıklamanız yeterlidir.

      Grafik hesap makinesi kullanma

      1. Verileri girin. Bir grafik hesap makinesi alın, istatistiksel moda gidin ve Düzenle komutunu seçin.

        • Farklı hesap makineleri farklı tuş vuruşlarına basılmasını gerektirir. Bu makalede Texas Instruments TI-86 hesap makinesi anlatılmaktadır.
        • İstatistiksel hesaplama moduna geçmek için – Stat'a (“+” tuşunun üstünde) basın. Daha sonra F2 – Düzenle'ye basın.
      2. Daha önce kaydedilen verileri silin.Çoğu hesap makinesi, girdiğiniz istatistikleri siz silinceye kadar saklar. Eski verilerin yeni verilerle karıştırılmasını önlemek için öncelikle depolanan bilgileri silin.

        • İmleci hareket ettirmek ve "xStat" başlığını vurgulamak için ok tuşlarını kullanın. Daha sonra xStat sütununa girilen tüm değerleri kaldırmak için Temizle ve Enter tuşuna basın.
        • "yStat" başlığını vurgulamak için ok tuşlarını kullanın. Daha sonra yStat sütununa girilen tüm değerleri temizlemek için Temizle ve Enter tuşuna basın.
      3. Başlangıç ​​verilerini girin.İmleci "xStat" başlığı altındaki ilk hücreye taşımak için ok tuşlarını kullanın. İlk değeri girin ve Enter tuşuna basın. Ekranın alt kısmında “xStat (1) = __” görüntülenecek, burada boşluk yerine girilen değer görünecektir. Enter tuşuna bastıktan sonra girilen değer tabloda görünecek ve imleç bir sonraki satıra geçecektir; bu, ekranın alt kısmında “xStat (2) = __” görüntüleyecektir.

        • "X" değişkeni için tüm değerleri girin.
        • X değişkeni için tüm değerleri girdikten sonra ok tuşlarını kullanarak yStat sütununa gidin ve y değişkeni için değerleri girin.
        • Tüm sayı çiftleri girildikten sonra ekranı temizlemek ve istatistiksel hesaplama modundan çıkmak için Çıkış'a basın.
      4. Korelasyon katsayısını hesaplayın. Verinin belirli bir satıra ne kadar yakın olduğunu karakterize eder. Bir grafik hesaplayıcı, uygun çizgiyi hızlı bir şekilde belirleyebilir ve korelasyon katsayısını hesaplayabilir.

        • İstatistik – Hesaplama'ya tıklayın. TI-86'da – – tuşuna basmanız gerekir.
        • "Doğrusal Regresyon" fonksiyonunu seçin. TI-86'da "LinR" etiketli tuşuna basın. Ekranda yanıp sönen bir imleçle birlikte “LinR_” satırı görüntülenecektir.
        • Şimdi iki değişkenin adını girin: xStat ve yStat.
          • TI-86'da isim listesini açın; Bunu yapmak için – – tuşuna basın.
          • Ekranın alt satırında mevcut değişkenler görüntülenecektir. öğesini seçin (bunu yapmak için muhtemelen F1 veya F2 tuşuna basmanız gerekir), bir virgül girin ve ardından öğesini seçin.
          • Girilen verileri işlemek için Enter tuşuna basın.
      5. Sonuçlarınızı analiz edin. Enter tuşuna bastığınızda ekranda aşağıdaki bilgiler görüntülenecektir:

        • y = a + b x (\displaystyle y=a+bx): Bu, düz bir çizgiyi tanımlayan bir fonksiyondur. Lütfen fonksiyonun standart biçimde yazılmadığına dikkat edin (y = kh + b).
        • a = (\displaystyle a=). Bu, doğrunun Y eksenini kestiği noktanın “y” koordinatıdır.
        • b = (\displaystyle b=). Bu doğrunun eğimidir.
        • düzelt = (\displaystyle (\text(düzelt))=). Bu korelasyon katsayısıdır.
        • n = (\displaystyle n=). Bu, hesaplamalarda kullanılan sayı çiftlerinin sayısıdır.

Regresyon ve korelasyon analizi istatistiksel araştırma yöntemleridir. Bunlar bir parametrenin bir veya daha fazla bağımsız değişkene bağımlılığını göstermenin en yaygın yoludur.

Aşağıda spesifik olarak pratik örneklerİktisatçılar arasında çok popüler olan bu iki analize bakalım. Bunları birleştirirken sonuçların elde edilmesine de bir örnek vereceğiz.

Excel'de Regresyon Analizi

Bazı değerlerin (bağımsız, bağımsız) bağımlı değişken üzerindeki etkisini gösterir. Örneğin ekonomik olarak aktif nüfus sayısı işletme sayısına, ücretlere ve diğer parametrelere nasıl bağlıdır? Veya: yabancı yatırımlar, enerji fiyatları vb. GSYİH düzeyini nasıl etkiler?

Analizin sonucu öncelikleri vurgulamanıza olanak tanır. Ve ana faktörlere dayanarak öncelikli alanların gelişimini tahmin edin, planlayın ve yönetim kararları alın.

Regresyon gerçekleşir:

  • doğrusal (y = a + bx);
  • parabolik (y = a + bx + cx 2);
  • üstel (y = a * exp(bx));
  • güç (y = a*x^b);
  • hiperbolik (y = b/x + a);
  • logaritmik (y = b * 1n(x) + a);
  • üstel (y = a * b^x).

Örnek olarak yapımına bakalım Regresyon modeli Excel'de ve sonuçların yorumlanması. Regresyonun doğrusal türünü ele alalım.

Görev. 6 işletmede aylık ortalama maaş ve işten ayrılan çalışanların sayısı. İşten ayrılan çalışan sayısının ortalama maaşa bağımlılığının belirlenmesi gerekmektedir.

Modeli doğrusal regresyon aşağıdaki forma sahiptir:

Y = a 0 + a 1 x 1 +…+a k x k.

a regresyon katsayılarını, x etkileyen değişkenleri, k ise faktör sayısını göstermektedir.

Örneğimizde Y, çalışanların işten ayrılma göstergesidir. Etkileyen faktör ücretlerdir (x).

Excel, doğrusal regresyon modelinin parametrelerini hesaplamanıza yardımcı olabilecek yerleşik işlevlere sahiptir. Ancak “Analiz Paketi” eklentisi bunu daha hızlı yapacaktır.

Güçlü bir analitik aracı etkinleştiriyoruz:

Etkinleştirildiğinde eklenti Veri sekmesinde mevcut olacaktır.

Şimdi regresyon analizini kendimiz yapalım.



Öncelikle R-kare ve katsayılara dikkat ediyoruz.

R-kare belirleme katsayısıdır. Örneğimizde – 0,755 veya %75,5. Bu da modelin hesaplanan parametrelerinin çalışılan parametreler arasındaki ilişkinin %75,5'ini açıkladığı anlamına gelmektedir. Belirleme katsayısı ne kadar yüksek olursa model o kadar iyi olur. İyi - 0,8'in üzerinde. Kötü - 0,5'ten az (böyle bir analizin pek makul olduğu düşünülemez). Örneğimizde – “fena değil”.

64.1428 katsayısı, söz konusu modeldeki tüm değişkenlerin 0'a eşit olması durumunda Y'nin ne olacağını gösterir. Yani, analiz edilen parametrenin değeri, modelde açıklanmayan diğer faktörlerden de etkilenir.

-0,16285 katsayısı, X değişkeninin Y üzerindeki ağırlığını gösterir. Yani, bu modeldeki ortalama aylık maaş, -0,16285 ağırlığıyla işten ayrılanların sayısını etkiler (bu, küçük bir etki derecesidir). “-” işareti olumsuz bir etkiyi gösterir: maaş ne kadar yüksek olursa, o kadar az kişi ayrılır. Bu adil.



Excel'de Korelasyon Analizi

Korelasyon analizi, bir veya iki örnekteki göstergeler arasında bir ilişki olup olmadığının belirlenmesine yardımcı olur. Örneğin, bir makinenin çalışma süresi ile onarım maliyeti, ekipmanın fiyatı ile çalışma süresi, çocukların boyu ve kilosu vb. arasında.

Bir bağlantı varsa, bir parametredeki artış diğerinin artmasına (pozitif korelasyon) veya azalmasına (negatif) yol açar mı? Korelasyon analizi, analistin bir göstergenin değerinin tahminde kullanılıp kullanılamayacağını belirlemesine yardımcı olur. olası anlam bir diğer.

Korelasyon katsayısı r ile gösterilir. +1 ila -1 arasında değişir. Korelasyonların sınıflandırılması farklı bölgeler farklı olacak. Katsayı 0 olduğunda doğrusal bağımlılıkörnekler arasında mevcut değildir.

Excel kullanarak korelasyon katsayısının nasıl bulunacağına bakalım.

Eşleştirilmiş katsayıları bulmak için CORREL işlevi kullanılır.

Amaç: Torna tezgahının çalışma süresi ile bakım maliyeti arasında bir ilişki olup olmadığını belirlemek.

İmleci herhangi bir hücreye yerleştirin ve fx düğmesine basın.

  1. “İstatistik” kategorisinde CORREL fonksiyonunu seçin.
  2. Argüman "Dizi 1" - ilk değer aralığı - makinenin çalışma süresi: A2:A14.
  3. Bağımsız değişken "Dizi 2" - ikinci değer aralığı - onarım maliyeti: B2:B14. Tamam'ı tıklayın.

Bağlantı türünü belirlemek için katsayının mutlak sayısına bakmanız gerekir (her faaliyet alanının kendi ölçeği vardır).

Birkaç parametrenin (2'den fazla) korelasyon analizi için “Veri Analizi” (“Analiz Paketi” eklentisi) kullanılması daha uygundur. Listeden korelasyonu seçmeniz ve diziyi belirlemeniz gerekir. Tüm.

Ortaya çıkan katsayılar korelasyon matrisinde görüntülenecektir. Bunun gibi:

Korelasyon ve regresyon analizi

Pratikte bu iki teknik sıklıkla birlikte kullanılmaktadır.

Örnek:


Artık regresyon analizi verileri görünür hale geldi.

İlişkinin niceliksel bir özelliği, korelasyon katsayısının hesaplanmasıyla elde edilebilir.

Excel'de Korelasyon Analizi

Fonksiyonun kendisi var Genel form KOREL(dizi1; dizi2). “Dizi1” alanına bağımlılığının belirlenmesi gereken değerlerden birinin hücre aralığının koordinatlarını girin. Gördüğünüz gibi daha önce seçtiğimiz hücrede sayı formundaki korelasyon katsayısı beliriyor. Korelasyon analizi parametrelerini içeren bir pencere açılır. Önceki yöntemden farklı olarak “Giriş aralığı” alanına her sütunun ayrı ayrı değil, analize katılan tüm sütunların aralığını giriyoruz. Gördüğünüz gibi Excel uygulaması iki korelasyon analizi yöntemini aynı anda sunuyor.

Excel'de korelasyon grafiği

6) Final masasının ilk elemanı seçilen alanın sol üst hücresinde görünecektir. Bu nedenle H0 hipotezi reddedilir, yani regresyon parametreleri ve korelasyon katsayısı rastgele sıfırdan farklı değildir, ancak istatistiksel olarak anlamlıdır. 7. Regresyon denkleminin elde edilen tahminleri, onun tahmin için kullanılmasına olanak sağlar.

Excel'de korelasyon katsayısı nasıl hesaplanır

Katsayının 0 olması değerler arasında ilişki olmadığını gösterir. Değişkenler ile y arasındaki ilişkiyi bulmak için yerleşik işlevi kullanın Microsoft Excel"KOREL". Örneğin, "Dizi1" için y değerlerini seçin ve "Dizi2" için x değerlerini seçin. Sonuç olarak, program tarafından hesaplanan korelasyon katsayısını alacaksınız. Daha sonra, her x ile xav ve yav arasındaki farkı hesaplamanız gerekir. Seçilen hücrelere şunu yaz formüller x-x, y-. Hücreleri ortalamalarla sabitlemeyi unutmayın. Elde edilen sonuç istenen korelasyon katsayısı olacaktır.

Pearson katsayısını hesaplamak için yukarıdaki formül, bu işlemin manuel olarak yapılması durumunda ne kadar emek yoğun olduğunu gösterir. İkinci olarak, lütfen geniş bir veri yelpazesine sahip farklı örnekler için ne tür bir korelasyon analizinin kullanılabileceğini önerin? 60 yaş üstü grupla diğer herkes arasında anlamlı bir fark olduğunu istatistiksel olarak nasıl kanıtlayabilirim?

Kendin Yap: Excel Kullanarak Para Birimi Korelasyonlarını Hesaplamak

Örneğin, Microsoft Excel kullanıyoruz, ancak korelasyon formülünü kullanabileceğiniz diğer herhangi bir program da işe yarayacaktır. 7.Bundan sonra EUR/USD verilerinin bulunduğu hücreleri seçin. 9. EUR/USD ve USD/JPY korelasyon katsayısını hesaplamak için Enter'a basın. Rakamları her gün güncellemeye değmez (eğer para birimi korelasyonlarına takıntılı değilseniz).

İki kişi arasındaki bağlantının derecesini hesaplama ihtiyacıyla zaten karşılaştınız. istatistiksel büyüklükler ve bunların korelasyonunu sağlayan formülü belirleyin? Bunu yapmak için CORREL fonksiyonunu kullandım - burada bununla ilgili bazı bilgiler var. İki veri aralığı arasındaki korelasyonun derecesini döndürür. Teorik olarak korelasyon fonksiyonu, doğrusaldan üstel veya logaritmik hale dönüştürülerek iyileştirilebilir. Verilerin analizi ve korelasyon grafikleri güvenilirliğini önemli ölçüde artırabilir.

B2 hücresinin korelasyon katsayısını içerdiğini, B3 hücresinin ise tam gözlem sayısını içerdiğini varsayalım. Rusça konuşulan bir ofisiniz var mı Bu arada, ben de bir hata buldum - negatif korelasyonlar için anlamlılık hesaplanmıyor. Her iki değişken de metrikse ve normal dağılım, o zaman seçim doğru yapıldı. Ve sadece bir CC kullanarak eğrilerin benzerliği kriterini karakterize etmek mümkün mü? "Eğrilerin" benzerliğine değil, prensipte bir eğri ile tanımlanabilecek iki serinin benzerliğine sahipsiniz.



Sitede yeni

>

En popüler