Ev Ağız boşluğu Korelasyon katsayılarının önemi nasıl kontrol edilir? Test: Regresyon ve korelasyon katsayılarının öneminin Öğrenci f-testi kullanılarak değerlendirilmesi

Korelasyon katsayılarının önemi nasıl kontrol edilir? Test: Regresyon ve korelasyon katsayılarının öneminin Öğrenci f-testi kullanılarak değerlendirilmesi

Egzersiz yapmak. Bölge bölgeleri için 199X verileri sağlanmaktadır;
Bölge numarası Sağlıklı bir kişinin günlük kişi başına düşen ortalama yaşam ücreti, rub., X Ortalama günlük ücret, rub., en
1 78 133
2 82 148
3 87 134
4 79 154
5 89 162
6 106 195
7 67 139
8 88 158
9 73 152
10 87 162
11 76 159
12 115 173
Gerekli:
1. y'nin x'ten ikili regresyonu için doğrusal bir denklem oluşturun.
2. Hesapla doğrusal katsayıçift ​​korelasyonu ve ortalama hata yaklaşımlar.
3. Regresyon ve korelasyon parametrelerinin istatistiksel anlamlılığını değerlendirin.
4. Tahmin çalıştırın ücretler y kişi başına ortalama geçim seviyesi x'in tahmin değeri ortalama seviyenin %107'sine tekabül etmektedir.
5. Tahmin hatasını ve güven aralığını hesaplayarak tahminin doğruluğunu değerlendirin.

Çözüm hesap makinesi kullanarak bulun.
Kullanım grafik yöntemi .
Bu yöntem, incelenenler arasındaki bağlantı biçimini görsel olarak tasvir etmek için kullanılır. ekonomik göstergeler. Bunu yapmak için, dikdörtgen bir koordinat sisteminde bir grafik çizilir, elde edilen Y karakteristiğinin bireysel değerleri ordinat ekseni boyunca çizilir ve X faktör karakteristiğinin bireysel değerleri apsis ekseni boyunca çizilir.
Sonuç ve faktör özelliklerinin puan kümesine denir korelasyon alanı.
Korelasyon alanına dayanarak, (popülasyon için) X ve Y'nin tüm olası değerleri arasındaki ilişkinin doğrusal olduğunu varsayabiliriz.
Doğrusal regresyon denklemi: y = bx + a + ε
Burada ε rastgele bir hatadır (sapma, bozulma).
Rastgele bir hatanın varlığının nedenleri:
1. Regresyon modeline anlamlı açıklayıcı değişkenlerin dahil edilememesi;
2. Değişkenlerin toplanması. Örneğin, toplam tüketim fonksiyonu bir denemedir genel ifade Bireysel harcama kararlarının toplamı. Bu yalnızca farklı parametrelere sahip bireysel ilişkilerin bir tahminidir.
3. Model yapısının yanlış tanımlanması;
4. Yanlış işlevsel belirtim;
5. Ölçüm hataları.
Her spesifik gözlem i için sapmalar ε i rastgele olduğundan ve örnekteki değerleri bilinmediğinden, o zaman:
1) x i ve y i gözlemlerinden yalnızca α ve β parametrelerinin tahminleri elde edilebilir
2) Regresyon modelinin α ve β parametrelerinin tahminleri, doğası gereği rastgele olan sırasıyla a ve b değerleridir, çünkü rastgele bir örneğe karşılık gelir;
Daha sonra tahmin regresyon denklemi (örnek verilerden oluşturulan) y = bx + a + ε formuna sahip olacaktır; burada e i, ε i hatalarının gözlemlenen değerleridir (tahminlerdir) ve a ve b sırasıyla tahminlerdir. bulunması gereken regresyon modelinin α ve β parametreleri.
α ve β parametrelerini tahmin etmek için en küçük kareler yöntemi (en küçük kareler yöntemi) kullanılır.
Normal denklem sistemi.
Verilerimiz için denklem sistemi şu şekildedir:
İlk denklemden a'yı ifade edip ikinci denklemde yerine koyuyoruz
B = 0,92, a = 76,98 elde ederiz
Regresyon denklemi:
y = 0,92 x + 76,98

1. Regresyon denklemi parametreleri.
Örnek anlamına gelir.



Örnek farklılıklar:


Standart sapma


Korelasyon katsayısı
Bağlantı yakınlığının göstergesini hesaplıyoruz. Bu gösterge, aşağıdaki formülle hesaplanan örnek doğrusal korelasyon katsayısıdır:

Doğrusal korelasyon katsayısı –1 ile +1 arasında değerler alır.
Karakteristikler arasındaki bağlantılar zayıf ve güçlü (yakın) olabilir. Kriterleri Chaddock ölçeğine göre değerlendirilir:
0.1 < r xy < 0.3: слабая;
0.3 < r xy < 0.5: умеренная;
0.5 < r xy < 0.7: заметная;
0.7 < r xy < 0.9: высокая;
0.9 < r xy < 1: весьма высокая;
Örneğimizde ortalama günlük ücret ile kişi başına düşen ortalama geçim ücreti arasındaki bağlantı yüksek ve doğrudandır.
1.2. Regresyon denklemi(regresyon denkleminin tahmini).

Doğrusal regresyon denklemi y = 0,92 x + 76,98'dir
Denklem katsayıları doğrusal regresyon ekonomik anlam verilebilir.
Katsayı b = 0,92, ölçüm birimi başına x faktörünün değerindeki bir artış veya azalma ile etkili göstergedeki (y ölçüm birimleri cinsinden) ortalama değişimi gösterir. Bu örnekte 1 rub artışla. Kişi başına günlük geçim düzeyine bakıldığında ortalama günlük ücret ortalama 0,92 oranında artıyor.
a = 76,98 katsayısı resmi olarak ortalama günlük ücretin öngörülen düzeyini gösterir, ancak yalnızca x=0'ın örnek değerlere yakın olması durumunda.
Uygun x değerlerini regresyon denkleminde yerine koyarak, her gözlem için performans göstergesi y(x)'in hizalanmış (tahmin edilen) değerlerini belirleyebiliriz.
Ortalama günlük ücret ile kişi başına düşen ortalama asgari geçim arasındaki ilişki, regresyon katsayısı b'nin işaretiyle belirlenir (eğer > 0 ise - doğrudan ilişki, aksi takdirde - ters). Örneğimizde bağlantı doğrudandır.
Esneklik katsayısı.
Sonuç göstergesi y ile faktör özelliği x'in ölçüm birimlerinde bir fark varsa, faktörlerin sonuç özelliği üzerindeki etkisini doğrudan değerlendirmek için regresyon katsayılarının (örnek b) kullanılması önerilmez.
Bu amaçlar için esneklik katsayıları ve beta katsayıları hesaplanır. Esneklik katsayısı aşağıdaki formülle bulunur:


Faktör özelliği x %1 değiştiğinde etkili y özelliğinin ortalama yüzde kaç oranında değiştiğini gösterir. Faktörlerin dalgalanma derecesi dikkate alınmaz.
Esneklik katsayısı 1'den küçüktür. Dolayısıyla kişi başına günlük ortalama yaşam maliyeti %1 oranında değişirse ortalama günlük ücret %1'den az değişecektir. Başka bir deyişle, kişi başına düşen ortalama geçim düzeyi X'in ortalama günlük ücret Y üzerindeki etkisi anlamlı değildir.
Beta katsayısı ortalamasının değerinin ne kadar olduğunu gösterir kare sapma Ortaya çıkan özelliğin ortalama değeri, faktör karakteristiği standart sapma değeri kadar değiştiğinde ve kalan bağımsız değişkenlerin değeri sabit bir seviyede sabitlendiğinde değişecektir:

Onlar. x'te bu göstergenin standart sapması kadar bir artış, ortalama günlük ücret Y'de bu göstergenin 0,721 standart sapması kadar bir artışa yol açacaktır.
1.4. Yaklaşım hatası.
Mutlak yaklaşım hatasını kullanarak regresyon denkleminin kalitesini değerlendirelim.


Hata %15'ten az olduğundan bu denklem regresyon olarak kullanılabilir.
Belirleme katsayısı.
(Çoklu) korelasyon katsayısının karesine, faktör özelliğindeki değişiklik tarafından açıklanan sonuç özellikteki değişimin oranını gösteren belirleme katsayısı adı verilir.
Çoğu zaman, belirleme katsayısını yorumlarken yüzde olarak ifade edilir.
R2 = 0,722 = 0,5199
onlar. Vakaların %51,99'unda, kişi başına düşen ortalama geçim seviyesi x'teki değişiklikler, ortalama günlük ücret y'de bir değişikliğe yol açmaktadır. Başka bir deyişle regresyon denkleminin seçiminin doğruluğu ortalamadır. Ortalama günlük ücret Y'deki değişimin geri kalan %48,01'i modelde dikkate alınmayan faktörlerle açıklanmaktadır.

X sen x 2 y 2 x o y y(x) (y i -y cp) 2 (y-y(x)) 2 (x i -x cp) 2 |y - yx |:y
78 133 6084 17689 10374 148,77 517,56 248,7 57,51 0,1186
82 148 6724 21904 12136 152,45 60,06 19,82 12,84 0,0301
87 134 7569 17956 11658 157,05 473,06 531,48 2,01 0,172
79 154 6241 23716 12166 149,69 3,06 18,57 43,34 0,028
89 162 7921 26244 14418 158,89 39,06 9,64 11,67 0,0192
106 195 11236 38025 20670 174,54 1540,56 418,52 416,84 0,1049
67 139 4489 19321 9313 138,65 280,56 0,1258 345,34 0,0026
88 158 7744 24964 13904 157,97 5,06 0,0007 5,84 0,0002
73 152 5329 23104 11096 144,17 14,06 61,34 158,34 0,0515
87 162 7569 26244 14094 157,05 39,06 24,46 2,01 0,0305
76 159 5776 25281 12084 146,93 10,56 145,7 91,84 0,0759
115 173 13225 29929 19895 182,83 297,56 96,55 865,34 0,0568
1027 1869 89907 294377 161808 1869 3280,25 1574,92 2012,92 0,6902

2. Regresyon denklemi parametrelerinin tahmini.
2.1. Korelasyon katsayısının önemi.

Anlam düzeyi α=0,05 ve serbestlik derecesi k=10 olan Öğrenci tablosunu kullanarak t kritikini buluruz:
t kritik = (10;0,05) = 1,812
burada m = 1 açıklayıcı değişkenlerin sayısıdır.
Eğer t gözlendi > t kritikse, korelasyon katsayısının ortaya çıkan değeri anlamlı kabul edilir (korelasyon katsayısının sıfıra eşit olduğunu belirten sıfır hipotezi reddedilir).
t obs > t kritik olduğundan korelasyon katsayısının 0'a eşit olduğu hipotezini reddediyoruz. Başka bir deyişle korelasyon katsayısı istatistiksel olarak anlamlıdır.
Eşleştirilmiş doğrusal regresyonda t 2 r = t 2 b ve ardından regresyon ve korelasyon katsayılarının önemine ilişkin hipotezlerin test edilmesi, anlamlılığa ilişkin hipotezin test edilmesine eşdeğerdir Doğrusal Denklem gerileme.

2.3. Regresyon katsayısı tahminlerinin belirlenmesinin doğruluğunun analizi.
Bozulmaların dağılımının tarafsız bir tahmini şu değerdir:


S 2 y = 157,4922 - açıklanamayan varyans (bağımlı değişkenin regresyon çizgisi etrafındaki yayılmasının bir ölçüsü).

12.5496 - tahminin standart hatası (regresyonun standart hatası).
S a - standart sapma Rastgele değişken a.


S b - rastgele değişken b'nin standart sapması.


2.4. Bağımlı değişken için güven aralıkları.
Oluşturulan modele dayalı ekonomik tahmin, değişkenler arasındaki önceden var olan ilişkilerin teslim süresi boyunca korunduğunu varsayar.
Ortaya çıkan özelliğin bağımlı değişkenini tahmin etmek için modelde yer alan tüm faktörlerin tahmin değerlerinin bilinmesi gerekir.
Faktörlerin tahmin edilen değerleri modele yerleştirilerek çalışılan göstergenin tahmine yönelik nokta tahminleri elde edilir.
(a + bx p ± ε)
Nerede

%95'in yoğunlaşacağı aralığın sınırlarını hesaplayalım olası değerler Sınırsız sayıda gözlem için Y ve X p = 94

(76,98 + 0,92*94 ± 7,8288)
(155.67;171.33)
Sınırsız sayıda gözlem için Y değerinin, bulunan aralıkların sınırlarının dışına çıkmayacağını %95 olasılıkla garanti etmek mümkündür.
2.5. Doğrusal bir regresyon denkleminin katsayılarına ilişkin hipotezlerin test edilmesi.
1) t-istatistikleri. Öğrenci t testi.
Bireysel regresyon katsayılarının sıfıra eşitliği hakkındaki H 0 hipotezini (alternatif H 1'e eşit değilse) α=0,05 anlamlılık seviyesinde kontrol edelim.
t kritik = (10;0,05) = 1,812


3,2906 > 1,812 olduğundan regresyon katsayısı b'nin istatistiksel anlamlılığı doğrulanmıştır (bu katsayının sıfıra eşit olduğu hipotezini reddediyoruz).


3,1793 > 1,812 olduğundan, regresyon katsayısı a'nın istatistiksel anlamlılığı doğrulanmıştır (bu katsayının sıfıra eşit olduğu hipotezini reddediyoruz).
Regresyon denklemi katsayıları için güven aralığı.
Hadi tanımlayalım güvenilirlik aralığı% 95 güvenilirlikle aşağıdaki gibi olacak regresyon katsayıları:
(b - t kritik S b ; b + t kritik S b)
(0.9204 - 1.812 0.2797; 0.9204 + 1.812 0.2797)
(0.4136;1.4273)

(a - t lang=SV>a)
(76.9765 - 1.812 24.2116; 76.9765 + 1.812 24.2116)
(33.1051;120.8478)
%95 olasılıkla bu parametrenin değerinin bulunan aralıkta olacağı söylenebilir.
2) F istatistikleri. Fisher kriteri.
Bir regresyon modelinin öneminin test edilmesi, hesaplanan değeri, incelenen göstergenin orijinal gözlem serisinin varyansının oranı ve artık dizinin varyansının tarafsız tahmini olarak bulunan Fisher'in F testi kullanılarak gerçekleştirilir. bu model için.
k1=(m) ve k2=(n-m-1) serbestlik derecesi ile hesaplanan değer, belirli bir anlamlılık düzeyinde tablodaki değerden büyükse model anlamlı kabul edilir.

burada m modeldeki faktörlerin sayısıdır.
Seviye İstatistiksel anlamlılık eşleştirilmiş doğrusal regresyon aşağıdaki algoritma kullanılarak gerçekleştirilir:
1. Denklemin bir bütün olarak istatistiksel olarak anlamsız olduğuna dair boş bir hipotez öne sürülüyor: α anlamlılık düzeyinde H 0: R 2 =0.
2. Daha sonra F kriterinin gerçek değerini belirleyin:


burada m=1 ikili regresyon için.
3. Tablo değeri belirli bir önem düzeyi için Fisher dağılım tablolarından, serbestlik derecesi sayısı dikkate alınarak belirlenir. toplam tutar doğrusal regresyonda kareler (daha büyük varyans) 1'dir ve kalan kareler toplamının (daha küçük varyans) serbestlik derecesi sayısı n-2'dir.
4. F testinin gerçek değeri tablo değerinden küçükse sıfır hipotezini reddetmek için hiçbir neden olmadığını söylüyorlar.
Aksi takdirde sıfır hipotezi reddedilir ve denklemin bir bütün olarak istatistiksel anlamlılığına ilişkin alternatif hipotez (1-α) olasılığıyla kabul edilir.
Serbestlik derecesi k1=1 ve k2=10 olan kriterin tablo değeri, Fkp = 4,96
F > Fkp'nin gerçek değeri olduğundan, belirleme katsayısı istatistiksel olarak anlamlıdır (Regresyon denkleminin bulunan tahmini istatistiksel olarak güvenilirdir).

Aşama 3. Veriler arasındaki ilişkileri bulma

Doğrusal korelasyon

Olgular arasındaki bağlantıları inceleme görevinin son aşaması, göstergelere dayalı olarak bağlantının yakınlığını değerlendirmektir. korelasyon bağlantısı. Bu aşama, faktör ve performans özellikleri arasındaki bağımlılığın belirlenmesi ve dolayısıyla incelenen olgunun teşhis ve prognozunun yapılması olasılığı açısından çok önemlidir.

Teşhis(Yunanca tanı tanımadan) - kapsamlı bir çalışmaya dayanarak bir nesnenin veya olgunun durumunun özünün ve özelliklerinin belirlenmesi.

Tahmin etmek(Yunan prognoz öngörüsünden, tahminden) - gelecekteki herhangi bir olgunun durumu hakkında herhangi bir özel tahmin, yargı (hava durumu tahmini, seçim sonucu vb.). Tahmin, incelenen sistemin, nesnenin veya olgunun gelecekteki olası durumu ve bu durumu karakterize eden göstergeler hakkında bilimsel temelli bir hipotezdir. Tahmin – tahmin geliştirme, özel Bilimsel araştırma herhangi bir olgunun gelişimi için belirli beklentiler.

Korelasyonun tanımını hatırlayalım:

Korelasyon– rastgele değişkenler arasındaki bağımlılık, bir değerin dağılımının başka bir değerin değerine bağlı olmasıyla ifade edilir.

Sadece niceliksel değil niteliksel özellikler arasında da bir korelasyon görülmektedir. Var olmak çeşitli yollar ve bağların yakınlığını değerlendirmeye yönelik göstergeler. Sadece burada duracağız doğrusal çift korelasyon katsayısı Rastgele değişkenler arasında doğrusal bir ilişki olduğunda kullanılır. Uygulamada, genellikle eşit olmayan boyutlardaki rastgele değişkenler arasındaki bağlantı düzeyinin belirlenmesine ihtiyaç duyulur, dolayısıyla bu bağlantının bir tür boyutsuz karakteristiğine sahip olmak arzu edilir. Böyle bir özellik (bağlantı ölçüsü) katsayıdır doğrusal korelasyon r xy formülle belirlenir

Nerede , .

Gösterilen ve , korelasyon katsayısını hesaplamak için aşağıdaki ifadeyi elde edebiliriz

.

Konsepti tanıtacak olursak normalleştirilmiş sapma , ilişkili değerlerin standart sapmanın kesirleri cinsinden ortalamadan sapmasını ifade eder:



o zaman korelasyon katsayısının ifadesi şu şekli alacaktır:

.

Korelasyon katsayısını hesaplama tablosundaki orijinal rastgele değişkenlerin son değerlerini kullanarak hesaplarsanız, korelasyon katsayısı formül kullanılarak hesaplanabilir.

.

Doğrusal korelasyon katsayısının özellikleri:

1). Korelasyon katsayısı boyutsuz bir niceliktir.

2). |R| 1 £ veya.

3). , a,b= const, – X ve Y rastgele değişkenlerinin tüm değerleri bir sabitle çarpılırsa (veya bölünürse) korelasyon katsayısının değeri değişmeyecektir.

4). , a,b= const, – X ve Y rastgele değişkenlerinin tüm değerleri bir sabit kadar artırılırsa (veya azaltılırsa) korelasyon katsayısının değeri değişmeyecektir.

5). Korelasyon katsayısı ile regresyon katsayısı arasında bir ilişki vardır:

Korelasyon katsayılarının değerleri şu şekilde yorumlanabilir:

İletişimin yakınlığını değerlendirmek için niceliksel kriterler:

Prognostik amaçlar için |r| olan değerler > 0,7.

Korelasyon katsayısı varlığı sonucuna varmamızı sağlar doğrusal bağımlılık iki rastgele değişken arasındadır ancak değişkenlerden hangisinin diğerinde değişikliğe neden olduğunu göstermez. Aslında iki rastgele değişken arasında bir bağlantı, değerlerin kendisi arasında bir neden-sonuç ilişkisi olmadan da var olabilir, çünkü Her iki rastgele değişkendeki bir değişiklik, üçüncüdeki bir değişiklikten (etkiden) kaynaklanabilir.

Korelasyon katsayısı r xy söz konusu rastgele değişkenlere göre simetriktir X Ve e. Bu, korelasyon katsayısını belirlemek için büyüklüklerden hangisinin bağımsız, hangisinin bağımlı olduğunun tamamen önemsiz olduğu anlamına gelir.

Korelasyon katsayısının önemi

İçin bile bağımsız miktarlar korelasyon katsayısı, ölçüm sonuçlarının rastgele dağılmasından veya rastgele değişkenlerin küçük bir örneğinden dolayı sıfırdan farklı olabilir. Bu nedenle korelasyon katsayısının anlamlılığı kontrol edilmelidir.

Doğrusal korelasyon katsayısının önemi şu şekilde kontrol edilir: Öğrenci t testi :

.

Eğer T > t cr(P, n-2), o zaman doğrusal korelasyon katsayısı anlamlıdır ve dolayısıyla istatistiksel ilişki de anlamlıdır X Ve e.

.

Hesaplama kolaylığı için, korelasyon katsayılarının güven limitlerinin değer tabloları oluşturulmuştur. çeşitli sayılarözgürlük derecesi f = n–2 (iki kuyruklu test) ve çeşitli anlamlılık seviyeleri A= 0,1; 0,05; 0,01 ve 0,001. Hesaplanan korelasyon katsayısı verilen veri için korelasyon katsayısının güven sınırı değerini aşarsa korelasyonun anlamlı olduğu kabul edilir. F Ve A.

Büyük olanlar için N Ve A= 0,01 korelasyon katsayısının güven sınırı değeri yaklaşık formül kullanılarak hesaplanabilir

.

Tekrar tekrar belirtildiği gibi, incelenen değişkenler arasında bir korelasyonun varlığı veya yokluğu hakkında istatistiksel bir sonuca varmak için örnek korelasyon katsayısının öneminin kontrol edilmesi gerekir. Korelasyon katsayısı da dahil olmak üzere istatistiksel özelliklerin güvenilirliğinin örneklem büyüklüğüne bağlı olması nedeniyle, korelasyon katsayısının değerinin tamamen hesaplandığı örneklemdeki rastgele dalgalanmalar tarafından belirlendiği bir durum ortaya çıkabilir. . Değişkenler arasında anlamlı bir ilişki varsa korelasyon katsayısının sıfırdan önemli ölçüde farklı olması gerekir. İncelenen değişkenler arasında korelasyon yoksa popülasyonun korelasyon katsayısı sıfıra eşittir. Pratik araştırmalarda kural olarak örnek gözlemlere dayanırlar. Herhangi bir istatistiksel özellik gibi, örnek korelasyon katsayısı da rastgele değişken yani değerleri aynı adı taşıyan popülasyon parametresi (korelasyon katsayısının gerçek değeri) etrafına rastgele dağılmıştır. Değişkenler arasında korelasyon yoksa popülasyondaki korelasyon katsayıları sıfıra eşittir. Ancak saçılımın rastgele doğası nedeniyle, bu popülasyondan alınan örneklerden hesaplanan bazı korelasyon katsayılarının sıfırdan farklı olacağı durumlar temelde mümkündür.

Gözlenen farklılıklar örneklemdeki rastgele dalgalanmalara bağlanabilir mi, yoksa değişkenler arasındaki ilişkilerin oluştuğu koşullarda önemli bir değişikliği mi yansıtıyor? Örnek korelasyon katsayısının değerleri saçılma bölgesi içinde kalıyorsa,

göstergenin rastgele doğasından dolayı bu bir ilişkinin bulunmadığının kanıtı değildir. Söylenebilecek en fazla gözlemsel verilerin değişkenler arasında bir ilişkinin yokluğunu inkar etmediğidir. Ancak örnek korelasyon katsayısının değeri bahsedilen saçılma bölgesinin dışındaysa, bu durumda sıfırdan önemli ölçüde farklı olduğu sonucuna varırlar ve değişkenler arasında istatistiksel bir fark olduğunu varsayabiliriz. anlamlı bağlantı. Çeşitli istatistiklerin dağılımına dayalı olarak bu sorunu çözmek için kullanılan kritere anlamlılık kriteri denir.

Anlamlılık testi prosedürü sıfır hipotezi B'nin formüle edilmesiyle başlar. Genel görünümörnek parametresi ile popülasyon parametresi arasında anlamlı bir fark olmaması gerçeğinde yatmaktadır. Alternatif bir hipotez ise bu parametreler arasında önemli farklılıklar olduğu yönündedir. Örneğin, bir popülasyonda bir korelasyonun varlığını test ederken boş hipotez, gerçek korelasyon katsayısının sıfır olduğu şeklindedir. Test, sıfır hipotezinin kabul edilemez olmasıyla sonuçlanırsa, o zaman örnek korelasyon katsayısı sıfırdan önemli ölçüde farklıdır (sıfır) hipotez reddedilir ve alternatif kabul edilir. Başka bir deyişle, rastgele değişkenlerin popülasyonda korelasyonsuz olduğu varsayımı temelsiz kabul edilmelidir ve bunun tersi de, anlamlılık kriterine göre sıfır hipotezi kabul edilirse, yani yalan söylerse izin verilen rastgele dağılım bölgesinde ise, popülasyondaki ilişkisiz değişkenler varsayımının sorgulanabilir olduğunu düşünmek için hiçbir neden yoktur.

Bir anlamlılık testinde araştırmacı, yalnızca çok nadir durumlarda hatalı sonuçlara varılacağına dair pratik bir güven sağlayan bir anlamlılık düzeyi a belirler. Anlamlılık düzeyi, sıfır hipotezinin gerçekte doğru olduğu halde reddedilme olasılığını ifade eder. Açıkçası bu olasılığı mümkün olduğu kadar küçük seçmek mantıklıdır.

Popülasyon parametresinin tarafsız bir tahmini olan örneklem karakteristiğinin dağılımı bilinsin. Seçilen anlamlılık düzeyi a, bu dağılım eğrisinin altındaki gölgeli alanlara karşılık gelir (bkz. Şekil 24). Dağılım eğrisinin altındaki gölgesiz alan olasılığı belirler.Gölgeli alanların altındaki apsis eksenindeki bölümlerin sınırlarına kritik değerler denir ve bölümlerin kendisi de kritik bölgeyi veya hipotezin reddedildiği alanı oluşturur.

Hipotez testi prosedüründe, gözlem sonuçlarından hesaplanan örnek özelliği, karşılık gelen kritik değerle karşılaştırılır. Bu durumda tek taraflı ve iki taraflı kritik alanlar arasında ayrım yapılmalıdır. Kritik bölgenin belirtilme şekli problemin formülasyonuna bağlıdır. istatistiksel araştırma. Bir örnek parametre ile bir popülasyon parametresini karşılaştırırken iki taraflı bir kritik bölgeye ihtiyaç vardır

değerlendirilmesi gerekiyor mutlak değer aralarındaki tutarsızlıklar, yani incelenen miktarlar arasındaki hem pozitif hem de negatif farklar ilgi çekicidir. Bir değerin ortalama olarak diğerinden kesinlikle büyük veya küçük olduğundan emin olmak gerektiğinde, tek taraflı bir kritik bölge (sağ veya sol taraf) kullanılır. Aynı kritik değer için, tek taraflı kritik bölge kullanıldığında anlamlılık düzeyinin, iki taraflı kritik bölgeye göre daha düşük olduğu oldukça açıktır.

Pirinç. 24. Boş Hipotez Testi

Örnek özelliğinin dağılımı simetrikse, iki taraflı kritik bölgenin anlamlılık düzeyi a'ya, tek taraflı kritik bölgenin ise y'ye eşittir (bkz. Şekil 24). Kendimizi sorunun genel formülasyonuyla sınırlayalım. Testin teorik gerekçesi ile daha ayrıntılı olarak istatistiksel hipotezler buluşabilirsin özel edebiyat. Aşağıda yalnızca önem kriterlerini göstereceğiz. çeşitli prosedürler, inşaatlarına ara vermeden.

Çift korelasyon katsayısının öneminin kontrol edilmesiyle, incelenen olaylar arasında bir korelasyonun varlığı veya yokluğu belirlenir. Bağlantı yoksa popülasyonun korelasyon katsayısı sıfırdır.Doğrulama prosedürü boş ve alternatif hipotezlerin formülasyonu ile başlar:

Örnek korelasyon katsayıları arasındaki fark önemsizdir,

Aralarındaki fark anlamlıdır ve dolayısıyla değişkenleri arasında anlamlı bir ilişki vardır. Alternatif hipotez, iki taraflı bir kritik bölge kullanmamız gerektiğini ima ediyor.

Örnek korelasyon katsayısının, belirli varsayımlar altında, serbestlik dereceli Öğrenci dağılımına tabi rastgele bir değişkenle ilişkili olduğu Bölüm 8.1'de zaten belirtilmişti. Örnek sonuçlarından hesaplanan istatistikler

verilen bir anlamlılık düzeyi a ve serbestlik derecesinde Öğrenci dağılım tablosundan belirlenen kritik değerle karşılaştırılır. Kriteri uygulama kuralı şu şekildedir: Eğer sıfır hipotezi anlamlılık düzeyinde a reddedilirse, yani değişkenler arasındaki ilişki anlamlı ise; bu durumda a anlamlılık seviyesindeki sıfır hipotezi kabul edilir. Değerin sapması rastgele değişime bağlanabilir. Örnek veriler, incelenmekte olan hipotezi oldukça mümkün ve makul olarak nitelendirmektedir, yani. bir bağlantının olmadığı hipotezi itirazlara yol açmamaktadır.

İstatistik yerine, Öğrenci dağılımının nicelikleri aracılığıyla belirlenebilen korelasyon katsayısının kritik değerlerini kullanırsak, hipotez test prosedürü büyük ölçüde basitleştirilir.

Bu kitabın ekinde bir alıntısı verilen kritik değerlerin ayrıntılı tabloları bulunmaktadır (bkz. Tablo 6). Bu durumda bir hipotezi test etmenin kuralı şuna indirgenir: Eğer öyleyse, değişkenler arasındaki ilişkinin anlamlı olduğunu iddia edebiliriz. Eğer öyleyse, gözlem sonuçlarının bir bağlantının olmadığı hipoteziyle tutarlı olduğunu düşünüyoruz.

Bölüm 4.1'de verilen verilere göre emek verimliliğinin işin mekanizasyon düzeyinden bağımsızlığı hakkındaki hipotezi test edelim. Daha önce (8.38)'den elde ettiğimiz hesaplanmıştı.

Öğrenci dağılım tablosunu kullanarak bu istatistiğin kritik değerini buluyoruz: Sıfır hipotezini reddettiğimiz için vakaların yalnızca %5'inde hata yapıyoruz.

İlgili tablodan bulunan korelasyon katsayısının kritik değeri ile karşılaştırırsak aynı sonucu elde ederiz.

serbestlik dereceli bir dağılıma sahiptir. Daha sonra, önemi kontrol etme prosedürü, -kriter kullanılarak öncekine benzer şekilde gerçekleştirilir.

Örnek

Olayın ekonomik analizine dayanarak, genel nüfusta emek verimliliği ile işin makineleşme düzeyi arasında güçlü bir bağlantı olduğunu varsayıyoruz. Örneğin . Alternatif olarak bu durumda örnek korelasyon katsayısı hipotezini öne sürebiliriz. Dolayısıyla tek taraflı bir kritik bölge kullanmamız gerekir. (8.40)’tan şu sonuç çıkıyor

Elde edilen değeri kritik değerle karşılaştırıyoruz.Böylece %5'lik bir anlamlılık seviyesinde, incelenen özellikler arasında çok yakın bir bağlantının varlığını varsayabiliriz, yani ilk veriler bunun makul olduğunu düşünmeyi mümkün kılıyor

Kısmi korelasyon katsayılarının anlamlılığı da benzer şekilde kontrol edilir. Yalnızca açıklayıcı değişkenlerin sayısına eşit olan serbestlik derecesi sayısı değişir. Formül kullanılarak hesaplanan istatistik değeri

a anlamlılık düzeyinde dağılım tablosundan bulunan kritik değer a ve serbestlik derecesi sayısı ile karşılaştırılır Kısmi korelasyon katsayısının anlamlılığına ilişkin hipotezin kabulü veya reddi, yukarıda açıklanan aynı kurala göre gerçekleştirilir. . Anlamlılık testi, (8.39)'a göre korelasyon katsayısının kritik değerlerinin yanı sıra Fisher dönüşümü (8.40) kullanılarak da yapılabilir.

Örnek

Bölüm 4.5'te hesaplanan kısmi korelasyon katsayılarının istatistiksel güvenilirliğini anlamlılık düzeyinde kontrol edelim. Aşağıda, kısmi korelasyon katsayılarıyla birlikte karşılık gelen hesaplanan ve kritik istatistiksel değerler verilmiştir.

Katsayıların önemine ilişkin hipotezin kabul edilmesi nedeniyle şu sonuca varıyoruz: İşin makineleşme düzeyinin, çalışanların ortalama yaşının (ve ortalama uyum yüzdesinin) etkisi hariç, emek verimliliği üzerinde önemli bir etkisi vardır. standartlar). Kalan katsayıların sıfırdan farkı

kısmi korelasyonlar örneklemdeki rastgele dalgalanmalara atfedilebilir ve bu nedenle bunlardan ilgili değişkenlerin kısmi etkileri hakkında kesin bir şey söyleyemeyiz.

Çoklu korelasyon katsayısının önemi, çoklu belirleme katsayısının önemini kontrol etme prosedürünün sonucuna göre değerlendirilir. Bunu bir sonraki bölümde daha ayrıntılı olarak ele alacağız.

Sıklıkla ilgi çeken bir soru şudur: İki korelasyon katsayısı birbirinden önemli ölçüde farklı mıdır? Bu hipotezi test ederken homojen popülasyonların aynı özelliklerinin dikkate alındığı varsayılır; veriler sonuçları temsil eder bağımsız testler; Aynı türdeki korelasyon katsayıları kullanılır, yani aynı sayıda değişken hariç tutulduğunda ya ikili korelasyon katsayıları ya da kısmi korelasyon katsayıları kullanılır.

Korelasyon katsayılarının hesaplandığı iki numunenin hacimleri farklı olabilir. Boş hipotez: yani, söz konusu iki popülasyonun korelasyon katsayıları eşittir. Alternatif Hipotez: Alternatif hipotez, iki yönlü bir kritik bölgenin kullanılması gerektiğini ima eder. Başka bir deyişle, farkın sıfırdan önemli ölçüde farklı olup olmadığını kontrol etmelisiniz.Yaklaşık olarak normal dağılıma sahip istatistikleri kullanalım:

nerede - korelasyon katsayılarının dönüşümlerinin sonuçları - numune hacimleri. Test kuralı: Eğer hipotez reddedilirse; eğer öyleyse hipotez kabul edilir.

Kabul edilirse değer

(8.6) kullanılarak yeniden hesaplama yapıldıktan sonra korelasyon katsayısının özet bir tahmini görevi görür.Daha sonra hipotez istatistikler kullanılarak test edilebilir

normal dağılıma sahiptir.

Örnek

Ülkenin farklı bölgelerinde bulunan aynı sektördeki işletmelerde işgücü verimliliği ile işin mekanizasyon düzeyi arasındaki bağlantının yakınlığının farklı olup olmadığını tespit etmek gerekli olsun. İki bölgede bulunan işletmeleri karşılaştıralım. Bunlardan birinin korelasyon katsayısının hacim örneği kullanılarak hesaplanmasına izin verin (bkz. Bölüm 4.1). Diğer bölge için hacim örneği kullanılarak hesaplanır

Her iki korelasyon katsayısını da -değerlere dönüştürdükten sonra, X istatistiğinin değerini (8.42) kullanarak hesaplıyoruz:

İstatistiğin kritik değeri şudur: Dolayısıyla hipotez kabul edilir, yani mevcut örneklere dayanarak korelasyon katsayıları arasında anlamlı bir fark kuramayız. Ayrıca her iki korelasyon katsayısı da anlamlıdır.

(8.43) ve (8.6)'yı kullanarak, iki bölge için korelasyon katsayısının özet bir tahminini elde ederiz:

Son olarak, korelasyon katsayısının özet tahmininin sıfırdan önemli ölçüde farklı olup olmadığı hipotezini istatistikleri (8.44) kullanarak kontrol edelim:

Çünkü genel nüfusta emek verimliliği ile işin makineleşme düzeyi arasında önemli bir bağlantı olduğunu söyleyebiliriz.

X kriteri çeşitli yönlerden kullanılabilir. Bu nedenle, örneğin iki farklı sektöre ait işletmelerin ekonomik göstergeleri arasında incelenen ilişkilerin gücündeki farklılıkların anlamlı olup olmadığını belirlemek gerektiğinde, bölgeler yerine farklı sektörler dikkate alınabilir.

İki hacim örneğine dayanarak, iki sektöre (iki genel nüfus) ait işletmelerde işgücü verimliliği ile işin mekanizasyon düzeyi arasındaki yakın ilişkiyi karakterize eden korelasyon katsayılarını hesaplayalım. (8.42)'den şunu elde ederiz:

Sıfır hipotezini reddettiğimiz için. Sonuç olarak, çeşitli sektörlere ait işletmelerde işgücü verimliliği ile işin mekanizasyon düzeyi arasındaki ilişkinin yakınlığında önemli farklılıklar olduğu ileri sürülebilir. Bu örneğe, iki popülasyon için oluşturulan regresyon çizgilerini karşılaştıracağımız Bölüm 8.7'de devam edeceğiz.

Verilen örnekleri analiz ettiğimizde, karşılaştırılan korelasyon katsayılarının yalnızca mutlak farkını dikkate aldığımıza inanıyoruz.

(her iki durumda da örneklem büyüklükleri aynıdır) bu farkın anlamlılığı kontrol edilmeden yapılması hatalı sonuçlara yol açacaktır. Bu, korelasyon katsayılarını karşılaştırırken istatistiksel kriterlerin kullanılması ihtiyacını doğrulamaktadır.

İki korelasyon katsayısını karşılaştırma prosedürü şu şekilde genelleştirilebilir: daha büyük sayı katsayılar yukarıdaki önkoşullara tabidir. Değişkenler arasındaki korelasyon katsayılarının eşitliği hipotezi şu şekilde ifade edilir: Hacim örneklerinden hesaplanan korelasyon katsayıları temel alınarak test edilir. genel nüfus. korelasyon katsayıları -değerler halinde yeniden hesaplanır: Genel dava bilinmiyor, tahminini (8.43)'ün genellemesi olan formül aracılığıyla buluyoruz.

DERS ÇALIŞMASI

Konu: Korelasyon analizi

giriiş

1. Korelasyon analizi

1.1 Korelasyon kavramı

1.2 Korelasyonların genel sınıflandırması

1.3 Korelasyon alanları ve yapım amacı

1.4 Aşamalar korelasyon analizi

1.5 Korelasyon katsayıları

1.6 Normalleştirilmiş Bravais-Pearson korelasyon katsayısı

1.7 Katsayı sıra korelasyonu Mızrakçı

1.8 Korelasyon katsayılarının temel özellikleri

1.9 Korelasyon katsayılarının öneminin kontrol edilmesi

1.10 Kritik değerlerçift ​​korelasyon katsayısı

2. Çok faktörlü bir deney planlamak

2.1 Sorunun durumu

2.2 Planın merkezinin (temel düzey) ve faktör değişimi düzeyinin belirlenmesi

2.3 Planlama matrisinin oluşturulması

2.4 Farklı serilerde dağılım homojenliğinin ve ölçüm denkliğinin kontrol edilmesi

2.5 Regresyon denklemi katsayıları

2.6 Tekrarlanabilirlik farkı

2.7 Regresyon denklemi katsayılarının öneminin kontrol edilmesi

2.8 Regresyon denkleminin yeterliliğinin kontrol edilmesi

Çözüm

Kaynakça

GİRİİŞ

Deneysel planlama, rasyonel organizasyon yöntemlerini inceleyen matematiksel ve istatistiksel bir disiplindir. deneysel araştırma- itibaren optimal seçim incelenen faktörler ve gerçek deney planının amacına uygun olarak belirlenmesi ve sonuçların analiz edilmesine yönelik yöntemler. Deneysel planlama, rasyonel deneysel planlamanın, tahminlerin doğruluğunda, ölçüm sonuçlarının en iyi şekilde işlenmesinden daha az önemli kazanımlar sağlamadığını vurgulayan İngiliz istatistikçi R. Fisher'ın (1935) çalışmalarıyla başladı. 20. yüzyılın 60'lı yıllarında vardı modern teori deneyi planlıyoruz. Yöntemleri fonksiyon yaklaşım teorisi ve matematiksel programlamayla yakından ilgilidir. Geniş bir model sınıfı için en uygun planlar oluşturulmuş ve özellikleri incelenmiştir.

Deneysel planlama - belirli gereksinimleri karşılayan bir deney planının seçimi, bir deney stratejisi geliştirmeyi amaçlayan bir dizi eylem (önsel bilgi elde etmekten uygulanabilir bir matematiksel model elde etmeye veya belirlemeye kadar) optimal koşullar). Bu, incelenen olgunun mekanizması hakkında eksik bilgi koşulları altında uygulanan bir deneyin amaçlı kontrolüdür.

Ölçümler sürecinde, sonraki veri işlemenin yanı sıra sonuçların matematiksel bir model biçiminde resmileştirilmesi sırasında hatalar ortaya çıkar ve orijinal verilerde yer alan bilgilerin bir kısmı kaybolur. Deneysel planlama yöntemlerinin kullanılması, matematiksel modelin hatasını belirlemeyi ve yeterliliğini değerlendirmeyi mümkün kılar. Modelin doğruluğu yetersiz çıkarsa, deneysel planlama yöntemlerinin kullanılması modernizasyonu mümkün kılar. matematiksel modelönceki bilgileri kaybetmeden ve minimum maliyetle ek deneylerle.

Bir deney planlamanın amacı, bir nesne hakkında en az emekle güvenilir ve güvenilir bilgi elde etmenin mümkün olduğu deneyleri yürütmek için bu koşulları ve kuralları bulmak ve bu bilgiyi kompakt ve kullanışlı bir biçimde sunmaktır. doğruluğun niceliksel bir değerlendirmesiyle.

Çalışmanın farklı aşamalarında kullanılan ana planlama yöntemleri arasında şunlar yer almaktadır:

Asıl anlamı, daha ayrıntılı çalışmaya konu olan bir grup önemli faktörün tüm faktör kümesinden seçimi olan bir tarama deneyinin planlanması;

Şunun için bir deney planlamak: varyans analizi yani niteliksel faktörlere sahip nesneler için planların hazırlanması;

Regresyon modellerini (polinom ve diğerleri) elde etmenizi sağlayacak bir regresyon deneyi planlamak;

Ana görevin araştırma nesnesinin deneysel optimizasyonu olduğu aşırı bir deney planlamak;

Dinamik süreçleri vb. incelerken planlama yapmak.

Disiplini incelemenin amacı, öğrencileri planlama teorisi yöntemlerini ve modern bilgi teknolojilerini kullanarak uzmanlık alanlarındaki üretim ve teknik faaliyetlere hazırlamaktır.

Disiplinin amaçları: çalışma modern yöntemler bilimsel ve endüstriyel deneyleri planlamak, organize etmek ve optimize etmek, deneyler yapmak ve elde edilen sonuçları işlemek.

1. KORELASYON ANALİZİ

1.1 Korelasyon kavramı

Bir araştırmacı genellikle incelenen bir veya daha fazla örnekte iki veya daha fazla değişkenin birbiriyle nasıl ilişkili olduğuyla ilgilenir. Örneğin boy kişinin kilosunu etkileyebilir mi veya kan basıncı ürün kalitesini etkileyebilir mi?

Değişkenler arasındaki bu tür bağımlılığa korelasyon veya korelasyon denir. Korelasyon, bir özelliğin değişkenliğinin diğerinin değişkenliğine uygun olduğu gerçeğini yansıtan, iki özellikteki tutarlı bir değişikliktir.

Örneğin insanların boyu ile kiloları arasında ortalama olarak pozitif bir ilişki olduğu ve boy arttıkça kişinin kilosunun da arttığı bilinmektedir. Ancak göreceli olarak bu kuralın istisnaları vardır. kısa insanlar sahip olmak kilolu ve tersine, yüksek büyüme gösteren astenikler düşük ağırlığa sahiptir. Bu tür istisnaların nedeni her biyolojik, fizyolojik veya psikolojik işaret birçok faktörün etkisiyle belirlenir: çevresel, genetik, sosyal, çevresel vb.

Korelasyon bağlantıları, yalnızca temsili örnekler üzerinde yöntemler kullanılarak incelenebilen olasılıksal değişikliklerdir. matematiksel istatistik. Her iki terim de (korelasyon bağlantısı ve korelasyon bağımlılığı) sıklıkla birbirinin yerine kullanılır. Bağımlılık etkiyi, bağlantıyı, yani yüzlerce nedenden dolayı açıklanabilecek her türlü koordineli değişikliği ima eder. Korelasyon bağlantıları neden-sonuç ilişkisinin kanıtı olarak değerlendirilemez; yalnızca bir özellikteki değişime genellikle diğerindeki belirli değişikliklerin eşlik ettiğini gösterir.

Korelasyon bağımlılığı - bunlar bir özelliğin değerlerini ortaya çıkma olasılığına sokan değişikliklerdir Farklı anlamlar başka bir işaret.

Korelasyon analizinin görevi, değişen özellikler arasındaki ilişkinin yönünü (pozitif veya negatif) ve formunu (doğrusal, doğrusal olmayan) belirlemek, yakınlığını ölçmek ve son olarak elde edilen korelasyon katsayılarının anlamlılık düzeyini kontrol etmekten ibarettir.

Korelasyon bağlantıları biçim, yön ve derece (kuvvet) bakımından farklılık gösterir .

Korelasyon ilişkisinin şekli doğrusal veya eğrisel olabilir. Örneğin, simülatördeki eğitim oturumlarının sayısı ile kontrol oturumundaki doğru çözülmüş problemlerin sayısı arasındaki ilişki basit olabilir. Örneğin motivasyon düzeyi ile bir görevin etkinliği arasındaki ilişki eğrisel olabilir (Şekil 1). Motivasyon arttıkça, önce bir görevi tamamlamanın etkinliği artar, daha sonra görevi tamamlamanın maksimum etkinliğine karşılık gelen optimum motivasyon düzeyine ulaşılır; Motivasyondaki daha fazla artışa verimlilikte bir azalma eşlik eder.

Şekil 1 - Problem çözmenin etkinliği ile motivasyon eğilimlerinin gücü arasındaki ilişki

Korelasyon ilişkisi yönde pozitif (“doğrudan”) ve negatif (“ters”) olabilir. Pozitif doğrusal korelasyonda, bir özelliğin daha yüksek değerleri diğerinin daha yüksek değerlerine karşılık gelir ve bir özelliğin daha düşük değerleri şuna karşılık gelir: düşük değerler diğeri (Şekil 2). Negatif korelasyon durumunda ilişkiler terstir (Şekil 3). Pozitif bir korelasyon ile korelasyon katsayısı olumlu işaret, negatif korelasyonla - negatif bir işaret.

Şekil 2 - Doğrudan korelasyon

Şekil 3 - Ters korelasyon


Şekil 4 – Korelasyon yok

Korelasyonun derecesi, gücü veya yakınlığı korelasyon katsayısının değeri ile belirlenir. Bağlantının gücü yönüne bağlı değildir ve korelasyon katsayısının mutlak değeri ile belirlenir.

1.2 Korelasyonların genel sınıflandırması

Korelasyon katsayısına bağlı olarak aşağıdaki korelasyonlar ayırt edilir:

Güçlü veya r>0,70 korelasyon katsayısına yakın;

Ortalama (0,50'de

Orta (0,30'da

Zayıf (0,20'de

Çok zayıf (r'de<0,19).

1.3 Korelasyon alanları ve yapım amacı

Korelasyon, iki özelliğin ölçülen değerleri (xi, y i) olan deneysel verilere dayanarak incelenir. Çok az deneysel veri varsa, iki boyutlu ampirik dağılım, x i ve y i değerlerinin çift serisi olarak temsil edilir. Aynı zamanda özellikler arasındaki korelasyon bağımlılığı farklı şekillerde açıklanabilir. Bir argüman ile bir fonksiyon arasındaki yazışma bir tablo, formül, grafik vb. ile verilebilir.

Korelasyon analizi, diğer istatistiksel yöntemler gibi, deneysel değerlerin xi ve y'nin elde edildiği belirli bir genel popülasyonda incelenen özelliklerin davranışını tanımlayan olasılıksal modellerin kullanımına dayanmaktadır. Değerleri metrik ölçek birimlerinde (metre, saniye, kilogram vb.) Doğru bir şekilde ölçülebilen niceliksel özellikler arasındaki korelasyonu incelerken, genellikle iki boyutlu normal dağılmış bir nüfus modeli benimsenir. Böyle bir model, x i ve y i değişkenleri arasındaki ilişkiyi, dikdörtgen koordinat sistemindeki noktaların geometrik konumu biçiminde grafiksel olarak gösterir. Bu grafiksel ilişkiye aynı zamanda dağılım grafiği veya korelasyon alanı da denir.
Bu iki boyutlu normal dağılım modeli (korelasyon alanı), korelasyon katsayısının net bir grafiksel yorumunu vermemize olanak tanır, çünkü toplam dağılım beş parametreye bağlıdır: μ x, μ y – ortalama değerler (matematiksel beklentiler); σ x ,σ y – X ve Y rastgele değişkenlerinin standart sapmaları ve p – X ve Y rastgele değişkenleri arasındaki ilişkinin bir ölçüsü olan korelasyon katsayısı.
p = 0 ise iki boyutlu normal bir popülasyondan elde edilen x i , y i değerleri grafik üzerinde dairenin sınırladığı alan içerisinde x, y koordinatlarında yer alır (Şekil 5, a). Bu durumda X ve Y rastgele değişkenleri arasında korelasyon yoktur ve bunlara korelasyonsuz denir. İki boyutlu bir normal dağılım için korelasyonsuzluk aynı zamanda X ve Y rastgele değişkenlerinin bağımsızlığı anlamına gelir.

Bilimsel araştırmalarda, genellikle sonuç ve faktör değişkenleri (bir mahsulün verimi ve yağış miktarı, cinsiyet ve yaşa göre homojen gruplardaki bir kişinin boyu ve ağırlığı, kalp atış hızı ve vücut sıcaklığı) arasında bir bağlantı bulmaya ihtiyaç vardır. , vesaire.).

İkincisi, kendileriyle ilişkili olanlarda (birincisi) değişikliklere katkıda bulunan işaretlerdir.

Korelasyon analizi kavramı

Yukarıdakilere dayanarak korelasyon analizinin, araştırmacının bunları ölçebilmesi ancak değiştirememesi durumunda, iki veya daha fazla değişkenin istatistiksel anlamlılığı hakkındaki hipotezi test etmek için kullanılan bir yöntem olduğunu söyleyebiliriz.

Söz konusu kavramın başka tanımları da bulunmaktadır. Korelasyon analizi, değişkenler arasındaki korelasyon katsayılarının incelenmesini içeren bir işleme yöntemidir. Bu durumda, bir veya daha fazla özellik çifti arasındaki korelasyon katsayıları karşılaştırılarak aralarında istatistiksel ilişkiler kurulur. Korelasyon analizi, bir rastgele değişkenin dinamiğinin diğerinin matematiksel beklentisinin dinamiğine yol açtığı katı bir fonksiyonel doğanın isteğe bağlı varlığı ile rastgele değişkenler arasındaki istatistiksel bağımlılığı incelemek için bir yöntemdir.

Yanlış korelasyon kavramı

Korelasyon analizi yapılırken, genellikle birbiriyle ilişkili olarak saçma olan herhangi bir özellik kümesiyle ilişkili olarak yapılabileceğini dikkate almak gerekir. Bazen birbirleriyle nedensel bir bağlantı yoktur.

Bu durumda yanlış bir korelasyondan bahsediyorlar.

Korelasyon analizinin sorunları

Yukarıdaki tanımlara dayanarak, açıklanan yöntemin aşağıdaki görevleri formüle edilebilir: aranan değişkenlerden biri hakkında diğerini kullanarak bilgi elde etmek; Çalışılan değişkenler arasındaki ilişkinin yakınlığını belirler.

Korelasyon analizi, incelenen özellikler arasındaki ilişkinin belirlenmesini içerir ve bu nedenle korelasyon analizinin görevleri aşağıdakilerle desteklenebilir:

  • ortaya çıkan karakteristik üzerinde en büyük etkiye sahip olan faktörlerin belirlenmesi;
  • daha önce keşfedilmemiş bağlantı nedenlerinin belirlenmesi;
  • parametrik analizi ile bir korelasyon modelinin oluşturulması;
  • iletişim parametrelerinin öneminin ve aralık değerlendirmelerinin incelenmesi.

Korelasyon analizi ile regresyon arasındaki ilişki

Korelasyon analizi yöntemi çoğu zaman çalışılan nicelikler arasındaki ilişkinin yakınlığını bulmakla sınırlı değildir. Bazen aynı adı taşıyan analiz kullanılarak elde edilen ve sonuç ile faktör (faktör) özelliği (özellikler) arasındaki korelasyon bağımlılığının bir tanımını temsil eden regresyon denklemlerinin derlenmesiyle desteklenir. Bu yöntem, söz konusu analizle birlikte yöntemi oluşturur.

Yöntemi kullanma koşulları

Etkili faktörler bir veya birkaç faktöre bağlıdır. Etkin ve faktör göstergelerinin (faktörlerin) değeri hakkında çok sayıda gözlem varsa, korelasyon analizi yöntemi kullanılabilir; incelenen faktörlerin niceliksel olması ve belirli kaynaklara yansıtılması gerekir. Birincisi normal yasa ile belirlenebilir - bu durumda korelasyon analizinin sonucu Pearson korelasyon katsayılarıdır veya özellikler bu yasaya uymuyorsa Spearman sıra korelasyon katsayısı kullanılır.

Korelasyon analizi faktörlerini seçme kuralları

Bu yöntemi uygularken performans göstergelerini etkileyen faktörlerin belirlenmesi gerekmektedir. Göstergeler arasında neden-sonuç ilişkileri olması gerektiği dikkate alınarak seçilirler. Çok faktörlü korelasyon modeli oluşturulması durumunda, ortaya çıkan gösterge üzerinde anlamlı etkisi olan faktörler seçilirken, ikili korelasyon katsayısı 0,85'in üzerinde olan birbirine bağımlı faktörlerin yanı sıra korelasyon modeline dahil edilmemesi tercih edilir. sonuç parametresi ile olan ilişkinin doğrusal veya fonksiyonel karakterde olmadığı durum.

Sonuçlar görüntüleniyor

Korelasyon analizinin sonuçları metin ve grafik formlarında sunulabilir. İlk durumda, bir korelasyon katsayısı olarak, ikincisinde ise bir dağılım diyagramı şeklinde sunulurlar.

Parametreler arasında korelasyon olmadığında, diyagramdaki noktalar düzensiz bir şekilde yerleştirilir, ortalama bağlantı derecesi daha büyük bir düzen derecesi ile karakterize edilir ve işaretli işaretlerin medyandan az çok eşit bir mesafeyle karakterize edilir. Güçlü bir bağlantı düz olma eğilimindedir ve r=1'de nokta grafiği düz bir çizgidir. Ters korelasyon, grafiğin yönünde sol üstten sağ alta, doğrudan korelasyon - sol alttan sağ üst köşeye doğru farklılık gösterir.

Bir dağılım grafiğinin 3 boyutlu gösterimi

Geleneksel 2 boyutlu dağılım grafiği gösterimine ek olarak artık korelasyon analizinin 3 boyutlu grafik gösterimi de kullanılıyor.

Tüm eşleştirilmiş grafikleri matris formatında tek bir şekilde görüntüleyen bir dağılım grafiği matrisi de kullanılır. N değişken için matris n satır ve n sütun içerir. i'inci satır ile j'inci sütunun kesişiminde yer alan grafik, Xi ve Xj değişkenlerinin grafiğidir. Böylece, her satır ve sütun bir boyuttur; tek bir hücre, iki boyutlu bir dağılım grafiğini görüntüler.

Bağlantının sıkılığının değerlendirilmesi

Korelasyon bağlantısının yakınlığı korelasyon katsayısı (r) ile belirlenir: güçlü - r = ±0,7 ila ±1, orta - r = ±0,3 ila ±0,699, zayıf - r = 0 ila ±0,299. Bu sınıflandırma katı değildir. Şekil biraz farklı bir diyagramı göstermektedir.

Korelasyon analizi yöntemini kullanma örneği

İngiltere'de ilginç bir araştırma yapıldı. Sigara içme ile akciğer kanseri arasındaki bağlantıya adanmıştır ve korelasyon analizi yoluyla gerçekleştirilmiştir. Bu gözlem aşağıda sunulmuştur.

Korelasyon analizi için başlangıç ​​verileri

Profesyonel grup

ölüm

Çiftçiler, ormancılar ve balıkçılar

Madenciler ve taş ocağı işçileri

Gaz, kok ve kimyasal madde üreticileri

Cam ve seramik üreticileri

Fırın, demirhane, dökümhane ve haddehane işçileri

Elektrik ve elektronik çalışanları

Mühendislik ve ilgili meslekler

Ağaç işleme endüstrileri

Deri işçileri

Tekstil işçileri

İş kıyafeti üreticileri

Yiyecek, içecek ve tütün endüstrilerinde çalışanlar

Kağıt ve Baskı Üreticileri

Diğer ürünlerin üreticileri

İnşaatçılar

Ressamlar ve dekoratörler

Sabit motorların, vinçlerin vb. sürücüleri.

Başka yerde yer almayan işçiler

Ulaştırma ve iletişim çalışanları

Depo çalışanları, mağaza sahipleri, paketleyiciler ve dolum makinesi çalışanları

Ofis çalışanları

Satıcılar

Spor ve eğlence çalışanları

Yöneticiler ve yöneticiler

Profesyoneller, teknisyenler ve sanatçılar

Korelasyon analizine başlıyoruz. Açıklık sağlamak için, çözüme bir dağılım diyagramı oluşturacağımız grafiksel bir yöntemle başlamak daha iyidir.

Doğrudan bir bağlantıyı gösterir. Ancak yalnızca grafiksel yönteme dayanarak kesin bir sonuca varmak zordur. Bu nedenle korelasyon analizi yapmaya devam edeceğiz. Korelasyon katsayısının hesaplanmasına ilişkin bir örnek aşağıda sunulmuştur.

Yazılım kullanarak (MS Excel aşağıda örnek olarak açıklanacaktır), 0,716 olan korelasyon katsayısını belirleriz, bu da incelenen parametreler arasında güçlü bir bağlantı anlamına gelir. Elde edilen değerin istatistiksel güvenilirliğini, 25 çift değerden 2 çıkarmamız gereken ilgili tabloyu kullanarak belirleyelim, sonuç olarak 23 elde ederiz ve tablodaki bu satırı kullanarak r'yi p = 0,01 için kritik buluruz (çünkü bunlar tıbbi verilerdir, daha katı bir bağımlılık, diğer durumlarda p=0,05 yeterlidir), bu korelasyon analizi için 0,51'dir. Örnek, hesaplanan r'nin kritik r'den daha büyük olduğunu ve korelasyon katsayısının değerinin istatistiksel olarak güvenilir kabul edildiğini gösterdi.

Korelasyon analizi yaparken yazılımı kullanma

Tanımlanan istatistiksel veri işleme türü, yazılım, özellikle MS Excel kullanılarak gerçekleştirilebilir. Korelasyon, işlevleri kullanarak aşağıdaki parametrelerin hesaplanmasını içerir:

1. Korelasyon katsayısı CORREL fonksiyonu (dizi1; dizi2) kullanılarak belirlenir. Dizi1,2 - sonuç ve faktör değişkenlerinin değer aralığının hücresi.

Doğrusal korelasyon katsayısı aynı zamanda Pearson korelasyon katsayısı olarak da adlandırılır ve bu nedenle Excel 2007'den başlayarak işlevi aynı dizilerle kullanabilirsiniz.

Excel'de korelasyon analizinin grafiksel gösterimi “Grafikler” paneli “Dağılım Grafiği” seçeneği kullanılarak yapılır.

Başlangıç ​​verilerini belirledikten sonra bir grafik elde ediyoruz.

2. Öğrenci t-testi kullanılarak ikili korelasyon katsayısının anlamlılığının değerlendirilmesi. T kriterinin hesaplanan değeri, belirtilen önem düzeyi ve serbestlik derecesi sayısı dikkate alınarak, söz konusu parametrenin karşılık gelen değer tablosundan bu göstergenin tablo halindeki (kritik) değeriyle karşılaştırılır. Bu tahmin STUDISCOVER(olasılık; serbestlik_derecesi) fonksiyonu kullanılarak gerçekleştirilir.

3. Çift korelasyon katsayılarının matrisi. Analiz, Korelasyonun seçildiği Veri Analizi aracı kullanılarak gerçekleştirilir. Çift korelasyon katsayılarının istatistiksel değerlendirmesi, mutlak değeri tablodaki (kritik) değerle karşılaştırılarak gerçekleştirilir. Hesaplanan ikili korelasyon katsayısı kritik değeri aştığında, verilen olasılık derecesi dikkate alınarak doğrusal ilişkinin anlamlılığına ilişkin sıfır hipotezinin reddedilmediğini söyleyebiliriz.

Nihayet

Korelasyon analizi yönteminin bilimsel araştırmalarda kullanılması, çeşitli faktörler ile performans göstergeleri arasındaki ilişkiyi belirlememize olanak sağlar. Absürt bir veri çifti veya kümesinden yüksek bir korelasyon katsayısı elde edilebileceğini hesaba katmak gerekir ve bu nedenle bu tür bir analizin yeterince geniş bir veri dizisi üzerinde yapılması gerekir.

Hesaplanan r değeri elde edildikten sonra, belirli bir değerin istatistiksel güvenilirliğini doğrulamak için bunun kritik r ile karşılaştırılması tavsiye edilir. Korelasyon analizi, formüller kullanılarak manuel olarak veya yazılım, özellikle MS Excel kullanılarak gerçekleştirilebilir. Burada ayrıca korelasyon analizinin incelenen faktörleri ile ortaya çıkan karakteristik arasındaki ilişkiyi görsel olarak temsil etmek amacıyla bir dağılım diyagramı oluşturabilirsiniz.



Sitede yeni

>

En popüler