Ev Ağız boşluğu Korelasyon katsayısının güvenilirliği. Test: Regresyon ve korelasyon katsayılarının öneminin Öğrenci f-testi kullanılarak değerlendirilmesi

Korelasyon katsayısının güvenilirliği. Test: Regresyon ve korelasyon katsayılarının öneminin Öğrenci f-testi kullanılarak değerlendirilmesi

Korelasyon katsayısının değerini hesaplayan bazı araştırmacılar burada duruyor. Ancak yetkin deneysel metodoloji açısından bakıldığında, bu katsayının önem düzeyi (yani güvenilirlik derecesi) de belirlenmelidir.

Korelasyon katsayısının anlamlılık düzeyi kritik değerler tablosu kullanılarak hesaplanır. Aşağıda, elde ettiğimiz katsayının anlamlılık düzeyini belirlememize olanak tanıyan bu tablonun bir parçası bulunmaktadır.

Örnek boyutuna karşılık gelen satırı seçiyoruz. Bizim durumumuzda n = 10. Bu satırda ampirik değerden biraz daha küçük olan (ya da ona tam olarak eşit olan, ki bu son derece nadirdir) tablo değerini seçiyoruz. Kalın yazılmış bu sayı 0,632'dir. Anlamlılık düzeyi p = 0,05 olan bir sütunu ifade eder. Yani aslında ampirik değer p = 0,05 ve p = 0,01 sütunları arasında ortadadır, dolayısıyla 0,05  p  0,01. Dolayısıyla sıfır hipotezini reddediyoruz ve elde edilen sonucun (R xy = 0,758) p düzeyinde anlamlı olduğu sonucuna varıyoruz.< 0,05 (это уровень статистической значимости): R эмп >R cr (p< 0,05) H 0 ,  Н 1 ! ст. зн.

Günlük dilde bu şu şekilde yorumlanabilir: Eğer bu bağlantı şans eseri ise, bu bağlantı gücünün örnekte 100 vakanın beşinde olduğundan daha az sıklıkla ortaya çıkmasını bekleyebiliriz.

    1. Regresyon analizi

X(yükseklik)

e(ağırlık)

M X = 166,6

M sen = 58,3

X = 6 , 54

sen = 8 , 34

Regresyon analizi, aralık ölçeğinde ölçülen iki büyüklük arasındaki ilişkiyi incelemek için kullanılır. Bu tür analiz, bir özelliğin diğerine bağımlılığını niceliksel olarak tanımlamanıza olanak tanıyan bir regresyon denkleminin oluşturulmasını içerir (Pearson korelasyon katsayısı bir ilişkinin varlığını veya yokluğunu gösterir, ancak bu ilişkiyi açıklamaz). Karakteristiklerden birinin rastgele değerini bilen ve bu denklemi kullanan araştırmacı, belirli bir olasılıkla ikinci özelliğin karşılık gelen değerini tahmin edebilir. Karakteristiklerin doğrusal bağımlılığı aşağıdaki denklem türüyle tanımlanır:

y = a +B sen * X ,

Nerede A - Denklemin serbest terimi grafiğin bir noktadaki yükselişine eşittir x=0 apsis eksenine göre, B – regresyon çizgisinin eğiminin açısal katsayısı, grafiğin eğim açısının apsis eksenine olan tanjantına eşittir (her iki eksendeki değerlerin ölçeğinin aynı olması şartıyla).

İncelenen özelliklerin değerlerini bilerek, aşağıdaki formülleri kullanarak serbest terimin değerini ve regresyon katsayısını belirleyebilirsiniz:

bir =M sen B sen * M X

Bizim durumumuzda:
;

bir = 58,3 – 0,97 * 166,6 = -103,3

Dolayısıyla boy-ağırlık formülü şu şekildedir: y = 0,969 * x – 103,3

İlgili grafik aşağıda gösterilmiştir.

Boy ve kilo arasındaki ilişkiyi anlatmak gerekirse ( X itibaren en), ardından değerler A Ve B farklılaşır ve formüller buna göre değiştirilmelidir:

X= bir +B X * en

bir =M X B X * M sen

Bu durumda grafiğin görünümü de değişir.

Regresyon katsayısı korelasyon katsayısıyla yakından ilişkilidir. İkincisi, özellik regresyon katsayılarının geometrik ortalamasıdır:

Korelasyon katsayısının karesine belirleme katsayısı denir. Değeri, değişkenlerin karşılıklı etkisinin yüzdesini belirler. Bizim durumumuzda R 2 = 0,76 2 = 0,58 . Bu, Y'deki toplam varyansın %58'inin X değişkeninin etkisiyle açıklandığı, geri kalan %42'sinin ise denklemde dikkate alınmayan faktörlerin etkisinden kaynaklandığı anlamına gelir.

Değişkenler arasındaki doğrusal ilişkinin derecesinin gerçek göstergesinin şu olduğu unutulmamalıdır: teorik korelasyon katsayısı, tüm popülasyondan (yani tüm popülasyondan) elde edilen verilere dayanarak hesaplanır olası değerler göstergeler):

Nerede - teorik kovaryans ölçüsü SV sapmalarının çarpımlarının matematiksel beklentisi olarak hesaplanan
Ve onların matematiksel beklentilerinden.

Kural olarak teorik korelasyon katsayısını hesaplayamayız. Ancak örnekleme katsayısının sıfıra eşit olmamasından
buradan teorik katsayının aynı zamanda olduğu sonucu çıkmaz.
(yani göstergeler doğrusal olarak bağımsız olabilir). O. Rastgele örnekleme verilerine dayanarak göstergeler arasında bir ilişki olduğu söylenemez.

Örnek korelasyon katsayısı teorik katsayının bir tahminidir, çünkü değişken değerlerinin yalnızca bir kısmı için hesaplanır.

Her zaman var korelasyon katsayısı hatası. Bu hata, numune hacminin korelasyon katsayısı arasındaki tutarsızlıktır. ve nüfusa ilişkin korelasyon katsayısı aşağıdaki formüllerle belirlenir:

en
; Ve
en
.

Doğrusal korelasyon katsayısının önemini test etmek, örnek verilere ne kadar güvenebileceğimizi test etmek anlamına gelir.

Bu amaçla sıfır hipotezi test edilir
genel popülasyon için korelasyon katsayısının değerinin sıfır olduğu, yani. popülasyonda hiçbir korelasyon yok. Alternatif bir hipotez ise
.

Bu hipotezi test etmek için şunu hesaplıyoruz: - İstatistik ( -Öğrencinin t testi:

.

Öğrenci dağılımına sahip olan
Serbestlik derecesi 1.

Kritik değer Öğrenci dağılım tablolarından belirlenir
.

Hesaplanan kriter değeri ise
, o zaman sıfır hipotezi reddedilir, yani hesaplanan korelasyon katsayısı olasılık ile sıfırdan önemli ölçüde farklıdır
.

Eğer
ise sıfır hipotezi reddedilemez. Bu durumda korelasyon katsayısının gerçek değerinin sıfır olması mümkündür; göstergeler arasındaki ilişki istatistiksel olarak anlamsız kabul edilebilir.

örnek 1. Tabloda toplam gelire ilişkin 8 yıllık veriler gösterilmektedir ve nihai tüketim harcamaları .

Verilen göstergeler arasındaki ilişkinin yakınlığını inceleyin ve ölçün.

Konu 4. Eşleştirilmiş doğrusal regresyon. En küçük kareler yöntemi

Korelasyon katsayısı, iki özellik arasındaki ilişkinin yakınlık derecesini gösterir ancak bir özellikteki boyutun bir birimlik değişiminin, diğer bir özellikteki değişimi nasıl etkilediği sorusuna cevap vermez. Bu soruyu cevaplamak için regresyon analizi yöntemlerinden yararlanılmaktadır.

Regresyon analizi setleri biçim rastgele bir değişken arasındaki bağımlılıklar ve değişken değerler
ve değerler
kesin olarak belirlendiği kabul edilmektedir.

Regresyon denklemi değişkenler arasındaki istatistiksel ilişki için bir formüldür.

Bu formül doğrusalsa, o zaman bahsediyoruz doğrusal regresyon.İki değişken arasındaki istatistiksel ilişkinin formülüne denir ikili regresyon(birkaç değişken - çoklu).

Bağımlılık formülü seçimi denir Şartname regresyon denklemleri. Seçilen formülün parametrelerinin değerlerinin tahmin edilmesine denir parametreleştirme.

Parametre değerleri nasıl tahmin edilir ve yapılan tahminlerin güvenilirliği nasıl kontrol edilir?

Hadi çizime bakalım

    Grafik (a)'daki ilişki X Ve en doğrusala yakındır, düz çizgi 1 burada gözlem noktalarına yakındır ve ikincisi ondan yalnızca nispeten küçük rastgele etkilerin bir sonucu olarak sapar.

    Grafik (b) miktarlar arasındaki gerçek ilişkiyi göstermektedir X Ve en doğrusal olmayan bir fonksiyon 2 ile tanımlanır ve hangi düz çizgiyi (örneğin 1) çizersek çizelim, noktaların ondan sapmaları rastgele olmayacaktır.

    Grafik (c)’de değişkenler arasındaki ilişki X Ve en eksiktir ve herhangi bir bağımlılık formülünün parametreleştirilmesinin sonuçları başarısız olacaktır.

Ekonometrik ilişki analizinin başlangıç ​​noktası genellikle tahmin etmektir. doğrusal bağımlılık değişkenler. Her zaman gözlem noktalarının bütününe “en yakın” olacak bir düz çizgi çizmeye çalışabilirsiniz (örneğin, Şekil (c)'de düz çizgi 1, düz çizgi 2'den daha iyi olacaktır).

Teorik İkili Doğrusal Regresyon Denklemişu forma sahiptir:


,

Nerede
arandı teorik parametreler (teorik katsayılar) regresyon; -rastgele sapma(rastgele hata).

Genel olarak teorik modeli şu şekilde sunacağız:

.

Teorik regresyon katsayılarının değerlerini belirlemek için değişkenlerin tüm değerlerinin bilinmesi gerekir. X Ve e yani Tümü Genel popülasyon ki bu neredeyse imkansızdır.

Görev şu şekildedir: mevcut gözlemsel verilere göre
,
parametre değerlerinin tahmin edilmesi gereklidir
.

İzin vermek Aparametre tahmini
,Bparametre tahmini .

O zaman tahmini regresyon denklemi şöyledir:
,

Nerede
bağımlı değişkenin teorik değerleri sen, - gözlemlenen hata değerleri . Bu denklem denir ampirik regresyon denklemi. Bunu forma yazacağız.
.

Doğrusal regresyon parametrelerini tahmin etmenin temeli En küçük kareler yöntemi (ÇUŞ) bağımlı değişkenin gözlemlerinin istenen doğrusal fonksiyondan sapmalarının karelerinin toplamını en aza indiren doğrusal regresyon parametrelerini tahmin etmeye yönelik bir yöntemdir.

İşlev Q dır-dir ikinci dereceden fonksiyon iki parametre A Ve B. Çünkü sürekli, dışbükey ve aşağıda sınırlı (
), yani minimuma ulaşır. Bir minimumun varlığı için gerekli koşul, kısmi türevlerinin sıfıra eşit olmasıdır. A Ve B:


.

Sistemin her iki denklemini de bölerek N, şunu elde ederiz:


veya

Aksi takdirde şunu yazabilirsiniz:

Ve - aynı özelliklerin değerlerinin standart sapmaları.

O. regresyon çizgisi ortalama değerlerin olduğu noktadan geçer X Ve en
, A regresyon katsayısı B kovaryans indeksi ve katsayısı ile orantılıdır doğrusal korelasyon.

Regresyonun yanı sıra e Açık X aynı ampirik değerler için X'in Y üzerindeki regresyon denklemi (
, Nerede
), daha sonra katsayıların çarpımı
:

.

İLE regresyon katsayısı  değerin kaç birim boyut değiştireceğini gösteren değerdir değeri değiştirirken boyutunun birimi başına. Katsayı benzer şekilde belirlenir .

Bilimsel araştırmalarda, genellikle sonuç ve faktör değişkenleri (bir mahsulün verimi ve yağış miktarı, cinsiyet ve yaşa göre homojen gruplardaki bir kişinin boyu ve ağırlığı, kalp atış hızı ve vücut sıcaklığı) arasında bir bağlantı bulmaya ihtiyaç vardır. , vesaire.).

İkincisi, kendileriyle ilişkili olanlarda (birincisi) değişikliklere katkıda bulunan işaretlerdir.

Korelasyon analizi kavramı

Yukarıdakilerden yola çıkarak korelasyon analizinin aşağıdaki hipotezleri test etmek için kullanılan bir yöntem olduğunu söyleyebiliriz. İstatistiksel anlamlılık Araştırmacı bunları ölçebiliyor ancak değiştiremiyorsa iki veya daha fazla değişken.

Söz konusu kavramın başka tanımları da bulunmaktadır. Korelasyon analizi, değişkenler arasındaki korelasyon katsayılarının incelenmesini içeren bir işleme yöntemidir. Bu durumda, bir veya daha fazla özellik çifti arasındaki korelasyon katsayıları karşılaştırılarak aralarında istatistiksel ilişkiler kurulur. Korelasyon analizi, bir rastgele değişkenin dinamiğinin dinamiğe yol açtığı, katı bir fonksiyonel doğanın isteğe bağlı varlığı ile rastgele değişkenler arasındaki istatistiksel bağımlılığı incelemek için bir yöntemdir. matematiksel beklenti bir diğer.

Yanlış korelasyon kavramı

Yürürken korelasyon analizi genellikle birbiriyle ilişkili olarak saçma olan herhangi bir özellik kümesiyle ilişkili olarak gerçekleştirilebileceğini hesaba katmak gerekir. Bazen birbirleriyle nedensel bir bağlantı yoktur.

Bu durumda yanlış bir korelasyondan bahsediyorlar.

Korelasyon analizinin sorunları

Yukarıdaki tanımlara dayanarak, açıklanan yöntemin aşağıdaki görevlerini formüle edebiliriz: aranan değişkenlerden biri hakkında diğerini kullanarak bilgi elde etmek; Çalışılan değişkenler arasındaki ilişkinin yakınlığını belirler.

Korelasyon analizi, incelenen özellikler arasındaki ilişkinin belirlenmesini içerir ve bu nedenle korelasyon analizinin görevleri aşağıdakilerle desteklenebilir:

  • ortaya çıkan karakteristik üzerinde en büyük etkiye sahip olan faktörlerin belirlenmesi;
  • daha önce keşfedilmemiş bağlantı nedenlerinin belirlenmesi;
  • parametrik analizi ile bir korelasyon modelinin oluşturulması;
  • iletişim parametrelerinin öneminin ve aralık değerlendirmelerinin incelenmesi.

Korelasyon analizi ile regresyon arasındaki ilişki

Korelasyon analizi yöntemi çoğu zaman çalışılan nicelikler arasındaki ilişkinin yakınlığını bulmakla sınırlı değildir. Bazen aynı adı taşıyan analiz kullanılarak elde edilen ve sonuç ile faktör (faktör) özelliği (özellikler) arasındaki korelasyon bağımlılığının bir tanımını temsil eden regresyon denklemlerinin derlenmesiyle desteklenir. Bu yöntem, söz konusu analizle birlikte yöntemi oluşturur.

Yöntemi kullanma koşulları

Etkili faktörler bir veya birkaç faktöre bağlıdır. Etkin ve faktör göstergelerinin (faktörlerin) değeri hakkında çok sayıda gözlem varsa, korelasyon analizi yöntemi kullanılabilir; incelenen faktörlerin niceliksel olması ve belirli kaynaklara yansıtılması gerekir. Birincisi normal yasa ile belirlenebilir - bu durumda korelasyon analizinin sonucu Pearson korelasyon katsayılarıdır veya özellikler bu yasaya uymuyorsa katsayı kullanılır. sıra korelasyonu Mızrakçı.

Korelasyon analizi faktörlerini seçme kuralları

Kullanırken Bu method performans göstergelerini etkileyen faktörlerin belirlenmesi gerekmektedir. Göstergeler arasında neden-sonuç ilişkileri olması gerektiği dikkate alınarak seçilirler. Çok faktörlü korelasyon modeli oluşturulması durumunda, ortaya çıkan gösterge üzerinde anlamlı etkisi olan faktörler seçilirken, ikili korelasyon katsayısı 0,85'in üzerinde olan birbirine bağımlı faktörlerin yanı sıra korelasyon modeline dahil edilmemesi tercih edilir. sonuç parametresi ile olan ilişkinin doğrusal veya fonksiyonel karakterde olmadığı durum.

Sonuçlar görüntüleniyor

Korelasyon analizinin sonuçları metin ve grafik formlarında sunulabilir. İlk durumda, bir korelasyon katsayısı olarak, ikincisinde ise bir dağılım diyagramı şeklinde sunulurlar.

Parametreler arasında korelasyon olmadığında, diyagramdaki noktalar düzensiz bir şekilde yerleştirilir, ortalama bağlantı derecesi daha büyük bir düzen derecesi ile karakterize edilir ve işaretli işaretlerin medyandan az çok eşit bir mesafeyle karakterize edilir. Güçlü bir bağlantı düz olma eğilimindedir ve r=1'de nokta grafiği düz bir çizgidir. Ters korelasyon, grafiğin yönünde sol üstten sağ alta, doğrudan korelasyon - sol alttan sağ üst köşeye doğru farklılık gösterir.

Bir dağılım grafiğinin 3 boyutlu gösterimi

Geleneksel 2 boyutlu dağılım grafiği gösterimine ek olarak artık korelasyon analizinin 3 boyutlu grafik gösterimi de kullanılıyor.

Tüm eşleştirilmiş grafikleri matris formatında tek bir şekilde görüntüleyen bir dağılım grafiği matrisi de kullanılır. N değişken için matris n satır ve n sütun içerir. i'inci satır ile j'inci sütunun kesişiminde yer alan grafik, Xi ve Xj değişkenlerinin grafiğidir. Böylece, her satır ve sütun bir boyuttur; tek bir hücre, iki boyutlu bir dağılım grafiğini görüntüler.

Bağlantının sıkılığının değerlendirilmesi

Korelasyon bağlantısının yakınlığı korelasyon katsayısı (r) ile belirlenir: güçlü - r = ±0,7 ila ±1, orta - r = ±0,3 ila ±0,699, zayıf - r = 0 ila ±0,299. Bu sınıflandırma katı değildir. Şekil biraz farklı bir diyagramı göstermektedir.

Korelasyon analizi yöntemini kullanma örneği

İngiltere'de ilginç bir araştırma yapıldı. Sigara içme ile akciğer kanseri arasındaki bağlantıya adanmıştır ve korelasyon analizi yoluyla gerçekleştirilmiştir. Bu gözlem aşağıda sunulmuştur.

Korelasyon analizi için başlangıç ​​verileri

Profesyonel grup

ölüm

Çiftçiler, ormancılar ve balıkçılar

Madenciler ve taş ocağı işçileri

Gaz, kok ve kimyasal üreticileri

Cam ve seramik üreticileri

Fırın, demirhane, dökümhane ve haddehane işçileri

Elektrik ve elektronik çalışanları

Mühendislik ve ilgili meslekler

Ağaç işleme endüstrileri

Deri işçileri

Tekstil işçileri

İş kıyafeti üreticileri

Yiyecek, içecek ve tütün endüstrilerinde çalışanlar

Kağıt ve Baskı Üreticileri

Diğer ürünlerin üreticileri

İnşaatçılar

Ressamlar ve dekoratörler

Sabit motorların, vinçlerin vb. sürücüleri.

Başka yerde yer almayan işçiler

Ulaştırma ve iletişim çalışanları

Depo çalışanları, mağaza sahipleri, paketleyiciler ve dolum makinesi çalışanları

Ofis çalışanları

Satıcılar

Spor ve eğlence çalışanları

Yöneticiler ve yöneticiler

Profesyoneller, teknisyenler ve sanatçılar

Korelasyon analizine başlıyoruz. Netlik sağlamak için çözüme şununla başlamak daha iyidir: grafik yöntemi bunun için bir dağılım diyagramı oluşturacağız.

Doğrudan bir bağlantıyı gösterir. Ancak yalnızca grafiksel yönteme dayanarak kesin bir sonuca varmak zordur. Bu nedenle korelasyon analizi yapmaya devam edeceğiz. Korelasyon katsayısının hesaplanmasına ilişkin bir örnek aşağıda sunulmuştur.

Yazılım kullanarak (MS Excel aşağıda örnek olarak açıklanacaktır), 0,716 olan korelasyon katsayısını belirleriz, bu da incelenen parametreler arasında güçlü bir bağlantı anlamına gelir. Elde edilen değerin istatistiksel güvenilirliğini, 25 çift değerden 2 çıkarmamız gereken ilgili tabloyu kullanarak belirleyelim, sonuç olarak 23 elde ederiz ve tablodaki bu satırı kullanarak r'yi p = 0,01 için kritik buluruz (çünkü bunlar tıbbi verilerdir, daha katı bir bağımlılık, diğer durumlarda p=0,05 yeterlidir), bu korelasyon analizi için 0,51'dir. Örnek, hesaplanan r'nin kritik r'den daha büyük olduğunu ve korelasyon katsayısının değerinin istatistiksel olarak güvenilir kabul edildiğini gösterdi.

Korelasyon analizi yaparken yazılımı kullanma

Tanımlanan istatistiksel veri işleme türü kullanılarak gerçekleştirilebilir. yazılım, özellikle MS Excel. Korelasyon, işlevleri kullanarak aşağıdaki parametrelerin hesaplanmasını içerir:

1. Korelasyon katsayısı CORREL fonksiyonu (dizi1; dizi2) kullanılarak belirlenir. Dizi1,2 - sonuç ve faktör değişkenlerinin değer aralığının hücresi.

Doğrusal korelasyon katsayısı aynı zamanda Pearson korelasyon katsayısı olarak da adlandırılır ve bu nedenle Excel 2007'den başlayarak işlevi aynı dizilerle kullanabilirsiniz.

Excel'de korelasyon analizinin grafiksel gösterimi “Grafikler” paneli “Dağılım Grafiği” seçeneği kullanılarak yapılır.

Başlangıç ​​verilerini belirledikten sonra bir grafik elde ediyoruz.

2. Öğrenci t-testi kullanılarak ikili korelasyon katsayısının anlamlılığının değerlendirilmesi. T kriterinin hesaplanan değeri, belirtilen önem düzeyi ve serbestlik derecesi sayısı dikkate alınarak, söz konusu parametrenin karşılık gelen değer tablosundan bu göstergenin tablo halindeki (kritik) değeriyle karşılaştırılır. Bu tahmin STUDISCOVER(olasılık; serbestlik_derecesi) fonksiyonu kullanılarak gerçekleştirilir.

3. Çift korelasyon katsayılarının matrisi. Analiz, Korelasyonun seçildiği Veri Analizi aracı kullanılarak gerçekleştirilir. Çift korelasyon katsayılarının istatistiksel değerlendirmesi karşılaştırılarak gerçekleştirilir. mutlak değer tablo halinde (kritik) bir değere sahip. Hesaplanan ikili korelasyon katsayısı kritik değeri aştığında, verilen olasılık derecesi dikkate alınarak doğrusal ilişkinin anlamlılığına ilişkin sıfır hipotezinin reddedilmediğini söyleyebiliriz.

Nihayet

Korelasyon analizi yönteminin bilimsel araştırmalarda kullanılması, aralarındaki ilişkiyi belirlememize olanak sağlar. Çeşitli faktörler ve performans göstergeleri. Absürt bir veri çifti veya kümesinden yüksek bir korelasyon katsayısının elde edilebileceğini hesaba katmak gerekir ve bu nedenle bu tip Analiz yeterince geniş bir veri dizisi üzerinde gerçekleştirilmelidir.

Hesaplanan r değeri elde edildikten sonra, belirli bir değerin istatistiksel güvenilirliğini doğrulamak için bunun kritik r ile karşılaştırılması tavsiye edilir. Korelasyon analizi, formüller kullanılarak manuel olarak veya yazılım, özellikle MS Excel kullanılarak gerçekleştirilebilir. Burada ayrıca korelasyon analizinin çalışılan faktörleri ile ortaya çıkan karakteristik arasındaki ilişkiyi görsel olarak temsil etmek amacıyla bir dağılım diyagramı oluşturabilirsiniz.

Aşama 3. Veriler arasındaki ilişkileri bulma

Doğrusal korelasyon

Olgular arasındaki bağlantıları inceleme görevinin son aşaması, korelasyon göstergelerini kullanarak bağlantının yakınlığını değerlendirmektir. Bu aşama, faktör ve performans özellikleri arasındaki bağımlılığın belirlenmesi ve dolayısıyla incelenen olgunun teşhis ve prognozunun yapılması olasılığı açısından çok önemlidir.

Teşhis(Yunanca tanı tanımadan) - kapsamlı bir çalışmaya dayanarak bir nesnenin veya olgunun durumunun özünün ve özelliklerinin belirlenmesi.

Tahmin etmek(Yunan prognoz öngörüsünden, tahminden) - gelecekteki herhangi bir olgunun durumu hakkında herhangi bir özel tahmin, yargı (hava durumu tahmini, seçim sonucu vb.). Tahmin, incelenen sistemin, nesnenin veya olgunun gelecekteki olası durumu ve bu durumu karakterize eden göstergeler hakkında bilimsel temelli bir hipotezdir. Tahmin – tahmin geliştirme, özel Bilimsel araştırma herhangi bir olgunun gelişimi için belirli beklentiler.

Korelasyonun tanımını hatırlayalım:

Korelasyon– rastgele değişkenler arasındaki bağımlılık, bir değerin dağılımının başka bir değerin değerine bağlı olmasıyla ifade edilir.

Sadece niceliksel değil niteliksel özellikler arasında da bir korelasyon görülmektedir. Var olmak çeşitli yollar ve bağların yakınlığını değerlendirmeye yönelik göstergeler. Sadece burada duracağız doğrusal çift korelasyon katsayısı Rastgele değişkenler arasında doğrusal bir ilişki olduğunda kullanılır. Uygulamada, genellikle eşit olmayan boyutlardaki rastgele değişkenler arasındaki bağlantı düzeyinin belirlenmesine ihtiyaç duyulur, dolayısıyla bu bağlantının bir tür boyutsuz karakteristiğine sahip olmak arzu edilir. Böyle bir özellik (bağlantı ölçüsü) doğrusal korelasyon katsayısıdır. r xy formülle belirlenir

Nerede , .

Gösterilen ve , korelasyon katsayısını hesaplamak için aşağıdaki ifadeyi elde edebiliriz

.

Konsepti tanıtacak olursak normalleştirilmiş sapma , ilişkili değerlerin standart sapmanın kesirleri cinsinden ortalamadan sapmasını ifade eder:



o zaman korelasyon katsayısının ifadesi şu şekli alacaktır:

.

Korelasyon katsayısını başlangıçtaki son değerlere göre hesaplarsanız rastgele değişkenler hesaplama tablosundan, korelasyon katsayısı aşağıdaki formül kullanılarak hesaplanabilir

.

Doğrusal korelasyon katsayısının özellikleri:

1). Korelasyon katsayısı boyutsuz bir niceliktir.

2). |R| 1 £ veya.

3). , a,b= const, – X ve Y rastgele değişkenlerinin tüm değerleri bir sabitle çarpılırsa (veya bölünürse) korelasyon katsayısının değeri değişmeyecektir.

4). , a,b= const, – X ve Y rastgele değişkenlerinin tüm değerleri bir sabit kadar artırılırsa (veya azaltılırsa) korelasyon katsayısının değeri değişmeyecektir.

5). Korelasyon katsayısı ile regresyon katsayısı arasında bir ilişki vardır:

Korelasyon katsayılarının değerleri şu şekilde yorumlanabilir:

İletişimin yakınlığını değerlendirmek için niceliksel kriterler:

Prognostik amaçlar için |r| olan değerler > 0,7.

Korelasyon katsayısı, iki rastgele değişken arasında doğrusal bir ilişki olduğu sonucuna varmamızı sağlar ancak değişkenlerden hangisinin diğerinde değişikliğe neden olduğunu göstermez. Aslında iki rastgele değişken arasında bir bağlantı, değerlerin kendisi arasında bir neden-sonuç ilişkisi olmadan da var olabilir, çünkü Her iki rastgele değişkendeki bir değişiklik, üçüncüdeki bir değişiklikten (etkiden) kaynaklanabilir.

Korelasyon katsayısı r xy söz konusu rastgele değişkenlere göre simetriktir X Ve e. Bu, korelasyon katsayısını belirlemek için büyüklüklerden hangisinin bağımsız, hangisinin bağımlı olduğunun tamamen önemsiz olduğu anlamına gelir.

Korelasyon katsayısının önemi

İçin bile bağımsız miktarlar korelasyon katsayısı, ölçüm sonuçlarının rastgele dağılmasından veya rastgele değişkenlerin küçük bir örneğinden dolayı sıfırdan farklı olabilir. Bu nedenle korelasyon katsayısının anlamlılığı kontrol edilmelidir.

Doğrusal korelasyon katsayısının önemi şu şekilde kontrol edilir: Öğrenci t testi :

.

Eğer T > t cr(P, n-2), sonra doğrusal katsayı Korelasyon anlamlıdır ve dolayısıyla istatistiksel bağlantı da anlamlıdır X Ve e.

.

Hesaplama kolaylığı için, korelasyon katsayılarının güven limitlerinin değer tabloları oluşturulmuştur. çeşitli sayılarözgürlük derecesi f = n–2 (iki kuyruklu test) ve çeşitli anlamlılık seviyeleri A= 0,1; 0,05; 0,01 ve 0,001. Hesaplanan korelasyon katsayısı verilen veri için korelasyon katsayısının güven sınırı değerini aşarsa korelasyonun anlamlı olduğu kabul edilir. F Ve A.

Büyük olanlar için N Ve A= 0,01 korelasyon katsayısının güven sınırı değeri yaklaşık formül kullanılarak hesaplanabilir

.

Giriiş. 2

1. Regresyon ve korelasyon katsayılarının anlamlılığının Öğrenci f-testi kullanılarak değerlendirilmesi. 3

2. Regresyon ve korelasyon katsayılarının anlamlılığının Öğrenci f-testi kullanılarak hesaplanması. 6

Çözüm. 15

Regresyon denklemini oluşturduktan sonra önemini kontrol etmek gerekir: özel kriterler kullanarak ortaya çıkan bağımlılığın olup olmadığını belirleyin. denklemle ifade edilir regresyon, rastgele, yani tahmin amacıyla kullanılabilir mi ve faktor analizi. İstatistikte, regresyon katsayılarının anlamlılığını kesin olarak test etmek için yöntemler geliştirilmiştir. varyans analizi ve özel kriterlerin hesaplanması (örneğin, F kriteri). Gevşek bir test, adı verilen ortalama bağıl doğrusal sapmanın (e) hesaplanmasıyla gerçekleştirilebilir. ortalama hata yaklaşımlar:

Şimdi bj regresyon katsayılarının önemini değerlendirmeye ve Ru regresyon modelinin (J=l,2,..., p) parametreleri için bir güven aralığı oluşturmaya geçelim.

Blok 5 - Öğrenci ^-testinin değerine göre regresyon katsayılarının öneminin değerlendirilmesi. Hesaplanan ta değerleri izin verilen değerle karşılaştırılır

Blok 5 - ^-kriterinin değerine göre regresyon katsayılarının öneminin değerlendirilmesi. Hesaplanan t0n değerleri, belirli bir hata olasılığı (a) ve serbestlik derecesi sayısı (/) için t-dağılım tablolarından belirlenen izin verilen değer 4,/ ile karşılaştırılır.

Tüm modelin anlamlılığının kontrol edilmesine ek olarak, Öğrenci /-testi kullanılarak regresyon katsayılarının anlamlılığının test edilmesi de gereklidir. Regresyon katsayısı br'nin minimum değeri bifob- ^t koşuluna karşılık gelmelidir; burada bi, i'inci faktör karakteristiği için doğal ölçekte regresyon denkleminin katsayısının değeridir; Ah. - her katsayının ortalama kare hatası. D katsayılarının önem açısından karşılaştırılamazlığı;

Daha ileri istatistiksel analiz, regresyon katsayılarının öneminin test edilmesiyle ilgilidir. Bunu yapmak için regresyon katsayıları için ^ kriterinin değerini buluyoruz. Bunların karşılaştırılması sonucunda en küçük ^-kriteri belirlenir. Katsayısı en küçük ^-ölçütüne karşılık gelen faktör ileri analizin dışında bırakılır.

Regresyon ve korelasyon katsayılarının istatistiksel anlamlılığını değerlendirmek için, Öğrenci t-testi ve güvenilirlik aralığı göstergelerin her biri. Göstergelerin rastgele doğası hakkında bir hipotez öne sürülüyor; sıfırdan önemsiz farkları hakkında. Regresyon ve korelasyon katsayılarının öneminin Öğrenci f-testi kullanılarak değerlendirilmesi, değerlerinin rastgele hatanın büyüklüğü ile karşılaştırılması yoluyla gerçekleştirilir:

Saf regresyon katsayılarının öneminin Öğrenci /-testi kullanılarak değerlendirilmesi, değerin hesaplanmasına gelir

Emeğin kalitesi, belirli bir emeğin karmaşıklığının derecesini, yoğunluğunu (yoğunluğunu), koşullarını ve ekonomik kalkınma için önemini yansıtan bir özelliğidir. K.t. ücretlerin nitelik düzeyine (işin karmaşıklığı), koşullara, emeğin ciddiyetine ve yoğunluğuna ve ayrıca bireysel endüstrilerin ve üretimlerin, bölgelerin, bölgelerin kalkınma için önemine bağlı olarak farklılaştırılmasına olanak tanıyan bir tarife sistemi aracılığıyla ölçülür. ülke ekonomisi. K.t. ifadesini bulur ücretler Arz ve talebin etkisi altında işgücü piyasasında gelişen işçiler iş gücü(belirli emek türleri). K.t. - yapı olarak karmaşık

Projenin bireysel ekonomik, sosyal ve çevresel sonuçlarının göreceli önemine ilişkin elde edilen puanlar, Ek projesinin hesaplanan "sosyal ve çevresel-ekonomik verimliliğin karmaşık puanlama boyutsuz kriteri" kullanılarak alternatif projeler ve seçeneklerinin karşılaştırılması için bir temel sağlar. (ortalama anlamlılık puanlarında) formülü kullanarak

Endüstri içi düzenleme, belirli bir endüstrideki bireysel üretim türlerinin önemine, karmaşıklığa ve çalışma koşullarına ve ayrıca kullanılan ücretlendirme biçimlerine bağlı olarak, belirli bir endüstrideki işçiler için ücret farklılıkları sağlar.

Bireysel göstergelerin önemi dikkate alınmaksızın, analiz edilen işletmenin standart kuruluşla ilgili olarak elde edilen derecelendirme değerlendirmesi karşılaştırmalıdır. Birkaç işletmenin derecelendirmelerini karşılaştırırken en yüksek derecelendirme Elde edilen karşılaştırmalı değerlendirmeye göre minimum değere sahip bir işletmeye sahiptir.

Bir ürünün kalitesini, kullanışlılığının bir ölçüsü olarak anlamak, pratik açıdan önemli soruölçümü hakkında. Çözümü, belirli bir ihtiyacın karşılanmasında bireysel özelliklerin öneminin incelenmesiyle elde edilir. Aynı özelliğin bile önemi, ürünün tüketim koşullarına göre farklılık gösterebilmektedir. Sonuç olarak ürünün kullanışlılığı farklı koşullar kullanımları farklıdır.

Çalışmanın ikinci aşaması istatistiksel verileri incelemek ve göstergelerin ilişkisini ve etkileşimini belirlemek, bireysel faktörlerin önemini ve genel göstergelerdeki değişikliklerin nedenlerini belirlemektir.

Dikkate alınan tüm göstergeler, sonuç olarak, bireysel göstergelerin önem derecesi dikkate alınarak, faaliyet koşulları dikkate alınarak, işletmenin faaliyetlerinin analiz edilen tüm yönlerinin kapsamlı bir değerlendirmesi olacak şekilde birleştirilir. çeşitli türler yatırımcılar:

Regresyon katsayıları, faktörlerin performans göstergesi üzerindeki etkisinin yoğunluğunu gösterir. Faktör göstergelerinin ön standardizasyonu yapılırsa, b0 toplamdaki etkili göstergenin ortalama değerine eşittir. Katsayılar b, b2 ..... bl, faktör göstergesinin değerleri ortalamadan sıfıra eşit bir şekilde saparsa, etkin göstergenin seviyesinin ortalama değerinden kaç birim saptığını gösterir. standart sapma. Dolayısıyla regresyon katsayıları, performans göstergesinin seviyesini arttırmak için bireysel faktörlerin önem derecesini karakterize eder. Regresyon katsayılarının spesifik değerleri, yönteme göre ampirik verilerden belirlenir. en küçük kareler(normal denklem sistemlerinin çözülmesinin bir sonucu olarak).

2. Regresyon ve korelasyon katsayılarının anlamlılığının Öğrenci f-testi kullanılarak hesaplanması

Çok faktörlü ilişkilerin doğrusal biçimini yalnızca en basit olarak değil, aynı zamanda PC'ler için uygulama yazılım paketleri tarafından sağlanan biçim olarak da ele alalım. Bireysel bir faktör ile ortaya çıkan nitelik arasındaki bağlantı doğrusal değilse, o zaman denklem, faktör niteliğinin değeri değiştirilerek veya dönüştürülerek doğrusallaştırılır.

Genel formçok değişkenli regresyon denklemi şu şekildedir:


burada k, faktör özelliklerinin sayısıdır.

Denklem (8.32) parametrelerinin hesaplanması için gerekli olan en küçük kareler denklemleri sistemini basitleştirmek için, tüm özelliklerin bireysel değerlerinin bu özelliklerin ortalama değerlerinden sapmaları genellikle tanıtılır.

En küçük karelerden oluşan bir k denklem sistemi elde ederiz:

Bu sistemi çözerek koşullu olarak saf regresyon katsayılarının değerlerini elde ederiz b. Denklemin serbest terimi formülle hesaplanır


“Koşullu olarak saf regresyon katsayısı” terimi, bj değerlerinin her birinin, belirli bir xj faktörünün ortalama değerinden ölçüm birimi kadar sapması durumunda ortaya çıkan özelliğin ortalama değerinden toplam ortalama sapmasını ölçtüğü anlamına gelir ve hepsinin sağlanması şartıyla Regresyon denkleminde yer alan diğer faktörler ortalama değerlerde sabitlenir, değişmez, değişmez.

Dolayısıyla, eşleştirilmiş regresyon katsayısının aksine, koşullu saf regresyon katsayısı, bir faktörün etkisini ölçer ve bu faktörün varyasyonunun diğer faktörlerin varyasyonu ile ilişkisinden soyutlar. Ortaya çıkan özelliğin değişimini etkileyen tüm faktörleri regresyon denklemine dahil etmek mümkün olsaydı, o zaman bj değerleri. faktörlerin saf etkisinin ölçüleri olarak düşünülebilir. Ancak tüm faktörleri denkleme dahil etmek gerçekten imkansız olduğundan, katsayılar bj olur. denklemde yer almayan faktörlerin etkisinden muaf değildir.

Üç nedenden biri nedeniyle veya tüm faktörlerin aynı anda regresyon denklemine dahil edilmesi imkansızdır, çünkü:

1) bazı faktörler bilinmiyor olabilir modern bilim herhangi bir sürece ilişkin bilgi her zaman eksiktir;

2) bilinen bazı teorik faktörlere ilişkin bilgi yoktur veya güvenilmezdir;

3) incelenen popülasyonun (örneklem) boyutu sınırlıdır, bu da regresyon denklemine sınırlı sayıda faktörün dahil edilmesini mümkün kılar.

Koşullu saf regresyon katsayıları bj. farklı ölçü birimleriyle ifade edilen ve bu nedenle birbirleriyle karşılaştırılamayan adlandırılmış sayılardır. Bunları karşılaştırılabilir göreceli göstergelere dönüştürmek için ikili korelasyon katsayısının elde edilmesinde kullanılan dönüşümün aynısı kullanılır. Ortaya çıkan değer denir standartlaştırılmış katsayı regresyon veya?-katsayısı.


xj faktörünün katsayısı, regresyon denkleminde yer alan diğer faktörlerin eş zamanlı değişiminden soyutlanarak, xj faktörünün varyasyonunun sonuçta ortaya çıkan y karakteristiğinin değişimi üzerindeki etkisinin ölçüsünü belirler.

Koşullu olarak saf regresyon katsayılarını göreceli karşılaştırılabilir bağlantı göstergeleri, esneklik katsayıları şeklinde ifade etmek faydalıdır:

xj faktörünün esneklik katsayısı, belirli bir faktörün değeri ortalama değerinden %1 saptığında ve denklemde yer alan diğer faktörlerin eşlik eden sapmasından soyutlandığında, ortaya çıkan özelliğin ortalama değerinden yüzde ej kadar sapacağını söyler. y'den. Daha sık olarak, esneklik katsayıları dinamik açıdan yorumlanır ve uygulanır: x faktörünün ortalama değerinin %1'i oranında artmasıyla, ortaya çıkan karakteristik, ortalama değerinin yüzde e kadar artacaktır.

Örnek olarak aynı 16 çiftliği kullanarak çok faktörlü regresyon denkleminin hesaplanmasını ve yorumlanmasını ele alalım (Tablo 8.1). Ortaya çıkan işaret - seviye brüt gelir ve bunu etkileyen üç faktör tabloda sunulmaktadır. 8.7.

Güvenilir ve yeterince doğru korelasyon göstergeleri elde etmek için daha büyük bir popülasyona ihtiyaç olduğunu bir kez daha hatırlayalım.


Tablo 8.7

Brüt gelir düzeyi ve faktörleri

Çiftlik numaraları

Brüt gelir, rub./ra

İşçilik maliyetleri, adam-gün/ha x1

Ekilebilir arazi payı,

1 inek başına süt verimi,

Tablo 8.8 Regresyon denklemi göstergeleri

Bağımlı değişken: y

Regresyon katsayısı

Sabit-240.112905

Std. tahmini hata. = 79,243276


Çözüm PC için “Microstat” programı kullanılarak gerçekleştirildi. İşte çıktıdaki tablolar: tablo. 8.7, tüm özelliklerin ortalama değerlerini ve standart sapmalarını verir. Masa 8.8, regresyon katsayılarını ve bunların olasılıksal değerlendirmesini içerir:

ilk sütun “var” - değişkenler, yani. faktörler; ikinci sütun “regresyon katsayısı” - koşullu olarak saf regresyon katsayıları bj; üçüncü sütun “std. errr" - regresyon katsayısı tahminlerindeki ortalama hatalar; dördüncü sütun - 12 derecelik varyasyon serbestliğine sahip Öğrenci t testinin değerleri; beşinci sütun “olasılık” - regresyon katsayılarına göre sıfır hipotezinin olasılığı;

altıncı sütun “kısmi r2” - kısmi belirleme katsayıları. Sütun 3-6'daki göstergelerin hesaplanmasına ilişkin içerik ve metodoloji Bölüm 8'de daha ayrıntılı olarak tartışılmaktadır. “Sabit” regresyon denklemi a'nın serbest terimidir; "Std. tahmin hatası.” - regresyon denklemini kullanarak etkili özelliği tahmin etmenin ortalama kare hatası. Denklem elde edildi çoklu regresyon:

y = 2,26x1 - 4,31x2 + 0,166x3 - 240.

Bu, 1 hektar tarım arazisi başına brüt gelir miktarının ortalama 2,26 ruble arttığı anlamına geliyor. işçilik maliyetlerinde 1 saat/ha artışla; ortalama 4,31 ruble azaldı. Ekilebilir arazilerin tarım arazileri içindeki payı %1 oranında artarak 0,166 ruble arttı. İnek başına süt veriminde 1 kg artış sağlandı. Serbest terimin negatif değeri oldukça doğaldır ve paragraf 8.2'de belirtildiği gibi etkin işaret, faktörler sıfır değerlerine ulaşmadan çok önce brüt gelirin sıfır olması, ki bu üretimde imkansızdır.

X^ katsayısının negatif değeri, mahsul çiftçiliğinin kârsız olduğu ve yalnızca hayvancılığın kârlı olduğu, incelenen çiftliklerin ekonomisinde ciddi bir sorun olduğunun işaretidir. Rasyonel tarım yöntemleri ve tüm sektörlerin ürünleri için normal fiyatlar (denge veya bunlara yakın) ile gelir azalmamalı, tarım arazilerinin en verimli payı olan ekilebilir arazideki artışla birlikte artmalıdır.

Tablonun sondan iki satırındaki verilere dayanmaktadır. 8.7 ve tablo. 8.8'de p-katsayılarını ve esneklik katsayılarını (8.34) ve (8.35) formüllerine göre hesaplıyoruz.

Hem gelir seviyesindeki değişiklik hem de bunun dinamiklerindeki olası değişiklik en güçlü şekilde x3 faktöründen (ineklerin üretkenliği) etkilenir ve en zayıf olanı x2 faktöründen (ekilebilir arazi payı) etkilenir. P2/ değerleri daha sonra kullanılacaktır (Tablo 8.9);

Tablo 8.9 Faktörlerin gelir düzeyi üzerindeki karşılaştırmalı etkisi

Faktörler xj


Böylece, xj faktörünün ?-katsayısının, bu faktörün esneklik katsayısıyla ilişkili olduğunu, faktörün değişim katsayısının ise ortaya çıkan özelliğin değişim katsayısıyla ilişkili olduğunu elde ettik. Çünkü tablonun son satırından da anlaşılacağı üzere. 8.7, tüm faktörlerin değişim katsayıları, ortaya çıkan özelliğin değişim katsayısından daha azdır; hepsi?-katsayıları esneklik katsayılarından küçüktür.

Örnek olarak -с faktörünü kullanarak eşleştirilmiş ve koşullu saf regresyon katsayısı arasındaki ilişkiyi ele alalım. Çiftler Doğrusal Denklem y ile x arasındaki bağlantı şu şekildedir:

y = 3,886x1 – 243,2

x1'deki koşullu saf regresyon katsayısı, eşleştirilmiş olanın yalnızca %58'idir. Geriye kalan %42, x1 varyasyonuna x2 x3 faktörlerindeki varyasyonun eşlik etmesinden kaynaklanmaktadır ve bu da sonuçta ortaya çıkan özelliği etkilemektedir. Tüm özelliklerin bağlantıları ve ikili regresyon katsayıları, bağlantı grafiğinde sunulmaktadır (Şekil 8.2).


x1 varyasyonunun y üzerindeki doğrudan ve dolaylı etkisine ilişkin tahminleri, yani tüm "yollar" boyunca eşleştirilmiş regresyon katsayılarının çarpımını toplarsak (Şekil 8.2), şunu elde ederiz: 2,26 + 12,55 0,166 + (-0,00128) (- 4,31) + (-0,00128) 17,00 0,166 = 4,344.

Bu değer daha da büyük çift ​​katsayısı x1 ile y arasındaki bağlantılar. Sonuç olarak, x1 varyasyonunun denklemde yer almayan faktörler aracılığıyla dolaylı etkisi tam tersidir ve toplamda şunu verir:

1 Ayvazyan S.A., Mkhitaryan V.S. Uygulamalı istatistik ve ekonometrinin temelleri. Üniversiteler için ders kitabı. - M.: BİRLİK, 2008, – 311 s.

2 Johnston J. Ekonometrik yöntemler. - M .: İstatistikler, 1980. – 282'ler.

3 Dougherty K. Ekonometriye giriş. - M.: INFRA-M, 2004, – 354 s.

4 Dreyer N., Smith G., Uygulamalı regresyon analizi. - M.: Finans ve İstatistik, 2006, – 191 s.

5 Magnus Y.R., Kartyshev P.K., Peresetsky A.A. Ekonometri. Başlangıç ​​kursu.-M.: Delo, 2006, – 259 s.

6 Ekonometri Çalıştayı/Ed. II Eliseeva - M .: Finans ve İstatistik, 2004, – 248 s.

7 Ekonometri/Ed. II Eliseeva - M .: Finans ve İstatistik, 2004, – 541 s.

8 Kremer N., Putko B. Ekonometri - M.: UNITY-DANA, 200, – 281 s.


Ayvazyan S.A., Mkhitaryan V.S. Uygulamalı istatistik ve ekonometrinin temelleri. Üniversiteler için ders kitabı. - M.: BİRLİK, 2008, – s. 23.

Kremer N., Putko B. Econometrics.- M.: UNITY-DANA, 200, – s.64

Dreyer N., Smith G., Uygulamalı regresyon analizi. - M.: Finans ve İstatistik, 2006, – s57.

Ekonometri çalıştayı/Ed. II Eliseeva. - M .: Finans ve İstatistik, 2004, – s. 172.



Sitede yeni

>

En popüler