Ev Ağızdan gelen koku Çoklu korelasyon katsayısı ve çoklu belirleme katsayısı. Çoklu Doğrusal Korelasyon

Çoklu korelasyon katsayısı ve çoklu belirleme katsayısı. Çoklu Doğrusal Korelasyon

Öncelikle nedensel modelimizin yalnızca içerdiği bir durumda belirlediğimiz soruların her birine bir cevap bulmaya çalışalım. iki bağımsız değişken.

Çoklu korelasyon R ve belirleme katsayısı R2

Tüm bağımsız değişkenlerin bağımlı değişkenle toplam ilişkisini tahmin etmek için şunu kullanın: çoklu katsayı R korelasyonları. Çoklu korelasyon katsayısı arasındaki fark R iki değişkenli korelasyon katsayısından G sadece olumlu olabileceğidir. İki bağımsız değişken için aşağıdaki şekilde tahmin edilebilir:

Çoklu korelasyon katsayısı, denklem (9.1)'i oluşturan kısmi regresyon katsayıları tahmin edilerek de belirlenebilir. İki değişken için bu denklem açıkça aşağıdaki formu alacaktır:

(9.2)

Bağımsız değişkenlerimiz standart birimlere dönüştürülürse normal dağılım, veya Z-dağılımı, denklem (9.2) açıkça aşağıdaki formu alacaktır:

(9.3)

Denklem (9.3)'te β katsayısı, regresyon katsayısının standartlaştırılmış değerini belirtir İÇİNDE.

Standartlaştırılmış regresyon katsayıları aşağıdaki formüller kullanılarak hesaplanabilir:

Şimdi çoklu korelasyon katsayısını hesaplama formülü şöyle görünecek:

Korelasyon katsayısını tahmin etmenin başka bir yolu R iki değişkenli korelasyon katsayısının hesaplanmasıdır R bağımlı değişken Y'nin değerleri ile denklem temel alınarak hesaplanan karşılık gelen değerler arasında doğrusal regresyon(9.2). Başka bir deyişle değer R şu şekilde değerlendirilebilir:

Bu katsayı ile birlikte basit regresyon durumunda olduğu gibi değeri tahmin edebiliriz. R 2, aynı zamanda genellikle şu şekilde de gösterilir: determinasyon katsayısı. İki değişken arasındaki ilişkinin değerlendirilmesi durumunda olduğu gibi, belirleme katsayısı da R 2 bağımlı değişkenin varyansının yüzde kaçını gösterir e , yani , tüm bağımsız değişkenlerin dağılımıyla ilişkili olduğu ortaya çıktı - . Başka bir deyişle belirleme katsayısı şu şekilde değerlendirilebilir:

Ayrıca bağımsız değişkenlerin hiçbiriyle ilişkili olmayan bağımlı değişkendeki artık varyansın yüzdesini de tahmin edebiliriz 1 – R 2. Kare kök bu değerden, yani. miktar, tıpkı iki değişkenli korelasyon durumunda olduğu gibi, denir yabancılaşma katsayısı.

Korelasyon kısmı

Determinasyon katsayısı R Şekil 2, bağımlı değişkendeki varyansın yüzde kaçının nedensel modelde yer alan tüm bağımsız değişkenlerdeki varyansa atfedilebileceğini göstermektedir. Bu katsayı ne kadar büyük olursa ortaya koyduğumuz nedensel model de o kadar anlamlı olur. Eğer bu katsayı çok büyük değilse, incelediğimiz değişkenlerin bağımlı değişkenin toplam varyansına katkısı da anlamsız çıkıyor. Ancak uygulamada çoğu zaman sadece tüm değişkenlerin toplam katkısını tahmin etmek değil, aynı zamanda ele aldığımız bağımsız değişkenlerin her birinin bireysel katkısını da tahmin etmek gerekir. Böyle bir katkı şu şekilde tanımlanabilir: korelasyon kısmı.

Bildiğimiz gibi, iki değişkenli korelasyon durumunda, bağımsız değişkendeki varyansla ilişkili bağımlı değişkendeki varyansın yüzdesi şu şekilde gösterilebilir: R 2. Bununla birlikte, birkaç bağımsız değişkenin etkilerinin incelenmesi durumunda bu varyansın bir kısmı, kontrol olarak kullandığımız bağımsız değişkenin varyansından aynı anda kaynaklanmaktadır. Bu ilişkiler Şekil 2'de açıkça gösterilmektedir. 9.1.

Pirinç. 9.1. Bağımlı değişkenin varyanslarının oranı (e ) ve iki bağımsız (X 1VeX 2) değişkenler korelasyon analizi iki bağımsız değişkenle

Şekil 2'de gösterildiği gibi. 9.1, tüm varyans e iki bağımsız değişkenimizle ilişkili, etiketli üç bölümden oluşur a, b Ve İle. Parçalar A Ve B farklılıklar e iki bağımsız değişkenin varyanslarına ayrı ayrı aittir – X 1 ve X 2. Aynı zamanda c kısmının dağılımı aynı anda hem bağımlı değişken Y'nin dağılımını hem de iki değişkenimizin dağılımını birbirine bağlar X. Bu nedenle değişkenin ilişkisini değerlendirmek için X 1 değişkenli E, değişkenin etkisinden kaynaklanmıyor X Değişken başına 2 e miktardan gerekli R" 2 kare korelasyonun değerini çıkarın e İle X 2:

(9.6)

Benzer şekilde, Y ile korelasyonun kısmını tahmin edebiliriz. X 2 ile korelasyonundan kaynaklanmıyor X 1.

(9.7)

Büyüklük efendim (9.6) ve (9.7) denklemlerinde aradığımız şey korelasyon kısmı.

Bir parçanın korelasyonu aynı zamanda olağan iki değişkenli korelasyona göre de tanımlanabilir:

Başka bir deyişle parça korelasyonuna yarı kısmi korelasyon denir. Bu isim, bir korelasyon hesaplanırken ikinci bağımsız değişkenin etkisinin birinci bağımsız değişkenin değerlerine göre ortadan kaldırıldığı, ancak bağımlı değişkene göre ortadan kaldırılmadığı anlamına gelir. Etki X 1, değerler kullanılarak bir nevi ayarlanır X 2, dolayısıyla korelasyon katsayısı hesaplanmaz e Ve X 1 ve arası e ve ve değerler değerlere göre hesaplanır X 2, basit doğrusal regresyon bölümünde tartışıldığı gibi (bkz. alt bölüm 7.4.2). Böylece aşağıdaki ilişkinin geçerli olduğu ortaya çıkar:

Regresyon analizinde, diğer bağımsız değişkenlerin hem bağımsız değişkenin kendisi hem de bağımlı değişken üzerinde etkisi olmadığında, bir bağımsız değişkenin bağımlı bir değişkenle korelasyonunu değerlendirmek için kısmi korelasyon kavramı kullanılır.

Kısmi korelasyonlar

Özel, veya kısmi, korelasyon Matematiksel istatistiklerde, belirli bir bağımsız değişkenin varyansıyla ilişkili bağımlı değişkenin varyansının, bu bağımlı değişkenin tüm varyansına göre oranı yoluyla belirlenir; diğerinin varyansıyla ilişkili kısmı sayılmaz. bağımsız değişkenler. Resmi olarak, iki bağımsız değişken durumunda bu şu şekilde ifade edilebilir:

Kısmi korelasyon değerlerinin kendisi halkla ilişkiler iki değişkenli korelasyon değerlerine dayanarak bulunabilir:

Dolayısıyla kısmi korelasyon, hem bağımlı hem de bağımsız değişkenin düzeltilmiş değerleri arasındaki sıradan iki değişkenli korelasyon olarak tanımlanabilir. Düzeltmenin kendisi, kontrol değişkeni görevi gören bağımsız değişkenin değerlerine uygun olarak gerçekleştirilir. Başka bir deyişle bağımlı değişken arasındaki kısmi korelasyon e ve bağımsız değişken X değerleri ve değerleri arasındaki olağan korelasyon olarak tanımlanabilir ve ikinci bağımsız değişkenin değerlerine dayalı olarak tahmin edilebilir X 2.

Çoklu korelasyon katsayısı Ortaya çıkan gösterge (bağımlı değişken) arasındaki istatistiksel ilişkinin yakınlık derecesinin bir ölçüsü olarak kullanılır. sen ve bir dizi açıklayıcı (bağımsız) değişken veya başka bir deyişle, faktörlerin sonuç üzerindeki ortak etkisinin yakınlığını değerlendirir.

Çoklu korelasyon katsayısı, aşağıdakiler de dahil olmak üzere çeşitli formüller (5) kullanılarak hesaplanabilir:

    çift ​​korelasyon katsayılarından oluşan bir matris kullanarak

, (3.18)

nerede  R- çift korelasyon katsayıları matrisinin belirleyicisi sen,
,

R 11 - faktörler arası korelasyon matrisinin belirleyicisi
;

. (3.19)

İki bağımsız değişkenin olduğu bir model için formül (3.18) basitleştirilmiştir

. (3.20)

Çoklu korelasyon katsayısının karesi determinasyon katsayısı R 2. İkili regresyonda olduğu gibi, R 2, regresyon modelinin kalitesini gösterir ve ortaya çıkan özelliğin toplam varyasyonunun payını yansıtır sen regresyon fonksiyonundaki değişikliklerle açıklanır F(X) (bkz. 2.4). Ek olarak, belirleme katsayısı formül kullanılarak bulunabilir.

. (3.21)

Ancak kullanım R 2 durumda çoklu regresyon modele regresörler eklenirken belirleme katsayısı arttığından tamamen doğru değildir. Bunun nedeni, ilave değişkenler eklendiğinde artık varyansın azalmasıdır. Ve eğer faktör sayısı gözlem sayısına yaklaşırsa, o zaman artık varyans sıfıra eşit olacak ve çoklu korelasyon katsayısı ve dolayısıyla belirleme katsayısı bire yaklaşacaktır, ancak gerçekte faktörler ile sonuç arasındaki ilişki ve regresyon denkleminin açıklayıcı gücü çok daha düşük olabilir.

Ortaya çıkan karakteristikteki varyasyonun çeşitli faktör karakteristiklerinin değişimi ile ne kadar iyi açıklandığı konusunda yeterli bir değerlendirme elde etmek için, düzeltilmiş belirleme katsayısı

(3.22)

Düzeltilmiş belirleme katsayısı her zaman daha azdır R 2. Üstelik farklı olarak R 2, her zaman pozitiftir,
negatif değer de alabilir.

Örnek (örnek 1'in devamı). Çoklu korelasyon katsayısını formül (3.20)'ye göre hesaplayalım:

Çoklu korelasyon katsayısının 0,8601'e eşit değeri, taşıma maliyeti ile yükün ağırlığı ve taşındığı mesafe arasında güçlü bir ilişki olduğunu gösterir.

Belirleme katsayısı şuna eşittir: R 2 =0,7399.

Düzeltilmiş belirleme katsayısı formül (3.22) kullanılarak hesaplanır:

=0,7092.

Düzeltilmiş belirleme katsayısının değerinin, belirleme katsayısının değerinden farklı olduğunu unutmayın.

Böylece bağımlı değişkendeki (ulaşım maliyeti) değişimin %70,9'u bağımsız değişkenlerdeki (kargo ağırlığı ve taşıma mesafesi) değişimle açıklanmaktadır. Bağımlı değişkendeki değişimin kalan %29,1'i modelde dikkate alınmayan faktörlerle açıklanmaktadır.

Düzeltilmiş belirleme katsayısının değeri oldukça büyüktür, bu nedenle ulaşım maliyetini belirleyen en önemli faktörleri modelde dikkate alabildik. 

Üç değişkenin çoklu korelasyon katsayısı, özelliklerden biri (çizgiden önceki indeks harfi) ile diğer iki özelliğin birleşimi (tireden sonraki indeks harfi) arasındaki doğrusal ilişkinin yakınlığının bir göstergesidir:

; (12.7)

(12.8)

Bu formüller çoklu korelasyon katsayılarının hesaplanmasını kolaylaştırır. bilinen değerlerçift ​​korelasyon katsayıları r xy, r xz ve r yz.

Katsayı R negatif değildir ve her zaman 0 ile 1 arasında değişir. Yaklaştıkça R Bire doğru, üç karakteristik arasındaki doğrusal bağlantının derecesi artar. Çoklu korelasyon katsayısı arasında, ör. R y-xz ve iki çift korelasyon katsayısı r yx Ve r yz aşağıdaki ilişki vardır: eşleştirilmiş katsayıların her biri geçemez mutlak değer R y-xz.

Çoklu korelasyon katsayısının karesi R2çoklu belirleme katsayısı denir. İncelenen faktörlerin etkisi altında bağımlı değişkendeki değişimin oranını gösterir.

Çoklu korelasyonun önemi şu şekilde değerlendirilir:
F–kriter:

, (12.9)

N- örnek boyut,

k– işaretlerin sayısı; bizim durumumuzda k = 3.

Teorik değer F– Kriterler başvuru tablosundan alınır. v 1 = k–1 ve ν 2 = n–k serbestlik dereceleri ve kabul edilen anlamlılık düzeyi. Popülasyondaki çoklu korelasyon katsayısının sıfıra eşit olduğuna dair boş hipotez ( H0:R= 0) şu durumda kabul edilir: F gerçeği.< F табл . ve eğer reddedilirse F gerçeği. ≥ F tablosu.

İş bitimi -

Bu konu şu bölüme aittir:

Matematik istatistikleri

Eğitim kurumu.. Gomel Devlet Üniversitesi.. adını Francis Skaryna Yu M Zhuchenko'dan almıştır..

Bu konuyla ilgili ek materyale ihtiyacınız varsa veya aradığınızı bulamadıysanız, çalışma veritabanımızdaki aramayı kullanmanızı öneririz:

Alınan materyalle ne yapacağız:

Bu materyal sizin için yararlı olduysa, onu sosyal ağlardaki sayfanıza kaydedebilirsiniz:

Bu bölümdeki tüm konular:

öğretici
uzmanlık alanında okuyan üniversite öğrencileri için 1-31 01 01 “Biyoloji” Gomel 2010

Matematiksel istatistiğin konusu ve yöntemi
Matematiksel istatistiğin konusu, biyoloji, ekonomi, teknoloji ve diğer alanlardaki kütle olaylarının özelliklerinin incelenmesidir. Bu olgular genellikle çeşitlilik (varyasyonlar) nedeniyle karmaşık olarak sunulur.

Rastgele olay kavramı
Temel çıkarım olarak istatistiksel tümevarım veya istatistiksel çıkarım bileşen kitle olaylarını incelemek için yöntemler, kendi ayırt edici özellikleri. İstatistiksel sonuçlar sayısal verilerle yapılır

Rastgele bir olayın olasılığı
Yeterince büyük herhangi bir test serisi için olayın sıklığının bu karakteristikten çok az farklı olması özelliğine sahip olan rastgele bir olayın sayısal karakteristiğine denir.

Olasılıkların Hesaplanması
Genellikle olasılıkları aynı anda toplamaya ve çarpmaya ihtiyaç vardır. Örneğin 2 zar aynı anda atıldığında 5 puan gelme olasılığını belirlemeniz gerekiyor. Gerekli miktar muhtemelen

Rasgele değişken kavramı
Olasılık kavramını tanımladıktan ve temel özelliklerini açıklığa kavuşturduktan sonra, olasılık teorisindeki en önemli kavramlardan biri olan rastgele değişken kavramını ele alalım. Sonuç olarak şunu varsayalım

Ayrık rastgele değişkenler
Olası değerlerinin kümesi sonlu veya en azından sayılabilirse, rastgele bir değişken ayrıktır. X rastgele değişkeninin x1 değerlerini alabildiğini varsayalım

Sürekli rastgele değişkenler
Önceki alt bölümde tartışılan ayrık rastgele değişkenlerin aksine, popülasyon olası değerler sürekli rastgele değişken yalnızca sonlu olmakla kalmaz, aynı zamanda olamaz

Beklenti ve varyans
Çoğunlukla, bir rastgele değişkenin dağılımını, bu dağılımın en temel özelliklerini ifade eden bir veya iki sayısal göstergeyi kullanarak karakterize etmeye ihtiyaç vardır. Buna

Anlar
Rastgele bir değişkenin sözde dağılım momentleri matematiksel istatistikte büyük önem taşır. Matematiksel beklentide, bir rastgele değişkenin büyük değerleri yeterince dikkate alınmaz.

Binom dağılımı ve olasılık ölçümü
Bu konuda ayrık rastgele değişkenlerin ana dağılım türlerini ele alacağız. Tek bir deneme sırasında rastgele bir A olayının meydana gelme olasılığının şuna eşit olduğunu varsayalım:

Dikdörtgen (düzgün) dağılım
Dikdörtgen (düzgün) dağılım - en basit tür sürekli dağılımlar. Bir rastgele değişken X, a ve b'nin gerçek olduğu (a, b) aralığında herhangi bir gerçek değeri alabiliyorsa

Normal dağılım
Normal dağılım matematiksel istatistikte temel bir rol oynar. Bu hiç de tesadüfi değildir: nesnel gerçeklikte, çeşitli işaretlerle sıklıkla karşılaşılır.

Lognormal dağılım
Bir rastgele değişken Y, μ ve σ parametreleriyle lognormal dağılıma sahiptir, eğer bir X = lnY rastgele değişkeni μ ve & ile aynı parametrelerle normal bir dağılıma sahipse

Ortalama değerler
Tüm grup özellikleri arasında, özelliğin ortalama değeriyle ölçülen ortalama seviye, en büyük teorik ve pratik öneme sahiptir. Bir özelliğin ortalama değeri çok derin bir kavramdır.

Ortalamaların genel özellikleri
Ortalama değerlerin doğru kullanımı için bu göstergelerin özelliklerini bilmek gerekir: ortalama konum, soyutluk ve toplam eylemin birliği. Sayısal değerine göre

Aritmetik ortalama
Ortalama değerlerin genel özelliklerine sahip olan aritmetik ortalamanın, aşağıdaki formüllerle ifade edilebilecek kendine has özellikleri vardır:

Ortalama sıralama (parametrik olmayan ortalama)
Henüz niceliksel ölçüm yöntemleri bulunamayan özellikler için ortalama sıralama belirlenir. Bu tür işaretlerin tezahür derecesine göre nesneler sıralanabilir, yani.

Ağırlıklı aritmetik ortalama
Genellikle aritmetik ortalamayı hesaplamak için özelliğin tüm değerleri toplanır ve elde edilen toplam, seçenek sayısına bölünür. Bu durumda toplama dahil edilen her değer onu tam olarak artırır.

Ortalama kare
Ortalamanın karekökü şu formül kullanılarak hesaplanır: , (6.5) Toplamın kareköküne eşittir.

Medyan
Medyan, tüm grubu iki eşit parçaya bölen karakteristik bir değerdir: bir parçanın karakteristik değeri medyandan daha düşük, diğeri ise daha büyük bir değere sahiptir. Örneğin, eğer

Geometrik ortalama
N verili bir grubun geometrik ortalamasını elde etmek için tüm seçenekleri çarpmanız ve sonuçtaki çarpımdan çıkarmanız gerekir. n'inci kök derece:

Harmonik ortalama
Harmonik ortalama aşağıdaki formül kullanılarak hesaplanır. (6.14) Beş seçenek için: 1, 4, 5, 5 Çarşamba

Serbestlik derecesi sayısı
Serbestlik derecesinin sayısı gruptaki serbest çeşitliliğin elemanlarının sayısına eşittir. Çeşitlilik kısıtlamalarının sayısı olmaksızın mevcut tüm öğrenme öğelerinin sayısına eşittir. Örneğin araştırma için

Değişim katsayısı
Standart sapma– Aritmetik ortalamayla aynı ölçü birimleriyle ifade edilen adlandırılmış bir miktar. Bu nedenle karşılaştırma için farklı işaretler farklı birimlerle ifade edilir

Sınırlar ve kapsam
Çeşitlilik derecesinin hızlı ve yaklaşık bir değerlendirmesi için genellikle en basit göstergeler kullanılır: lim = (min ¸ maks) – sınırlar, yani. en küçük ve en yüksek değer işaret, p =

Normalleştirilmiş sapma
Tipik olarak bir özelliğin gelişim derecesi, onun ölçülmesiyle belirlenir ve belirli bir sayıyla ifade edilir: 3 kg ağırlık, 15 cm uzunluk, arıların kanadında 20 kanca, sütte %4 yağ, 15 kg bal. kırpma

Toplam grubun ortalaması ve sigması
Bazen birden fazla dağılımdan oluşan özet bir dağılım için ortalama ve sigmanın belirlenmesi gerekebilir. Bu durumda dağılımların kendileri değil, yalnızca ortalamaları ve sigmaları bilinmektedir.

Dağılım eğrisinin çarpıklığı (çarpıklığı) ve dikliği (basıklık)
Büyük örnekler için (n > 100) iki istatistik daha hesaplanır. Eğrinin çarpıklığına asimetri denir:

Varyasyon serisi
İncelenen grupların sayısı arttıkça, küçük gruplarda tezahürünün rastgele biçimiyle gizlenen çeşitlilik modeli giderek daha belirgin hale geliyor.

Histogram ve varyasyon eğrisi
Bir histogram varyasyon serisi farklı frekans değerlerinin çubukların farklı yükseklikleriyle temsil edildiği bir diyagram şeklinde sunulur. Veri dağılımının histogramı p olarak gösterilmiştir.

Dağılımlardaki farklılıkların güvenilirliği
İstatistiksel hipotez, gözlemlenen bir veri örneğinin altında yatan olasılık dağılımı hakkında özel bir varsayımdır. Sınav istatistiksel hipotez bir kabullenme sürecidir

Çarpıklık ve basıklık kriteri
Bitkilerin, hayvanların ve mikroorganizmaların bazı özellikleri, nesneleri gruplar halinde birleştirirken normalden önemli ölçüde farklı dağılımlar verir. Herhangi bir durumda

Nüfus ve örnek
Belirli bir kategorideki bireylerin oluşturduğu tüm diziye genel popülasyon denir. Hacim nüfusçalışmanın amaçlarına göre belirlenir. Herhangi bir yabani tür üzerinde çalışılıyorsa

Temsil edilebilirlik
Bir grup seçilmiş nesnenin doğrudan incelenmesi, her şeyden önce, birincil materyali ve numunenin kendisinin özelliklerini sağlar. Tüm örnek veriler ve özet göstergeler konuyla ilgilidir

Temsil edilebilirlik hataları ve diğer araştırma hataları
Örnek göstergeler kullanılarak genel parametrelerin tahmininin kendine has özellikleri vardır. Bir parça hiçbir zaman bütünü tam olarak karakterize edemez; dolayısıyla genel popülasyonun özellikleri

Güven sınırları
Genel parametrelerin olası değerlerini bulmak için örnek göstergeleri kullanmak için temsil edilebilirlik hatalarının büyüklüğünü belirlemek gerekir. Bu işleme o denir

Genel değerlendirme prosedürü
Genel parametreyi değerlendirmek için üç miktar gereklidir - örnek gösterge (), güvenilirlik kriteri

Aritmetik ortalamanın tahmini
Ortalama değerin tahmini, incelenen nesne kategorisi için genel ortalamanın değerini belirlemeyi amaçlar. Bu amaç için gereken temsiliyet hatası aşağıdaki formülle belirlenir:

Ortalama farkın tahmini
Bazı çalışmalar iki ölçümün farkını birincil veri olarak alır. Bu, numunedeki her bireyin iki durumda - ya da farklı yaşlarda, veya p

Ortalama farkın güvenilmez ve güvenilir tahmini
Genel parametrenin kesin bir tahmininin elde edilemediği (veya sıfırdan büyük, sıfırdan küçük veya sıfıra eşit) örnek çalışmaların bu tür sonuçlarına güvenilmez denir.

Genel ortalamalar arasındaki farkın tahmini
Biyolojik araştırmalarda iki miktar arasındaki fark özellikle önemlidir. Farklı popülasyonlar, ırklar, ırklar, çeşitler, hatlar, familyalar, deney ve kontrol grupları arasında farklılık yapılarak karşılaştırmalar yapılır (gr yöntemi)

Fark güvenilirliği kriteri
Dahası büyük önem Güvenilir farklılıklar elde etmek araştırmacılar için önemli olan, sonucun güvenilir, gerçekçi bir şekilde belirlenmesini mümkün kılan yöntemlere hakim olmak gerekmektedir.

Niteliksel özelliklerin araştırılmasında temsiliyet
Niteliksel özellikler genellikle tezahür derecelerine sahip olamaz: bunlar her bir bireyde ya mevcuttur ya da yoktur, örneğin cinsiyet, boynuzsuz olma, bazı özelliklerin varlığı ya da yokluğu, şekil bozuklukları

Hisse farkının güvenilirliği
Örnek oranlarındaki farkın güvenilirliği, ortalamalardaki farkla aynı şekilde belirlenir: (10.34)

Korelasyon katsayısı
Birçok çalışma birden fazla özelliğin birbiriyle olan ilişkisini incelemeyi gerektirir. İki özelliğe göre böyle bir çalışma yaparsanız, bir özelliğin değişkenliğinin olmadığını fark edeceksiniz.

Korelasyon katsayısı hatası
Herhangi bir numune değeri gibi, korelasyon katsayısının da büyük numuneler için aşağıdaki formül kullanılarak hesaplanan kendi temsiliyet hatası vardır:

Örnek korelasyon katsayısının güvenilirliği
Örnek korelasyon katsayısı kriteri aşağıdaki formülle belirlenir: (11.9) burada:

Korelasyon katsayısının güven sınırları
Korelasyon katsayısının genel değerinin güven sınırları genel anlamda formüle göre:

İki korelasyon katsayısı arasındaki farkın güvenilirliği
Korelasyon katsayılarındaki farkın güvenilirliği, olağan formüle göre ortalamalar arasındaki farkın güvenilirliği ile aynı şekilde belirlenir.

Düz Regresyon Denklemi
Düz çizgi korelasyonu, bu bağlantı biçiminde, birinci karakteristikteki özdeş değişikliklerin her birinin, diğer karakteristikteki tamamen belirli ve aynı zamanda ortalama olarak özdeş bir değişikliğe karşılık gelmesi bakımından farklıdır.

Doğrusal regresyon denklemi öğelerindeki hatalar
Basit doğrusal regresyon denkleminde: y = a + bx, üç temsil hatası ortaya çıkar. 1 Regresyon katsayısı hatası:

Kısmi korelasyon katsayısı
Kısmi katsayı korelasyon, iki özelliğin üçüncünün sabit değeriyle birleşme derecesini ölçen bir göstergedir. Matematik istatistikleri bir korelasyon kurmanızı sağlar

Doğrusal çoklu regresyon denklemi
Üç değişken arasındaki doğrusal ilişkinin matematiksel denklemine çoklu denir Doğrusal Denklem regresyon düzlemleri. Aşağıdaki genel forma sahiptir:

Korelasyon ilişkisi
İncelenen olgular arasındaki ilişki, bir grafikten kolayca belirlenebilen doğrusal ilişkiden önemli ölçüde sapıyorsa, bu durumda korelasyon katsayısı, bağlantının ölçüsü olarak uygun değildir. Yokluğu işaret edebilir

Korelasyon ilişkisinin özellikleri
Korelasyon oranı herhangi bir biçimdeki korelasyonun derecesini ölçer. Buna ek olarak, korelasyon ilişkisi istatistiksel açıdan büyük ilgi çeken bir dizi başka özelliğe de sahiptir.

Korelasyon ilişkisinin temsil edilebilirliği hatası
Bir korelasyon ilişkisinin temsil edilebilirlik hatası için kesin bir formül henüz geliştirilmemiştir. Genellikle ders kitaplarında verilen formülün her zaman göz ardı edilemeyecek dezavantajları vardır. Bu formül öğretmiyor

Korelasyon Doğrusallık Kriteri
Eğrisel bir bağımlılığın doğrusal olana yaklaşma derecesini belirlemek için, aşağıdaki formülle hesaplanan F kriteri kullanılır:

Dispersiyon kompleksi
Bir dağılım kompleksi, çalışmaya dahil edilen verileri ve her bir derecelendirmeye (kısmi ortalamalar) ve kompleksin tamamına (genel ortalama) ilişkin verilerin ortalamasını içeren bir derecelendirme kümesidir.

İstatistiksel etkiler
İstatistiksel etki, çalışmada düzenlenen faktörün çeşitliliğinin (derecelendirmelerinin) ortaya çıkan niteliğinin çeşitliliğindeki bir yansımasıdır. Neo faktörünün etkisini değerlendirmek

Faktöriyel etki
Faktöriyel etki, incelenen faktörlerin basit veya birleşik istatistiksel etkisidir. Tek faktörlü komplekslerde, bir faktörün basit etkisi belirli organizasyonel koşullar altında incelenir.

Tek faktörlü dağılım kompleksi
Varyans analizi Ortalama kareler oranının dağılım yasasını keşfeden İngiliz bilim adamı R. A. Fisher tarafından tarımsal ve biyolojik araştırma uygulamasına geliştirilmiş ve tanıtılmıştır.

Çok faktörlü dağılım kompleksi
Hakkında net fikir matematiksel model varyans analizi, özellikle çok değişkenli deneylerden elde edilen veriler işlenirken gerekli hesaplama işlemlerinin anlaşılmasını kolaylaştırır.

Dönüşümler
Doğru Kullanım Deneysel materyalin işlenmesi için varyans analizi, değişkenler (örnekler) arasındaki varyansların homojenliğini, normal veya normale yakın dağılıma sahip olduğunu varsayar.

Etkilerin gücünün göstergeleri
Etkilerin gücünü sonuçlarına göre belirlemek, biyoloji, tarım ve tıpta en çok seçim yapmak için gereklidir. Etkili araçlar etkiler, fiziksel ve kimyasal ajanların dozajı için - st.

Etkinin gücünün ana göstergesinin temsil edilebilirliği hatası
Etki gücünün ana göstergesine ilişkin kesin hata formülü henüz bulunamamıştır. Tek faktörlü komplekslerde temsiliyet hatasının yalnızca bir faktöriyel gösterge için belirlendiği durumlarda

Etki göstergelerinin sınır değerleri
Etki gücünün ana göstergesi, bir terimin toplam terimler toplamından aldığı paya eşittir. Ayrıca bu gösterge kareye eşit korelasyon ilişkisi. Bu iki nedenden dolayı güç göstergesi

Etkilerin güvenilirliği
Elde edilen etki gücünün ana göstergesi örnek çalışma, her şeyden önce, incelenen nesne grubunda gerçekte kendini gösteren etkinin derecesini karakterize eder

Diskriminant analizi
Diskriminant analizi çok değişkenli istatistiksel analiz yöntemlerinden biridir. Diskriminant analizinin amacı, çeşitli özelliklerin (özellikler, çiftler) ölçümüne dayalıdır.

Problem ifadesi, çözüm yöntemleri, sınırlamalar
m karakteristiğe sahip n tane nesne olduğunu varsayalım. Ölçümler sonucunda her nesne x1 ... xm, m >1 vektörü ile karakterize edilir. Sorun şu ki

Varsayımlar ve Sınırlamalar
Diskriminant analizi, bir takım varsayımların karşılanması durumunda "işe yarar". Gözlemlenebilir niceliklerin (bir nesnenin ölçülebilir özelliklerinin) normal bir dağılıma sahip olduğu varsayımı. Bu

Diskriminant Analizi Algoritması
Ayrım sorunlarının çözümü (ayırt edici analiz), tüm örnek uzayın (göz önünde bulundurulan tüm çok boyutlu rastgele değişkenlerin gerçekleşme kümesi) belirli bir sayıya bölünmesinden oluşur.

Küme analizi
Küme analizi bir araya getirir çeşitli prosedürler, sınıflandırma için kullanılır. Bu prosedürlerin uygulanmasının bir sonucu olarak, başlangıçtaki nesneler kümesi kümelere veya gruplara bölünür.

Küme analizi yöntemleri
Uygulamada genellikle aglomeratif kümeleme yöntemleri uygulanmaktadır. Genellikle sınıflandırma başlamadan önce veriler standartlaştırılır (ortalama çıkarılıp karekökle bölünür)

Küme analizi algoritması
Küme analizi, nesneler arasındaki mesafe kavramını tanımlamaya ve daha sonra onlardan grupları tanımlamaya dayalı olarak çok boyutlu gözlemleri veya nesneleri sınıflandırmaya yönelik bir dizi yöntemdir.

7.1. Doğrusal Regresyon Analizi yöntemini kullanarak bir dizi gözlem için bir grafiğin seçilmesinden oluşur. en küçük kareler. Regresyon analizi bazı durumlar arasında işlevsel bir ilişki kurmamızı sağlar. rastgele değişken e ve bazı etkileyici e değerler X. Bu bağımlılığa regresyon denklemi denir. Basit var ( y=m*x+b) ve çoğul ( y=m 1 *x 1 +m 2 *x 2 +... + m k *x k +b) doğrusal ve doğrusal olmayan türün regresyonu.
Büyüklükler arasındaki bağlantının derecesini değerlendirmek için kullanılır. Pearson R çoklu korelasyon katsayısı(korelasyon oranı), 0'dan 1'e kadar değerler alabilmektedir. R=0 eğer miktarlar arasında ilişki yoksa ve R=1 eğer büyüklükler arasında işlevsel bir bağlantı varsa. Çoğu durumda R, 0'dan 1'e kadar ara değerler alır. Değer R2 isminde determinasyon katsayısı.
Regresyon bağımlılığı oluşturmanın görevi katsayıların vektörünü bulmaktır. M katsayının olduğu çoklu doğrusal regresyon modeli R maksimum değeri alır.
Anlamlılığı değerlendirmek için R geçerlidir Fisher'in F testi, aşağıdaki formülle hesaplanır:

Nerede N– deney sayısı; k– model katsayılarının sayısı. Eğer F veriler için bazı kritik değerleri aşıyor N Ve k ve kabul edildi güven olasılığı, ardından değer R anlamlı kabul edildi.

7.2. Alet Regresyon itibaren Analiz paketi aşağıdaki verileri hesaplamanıza olanak tanır:

· ihtimaller doğrusal fonksiyon gerileme– en küçük kareler yöntemi; regresyon fonksiyonunun türü kaynak verinin yapısına göre belirlenir;

· belirleme katsayısı ve ilgili miktarlar(masa Regresyon istatistikleri);

· Regresyonun önemini test etmek için varyans tablosu ve kriter istatistikleri(masa Varyans analizi);

· her regresyon katsayısı için standart sapma ve diğer istatistiksel özellikleri; bu katsayının önemini kontrol etmenize ve bunun için güven aralıkları oluşturmanıza olanak tanır;

· regresyon fonksiyonu değerleri ve artıklar– değişkenin başlangıç ​​değerleri arasındaki farklar e ve regresyon fonksiyonunun hesaplanan değerleri (tablo Bakiyenin çekilmesi);

· artan sırada sıralanan Y değişkeninin değerlerine karşılık gelen olasılıklar(masa Olasılık çıktısı).

7.3. Seçim aracını şu şekilde çağırın: Veri > Veri Analizi > Regresyon.

7.4. Tarlada Giriş aralığı Y bağımlı değişken Y'nin değerlerini içeren aralığın adresini girin. Aralık bir sütundan oluşmalıdır.
Tarlada Giriş aralığı X X değişkeninin değerlerini içeren aralığın adresini girin. Aralık bir veya daha fazla sütundan oluşmalı ancak en fazla 16 sütundan oluşmalıdır. Alanlarda belirtilmişse Giriş aralığı Y Ve Giriş aralığı X aralıklar sütun başlıklarını içeriyorsa seçenek kutusunu işaretlemeniz gerekir Etiketler– bu başlıklar araç tarafından oluşturulan çıktı tablolarında kullanılacaktır Regresyon.
Seçenek onay kutusu Sabit - sıfır Regresyon denkleminin sabit olması durumunda kurulmalıdır B sıfıra eşit olmaya zorlanır.
Seçenek Güvenilirlik düzeyi Varsayılan olarak kullanılan 0,95 dışında bir güven düzeyine sahip regresyon katsayıları için güven aralıkları oluşturmak gerektiğinde ayarlanır. Seçenek kutusunu işaretledikten sonra Güvenilirlik düzeyi Yeni bir güven düzeyi değerinin girildiği bir giriş alanı kullanılabilir hale gelir.
Bölgede Kalanlar Dört seçenek vardır: Kalanlar, Standartlaştırılmış dengeler, Denge tablosu Ve Seçim programı. Bunlardan en az biri kuruluysa çıktı sonuçlarında tablo görünecektir Bakiyenin çekilmesi regresyon fonksiyonunun değerlerinin ve artıkların görüntüleneceği - Y değişkeninin başlangıç ​​​​değerleri ile regresyon fonksiyonunun hesaplanan değerleri arasındaki farklar. Bölgede Normal olasılık Bir seçenek var – ; ayarı çıktı sonuçlarında bir tablo oluşturur Olasılık çıktısı ve karşılık gelen grafiğin oluşturulmasına yol açar.


7.5. Parametreleri resme göre ayarlayın. Y değerinin ilk değişken olduğundan (başlık hücresi dahil) ve X değerinin diğer iki değişken olduğundan (başlık hücreleri dahil) emin olun. Tıklamak TAMAM.

7.6. Masada Regresyon istatistikleri Aşağıdaki veriler sağlanmaktadır.

Çoğul R– bir sonraki satırda verilen R2 belirleme katsayısının kökü. Bu göstergenin diğer adı korelasyon indeksi veya çoklu korelasyon katsayısıdır.

R Meydanı– belirleme katsayısı R2; oran olarak hesaplanır regresyon kareler toplamı(hücre C12) ila toplam kareler toplamı(hücre C14).

Normalleştirilmiş R-kare formülle hesaplanır

burada n, Y değişkeninin değer sayısıdır, k ise X değişkeninin giriş aralığındaki sütun sayısıdır.

Standart hata– artık varyansın kökü (hücre D13).

Gözlemler– Y değişkeninin değerlerinin sayısı.

7.7. İÇİNDE Dağılım tablosu sütunda SS karelerin toplamları sütunda verilmiştir df– serbestlik derecesi sayısı. sütunda HANIM- dağılım. Çizgide Regresyon sütunda F Regresyonun anlamlılığını test etmek için kriter istatistiklerinin değeri hesaplandı. Bu değer, regresyon varyansının artık varyansa (D12 ve D13 hücreleri) oranı olarak hesaplanır. Sütunda Önem F kriter istatistiklerinin elde edilen değerinin olasılığı hesaplanır. Bu olasılık, örneğin 0,05'ten (belirli bir anlamlılık düzeyi) küçükse, o zaman regresyonun önemsizliğine ilişkin hipotez (yani, regresyon fonksiyonunun tüm katsayılarının sıfıra eşit olduğu hipotezi) reddedilir ve regresyon, anlamlı olduğu değerlendirilmektedir. Bu örnekte regresyon anlamlı değildir.

7.8. Aşağıdaki tabloda sütunda Oranlar, regresyon fonksiyonunun katsayılarının hesaplanan değerleri satırda yazılır. Y-kavşağı serbest terimin değeri yazılır B. Sütunda Standart hata Katsayıların standart sapmaları hesaplandı.
Sütunda t-istatistiği Katsayı değerlerinin standart sapmalarına oranları kaydedilir. Bunlar, regresyon katsayılarının önemi hakkındaki hipotezleri test etmek için kriter istatistiklerinin değerleridir.
Sütunda P-Değeri kriter istatistiklerinin değerlerine karşılık gelen önem seviyeleri hesaplanır. Hesaplanan anlamlılık düzeyi belirtilen anlamlılık düzeyinden düşükse (örneğin, 0,05). daha sonra katsayının sıfırdan önemli ölçüde farklı olduğu hipotezi kabul edilir; aksi durumda katsayının sıfırdan önemsiz derecede farklı olduğu hipotezi kabul edilir. Bu örnekte yalnızca katsayı B sıfırdan önemli ölçüde farklı, geri kalanı - önemsiz.
Sütunlarda Alt %95 Ve İlk %95 0,95 güven düzeyine sahip güven aralıklarının sınırları verilmiştir. Bu sınırlar formüller kullanılarak hesaplanır
Daha düşük %95 = Katsayı - Standart Hata * t α;
Üst %95 = Katsayı + Standart Hata * t α.
Burada – siparişin niceliği α (n-k-1) serbestlik derecesine sahip öğrenci t dağılımları. İÇİNDE bu durumda α = 0,95. Sütunlardaki güven aralıklarının sınırları da aynı şekilde hesaplanır. Alt %90,0 Ve İlk %90,0.

7.9. Tabloyu düşünün Bakiyenin çekilmesiçıktı sonuçlarından. Bu tablo yalnızca alanda en az bir seçenek ayarlandığında çıktı sonuçlarında görünür Kalanlar iletişim kutusu Regresyon.

Sütunda Gözlem değişken değerlerinin seri numaraları verilmiştir e.
Sütunda Tahmin edilen Y regresyon fonksiyonunun değerleri y i = f(x i) değişkenin bu değerleri için hesaplanır X, buna karşılık gelir seri numarası Ben sütunda Gözlem.
Sütunda Kalanlar farkları (kalıntıları) içerir ε i =Y-y i ve sütun Standart bakiyeler– ε i / s ε oranları olarak hesaplanan normalleştirilmiş artıklar. burada s ε artıkların standart sapmasıdır. s ε değerinin karesi aşağıdaki formül kullanılarak hesaplanır:

artıkların ortalaması nerede. Değer, dağılım tablosundaki iki değerin oranı olarak hesaplanabilir: artıkların karelerinin toplamı (C13 hücresi) ve satırdan serbestlik dereceleri Toplam(B14 hücresi).

7.10. Tablo değerlerine göre Bakiyenin çekilmesi iki tür grafik oluşturulur: kalan grafikler Ve seçim programları(bölgede uygun seçenekler ayarlanmışsa Kalanlar iletişim kutusu Regresyon). Her değişken bileşen için üretilmiştir X ayrı ayrı.

Açık denge çizelgeleri bakiyeler görüntülenir, yani orijinal değerler arasındaki farklar e ve değişken bileşenin her değeri için regresyon fonksiyonundan hesaplanır X.

Açık seçim programları her değişken bileşen değeri için hem orijinal Y değerlerini hem de hesaplanan regresyon fonksiyonu değerlerini görüntüler X.

7.11. Çıktı sonuçlarının son tablosu aşağıdaki tablodur Olasılık çıktısı. İletişim kutusunda ise görünür Regresyon seçenek yüklü Normal olasılık grafiği.
Sütun değerleri Yüzdelik aşağıdaki gibi hesaplanır. Adım hesaplanır h = (1/n)*100%, ilk değer saat/2 ikincisi eşittir 100 saat/2. İkinci değerden başlayarak, sonraki her değer, bir adımın eklendiği bir önceki değere eşittir. H.
Sütunda e değişken değerleri verilmiştir e, artan düzende sıralanmıştır. Bu tablodaki verilere dayanarak, sözde normal dağılım grafiği. Değişkenler arasındaki ilişkinin doğrusallık derecesini görsel olarak değerlendirmenizi sağlar X Ve e.


8. D varyans analizi

8.1. Analiz paketiÜç tür varyans analizine izin verir. Belirli bir enstrümanın seçimi, üzerinde çalışılan veri setindeki faktör sayısı ve örnek sayısına göre belirlenir.
Aynı popülasyona ait iki veya daha fazla örneğin ortalamalarının benzer olduğu hipotezini test etmek için kullanılır.
Tekrarlı iki yönlü ANOVA daha karmaşık bir seçenektir tek değişkenli analiz Her veri grubu için birden fazla örnek dahil.
Tekrarlama olmadan iki yönlü ANOVA grup başına birden fazla örnek içermeyen iki yönlü bir varyans analizidir. İki veya daha fazla örneğin ortalamalarının aynı olduğu (örneklerin aynı popülasyona ait olduğu) hipotezini test etmek için kullanılır.

8.2. Tek yönlü ANOVA

8.2.1. Verileri analize hazırlayalım. Yeni bir sayfa oluşturun ve sütunları bu sayfaya kopyalayın A,B,C,D. İlk iki satırı kaldırın. Hazırlanan veriler yürütmek için kullanılabilir Tek yönlü varyans analizi.

8.2.2. Seçim aracını şu şekilde çağırın: Veri > Veri Analizi > Tek Yönlü ANOVA. Resme göre doldurun. Tıklamak TAMAM.

8.2.3. Tabloyu düşünün Sonuçlar: Kontrol etmek– tekrar sayısı, Toplam– gösterge değerlerinin satır bazında toplamı, Dağılım– göstergenin kısmi varyansı.

8.2.4. Masa Varyans analizi: ilk sütun Varyasyonun Kaynağı dağılımların adını içerir, SS– sapmaların karelerinin toplamı, df- özgürlük derecesi, HANIM– ortalama kare, F testi gerçek F dağılımı. P değeri– Denklemin ürettiği varyansın artıkların varyansına eşit olma olasılığı. Faktörler ile sonuç arasındaki ilişkinin elde edilen niceliksel belirlenmesinin rastgele kabul edilebileceği olasılığını belirler. F-kritik daha sonra gerçek F ile karşılaştırılan teorik F değeridir.

8.2.5. Eşitliğin sıfır hipotezi matematiksel beklentiler eşitsizlik varsa tüm örneklerin kabul edilmesi F testi < F-kritik. bu hipotez reddedilmelidir. Bu durumda numunelerin ortalama değerleri önemli ölçüde farklılık gösterir.

İÇİNDE regresyon istatistikleri çoklu korelasyon katsayısı belirtilir (Çoğul R) ve kararlılık (R-kare) Y ile faktör özellikleri dizisi arasında (bu, korelasyon analizinde daha önce elde edilen değerlerle örtüşür)

Masanın orta kısmı (Varyans Analizi) regresyon denkleminin anlamlılığını test etmek için gereklidir.

Tablonun alt kısmı - tam

genel regresyon katsayılarının bi nihai tahminleri, anlamlılıklarının ve aralık tahminlerinin test edilmesi.

b katsayılarının vektörünün tahmini (sütun Oranlar):

Bu durumda regresyon denklemi tahmini şu şekilde olur:

Regresyon denkleminin ve ortaya çıkan regresyon katsayılarının anlamlılığının kontrol edilmesi gerekir.

Regresyon denkleminin anlamlılığını b=0,05 düzeyinde kontrol edelim; hipotez H0: в1=в2=в3=…=вk=0. Bunu yapmak için F istatistiğinin gözlemlenen değeri hesaplanır:

Excel bunu sonuçlarda gösterir varyans analizi:

QR=527.4296; Qost=1109.8673 =>

Sütunda F değer belirtilir Fgözlemlenebilir.

F-dağıtım tablolarından veya yerleşik istatistiksel işlevi kullanarak FKEŞFETMEK anlamlılık seviyesi b=0.05 ve pay n1=k=4 ve payda n2=n-k-1=45'in serbestlik derecesi sayısı için F istatistiklerinin kritik değerini şuna eşit buluyoruz:

Fcr = 2,578739184

F istatistiğinin gözlemlenen değeri kritik değeri olan 8,1957 > 2,7587'yi aştığı için katsayılar vektörünün eşitliği hipotezi 0,05 hata olasılığıyla reddedilir. Sonuç olarak, b=(b1,b2,b3,b4)T vektörünün en az bir elemanı sıfırdan önemli ölçüde farklıdır.

Regresyon denkleminin bireysel katsayılarının önemini kontrol edelim, yani. hipotez .

Regresyon katsayılarının anlamlılığının test edilmesi, anlamlılık düzeyi için t-istatistikleri temel alınarak gerçekleştirilir.

T istatistiklerinin gözlemlenen değerleri sütundaki sonuç tablosunda belirtilmiştir. T-İstatistik.

Katsayılar (bi)

t-istatistikleri (tob)

Y-kavşağı

Değişken X5

Değişken X7

Değişken X10

Değişken X15

Anlamlılık seviyesi b=0,05 ve serbestlik derecesi sayısı n=n – k - 1 için bulunan kritik değer tcr ile karşılaştırılmaları gerekir.

Bunu yapmak için yerleşik Excel istatistik işlevini kullanıyoruz STUDISPOBR,Önerilen menüye olasılık b = 0,05 ve serbestlik derecesi sayısı n = n–k-1 = 50-4-1 = 45 girilerek. (Tcr değerlerini matematiksel istatistik tablolarından bulabilirsiniz.

tcr = 2,014103359 elde ederiz.

Çünkü t-istatistiklerinin gözlemlenen değeri, 2.0141>|-0.0872|, 2.0141>|0.2630|, 2.0141>|0.7300|, 2.0141>|-1.6629 | mutlak değerinde kritikten azdır.

Sonuç olarak bu katsayıların sıfıra eşit olduğu hipotezi 0,05 hata olasılığı ile reddedilmez, yani. karşılık gelen katsayılar önemsizdir.

Gözlemlenen t-istatistik değeri daha büyüktür kritik değer modulo |3.7658|>2.0141, dolayısıyla H0 hipotezi reddedilir, yani. - önemli

Regresyon katsayılarının önemi, sonuç tablosunun aşağıdaki sütunlarıyla da kontrol edilir:

Kolon P-Anlam model parametrelerinin önemini %5 sınır seviyesinde gösterir; p≤0,05 ise ilgili katsayı anlamlı kabul edilir, eğer p>0,05 ise önemsizdir.

Ve son sütunlar - %95'in altında Ve üst %95 Ve alt %98 Ve ilk %98 - bunlar, r = 0,95 (her zaman verilir) ve r = 0,98 (karşılık gelen ek güvenilirlik ayarlandığında verilir) için belirtilen güvenilirlik seviyelerine sahip regresyon katsayılarının aralık tahminleridir.

Eğer daha düşükse ve üst sınırlar aynı işarete sahip (sıfır dahil değildir) güven aralığı), bu durumda karşılık gelen regresyon katsayısı anlamlı kabul edilir, aksi takdirde önemsiz

Tablodan da anlaşılacağı üzere b3 katsayısı için p değeri p=0,0005<0,05 и доверительные интервалы не включают ноль, т.е. по всем проверочным критериям этот коэффициент является значимым.

Anlamlı olmayan regresörlerin hariç tutulduğu aşamalı regresyon analizi algoritmasına göre, bir sonraki aşamada, önemsiz regresyon katsayısına sahip bir değişkenin değerlendirmeden çıkarılması gerekir.

Regresyon değerlendirmesi sırasında çok sayıda önemsiz katsayının belirlenmesi durumunda, regresyon denkleminden ilk çıkarılacak olan, t istatistiğinin () mutlak değer olarak minimum olduğu regresördür. Bu prensibe göre bir sonraki aşamada regresyon katsayısı b2 önemsiz olan X5 değişkenini hariç tutmak gerekir.

REGRESYON ANALİZİNİN II. AŞAMASI.

Model, X7, X10, X15 faktör özelliklerini içerir ve X5'i hariç tutar.

SONUÇLARIN SONUÇLANMASI

Regresyon istatistikleri

Çoğul R

R Meydanı

Normalleştirilmiş R-kare

Standart hata

Gözlemler

Varyans analizi

(serbestlik derecesi sayısı n)

(Sapmaların karesi toplamı Q)

(ortalama kare MS=SS/n)

(Fob'lar = MSR/MSrest)

Önem F

Regresyon

Oranlar

Standart hata

t-istatistikleri

P-Değeri

İlk %95 (bimaks)

Daha düşük %98 (bimin)

Y-kavşağı

Değişken X7

Değişken X10

Değişken X15



Sitede yeni

>

En popüler