Ev Ağız boşluğu Varyans analizi yöntemleri. Tek yönlü ANOVA

Varyans analizi yöntemleri. Tek yönlü ANOVA

5.1. Ne oldu varyans analizi?

Dispersiyon analizi, 20. yüzyılın 20'li yıllarında İngiliz matematikçi ve genetikçi Ronald Fisher tarafından geliştirildi. 20. yüzyılın biyolojisi üzerinde en büyük etkiye kimin sahip olduğunu ortaya çıkaran bilim adamları arasında yapılan bir ankete göre, şampiyonluğu kazanan Sir Fisher'dı (hizmetlerinden dolayı kendisine Büyük Britanya'daki en yüksek onurlardan biri olan şövalyelik unvanı verildi) ; Bu açıdan Fischer, 19. yüzyıl biyolojisi üzerinde en büyük etkiye sahip olan Charles Darwin ile karşılaştırılabilir.

Varyans analizi artık istatistiğin ayrı bir dalıdır. Fisher tarafından keşfedilen, incelenen miktarın değişkenlik ölçüsünün, bu miktarı etkileyen faktörlere ve rastgele sapmalara karşılık gelen parçalara ayrıştırılabileceği gerçeğine dayanmaktadır.

Varyans analizinin özünü anlamak için aynı tür hesaplamaları iki kez gerçekleştireceğiz: "manuel olarak" (bir hesap makinesiyle) ve Statistica programını kullanarak. Görevimizi basitleştirmek için, yeşil kurbağaların çeşitliliğinin gerçek tanımının sonuçlarıyla değil, insanlardaki dişi ve erkeklerin karşılaştırılmasıyla ilgili hayali bir örnekle çalışacağız. 12 yetişkinin boy çeşitliliğini düşünün: 7 kadın ve 5 erkek.

Tablo 5.1.1. Tek yönlü ANOVA örneği: 12 kişinin cinsiyeti ve boyuna ilişkin veriler

Tek yönlü bir varyans analizi yapalım: karakterize edilen gruptaki erkek ve kadınların boylarının istatistiksel olarak anlamlı düzeyde farklı olup olmadığını karşılaştırın.

5.2. Normal dağılım testi

Daha ileri muhakeme, söz konusu numunedeki dağılımın normal veya normale yakın olduğu gerçeğine dayanmaktadır. Dağılım normalden uzaksa dağılım (varyans), değişkenliğin yeterli bir ölçüsü değildir. Ancak varyans analizi normallikten dağılım sapmalarına karşı nispeten dirençlidir.

Bu verilerin normallik testi iki farklı şekilde yapılabilir. Birincisi: İstatistikler / Temel İstatistikler / Tablolar / Tanımlayıcı istatistikler / Normallik sekmesi. Sekmede Normallik Hangi normallik testlerinin kullanılacağını seçebilirsiniz. Frekans tabloları düğmesine tıkladığınızda bir frekans tablosu görünecek ve Histogramlar düğmesi bir histogram görüntüleyecektir. Tablo ve histogram çeşitli testlerin sonuçlarını gösterecektir.

İkinci yöntem, histogramları oluştururken uygun yeteneklerin kullanılmasıyla ilişkilidir. Histogramların (Graflar / Histogramlar...) oluşturulmasına yönelik iletişim kutusunda Gelişmiş sekmesini seçin. Altta bir İstatistik bloğu var. Üzerine Shapiro-Wilk'i işaretleyelim T şekilde gösterildiği gibi est ve Kolmogorov-Smirnov testi.

Pirinç. 5.2.1. Histogram çizim iletişim kutusunda dağılımın normalliği için istatistiksel testler

Histogramdan da görülebileceği gibi örneğimizdeki büyümenin dağılımı normalden farklı (ortada bir “başarısızlık” var).


Pirinç. 5.2.2. Önceki şekilde belirtilen parametrelerle oluşturulmuş histogram

Grafik başlığındaki üçüncü satır, gözlenen dağılımın en yakın olduğu normal dağılım parametrelerini göstermektedir. Genel ortalama 173, genel standart sapma ise 10,4'tür. Aşağıdaki grafikte normallik testlerinin sonuçları gösterilmektedir. D, Kolmogorov-Smirnov testidir ve SW-W, Shapiro-Wilk testidir. Görüldüğü gibi kullanılan tüm testlerde boy dağılımı ile normal dağılım arasındaki farklar istatistiksel olarak anlamsız çıkmıştır ( P her durumda 0,05'ten büyük).

Dolayısıyla, resmi olarak konuşursak, dağılımın normal olması için yapılan testler, normal dağılım varsayımına dayanan parametrik yöntemi kullanmamızı "yasaklamadı". Daha önce de belirtildiği gibi, varyans analizi normallikten sapmalara karşı nispeten dirençlidir, dolayısıyla onu kullanmaya devam edeceğiz.

5.3. Tek yönlü varyans analizi: manuel hesaplamalar

Verilen örnekte insanların boylarının değişkenliğini karakterize etmek için sapmaların karelerinin toplamını hesaplayalım (İngilizce'de şu şekilde ifade edilir): SS , Kareler Toplamı veya ) ortalamadan bireysel değerler: . Yukarıdaki örnekte boy için ortalama değer 173 santimetredir. Buna dayanarak,

SS = (186–173) 2 + (169–173) 2 + (166–173) 2 + (188–173) 2 + (172–173) 2 + (179–173) 2 + (165–173) 2 + (174–173) 2 + (163–173) 2 + (162–173) 2 + (162–173) 2 + (190–173) 2 ;

SS = 132 + 42 + 72 + 152 + 12 + 62 + 82 + 12 + 102 + 112 + 112 + 172;

SS = 169 + 16 + 49 + 225 + 1 + 36 + 64 + 1 + 100 + 121 + 121 + 289 = 1192.

Ortaya çıkan değer (1192), tüm veri setinin değişkenliğinin bir ölçüsüdür. Ancak her birinin kendi ortalaması olabilen iki gruptan oluşurlar. Verilen verilerde ortalama yükseklik kadınlar - 168 cm ve erkekler - 180 cm.

Kadınlar için sapmaların karelerinin toplamını hesaplayalım:

SS f = (169–168) 2 + (166–168) 2 + (172–168) 2 + (179–168) 2 + (163–168) 2 + (162–168) 2 ;

SS f = 12 + 22 + 42 + 112 + 32 + 52 + 62 = 1 + 4 + 16 + 121 + 9 + 25 + 36 = 212.

Ayrıca erkekler için sapmaların karelerinin toplamını da hesaplıyoruz:

SS m = (186–180) 2 + (188–180) 2 + (174–180) 2 + (162–180) 2 + (190–180) 2 ;

SS m = 62 + 82 + 62 + 182 + 102 = 36 + 64 + 36 + 324 + 100 = 560.

Varyans analizi mantığına göre incelenen değer neye bağlıdır?

Hesaplanan iki değer, SS f Ve SS m , varyans analizinde genellikle "hata" olarak adlandırılan grup içi varyasyonu karakterize eder. Bu ismin kökeni şu mantıkla bağlantılıdır.

Bu örnekte bir kişinin boyunu ne belirler? Her şeyden önce, cinsiyetlerine bakılmaksızın genel olarak insanların ortalama boyu. İkincisi - yerden. Bir cinsiyetten (erkek) insanlar diğerinden (kadın) daha uzunsa, bu, bazı değerlerin "evrensel" ortalamasına, yani cinsiyet etkisine bir ekleme olarak temsil edilebilir. Son olarak, aynı cinsiyetten kişilerin boyları bireysel farklılıklar nedeniyle farklılık gösterir. Boyu insan ortalaması ile cinsiyete göre ayarlamanın toplamı olarak tanımlayan bir modelde, bireysel farklılıklar açıklanamaz ve "hata" olarak değerlendirilebilir.

Dolayısıyla varyans analizi mantığına uygun olarak incelenen değer şu şekilde belirlenir: , Nerede x ij - çalışılan faktörün j-th değerinde çalışılan miktarın i-th değeri; - genel ortalama; Fj - incelenen faktörün j-th değerinin etkisi; - “hata”, değerin atıfta bulunduğu nesnenin bireyselliğinin katkısıx ij .

Gruplararası kareler toplamı

Bu yüzden, SS hatalar = SS f + SS m = 212 + 560 = 772. Bu değerle grup içi değişkenliği tanımladık (grupları cinsiyete göre ayırırken). Ancak değişkenliğin ikinci bir kısmı daha vardır; buna gruplar arası değişkenlik adını vereceğiz.SS etkisi (çünkü söz konusu nesnelerin bütününün kadın ve erkeklere bölünmesinin etkisinden bahsediyoruz).

Her grubun ortalaması genel ortalamadan farklıdır. Bu farkın genel değişkenlik ölçüsüne katkısını hesaplarken, grup ile genel ortalama arasındaki farkı her gruptaki nesne sayısıyla çarpmamız gerekir.

SS etkisi = = 7×(168–173) 2 + 5×(180–173) 2 = 7×52 + 5×72 = 7×25 + 5×49 = 175 + 245 = 420.

Fischer'in keşfettiği kareler toplamının sabitliği ilkesi burada kendini gösterdi: SS = etki SS + hata SS yani bu örnek için 1192 = 440 + 722.

Ortalama kareler

Örneğimizde gruplar arası ve grup içi kareler toplamlarını karşılaştırdığımızda birincisinin iki grubun varyasyonuyla, ikincisinin ise 2 gruptaki 12 değerle ilişkili olduğunu görebiliriz. Serbestlik derecesi sayısı ( df ) bazı parametreler için gruptaki nesnelerin sayısı ile bu miktarları birbirine bağlayan bağımlılıkların (denklemlerin) sayısı arasındaki fark olarak tanımlanabilir.

Örneğimizde df efekti = 2–1 = 1, A df hataları = 12–2 = 10.

Karelerin toplamını serbestlik derecelerine bölerek karelerin ortalamasını verebiliriz ( HANIM , Karelerin Ortalaması). Bunu yaptıktan sonra şunu belirleyebiliriz HANIM - varyasyonlardan başka bir şey değil (“varyanslar”, kareler toplamının serbestlik derecesi sayısına bölünmesinin sonucu). Bu keşiften sonra ANOVA tablosunun yapısını anlayabiliyoruz. Örneğimiz için şöyle görünecek.

Etki

Hata

MS etkisi Ve MS hataları gruplar arası ve grup içi varyansın tahminleridir ve bu nedenle kriterlere göre karşılaştırılabilirler.F (Fischer'in adını taşıyan Snedecor kriteri), varyasyonları karşılaştırmak için tasarlanmıştır. Bu kriter basitçe daha büyük varyasyonun daha küçük varyasyona bölünmesinin oranıdır. Bizim durumumuzda 420 / 77,2 = 5,440'tır.

Tablolar kullanılarak Fisher testinin istatistiksel anlamlılığının belirlenmesi

Etkinin istatistiksel anlamlılığını tablolar kullanarak manuel olarak belirleyecek olsaydık, ortaya çıkan kriter değerini karşılaştırmamız gerekirdi. F Belirli bir serbestlik derecesi için belirli bir istatistiksel anlamlılık düzeyine karşılık gelen kritik bir değere sahiptir.


Pirinç. 5.3.1. Kritik kriter değerlerine sahip bir tablonun parçası F

Gördüğünüz gibi p=0,05 istatistiksel anlamlılık düzeyi için kriterin kritik değeri şu şekildedir:F 4.96'dır. Bu, örneğimizde çalışılan cinsiyetin etkisinin 0,05 istatistiksel anlamlılık düzeyinde kaydedildiği anlamına gelir.

Elde edilen sonuç şu şekilde yorumlanabilir. Kadın ve erkeklerin ortalama boylarının aynı olduğu ve boyları arasında kaydedilen farkın örneklem seçiminde rastlantısallıktan kaynaklandığı şeklindeki boş hipotezin olasılığı %5'ten azdır. Bu, kadınların ve erkeklerin ortalama boylarının farklı olduğunu öne süren alternatif hipotezi seçmemiz gerektiği anlamına geliyor.

5.4. Tek yönlü varyans analizi ( ANOVA) Statistica paketinde

Hesaplamaların manuel olarak değil de uygun programlar (örneğin Statistica paketi) kullanılarak yapıldığı durumlarda, değer P otomatik olarak belirlenir. Kritik değerden biraz daha yüksek olduğunu doğrulayabilirsiniz.

Tartışılan örneği varyans analizinin en basit sürümünü kullanarak analiz etmek için, ilgili verilerle birlikte dosya için İstatistik / ANOVA prosedürünü çalıştırmanız ve Analiz türü penceresinde ve Hızlı özellikler iletişim kutusunda Tek yönlü ANOVA seçeneğini seçmeniz gerekir. Belirtim yöntemi penceresindeki seçenek.


Pirinç. 5.4.1. Diyalog Genel ANOVA/MANOVA (Varyans Analizi)

Açılan hızlı iletişim penceresinde Değişkenler alanında, değişkenliğini incelediğimiz verileri içeren sütunları (Bağımlı değişken listesi; bizim durumumuzda Büyüme sütunu) ve değerleri içeren bir sütunu belirtmeniz gerekir. ​incelenen değeri gruplara ayıran (Kategorik öngörücü ( faktör); bizim durumumuzda Cinsiyet sütunu). Analizin bu versiyonunda, çok değişkenli analizden farklı olarak yalnızca bir faktör dikkate alınabilir.


Pirinç. 5.4.2. Diyalog Tek Yönlü ANOVA (Tek yönlü varyans analizi)

Faktör kodları penceresinde söz konusu faktörün bu analiz sırasında işlenmesi gereken değerlerini belirtmelisiniz. Mevcut tüm değerler Yakınlaştır düğmesi kullanılarak görüntülenebilir; Örneğimizde olduğu gibi faktörün tüm değerlerini dikkate almanız gerekiyorsa (ve örneğimizde cinsiyet için yalnızca iki tane vardır), Tümü düğmesini tıklayabilirsiniz. İşlem yapılacak sütunlar ve faktör kodları belirtildiğinde Tamam'a tıklayıp pencereye gidebilirsiniz. hızlı analiz sonuçlar: Hızlı sekmesinde ANOVA Sonuçları 1.

Pirinç. 5.4.3. ANOVA Sonuçları Penceresinin Hızlı Sekmesi

Tüm efektler/Grafikler düğmesi, iki grubun ortalamalarının nasıl karşılaştırıldığını görmenizi sağlar. Grafiğin üzerinde serbestlik derecesi sayısı ile söz konusu faktöre ait F ve p değerleri belirtilmektedir.


Pirinç. 5.4.4. ANOVA sonuçlarının grafiksel gösterimi

Tüm efektler düğmesi, yukarıda açıklanana benzer bir varyans tablosu analizi elde etmenizi sağlar (bazı önemli farklılıklarla birlikte).


Pirinç. 5.4.5. Varyans analizi sonuçlarını içeren tablo (“manuel olarak” elde edilen benzer bir tabloyla karşılaştırın)

Tablonun alt satırı karelerin toplamını, serbestlik derecesi sayısını ve hatanın (grup içi değişkenlik) ortalama karelerini gösterir. Yukarıdaki satırda incelenen faktör için benzer göstergeler bulunmaktadır ( bu durumda- Cinsiyet işareti) ve kriter F (Etkinin ortalama karelerinin hatanın ortalama karelerine oranı) ve istatistiksel anlamlılık düzeyi. Söz konusu faktörün etkisinin istatistiksel olarak anlamlı çıkması kırmızı renkle gösterilmektedir.

Ve ilk satır "Kesme" göstergesindeki verileri gösterir. Bu Tablo satırı, Statistica'ya 6. veya sonraki sürümünde katılan kullanıcılar için bir gizem sunuyor. Intercept değeri muhtemelen tüm veri değerlerinin karelerinin toplamının ayrıştırılmasıyla ilgilidir (yani 1862 + 1692 ... = 360340). Bunun için belirtilen F kriter değeri bölünerek elde edildi. MS Engelleme/MS Hatası = 353220 / 77,2 = 4575,389 ve doğal olarak çok verir Düşük değer P . Statistica-5'te bu değerin hiç hesaplanmamış olması ilginçtir ve paketin sonraki sürümlerinin kullanımına ilişkin kılavuzlar, bunun tanıtımı hakkında hiçbir şekilde yorum yapmamaktadır. Muhtemelen Statistica-6 ve sonraki sürümlerini kullanan bir biyoloğun yapabileceği en iyi şey, ANOVA tablosundaki Intercept satırını görmezden gelmektir.

5.5. ANOVA ve Öğrenci ve Fisher'in t testleri: hangisi daha iyi?

Fark etmiş olabileceğiniz gibi, tek yönlü varyans analizini kullanarak karşılaştırdığımız verileri aynı zamanda Öğrenci ve Fisher testlerini kullanarak da inceleyebiliriz. Bu iki yöntemi karşılaştıralım. Bunu yapmak için bu kriterleri kullanarak kadın ve erkek arasındaki boy farkını hesaplayalım. Bunu yapmak için gruplara göre bağımsız olarak İstatistik / Temel İstatistik / t-testi yolunu izlememiz gerekecek. Doğal olarak Bağımlı değişkenler Büyüme değişkenidir ve Gruplandırma değişkeni Cinsiyet değişkenidir.


Pirinç. 5.5.1. ANOVA kullanılarak işlenen verilerin Öğrenci ve Fisher testleri kullanılarak karşılaştırılması

Gördüğünüz gibi sonuç ANOVA kullanımıyla aynı. P = 0,041874 her iki durumda da Şekil 2'de gösterildiği gibi. 5.4.5 ve Şekil 2'de gösterilmiştir. 5.5.2 (kendi gözünüzle görün!).


Pirinç. 5.5.2. Analiz sonuçları (sonuç tablosunun ayrıntılı açıklaması - Öğrenci testine ayrılmış paragrafta)

Öğrenci ve Fisher testlerine göre ele alınan analizde matematiksel açıdan F kriteri ANOVA ile aynı olmasına (ve varyans oranını ifade etmesine) rağmen, aşağıda sunulan analiz sonuçlarındaki anlamının vurgulanması önemlidir. final masası ise tamamen farklı. Öğrenci ve Fisher testleri ile karşılaştırma yapılırken, örnek ortalamaların karşılaştırılması Öğrenci testi ile, değişkenliklerinin karşılaştırılması ise Fisher testi ile gerçekleştirilir. Analizin sonuçları varyasyonun kendisini değil, varyasyonun kendisini gösterir. Kare kök- standart sapma.

Öte yandan ANOVA'da Fisher testi, farklı örneklerin ortalamalarını karşılaştırmak için kullanılır (daha önce tartıştığımız gibi, bu, kareler toplamını parçalara bölerek ve grup içi ve grup içi karşılık gelen karelerin ortalama toplamını karşılaştırarak yapılır) değişkenlik).

Ancak yukarıdaki farklılık istatistiksel bir çalışmanın özünden ziyade sonuçlarının sunumuyla ilgilidir. Glantz'ın (1999, s. 99) işaret ettiği gibi, örneğin, grupların Öğrenci t testi kullanılarak karşılaştırılması şu şekilde görülebilir: özel durum iki örnek için varyans analizi.

Dolayısıyla, Öğrenci ve Fisher testleri kullanılarak örneklerin karşılaştırılmasında bir şey vardır: önemli avantaj Varyans analizinden önce: İçinde örnekler değişkenlikleri açısından karşılaştırılabilir. Ancak varyans analizinin avantajları hala daha önemlidir. Bunlar, örneğin, birkaç numuneyi aynı anda karşılaştırma yeteneğini içerir.

Varyans analizi, çeşitli faktörlerin bir deneyin sonucu üzerindeki etkisini değerlendirmek ve benzer deneylerin daha sonra planlanması için tasarlanmış istatistiksel bir yöntemdir.

Başlangıçta (1918), varyans analizi İngiliz matematikçi ve istatistikçi R.A. tarafından geliştirildi. Fischer'e, çeşitli tarımsal ürün türlerinden maksimum verimi elde etme koşullarını belirlemek için tarımsal deneylerin sonuçlarını işlemesi talimatı verildi.

Bir deneme oluştururken aşağıdaki koşulların karşılanması gerekir:

    Deneyin her çeşidi birkaç gözlem biriminde (hayvan grupları, tarla bölümleri vb.)

    Gözlem birimlerinin deneysel değişkenler arasındaki dağılımı rastgele olmalı ve kasıtlı olmamalıdır.

ANOVA'nın kullanım alanları F-kriter(R.A. Fisher kriteri), iki varyansın oranını temsil eder:

burada d olgusu, d kalıntısı sırasıyla serbestlik derecesi başına faktöriyel (gruplar arası) ve artık (grup içi) varyanslardır.

Faktör ve artık varyanslar, varyasyon serbestlik derecelerinin sayısı dikkate alınarak örnek verilerden hesaplanan popülasyon varyansının tahminleridir.

Faktöriyel (gruplar arası) dağılım, çalışılan faktörün etkisi altında etkili özelliğin değişimini açıklar.

Artık (grup içi) varyans, diğer faktörlerin etkisine bağlı olarak (incelenen faktörün etkisi hariç) etkili karakteristikteki değişimi açıklar.

Özetle, faktör ve artık varyanslar toplam varyansı verir ve tüm faktör özelliklerinin sonuç üzerindeki etkisini ifade eder.

Varyans analizi yapma prosedürü:

1. Deneysel veriler bir hesaplama tablosuna girilir ve çalışılan popülasyonun her bir grubundaki miktarlar ve ortalama değerlerin yanı sıra tüm popülasyon için toplam miktar ve ortalama değer belirlenir (Tablo 1).

tablo 1

İ'inci birim için ortaya çıkan özelliğin değeri

j'inci grupta, x ij

Gözlem sayısı, f j

Ortalama (grup ve toplam), x j

x 11, x 12, …, x 1 n

x 21, x 22, …, x 2 n

x m 1, x m 2, …, x mn

Toplam gözlem sayısı N gözlem sayısının toplamı olarak hesaplanır F J her grupta:

Tüm gruplar aynı sayıda öğeye sahipse, genel ortalama grup ortalamalarından basit bir aritmetik ortalama olarak bulunur:

Gruplardaki eleman sayısı farklıysa genel ortalama ağırlıklı aritmetik ortalama formülü kullanılarak hesaplanır:

2. Toplam varyans belirlenir D genel olarak ortaya çıkan özelliğin bireysel değerlerinin kare sapmalarının toplamı olarak toplam ortalamadan :

3. Faktöriyel (gruplar arası) varyans hesaplanır D hakikat grup ortalamalarının karesel sapmalarının toplamı olarak toplam ortalamadan gözlem sayısıyla çarpılır:

4. Artık (grup içi) varyansın değeri belirlenir D ost toplam arasındaki fark olarak D genel olarak ve faktöriyel D hakikat farklılıklar:

5. Faktörün serbestlik derecesi sayısını hesaplayın
grup sayısı arasındaki fark olarak varyans M ve birim:

6. Artık dağılım için serbestlik derecesi sayısı belirlenir
bir özelliğin bireysel değerlerinin sayısı arasındaki fark olarak N ve grup sayısı M:

7. Bir serbestlik derecesi başına faktör dağılım değeri hesaplanır D hakikat faktör varyans oranı olarak D hakikat faktör dağılımının serbestlik derecesi sayısına
:

8. Bir serbestlik derecesi başına artık dağılımın değeri belirlenir D ost artık varyans oranı olarak D ost artık dağılımın serbestlik derecesi sayısına
:

9. F kriterinin hesaplanan değeri belirlenir F-hesaplama serbestlik derecesi başına faktör varyansının oranı olarak D hakikat serbestlik derecesi başına artık varyansa D ost :

10. Fisher F test tablosunu kullanarak, çalışmada benimsenen anlamlılık düzeyinin yanı sıra faktör ve artık varyansların serbestlik dereceleri de dikkate alınarak teorik değer bulunur. F masa .

%5 anlamlılık düzeyi %95 olasılık düzeyine, %1 anlamlılık düzeyi ise %99 olasılık düzeyine karşılık gelir. Çoğu durumda %5 anlamlılık düzeyi kullanılır.

Teorik değer F masa Belirli bir önem düzeyi, varyansların iki serbestlik derecesine karşılık gelen, bir satır ve bir sütunun kesişimindeki tablolardan belirlenir:

satıra göre - artık;

sütuna göre - faktöriyel.

11. Hesaplama sonuçları bir tabloda sunulmaktadır (Tablo 2).

Doğası gereği tüm insanlar bilgi için çabalar. (Aristoteles. Metafizik)

Varyans analizi

Giriş niteliğindeki genel bakış

Bu bölümde ANOVA'nın temel yöntemlerini, varsayımlarını ve terminolojisini inceleyeceğiz.

İngilizce literatürde varyans analizine genellikle varyasyon analizi adı verildiğini unutmayın. Bu nedenle, konuyu kısaltmak adına aşağıda bazen terimini kullanacağız. ANOVA (Bir analiz Ö F evet riasyon) sıradan ANOVA ve terim için MANOVAçok değişkenli varyans analizi için. Bu bölümde varyans analizinin ana fikirlerini sırayla gözden geçireceğiz ( ANOVA), kovaryans analizi ( ANÇOVA), çok değişkenli varyans analizi ( MANOVA) ve çok değişkenli kovaryans analizi ( MANÇOVA). Kontrast analizi ve post hoc testlerin yararları hakkında kısa bir tartışmanın ardından ANOVA yöntemlerinin dayandığı varsayımlara bakalım. Bu bölümün sonuna doğru, tekrarlanan ölçüm analizi için çok değişkenli bir yaklaşımın geleneksel tek değişkenli yaklaşıma göre avantajları açıklanmaktadır.

Anahtar Fikirler

Varyans analizinin amacı. Varyans analizinin temel amacı ortalamalar arasındaki farkların önemini incelemektir. Bölüm (Bölüm 8) istatistiksel anlamlılık çalışmasına kısa bir giriş sağlar. Eğer sadece iki numunenin ortalamalarını karşılaştırıyorsanız, varyans analizi sıradan analizle aynı sonucu verecektir. T- bağımsız örnekler için test (eğer iki bağımsız nesne grubu veya gözlem karşılaştırılıyorsa) veya T- bağımlı örnekler için kriter (iki değişken aynı nesne veya gözlem kümesinde karşılaştırılırsa). Bu kriterlere aşina değilseniz giriş bölümüne genel bakışa bakmanızı öneririz. (Bölüm 9).

Adı nereden geldi? Varyans analizi? Ortalamaları karşılaştırma prosedürünün varyans analizi olarak adlandırılması garip görünebilir. Gerçekte bunun nedeni, ortalamalar arasındaki farkların istatistiksel anlamlılığını incelediğimizde aslında varyansları analiz ediyor olmamızdır.

Kareler toplamını bölme

N örneklem büyüklüğü için örneklem varyansı, örneklem ortalamasından sapmaların karelerinin toplamının n-1'e bölünmesiyle hesaplanır (örneklem büyüklüğü eksi bir). Dolayısıyla, sabit bir örneklem büyüklüğü n için varyans, kısalık amacıyla belirtilen kareler (sapmalar) toplamının bir fonksiyonudur, SS(İngilizce Kareler Toplamı - Karelerin Toplamı'ndan). Varyans analizinin temeli, varyansın parçalara ayrılmasıdır (veya bölümlenmesidir). Aşağıdaki veri kümesini göz önünde bulundurun:

İki grubun ortalamaları önemli ölçüde farklıdır (sırasıyla 2 ve 6). Karesel sapmaların toplamı içeri her grup 2'ye eşittir. Bunları topladığımızda 4 elde ederiz. Şimdi bu hesaplamaları tekrarlarsak hariç grup üyeliği, yani hesaplarsak SS iki örneğin genel ortalamasına dayalı olarak 28 elde ederiz. Başka bir deyişle, grup içi değişkenliğe dayalı varyans (kareler toplamı), genel değişkenliğe dayalı olarak hesaplanandan çok daha küçük değerlerle sonuçlanır (karelerin toplamına göre). genel ortalama). Bunun nedeni elbette ortalamalar arasındaki anlamlı farktır ve ortalamalar arasındaki bu fark kareler toplamları arasındaki mevcut farkı açıklamaktadır. Aslında, verilen verileri analiz etmek için modülü kullanırsanız Varyans analizi aşağıdaki sonuçlar elde edilecektir:

Tablodan da görülebileceği gibi kareler toplamı SS=28, verilen karelerin toplamına bölünür grup içi değişkenlik ( 2+2=4 ; bkz. tablonun ikinci satırı) ve ortalama değerlerdeki fark nedeniyle kareler toplamı. (28-(2+2)=24; bkz. tablonun ilk satırı).

SS hatalar veSS etki. Grup içi değişkenlik ( SS) genellikle dispersiyon olarak adlandırılır hatalar. Bu, bir deney yapıldığında genellikle tahmin edilemeyeceği veya açıklanamayacağı anlamına gelir. Diğer tarafta, SS etki(veya gruplar arası değişkenlik), çalışma gruplarının ortalamaları arasındaki farklılıklarla açıklanabilir. Başka bir deyişle belirli bir gruba ait olmak açıklıyor gruplar arası değişkenlik, çünkü bu grupların farklı araçları olduğunu biliyoruz.

Önem kontrolü.İstatistiksel anlamlılık testinin temel fikirleri Bölüm'de tartışılmaktadır. İstatistiğin temel kavramları(Bölüm 8). Bu bölüm aynı zamanda birçok testin açıklanan varyansın açıklanmayan varyansa oranını kullanmasının nedenlerini de açıklamaktadır. Bu kullanıma bir örnek varyans analizinin kendisidir. ANOVA'da anlamlılık testi, gruplar arası varyanstan kaynaklanan varyansın karşılaştırılmasına dayanır (buna grup adı verilir). ortalama kare etkisi veya HANIMEtki) ve grup içi varyasyondan kaynaklanan varyans (buna ortalama kare hatası veya HANIMhata). Eğer sıfır hipotezi (iki popülasyondaki ortalamaların eşitliği) doğruysa, o zaman rastgele değişim nedeniyle örnek ortalamalarında nispeten az bir fark beklenebilir. Bu nedenle sıfır hipotezi altında, grup içi varyans pratikte grup üyeliği dikkate alınmadan hesaplanan toplam varyansla örtüşecektir. Ortaya çıkan grup içi varyanslar aşağıdakiler kullanılarak karşılaştırılabilir: F- Varyans oranının 1'den önemli ölçüde büyük olup olmadığını kontrol eden test. Yukarıda tartışılan örnekte F- kriter ortalamalar arasındaki farkın istatistiksel olarak anlamlı olduğunu göstermektedir.

Varyans analizinin temel mantığı.Özetlemek gerekirse, ANOVA'nın amacı ortalamalar arasındaki farkın (gruplar veya değişkenler için) istatistiksel anlamlılığını test etmektir. Bu kontrol varyans analizi kullanılarak gerçekleştirilir; toplam varyansı (varyansı) parçalara bölerek, bunlardan biri rastgele hatadan (yani grup içi değişkenlikten) kaynaklanır ve ikincisi ortalama değerlerdeki farklılıklarla ilişkilidir. Son varyans bileşeni daha sonra ortalamalar arasındaki farkın istatistiksel anlamlılığını analiz etmek için kullanılır. Bu fark anlamlı ise sıfır hipotezi reddedilir ve ortalamalar arasında fark olduğunu ifade eden alternatif hipotez kabul edilir.

Bağımlı ve bağımsız değişkenler. Değerleri bir deney sırasında yapılan ölçümlerle belirlenen değişkenlere (örneğin test puanı) denir. bağımlı değişkenler. Bir deneyde kontrol edilebilen değişkenlere (örneğin, öğretim yöntemleri veya gözlemleri gruplara ayırmaya yönelik diğer kriterler) denir. faktörler veya bağımsız değişkenler. Bu kavramlar bu bölümde daha ayrıntılı olarak açıklanmaktadır. İstatistiğin temel kavramları(Bölüm 8).

Çok değişkenli varyans analizi

Yukarıda basit örnek uygun modül seçeneğini kullanarak bağımsız örnekler için t-testini hemen hesaplayabilirsiniz. Temel istatistikler ve tablolar. Elde edilen sonuçlar doğal olarak varyans analizi sonuçlarıyla örtüşecektir. Ancak ANOVA çok daha karmaşık çalışmalar için kullanılabilecek esnek ve güçlü teknikler içerir.

Birçok faktör. Dünya doğası gereği karmaşık ve çok boyutludur. Belirli bir olgunun tamamen tek bir değişken tarafından tanımlandığı durumlar son derece nadirdir. Örneğin büyük domates yetiştirmeyi öğrenmeye çalışıyorsak bitkinin genetik yapısı, toprak tipi, ışık, sıcaklık vb. gibi faktörleri göz önünde bulundurmalıyız. Bu nedenle, tipik bir deneyi yürütürken çok sayıda faktörle uğraşmak gerekir. ANOVA'nın kullanılmasının, iki örneğin farklı faktör seviyelerinde tekrarlanan karşılaştırmaları yerine tercih edilmesinin ana nedeni T- kriter, varyans analizinin daha fazla olmasıdır etkili ve küçük örnekler için daha bilgilendirici.

Faktör yönetimi. Yukarıda tartışılan iki örnekli analiz örneğinde başka bir faktör eklediğimizi varsayalım; Zemin- Cinsiyet. Her grup 3 erkek ve 3 kadından oluşsun. Bu deneyin tasarımı 2'ye 2'lik bir tablo şeklinde sunulabilir:

Deney. Grup 1 Deney. Grup 2
Erkekler2 6
3 7
1 5
Ortalama2 6
Kadınlar4 8
5 9
3 7
Ortalama4 8

Hesaplamaları yapmadan önce bu örnekte toplam varyansın en az üç kaynağı olduğunu fark edebilirsiniz:

(1) rastgele hata (grup varyansı dahilinde),

(2) deney grubu üyeliğiyle ilişkili değişkenlik ve

(3) gözlem nesnelerinin cinsiyetine bağlı değişkenlik.

(Değişkenliğin başka bir olası kaynağı olduğunu unutmayın - faktörlerin etkileşimi, bunu daha sonra tartışacağız). Eklemezsek ne olur? zemincinsiyet analizde bir faktör olarak kullanın ve olağan olanı hesaplayın T-kriter? Kareler toplamını hesaplarsak zemin -cinsiyet(yani, grup içi varyansı hesaplarken farklı cinsiyetteki nesneleri bir grupta birleştirmek, böylece her grup için şuna eşit kareler toplamı elde etmek: SS=10 ve karelerin toplamı SS= 10+10 = 20), daha sonra aşağıdakilere göre alt gruplara ek bölünme ile daha doğru bir analize göre daha büyük bir grup içi varyans değeri elde ederiz. yarı cinsiyet(bu durumda grup içi ortalamalar 2'ye eşit olacak ve grup içi karelerin toplamı şuna eşit olacaktır: SS = 2+2+2+2 = 8). Bu fark ortalama değerin yüksek olmasından kaynaklanmaktadır. erkekler - erkekler ortalamasından daha az kadınlar -dişi ve ortalamalardaki bu farklılık, cinsiyet dikkate alınmadığında genel grup içi değişkenliği artırır. Hata varyansının kontrol edilmesi testin duyarlılığını (gücünü) artırır.

Bu örnek, geleneksel analize kıyasla varyans analizinin başka bir avantajını göstermektedir. T- iki numune için kriter. Varyans analizi, kalan faktörlerin değerlerini kontrol ederek her bir faktörü incelemenize olanak tanır. Aslında istatistiksel gücünün daha yüksek olmasının ana nedeni budur (anlamlı sonuçlar elde etmek için daha küçük örneklem boyutları gerekir). Bu nedenle varyans analizi küçük örneklemlerde bile istatistiksel olarak daha fazla sonuç verir. önemli sonuçlar basitten daha T- kriter.

Etkileşim Etkileri

Geleneksel analize kıyasla varyans analizi kullanmanın başka bir avantajı daha vardır: T- kriter: varyans analizi tespit etmemizi sağlar etkileşim faktörler arasındadır ve bu nedenle daha karmaşık modellerin incelenmesine olanak tanır. Açıklamak için başka bir örneği düşünün.

Ana etkiler, ikili (iki faktörlü) etkileşimler.İki grup öğrenci olduğunu ve psikolojik olarak birinci gruptaki öğrencilerin verilen görevleri tamamlamaya kararlı olduklarını ve tembel öğrencilerden oluşan ikinci gruptaki öğrencilere göre daha amaçlı olduklarını varsayalım. Her grubu rastgele ikiye bölelim ve her grubun bir yarısına zor, diğer yarısına ise kolay bir görev verelim. Daha sonra öğrencilerin bu görevler üzerinde ne kadar sıkı çalıştıklarını ölçeceğiz. Bu (kurgusal) çalışmanın ortalamaları tabloda gösterilmektedir:

Bu sonuçlardan ne gibi bir sonuç çıkarılabilir? Şu sonuca varabilir miyiz: (1) öğrenciler karmaşık bir görev üzerinde daha yoğun çalışırlar; (2) Motivasyonlu öğrenciler tembel öğrencilerden daha mı çok çalışırlar? Bu ifadelerin hiçbiri tabloda gösterilen araçların sistematik doğasının özünü yansıtmamaktadır. Sonuçlara bakıldığında sadece motive öğrencilerin zor görevlerde daha çok çalıştıklarını, sadece tembel öğrencilerin ise kolay görevlerde daha çok çalıştıklarını söylemek daha doğru olacaktır. Başka bir deyişle öğrencilerin karakteri ve görevin zorluğu etkileşimli harcanan çaba üzerinde birbirlerini etkilerler. Bu bir örnek çift ​​etkileşimiÖğrencilerin karakteri ile görevin zorluğu arasında. 1 ve 2 numaralı ifadelerin açıkladığını unutmayın. ana etkiler.

Üst düzey etkileşimler.İkili etkileşimleri açıklamak hala nispeten kolay olsa da, yüksek dereceli etkileşimleri açıklamak çok daha zordur. Yukarıda ele alınan örnekte başka bir faktörün devreye girdiğini düşünelim. zemin -Cinsiyet ve aşağıdaki ortalamalar tablosunu elde ettik:

Şimdi elde edilen sonuçlardan ne gibi sonuçlar çıkarılabilir? Ortalama grafikler karmaşık etkilerin yorumlanmasını kolaylaştırır. ANOVA modülü, bu grafikleri neredeyse tek bir fare tıklamasıyla oluşturmanıza olanak tanır.

Aşağıdaki grafiklerde yer alan görüntü, üzerinde çalışılan üç faktörlü etkileşimi temsil etmektedir.

Grafiklere baktığımızda, kadınlar için kişilik ile testin zorluğu arasında bir etkileşim olduğunu söyleyebiliriz: Motivasyona sahip kadınlar zor bir görev üzerinde kolay bir görevden daha çok çalışırlar. Erkeklerde ise aynı etkileşim tersinedir. Faktörler arasındaki etkileşimin tanımının daha kafa karıştırıcı hale geldiği görülebilir.

Etkileşimleri tanımlamanın genel bir yolu.İÇİNDE Genel dava Faktörler arasındaki etkileşim, bir etkinin diğerinin etkisi altında değişmesi olarak tanımlanmaktadır. Yukarıda tartışılan örnekte iki faktörlü etkileşim, öğrencinin karakterini tanımlayan faktörün etkisi altında görevin zorluğunu karakterize eden faktörün ana etkisinin değişmesi olarak tanımlanabilir. Bir önceki paragrafta bahsedilen üç faktörün etkileşimi için iki faktörün (görevin zorluğu ve öğrencinin karakteri) etkileşiminin etki altında değiştiğini söyleyebiliriz. cinsiyetCinsiyet. Dört faktörün etkileşimi incelenirse, üç faktörün etkileşiminin dördüncü faktörün etkisi altında değiştiğini söyleyebiliriz. Dördüncü faktörün farklı düzeylerinde farklı türde etkileşimler vardır. Pek çok alanda beş veya daha fazla faktörün etkileşiminin olağandışı olmadığı ortaya çıktı.

Karmaşık planlar

Gruplar arası ve grup içi tasarımlar (tekrarlanan ölçüm tasarımları)

İki farklı grubu karşılaştırırken genellikle kullanılır T- bağımsız örnekler için kriter (modülden Temel istatistikler ve tablolar). İki değişken aynı nesne kümesinde (gözlemler) karşılaştırıldığında, T-bağımlı örnekler için kriter. Varyans analizi için örneklemlerin bağımlı olup olmadığı da önemlidir. Aynı değişkenlerin tekrarlanan ölçümleri varsa (ile farklı koşullar veya farklı zamanlarda) aynı nesneler için, sonra varlığından bahsediyorlar tekrarlanan ölçüm faktörü(olarak da adlandırılır grup içi faktör, Grup içi kareler toplamı, önemini değerlendirmek için hesaplandığından). Farklı nesne grupları karşılaştırıldığında (örneğin, erkekler ve kadınlar, üç bakteri türü vb.), gruplar arasındaki fark açıklanır. Gruplararası faktör. Tanımlanan iki faktör türü için anlamlılık kriterlerini hesaplama yöntemleri farklıdır ancak bunların genel mantığı ve yorumları aynıdır.

Grup içi ve grup içi planlar.Çoğu durumda deney, hem denekler arası faktörün hem de tekrarlanan ölçüm faktörünün tasarıma dahil edilmesini gerektirir. Örneğin kız ve erkek öğrencilerin matematik becerileri ölçülür (burada zemin -Cinsiyet-gruplararası faktör) yarıyılın başında ve sonunda. Her öğrencinin becerilerinin iki ölçümü, grup içi bir faktör (tekrarlanan ölçüm faktörü) oluşturur. Konular arası ve tekrarlanan ölçüm faktörleri için ana etkilerin ve etkileşimlerin yorumlanması tutarlıdır ve her iki faktör türü de açıkça birbirleriyle etkileşime girebilir (örneğin, kadınlar bir dönem boyunca beceriler kazanırken erkekler bunları kaybeder).

Tamamlanmamış (yuvalanmış) planlar

Çoğu durumda etkileşim etkisi ihmal edilebilir. Bu durum ya popülasyonda herhangi bir etkileşim etkisinin olmadığı bilindiğinde ya da tam bir etkileşim etkisi uygulandığında meydana gelir. faktöriyel planlamak imkansızdır. Örneğin dört yakıt katkı maddesinin yakıt tüketimine etkisi araştırılmaktadır. Dört araba ve dört sürücü seçilir. Tam dolu faktöriyel deney, her kombinasyonun (katkı maddesi, sürücü, araba) en az bir kez görünmesini gerektirir. Bu, en az 4 x 4 x 4 = 64 grup test gerektirir ve bu da çok zaman alıcıdır. Ayrıca sürücü ile yakıt katkısı arasında herhangi bir etkileşimin olması pek olası değildir. Bunu dikkate alarak planı kullanabilirsiniz. Latin kareleri, yalnızca 16 test grubu içeren (dört katkı maddesi A, B, C ve D harfleriyle gösterilmiştir):

Latin kareleri deneysel tasarımla ilgili kitapların çoğunda anlatılmıştır (örneğin, Hays, 1988; Lindman, 1974; Milliken ve Johnson, 1984; Winer, 1962) ve burada ayrıntılı olarak tartışılmayacaktır. Latin karelerinin OlumsuzNtam dolu faktör düzeylerinin tüm kombinasyonlarının dahil edilmediği tasarımlar. Örneğin, 1. sürücü, 1. arabayı yalnızca A katkısıyla kullanıyor, 3. sürücü, 1. arabayı yalnızca C katkısıyla kullanıyor. Faktör seviyeleri katkı maddeleri ( A, B, C ve D) tablo hücrelerinde yuvalanmıştır otomobil X sürücü - yuvalardaki yumurtalar gibi. Bu anımsatıcı doğayı anlamak için faydalıdır iç içe veya iç içe planlar. Modül Varyans analizi sağlar basit yollar bu tür planların analizi.

Kovaryans Analizi

ana fikir

Bölümde Anahtar Fikirler Faktör kontrolü fikri ve ilave faktörlerin dahil edilmesinin karesel hataların toplamını nasıl azalttığı ve tasarımın istatistiksel gücünü nasıl arttırdığı kısaca tartışıldı. Bütün bunlar sürekli bir değer kümesine sahip değişkenlere genişletilebilir. Bu tür sürekli değişkenler bir tasarımda faktör olarak yer aldığında bunlara denir. ortak değişkenler.

Sabit ortak değişkenler

İki farklı ders kitabı kullanılarak eğitim verilen iki grup öğrencinin matematik becerilerini karşılaştırdığımızı varsayalım. Ayrıca her öğrenci için zeka bölümü (IQ) verilerinin mevcut olduğunu varsayalım. IQ'nun matematik becerileriyle ilgili olduğunu varsayabilir ve bu bilgiyi kullanabilirsiniz. Her iki öğrenci grubu için IQ ile matematik becerileri arasındaki korelasyon katsayısı hesaplanabilir. Bu korelasyon katsayısını kullanarak, IQ'nun etkisiyle açıklanan gruplardaki varyans oranını ve açıklanamayan varyans oranını izole etmek mümkündür (ayrıca bkz. İstatistiğin temel kavramları(Bölüm 8) ve Temel istatistikler ve tablolar(bölüm 9)). Varyansın geri kalan kısmı analizde hata varyansı olarak kullanılır. IQ ile matematik becerileri arasında bir korelasyon varsa hata varyansı önemli ölçüde azaltılabilir SS/(N-1) .

Ortak değişkenlerin etkisiF- kriter. F- kriter, gruplardaki ortalama değerlerdeki farkın istatistiksel önemini değerlendirir ve gruplar arası varyansın oranı hesaplanır ( HANIMetki) hata varyansına ( HANIMhata) . Eğer HANIMhataörneğin IQ faktörü dikkate alındığında değer azalır F artışlar.

Çok sayıda ortak değişken. Yukarıda tek bir ortak değişken (IQ) için kullanılan mantık, kolaylıkla birden fazla ortak değişkene genişletilebilir. Örneğin, IQ'ya ek olarak motivasyon, mekansal düşünme vb. ölçümlerini de dahil edebilirsiniz. Alışılmış korelasyon katsayısı yerine çoklu korelasyon katsayısı kullanılır.

Değer ne zamanF -kriterler azalır. Bazen ortak değişkenlerin deneysel bir tasarıma dahil edilmesi, deneysel tasarımın önemini azaltır. F-kriter . Bu genellikle ortak değişkenlerin yalnızca bağımlı değişkenle (örneğin matematik becerileri) değil aynı zamanda faktörlerle de (örneğin farklı ders kitapları) ilişkili olduğunu gösterir. IQ'nun, neredeyse bir yıl boyunca iki grup öğrenciye iki farklı ders kitabı kullanarak ders verdikten sonra dönem sonunda ölçüldüğünü varsayalım. Öğrenciler gruplara rastgele atanmasına rağmen, ders kitabı farklılıkları o kadar büyük olabilir ki hem IQ hem de matematik becerileri gruplar arasında büyük farklılıklar gösterebilir. Bu durumda, ortak değişkenler yalnızca hata varyansını değil aynı zamanda gruplar arası varyansı da azaltır. Başka bir deyişle, gruplar arasındaki IQ farklılıkları kontrol edildikten sonra matematik becerilerindeki farklılıklar artık anlamlı değildir. Farklı söyleyebilirsin. IQ'nun etkisi "dışlandıktan" sonra, ders kitabının matematik becerilerinin gelişimi üzerindeki etkisi istemeden de dışlanır.

Ortalamalar düzeltildi. Bir ortak değişken denekler arası faktörü etkilediğinde, hesaplama yapılmalıdır. düzeltilmiş araçlar yani tüm ortak değişken tahminleri çıkarıldıktan sonra elde edilen ortalamalar.

Ortak değişkenler ve faktörler arasındaki etkileşimler. Faktörler arasındaki etkileşimler incelendiği gibi, ortak değişkenler arasındaki ve faktör grupları arasındaki etkileşimler de incelenebilir. Ders kitaplarından birinin özellikle akıllı öğrenciler için uygun olduğunu varsayalım. İkinci ders kitabı zeki öğrenciler için sıkıcıdır ve aynı ders kitabı daha az zeki öğrenciler için zordur. Sonuç olarak, birinci grupta IQ ile öğrenme çıktısı arasında pozitif bir korelasyon (daha zeki öğrenciler, daha iyi sonuçlar) varken, ikinci grupta sıfır veya hafif negatif korelasyon (öğrenci ne kadar akıllıysa matematik becerileri kazanma olasılığı o kadar az) vardır. ikinci ders kitabından). Bazı çalışmalar bu durumu kovaryans analizinin varsayımlarının ihlaline örnek olarak ele almaktadır. Bununla birlikte, ANOVA modülü kovaryans analizinin en yaygın yöntemlerini kullandığından, özellikle faktörler ve ortak değişkenler arasındaki etkileşimin istatistiksel önemini değerlendirmek mümkündür.

Değişken ortak değişkenler

Ders kitaplarında sabit ortak değişkenler oldukça sık tartışılırken, değişken ortak değişkenlerden çok daha az bahsedilmektedir. Tipik olarak, tekrarlanan ölçümlerle deneyler yürütürken, aynı niceliklerin farklı zaman noktalarındaki ölçümlerindeki farklılıklarla ilgileniriz. Yani biz bu farklılıkların önemiyle ilgileniyoruz. Ortak değişkenler bağımlı değişkenlerin ölçümleriyle eş zamanlı olarak ölçülürse, ortak değişken ile bağımlı değişken arasındaki korelasyon hesaplanabilir.

Örneğin, matematiğe ilgi ve matematik becerileri dönem başında ve sonunda araştırılabilir. Matematiğe olan ilgideki değişikliklerin matematik becerilerindeki değişikliklerle ilişkili olup olmadığını test etmek ilginç olurdu.

Modül Varyans analizi V İSTATİSTİK Mümkün olan yerlerde tasarımlardaki ortak değişkenlerdeki değişikliklerin istatistiksel önemini otomatik olarak değerlendirir.

Çok değişkenli tasarımlar: çok değişkenli varyans ve kovaryans analizi

Gruplararası planlar

Daha önce tartışılan örneklerin tümü yalnızca bir bağımlı değişken içeriyordu. Aynı anda birden fazla bağımlı değişken olduğunda hesaplamaların yalnızca karmaşıklığı artar ancak içeriği ve temel ilkeleri değişmez.

Örneğin iki farklı ders kitabı üzerinde bir çalışma yapılıyor. Aynı zamanda öğrencilerin fizik ve matematik çalışmalarındaki başarıları da araştırılır. Bu durumda iki bağımlı değişken vardır ve iki farklı ders kitabının bunları aynı anda nasıl etkilediğini bulmanız gerekir. Bunu yapmak için çok değişkenli varyans analizini (MANOVA) kullanabilirsiniz. Tek boyutlu olmak yerine F kriter, çok boyutlu kullanılır F hata kovaryans matrisi ile gruplar arası kovaryans matrisinin karşılaştırılmasına dayanan test (Wilks' l testi).

Bağımlı değişkenler birbirleriyle ilişkili ise anlamlılık kriteri hesaplanırken bu korelasyonun dikkate alınması gerekir. Açıkçası, aynı ölçüm iki kez tekrarlanırsa yeni bir şey elde edilemez. Eğer onunla ilişkilendirilen bir ölçüm mevcut bir ölçüme eklenirse, bazı yeni bilgi ancak yeni değişken, değişkenler arasındaki kovaryansa yansıyan gereksiz bilgiler içerir.

Sonuçların yorumlanması. Genel çok değişkenli test anlamlıysa, buna karşılık gelen etkinin (örneğin ders kitabı türü) anlamlı olduğu sonucuna varabiliriz. Ancak aşağıdaki sorular ortaya çıkıyor. Ders kitabı türü yalnızca matematik becerilerindeki, yalnızca fiziksel becerilerdeki veya her iki becerideki gelişmeleri etkiler mi? Aslında anlamlı bir çok değişkenli test elde edildikten sonra, bireysel ana etki veya etkileşim için tek değişkenli bir test incelenir. F kriter. Bir başka deyişle çok değişkenli testin anlamlılığına katkı sağlayan bağımlı değişkenler ayrı ayrı incelenmektedir.

Tekrarlanan Ölçü Tasarımları

Öğrencilerin matematik ve fizik becerileri dönem başında ve sonunda ölçülüyorsa bunlar tekrarlanan ölçümlerdir. Bu tür planlarda önem kriterinin incelenmesi mantıksal gelişim tek boyutlu durum. Çok değişkenli varyans analizi tekniklerinin, ikiden fazla seviyeye sahip tek değişkenli tekrarlanan ölçüm faktörlerinin önemini incelemek için yaygın olarak kullanıldığına dikkat edin. İlgili uygulamalar bu bölümün ilerleyen kısımlarında ele alınacaktır.

Değişken değerlerin toplamı ve çok değişkenli varyans analizi

Tek değişkenli ve çok değişkenli varyans analizinin deneyimli kullanıcıları bile, çok değişkenli varyans analizini örneğin üç değişkene uygularken ve tek değişkenli varyans analizini bu üç değişkenin toplamına uygularken, genellikle farklı sonuçlar elde etmekte zorlanırlar. tek değişkendi.

Fikir toplam Değişkenler, her değişkenin üzerinde çalışılan bazı gerçek değişkenlerin yanı sıra rastgele bir ölçüm hatası içermesidir. Bu nedenle değişkenlerin değerlerinin ortalaması alınırken tüm ölçümler için ölçüm hatası 0'a yakın olacak ve ortalama değerler daha güvenilir olacaktır. Aslında bu durumda değişkenlerin toplamına ANOVA uygulamak mantıklıdır ve güçlü yöntem. Ancak bağımlı değişkenler doğası gereği çok boyutlu ise değişkenlerin değerlerinin toplanması uygun değildir.

Örneğin bağımlı değişkenler dört göstergeden oluşsun toplumdaki başarı. Her gösterge, insan faaliyetinin tamamen bağımsız bir yönünü karakterize eder (örneğin, mesleki başarı, iş dünyasında başarı, aile refahı vb.). Bu değişkenleri eklemek elma ve portakal eklemek gibidir. Bu değişkenlerin toplamı uygun bir tek boyutlu ölçüm olmayacaktır. Bu nedenle bu tür verilerin çok boyutlu göstergeler olarak ele alınması gerekmektedir. çok değişkenli varyans analizi.

Kontrast analizi ve post hoc testler

Neden ayrı ortalama kümeleri karşılaştırılıyor?

Tipik olarak deneysel verilere ilişkin hipotezler, yalnızca ana etkiler veya etkileşimler açısından formüle edilmez. Bir örnek şu hipotez olabilir: Belirli bir ders kitabı yalnızca erkek öğrencilerin matematik becerilerini geliştirirken, başka bir ders kitabı her iki cinsiyet için de yaklaşık olarak eşit derecede etkilidir, ancak erkekler için hala daha az etkilidir. Ders kitabı etkililiğinin öğrencinin cinsiyetiyle etkileşim içinde olduğu öngörülebilir. Ancak bu tahmin de geçerli doğa etkileşimler. Bir kitabı kullanan öğrenciler için cinsiyetler arasında anlamlı bir fark olması beklenirken, diğer kitabı kullanan öğrenciler için cinsiyete göre neredeyse bağımsız sonuçlar beklenmektedir. Bu tür hipotezler genellikle kontrast analizi kullanılarak incelenir.

Kontrastların Analizi

Kısacası kontrast analizi, karmaşık etkilerin belirli doğrusal kombinasyonlarının istatistiksel öneminin değerlendirilmesine olanak tanır. Kontrast analizi, herhangi bir karmaşık ANOVA planının ana ve zorunlu unsurudur. Modül Varyans analizi Her türlü ortalama karşılaştırmasını izole etmenize ve analiz etmenize olanak tanıyan oldukça çeşitli kontrast analizi yeteneklerine sahiptir.

Bir posteriori karşılaştırmalar

Bazen bir deneyin işlenmesi sonucunda beklenmedik bir etki keşfedilir. Çoğu durumda yaratıcı bir araştırmacı herhangi bir sonucu açıklayabilecek olsa da, bu daha fazla analize ve tahmine yönelik tahminlere izin vermez. Bu sorun, bunlardan biri a posteriori kriterler yani kullanılmayan kriterler Önsel hipotezler. Örneklemek için aşağıdaki deneyi düşünün. İçinde 1'den 10'a kadar sayıların yer aldığı 100 kart olduğunu varsayalım. Tüm bu kartları bir başlığa koyarak 5 kartı 20 kez rastgele seçiyoruz ve her örnek için ortalama değeri (kartların üzerinde yazan sayıların ortalaması) hesaplıyoruz. Ortalamaları önemli ölçüde farklı olan iki örneğin olmasını bekleyebilir misiniz? Bu çok makul! Maksimum ve minimum ortalamaya sahip iki örnek seçerek, örneğin ilk iki örneğin ortalamalarındaki farktan çok farklı bir ortalama farkı elde edebilirsiniz. Bu fark örneğin kontrast analizi kullanılarak araştırılabilir. Ayrıntılara girmeden, birkaç sözde var. a posteriori tam olarak ilk senaryoya dayanan kriterler (20 örnekten ekstrem ortalamaların alınması), yani bu kriterler tasarımdaki tüm ortalamaların karşılaştırılması için en farklı araçların seçilmesine dayanmaktadır. Bu kriterler yapay bir etkinin tamamen tesadüfen elde edilmemesini sağlamak için kullanılır; örneğin ortalamalar arasında anlamlı bir fark olmadığında anlamlı bir farkın tespit edilmesi için. Modül Varyans analizi Bu tür kriterlerin geniş bir yelpazesini sunar. Birden fazla grubun yer aldığı bir deneyde beklenmeyen sonuçlarla karşılaşıldığında, a posteriori Elde edilen sonuçların istatistiksel anlamlılığının incelenmesine yönelik prosedürler.

I, II, III ve IV tipi karelerin toplamı

Çok değişkenli regresyon ve varyans analizi

Çok değişkenli regresyon yöntemi ile varyans analizi (varyans analizi) arasında yakın bir ilişki vardır. Her iki yöntemde de doğrusal bir model çalışılır. Kısacası hemen hemen tüm deneysel tasarımlar çok değişkenli regresyon kullanılarak incelenebilir. Aşağıdaki basit gruplararası 2 x 2 tasarımını düşünün.

D.V. A B AxB
3 1 1 1
4 1 1 1
4 1 -1 -1
5 1 -1 -1
6 -1 1 -1
6 -1 1 -1
3 -1 -1 1
2 -1 -1 1

A ve B sütunları, A ve B faktörlerinin seviyelerini karakterize eden kodları içerir; AxB sütunu, A ve B iki sütununun çarpımını içerir. Bu verileri çok değişkenli regresyon kullanarak analiz edebiliriz. Değişken D.V. bağımlı değişken olarak tanımlanan değişkenler Aönce AxB bağımsız değişkenler olarak. Regresyon katsayılarının anlamlılık çalışması, faktörlerin ana etkilerinin anlamlılığının varyans analizindeki hesaplamalarla örtüşecektir. A Ve B ve etkileşim etkisi AxB.

Dengesiz ve dengeli planlar

Yukarıda gösterilen veriler gibi tüm değişkenler için korelasyon matrisini hesaplarken, faktörlerin ana etkilerinin olduğunu fark edeceksiniz. A Ve B ve etkileşim etkisi AxB ilişkisiz. Etkilerin bu özelliğine diklik de denir. Efekt diyorlar A Ve B - dikey veya bağımsız birbirinden. Yukarıdaki örnekte olduğu gibi bir plandaki tüm etkiler birbirine dik ise, o zaman plan denir. dengeli.

Dengeli planlar “ iyi mülk" Bu tür planları analiz etmek için yapılan hesaplamalar çok basittir. Tüm hesaplamalar, etkiler ve bağımlı değişkenler arasındaki korelasyonun hesaplanmasına dayanır. Etkiler dik olduğundan, kısmi korelasyonlar (tam olarak olduğu gibi) çok boyutlu regresyonlar) hesaplanmaz. Ancak gerçek hayatta planlar her zaman dengeli değildir.

Hücrelerdeki eşit olmayan sayıda gözlem içeren gerçek verileri ele alalım.

Faktör A Faktör B
B1 B2
A1 3 4, 5
A2 6, 6, 7 2

Bu verileri yukarıdaki gibi kodlarsak ve tüm değişkenler için bir korelasyon matrisi hesaplarsak tasarım faktörlerinin birbiriyle ilişkili olduğunu buluruz. Bir plandaki faktörler artık dik değildir ve bu tür planlara plan denir. dengesiz. Söz konusu örnekte, faktörler arasındaki korelasyonun tamamen veri matrisinin sütunlarındaki 1 ve -1 frekanslarındaki farktan kaynaklandığına dikkat edin. Başka bir deyişle, eşit olmayan hücre hacimlerine (daha doğrusu orantısız hacimlere) sahip deney tasarımları dengesiz olacak, bu da ana etkilerin ve etkileşimlerin birbirine karışacağı anlamına geliyor. Bu durumda etkilerin istatistiksel anlamlılığını hesaplamak için tam çok değişkenli regresyonun hesaplanması gerekir. Burada birkaç strateji var.

I, II, III ve IV tipi karelerin toplamı

Karelerin toplamı türüBENVeIII. Çok değişkenli bir modelde her faktörün önemini incelemek için, diğer tüm faktörlerin modelde zaten hesaba katılması koşuluyla, her faktörün kısmi korelasyonu hesaplanabilir. Ayrıca, modele önceden girilmiş olan tüm faktörleri yakalayıp diğer tüm faktörleri göz ardı ederek, faktörleri adım adım modele girebilirsiniz. Genel olarak aradaki fark bu tip III Ve tipBEN kareler toplamı (bu terminoloji SAS'ta tanıtıldı, örneğin bkz. SAS, 1982; ayrıntılı tartışma aynı zamanda Searle, 1987, s. 461; Woodward, Bonett ve Brecht, 1990, s. 216 veya Milliken'de de bulunabilir) ve Johnson, 1984, s.138).

Karelerin toplamı türüII. Bir sonraki “ara” model oluşturma stratejisi aşağıdakilerden oluşur: tek bir ana etkinin önemi incelenirken tüm ana etkilerin kontrol edilmesi; bireysel bir ikili etkileşimin önemini incelerken tüm ana etkileri ve tüm ikili etkileşimleri kontrol etmede; tüm ikili etkileşimlerin ve üç faktörün tüm etkileşimlerinin tüm ana etkilerinin kontrol edilmesinde; üç faktörün bireysel etkileşimini incelerken vb. Bu şekilde hesaplanan etkilerin karelerinin toplamına denir. tipII karelerin toplamı. Bu yüzden, tipII Aynı ve daha düşük düzeydeki tüm etkiler için karelerin toplamı kontrolleri, tüm yüksek dereceli efektleri göz ardı eder.

Karelerin toplamı türüIV. Son olarak, eksik hücreleri olan bazı özel planlar (tamamlanmamış planlar) için sözde hesaplamak mümkündür. tip IV karelerin toplamı. Bu yöntem daha sonra tamamlanmamış tasarımlarla (eksik hücreli tasarımlar) bağlantılı olarak tartışılacaktır.

Tip I, II ve III'ün kareler toplamı hipotezinin yorumlanması

Karelerin toplamı tipIII yorumlaması en kolayı. Karelerin toplamının olduğunu hatırlayın tipIII Diğer tüm etkileri kontrol ettikten sonra etkileri inceleyin. Örneğin, istatistiksel olarak anlamlı bir sonuç bulduktan sonra tipIII faktör etkisi A modülde Varyans analizi faktörünün tek anlamlı etkisinin olduğunu söyleyebiliriz. A diğer tüm etkileri (faktörleri) ortaya koyduktan sonra bu etkiyi buna göre yorumlayın. Muhtemelen tüm ANOVA uygulamalarının %99'unda bu, araştırmacının ilgilendiği test türüdür. Bu tür kareler toplamı genellikle modülo olarak hesaplanır. Varyans analizi seçeneğin seçili olup olmadığına bakılmaksızın varsayılan olarak Regresyon yaklaşımı ya da değil (modülde benimsenen standart yaklaşımlar Varyans analizi Aşağıda tartışılmıştır).

Kareler toplamları kullanılarak elde edilen önemli etkiler tip veya tipII Karelerin toplamını yorumlamak o kadar kolay değil. Bunlar en iyi şekilde adım adım çok değişkenli regresyon bağlamında yorumlanır. Eğer kareler toplamını kullanırken tipBEN B faktörünün ana etkisi anlamlıydı (A faktörü modele dahil edildikten sonra ancak A ile B arasındaki etkileşim eklenmeden önce), herhangi bir etkileşim olmaması koşuluyla B faktörünün önemli bir ana etkisinin olduğu sonucuna varabiliriz. A ve B faktörleri arasında. (Kriter kullanılıyorsa tipIII, B faktörünün de anlamlı olduğu ortaya çıkarsa, diğer tüm faktörleri ve bunların etkileşimlerini modele dahil ettikten sonra, B faktörünün önemli bir ana etkisinin olduğu sonucuna varabiliriz).

Marjinal ortalamalar hipotezi açısından tipBEN Ve tipII genellikle basit bir yorumu yoktur. Bu durumlarda etkilerin öneminin sadece marjinal araçlara bakarak yorumlanamayacağı söylenmektedir. Oldukça sundu P ortalamalar, ortalamaları ve örneklem büyüklüğünü birleştiren karmaşık bir hipotezle ilgilidir. Örneğin, tipII Daha önce tartışılan 2 x 2 tasarımın basit örneğinde A faktörüne ilişkin hipotezler şöyle olacaktır (bkz. Woodward, Bonett ve Brecht, 1990, s. 219):

nij- hücredeki gözlem sayısı

uij- hücredeki ortalama değer

N. J- marjinal ortalama

Çok fazla ayrıntıya girmeden (daha fazla ayrıntı için bkz. Milliken ve Johnson, 1984, Bölüm 10), bunların basit hipotezler olmadığı ve çoğu durumda hiçbirinin araştırmacının ilgisini çekmediği açıktır. Ancak hipotezlerin ortaya çıktığı durumlar vardır. tipBEN ilginç olabilir.

Modüldeki varsayılan hesaplamalı yaklaşım Varyans analizi

Seçenek işaretli değilse varsayılan Regresyon yaklaşımı, modül Varyans analizi kullanır hücre ortalama modeli. Bu modelin özelliği, hücre ortalamalarının doğrusal kombinasyonları için farklı etkiler için kareler toplamlarının hesaplanmasıdır. Tam faktöriyel bir deneyde bu, daha önce tartışılan karelerin toplamlarıyla aynı olan karelerin toplamlarıyla sonuçlanır. tip III. Ancak seçenekte Planlanan karşılaştırmalar(pencerede ANOVA sonuçları), kullanıcı ağırlıklı veya ağırlıksız hücre araçlarının herhangi bir doğrusal kombinasyonuna karşı bir hipotezi test edebilir. Böylece kullanıcı yalnızca hipotezleri test etmekle kalmaz tipIII ancak her türden hipotez (dahil) tipIV). Bu genel yaklaşım özellikle eksik hücreli (tamamlanmamış tasarımlar olarak adlandırılan) tasarımları incelerken faydalıdır.

Tam faktöriyel tasarımlar için bu yaklaşım, ağırlıklı marjinal ortalamaların analiz edilmesi istendiğinde de faydalıdır. Örneğin, daha önce ele alınan basit 2 x 2 tasarımında, ağırlıklı (faktör düzeylerine göre) karşılaştırma yapmamız gerektiğini varsayalım. B) faktör A için marjinal ortalama. Bu, gözlemlerin hücreler arasındaki dağılımı deneyci tarafından hazırlanmadığı, ancak rastgele oluşturulduğu ve bu rastgeleliğin, faktör B düzeyleri boyunca gözlem sayısının dağılımına yansıdığı durumlarda faydalıdır. agrega.

Örneğin bir faktör var; dul kadınların yaşı. Olası yanıtlayıcı örneklemi iki gruba ayrılmıştır: 40 yaş altı ve 40 yaş üstü (B faktörü). Plandaki ikinci faktör (Faktör A), dul kadınların bazı kuruluşlardan sosyal destek alıp almadığıydı (bazı dul kadınlar rastgele seçilmişti, diğerleri ise kontrol grubu olarak görev yapıyordu). Bu durumda, örneklemdeki dul kadınların yaşa göre dağılımı, nüfustaki dul kadınların yaşa göre gerçek dağılımını yansıtmaktadır. Grup etkililiği değerlendirmesi sosyal Destek dul kadınlar her yaştan iki yaş grubu için ağırlıklı ortalamaya karşılık gelecektir (ağırlıklar gruptaki gözlem sayısına karşılık gelir).

Planlanan karşılaştırmalar

Girilen kontrast katsayılarının toplamının mutlaka 0'a (sıfır) eşit olmayabileceğini unutmayın. Bunun yerine program, ilgili hipotezlerin genel ortalamayla karıştırılmamasını sağlamak için otomatik olarak ayarlamalar yapacaktır.

Bunu göstermek için daha önce tartışılan basit 2 x 2 planına geri dönelim. Bu dengesiz tasarımın hücrelerindeki gözlem sayısının -1, 2, 3 ve 1 olduğunu hatırlayın. A faktörünün ağırlıklı marjinal ortalamalarını (B faktörünün seviyelerinin frekansıyla ağırlıklandırılmış) karşılaştırmak istediğimizi varsayalım. Kontrast katsayılarını girebilirsiniz:

Bu katsayıların toplamının 0'a ulaşmadığını unutmayın. Program, katsayıları, toplamları 0 olacak şekilde ayarlayacak ve göreceli değerleri korunacaktır, yani:

1/3 2/3 -3/4 -1/4

Bu kontrastlar Faktör A için ağırlıklı ortalamaları karşılaştıracaktır.

Temel ortalamaya ilişkin hipotezler. Ağırlıklandırılmamış temel ortalamanın 0 olduğu hipotezi, katsayılar kullanılarak araştırılabilir:

Ağırlıklı temel ortalamanın 0 olduğu hipotezi aşağıdakiler kullanılarak test edilir:

Program hiçbir durumda kontrast oranlarını ayarlamaz.

Eksik hücreli planların analizi (eksik planlar)

Boş hücreler (gözlemi olmayan hücrelerin işlem kombinasyonları) içeren faktöriyel tasarımlara eksik denir. Bu tür tasarımlarda bazı faktörler genellikle dik değildir ve bazı etkileşimler hesaplanamaz. Hiç mevcut değil en iyi yöntem Bu tür planların analizi.

Regresyon yaklaşımı

Çok değişkenli regresyon kullanarak ANOVA tasarımlarını analiz etmeye dayanan bazı eski programlarda, tamamlanmamış tasarımlardaki faktörler her zamanki gibi varsayılan olarak belirtilir (sanki tasarım tamamlanmış gibi). Daha sonra çok boyutlu regresyon analizi bu kukla kodlanmış faktörler için. Ne yazık ki, bu yöntem, yorumlanması imkansız olmasa da çok zor olan sonuçlar üretmektedir çünkü her bir etkinin, ortalamaların doğrusal kombinasyonuna nasıl katkıda bulunduğu belirsizdir. Aşağıdaki basit örneği düşünün.

Faktör A Faktör B
B1 B2
A1 3 4, 5
A2 6, 6, 7 Kaçırıldı

Formun çok değişkenli regresyonunu yaparsak Bağımlı Değişken = Sabit + Faktör A + Faktör B o zaman A ve B faktörlerinin ortalamaların doğrusal kombinasyonları açısından önemi hakkındaki hipotez şuna benzer:

Faktör A: Hücre A1,B1 = Hücre A2,B1

Faktör B: Hücre A1,B1 = Hücre A1,B2

Bu dava basit. Daha karmaşık tasarımlarda aslında tam olarak neyin inceleneceğini belirlemek imkansızdır.

Hücre anlamına gelir, ANOVA yaklaşımı , Tip IV hipotezler

Literatürde önerilen ve tercih edilebilir görünen yaklaşım anlamlı (araştırma soruları açısından) çalışmalar yapmaktır. Önsel Planın hücrelerinde gözlemlenen araçlarla ilgili hipotezler. Bu yaklaşımın ayrıntılı tartışması Dodge (1985), Heiberger (1989), Milliken ve Johnson (1984), Searle (1987) veya Woodward, Bonett ve Brecht (1990)'de bulunabilir. Etkilerin bir kısmına ilişkin tahminleri inceleyen tamamlanmamış tasarımlarda ortalamaların doğrusal kombinasyonu hakkındaki hipotezlerle ilişkili kareler toplamlarına aynı zamanda kareler toplamları da denir. IV.

Tip hipotezlerinin otomatik oluşturulmasıIV. Çok değişkenli tasarımlar karmaşık eksik hücre modellerine sahip olduğunda, araştırması ana etkileri veya etkileşimleri incelemeye eşdeğer olan ortogonal (bağımsız) hipotezlerin tanımlanması arzu edilir. Bu tür karşılaştırmalar için uygun ağırlıkların üretilmesi amacıyla algoritmik (hesaplamalı) stratejiler (sözde ters tasarım matrisine dayalı) geliştirilmiştir. Ne yazık ki son hipotezler benzersiz bir şekilde tanımlanmamıştır. Elbette etkilerin belirlenme sırasına bağlıdırlar ve nadiren basit bir yoruma izin verirler. Bu nedenle, eksik hücrelerin doğasının dikkatlice incelenmesi ve ardından hipotezlerin formüle edilmesi önerilir. tipIV, çalışmanın amaçlarına en anlamlı şekilde karşılık gelenler. Daha sonra seçeneği kullanarak bu hipotezleri keşfedin Planlanan karşılaştırmalar pencerede sonuçlar. Bu durumda karşılaştırmaları belirtmenin en kolay yolu, tüm faktörler için bir kontrast vektörünün eklenmesini gerektirmektir. birlikte pencerede Planlanan karşılaştırmalar.İletişim kutusunu çağırdıktan sonra Planlanan karşılaştırmalar tüm gruplar gösterilecek mevcut plan ve kaçırılanlar işaretlenir.

Eksik hücreler ve spesifik etkinin test edilmesi

Eksik hücrelerin konumunun rastgele olmadığı, ancak diğer etkileri etkilemeden ana etkilerin basit analizine olanak tanıyan dikkatlice planlandığı çeşitli tasarım türleri vardır. Örneğin bir planda gerekli sayıda hücre mevcut olmadığında planlar sıklıkla kullanılır. Latin kareleriÇeşitli faktörlerin ana etkilerini çok sayıda düzeyle tahmin etmek. Örneğin, 4 x 4 x 4 x 4 faktöriyel tasarım 256 hücre gerektirir. Aynı zamanda kullanabilirsiniz Greko-Latin meydanı tasarımdaki yalnızca 16 hücreyle ana etkileri tahmin etmek (Bölüm Deney planlama, Cilt IV, bu tür planların ayrıntılı bir açıklamasını içerir). Ana etkilerin (ve bazı etkileşimlerin) basit doğrusal ortalama kombinasyonları kullanılarak tahmin edilebildiği tamamlanmamış tasarımlara denir. dengeli tamamlanmamış planlar.

Dengeli tasarımlarda, ana etkiler ve etkileşimler için kontrastlar (ağırlıklar) oluşturmanın standart (varsayılan) yöntemi, ilgili etkilerin karelerinin toplamlarının birbiriyle karıştırılmadığı bir varyans analizi tablosu üretecektir. Seçenek Spesifik etkiler pencere sonuçlar eksik plan hücrelerine sıfır yazarak eksik kontrastlar oluşturacaktır. Seçenek talep edildikten hemen sonra Spesifik etkiler Bazı hipotezleri inceleyen kullanıcı için gerçek ağırlıkların yer aldığı bir sonuç tablosu görünür. Dengeli bir tasarımda, karşılık gelen etkilerin karelerinin toplamlarının, yalnızca bu etkilerin diğer tüm ana etkilere ve etkileşimlere dik (bağımsız) olması durumunda hesaplanacağını unutmayın. Aksi takdirde seçeneği kullanmanız gerekir. Planlanan karşılaştırmalar Ortalamalar arasındaki anlamlı karşılaştırmaları araştırmak.

Eksik hücreler ve birleştirilmiş etkiler/hata terimleri

Eğer seçenek Regresyon yaklaşımı modül başlatma panelinde Varyans analizi seçili değilse, efektler için karelerin toplamı hesaplanırken hücre ortalama modeli kullanılacaktır (varsayılan ayar). Tasarım dengeli değilse, ortogonal olmayan efektleri birleştirirken (seçenek ile ilgili yukarıdaki tartışmaya bakın) Kaçırılan hücreler ve spesifik etki) dik olmayan (veya üst üste binen) bileşenlerden oluşan bir kareler toplamı elde edilebilir. Elde edilen sonuçlar genellikle yorumlanamaz. Bu nedenle karmaşık, tamamlanmamış deneysel tasarımları seçerken ve uygularken çok dikkatli olunmalıdır.

Farklı plan türlerinin ayrıntılı tartışmalarını içeren birçok kitap vardır. (Dodge, 1985; Heiberger, 1989; Lindman, 1974; Milliken ve Johnson, 1984; Searle, 1987; Woodward ve Bonett, 1990), ancak bu tür bilgiler bu ders kitabının kapsamı dışındadır. Ancak bu bölümde daha sonra bir analiz gösterilecektir. çeşitli türler planlar.

Varsayımlar ve varsayımları ihlal etmenin etkileri

Normal dağılım varsayımından sapma

Bağımlı değişkenin sayısal bir ölçekte ölçüldüğünü varsayalım. Ayrıca bağımlı değişkenin her grupta normal dağıldığını varsayalım. Varyans analizi bu varsayımı destekleyecek geniş bir grafik ve istatistik yelpazesi içerir.

Kesintinin etkileri. Hiç F test normallikten sapmalara karşı çok dayanıklıdır (ayrıntılı sonuçlar için bkz. Lindman, 1974). Basıklık 0'dan büyükse istatistiğin değeri Fçok küçük hale gelebilir. Sıfır hipotezi doğru olmasa da kabul edilir. Basıklık 0'dan küçük olduğunda durum tersine döner. Dağılım çarpıklığının genellikle üzerinde çok az etkisi vardır. Fİstatistik. Bir hücredeki gözlem sayısı yeterince büyükse normallikten sapma çok fazla önem taşımaz. Merkezi Limit Teoremi, buna göre, başlangıç ​​​​dağılımı ne olursa olsun, ortalama değerin dağılımı normale yakındır. Sürdürülebilirliğin ayrıntılı tartışması F istatistikler Box ve Anderson (1955) veya Lindman'da (1974) bulunabilir.

Varyansın tekdüzeliği

Varsayımlar. Farklı tasarım gruplarının varyanslarının aynı olduğu varsayılmaktadır. Bu varsayıma varsayım denir varyansın homojenliği. Bu bölümün başında hataların karelerinin toplamının hesaplanmasını anlatırken her grup içinde toplama işlemi yaptığımızı hatırlayın. İki gruptaki varyanslar birbirinden farklıysa, bu durumda bunların toplanması pek doğal değildir ve grup içi toplam varyansın tahminini sağlamaz (çünkü bu durumda hiçbir toplam varyans yoktur). Modül Varyans analizi -ANOVA/MANOVA büyük bir set içerir istatistiksel kriterler varyans varsayımlarının homojenliğinden sapmaların tespit edilmesi.

Kesintinin etkileri. Lindman (1974, s. 33) şunu gösteriyor: F varyansın homojenliği varsayımlarının ihlali açısından kriter oldukça kararlıdır ( heterojenlik varyans, ayrıca bkz. Box, 1954a, 1954b; Hsu, 1938).

Özel durum: ortalamaların ve varyansların korelasyonu.Öyle zamanlar vardır ki F istatistikler yapabilir yanıltmak. Bu, tasarım hücrelerinin araçları varyansla ilişkilendirildiğinde gerçekleşir. Modül Varyans analizi dağılım dağılım grafikleri oluşturmanıza olanak tanır veya standart sapma böyle bir korelasyonu tespit etmek için ortalamalara göre. Bu korelasyonun tehlikeli olmasının nedeni şudur. Planda 8 hücre olduğunu, bunların 7'sinin hemen hemen aynı ortalamaya sahip olduğunu ve bir hücrede ortalamanın diğerlerine göre çok daha yüksek olduğunu düşünelim. Daha sonra F test istatistiksel olarak anlamlı bir etki tespit edebilir. Ancak ortalama değeri büyük olan bir hücrede varyansın diğerlerinden önemli ölçüde daha büyük olduğunu varsayalım; hücrelerdeki ortalama değer ve varyans bağımlıdır (ortalama ne kadar yüksek olursa varyans da o kadar büyük olur). Bu durumda büyük bir ortalama güvenilmezdir çünkü verilerdeki büyük farklılıklardan kaynaklanabilir. Fakat F dayalı istatistikler Birleşik Hücreler içindeki varyans genel ortalamayı yakalayacaktır, ancak her bir hücre içindeki varyansa dayalı testler ortalamalardaki tüm farklılıkları anlamlı olarak dikkate almayacaktır.

Bu tür veriler (büyük ortalama ve büyük varyans) genellikle aykırı gözlemler olduğunda ortaya çıkar. Bir veya iki aykırı değer gözlemi ortalamayı büyük ölçüde kaydırır ve varyansı büyük ölçüde artırır.

Varyans ve Kovaryansın Homojenliği

Varsayımlar.Çok değişkenli bağımlı ölçümlere sahip çok değişkenli tasarımlar, daha önce açıklanan varyansın homojenliği varsayımını da uygular. Ancak çok değişkenli bağımlı değişkenler mevcut olduğundan bunların çapraz korelasyonlarının (kovaryanslarının) tasarımın tüm hücrelerinde aynı olması da gerekir. Modül Varyans analizi bu varsayımları test etmek için farklı yollar sunar.

Kesintinin etkileri. Çok boyutlu analog F- kriter - Wilks'in λ testi. Yukarıdaki varsayımların ihlali açısından Wilks λ testinin sağlamlığı hakkında pek fazla şey bilinmemektedir. Ancak modül sonuçlarının yorumlanmasından bu yana Varyans analizi Genellikle tek değişkenli etkilerin önemine dayanıldığından (genel kriterin önemi belirlendikten sonra), sağlamlık tartışması temel olarak tek değişkenli varyans analiziyle ilgilidir. Bu nedenle tek değişkenli etkilerin anlamlılığı dikkatle incelenmelidir.

Özel durum: kovaryans analizi. Ortak değişkenler tasarıma dahil edildiğinde özellikle ciddi varyans/kovaryans homojenliği ihlalleri meydana gelebilir. Özellikle, ortak değişkenler ile bağımlı ölçümler arasındaki korelasyon tasarımdaki hücreler arasında değişiklik gösteriyorsa, sonuçların yanlış yorumlanması ortaya çıkabilir. Kovaryans analizinin esasen, ortak değişken tarafından açıklanan varyans kısmını izole etmek için her hücrede bir regresyon analizi gerçekleştirdiğini unutmayın. Varyans/kovaryans varsayımının homojenliği bu regresyon analizinin şu şekilde yapıldığını göstermektedir: aşağıdaki sınırlama: Tüm regresyon denklemleri (eğimler) tüm hücreler için aynıdır. Bu beklenmiyorsa ortaya çıkabilir büyük hatalar. Modül Varyans analizi Bu varsayımı test etmek için çeşitli özel kriterleri vardır. Farklı hücrelere yönelik regresyon denklemlerinin yaklaşık olarak aynı olmasını sağlamak için bu kriterlerin kullanılması tavsiye edilir.

Küresellik ve karmaşık simetri: varyans analizinde tekrarlanan ölçümlere çok değişkenli bir yaklaşım kullanmanın nedenleri

İkiden fazla seviyeye sahip tekrarlanan ölçüm faktörlerini içeren tasarımlarda, tek değişkenli ANOVA'nın kullanımı ek varsayımlar gerektirir: bileşik simetri varsayımı ve küresellik varsayımı. Bu varsayımlar nadiren karşılanır (aşağıya bakınız). Bu nedenle, son yıllarda bu tür tasarımlarda çok değişkenli varyans analizi popülerlik kazanmıştır (her iki yaklaşım da modülde birleştirilmiştir). Varyans analizi).

Karmaşık simetri varsayımı Bileşik simetri varsayımı, farklı tekrarlanan ölçümler için varyansların (gruplar içinde paylaşılan) ve kovaryansların (gruplar içinde paylaşılan) homojen (aynı) olmasıdır. Bu, tekrarlanan ölçümlerin geçerli olması için tek değişkenli F testinin geçerli olması için yeterli bir durumdur (yani rapor edilen F değerleri ortalama olarak F dağılımıyla tutarlıdır). Ancak bu durumda bu şart aranmaz.

Küresellik varsayımı. Küresellik varsayımı F testinin geçerli olabilmesi için gerekli ve yeterli bir koşuldur. Gruplar içinde tüm gözlemlerin bağımsız ve eşit olarak dağılmış olması gerçeğinden oluşur. Bu varsayımların doğası ve bunları ihlal etmenin etkisi ANOVA ile ilgili kitaplarda genellikle iyi bir şekilde açıklanmaz; bunlar aşağıdaki paragraflarda ele alınacaktır. Ayrıca tek değişkenli yaklaşımın sonuçlarının çok değişkenli yaklaşımın sonuçlarından farklı olabileceği gösterilecek ve bunun ne anlama geldiği açıklanacaktır.

Hipotezlerin bağımsızlığı ihtiyacı. ANOVA'da verileri analiz etmenin genel yolu modeli uydurma. Verilere uyan modele göre bazı Önsel hipotezler, daha sonra bu hipotezleri test etmek için varyans bölünür (ana etkiler, etkileşimler için kriterler). Hesaplamalı bir bakış açısından bakıldığında, bu yaklaşım bir dizi karşıtlık (plan araçlarının bir dizi karşılaştırması) üretir. Ancak zıtlıklar birbirinden bağımsız değilse varyansların bölümlenmesi anlamsız hale gelir. Örneğin iki zıtlık varsa A Ve B aynıdır ve varyansın karşılık gelen kısmı çıkarılır, ardından aynı kısım iki kez çıkarılır. Örneğin iki hipotez tanımlamak aptalca ve anlamsızdır: "1. hücredeki ortalama, hücre 2'deki ortalamadan daha yüksektir" ve "hücre 1'deki ortalama, hücre 2'deki ortalamadan daha yüksektir." Bu nedenle hipotezlerin bağımsız veya dik olması gerekir.

Tekrarlanan ölçümlerde bağımsız hipotezler. Modülde uygulanan genel algoritma Varyans analizi, her efekt için bağımsız (dik) kontrastlar oluşturmaya çalışacaktır. Tekrarlanan ölçümler faktörü için bu zıtlıklar, konuyla ilgili birçok hipotez sağlar. farklılıklar Söz konusu faktörün seviyeleri arasında. Bununla birlikte, eğer bu farklılıklar gruplar içinde ilişkilendiriliyorsa, o zaman ortaya çıkan zıtlıklar artık bağımsız değildir. Örneğin, öğrencilerin bir yarıyılda üç kez ölçüldüğü öğretimde, 1. ve 2. ölçümler arasındaki değişimin, konuların 2. ve 3. ölçümleri arasındaki değişimle negatif ilişkili olması söz konusu olabilir. 1. ve 2. boyut arasında konunun büyük bir kısmına hakim olanlar, 2. ve 3. boyut arasında geçen sürede daha küçük bir kısma hakim olurlar. Aslında ANOVA'nın tekrarlanan ölçümler için kullanıldığı çoğu durumda, düzeyler arasındaki değişikliklerin denekler arasında ilişkili olduğu varsayılabilir. Ancak bu gerçekleştiğinde karmaşık simetri varsayımı ve küresellik varsayımı geçerli olmaz ve bağımsız kontrastlar hesaplanamaz.

İhlallerin etkisi ve bunları düzeltmenin yolları. Karmaşık simetri veya küresellik varsayımları karşılanmadığında ANOVA hatalı sonuçlar üretebilir. Çok değişkenli prosedürler yeterince geliştirilmeden önce, bu varsayımların ihlallerini telafi etmek için çeşitli varsayımlar önerildi. (Örneğin bkz. Greenhouse & Geisser, 1959 ve Huynh & Feldt, 1970). Bu yöntemler hala yaygın olarak kullanılmaktadır (bu nedenle modülde sunulmaktadırlar). Varyans analizi).

Tekrarlanan ölçümlere çok değişkenli varyans analizi yaklaşımı. Genel olarak karmaşık simetri ve küresellik sorunları, tekrarlanan ölçüm faktörlerinin (2'den fazla seviyeli) etkilerine ilişkin çalışmada yer alan zıtlık kümelerinin birbirinden bağımsız olmamasıyla ilgilidir. Ancak kullanıldıkları takdirde bağımsız olmalarına gerek yoktur. çok boyutlu eşzamanlı doğrulama kriteri İstatistiksel anlamlılık iki veya daha fazla tekrarlanan ölçüm faktörü kontrastları. Bu, çok değişkenli varyans analizi tekniklerinin, 2'den fazla seviyeye sahip tek değişkenli tekrarlanan ölçüm faktörlerinin önemini test etmek için giderek daha fazla kullanılmasının nedenidir. Bu yaklaşım genel olarak karmaşık simetri veya küresellik gerektirmediği için geniş çapta kabul görmektedir.

Çok değişkenli varyans analizi yaklaşımının kullanılamadığı durumlar.Çok değişkenli varyans analizi yaklaşımının uygulanamadığı örnekler (tasarımlar) vardır. Bunlar tipik olarak tasarımda az sayıda konunun olduğu ve tekrarlanan ölçümler faktöründe çok sayıda seviyenin olduğu durumlardır. Bu durumda çok değişkenli bir analiz yürütmek için çok az gözlem olabilir. Örneğin 12 konu varsa; P = 4 tekrarlanan ölçümler faktörü ve her faktörün k = 3 seviyeleri. Daha sonra 4 faktörün etkileşimi "tüketilecek" (k-1)P = 2 4 = 16 özgürlük derecesi. Ancak yalnızca 12 denek olduğundan bu örnekte çok değişkenli bir test gerçekleştirilemez. Modül Varyans analizi bağımsız olarak bu gözlemleri tespit edecek ve yalnızca tek boyutlu kriterleri hesaplayacaktır.

Tek değişkenli ve çok değişkenli sonuçlardaki farklılıklar. Bir çalışma çok sayıda tekrarlanan ölçüm içeriyorsa, tek değişkenli tekrarlanan ölçümler ANOVA yaklaşımının, çok değişkenli yaklaşımla elde edilenlerden çok farklı sonuçlar ürettiği durumlar olabilir. Bu, karşılık gelen tekrarlanan ölçümlerin seviyeleri arasındaki farkların denekler arasında ilişkili olduğu anlamına gelir. Bazen bu gerçek bağımsız olarak ilgi çekici olabilir.

Çok değişkenli varyans analizi ve yapısal eşitlik modellemesi

Son yıllarda, yapısal eşitlik modellemesi çok değişkenli varyans analizine alternatif olarak popüler hale gelmiştir (örneğin bakınız, Bagozzi ve Yi, 1989; Bagozzi, Yi ve Singh, 1991; Cole, Maxwell, Arvey ve Salas, 1993). . Bu yaklaşım, yalnızca farklı gruplardaki ortalamalara ilişkin değil aynı zamanda bağımlı değişkenlerin korelasyon matrislerine ilişkin hipotezlerin test edilmesine olanak tanır. Örneğin, varyansların ve kovaryansların homojenliği varsayımları gevşetilebilir ve her grup için modele hata varyansları ve kovaryanslar açıkça dahil edilebilir. Modül İSTATİSTİKYapısal Eşitlik Modellemesi (SEPATH) (bkz. Cilt III) böyle bir analize olanak sağlar.

Genel tanımlar

Varyans analizinin (ANOVA - Variasyon Analizi) amacı, farklı gruplardaki ortalamalar arasındaki farkın anlamlılığını, bu grupların varyanslarını karşılaştırarak test etmektir. Toplam varyansın birden fazla kaynağa bölünmesi (farklı tasarım etkilerine atfedilebilir), gruplar arası varyasyondan kaynaklanan varyansın, grup içi varyasyondan kaynaklanan varyansla karşılaştırılmasına olanak tanır.

Test edilen hipotez gruplar arasında fark olmadığıdır. Boş hipotez doğruysa, grup içi değişkenlikle ilişkili varyans tahmini, gruplar arası varyans tahminine yakın olmalıdır. Yanlışsa sapma anlamlıdır.

Genel olarak varyans analizi birkaç türe ayrılabilir:

  • tek boyutlu (bir bağımlı değişken) ve çok boyutlu (birkaç bağımlı değişken);

  • faktörler arasında olası etkileşim ile tek değişkenli (bir gruplandırma değişkeni) ve çok faktörlü (birkaç gruplandırma değişkeni);

  • basit ölçümlerle (bağımlı değişken yalnızca bir kez ölçülür) ve tekrarlanan ölçümlerle (bağımlı değişken birkaç kez ölçülür).

İÇİNDE İSTATİSTİK Bilinen tüm varyans analizi modelleri uygulanmaktadır.

İÇİNDE İSTATİSTİK varyans analizi bloktaki ANOVA modülü kullanılarak gerçekleştirilebilir İSTATİSTİK Tabanı (Analiz -> Varyans Analizi(DA)). Özel bir model türü oluşturmak için şunu kullanın: tam versiyon Modüller halinde sunulan varyans analizi Genel doğrusal modeller, Genelleştirilmiş doğrusal ve doğrusal olmayan modeller, Genel regresyon modelleri, Genel özel modeller en küçük kareler bloktan İleri Analiz Teknikleri (STATISTICA Gelişmiş Doğrusal/Doğrusal Olmayan Modeller).

başlangıca

Adım adım örnek İSTATİSTİK

ANOVA'nın gücünü şu şekilde göstereceğiz: İSTATİSTİK, adım adım model örneğine bakarak.

Kaynak veri dosyası, farklı gelir, eğitim, yaş ve cinsiyet düzeylerine sahip insanlardan oluşan bir popülasyonu tanımlamaktadır. Eğitim düzeyi, yaş ve cinsiyetin gelir düzeyini nasıl etkilediğini düşünelim.

Yaşa göre tüm insanlar dört gruba ayrıldı:

  • 30 yıla kadar;

  • 31 ila 40 yaş arası;

  • 41 ila 50 yaş arası;

  • 51 yaşından itibaren.

Eğitim seviyesine göre 5 gruba ayrıldı:

  • tamamlanmamış ikincil;

  • ortalama;

  • orta mesleki;

  • tamamlanmamış yüksek öğrenim;

  • daha yüksek.

Bunlar model verileri olduğundan, elde edilen sonuçlar doğası gereği çoğunlukla niteliksel olacak ve analizin gerçekleştirilme yöntemini gösterecektir.

Adım 1: Bir Analizin Seçilmesi

Menüden varyans analizini seçelim: Analiz -> İleri Analiz Yöntemleri -> Genel Doğrusal Modeller.

Pirinç. 1. İSTATİSTİK açılır menüsünden ANOVA'nın seçilmesi

Daha sonra, çeşitli analiz türlerinin sunulduğu bir pencere açılacaktır. Seçmek Analiz türüFaktöriyel Varyans Analizi.


Pirinç. 2. Analiz türünün seçilmesi

Bu pencerede ayrıca nasıl model oluşturulacağını da seçebilirsiniz: iletişim modu veya analiz sihirbazını kullanma. Diyalog modunu seçelim.

Adım 2: Değişkenleri Ayarlama

Açık veri dosyasından analiz için değişkenleri seçin, düğmeye tıklayın Değişkenler, şunları alıyorsunuz:

Gelir- bağımlı değişken,

Eğitim düzeyi, Zemin Ve Yaş– kategorik faktörler (tahmin ediciler).

dikkat et ki Faktör kodları bu basit örnekte bunu belirtmenize gerek yok. Düğmeye bastığınızda TAMAM, İSTATİSTİK bunları otomatik olarak ayarlayacaktır.


Pirinç. 3. Değişkenleri ayarlama

3. Adım: Seçenekleri Değiştirme

Haydi sekmeye gidelim Seçenekler pencerede GLM Faktöriyel VAR.


Pirinç. 4. Seçenekler Sekmesi

Bu diyalogda şunları yapabilirsiniz:

  • rastgele faktörleri seçin;

  • model parametrelendirmesinin türünü ayarlayın;

  • kareler toplamlarının türünü (SS) belirtin, 6 farklı kareler toplamı (SS) vardır;

  • çapraz kontrolü etkinleştirin.

Tüm varsayılan ayarları bırakalım (bu çoğu durumda yeterlidir) ve düğmesine basalım TAMAM.

4. Adım. Sonuçları analiz edin - tüm etkileri görüntüleyin

Analiz sonuçları pencerede görüntülenebilir sonuçlar sekmeleri ve düğme gruplarını kullanma. Örneğin sekmeyi düşünün Sonuçlar.


Pirinç. 5. Sonuç analiz penceresi: Sonuçlar sekmesi

Bu sekmeden tüm ana sonuçlara erişebilirsiniz. Daha fazla sonuç için diğer sekmeleri kullanın. Düğme Az genellikle kullanılmayan sekmeleri kaldırarak sonuçlar iletişim kutusunu değiştirmenize olanak sağlar.

Düğmeye basıldığında Tüm efektleri kontrol et aşağıdaki tabloyu elde ederiz.


Pirinç. 6. Tüm etkilerin tablosu

Bu tablo analizin ana sonuçlarını gösterir: karelerin toplamları, serbestlik dereceleri, F testi değerleri, anlamlılık düzeyleri.

Çalışmanın kolaylığı açısından önemli etkiler (p<.05) выделены красным цветом. Два главных эффекта (Eğitim düzeyi Ve Yaş) ve bu örnekteki bazı etkileşimler önemlidir (p<.05).

5. Adım. Sonuçların analiz edilmesi - belirtilen efektlerin görüntülenmesi

Ortalama gelirin kategorilere göre nasıl değiştiğini görmenin en iyi yolu grafik araçları kullanmaktır. Düğmeye bastığınızda Tüm efektler/grafikler Aşağıdaki iletişim kutusu görünecektir.


Pirinç. 7. Tüm efektlerin Pencere Tablosu

Pencere, dikkate alınan tüm efektleri listeler. İstatistiksel olarak anlamlı etkiler * ile işaretlenmiştir.

Örneğin efekti seçelim Yaş, grup içinde Görüntülemek hadi belirtelim Masa ve tıklayın TAMAM. Her etki düzeyi için bağımlı değişkenin ortalama değerini gösteren bir tablo görüntülenir. (Gelir), standart hata değeri ve güven sınırları.


Pirinç. 8. Yaş değişkeninin düzeylerine göre tanımlayıcı istatistiklerin yer aldığı tablo

Bu tabloyu grafiksel olarak sunmak uygundur. Bunun için seçiyoruz Takvim grup içinde Görüntülemek iletişim kutusu Masa tüm efektler ve basın TAMAM. İlgili grafik görünecektir.


Pirinç. 9. Ortalama gelirin yaşa göre grafiği

Grafik, farklı yaşlardaki insan grupları arasında gelir düzeyleri açısından farklılık olduğunu açıkça göstermektedir. Yaş ne kadar yüksek olursa gelir de o kadar yüksek olur.

Birçok faktörün etkileşimi için benzer çalışmalar gerçekleştireceğiz. İletişim kutusunda hadi seçelim Zemin*Yaş ve tıklayın TAMAM.


Pirinç. 10. Cinsiyet ve yaşa göre ortalama gelir grafiği

Beklenmedik bir sonuç elde edildi: Ankete katılan 50 yaşın altındaki kişilerin gelir düzeyi yaşla birlikte artıyor ve cinsiyete bağlı kalmıyor; Ankete katılan 50 yaş üstü kişiler için kadınların geliri erkeklerden önemli ölçüde daha fazladır.

Ortaya çıkan grafiği eğitim düzeyine göre oluşturmaya değer. Belki bu kalıp bazı kategorilerde ihlal edilmiştir veya tam tersi evrenseldir. Bunun için seçiyoruz Eğitim düzeyi * Zemin* Yaş ve tıklayın TAMAM.


Pirinç. 11. Cinsiyete, yaşa, eğitim düzeyine göre ortalama gelir grafiği

Ortaya çıkan bağımlılığın orta ve orta mesleki eğitim için tipik olmadığını görüyoruz. Diğer durumlarda adildir.

Adım 6. Sonuçların analizi - model kalitesinin değerlendirilmesi

Yukarıda, esas olarak varyans analizinin grafiksel araçları kullanıldı. Elde edilebilecek diğer bazı yararlı sonuçlara bakalım.

İlk olarak, varyansın ne kadarının söz konusu faktörler ve bunların etkileşimleri tarafından açıklandığını görmek ilginçtir. Bunu yapmak için sekmede Sonuçlar düğmeye tıklayın Genel R modelleri. Aşağıdaki tablo görünecektir.

Pirinç. 12. SS modeli ve SS artıkları tablosu

Ayarla sütunundaki sayı. R2 – kare çoklu korelasyon katsayısı; oluşturulan model tarafından ne oranda değişkenliğin açıklandığını gösterir. Bizim durumumuzda R2 = 0,195 olması modelin kalitesinin düşük olduğunu göstermektedir. Aslında gelir düzeyleri yalnızca modele dahil edilen faktörlerden etkilenmemektedir.

Adım 7. Sonuçların analizi - kontrast analizi

Çoğu zaman, yalnızca farklı kategoriler için bağımlı değişkenin ortalama değerindeki farkı belirlemek değil, aynı zamanda belirli kategoriler için farkın büyüklüğünü de belirlemek gerekir. Bunu yapmak için zıtlıkların araştırılması gerekir.

Yukarıda erkek ve kadınların gelir düzeylerinin 51 yaş üstü için önemli ölçüde farklılaştığı, diğer durumlarda ise farkın anlamlı olmadığı gösterilmiştir. 51 yaş üstü ve 40-50 yaş arası erkek ve kadınların gelir düzeyi farkını çıkaralım.

Bunu yapmak için sekmeye gidin Kontrastlar ve tüm değerleri aşağıdaki gibi ayarlayın.


Pirinç. 13. Kontrastlar sekmesi

Düğmeye basıldığında Hesaplamak Birkaç tablo görünecektir. Kontrast tahminlerini içeren bir tabloyla ilgileniyoruz.


Pirinç. 14. Kontrast Değerlendirme Tablosu

Aşağıdaki sonuçlar çıkarılabilir:

  • 51 yaş üstü erkek ve kadınlar arasındaki gelir farkı ise 48,7 bin dolar.

  • 41-50 yaş arası erkek ve kadınlar arasında gelir farkı 1,73 bin dolar, fark çok da önemli değil.

Benzer şekilde, daha karmaşık kontrastlar ayarlayabilir veya önceden tanımlanmış setlerden birini kullanabilirsiniz.

Adım 8: Ek Sonuçlar

Sonuçlar penceresinin geri kalan sekmelerini kullanarak aşağıdaki sonuçları alabilirsiniz:

  • seçilen etki için bağımlı değişkenin ortalama değerleri – sekme Ortalama;

  • a posteriori kriterlerin kontrol edilmesi (post hoc) – sekme Bir posteriori;

  • ANOVA için yapılan varsayımların kontrol edilmesi – sekme Varsayımlar;

  • tepki/arzu edilirlik profilleri oluşturma – sekme Profiller;

  • Kalıntı analizi – sekme Kalanlar;

  • analizde kullanılan matrislerin çıktısı – sekme Matrisler;

  • Bu notta istatistiklerin kullanımı kesişen bir örnekle gösterilecektir. Diyelim ki Perfect Parachute'ta üretim müdürüsünüz. Paraşütler dört farklı tedarikçi tarafından sağlanan sentetik elyaflardan yapılmıştır. Paraşütün temel özelliklerinden biri gücüdür. Tedarik edilen tüm elyafların aynı mukavemette olduğundan emin olmanız gerekir. Bu soruyu cevaplamak için sentetik elyaftan dokunan paraşütlerin mukavemetini ölçecek deneysel bir tasarım tasarlanmalıdır. farklı tedarikçiler. Bu deneyden elde edilen bilgiler, hangi tedarikçinin en dayanıklı paraşütleri sağladığını belirleyecek.

    Birçok uygulama, tek bir faktörün birden fazla grubunu veya düzeyini dikkate alan deneyleri içerir. Seramik pişirme sıcaklığı gibi bazı faktörlerin birden fazla sayısal seviyesi olabilir (örn. 300°, 350°, 400° ve 450°). Bir süpermarkette ürünlerin konumu gibi diğer faktörlerin kategorik seviyeleri olabilir (örneğin, birinci tedarikçi, ikinci tedarikçi, üçüncü tedarikçi, dördüncü tedarikçi). Deney birimlerinin gruplara veya faktör düzeylerine rastgele atandığı tek faktörlü deneylere tamamen randomize denir.

    KullanımF-çeşitli matematiksel beklentiler arasındaki farkları değerlendirme kriterleri

    Gruplardaki faktörün sayısal ölçümleri sürekli ise ve bazı ek koşullar karşılanıyorsa, çeşitli grupların matematiksel beklentilerini karşılaştırmak için varyans analizi (ANOVA) kullanılır. Bir analiz Ö F Va Riance). Tamamen rastgele tasarımlar kullanılarak yapılan varyans analizine tek yönlü ANOVA prosedürü denir. Bazı yönlerden varyans analizi terimi yanlış bir isimdir çünkü varyanslar yerine grupların beklenen değerleri arasındaki farkları karşılaştırır. Bununla birlikte, matematiksel beklentilerin karşılaştırılması, tam olarak veri değişiminin analizine dayanarak gerçekleştirilir. ANOVA prosedüründe ölçüm sonuçlarındaki toplam varyasyon gruplar arası ve grup içi olarak bölünür (Şekil 1). Grup içi varyasyon deneysel hatayla, gruplar arası varyasyon ise deneysel koşulların etkisiyle açıklanmaktadır. Sembol İle grup sayısını ifade eder.

    Pirinç. 1. Tamamen Rastgele Bir Deneyde Varyasyonu Bölümlendirme

    Notu veya formatında indirin, formattaki örnekler

    Öyleymiş gibi yapalım İle gruplar normal dağılıma ve eşit varyansa sahip bağımsız popülasyonlardan çıkarılır. Boş hipotez, popülasyonların matematiksel beklentilerinin aynı olduğu yönündedir: H 0: μ 1 = μ 2 = ... = μ s. Alternatif hipotez, tüm matematiksel beklentilerin aynı olmadığını belirtir: H 1: μj'lerin hepsi aynı değildir J= 1, 2, …, s).

    İncirde. Şekil 2, popülasyonların normal dağılıma ve aynı varyansa sahip olması koşuluyla, karşılaştırılan beş grubun matematiksel beklentilerine ilişkin gerçek sıfır hipotezini sunmaktadır. Faktörün farklı düzeyleriyle ilişkili beş popülasyon aynıdır. Sonuç olarak, aynı matematiksel beklentiye, varyasyona ve şekle sahip olarak üst üste bindirilirler.

    Pirinç. 2. Beş genel popülasyon aynı matematiksel beklentiye sahiptir: μ 1 = μ 2 = μ 3 = μ 4 = μ 5

    Öte yandan, dördüncü seviyenin en yüksek beklenen değere sahip olduğu, birinci seviyenin biraz daha düşük beklenen değere sahip olduğu ve geri kalan seviyelerin aynı ve hatta daha düşük beklenen değerlere sahip olduğu sıfır hipotezinin aslında yanlış olduğunu varsayalım ( Figür 3). Beklenen değerler haricinde beş popülasyonun hepsinin aynı olduğunu (yani aynı değişkenliğe ve şekle sahip olduklarını) unutmayın.

    Pirinç. 3. Deney koşullarının etkisi gözlenir: μ 4 > μ 1 > μ 2 = μ 3 = μ 5

    Çeşitli genel popülasyonların matematiksel beklentilerinin eşitliği hakkındaki hipotezi test ederken, toplam varyasyon iki kısma ayrılır: gruplar arasındaki farklardan kaynaklanan gruplar arası varyasyon ve aynı gruba ait öğeler arasındaki farklardan kaynaklanan grup içi varyasyon. Toplam varyasyon, toplam kareler toplamı (SST – toplam kareler toplamı) ile ifade edilir. Sıfır hipotezi herkesin matematiksel beklentilerinin olduğu yönünde olduğundan İle gruplar birbirine eşitse, toplam varyasyon, bireysel gözlemler arasındaki farkların karelerinin toplamına ve tüm numuneler için hesaplanan genel ortalamaya (ortalamaların ortalaması) eşittir. Tam varyasyon:

    Nerede - genel ortalama, X ij - Ben-e gözlem J-grup veya seviye, nj- gözlem sayısı J grup, N - Toplam tüm gruplardaki gözlemler (ör. N = N 1 + n 2 + … + nc), İle- çalışılan grup veya seviye sayısı.

    Gruplar arası varyasyon Genellikle gruplar arası kareler toplamı (SSA – gruplar arasındaki karelerin toplamı) olarak adlandırılan, her grubun örnek ortalamaları arasındaki farkların karelerinin toplamına eşittir J ve genel ortalama karşılık gelen grubun hacmiyle çarpılır nj:

    Nerede İle- çalışılan grup veya seviye sayısı, nj- gözlem sayısı J grup, J- ortalama değer J grup, - genel ortalama.

    Grup içi varyasyon genellikle grup içi kareler toplamı (SSW – gruplar içindeki karelerin toplamı) olarak adlandırılan, her grubun elemanları arasındaki farkların karelerinin toplamına ve bu grubun örnek ortalamasına eşittir J:

    Nerede Xben - Ben inci eleman J grup, J- ortalama değer J grup.

    Karşılaştırıldıkları için İle faktör seviyeleri, gruplar arası kareler toplamı s – 1özgürlük derecesi. Her biri İle seviyeleri vardır nj – 1 serbestlik derecesi, dolayısıyla grup içi kareler toplamı N- İle serbestlik dereceleri ve

    Ayrıca toplam kareler toplamı N – 1 Her gözlemden bu yana serbestlik derecesi Xben tamamı üzerinden hesaplanan genel ortalamayla karşılaştırılır. N gözlemler. Bu toplamların her biri karşılık gelen serbestlik derecesine bölünürse, üç tür dağılım ortaya çıkar: gruplar arası(ortalama kare - MSA), grup içi(ortalama kare - MSW) ve tam dolu(ortalama kare toplamı - MST):

    Varyans analizinin asıl amacı matematiksel beklentileri karşılaştırmak olmasına rağmen İle Deneysel koşulların etkisini belirlemek amacıyla gruplar halinde kullanılması, ana aracın çeşitli türlerdeki varyansların analizi olmasından kaynaklanmaktadır. Sıfır hipotezi doğruysa ve matematiksel beklentiler arasındaysa İle Gruplar arasında anlamlı bir fark yoktur; üç varyansın tümü (MSA, MSW ve MST) varyans tahminleridir σ2 analiz edilen verilerin doğasında vardır. Bu nedenle sıfır hipotezini test etmek için H 0: μ 1 = μ 2 = ... = μ s ve alternatif hipotez H 1: μj'lerin hepsi aynı değildir J = 1, 2, …, İle), istatistikleri hesaplamak gerekir F-kriter, iki varyansın, MSA ve MSW'nin oranıdır. Ölçek F-tek yönlü varyans analizinde istatistikler

    İstatistik F-kriterlere tabi F-ile dağıtım s – 1 payda serbestlik derecesi M.S.A. Ve n – s paydadaki serbestlik derecesi M.S.W.. Belirli bir anlamlılık seviyesi α için, hesaplanan değer aşağıdaki durumlarda sıfır hipotezi reddedilir: F Fsen, doğuştan F-ile dağıtım s – 1 n – s paydadaki serbestlik derecesi. Böylece, Şekil 2'de gösterildiği gibi. 4, belirleyici kuralşu şekilde formüle edilmiştir: boş hipotez H 0 eğer reddedilirse F>Fsen; aksi takdirde reddedilmez.

    Pirinç. 4. Bir hipotezi test ederken kritik varyans analizi alanı H 0

    Sıfır hipotezi ise H 0 doğru, hesaplanmış F-istatistik 1'e yakındır, çünkü payı ve paydası aynı miktarın tahminleridir - analiz edilen verilerin doğasında bulunan σ2 dağılımı. Sıfır hipotezi ise H 0 yanlıştır (ve farklı grupların matematiksel beklentileri arasında önemli bir fark vardır), hesaplanmıştır F-istatistik birden çok daha büyük olacaktır çünkü payı MSA, verilerin doğal değişkenliğine ek olarak deneysel koşulların etkisini veya gruplar arasındaki farkı tahmin ederken, payda MSW yalnızca verilerin doğal değişkenliğini tahmin eder. . Böylece ANOVA prosedürü F-belirli bir anlamlılık seviyesi α'da, hesaplanan değerin geçerli olması durumunda boş hipotezin reddedildiği kriter F-istatistikler üst kritik değerden büyük Fsen, doğuştan F-ile dağıtım s – 1 paydaki serbestlik dereceleri ve n – s Paydadaki serbestlik derecesi, Şekil 2'de gösterildiği gibi. 4.

    Tek yönlü varyans analizini göstermek için notun başında özetlenen senaryoya dönelim. Deneyin amacı, farklı tedarikçilerden temin edilen sentetik elyaflardan dokunan paraşütlerin aynı mukavemete sahip olup olmadığını tespit etmektir. Her grubun beş paraşütü vardır. Gruplar tedarikçiye göre bölünmüştür - Tedarikçi 1, Tedarikçi 2, Tedarikçi 3 ve Tedarikçi 4. Paraşütlerin mukavemeti, kumaşın her iki taraftan yırtılmasını test eden özel bir cihaz kullanılarak ölçülür. Paraşütü kırmak için gereken kuvvet özel bir ölçekte ölçülür. Kopma kuvveti ne kadar yüksek olursa paraşüt o kadar güçlü olur. Excel analiz etmenizi sağlar F-tek tıklamayla istatistikler. Menüde gezinme VeriVeri analizi ve satırı seçin Tek yönlü ANOVA, açılan pencereyi doldurun (Şek. 5). Deneysel sonuçlar (kırılma mukavemeti), bazı tanımlayıcı istatistikler ve tek yönlü varyans analizi sonuçları Şekil 1'de sunulmaktadır. 6.

    Pirinç. 5. Pencere Varyans Analizi Paketinin Tek Yönlü Analizi excel

    Pirinç. 6. Farklı tedarikçilerden elde edilen sentetik elyaflardan dokunmuş paraşütlerin mukavemet göstergeleri, tanımlayıcı istatistikler ve tek yönlü varyans analizi sonuçları

    Şekil 6'nın analizi örnek ortalamalar arasında bazı farklılıklar olduğunu göstermektedir. Birinci tedarikçiden elde edilen liflerin ortalama mukavemeti 19,52, ikinci tedarikçiden 24,26, üçüncü tedarikçiden 22,84 ve dördüncü tedarikçiden 21,16'dır. Bu fark istatistiksel olarak anlamlı mıdır? Kopma kuvvetinin dağılımı dağılım grafiğinde gösterilmektedir (Şekil 7). Gruplar arası ve grup içi farklılıkları açıkça göstermektedir. Her grubun boyutu daha büyük olsaydı, bunları analiz etmek için bir kök-yaprak diyagramı, kutu grafiği veya çan grafiği kullanılabilirdi.

    Pirinç. 7. Dört tedarikçiden temin edilen sentetik elyaflardan dokunmuş paraşütler için mukavemet dağılımı diyagramı.

    Boş hipotez, ortalama güç puanları arasında anlamlı bir fark olmadığını belirtir: H 0: μ 1 = μ 2 = μ 3 = μ 4. Alternatif bir hipotez, ortalama elyaf mukavemeti diğerlerinden farklı olan en az bir tedarikçinin var olduğudur: H 1: μj'lerin hepsi aynı değildir ( J = 1, 2, …, İle).

    Genel ortalama (bkz. Şekil 6) = ORTALAMA(D12:D15) = 21,945; belirlemek için ayrıca 20 orijinal sayının tümünün ortalamasını alabilirsiniz: = ORTALAMA(A3:D7). Varyans değerleri hesaplanır Analiz paketi ve plakaya yansıtılır Varyans analizi(bkz. Şekil 6): SSA = 63,286, SSW = 97,504, SST = 160,790 (bkz. sütun SS tablolar Varyans analiziŞekil 6). Ortalamalar, bu kareler toplamlarının uygun serbestlik derecesine bölünmesiyle hesaplanır. Çünkü İle= 4, bir N= 20, aşağıdaki serbestlik derecesi değerlerini elde ederiz; SSA için: s – 1= 3; SSW için: n-c= 16; SST için: n – 1= 19 (bkz. sütun df). Böylece: MSA = SSA / ( s – 1)= 21.095; MSW = SSW / ( n-c) = 6,094; MST = SST / ( n – 1) = 8,463 (bkz. sütun HANIM). F-istatistik = MSA / MSW = 3,462 (bkz. sütun F).

    Üst kritik değer Fsen, nin kişilik özelliği F-dağıtım, =F.OBR(0,95;3;16) = 3,239 formülüyle belirlenir. =F.OBR() fonksiyonunun parametreleri: α = 0,05, pay üç serbestlik derecesine sahiptir ve payda 16'dır. Böylece hesaplanan F-3.462'ye eşit olan istatistik üst kritik değeri aşıyor Fsen= 3,239 ise sıfır hipotezi reddedilir (Şekil 8).

    Pirinç. 8. Payın üç serbestlik derecesine sahip olması ve paydanın -16 olması durumunda 0,05 anlamlılık düzeyinde varyans analizinin kritik bölgesi

    R-değer, yani sıfır hipotezinin doğru olması olasılığı F-istatistikler 3,46'dan az olmamalı, 0,041 veya %4,1'e eşit olmalıdır (bkz. sütun p değeri tablolar Varyans analiziŞekil 6). Bu değer α = %5 anlamlılık düzeyini aşmadığından sıfır hipotezi reddedilir. Dahası, R-değeri, genel popülasyonun matematiksel beklentileri arasında, gerçekte aynı olması koşuluyla, bu kadar veya daha büyük bir farkın tespit edilme olasılığının %4,1'e eşit olduğunu göstermektedir.

    Bu yüzden. Dört örnek ortalama arasında bir fark vardır. Boş hipotez, dört popülasyonun tüm matematiksel beklentilerinin eşit olduğu yönündeydi. Bu koşullar altında, tüm paraşütlerin kuvvetinin toplam değişkenliğinin (yani toplam SST değişiminin) bir ölçüsü, her gözlem arasındaki farkların karelerinin toplanmasıyla hesaplanır. X ij ve genel ortalama . Daha sonra toplam varyasyon iki bileşene ayrıldı (bkz. Şekil 1). İlk bileşen SSA'daki gruplar arası varyasyon, ikincisi ise SSW'deki grup içi varyasyondu.

    Verilerdeki değişkenliği ne açıklıyor? Başka bir deyişle, neden tüm gözlemler aynı değil? Bunun bir nedeni, farklı şirketlerin farklı dayanıklılıktaki elyafları tedarik etmesidir. Bu kısmen grupların neden farklı matematiksel beklentilere sahip olduğunu açıklamaktadır: Deney koşullarının etkisi ne kadar güçlü olursa, grupların matematiksel beklentileri arasındaki fark da o kadar büyük olur. Veri değişkenliğinin bir başka nedeni de herhangi bir sürecin, bu durumda paraşüt üretiminin, doğal değişkenliğidir. Tüm elyaflar aynı tedarikçiden satın alınsa bile diğer her şey eşit olduğundan mukavemetleri aynı olmaz. Bu etki her grupta meydana geldiğinden buna grup içi varyasyon denir.

    Örnek ortalamaları arasındaki farklara gruplar arası varyasyon SSA adı verilir. Grup içi varyasyonun bir kısmı, daha önce de belirtildiği gibi, verilerin farklı gruplara ait olmasıyla açıklanmaktadır. Bununla birlikte, gruplar tamamen aynı olsa bile (yani sıfır hipotezi doğruysa), gruplar arası varyasyon hala mevcut olacaktır. Bunun nedeni paraşüt üretim sürecinin doğal değişkenliğidir. Örnekler farklı olduğundan örnek ortalamaları da birbirinden farklıdır. Bu nedenle, sıfır hipotezi doğruysa, hem grup içi hem de grup içi değişkenlik, popülasyon değişkenliğinin bir tahminini temsil eder. Sıfır hipotezi yanlışsa, gruplar arası hipotez daha büyük olacaktır. Altında yatan bu gerçek F-çeşitli grupların matematiksel beklentileri arasındaki farklılıkları karşılaştırmaya yönelik kriterler.

    Tek yönlü ANOVA yapıldıktan ve firmalar arasında anlamlı bir fark bulunduktan sonra hangi tedarikçinin diğerlerinden önemli ölçüde farklı olduğu bilinmiyor. Sadece genel popülasyonun matematiksel beklentilerinin eşit olmadığını biliyoruz. Başka bir deyişle, matematiksel beklentilerden en az biri diğerlerinden önemli ölçüde farklıdır. Hangi tedarikçinin diğerlerinden farklı olduğunu belirlemek için şunları kullanabilirsiniz: Tukey prosedürü Tedarikçiler arasında ikili karşılaştırmalar kullanılarak. Bu prosedür John Tukey tarafından geliştirilmiştir. Daha sonra o ve K. Kramer, numune boyutlarının birbirinden farklı olduğu durumlar için bu prosedürü bağımsız olarak değiştirdiler.

    Çoklu karşılaştırma: Tukey-Kramer prosedürü

    Senaryomuzda paraşütlerin gücünü karşılaştırmak için tek yönlü varyans analizi kullanıldı. Dört grubun matematiksel beklentileri arasında anlamlı farklılıklar bulunduğundan hangi grupların birbirinden farklı olduğunu belirlemek gerekir. Bu sorunu çözmenin birkaç yolu olmasına rağmen, biz yalnızca Tukey-Kramer çoklu karşılaştırma prosedürünü anlatacağız. Bu yöntem, post hoc karşılaştırma prosedürlerinin bir örneğidir çünkü test edilen hipotez, veri analizinden sonra formüle edilir. Tukey-Kramer prosedürü tüm grup çiftlerinin aynı anda karşılaştırılmasına olanak tanır. İlk aşamada farklar hesaplanır XJ -XJ, Nerede j ≠J, matematiksel beklentiler arasında a(lar – 1)/2 gruplar. Kritik kapsam Tukey-Kramer prosedürü aşağıdaki formülle hesaplanır:

    Nerede Soru-Cevap- öğrencileştirilmiş aralık dağılımının üst kritik değeri; İle paydaki serbestlik dereceleri ve N - İle paydadaki serbestlik derecesi.

    Örneklem büyüklükleri aynı değilse her bir matematiksel beklenti çifti için kritik aralık ayrı ayrı hesaplanır. Son aşamada her biri a(lar – 1)/2 matematiksel beklenti çiftleri karşılık gelen kritik aralıkla karşılaştırılır. Fark modülü | Xj -XJ| aralarında kritik aralığı aşıyor.

    Tukey-Kramer prosedürünü paraşütlerin gücü problemine uygulayalım. Paraşüt şirketinin dört tedarikçisi olduğundan, kontrol edilecek 4(4 – 1)/2 = 6 çift tedarikçi vardır (Şekil 9).

    Pirinç. 9. Örnek ortalamaların ikili karşılaştırmaları

    Tüm gruplar aynı hacme sahip olduğundan (yani tümü nj = nj), yalnızca bir kritik aralığı hesaplamak yeterlidir. Bunu yapmak için tabloya göre ANOVA(Şekil 6) MSW = 6,094 değerini belirliyoruz. Daha sonra değeri buluyoruz Soru-Cevapα = 0,05'te, İle= 4 (paydaki serbestlik derecesi sayısı) ve N- İle= 20 – 4 = 16 (paydadaki serbestlik derecesi sayısı). Maalesef ilgili işlevi Excel'de bulamadım, bu yüzden tabloyu kullandım (Şekil 10).

    Pirinç. 10. Öğrenci aralığının kritik değeri Soru-Cevap

    Şunu elde ederiz:

    Yalnızca 4,74 > 4,47 olduğundan (bkz. Şekil 9'un alt tablosu), birinci ve ikinci tedarikçi arasında istatistiksel olarak anlamlı bir fark mevcuttur. Diğer tüm çiftlerin, farklılıkları hakkında konuşmamıza izin vermeyen örnek araçları vardır. Sonuç olarak, birinci tedarikçiden satın alınan elyaflardan dokunan paraşütlerin ortalama mukavemeti, ikinci tedarikçiden önemli ölçüde daha azdır.

    Tek yönlü varyans analizi için gerekli koşullar

    Paraşütlerin gücü sorununu çözerken, tek faktörlü bir paraşüt kullanmanın mümkün olduğu koşulların olup olmadığını kontrol etmedik. F-kriter. Tek faktörlü kullanıp kullanamayacağınızı nasıl anlarsınız? F-belirli deneysel verileri analiz ederken kriter? Tek faktör F-kriter ancak üç temel varsayımın karşılanması durumunda uygulanabilir: deneysel veriler rastgele ve bağımsız olmalı, normal dağılıma sahip olmalı ve varyansları eşit olmalıdır.

    İlk tahmin - Rastgelelik ve veri bağımsızlığı- Herhangi bir deneyin doğruluğu seçimin rastgeleliğine ve/veya rastgeleleştirme sürecine bağlı olduğundan her zaman gerçekleştirilmelidir. Sonuçların saptırılmasını önlemek için verilerin çıkarılması gerekir. İle genel popülasyonlar rastgele ve birbirlerinden bağımsız olarak. Benzer şekilde, veriler rastgele dağıtılmalıdır. İle ilgilendiğimiz faktörün düzeyleri (deney grupları). Bu koşulların ihlali, varyans analizinin sonuçlarını ciddi şekilde bozabilir.

    İkinci tahmin - normallik- Verilerin normal dağılıma sahip popülasyonlardan elde edildiği anlamına gelir. gelince T-kriterler, temel alınan tek yönlü varyans analizi F-kriterler bu koşulun ihlaline nispeten daha az duyarlıdır. Dağılım normalden çok fazla sapmıyorsa anlamlılık düzeyi F-kriter, özellikle örneklem boyutu yeterince büyükse çok az değişir. Dağılımın normallik şartı ciddi şekilde ihlal ediliyorsa uygulanmalıdır.

    Üçüncü tahmin - varyansın homojenliği- her popülasyonun varyanslarının birbirine eşit olduğu anlamına gelir (yani σ 1 2 = σ 2 2 = ... = σ j 2). Bu varsayım, kişinin grup içi varyansları ayırmaya veya bir araya toplamaya karar vermesine olanak tanır. Grup büyüklükleri aynı ise, varyansın homojenliği koşulunun, kullanılarak elde edilen sonuçlar üzerinde çok az etkisi vardır. F-kriterler. Ancak örneklem büyüklükleri eşit değilse, varyansların eşitliği koşulunun ihlali, varyans analizi sonuçlarını ciddi şekilde bozabilir. Bu nedenle örneklem büyüklüklerinin eşit olmasına dikkat edilmelidir. Varyansın homojenliği varsayımını kontrol etme yöntemlerinden biri kriterdir. Levene Aşağıda açıklanan.

    Her üç koşuldan yalnızca varyansın homojenliği koşulu ihlal edilirse, benzer bir prosedür T- Ayrı varyans kullanan kriter (daha fazla ayrıntı için bkz.). Ancak normal dağılım ve varyansların homojenliği varsayımlarının aynı anda ihlal edilmesi durumunda, verilerin normalleştirilmesi ve varyanslar arasındaki farkların azaltılması veya parametrik olmayan bir prosedür uygulanması gerekmektedir.

    Varyansın homojenliğini test etmek için Levene testi

    Rağmen F- kriter, gruplardaki varyansların eşitliği koşulunun ihlaline karşı nispeten dirençlidir; bu varsayımın büyük ölçüde ihlali, kriterin anlamlılık düzeyini ve gücünü önemli ölçüde etkiler. Belki de en güçlü olanlardan biri kriterdir Levene. Varyansların eşitliğini kontrol etmek için İle genel popülasyonlar için aşağıdaki hipotezleri test edeceğiz:

    Н 0: σ 1 2 = σ 2 2 = … = σJ 2

    H 1: Hepsi değil σj2 aynıdır ( J = 1, 2, …, İle)

    Değiştirilmiş Levene testi, gruplardaki değişkenlik aynıysa, gözlemler ve grup medyanları arasındaki farkların mutlak değerlerindeki varyans analizinin, varyansların eşitliğine ilişkin sıfır hipotezini test etmek için kullanılabileceği ifadesine dayanmaktadır. Bu nedenle, öncelikle her gruptaki gözlemler ve medyanlar arasındaki farkların mutlak değerlerini hesaplamalı, ardından farklılıkların ortaya çıkan mutlak değerleri üzerinde tek yönlü varyans analizi yapmalısınız. Levene'nin kriterini açıklamak için notun başında özetlenen senaryoya dönelim. Şekil 2'de sunulan verileri kullanarak. Şekil 6'da benzer bir analiz yapacağız, ancak her numune için başlangıç ​​verileri ve medyanlardaki farklılık modülleri ile ilgili olarak ayrı ayrı (Şekil 11).



Sitede yeni

>

En popüler