بيت تجويف الفم طرق تحليل التباين. اتجاه واحد أنوفا

طرق تحليل التباين. اتجاه واحد أنوفا

5.1. ماذا حدث تحليل التباين?

تم تطوير تحليل التشتت في العشرينات من القرن العشرين على يد عالم الرياضيات الإنجليزي وعالم الوراثة رونالد فيشر. وفقا لمسح بين العلماء، الذي اكتشف من الذي أثر أكثر على علم الأحياء في القرن العشرين، كان السير فيشر هو الذي حصل على البطولة (لخدماته حصل على وسام الفارس - أحد أعلى الأوسمة في بريطانيا العظمى)؛ وفي هذا الصدد، يمكن مقارنة فيشر بتشارلز داروين، صاحب التأثير الأكبر على علم الأحياء في القرن التاسع عشر.

أصبح تحليل التباين الآن فرعًا منفصلاً من الإحصاء. ويعتمد على ما اكتشفه فيشر من أن مقياس تباين الكمية المدروسة يمكن تحلله إلى أجزاء تتوافق مع العوامل المؤثرة في هذه الكمية والانحرافات العشوائية.

لفهم جوهر تحليل التباين، سنقوم بإجراء نفس النوع من الحسابات مرتين: "يدويًا" (باستخدام الآلة الحاسبة) وباستخدام برنامج Statistica. ولتبسيط مهمتنا، لن نعمل مع نتائج الوصف الفعلي لتنوع الضفادع الخضراء، ولكن مع مثال وهمي يتعلق بمقارنة الإناث والذكور في البشر.ضع في اعتبارك تنوع ارتفاعات 12 شخصًا بالغًا: 7 نساء و5 رجال.

الجدول 5.1.1. مثال على تحليل التباين أحادي الاتجاه: بيانات عن الجنس والطول لـ 12 شخصًا

دعونا نجري تحليل التباين أحادي الاتجاه: قارن ما إذا كان الرجال والنساء في المجموعة المميزة يختلفون في الطول بشكل ملحوظ إحصائيًا أم لا.

5.2. اختبار التوزيع الطبيعي

ويستند المزيد من الاستدلال إلى حقيقة أن التوزيع في العينة قيد النظر طبيعي أو قريب من الطبيعي. إذا كان التوزيع بعيدًا عن الطبيعي، فإن التشتت (التباين) ليس مقياسًا مناسبًا لتقلبه. ومع ذلك، فإن تحليل التباين مقاوم نسبيًا لانحرافات التوزيع عن الحالة الطبيعية.

يمكن إجراء اختبار الحالة الطبيعية لهذه البيانات بطريقتين مختلفتين. أولاً: الإحصائيات / الإحصائيات الأساسية / الجداول / الإحصائيات الوصفية / علامة التبويب العادية. في علامة التبويبالحياة الطبيعية يمكنك اختيار الاختبارات الطبيعية التي تريد استخدامها. عند النقر على زر الجداول التكرارية، سيظهر جدول تكراري، وسيعرض زر الرسوم البيانية رسمًا بيانيًا. سيظهر الجدول والرسم البياني نتائج الاختبارات المختلفة.

ترتبط الطريقة الثانية باستخدام الإمكانات المناسبة عند إنشاء الرسوم البيانية. في مربع الحوار الخاص بإنشاء الرسوم البيانية (الرسوم البيانية / الرسوم البيانية...)، حدد علامة التبويب خيارات متقدمة. يوجد في الأسفل كتلة إحصائيات. دعونا نضع علامة على شابيرو ويلك عليهار اختبار est وKolmogorov-Smirnov، كما هو موضح في الشكل.

أرز. 5.2.1. الاختبارات الإحصائية لحالة التوزيع الطبيعية في مربع حوار رسم الرسم البياني

وكما يتبين من الرسم البياني، فإن توزيع النمو في عينتنا يختلف عن الطبيعي (هناك "فشل" في المنتصف).


أرز. 5.2.2. رسم بياني تم إنشاؤه باستخدام المعلمات المحددة في الشكل السابق

يشير السطر الثالث في عنوان الرسم البياني إلى معلمات التوزيع الطبيعي التي تبين أن التوزيع الملحوظ هو الأقرب إليها. المتوسط ​​العام هو 173 والانحراف المعياري الكلي هو 10.4. يوضح الشكل الداخلي أدناه في الرسم البياني نتائج اختبارات الحالة الطبيعية. D هو اختبار Kolmogorov-Smirnov، وSW-W هو اختبار Shapiro-Wilk. كما يتبين، بالنسبة لجميع الاختبارات المستخدمة، تبين أن الاختلافات بين توزيع الارتفاع والتوزيع الطبيعي غير ذات دلالة إحصائية ( ص في جميع الحالات أكبر من 0.05).

لذلك، من الناحية الرسمية، فإن اختبارات التوزيع الطبيعي لا "تمنعنا" من استخدام الطريقة البارامترية القائمة على افتراض التوزيع الطبيعي. كما ذكرنا سابقًا، فإن تحليل التباين مقاوم نسبيًا للانحرافات عن الحالة الطبيعية، لذلك سنستمر في استخدامه.

5.3. تحليل التباين أحادي الاتجاه: الحسابات اليدوية

لتوصيف التباين في أطوال الأشخاص في المثال الموضح، دعونا نحسب مجموع الانحرافات المربعة (يشار إليها باللغة الإنجليزية بـ سس أو مجموع المربعات أو ) القيم الفردية من المتوسط: . متوسط ​​قيمة الارتفاع في المثال أعلاه هو 173 سم. بناء على هذا،

سس = (186–173) 2 + (169–173) 2 + (166–173) 2 + (188–173) 2 + (172–173) 2 + (179–173) 2 + (165–173) 2 + (174–173) 2 + (163–173) 2 + (162–173) 2 + (162–173) 2 + (190–173) 2 ;

سس = 132 + 42 + 72 + 152 + 12 + 62 + 82 + 12 + 102 + 112 + 112 + 172;

سس = 169 + 16 + 49 + 225 + 1 + 36 + 64 + 1 + 100 + 121 + 121 + 289 = 1192.

القيمة الناتجة (1192) هي مقياس لتباين مجموعة البيانات بأكملها. ومع ذلك، فهي تتكون من مجموعتين، يمكن أن يكون لكل منهما متوسطها الخاص. في البيانات المقدمة ارتفاع متوسطالنساء - 168 سم، والرجال - 180 سم.

لنحسب مجموع الانحرافات التربيعية للنساء:

سس و = (169–168) 2 + (166–168) 2 + (172–168) 2 + (179–168) 2 + (163–168) 2 + (162–168) 2 ;

سس و = 12 + 22 + 42 + 112 + 32 + 52 + 62 = 1 + 4 + 16 + 121 + 9 + 25 + 36 = 212.

نحسب أيضًا مجموع الانحرافات التربيعية للرجال:

سس م = (186–180) 2 + (188–180) 2 + (174–180) 2 + (162–180) 2 + (190–180) 2 ;

سس م = 62 + 82 + 62 + 182 + 102 = 36 + 64 + 36 + 324 + 100 = 560.

على ماذا تعتمد القيمة قيد الدراسة وفق منطق تحليل التباين؟

قيمتان محسوبتان، سس و و سس م ، يميز التباين داخل المجموعة، والذي يُسمى عادةً في تحليل التباين "خطأ". أصل هذا الاسم مرتبط بالمنطق التالي.

ما الذي يحدد طول الشخص في هذا المثال؟ بادئ ذي بدء، على متوسط ​​طول الأشخاص بشكل عام، بغض النظر عن جنسهم. ثانيا - من الأرض. إذا كان الأشخاص من أحد الجنسين (الذكور) أطول من الآخر (الأنثى)، فيمكن تمثيل ذلك كإضافة إلى المتوسط ​​"العالمي" لبعض القيمة، وهو تأثير الجنس. وأخيرًا، يختلف الأشخاص من نفس الجنس في الطول بسبب الاختلافات الفردية. في النموذج الذي يصف الطول كمجموع المتوسط ​​البشري والتعديل حسب الجنس، تكون الفروق الفردية غير مفسرة ويمكن اعتبارها "خطأ".

لذا، ووفقاً لمنطق تحليل التباين، يتم تحديد القيمة محل الدراسة على النحو التالي: ، أين س ي - القيمة i للكمية المدروسة عند القيمة j للعامل المدروس؛ - المتوسط ​​العام؛ إف جي - تأثير القيمة j للعامل قيد الدراسة؛ - "الخطأ"، مساهمة فردية الكائن الذي تشير إليه القيمةس ي .

مجموع المربعات بين المجموعات

لذا، سس أخطاء = سس و + سس م = 212 + 560 = 772. بهذه القيمة وصفنا التباين داخل المجموعة (عند التمييز بين المجموعات حسب الجنس). ولكن هناك الجزء الثاني من التباين - التباين بين المجموعات، والذي سنسميهتأثير سس (بما أننا نتحدث عن تأثير تقسيم مجمل الأشياء قيد النظر إلى نساء ورجال).

ويختلف متوسط ​​كل مجموعة عن المتوسط ​​العام. عند حساب مساهمة هذا الاختلاف في المقياس العام للتباين، يجب علينا ضرب الفرق بين المجموعة والمتوسط ​​الإجمالي بعدد العناصر في كل مجموعة.

تأثير سس = = 7×(168–173) 2 + 5×(180–173) 2 = 7×52 + 5×72 = 7×25 + 5×49 = 175 + 245 = 420.

هنا تجلى مبدأ ثبات مجموع المربعات الذي اكتشفه فيشر: SS = التأثير SS + الخطأ SS ، أي. على سبيل المثال، 1192 = 440 + 722.

متوسط ​​المربعات

بمقارنة مجموع المربعات بين المجموعات وداخل المجموعة في مثالنا، يمكننا أن نرى أن الأول مرتبط باختلاف مجموعتين، والثاني مرتبط بـ 12 قيمة في مجموعتين. عدد درجات الحرية ( df ) لبعض المعلمات يمكن تعريفها على أنها الفرق بين عدد الكائنات في المجموعة وعدد التبعيات (المعادلات) التي تربط هذه الكميات.

في مثالنا تأثير مدافع = 2–1 = 1، أ أخطاء df = 12–2 = 10.

يمكننا قسمة مجموع المربعات على عدد درجات حريتها، مما يعطينا متوسط ​​المربعات ( آنسة ، وسائل المربعات). بعد القيام بذلك، يمكننا إثبات ذلك آنسة - لا شيء أكثر من الاختلافات ("التباينات"، نتيجة قسمة مجموع المربعات على عدد درجات الحرية). بعد هذا الاكتشاف، يمكننا أن نفهم بنية جدول ANOVA. على سبيل المثال لدينا، سوف تبدو مثل هذا.

تأثير

خطأ

تأثير مرض التصلب العصبي المتعدد و أخطاء MS هي تقديرات للتباين بين المجموعات وداخل المجموعة، وبالتالي يمكن مقارنتها وفقًا للمعيارF (معيار سنديكور، الذي سمي على اسم فيشر)، وهو مصمم لمقارنة الاختلافات. هذا المعيار هو ببساطة حاصل قسمة التباين الأكبر على التباين الأصغر. في حالتنا هو 420 / 77.2 = 5.440.

تحديد الدلالة الإحصائية لاختبار فيشر باستخدام الجداول

إذا أردنا تحديد الأهمية الإحصائية للتأثير يدويًا باستخدام الجداول، فسنحتاج إلى مقارنة قيمة المعيار الناتج F بقيمة حرجة تتوافق مع مستوى معين من الأهمية الإحصائية لدرجات معينة من الحرية.


أرز. 5.3.1. جزء من جدول يحتوي على قيم معيارية حرجة F

كما ترون، بالنسبة لمستوى الأهمية الإحصائية p=0.05 فإن القيمة الحرجة للمعيار هيF هو 4.96. وهذا يعني أنه في مثالنا تم تسجيل تأثير الجنس عند مستوى دلالة إحصائية قدره 0.05.

يمكن تفسير النتيجة التي تم الحصول عليها على النحو التالي. إن احتمال الفرضية الصفرية، التي بموجبها يكون متوسط ​​طول النساء والرجال متساويين، وأن الفرق المسجل في أطوالهم يرجع إلى العشوائية في اختيار العينات، هو أقل من 5%. وهذا يعني أنه يجب علينا اختيار الفرضية البديلة، وهي أن متوسط ​​طول النساء والرجال مختلف.

5.4. تحليل التباين في اتجاه واحد ( ANOVA) في حزمة Statistica

في الحالات التي لا يتم فيها إجراء الحسابات يدويًا، ولكن باستخدام البرامج المناسبة (على سبيل المثال، حزمة Statistica)، تكون القيمة ص يتم تحديدها تلقائيًا. يمكنك التحقق من أنها أعلى قليلاً من القيمة الحرجة.

لتحليل المثال قيد المناقشة باستخدام أبسط إصدار من تحليل التباين، تحتاج إلى تشغيل إجراء الإحصائيات / ANOVA للملف الذي يحتوي على البيانات المقابلة وتحديد خيار One-way ANOVA في نافذة نوع التحليل ومربع حوار المواصفات السريعة الخيار في نافذة طريقة المواصفات.


أرز. 5.4.1. الحوار العام ANOVA/MANOVA (تحليل التباين)

في نافذة الحوار السريع التي تفتح، في حقل المتغيرات، تحتاج إلى تحديد تلك الأعمدة التي تحتوي على البيانات التي ندرس تباينها (قائمة المتغيرات التابعة؛ في حالتنا، عمود النمو)، بالإضافة إلى عمود يحتوي على قيم التي تقسم القيمة محل الدراسة إلى مجموعات (المتنبئ الفئوي (العامل)، في حالتنا، عمود الجنس). في هذا الإصدار من التحليل، على عكس التحليل متعدد المتغيرات، يمكن أخذ عامل واحد فقط في الاعتبار.


أرز. 5.4.2. الحوار أحادي الاتجاه ANOVA (تحليل التباين أحادي الاتجاه)

في نافذة رموز العوامل، يجب عليك الإشارة إلى قيم العامل المعني التي يجب معالجتها أثناء هذا التحليل. يمكن الاطلاع على جميع القيم المتاحة باستخدام زر التكبير. إذا كنت بحاجة، كما في مثالنا، إلى مراعاة جميع قيم العامل (وبالنسبة للجنس في مثالنا هناك قيمتان فقط)، فيمكنك النقر فوق الزر "الكل". عندما يتم تحديد الأعمدة وأكواد العوامل المراد معالجتها، يمكنك النقر فوق "موافق" والانتقال إلى النافذة تحليل سريعالنتائج: نتائج ANOVA 1، في علامة التبويب السريعة.

أرز. 5.4.3. علامة تبويب سريعة لنافذة نتائج ANOVA

يتيح لك زر جميع التأثيرات/الرسوم البيانية رؤية كيفية مقارنة متوسطات مجموعتين. يُشار فوق الرسم البياني إلى عدد درجات الحرية، بالإضافة إلى قيم F وp للعامل المعني.


أرز. 5.4.4. عرض رسومي لنتائج ANOVA

يتيح لك زر جميع التأثيرات الحصول على تحليل لجدول التباين مشابه للجدول الموصوف أعلاه (مع بعض الاختلافات المهمة).


أرز. 5.4.5. جدول نتائج تحليل التباين (قارن مع جدول مماثل تم الحصول عليه "يدويًا")

يوضح الصف السفلي من الجدول مجموع المربعات وعدد درجات الحرية ومتوسط ​​مربعات الخطأ (التباين داخل المجموعة). على السطر أعلاه مؤشرات مماثلة للعامل قيد الدراسة (في في هذه الحالة- علامة الجنس)، وكذلك المعيار F (نسبة متوسطات مربعات التأثير إلى متوسطات مربعات الخطأ)، ومستوى دلالتها الإحصائية. حقيقة أن تأثير العامل قيد النظر تبين أنه ذو دلالة إحصائية يظهر باللون الأحمر.

ويعرض السطر الأول بيانات على مؤشر "الاعتراض". هذا يمثل صف الجدول لغزًا للمستخدمين الذين ينضمون إلى Statistica في الإصدار السادس أو الأحدث. من المحتمل أن تكون قيمة الاعتراض مرتبطة بتحليل مجموع مربعات جميع قيم البيانات (أي 1862 + 1692 ... = 360340). تم الحصول على قيمة المعيار F المشار إليها عن طريق القسمة اعتراض MS/خطأ MS = 353220 / 77.2 = 4575.389 وبطبيعة الحال يعطي قيمة كبيرة جدًا قيمة منخفضة ص . ومن المثير للاهتمام أنه في Statistica-5 لم يتم حساب هذه القيمة على الإطلاق، ولا تعلق أدلة استخدام الإصدارات الأحدث من الحزمة على تقديمها بأي شكل من الأشكال. ربما يكون أفضل شيء يمكن أن يفعله عالم الأحياء الذي يستخدم Statistica-6 والإصدارات الأحدث هو ببساطة تجاهل صف الاعتراض في جدول ANOVA.

5.5. ANOVA واختبارات الطالب وفيشر: أيهما أفضل؟

كما لاحظت، فإن البيانات التي قمنا بمقارنتها باستخدام تحليل التباين أحادي الاتجاه، يمكننا أيضًا فحصها باستخدام اختبارات الطالب وفيشر. دعونا نقارن هاتين الطريقتين. للقيام بذلك، دعونا نحسب الفرق في الطول بين الرجال والنساء باستخدام هذه المعايير. للقيام بذلك، سيتعين علينا اتباع المسار الإحصائيات / الإحصائيات الأساسية / اختبار t، بشكل مستقل، حسب المجموعات. وبطبيعة الحال، فإن المتغيرات التابعة هي متغير النمو، ومتغير التجميع هو متغير الجنس.


أرز. 5.5.1. مقارنة البيانات التي تمت معالجتها باستخدام ANOVA باستخدام اختبارات الطالب وفيشر

كما ترون، والنتيجة هي نفس استخدام ANOVA. ص = 0.041874 في كلتا الحالتين، كما هو مبين في الشكل. 5.4.5، كما هو موضح في الشكل. 5.5.2 (انظر بنفسك!).


أرز. 5.5.2. نتائج التحليل (شرح تفصيلي لجدول النتائج - في الفقرة المخصصة لاختبار الطالب)

من المهم التأكيد على أنه على الرغم من أن معيار F من الناحية الرياضية في التحليل قيد النظر وفقًا لاختبارات الطالب وفيشر هو نفسه كما في تحليل التباين (ويعبر عن نسبة التباين)، إلا أن معناه في نتائج التحليل المقدمة في الجدول النهائي مختلف تماما. عند المقارنة باختبارات الطالب وفيشر، يتم إجراء مقارنة متوسطات العينة عن طريق اختبار الطالب، ويتم إجراء مقارنة تباينها عن طريق اختبار فيشر. لا تعرض نتائج التحليل التباين نفسه، بل التباين الخاص به الجذر التربيعي- الانحراف المعياري.

من ناحية أخرى، يُستخدم اختبار فيشر في تحليل التباين (ANOVA) لمقارنة متوسطات العينات المختلفة (كما ناقشنا، يتم ذلك عن طريق تقسيم مجموع المربعات إلى أجزاء ومقارنة متوسط ​​مجموع المربعات المقابلة لـ بين وداخل المجموعة التقلب).

ومع ذلك، فإن الاختلاف أعلاه يتعلق بالأحرى بعرض النتائج. البحوث الإحصائيةمن جوهرها. وكما يشير جلانتز (1999، ص 99)، على سبيل المثال، يمكن النظر إلى مقارنة المجموعات التي تستخدم اختبار الطالب على أنها حالة خاصةتحليل التباين لعينتين.

لذا، فإن مقارنة العينات باستخدام اختبارات الطالب واختبار فيشر لها شيء واحد ميزة مهمةقبل تحليل التباين: حيث يمكن مقارنة العينات من حيث تباينها. لكن مزايا تحليل التباين لا تزال أكثر أهمية. وتشمل هذه، على سبيل المثال، القدرة على مقارنة عدة عينات في وقت واحد.

تحليل التباين هو أسلوب إحصائي مصمم لتقييم تأثير العوامل المختلفة على نتيجة التجربة، وكذلك للتخطيط اللاحق للتجارب المماثلة.

في البداية (1918)، تم تطوير تحليل التباين من قبل عالم الرياضيات والإحصائي الإنجليزي ر. يقوم فيشر بمعالجة نتائج التجارب الزراعية للتعرف على شروط الحصول على أقصى إنتاجية لمختلف أصناف المحاصيل الزراعية.

عند إعداد التجربة يجب استيفاء الشروط التالية:

    يجب تنفيذ كل نوع من التجربة على عدة وحدات مراقبة (مجموعات من الحيوانات، أقسام ميدانية، إلخ)

    أن يكون توزيع وحدات المراقبة بين المتغيرات التجريبية عشوائياً وليس متعمداً.

استخدامات أنوفا F-معيار(معيار R.A. Fisher)، الذي يمثل نسبة التباينين:

حيث d الحقيقة، d المتبقية هي تباينات مضروبة (بين المجموعات) ومتبقية (داخل المجموعة) لكل درجة حرية، على التوالي.

تباينات العوامل والمتبقية هي تقديرات لتباين السكان، محسوبة من بيانات العينة مع الأخذ في الاعتبار عدد درجات حرية الاختلاف.

يفسر التشتت العاملي (بين المجموعات) تباين الخاصية الفعالة تحت تأثير العامل قيد الدراسة.

يفسر التباين المتبقي (داخل المجموعة) التباين في الخاصية الفعالة بسبب تأثير العوامل الأخرى (باستثناء تأثير العامل قيد الدراسة).

باختصار، يعطي العامل والتباينات المتبقية التباين الإجمالي، معبرًا عن تأثير جميع خصائص العامل على العامل الناتج.

إجراءات إجراء تحليل التباين:

1. يتم إدخال البيانات التجريبية في جدول حسابي ويتم تحديد الكميات ومتوسط ​​القيم في كل مجموعة من السكان محل الدراسة وكذلك المبلغ الإجمالي ومتوسط ​​القيمة لجميع السكان (جدول 1).

الجدول 1

قيمة الخاصية الناتجة للوحدة i

في المجموعة j-th، x ij

عدد الملاحظات، و ي

المتوسط ​​(المجموعة والإجمالي)، x j

× 11، × 12، …، × 1 ن

× 21، × 22، …، × 2 ن

س م 1، س م 2، ...، س مين

العدد الإجمالي للملاحظات نتحسب كمجموع عدد الملاحظات F يفي كل مجموعة:

إذا كانت جميع المجموعات لديها نفس عدد العناصر، فإن المتوسط ​​العام تم العثور عليه من وسائل المجموعة كوسيلة حسابية بسيطة:

إذا كان عدد العناصر في المجموعات مختلفا، فإن المتوسط ​​العام محسوبة باستخدام صيغة المتوسط ​​الحسابي المرجح:

2. يتم تحديد التباين الكلي د عمومًاكمجموع الانحرافات التربيعية للقيم الفردية للخاصية الناتجة من المتوسط ​​الإجمالي :

3. يتم حساب التباين العاملي (بين المجموعات). د حقيقةكمجموع الانحرافات التربيعية لوسائل المجموعة من المتوسط ​​الإجمالي ، مضروبًا في عدد الملاحظات:

4. يتم تحديد قيمة التباين المتبقي (داخل المجموعة). د ostمثل الفرق بين المجموع د عمومًاومضروب د حقيقةالفروق:

5. احسب عدد درجات حرية العامل
التباين هو الفرق بين عدد المجموعات موالوحدة:

6. يتم تحديد عدد درجات الحرية للتشتت المتبقي
كالفرق بين عدد القيم الفردية للخاصية نوعدد المجموعات م:

7. يتم حساب قيمة عامل التشتت لكل درجة حرية واحدة د حقيقةكنسبة تباين العوامل د حقيقةإلى عدد درجات حرية تشتت العامل
:

8. يتم تحديد قيمة التشتت المتبقي لكل درجة حرية واحدة د ostكنسبة التباين المتبقية د ostإلى عدد درجات حرية التشتت المتبقي
:

9. يتم تحديد القيمة المحسوبة للمعيار F F-عملية حسابيةكنسبة تباين العوامل لكل درجة حرية د حقيقةإلى التباين المتبقي لكل درجة من الحرية د ost :

10. باستخدام جدول اختبار فيشر F مع مراعاة مستوى الأهمية المعتمد في الدراسة وكذلك مع مراعاة درجات الحرية للعوامل والتباينات المتبقية تم إيجاد القيمة النظرية. F طاولة .

يتوافق مستوى الأهمية 5% مع مستوى احتمال 95%، ويتوافق مستوى الأهمية 1% مع مستوى احتمال 99%. في معظم الحالات، يتم استخدام مستوى الأهمية 5٪.

القيمة النظرية F طاولةعند مستوى معين من الأهمية يتم تحديده من خلال الجداول الموجودة عند تقاطع صف وعمود، بما يتوافق مع درجتين من حرية التباينات:

عن طريق الخط - المتبقية.

حسب العمود - مضروب.

11. يتم عرض نتائج الحساب في جدول (الجدول 2).

كل الناس بطبيعتهم يسعون إلى المعرفة. (أرسطو. الميتافيزيقا)

تحليل التباين

نظرة عامة تمهيدية

في هذا القسم، سنراجع الطرق الأساسية والافتراضات والمصطلحات الخاصة بتحليل التباين (ANOVA).

لاحظ أنه في أدبيات اللغة الإنجليزية، يُسمى تحليل التباين عادةً بتحليل التباين. ولذلك، للإيجاز، أدناه سوف نستخدم هذا المصطلح في بعض الأحيان أنوفا (انتحليل س F فا riation) لـ ANOVA العادي والمصطلح مانوفالتحليل التباين متعدد المتغيرات. في هذا القسم سوف نستعرض تباعاً الأفكار الرئيسية لتحليل التباين ( أنوفا) ، تحليل التباين ( أنكوفا) ، تحليل التباين متعدد المتغيرات ( مانوفا) والتحليل متعدد المتغيرات للتباين ( مانكوفا). بعد مناقشة موجزة لمزايا تحليل التباين والاختبارات اللاحقة، دعونا نلقي نظرة على الافتراضات التي تعتمد عليها أساليب ANOVA. في نهاية هذا القسم، يتم شرح مزايا النهج متعدد المتغيرات لتحليل التدابير المتكررة مقارنة بالنهج التقليدي أحادي المتغير.

الأفكار الرئيسية

الغرض من تحليل التباين.الغرض الرئيسي من تحليل التباين هو دراسة أهمية الاختلافات بين الوسائل. الفصل (الفصل 8) يقدم مقدمة موجزة لدراسة الأهمية الإحصائية. إذا كنت تقارن ببساطة بين متوسطي عينتين، فإن تحليل التباين سيعطي نفس نتيجة التحليل العادي. ر- اختبار العينات المستقلة (إذا تمت مقارنة مجموعتين مستقلتين من الأشياء أو الملاحظات) أو ر- معيار العينات التابعة (إذا تمت مقارنة متغيرين على نفس مجموعة الكائنات أو الملاحظات). إذا لم تكن على دراية بهذه المعايير، فنوصيك بالرجوع إلى نظرة عامة على الفصل التمهيدي (الفصل 9).

من أين أتت التسمية تحليل التباين? قد يبدو غريبًا أن يسمى إجراء مقارنة الوسائل تحليل التباين. في الواقع، هذا لأننا عندما نفحص الأهمية الإحصائية للاختلافات بين المتوسطات، فإننا في الواقع نقوم بتحليل التباينات.

تقسيم مجموع المربعات

بالنسبة لحجم العينة n، يتم حساب تباين العينة كمجموع الانحرافات المربعة عن متوسط ​​العينة مقسومًا على n-1 (حجم العينة ناقص واحد). وهكذا، بالنسبة لحجم العينة الثابت n، يكون التباين دالة لمجموع المربعات (الانحرافات)، ويشار إليها، للإيجاز، سس(من مجموع المربعات الإنجليزية - مجموع المربعات). أساس تحليل التباين هو فصل (أو تقسيم) التباين إلى أجزاء. خذ بعين الاعتبار مجموعة البيانات التالية:

تختلف وسائل المجموعتين بشكل كبير (2 و 6 على التوالي). مجموع الانحرافات التربيعية داخلكل مجموعة تساوي 2. وبجمعهم نحصل على 4. إذا كررنا هذه الحسابات الآن باستثناءعضوية المجموعة، وهذا هو، إذا حسبنا سسوبناءً على المتوسط ​​الإجمالي للعينتين، نحصل على 28. وبعبارة أخرى، فإن التباين (مجموع المربعات) بناءً على التباين داخل المجموعة يؤدي إلى قيم أصغر بكثير مما عند حسابه على أساس التباين الإجمالي (بالنسبة إلى المتوسط ​​العام). ومن الواضح أن السبب في ذلك هو وجود اختلاف كبير بين المتوسطات، وهذا الاختلاف بين المتوسطات يفسر الفرق الحالي بين مجموع المربعات. في الواقع، إذا كنت تستخدم الوحدة لتحليل البيانات المقدمة تحليل التباين، سيتم الحصول على النتائج التالية:

كما يتبين من الجدول، مجموع المربعات سس=28 مقسومة على مجموع المربعات المعطاة بواسطة com.intragroupالتقلب ( 2+2=4 ; انظر الصف الثاني من الجدول) ومجموع المربعات بسبب اختلاف القيم المتوسطة. (28-(2+2)=24؛ أنظر الصف الأول من الجدول).

سس الأخطاء وسس تأثير.التباين داخل المجموعة ( سس) عادة ما يسمى التشتت أخطاء.وهذا يعني أنه عادة لا يمكن التنبؤ به أو تفسيره عند إجراء التجربة. على الجانب الآخر، سس تأثير(أو التباين بين المجموعات) يمكن تفسيره بالاختلافات بين وسائل مجموعات الدراسة. بمعنى آخر الانتماء إلى جماعة معينة يشرحالتباين بين المجموعات، لأن ونحن نعلم أن هذه المجموعات لديها وسائل مختلفة.

فحص الأهمية.وتناقش الأفكار الأساسية لاختبار الأهمية الإحصائية في الفصل المفاهيم الأساسية للإحصاء(الفصل 8). يشرح هذا الفصل أيضًا أسباب استخدام العديد من الاختبارات لنسبة التباين الموضح إلى التباين غير المفسر. مثال على هذا الاستخدام هو تحليل التباين نفسه. يعتمد اختبار الأهمية في تحليل التباين (ANOVA) على مقارنة التباين الناتج عن التباين بين المجموعات (يسمى يعني تأثير مربعأو آنسةتأثير) والتباين بسبب الاختلاف داخل المجموعة (يسمى يعني خطأ تربيعياأو آنسةخطأ). إذا كانت الفرضية الصفرية (تساوي المتوسطات في المجموعتين) صحيحة، فمن المتوقع أن يكون هناك اختلاف بسيط نسبيًا في متوسطات العينة بسبب الاختلاف العشوائي. ولذلك، في ظل فرضية العدم، فإن التباين داخل المجموعة سوف يتطابق عمليا مع التباين الإجمالي المحسوب دون الأخذ في الاعتبار عضوية المجموعة. ويمكن مقارنة الفروق الناتجة داخل المجموعة باستخدام F- اختبار يتحقق مما إذا كانت نسبة التباين أكبر بكثير من 1. في المثال الذي تمت مناقشته أعلاه F- ويبين المعيار أن الفرق بين المتوسطات ذو دلالة إحصائية.

المنطق الأساسي لتحليل التباين.لتلخيص ذلك، فإن الغرض من تحليل التباين (ANOVA) هو اختبار الأهمية الإحصائية للفرق بين المتوسطات (للمجموعات أو المتغيرات). يتم إجراء هذا الفحص باستخدام تحليل التباين، أي. وذلك بتقسيم التباين الكلي (التباين) إلى أجزاء، أحدها يرجع إلى الخطأ العشوائي (أي التباين داخل المجموعة)، والثاني يرتبط بالاختلافات في القيم المتوسطة. ثم يتم استخدام مكون التباين الأخير لتحليل الأهمية الإحصائية للفرق بين الوسائل. فإذا كان هذا الفرق معنويا، يتم رفض الفرضية الصفرية وقبول الفرضية البديلة القائلة بوجود فرق بين الوسيطتين.

المتغيرات التابعة والمستقلة.تسمى المتغيرات التي يتم تحديد قيمها عن طريق القياسات أثناء التجربة (على سبيل المثال، درجة الاختبار). متكلالمتغيرات. تسمى المتغيرات التي يمكن التحكم فيها في التجربة (على سبيل المثال، طرق التدريس أو المعايير الأخرى لتقسيم الملاحظات إلى مجموعات) عواملأو مستقلالمتغيرات. يتم وصف هذه المفاهيم بمزيد من التفصيل في الفصل المفاهيم الأساسية للإحصاء(الفصل 8).

تحليل متعدد المتغيرات من التباين

في ما سبق مثال بسيطيمكنك على الفور حساب اختبار t للعينات المستقلة باستخدام خيار الوحدة المناسب الإحصائيات والجداول الأساسية.ومن الطبيعي أن تتطابق النتائج التي تم الحصول عليها مع نتائج تحليل التباين. ومع ذلك، يحتوي تحليل التباين (ANOVA) على تقنيات مرنة وقوية يمكن استخدامها في دراسات أكثر تعقيدًا.

عوامل كثيرة.إن العالم معقد ومتعدد الأبعاد بطبيعته. المواقف التي يتم فيها وصف ظاهرة معينة بالكامل بواسطة متغير واحد نادرة للغاية. على سبيل المثال، إذا كنا نحاول تعلم كيفية زراعة طماطم كبيرة، فيجب أن نأخذ في الاعتبار العوامل المتعلقة بالتركيب الوراثي للنبات، ونوع التربة، والضوء، ودرجة الحرارة، وما إلى ذلك. وبالتالي، عند إجراء تجربة نموذجية، يتعين على المرء التعامل مع عدد كبير من العوامل. السبب الرئيسي وراء تفضيل استخدام ANOVA هو إجراء مقارنات متكررة لعينتين عند مستويات عوامل مختلفة باستخدام ر- المعيار هو أن تحليل التباين هو أكثر فعالوبالنسبة للعينات الصغيرة، فهي أكثر إفادة.

إدارة العوامل.لنفترض أنه في مثال تحليل العينتين الذي تمت مناقشته أعلاه، أضفنا عاملاً آخر، على سبيل المثال. أرضية- جنس. لتتكون كل مجموعة من 3 رجال و3 نساء. يمكن تقديم تصميم هذه التجربة على شكل جدول 2 × 2:

تجربة. مجموعة 1 تجربة. المجموعة 2
رجال2 6
3 7
1 5
متوسط2 6
نحيف4 8
5 9
3 7
متوسط4 8

قبل إجراء الحسابات، يمكنك ملاحظة أنه في هذا المثال، يحتوي التباين الإجمالي على ثلاثة مصادر على الأقل:

(1) خطأ عشوائي (ضمن تباين المجموعة)،

(2) التباين المرتبط بعضوية المجموعة التجريبية، و

(3) التباين بسبب جنس كائنات المراقبة.

(لاحظ أن هناك مصدرًا آخر محتملًا للتباين - تفاعل العوامل، وهو ما سنتحدث عنه لاحقًا). ماذا يحدث إذا لم ندرج أرضيةجنسكعامل في التحليل وحساب المعتاد ر-معيار؟ إذا قمنا بحساب مجموع المربعات، تجاهل أرضية -جنس(أي دمج كائنات من جنسين مختلفين في مجموعة واحدة عند حساب التباين داخل المجموعة، وبالتالي الحصول على مجموع المربعات لكل مجموعة يساوي سس= 10، ومجموع المربعات سس= 10+10 = 20)، فإننا نحصل على قيمة أكبر للتباين داخل المجموعة مقارنةً بتحليل أكثر دقة مع تقسيم إضافي إلى مجموعات فرعية وفقًا لـ نصف- جنس(في هذه الحالة، سيكون الوسط داخل المجموعة مساويًا لـ 2، وسيكون إجمالي مجموع المربعات داخل المجموعة مساويًا لـ سس = 2+2+2+2 = 8). ويرجع هذا الاختلاف إلى حقيقة أن متوسط ​​قيمة رجال - ذكورأقل من المتوسط ​​ل نحيف -أنثىوهذا الاختلاف في الوسائل يزيد من التباين الإجمالي داخل المجموعة عندما لا يؤخذ الجنس في الاعتبار. التحكم في تباين الخطأ يزيد من حساسية (قوة) الاختبار.

يوضح هذا المثال ميزة أخرى لتحليل التباين مقارنة بالتحليل التقليدي ر- معيار لعينتين. يتيح لك تحليل التباين دراسة كل عامل من خلال التحكم في قيم العوامل المتبقية. وهذا، في الواقع، هو السبب الرئيسي لقوتها الإحصائية الأكبر (يلزم وجود أحجام أصغر للعينات للحصول على نتائج ذات معنى). ولهذا السبب فإن تحليل التباين، حتى على العينات الصغيرة، يعطي المزيد من الناحية الإحصائية نتائج هامةمن البسيط ر- معيار.

تأثيرات التفاعل

هناك ميزة أخرى لاستخدام تحليل التباين مقارنة بالطرق التقليدية ر- المعيار: تحليل التباين يسمح لنا بالكشف تفاعلبين العوامل وبالتالي يسمح بدراسة نماذج أكثر تعقيدا. لتوضيح ذلك، فكر في مثال آخر.

التأثيرات الرئيسية، التفاعلات الزوجية (ثنائية العامل).لنفترض أن هناك مجموعتين من الطلاب، ومن الناحية النفسية فإن طلاب المجموعة الأولى مصممون على إكمال المهام الموكلة إليهم ويكونون هادفين أكثر من طلاب المجموعة الثانية التي تتكون من طلاب أكثر كسلاً. دعونا نقسم كل مجموعة عشوائيًا إلى نصفين ونعطي نصف كل مجموعة مهمة صعبة والنصف الآخر مهمة سهلة. سنقوم بعد ذلك بقياس مدى صعوبة عمل الطلاب في هذه المهام. متوسطات هذه الدراسة (الخيالية) مبينة في الجدول:

ما هي النتيجة التي يمكن استخلاصها من هذه النتائج؟ هل يمكن أن نستنتج ما يلي: (1) يعمل الطلاب بشكل مكثف في مهمة معقدة؛ (2) هل يعمل الطلاب المتحمسون بجهد أكبر من الطلاب الكسالى؟ لا تعكس أي من هذه العبارات جوهر الطبيعة المنهجية للوسائل الموضحة في الجدول. عند تحليل النتائج، سيكون من الأصح القول إن الطلاب المتحمسين فقط هم الذين يعملون بجدية أكبر في المهام الصعبة، بينما يعمل الطلاب الكسالى فقط بجدية أكبر في المهام السهلة. وبعبارة أخرى، شخصية الطلاب وصعوبة المهمة التفاعليؤثر كل منهما على الآخر في الجهد المبذول. هذا مثال التفاعل الزوجيبين شخصية الطلاب وصعوبة المهمة. لاحظ أن البيانين 1 و2 يصفان ذلك التأثيرات الرئيسية.

التفاعلات ذات الترتيب العالي.في حين أن التفاعلات الزوجية لا تزال سهلة نسبيًا في التفسير، إلا أن تفسير التفاعلات ذات الترتيب الأعلى يكون أكثر صعوبة. دعونا نتخيل أنه في المثال المذكور أعلاه، تم تقديم عامل آخر أرضية -جنسوحصلنا على جدول المتوسطات التالي:

ما هي الاستنتاجات التي يمكن استخلاصها الآن من النتائج التي تم الحصول عليها؟ تجعل المؤامرات المتوسطة من السهل تفسير التأثيرات المعقدة. تتيح لك وحدة ANOVA إنشاء هذه الرسوم البيانية بنقرة واحدة تقريبًا على الفأرة.

تمثل الصورة في الرسوم البيانية أدناه التفاعل الثلاثي العوامل الذي تتم دراسته.

بالنظر إلى الرسوم البيانية، يمكننا أن نقول أنه بالنسبة للنساء هناك تفاعل بين الشخصية وصعوبة الاختبار: فالنساء المتحمسات يعملن بجد أكبر في مهمة صعبة مقارنة بمهمة سهلة. وبالنسبة للرجال، يتم عكس نفس التفاعل. ويمكن ملاحظة أن وصف التفاعل بين العوامل يصبح أكثر إرباكًا.

طريقة عامة لوصف التفاعلات.في الحالة العامةويوصف التفاعل بين العوامل بأنه تغير في تأثير واحد تحت تأثير آخر. في المثال الذي تمت مناقشته أعلاه، يمكن وصف التفاعل الثنائي على أنه تغيير في التأثير الرئيسي للعامل الذي يميز صعوبة المهمة تحت تأثير العامل الذي يصف شخصية الطالب. وبالنسبة لتفاعل العوامل الثلاثة من الفقرة السابقة يمكننا القول أن تفاعل العاملين (صعوبة المهمة وشخصية الطالب) يتغير تحت تأثير جنسجنس. وإذا تمت دراسة تفاعل العوامل الأربعة يمكننا القول أن تفاعل العوامل الثلاثة يتغير تحت تأثير العامل الرابع، أي. هناك أنواع مختلفة من التفاعلات على مستويات مختلفة للعامل الرابع. لقد اتضح أن التفاعل بين خمسة عوامل أو أكثر ليس بالأمر غير المعتاد في العديد من المجالات.

خطط معقدة

التصاميم بين المجموعة وداخل المجموعة (تصاميم التدابير المتكررة)

عند المقارنة بين اثنين مجموعات مختلفةتستخدم عادة ر- معيار العينات المستقلة (من الوحدة الإحصائيات والجداول الأساسية). عند مقارنة متغيرين على نفس مجموعة الكائنات (الملاحظات)، يتم استخدامه ر-معيار للعينات التابعة. لتحليل التباين، من المهم أيضًا ما إذا كانت العينات مستقلة أم لا. إذا كانت هناك قياسات متكررة لنفس المتغيرات (مع ظروف مختلفةأو في أوقات مختلفة) لنفس الكائناتثم يتحدثون عن الحضور عامل التدابير المتكررة(أيضا يسمى عامل داخل المجموعة,حيث يتم حساب مجموع المربعات داخل المجموعة لتقييم أهميتها). إذا تمت مقارنة مجموعات مختلفة من الكائنات (على سبيل المثال، الرجال والنساء، وثلاث سلالات من البكتيريا، وما إلى ذلك)، فسيتم وصف الفرق بين المجموعات عامل بين المجموعات.تختلف طرق حساب معايير الأهمية لهذين النوعين من العوامل، ولكن المنطق العام والتفسيرات هي نفسها.

خطط بين وداخل المجموعة.في كثير من الحالات، تتطلب التجربة إدراج كل من عامل بين المواضيع وعامل التدابير المتكررة في التصميم. على سبيل المثال، يتم قياس المهارات الحسابية للطلاب والطالبات (حيث أرضية -جنس- عامل المجموعات) في بداية ونهاية الفصل الدراسي. ويشكل المقياسان لمهارات كل طالب عاملاً داخل المجموعة (عامل التدابير المتكررة). إن تفسير التأثيرات والتفاعلات الرئيسية بين المواد وعوامل القياسات المتكررة متسق، ومن الواضح أن كلا النوعين من العوامل يمكن أن يتفاعلا مع بعضهما البعض (على سبيل المثال، تكتسب النساء المهارات على مدار الفصل الدراسي، بينما يفقدها الرجال).

خطط غير مكتملة (متداخلة).

في كثير من الحالات يمكن إهمال تأثير التفاعل. ويحدث هذا إما عندما يكون من المعروف أنه لا يوجد تأثير للتفاعل بين السكان، أو عند اكتمال التنفيذ مضروبالخطة مستحيلة. على سبيل المثال، تتم دراسة تأثير أربعة إضافات للوقود على استهلاك الوقود. يتم اختيار أربع سيارات وأربعة سائقين. ممتلىء مضروبتتطلب التجربة ظهور كل مجموعة: مادة مضافة، سائق، سيارة - مرة واحدة على الأقل. وهذا يتطلب ما لا يقل عن 4 × 4 × 4 = 64 مجموعة من الاختبارات، وهو ما يستغرق وقتًا طويلاً. بالإضافة إلى ذلك، من غير المحتمل أن يكون هناك أي تفاعل بين السائق والمادة المضافة للوقود. مع أخذ هذا في الاعتبار، يمكنك استخدام الخطة المربعات اللاتينيةوالتي تحتوي على 16 مجموعة اختبار فقط (يتم تحديد الإضافات الأربعة بالحروف A وB وC وD):

تم وصف المربعات اللاتينية في معظم الكتب المتعلقة بالتصميم التجريبي (على سبيل المثال، Hays, 1988; Lindman, 1974; Milliken and Johnson, 1984; Winer, 1962) ولن يتم مناقشتها بالتفصيل هنا. لاحظ أن المربعات اللاتينية هي لانممتلىءالتصميمات التي لا يتم تضمين جميع مجموعات مستويات العوامل فيها. على سبيل المثال، السائق 1 يقود السيارة 1 فقط مع المادة المضافة A، والسائق 3 يقود السيارة 1 فقط مع المادة المضافة C. مستويات العامل إضافات ( A وB وC وD) متداخلة في خلايا الجدول السياراتس سائق -مثل البيض في الاعشاش. هذا قاعدة ذاكريمفيدة لفهم الطبيعة متداخلة أو متداخلةخطط. وحدة تحليل التباينيوفر طرق بسيطةتحليل خطط من هذا النوع.

تحليل التباين

الفكرة الرئيسية

في الفصل الأفكار الرئيسيةتمت مناقشة فكرة التحكم في العوامل وكيف أن إدراج العوامل المضافة يقلل من مجموع الأخطاء التربيعية ويزيد من القوة الإحصائية للتصميم. كل هذا يمكن أن يمتد إلى المتغيرات مع مجموعة مستمرة من القيم. عندما يتم تضمين هذه المتغيرات المستمرة كعوامل في التصميم، يتم استدعاؤها المتغيرات المشتركة.

المتغيرات المشتركة الثابتة

لنفترض أننا نقارن مهارات الرياضيات لمجموعتين من الطلاب الذين تم تدريسهم باستخدام كتابين دراسيين مختلفين. لنفترض أيضًا أن بيانات معدل الذكاء (IQ) متاحة لكل طالب. يمكنك افتراض أن معدل الذكاء مرتبط بمهارات الرياضيات واستخدام تلك المعلومات. ولكل مجموعة من مجموعتي الطلاب، يمكن حساب معامل الارتباط بين معدل الذكاء ومهارات الرياضيات. باستخدام معامل الارتباط هذا، من الممكن عزل نسبة التباين في المجموعات التي يتم تفسيرها بتأثير معدل الذكاء ونسبة التباين غير المبررة (انظر أيضًا المفاهيم الأساسية للإحصاء(الفصل 8) و الإحصائيات والجداول الأساسية(الفصل 9)). يتم استخدام الجزء المتبقي من التباين في التحليل كتباين للخطأ. إذا كان هناك ارتباط بين معدل الذكاء ومهارات الرياضيات، فيمكن تقليل تباين الأخطاء بشكل كبير سس/(ن-1) .

تأثير المتغيرات المشتركة علىF- معيار. F-يقوم المعيار بتقييم الدلالة الإحصائية للفرق في القيم المتوسطة في المجموعات، ويتم حساب نسبة التباين بين المجموعات ( آنسةتأثير) إلى تباين الخطأ ( آنسةخطأ) . لو آنسةخطأتنخفض، على سبيل المثال، عند مراعاة عامل الذكاء، القيمة Fيزيد.

الكثير من المتغيرات المشتركة.يمكن بسهولة توسيع المنطق المستخدم أعلاه لمتغير مشترك واحد (IQ) ليشمل متغيرات مشتركة متعددة. على سبيل المثال، بالإضافة إلى معدل الذكاء، يمكنك تضمين قياسات التحفيز والتفكير المكاني وما إلى ذلك. بدلا من معامل الارتباط المعتاد، يتم استخدامه معامل متعددالارتباطات.

عندما القيمةF -تناقص المعايير.في بعض الأحيان يؤدي إدخال المتغيرات المشتركة في التصميم التجريبي إلى تقليل الأهمية F-معايير . يشير هذا عادةً إلى أن المتغيرات المشتركة لا ترتبط فقط بالمتغير التابع (على سبيل المثال، مهارات الرياضيات) ولكن أيضًا مع العوامل (على سبيل المثال، الكتب المدرسية المختلفة). لنفترض أنه تم قياس معدل الذكاء في نهاية الفصل الدراسي، بعد عام تقريبًا من تدريس مجموعتين من الطلاب باستخدام كتابين دراسيين مختلفين. على الرغم من أنه تم تقسيم الطلاب إلى مجموعات بشكل عشوائي، فمن الممكن أن تكون الاختلافات في الكتب المدرسية كبيرة جدًا لدرجة أن مهارات الذكاء والرياضيات ستختلف بشكل كبير بين المجموعات. في هذه الحالة، لا تقلل المتغيرات المشتركة من تباين الخطأ فحسب، بل تقلل أيضًا من التباين بين المجموعة. بمعنى آخر، بعد التحكم في الاختلافات في معدل الذكاء بين المجموعات، لم تعد الاختلافات في مهارات الرياضيات ذات أهمية. يمكنك أن تقول ذلك بشكل مختلف. بعد "استبعاد" تأثير معدل الذكاء، يتم استبعاد تأثير الكتاب المدرسي على تطوير المهارات الرياضية عن غير قصد.

المعدلات المعدلة.عندما يؤثر المتغير المشترك على العامل بين المواضيع، ينبغي للمرء أن يقوم بالحساب الوسائل المعدلة، أي. تلك الوسائل التي يتم الحصول عليها بعد إزالة جميع التقديرات المتغيرة.

التفاعلات بين المتغيرات المشتركة والعوامل.مثلما يتم فحص التفاعلات بين العوامل، يمكن فحص التفاعلات بين المتغيرات المشتركة وبين مجموعات العوامل. لنفترض أن أحد الكتب المدرسية مناسب بشكل خاص للطلاب الأذكياء. الكتاب الثاني ممل للطلاب الأذكياء، ونفس الكتاب صعب للطلاب الأقل ذكاءً. ونتيجة لذلك، هناك علاقة إيجابية بين معدل الذكاء ونتائج التعلم في المجموعة الأولى (الطلاب الأكثر ذكاءً، نتائج أفضل) وصفر أو ارتباط سلبي طفيف في المجموعة الثانية (كلما كان الطالب أكثر ذكاءً، قل احتمال اكتسابه للمهارات الرياضية). من الكتاب المدرسي الثاني). تناقش بعض الدراسات هذا الموقف كمثال على انتهاك افتراضات تحليل التغاير. ومع ذلك، نظرًا لأن وحدة ANOVA تستخدم الأساليب الأكثر شيوعًا لتحليل التباين، فمن الممكن، على وجه الخصوص، تقييم الأهمية الإحصائية للتفاعل بين العوامل والمتغيرات المشتركة.

المتغيرات المشتركة المتغيرة

في حين تتم مناقشة المتغيرات المشتركة الثابتة في كثير من الأحيان في الكتب المدرسية، يتم ذكر المتغيرات المشتركة المتغيرة بشكل أقل تكرارًا. عادة، عند إجراء تجارب ذات قياسات متكررة، فإننا مهتمون بالاختلافات في قياسات نفس الكميات في نقاط زمنية مختلفة. وهي أننا مهتمون بأهمية هذه الاختلافات. إذا تم قياس المتغيرات المشتركة في وقت واحد مع قياسات المتغيرات التابعة، فيمكن حساب الارتباط بين المتغير المشترك والمتغير التابع.

على سبيل المثال، يمكن استكشاف الاهتمام بالرياضيات ومهارات الرياضيات في بداية الفصل الدراسي ونهايته. سيكون من المثير للاهتمام اختبار ما إذا كانت التغييرات في الاهتمام بالرياضيات مرتبطة بالتغيرات في مهارات الرياضيات.

وحدة تحليل التباينالخامس إحصائياتيقوم تلقائيًا بتقييم الأهمية الإحصائية للتغيرات في المتغيرات المشتركة في التصاميم حيثما أمكن ذلك.

التصاميم متعددة المتغيرات: التحليل متعدد المتغيرات للتباين والتباين

خطط بين المجموعات

جميع الأمثلة التي تمت مناقشتها سابقًا تتضمن متغيرًا تابعًا واحدًا فقط. عندما يكون هناك العديد من المتغيرات التابعة في نفس الوقت، يزداد تعقيد الحسابات فقط، لكن المحتوى والمبادئ الأساسية لا تتغير.

على سبيل المثال، يتم إجراء دراسة على كتابين دراسيين مختلفين. وفي نفس الوقت تتم دراسة مدى نجاح الطلاب في دراسة الفيزياء والرياضيات. في هذه الحالة، هناك متغيران تابعان وتحتاج إلى معرفة كيفية تأثير كتابين دراسيين مختلفين عليهما في وقت واحد. للقيام بذلك، يمكنك استخدام تحليل التباين متعدد المتغيرات (MANOVA). بدلا من البعد الواحد Fالمعيار، يتم استخدام متعدد الأبعاد Fاختبار (اختبار ويلكس l)، يعتمد على مقارنة مصفوفة التباين المشترك للخطأ ومصفوفة التباين المشترك بين المجموعات.

إذا كانت المتغيرات التابعة مرتبطة ببعضها البعض، فيجب أن يؤخذ هذا الارتباط في الاعتبار عند حساب معيار الأهمية. ومن الواضح أنه إذا تم تكرار نفس القياس مرتين، فلا يمكن الحصول على شيء جديد. وإذا أضيف قياس مرتبط به إلى قياس موجود، فبعضه معلومات جديدة، ولكن المتغير الجديد يحتوي على معلومات زائدة عن الحاجة، وهو ما ينعكس في التباين بين المتغيرات.

تفسير النتائج.إذا كان الاختبار الشامل متعدد المتغيرات مهمًا، فيمكننا أن نستنتج أن التأثير المقابل (على سبيل المثال، نوع الكتاب المدرسي) مهم. ومع ذلك، تطرح الأسئلة التالية. هل يؤثر نوع الكتاب المدرسي على تحسين مهارات الرياضيات فقط، أو المهارات البدنية فقط، أو كلتا المهارتين؟ في الواقع، بعد الحصول على اختبار مهم متعدد المتغيرات، يتم فحص اختبار أحادي المتغير للتأثير أو التفاعل الرئيسي الفردي. Fمعيار. بمعنى آخر، يتم فحص المتغيرات التابعة التي تساهم في أهمية الاختبار متعدد المتغيرات بشكل منفصل.

تصاميم التدابير المتكررة

إذا تم قياس مهارات الطلاب في الرياضيات والفيزياء في بداية الفصل الدراسي وفي نهايته، فهذه مقاييس متكررة. دراسة معيار الأهمية في مثل هذه الخطط هو التطور المنطقيحالة أحادية البعد. لاحظ أن التحليل متعدد المتغيرات لتقنيات التباين يستخدم أيضًا بشكل شائع لفحص أهمية عوامل القياسات المتكررة أحادية المتغير التي لها أكثر من مستويين. سيتم مناقشة التطبيقات المقابلة لاحقًا في هذا الجزء.

جمع القيم المتغيرة وتحليل التباين متعدد المتغيرات

حتى المستخدمين ذوي الخبرة لتحليل التباين أحادي المتغير ومتعدد المتغيرات غالبًا ما يجدون صعوبة في الحصول على نتائج مختلفة عند تطبيق تحليل التباين متعدد المتغيرات، على سبيل المثال، على ثلاثة متغيرات، وعند تطبيق تحليل التباين أحادي المتغير على مجموع هذه المتغيرات الثلاثة، كما لو كان ذلك كانت متغيرا واحدا.

فكرة خلاصةوالمتغيرات هي أن كل متغير يحتوي على بعض المتغيرات الحقيقية التي يتم دراستها، بالإضافة إلى خطأ في القياس العشوائي. لذلك، عند حساب متوسط ​​قيم المتغيرات، سيكون خطأ القياس أقرب إلى 0 لجميع القياسات وستكون القيم المتوسطة أكثر موثوقية. في الواقع، في هذه الحالة، يعد تطبيق ANOVA على مجموع المتغيرات أمرًا معقولًا وصحيحًا طريقة قوية. ومع ذلك، إذا كانت المتغيرات التابعة ذات طبيعة متعددة الأبعاد، فإن جمع قيم المتغيرات غير مناسب.

على سبيل المثال، لنفترض أن المتغيرات التابعة تتكون من أربعة مؤشرات النجاح في المجتمع. يميز كل مؤشر جانبا مستقلا تماما من النشاط البشري (على سبيل المثال، النجاح المهني، والنجاح في الأعمال التجارية، ورفاهية الأسرة، وما إلى ذلك). إن إضافة هذه المتغيرات يشبه إضافة التفاح والبرتقال. لن يكون مجموع هذه المتغيرات مقياسًا مناسبًا أحادي البعد. ولذلك، يجب التعامل مع هذه البيانات كمؤشرات متعددة الأبعاد تحليل التباين متعدد المتغيرات.

تحليل التباين والاختبارات اللاحقة

لماذا تتم مقارنة مجموعات منفصلة من المتوسطات؟

عادة، لا تتم صياغة الفرضيات حول البيانات التجريبية من حيث التأثيرات أو التفاعلات الرئيسية فحسب. ومن الأمثلة على ذلك هذه الفرضية: كتاب مدرسي معين يحسن مهارات الرياضيات لدى الطلاب الذكور فقط، في حين أن كتابًا دراسيًا آخر له نفس القدر من الفعالية تقريبًا لكلا الجنسين، ولكنه لا يزال أقل فعالية بالنسبة للذكور. ويمكن التنبؤ بأن فعالية الكتاب المدرسي تتفاعل مع جنس الطالب. ومع ذلك، تنطبق هذه التوقعات أيضًا طبيعةالتفاعلات. من المتوقع وجود اختلاف كبير بين الجنسين للطلاب الذين يستخدمون كتابًا واحدًا ونتائج مستقلة تقريبًا حسب الجنس للطلاب الذين يستخدمون الكتاب الآخر. عادة ما يتم فحص هذا النوع من الفرضيات باستخدام تحليل التباين.

تحليل التناقضات

باختصار، يسمح تحليل التباين بتقييم الأهمية الإحصائية لمجموعات خطية معينة من التأثيرات المعقدة. تحليل التباين هو العنصر الرئيسي والإلزامي في أي خطة ANOVA معقدة. وحدة تحليل التباينيحتوي على مجموعة متنوعة من إمكانيات تحليل التباين التي تسمح لك بعزل وتحليل أي نوع من مقارنة الوسائل.

خلفيمقارنات

في بعض الأحيان، نتيجة لمعالجة التجربة، يتم اكتشاف تأثير غير متوقع. على الرغم من أن الباحث المبدع سيكون قادرًا في معظم الحالات على تفسير أي نتيجة، إلا أن هذا لا يسمح بإجراء مزيد من التحليل والتقديرات للتنبؤ. هذه المشكلة هي واحدة من تلك التي معايير لاحقة، أي المعايير التي لا تستخدم بداهةفرضيات. لتوضيح ذلك، فكر في التجربة التالية. لنفترض أن هناك 100 بطاقة تحتوي على أرقام من 1 إلى 10. وبوضع كل هذه البطاقات في قبعة، نختار 5 بطاقات عشوائيًا 20 مرة، ونحسب القيمة المتوسطة (متوسط ​​الأرقام المكتوبة على البطاقات) لكل عينة. هل يمكنك أن تتوقع وجود عينتين تختلف وسائلهما بشكل كبير؟ هذا معقول جداً! من خلال اختيار عينتين لهما الحد الأقصى والحد الأدنى للمتوسط، يمكنك الحصول على اختلاف في المتوسطات يختلف تمامًا عن الفرق في المتوسطات، على سبيل المثال، في العينتين الأوليين. ويمكن استكشاف هذا الاختلاف، على سبيل المثال، باستخدام تحليل التباين. وبدون الخوض في التفاصيل، هناك العديد مما يسمى خلفيالمعايير التي تعتمد بالضبط على السيناريو الأول (أخذ الوسائل المتطرفة من 20 عينة)، أي أن هذه المعايير تعتمد على اختيار أكثر الوسائل اختلافا لمقارنة جميع الوسائل في التصميم. تُستخدم هذه المعايير لضمان عدم الحصول على تأثير مصطنع عن طريق الصدفة البحتة، على سبيل المثال، لاكتشاف فرق كبير بين الوسائل عند عدم وجوده. وحدة تحليل التباينيقدم مجموعة واسعة من هذه المعايير. عند ظهور نتائج غير متوقعة في تجربة تتضمن عدة مجموعات، إذن خلفيإجراءات فحص الأهمية الإحصائية للنتائج التي تم الحصول عليها.

مجموع المربعات من النوع الأول والثاني والثالث والرابع

الانحدار متعدد المتغيرات وتحليل التباين

هناك علاقة وثيقة بين أسلوب الانحدار متعدد المتغيرات وتحليل التباين (تحليل التباين). وفي كلتا الطريقتين تمت دراسة النموذج الخطي. باختصار، يمكن فحص جميع التصاميم التجريبية تقريبًا باستخدام الانحدار متعدد المتغيرات. خذ بعين الاعتبار التصميم البسيط التالي للمجموعات البينية 2 × 2.

د.ف. أ ب اكس ب
3 1 1 1
4 1 1 1
4 1 -1 -1
5 1 -1 -1
6 -1 1 -1
6 -1 1 -1
3 -1 -1 1
2 -1 -1 1

يحتوي العمودان A وB على رموز تميز مستويات العوامل A وB، ويحتوي العمود AxB على منتج العمودين A وB. يمكننا تحليل هذه البيانات باستخدام الانحدار متعدد المتغيرات. عامل د.ف.يعرف بأنه متغير تابع، متغيرات من أقبل اكس بكمتغيرات مستقلة. ستتزامن دراسة الأهمية لمعاملات الانحدار مع الحسابات في تحليل تباين أهمية التأثيرات الرئيسية للعوامل أو بوتأثير التفاعل اكس ب.

خطط غير متوازنة ومتوازنة

عند حساب مصفوفة الارتباط لجميع المتغيرات مثل البيانات الموضحة أعلاه، ستلاحظ أن التأثيرات الرئيسية للعوامل أو بوتأثير التفاعل اكس بغير مترابطة. وتسمى خاصية التأثيرات هذه أيضًا بالتعامد. يقولون الآثار أو ب - متعامدأو مستقلمن بعضهما البعض. إذا كانت جميع التأثيرات في الخطة متعامدة مع بعضها البعض، كما في المثال أعلاه، يقال أن الخطة هي متوازن.

الخطط المتوازنة لديها " ملكية جيدة" حسابات تحليل مثل هذه الخطط بسيطة للغاية. تتلخص جميع الحسابات في حساب العلاقة بين التأثيرات والمتغيرات التابعة. وبما أن التأثيرات متعامدة، فإن الارتباطات الجزئية (كما هي الحال في كامل متعدد الأبعادالانحدارات) لا يتم حسابها. ومع ذلك، في الحياه الحقيقيهالخطط ليست متوازنة دائمًا.

دعونا ننظر في البيانات الحقيقية مع عدد غير متساو من الملاحظات في الخلايا.

العامل أ العامل ب
ب1 ب2
أ1 3 4, 5
أ2 6, 6, 7 2

إذا قمنا بترميز هذه البيانات كما هو مذكور أعلاه وقمنا بحساب مصفوفة الارتباط لجميع المتغيرات، نجد أن عوامل التصميم مرتبطة ببعضها البعض. لم تعد العوامل في الخطة متعامدة ويتم تسمية مثل هذه الخطط غير متوازن.لاحظ أنه في المثال قيد النظر، فإن الارتباط بين العوامل يرجع بالكامل إلى الاختلاف في الترددات 1 و-1 في أعمدة مصفوفة البيانات. وبعبارة أخرى، فإن التصاميم التجريبية ذات أحجام الخلايا غير المتكافئة (وبشكل أكثر دقة، أحجام غير متناسبة) ستكون غير متوازنة، مما يعني أن التأثيرات والتفاعلات الرئيسية سوف تكون مشوشة. في هذه الحالة، يجب حساب الانحدار الكامل متعدد المتغيرات لحساب الأهمية الإحصائية للتأثيرات. هناك العديد من الاستراتيجيات هنا.

مجموع المربعات من النوع الأول والثاني والثالث والرابع

مجموع نوع المربعاتأناوثالثا. لفحص أهمية كل عامل في نموذج متعدد المتغيرات، يمكن حساب الارتباط الجزئي لكل عامل، بشرط أن تكون جميع العوامل الأخرى قد تم أخذها في الاعتبار بالفعل في النموذج. يمكنك أيضًا إدخال العوامل في النموذج بطريقة خطوة بخطوة، مع التقاط جميع العوامل التي تم إدخالها بالفعل في النموذج وتجاهل جميع العوامل الأخرى. على العموم هذا هو الفرق بين يكتب ثالثاو يكتبأنامجموع المربعات (تم تقديم هذا المصطلح في SAS، انظر على سبيل المثال SAS, 1982؛ ويمكن أيضًا العثور على مناقشة تفصيلية في Searle, 1987, p. 461; Woodward, Bonett, and Brecht, 1990, p. 216؛ أو Millliken وجونسون، 1984، ص 138).

مجموع نوع المربعاتثانيا.تتكون استراتيجية تشكيل النموذج "الوسيط" التالية من: التحكم في جميع التأثيرات الرئيسية عند فحص أهمية تأثير رئيسي واحد؛ في التحكم في جميع التأثيرات الرئيسية وجميع التفاعلات الزوجية عند فحص أهمية التفاعل الزوجي الفردي؛ في التحكم في جميع التأثيرات الرئيسية لجميع التفاعلات الزوجية وجميع تفاعلات العوامل الثلاثة؛ عند دراسة التفاعل الفردي لثلاثة عوامل، الخ. تسمى مجموع مربعات التأثيرات المحسوبة بهذه الطريقة يكتبثانيامجموع المربعات. لذا، يكتبثانيايتحكم مجموع المربعات في جميع التأثيرات ذات الترتيب نفسه والأدنى، مع تجاهل جميع التأثيرات ذات الترتيب الأعلى.

مجموع نوع المربعاترابعا. أخيرا، بالنسبة لبعض الخطط الخاصة مع الخلايا المفقودة (خطط غير مكتملة)، من الممكن حساب ما يسمى يكتب رابعامجموع المربعات. سيتم مناقشة هذه الطريقة لاحقًا فيما يتعلق بالتصميمات غير المكتملة (التصميمات ذات الخلايا المفقودة).

تفسير فرضية مجموع المربعات من الأنواع الأول والثاني والثالث

مجموع المربعات يكتبثالثاأسهل للتفسير. أذكر أن مجموع المربعات يكتبثالثافحص التأثيرات بعد التحكم في جميع التأثيرات الأخرى. على سبيل المثال، بعد العثور على دلالة إحصائية يكتبثالثاتأثير للعامل أفي الوحدة تحليل التباينيمكننا القول أن هناك تأثيرًا مهمًا واحدًا للعامل أ، بعد إدخال جميع التأثيرات (العوامل) الأخرى وتفسير هذا التأثير وفقًا لذلك. ربما يكون هذا هو نوع الاختبار الذي يهتم به الباحث في 99% من جميع تطبيقات ANOVA. عادة ما يتم حساب هذا النوع من مجموع المربعات في الوحدة النمطية تحليل التباينبشكل افتراضي، بغض النظر عما إذا كان الخيار محددًا أم لا نهج الانحدارأم لا (الأساليب القياسية المعتمدة في الوحدة تحليل التباينمشروح بالاسفل).

تم الحصول على تأثيرات كبيرة باستخدام مجموع المربعات يكتبأو يكتبثانياليس من السهل تفسير مجموع المربعات. ومن الأفضل تفسيرها في سياق الانحدار متعدد المتغيرات التدريجي. إذا، عند استخدام مجموع المربعات يكتبأناكان التأثير الرئيسي للعامل B معنويا (بعد إدراج العامل A في النموذج، ولكن قبل إضافة التفاعل بين A و B)، يمكننا أن نستنتج أن هناك تأثير رئيسي معنوي للعامل B، بشرط عدم وجود تفاعل بين العاملين A و B. (في حالة استخدام المعيار يكتبثالثا، كما تبين أن العامل B مهم، فيمكننا أن نستنتج أن هناك تأثير رئيسي معنوي للعامل B، بعد إدخال جميع العوامل الأخرى وتفاعلاتها في النموذج).

من حيث فرضية الوسائل الهامشية يكتبأناو يكتبثانياعادة لا يكون لها تفسير بسيط. في هذه الحالات، يقال أنه لا يمكن تفسير أهمية التأثيرات من خلال النظر فقط إلى الوسائل الهامشية. بل قدم صترتبط الوسائل بفرضية معقدة تجمع بين الوسائل وحجم العينة. على سبيل المثال، يكتبثانياستكون فرضيات العامل A في المثال البسيط لتصميم 2 × 2 الذي تمت مناقشته سابقًا (انظر Woodward, Bonett, and Brecht, 1990, p. 219):

nij- عدد الملاحظات في الخلية

uij- متوسط ​​القيمة في الخلية

ن. ي- المتوسط ​​الهامشي

وبدون الخوض في الكثير من التفاصيل (لمزيد من التفاصيل، انظر ميليكين وجونسون، 1984، الفصل 10)، فمن الواضح أن هذه ليست فرضيات بسيطة وفي معظم الحالات لا يشكل أي منها أهمية خاصة للباحث. ومع ذلك، هناك حالات عندما تكون الفرضيات يكتبأناقد تكون مثيرة للاهتمام.

النهج الحسابي الافتراضي في الوحدة تحليل التباين

الافتراضي إذا لم يتم تحديد الخيار نهج الانحدار، وحدة تحليل التباينالاستخدامات نموذج الخلية المتوسطة. يتميز هذا النموذج بحقيقة أن مجموع المربعات ل تأثيرات مختلفةيتم حسابها لمجموعات خطية من وسائل الخلية. في تجربة مضروبة كاملة، يؤدي ذلك إلى مجموع المربعات التي هي نفس مجموع المربعات التي تمت مناقشتها سابقًا كما يلي يكتب ثالثا. ومع ذلك، في الخيار المقارنات المخططة(فى الشباك نتائج أنوفا)، يمكن للمستخدم اختبار الفرضية مقابل أي مجموعة خطية من وسائل الخلايا الموزونة أو غير الموزونة. وهكذا، يمكن للمستخدم اختبار ليس فقط الفرضيات يكتبثالثاولكن الفرضيات من أي نوع (بما في ذلك يكتبرابعا). هذا النهج العاممفيد بشكل خاص عند فحص الخطط التي تحتوي على خلايا مفقودة (تسمى الخطط غير المكتملة).

بالنسبة للتصميمات العاملية الكاملة، يكون هذا النهج مفيدًا أيضًا عندما يريد المرء تحليل المتوسطات الهامشية المرجحة. على سبيل المثال، لنفترض أنه في التصميم البسيط 2 × 2 الذي تم النظر فيه سابقًا، نحتاج إلى المقارنة الموزونة (حسب مستويات العامل ب) متوسط ​​هامشي للعامل A. وهذا مفيد عندما لا يتم إعداد توزيع الملاحظات عبر الخلايا من قبل المجرب، ولكن تم إنشاؤه بشكل عشوائي، وتنعكس هذه العشوائية في توزيع عدد الملاحظات عبر مستويات العامل B في إجمالي.

على سبيل المثال، هناك عامل - سن الأرامل. تنقسم العينة المحتملة من المستجيبين إلى مجموعتين: أقل من 40 عامًا وأكثر من 40 عامًا (العامل ب). كان العامل الثاني (العامل أ) في الخطة هو ما إذا كانت الأرامل يتلقين دعمًا اجتماعيًا من بعض الوكالات أم لا (تم اختيار بعض الأرامل عشوائيًا، بينما تم اختيار البعض الآخر كعناصر تحكم). وفي هذه الحالة فإن توزيع الأرامل حسب العمر في العينة يعكس التوزيع الفعلي للأرامل حسب العمر في عدد السكان. تقييم فعالية المجموعة دعم اجتماعيالأرامل بواسطة كل الأعمارسوف تتوافق مع المتوسط ​​المرجح للاثنين الفئات العمرية(مع الأوزان المقابلة لعدد الملاحظات في المجموعة).

المقارنات المخططة

لاحظ أن مجموع معاملات التباين المدخلة لا يساوي بالضرورة 0 (صفر). وبدلاً من ذلك، سيقوم البرنامج تلقائيًا بإجراء التعديلات للتأكد من عدم الخلط بين الفرضيات المقابلة والمعدل العام.

لتوضيح ذلك، دعونا نعود إلى خطة 2 × 2 البسيطة التي تمت مناقشتها سابقًا. تذكر أن أعداد الملاحظات في خلايا هذا التصميم غير المتوازن هي -1 و2 و3 و1. لنفترض أننا نريد مقارنة المتوسطات الهامشية المرجحة للعامل A (المرجح بتكرار مستويات العامل B). يمكنك إدخال معاملات التباين:

لاحظ أن هذه المعاملات لا مجموعها يصل إلى 0. سيقوم البرنامج بضبط المعاملات بحيث يكون مجموعها 0، وسيتم الحفاظ على قيمها النسبية، أي:

1/3 2/3 -3/4 -1/4

ستقوم هذه التناقضات بمقارنة الوسائل المرجحة للعامل A.

فرضيات حول المعدل الرئيسي.يمكن استكشاف الفرضية القائلة بأن المتوسط ​​الرئيسي غير المرجح هو 0 باستخدام المعاملات:

تم اختبار الفرضية القائلة بأن المتوسط ​​الرئيسي المرجح هو 0 باستخدام:

لا يقوم البرنامج بأي حال من الأحوال بضبط نسب التباين.

تحليل الخطط ذات الخلايا المفقودة (خطط غير مكتملة)

تسمى التصميمات العاملية التي تحتوي على خلايا فارغة (معالجة مجموعات من الخلايا التي ليس لها ملاحظات) غير مكتملة. في مثل هذه التصاميم، تكون بعض العوامل عادة غير متعامدة ولا يمكن حساب بعض التفاعلات. غير موجود على الإطلاق أفضل طريقةتحليل مثل هذه الخطط.

نهج الانحدار

في بعض البرامج القديمة التي تعتمد على تحليل تصميمات ANOVA باستخدام الانحدار متعدد المتغيرات، يتم تحديد العوامل في التصميمات غير المكتملة افتراضيًا كالمعتاد (كما لو كان التصميم كاملاً). ثم متعدد الأبعاد تحليل الانحدارلهذه العوامل الوهمية المشفرة. ولسوء الحظ، تنتج هذه الطريقة نتائج يصعب تفسيرها، إن لم يكن من المستحيل، لأنه من غير الواضح كيف يساهم كل تأثير في المجموعة الخطية للوسائل. النظر في مثال بسيط التالية.

العامل أ العامل ب
ب1 ب2
أ1 3 4, 5
أ2 6, 6, 7 مٌفتَقد

إذا قمنا بإجراء الانحدار متعدد المتغيرات للنموذج المتغير التابع = الثابت + العامل أ + العامل ب، فإن الفرضية حول أهمية العوامل A و B من حيث المجموعات الخطية للوسائل تبدو كما يلي:

العامل أ: الخلية A1، B1 = الخلية A2، B1

العامل ب: الخلية A1، B1 = الخلية A1، B2

هذه الحالة بسيطة. في التصاميم الأكثر تعقيدًا، من المستحيل تحديد ما سيتم فحصه بالضبط.

تعني الخلية نهج ANOVA , فرضيات النوع الرابع

النهج الموصى به في الأدبيات والذي يبدو مفضلاً هو الدراسة الهادفة (من حيث أسئلة البحث) بداهةفرضيات حول الوسائل الملاحظة في خلايا الخطة. يمكن العثور على مناقشة تفصيلية لهذا النهج في دودج (1985)، هيبرجر (1989)، ميليكين وجونسون (1984)، سيرل (1987)، أو وودوارد، بونيت، وبريشت (1990). تُسمى أيضًا مجموعات المربعات المرتبطة بفرضيات حول المجموعة الخطية للوسائل في التصميمات غير المكتملة التي تدرس تقديرات جزء من التأثيرات بمجموعات المربعات رابعا.

التوليد التلقائي لفرضيات النوعرابعا. عندما تحتوي التصميمات متعددة المتغيرات على أنماط خلايا مفقودة معقدة، فمن المستحسن تحديد فرضيات متعامدة (مستقلة) يكون بحثها مكافئًا لفحص التأثيرات أو التفاعلات الرئيسية. تم تطوير الاستراتيجيات الخوارزمية (الحسابية) (المعتمدة على مصفوفة التصميم العكسية الزائفة) لتوليد موازين مناسبةلمثل هذه المقارنات. ولسوء الحظ، لم يتم تعريف الفرضيات النهائية بطريقة فريدة. وبطبيعة الحال، فإنها تعتمد على الترتيب الذي تم به تحديد التأثيرات ونادرا ما تسمح بتفسير بسيط. لذلك، يوصى بدراسة طبيعة الخلايا المفقودة بعناية، ثم صياغة الفرضيات يكتبرابعا, والتي تتوافق بشكل كبير مع أهداف الدراسة. ثم استكشف هذه الفرضيات باستخدام الخيار المقارنات المخططةفى الشباك نتائج. أسهل طريقة لتحديد المقارنات في هذه الحالة هي المطالبة بإدخال ناقل التناقضات لجميع العوامل معاًفى الشباك المقارنات المخططةبعد استدعاء مربع الحوار المقارنات المخططةسيتم عرض كافة المجموعات الخطة الحاليةويتم وضع علامة على تلك التي فاتتها.

الخلايا المفقودة واختبار تأثير محدد

هناك عدة أنواع من التصاميم التي لا يكون فيها موقع الخلايا المفقودة عشوائيًا، بل يتم التخطيط له بعناية، مما يسمح بتحليل بسيط للتأثيرات الرئيسية دون التأثير على التأثيرات الأخرى. على سبيل المثال، عندما لا يتوفر العدد المطلوب من الخلايا في الخطة، يتم استخدام الخطط غالبًا المربعات اللاتينيةلتقدير التأثيرات الرئيسية لعدة عوامل مع عدد كبير من المستويات. على سبيل المثال، يتطلب التصميم العاملي 4 × 4 × 4 × 4 256 خلية. وفي الوقت نفسه يمكنك استخدام الساحة اليونانية اللاتينيةلتقدير التأثيرات الرئيسية باستخدام 16 خلية فقط في التصميم (الفصل 1). تخطيط التجربة، المجلد الرابع، يحتوي على وصف تفصيلي لهذه الخطط). تسمى التصميمات غير المكتملة التي يمكن فيها تقدير التأثيرات الرئيسية (وبعض التفاعلات) باستخدام مجموعات خطية بسيطة من الوسائل خطط متوازنة غير مكتملة.

في التصميمات المتوازنة، فإن الطريقة القياسية (الافتراضية) لتوليد التباينات (الأوزان) للتأثيرات والتفاعلات الرئيسية ستنتج بعد ذلك جدولًا لتحليل التباينات حيث لا يتم الخلط بين مجموع المربعات للتأثيرات المعنية مع بعضها البعض. خيار تأثيرات محددةنافذة او شباك نتائجسيولد التباينات المفقودة عن طريق كتابة صفر على خلايا الخطة المفقودة. مباشرة بعد طلب الخيار تأثيرات محددةوبالنسبة للمستخدم الذي يقوم بفحص بعض الفرضيات، يظهر جدول النتائج مع الأوزان الفعلية. لاحظ أنه في التصميم المتوازن، يتم حساب مجموع مربعات التأثيرات المقابلة فقط إذا كانت تلك التأثيرات متعامدة (مستقلة) عن جميع التأثيرات والتفاعلات الرئيسية الأخرى. خلاف ذلك، تحتاج إلى استخدام الخيار المقارنات المخططةلاستكشاف مقارنات ذات معنى بين الوسائل.

الخلايا المفقودة والتأثيرات المجمعة/مصطلحات الخطأ

إذا كان الخيار نهج الانحدارفي لوحة بداية الوحدة تحليل التباينإذا لم يتم تحديده، فسيتم استخدام نموذج متوسط ​​الخلية عند حساب مجموع مربعات التأثيرات (الإعداد الافتراضي). إذا كان التصميم غير متوازن، فعند الجمع بين التأثيرات غير المتعامدة (انظر مناقشة الخيار أعلاه الخلايا المفقودة وتأثير محدد) يمكن للمرء الحصول على مجموع المربعات التي تتكون من مكونات غير متعامدة (أو متداخلة). النتائج التي تم الحصول عليها عادة ما تكون غير قابلة للتفسير. ولذلك، يجب على المرء أن يكون حذراً للغاية عند اختيار وتنفيذ التصاميم التجريبية المعقدة غير المكتملة.

هناك العديد من الكتب التي تحتوي على مناقشات تفصيلية للخطط أنواع مختلفة. (دودج، 1985؛ هيبرجر، 1989؛ ليندمان، 1974؛ ميليكين وجونسون، 1984؛ سيرل، 1987؛ وودوارد وبونيت، 1990)، ولكن هذا النوع من المعلومات يقع خارج نطاق هذا الكتاب المدرسي. ومع ذلك، سيتم توضيح التحليل لاحقًا في هذا القسم. أنواع مختلفةخطط.

الافتراضات وآثار مخالفة الافتراضات

الانحراف عن افتراض التوزيعات الطبيعية

لنفترض أن المتغير التابع يقاس على مقياس رقمي. لنفترض أيضًا أن المتغير التابع يتم توزيعه بشكل طبيعي داخل كل مجموعة. تحليل التباينيحتوي على مجموعة واسعة من الرسوم البيانية والإحصاءات لدعم هذا الافتراض.

آثار الاضطراب.على الاطلاق Fالمعيار مقاوم جدًا للانحرافات عن الحالة الطبيعية ( نتائج مفصلةانظر ليندمان، 1974). إذا كان التفرطح أكبر من 0، فإن قيمة الإحصائية هي Fقد تصبح صغيرة جدًا. يتم قبول الفرضية الصفرية، على الرغم من أنها قد لا تكون صحيحة. وينعكس الوضع عندما يكون التفرطح أقل من 0. وعادة ما يكون لانحراف التوزيع تأثير ضئيل على Fإحصائيات. إذا كان عدد الملاحظات في الخلية كبيرًا بدرجة كافية، فإن الانحراف عن الحالة الطبيعية ليس مهمًا بشكل خاص بسبب نظرية الحد المركزيوالتي بموجبها يكون توزيع القيمة المتوسطة قريباً من الطبيعي بغض النظر عن التوزيع الأولي. مناقشة مفصلة للاستدامة Fيمكن العثور على الإحصائيات في بوكس ​​وأندرسون (1955)، أو ليندمان (1974).

توحيد التباين

الافتراضات.من المفترض أن الفروق في مجموعات التصميم المختلفة هي نفسها. ويسمى هذا الافتراض الافتراض تجانس التباين.تذكر أنه في بداية هذا القسم، عند وصف حساب مجموع الأخطاء المربعة، قمنا بإجراء الجمع داخل كل مجموعة. إذا كانت التباينات في مجموعتين مختلفة عن بعضها البعض، فإن جمعها ليس طبيعيًا جدًا ولا يوفر تقديرًا لإجمالي التباين داخل المجموعة (نظرًا لأنه في هذه الحالة لا يوجد تباين إجمالي على الإطلاق). وحدة تحليل التباين -أنوفا/مانوفايحتوي على مجموعة كبيرة المعايير الإحصائيةالكشف عن الانحرافات عن تجانس افتراضات التباين.

آثار الاضطراب.يوضح ليندمان (1974، ص 33) ذلك Fالمعيار مستقر تمامًا فيما يتعلق بانتهاك افتراضات تجانس التباين ( عدم التجانسالتباين، انظر أيضًا Box, 1954a, 1954b; هسو، 1938).

حالة خاصة: ارتباط الوسائل والتباينات.هناك أوقات عندما Fيمكن للإحصاءات تضليل.يحدث هذا عندما ترتبط وسائل خلايا التصميم بالتباين. وحدة تحليل التباينيسمح لك ببناء مخططات تشتت أو الانحراف المعياريمقارنة بالمتوسطات لاكتشاف مثل هذا الارتباط. السبب وراء خطورة هذا الارتباط هو ما يلي. لنتخيل أن هناك 8 خلايا في الخطة، 7 منها لها نفس المتوسط ​​تقريبًا، وفي خلية واحدة يكون المتوسط ​​أعلى بكثير من الخلايا الأخرى. ثم Fقد يكشف الاختبار عن تأثير ذي دلالة إحصائية. لكن لنفترض أنه في خلية ذات قيمة متوسطة كبيرة يكون التباين أكبر بكثير من الخلايا الأخرى، أي. يعتمد متوسط ​​القيمة والتباين في الخلايا (كلما زاد المتوسط، زاد التباين). في هذه الحالة، لا يمكن الاعتماد على المتوسط ​​الكبير لأنه قد يكون ناجما عن تباين كبير في البيانات. لكن Fالإحصاءات على أساس متحدسوف يلتقط التباين داخل الخلايا المتوسط ​​الكبير، على الرغم من أن الاختبارات المستندة إلى التباين داخل كل خلية لن تعتبر جميع الاختلافات في الوسائل ذات أهمية.

غالبًا ما يحدث هذا النوع من البيانات (المتوسط ​​الكبير والتباين الكبير) عندما تكون هناك ملاحظات خارجية. تؤدي واحدة أو اثنتين من الملاحظات الخارجية إلى تغيير المتوسط ​​بشكل كبير وزيادة التباين بشكل كبير.

تجانس التباين والتباين

الافتراضات.تطبق التصميمات متعددة المتغيرات ذات التدابير التابعة متعددة المتغيرات أيضًا افتراض تجانس التباين الموصوف سابقًا. ومع ذلك، نظرًا لوجود متغيرات تابعة متعددة المتغيرات، فمن المطلوب أيضًا أن تكون الارتباطات المتبادلة (التباينات المشتركة) موحدة عبر جميع خلايا التصميم. وحدة تحليل التباينيقدم طرقًا مختلفة لاختبار هذه الافتراضات.

آثار الاضطراب. التناظرية متعددة الأبعاد F- المعيار - اختبار ويلكس. لا يُعرف الكثير عن مدى متانة اختبار ويلكس فيما يتعلق بانتهاكات الافتراضات المذكورة أعلاه. ومع ذلك، منذ تفسير نتائج الوحدة تحليل التباينيعتمد عادةً على أهمية التأثيرات وحيدة المتغير (بعد تحديد أهمية المعيار العام)، فإن مناقشة المتانة تتعلق بشكل أساسي بالتحليل أحادي المتغير للتباين. ولذلك، ينبغي دراسة أهمية التأثيرات وحيدة المتغير بعناية.

حالة خاصة: تحليل التباين.يمكن أن تحدث انتهاكات خطيرة بشكل خاص لتجانس التباين/التباين عند تضمين المتغيرات المشتركة في التصميم. على وجه الخصوص، إذا كان الارتباط بين المتغيرات المشتركة والتدابير التابعة يختلف عبر الخلايا في التصميم، فقد يترتب على ذلك سوء تفسير للنتائج. تذكر أن تحليل التباين يقوم بشكل أساسي بإجراء تحليل انحدار داخل كل خلية لعزل ذلك الجزء من التباين الذي يتم حسابه بواسطة المتغير المشترك. يشير تجانس افتراض التباين / التباين إلى أن تحليل الانحدار هذا يتم إجراؤه في القيد التالي: الجميع معادلات الانحدار(المنحدرات) هي نفسها لجميع الخلايا. إذا لم يكن هذا متوقعا، فقد يظهر هناك أخطاء كبيرة. وحدة تحليل التباينلديها عدة معايير خاصة لاختبار هذا الافتراض. يُنصح باستخدام هذه المعايير للتأكد من أن معادلات الانحدار للخلايا المختلفة هي نفسها تقريبًا.

الكروية والتماثل المعقد: أسباب استخدام نهج متعدد المتغيرات للقياسات المتكررة في تحليل التباين

في التصاميم التي تحتوي على عوامل قياسات متكررة بأكثر من مستويين، يتطلب استخدام تحليل التباين أحادي المتغير افتراضات إضافية: افتراض التناظر المركب وافتراض الكروية. ونادرا ما يتم استيفاء هذه الافتراضات (انظر أدناه). لذلك، في السنوات الاخيرةاكتسب تحليل التباين متعدد المتغيرات شعبية في مثل هذه التصاميم (يتم الجمع بين كلا النهجين في الوحدة تحليل التباين).

افتراض التماثل المعقدافتراض التماثل المركب هو أن التباينات (المشتركة داخل المجموعات) والتباينات المشتركة (المشتركة داخل المجموعات) لمختلف التدابير المتكررة متجانسة (نفسها). يعد هذا شرطًا كافيًا لكي يكون اختبار F أحادي المتغير صالحًا للقياسات المتكررة (أي أن قيم F المُبلغ عنها تكون في المتوسط ​​متوافقة مع توزيع F). ومع ذلك، في هذه الحالة هذا الشرط ليس ضروريا.

افتراض كروية.يعد افتراض الكروية شرطًا ضروريًا وكافيًا لكي يكون اختبار F صالحًا. وهو يتألف من حقيقة أن جميع الملاحظات داخل المجموعات مستقلة وموزعة بالتساوي. إن طبيعة هذه الافتراضات، وتأثير انتهاكها، لا يتم وصفها بشكل جيد في الكتب المتعلقة بتحليل التباين (ANOVA) - وسيتم تناولها في الفقرات التالية. كما سيتم توضيح أن نتائج النهج أحادي المتغير قد تختلف عن نتائج النهج متعدد المتغيرات، وسيتم توضيح ما يعنيه ذلك.

ضرورة استقلال الفرضيات.الطريقة العامة لتحليل البيانات في ANOVA هي تركيب النموذج. إذا، بالنسبة للنموذج الذي يناسب البيانات، هناك بعض بداهةالفرضيات، ثم تم تقسيم التباين لاختبار هذه الفرضيات (معايير التأثيرات الرئيسية، التفاعلات). من وجهة نظر حسابية، يولد هذا النهج مجموعة من التناقضات (مجموعة من مقارنات وسائل الخطة). أما إذا لم تكن المتناقضات مستقلة عن بعضها البعض، فإن تقسيم التباينات يصبح بلا معنى. على سبيل المثال، إذا كان هناك تناقضان أو بمتطابقتين ويتم استخراج الجزء المقابل من التباين، ثم يتم استخراج نفس الجزء مرتين. على سبيل المثال، من الغباء والعبث تحديد فرضيتين: "المتوسط ​​في الخلية 1 أعلى من المتوسط ​​في الخلية 2" و"المتوسط ​​في الخلية 1 أعلى من المتوسط ​​في الخلية 2". لذلك، يجب أن تكون الفرضيات مستقلة أو متعامدة.

الفرضيات المستقلة في التدابير المتكررة. خوارزمية عامة، تم تنفيذها في الوحدة تحليل التباين، سيحاول إنشاء تباينات مستقلة (متعامدة) لكل تأثير. بالنسبة لعامل التدابير المتكررة، توفر هذه التناقضات العديد من الفرضيات المتعلقة اختلافاتبين مستويات العامل قيد النظر. ومع ذلك، إذا كانت هذه الاختلافات مرتبطة داخل المجموعات، فإن التناقضات الناتجة لم تعد مستقلة. على سبيل المثال، في التدريس حيث يتم قياس الطلاب ثلاث مرات في فصل دراسي واحد، قد يحدث أن التغيير بين القياسين الأول والثاني يرتبط سلبًا بالتغيير بين القياسين الثاني والثالث للمواد. أولئك الذين أتقنوا معظم المواد بين البعدين الأول والثاني يتقنون جزءًا أصغر خلال الفترة التي مرت بين البعدين الثاني والثالث. في الواقع، بالنسبة لمعظم الحالات التي يتم فيها استخدام ANOVA للقياسات المتكررة، يمكن افتراض أن التغييرات عبر المستويات مرتبطة عبر المواضيع. ومع ذلك، عندما يحدث هذا، فإن افتراض التناظر المعقد وافتراض الكروية لا يصمدان ولا يمكن حساب التباينات المستقلة.

أثر المخالفات وسبل تصحيحها.عندما لا تصمد افتراضات التناظر أو الكروية المعقدة، قد ينتج تحليل التباين (ANOVA). نتائج خاطئة. قبل أن يتم تطوير الإجراءات متعددة المتغيرات بشكل كافٍ، تم اقتراح عدة افتراضات للتعويض عن انتهاكات هذه الافتراضات. (انظر على سبيل المثال Greenhouse & Geisser, 1959 وHuynh & Feldt, 1970). لا تزال هذه الأساليب مستخدمة على نطاق واسع (ولهذا السبب تم تقديمها في الوحدة تحليل التباين).

التحليل متعدد المتغيرات لنهج التباين في التدابير المتكررة.بشكل عام، تتعلق مشاكل التماثل والكروية المعقدة بحقيقة أن مجموعات التناقضات المدرجة في دراسة تأثيرات عوامل القياسات المتكررة (مع أكثر من مستويين) ليست مستقلة عن بعضها البعض. ومع ذلك، فإنها لا تحتاج إلى أن تكون مستقلة إذا تم استخدامها متعدد الأبعادمعيار التحقق المتزامن دلالة إحصائيةاثنين أو أكثر من التدابير المتكررة عامل التناقضات. هذا هو السبب في أن التحليل متعدد المتغيرات لتقنيات التباين أصبح يستخدم بشكل متزايد لاختبار أهمية عوامل القياسات المتكررة أحادية المتغير مع أكثر من مستويين. يتم قبول هذا النهج على نطاق واسع لأنه لا يتطلب عمومًا تناظرًا أو كروية معقدة.

الحالات التي لا يمكن فيها استخدام التحليل متعدد المتغيرات لنهج التباين.هناك أمثلة (تصاميم) حيث لا يمكن تطبيق التحليل متعدد المتغيرات لنهج التباين. هذه هي الحالات التي يوجد فيها عدد صغير من الموضوعات في التصميم والعديد من المستويات في عامل التدابير المتكررة. قد يكون هناك عدد قليل جدًا من الملاحظات لإجراء تحليل متعدد المتغيرات. على سبيل المثال، إذا كان هناك 12 موضوعا، ص = 4 عامل التدابير المتكررة، ولكل عامل ك = 3 المستويات. ثم تفاعل 4 عوامل سوف "يستهلك" (ك-1)ص = 2 4 = 16 درجات الحرية. ومع ذلك، لا يوجد سوى 12 موضوعًا، لذلك لا يمكن إجراء اختبار متعدد المتغيرات في هذا المثال. وحدة تحليل التباينسوف يكتشف هذه الملاحظات بشكل مستقل ويحسب المعايير أحادية البعد فقط.

الاختلافات في النتائج أحادية المتغير ومتعددة المتغيرات.إذا تضمنت الدراسة عددًا كبيرًا من التدابير المتكررة، فقد تكون هناك حالات حيث يؤدي نهج ANOVA للتدابير المتكررة أحادي المتغير إلى نتائج مختلفة تمامًا عن تلك التي تم الحصول عليها باستخدام النهج متعدد المتغيرات. وهذا يعني أن الاختلافات بين مستويات التدابير المتكررة المقابلة ترتبط عبر المواضيع. في بعض الأحيان تكون هذه الحقيقة ذات أهمية مستقلة.

التحليل متعدد المتغيرات للتباين ونمذجة المعادلات الهيكلية

في السنوات الأخيرة، أصبحت نمذجة المعادلات الهيكلية شائعة كبديل للتحليل متعدد المتغيرات للتباين (انظر، على سبيل المثال، Bagozzi and Yi, 1989; Bagozzi, Yi, and Singh, 1991; Cole, Maxwell, Arvey, and Salas, 1993). . يسمح هذا النهج باختبار الفرضيات ليس فقط حول الوسائل في المجموعات المختلفة، ولكن أيضًا حول مصفوفات الارتباط للمتغيرات التابعة. على سبيل المثال، يمكن للمرء تخفيف افتراضات تجانس التباينات والتباينات المشتركة وإدراج تباينات الخطأ والتباينات المشتركة بشكل واضح في النموذج الخاص بكل مجموعة. وحدة إحصائياتنمذجة المعادلات الهيكلية (SEPATH) (انظر المجلد الثالث) يسمح بمثل هذا التحليل.

تعريفات عامة

الغرض من تحليل التباين (ANOVA - تحليل التباين) هو اختبار أهمية الفرق بين المتوسطات في المجموعات المختلفة من خلال مقارنة تباينات هذه المجموعات. يسمح تقسيم التباين الإجمالي إلى مصادر متعددة (يعزى إلى تأثيرات التصميم المختلفة) بمقارنة التباين الناتج عن التباين بين المجموعة مع التباين الناتج عن التباين داخل المجموعة.

الفرضية التي يتم اختبارها هي أنه لا يوجد فرق بين المجموعتين. إذا كانت فرضية العدم صحيحة، فإن تقدير التباين المرتبط بالتباين داخل المجموعة يجب أن يكون قريبًا من تقدير التباين بين المجموعة. إذا كاذبة، فمن المهم أن ينحرف.

وبشكل عام يمكن تقسيم تحليل التباين إلى عدة أنواع:

  • أحادي البعد (متغير تابع واحد) ومتعدد الأبعاد (عدة متغيرات تابعة)؛

  • أحادي المتغير (متغير تجميع واحد) ومتعدد العوامل (عدة متغيرات تجميع) مع احتمال التفاعل بين العوامل؛

  • بقياسات بسيطة (يتم قياس المتغير التابع مرة واحدة فقط) وبقياسات متكررة (يتم قياس المتغير التابع عدة مرات).

في إحصائياتيتم تنفيذ جميع النماذج المعروفة لتحليل التباين.

في إحصائياتيمكن إجراء تحليل التباين باستخدام وحدة ANOVA الموجودة في الكتلة قاعدة إحصائيات (التحليل -> تحليل التباين (DA)). لبناء نوع خاص من النماذج، استخدم النسخة الكاملةتحليل التباين، معروض في وحدات النماذج الخطية العامة, النماذج الخطية وغير الخطية المعممة, نماذج الانحدار العام, نماذج عامة خاصة المربعات الصغرى من الكتلة تقنيات التحليل المتقدمة (STATISTICA النماذج الخطية/غير الخطية المتقدمة).

إلى البداية

مثال خطوة بخطوة في إحصائيات

سنوضح قوة ANOVA في إحصائيات، بالنظر إلى مثال نموذجي خطوة بخطوة.

يصف ملف البيانات المصدر مجموعة من الأشخاص ذوي مستويات مختلفة من الدخل والتعليم والعمر والجنس. دعونا نفكر في كيفية تأثير مستوى التعليم والعمر والجنس على مستوى الدخل.

حسب العمر، تم تقسيم جميع الناس إلى أربع مجموعات:

  • ما يصل إلى 30 سنة؛

  • من 31 إلى 40 سنة؛

  • من 41 إلى 50 سنة؛

  • من 51 سنة.

حسب مستوى التعليم تم تقسيمهم إلى 5 مجموعات:

  • ثانوية غير مكتملة؛

  • متوسط؛

  • المهني الثانوي؛

  • التعليم العالي غير المكتمل؛

  • أعلى.

وبما أن هذه بيانات نموذجية، فإن النتائج التي سيتم الحصول عليها ستكون ذات طبيعة نوعية بشكل أساسي وتوضح طريقة إجراء التحليل.

الخطوة 1: اختيار التحليل

دعنا نختار تحليل التباين من القائمة: التحليل -> طرق التحليل المتقدمة -> النماذج الخطية العامة.

أرز. 1. تحديد ANOVA من القائمة المنسدلة STATISTICA

بعد ذلك، سيتم فتح نافذة يتم فيها عرض أنواع مختلفة من التحليل. يختار نوع التحليلالتحليل العاملي للتباين.


أرز. 2. اختيار نوع التحليل

في هذه النافذة، يمكنك أيضًا اختيار كيفية إنشاء نموذج: وضع الحوار أو استخدام معالج التحليل. دعونا نختار وضع الحوار.

الخطوة 2: تحديد المتغيرات

من ملف البيانات المفتوحة، حدد المتغيرات للتحليل، انقر فوق الزر المتغيرات، أنت تأخذ:

دخل- المتغير التابع،

مستوى التعليم, أرضيةو عمر- العوامل الفئوية (المتنبئات).

لاحظ أن رموز العواملفي هذا المثال البسيط ليس عليك تحديده. عندما تضغط على الزر نعم, إحصائياتسيتم تعيينها تلقائيا.


أرز. 3. تحديد المتغيرات

الخطوة 3: تغيير الخيارات

دعنا نذهب إلى علامة التبويب خياراتفى الشباك عامل GLM نعم.


أرز. 4. علامة التبويب خيارات

في هذا الحوار يمكنك:

  • حدد عوامل عشوائية.

  • تعيين نوع معلمات النموذج؛

  • تشير إلى نوع مجموع المربعات (SS)، هناك 6 مجموعات مختلفة من المربعات (SS)؛

  • تمكين التحقق المتبادل.

دعنا نترك جميع الإعدادات الافتراضية (وهذا يكفي في معظم الحالات) ونضغط على الزر نعم.

الخطوة 4. تحليل النتائج - عرض كافة التأثيرات

ويمكن الاطلاع على نتائج التحليل في النافذة نتائجباستخدام علامات التبويب ومجموعات الأزرار. خذ بعين الاعتبار، على سبيل المثال، علامة التبويب نتائج.


أرز. 5. نافذة تحليل النتائج: علامة تبويب النتائج

من علامة التبويب هذه يمكنك الوصول إلى جميع النتائج الرئيسية. استخدم علامات التبويب الأخرى لمزيد من النتائج. زر أقليسمح لك بتعديل مربع حوار النتائج عن طريق إزالة علامات التبويب التي لا يتم استخدامها عادةً.

عند الضغط على الزر تحقق من جميع التأثيراتنحصل على الجدول التالي.


أرز. 6. جدول كافة التأثيرات

يعرض هذا الجدول النتائج الرئيسية للتحليل: مجموع المربعات، درجات الحرية، قيم اختبار F، مستويات الأهمية.

لسهولة الدراسة، آثار كبيرة (ص<.05) выделены красным цветом. Два главных эффекта (مستوى التعليمو عمر) وبعض التفاعلات في هذا المثال مهمة (ص<.05).

الخطوة 5. تحليل النتائج - عرض التأثيرات المحددة

أفضل طريقة لمعرفة مدى اختلاف متوسط ​​الدخل عبر الفئات هي استخدام الأدوات الرسومية. عندما تضغط على الزر جميع التأثيرات/الرسوماتسوف يظهر مربع الحوار التالي.


أرز. 7. نافذة الجدول لجميع التأثيرات

تسرد النافذة جميع التأثيرات التي يتم النظر فيها. تم وضع علامة على التأثيرات ذات الدلالة الإحصائية *.

على سبيل المثال، دعونا نختار التأثير عمر، في مجموعة عرضدعونا نشير طاولةوانقر نعم. يظهر جدول يوضح متوسط ​​قيمة المتغير التابع لكل مستوى تأثير. (دخل)وقيمة الخطأ القياسية وحدود الثقة.


أرز. 8. جدول الإحصائيات الوصفية حسب مستويات متغير العمر

من الملائم تقديم هذا الجدول في شكل رسوم بيانية. لهذا نختار جدولفي مجموعة عرضصندوق المحادثة طاولةجميع التأثيرات والضغط نعم. سوف يظهر الرسم البياني المقابل.


أرز. 9. رسم بياني لمتوسط ​​الدخل مقابل العمر

يوضح الرسم البياني بوضوح أن هناك اختلافًا في مستويات الدخل بين مجموعات الأشخاص من مختلف الأعمار. كلما زاد العمر زاد الدخل.

سنقوم بتنفيذ عمليات مماثلة لتفاعل عدة عوامل. في مربع الحوار دعنا نختار أرضية*عمروانقر نعم.


أرز. 10. رسم بياني لمتوسط ​​الدخل حسب الجنس والعمر

تم الحصول على نتيجة غير متوقعة: بالنسبة للأشخاص الذين شملهم الاستطلاع الذين تقل أعمارهم عن 50 عاما، يزداد مستوى الدخل مع تقدم العمر ولا يعتمد على الجنس؛ بالنسبة للأشخاص الذين شملهم الاستطلاع والذين تزيد أعمارهم عن 50 عامًا، تحصل النساء على دخل أكبر بكثير من الرجال.

يجدر بناء الرسم البياني الناتج من حيث المستوى التعليمي. ربما يتم انتهاك هذا النمط في بعض الفئات أو، على العكس من ذلك، عالمي. لهذا نختار مستوى التعليم * أرضية* عمروانقر نعم.


أرز. 11. رسم بياني لمتوسط ​​الدخل حسب الجنس والعمر ومستوى التعليم

نرى أن الاعتماد الناتج ليس نموذجيًا للتعليم المهني الثانوي والثانوي. وفي حالات أخرى يكون عادلا.

الخطوة 6. تحليل النتائج - تقييم جودة النموذج

أعلاه، تم استخدام الوسائل الرسومية لتحليل التباين بشكل رئيسي. دعونا نلقي نظرة على بعض النتائج المفيدة الأخرى التي يمكن الحصول عليها.

أولاً، من المثير للاهتمام معرفة مقدار التباين الذي يفسره العوامل المعنية وتفاعلاتها. للقيام بذلك، في علامة التبويب نتائجانقر على الزر نماذج R العامة. سيظهر الجدول التالي.

أرز. 12. جدول نموذج SS وبقايا SS

الرقم الموجود في العمود "تعيين". R2 - معامل الارتباط المتعدد التربيعي؛ فهو يوضح نسبة التباين التي يفسرها النموذج المبني. في حالتنا R2 = 0.195، مما يشير إلى انخفاض جودة النموذج. في الواقع، لا تتأثر مستويات الدخل فقط بالعوامل المدرجة في النموذج.

الخطوة 7. تحليل النتائج - تحليل التباين

في كثير من الأحيان يكون من الضروري ليس فقط تحديد الفرق في متوسط ​​قيمة المتغير التابع للفئات المختلفة، ولكن أيضًا تحديد حجم الفرق لفئات معينة. للقيام بذلك، يجب استكشاف التناقضات.

لقد تبين أعلاه أن مستوى الدخل بين الرجال والنساء يختلف اختلافاً كبيراً بالنسبة للأعمار التي تزيد عن 51 عاماً؛ وفي حالات أخرى، لا يكون الفرق كبيراً. دعونا نستنتج الفرق في مستويات الدخل للرجال والنساء الذين تزيد أعمارهم عن 51 عامًا وبين 40 و50 عامًا.

للقيام بذلك، انتقل إلى علامة التبويب التناقضاتوقم بتعيين جميع القيم على النحو التالي.


أرز. 13. علامة التبويب التناقضات

عند الضغط على الزر احسبسوف تظهر عدة جداول نحن مهتمون بجدول يتضمن تقديرات التباين.


أرز. 14. جدول تقييم التباين

الاستنتاجات التالية يمكن استخلاصها:

  • وبالنسبة للرجال والنساء الذين تزيد أعمارهم عن 51 عاماً، يبلغ الفرق في الدخل 48.7 ألف دولار، والفارق كبير؛

  • وبالنسبة للرجال والنساء الذين تتراوح أعمارهم بين 41 إلى 50 سنة، يبلغ الفرق في الدخل 1.73 ألف دولار، والفارق ليس كبيرا.

وبالمثل، يمكنك تعيين تباينات أكثر تعقيدًا أو استخدام إحدى المجموعات المحددة مسبقًا.

الخطوة 8: نتائج إضافية

باستخدام علامات التبويب المتبقية من نافذة النتائج، يمكنك الحصول على النتائج التالية:

  • متوسط ​​قيم المتغير التابع للتأثير المحدد – علامة التبويب متوسط;

  • التحقق من المعايير اللاحقة (لاحقة) - علامة التبويب خلفي;

  • التحقق من الافتراضات المقدمة لـ ANOVA – علامة التبويب الافتراضات;

  • بناء ملفات تعريف الاستجابة/الرغبة – علامة التبويب مظهر;

  • تحليل المخلفات – علامة التبويب بقايا الطعام;

  • مخرجات المصفوفات المستخدمة في التحليل – علامة التبويب المصفوفات;

  • وسيتم توضيح استخدام الإحصاءات في هذه المذكرة بمثال شامل. لنفترض أنك مدير الإنتاج في Perfect Parachute. المظلات مصنوعة من ألياف صناعية مقدمة من أربعة موردين مختلفين. واحدة من الخصائص الرئيسية للمظلة هي قوتها. تحتاج إلى التأكد من أن جميع الألياف الموردة لها نفس القوة. للإجابة على هذا السؤال يجب تصميم تصميم تجريبي لقياس قوة المظلات المنسوجة من الألياف الصناعية. موردين مختلفين. ستحدد المعلومات التي تم الحصول عليها من هذه التجربة المورد الذي يوفر المظلات الأكثر متانة.

    تتضمن العديد من التطبيقات تجارب تأخذ في الاعتبار مجموعات أو مستويات متعددة من عامل واحد. قد يكون لبعض العوامل، مثل درجة حرارة حرق السيراميك، مستويات رقمية متعددة (أي 300 درجة و350 درجة و400 درجة و450 درجة). العوامل الأخرى، مثل موقع العناصر في السوبر ماركت، قد يكون لها مستويات فئوية (على سبيل المثال، المورد الأول، المورد الثاني، المورد الثالث، المورد الرابع). تسمى التجارب ذات العامل الواحد، والتي يتم فيها تعيين الوحدات التجريبية بشكل عشوائي إلى مجموعات أو مستويات عامل، بالتجارب العشوائية الكاملة.

    الاستخدامF-معايير لتقييم الفروق بين عدة توقعات رياضية

    إذا كانت القياسات العددية للعامل في المجموعات مستمرة وتم استيفاء بعض الشروط الإضافية، يتم استخدام تحليل التباين (ANOVA) لمقارنة التوقعات الرياضية لعدة مجموعات. انتحليل س F فرجينياريانس). ويسمى تحليل التباين باستخدام التصميمات العشوائية الكاملة بإجراء ANOVA أحادي الاتجاه. في بعض النواحي، يعتبر مصطلح تحليل التباين تسمية خاطئة لأنه يقارن الاختلافات بين القيم المتوقعة للمجموعات وليس بين التباينات. ومع ذلك، يتم إجراء مقارنة التوقعات الرياضية بدقة على أساس تحليل اختلاف البيانات. في إجراء ANOVA، يتم تقسيم التباين الإجمالي في نتائج القياس إلى مجموعات بين المجموعات وداخل المجموعات (الشكل 1). يتم تفسير التباين داخل المجموعة بالخطأ التجريبي، ويتم تفسير التباين بين المجموعة بتأثيرات الظروف التجريبية. رمز معيدل على عدد المجموعات.

    أرز. 1. تقسيم التباين في تجربة عشوائية كاملة

    قم بتنزيل المذكرة بالتنسيق أو بالأمثلة بالتنسيق

    دعونا نتظاهر بذلك معيتم استخراج المجموعات من السكان المستقلين الذين لديهم توزيع طبيعي وتباين متساوي. الفرضية الصفرية هي أن التوقعات الرياضية للسكان هي نفسها: ح 0: μ 1 = μ 2 = ... = μ s. تنص الفرضية البديلة على أن التوقعات الرياضية ليست كلها متماثلة: ح 1: ليست كل μ j متشابهة ي= 1، 2، ...، ق).

    في التين. يعرض الشكل 2 الفرضية الصفرية الحقيقية حول التوقعات الرياضية للمجموعات الخمس المقارنة، بشرط أن يكون لدى السكان توزيع طبيعي ونفس التباين. المجموعات السكانية الخمس المرتبطة بمستويات مختلفة من العامل متطابقة. وبالتالي، فهي متراكبة على بعضها البعض، ولها نفس التوقع الرياضي والتنوع والشكل.

    أرز. 2. هناك خمس مجموعات سكانية عامة لها نفس التوقعات الرياضية: μ 1 = μ 2 = μ 3 = μ 4 = μ 5

    من ناحية أخرى، لنفترض أن الفرضية الصفرية خاطئة في الواقع، حيث أن المستوى الرابع له أعلى قيمة متوقعة، والمستوى الأول له قيمة متوقعة أقل قليلاً، والمستويات المتبقية لها نفس القيم المتوقعة وحتى أقل ( الشكل 3). لاحظ أنه، باستثناء القيم المتوقعة، فإن جميع المجموعات السكانية الخمسة متطابقة (أي أن لها نفس التباين والشكل).

    أرز. 3. لوحظ تأثير الظروف التجريبية: μ 4 > μ 1 > μ 2 = μ 3 = μ 5

    عند اختبار فرضية مساواة التوقعات الرياضية للعديد من المجموعات العامة، ينقسم التباين الإجمالي إلى قسمين: التباين بين المجموعات، بسبب الاختلافات بين المجموعات، والتباين داخل المجموعة، بسبب الاختلافات بين العناصر التي تنتمي إلى نفس المجموعة. يتم التعبير عن التباين الإجمالي من خلال مجموع المربعات (SST - مجموع إجمالي المربعات). وبما أن الفرضية الصفرية هي أن التوقعات الرياضية للجميع معالمجموعات متساوية مع بعضها البعض، والتباين الإجمالي يساوي مجموع الفروق المربعة بين الملاحظات الفردية والمتوسط ​​العام (متوسط ​​المتوسطات)، المحسوب لجميع العينات. الاختلاف الكامل:

    أين - المتوسط ​​العام، X إي - أنا-ه الملاحظة في ي-المجموعة أو المستوى، ن ي- عدد الملاحظات في يالمجموعة الرابعة, ن - المجموعالملاحظات في جميع المجموعات (أي. ن = ن 1 + ن 2 + … + ن ج), مع- عدد المجموعات أو المستويات المدروسة.

    الاختلاف بين المجموعة، يُطلق عليه عادةً مجموع المربعات بين المجموعات (SSA - مجموع المربعات بين المجموعات)، ويساوي مجموع مربعات الاختلافات بين متوسط ​​العينة لكل مجموعة يوالمعدل العام ، مضروبًا في حجم المجموعة المقابلة ن ي:

    أين مع- عدد المجموعات أو المستويات المدروسة، ن ي- عدد الملاحظات في يالمجموعة الرابعة, ي- متوسط ​​القيمة يالمجموعة الرابعة, - المتوسط ​​العام .

    الاختلاف داخل المجموعة، يُسمى عادةً مجموع المربعات داخل المجموعة (SSW - مجموع المربعات داخل المجموعات)، يساوي مجموع مربعات الاختلافات بين عناصر كل مجموعة ومتوسط ​​العينة لهذه المجموعة ي:

    أين Xاي جاي - أناالعنصر ال يالمجموعة الرابعة, ي- متوسط ​​القيمة يالمجموعة الرابعة.

    منذ أن تم مقارنتها معمستويات العامل، مجموع المربعات بين المجموعات لديه ق – 1درجات الحرية. كل من معالمستويات لديها ن ي – 1 درجات الحرية، وبالتالي فإن مجموع المربعات داخل المجموعة لديه ن- معدرجات الحرية، و

    وبالإضافة إلى ذلك، فإن المبلغ الإجمالي للمربعات لديه ن – 1 درجات الحرية، منذ كل ملاحظة Xاي جايتتم مقارنتها بالمعدل العام المحسوب على الكل نالملاحظات. إذا تم قسمة كل من هذه المجاميع على العدد المقابل من درجات الحرية، تنشأ ثلاثة أنواع من التشتت: com.intergroup(متوسط ​​المربع بين - MSA)، com.intragroup(متوسط ​​المربع داخل - MSW) و ممتلىء(متوسط ​​​​المجموع المربع - MST):

    على الرغم من أن الغرض الأساسي من تحليل التباين هو مقارنة التوقعات الرياضية معمجموعات من أجل التعرف على تأثير الظروف التجريبية، ويرجع اسمها إلى أن الأداة الرئيسية هي تحليل التباينات بمختلف أنواعها. إذا كانت الفرضية الصفرية صحيحة، وبين التوقعات الرياضية معلا توجد فروق ذات دلالة إحصائية بين المجموعات، وجميع الفروق الثلاثة - MSA وMSW وMST - هي تقديرات تباين σ 2الكامنة في البيانات التي تم تحليلها. وبالتالي، لاختبار الفرضية الصفرية ح 0: μ 1 = μ 2 = ... = μ sوالفرضية البديلة ح 1: ليست كل μ j متشابهة ي = 1, 2, …, مع)، فمن الضروري حساب الإحصائيات F-المعيار، وهو نسبة التباينين، MSA وMSW. امتحان F-الإحصائيات في تحليل التباين الأحادي

    إحصائيات F- خاضعة للمعايير F-التوزيع مع ق – 1درجات الحرية في البسط M.S.A.و ن – سدرجات الحرية في المقام م.س.و.. بالنسبة لمستوى أهمية معين α، يتم رفض فرضية العدم إذا تم حسابها F Fش، متأصل F-التوزيع مع ق – 1 ن – سدرجات الحرية في المقام. وهكذا، كما هو مبين في الشكل. 4, قاعدة حاسمةصيغت على النحو التالي: فرضية العدم ح 0مرفوض إذا و>وش; وإلا فلا يتم رفضه.

    أرز. 4. المجال الحاسم لتحليل التباين عند اختبار الفرضية ح 0

    إذا كانت الفرضية الصفرية ح 0صحيح، محسوب F-الإحصائيات قريبة من 1، نظرًا لأن البسط والمقام هما تقديرات بنفس الكمية - التشتت σ 2 المتأصل في البيانات التي تم تحليلها. إذا كانت الفرضية الصفرية ح 0خاطئة (وهناك فرق كبير بين التوقعات الرياضية للمجموعات المختلفة)، محسوبة F-ستكون الإحصائية أكبر بكثير من واحد لأن بسطها MSA يقدر تأثير الظروف التجريبية أو الاختلافات بين المجموعات بالإضافة إلى التباين الطبيعي للبيانات، في حين أن مقام MSW يقدر فقط التباين الطبيعي للبيانات. وبالتالي فإن إجراء ANOVA هو F-المعيار الذي يتم فيه رفض الفرضية الصفرية إذا تم حسابها، عند مستوى دلالة معين α F-الإحصائيات أكبر من القيمة الحرجة العليا Fش، متأصل F-التوزيع مع ق – 1درجات الحرية في البسط و ن – سدرجات الحرية في المقام، كما هو مبين في الشكل. 4.

    لتوضيح تحليل التباين أحادي الاتجاه، دعنا نعود إلى السيناريو الموضح في بداية الملاحظة. الغرض من التجربة هو تحديد ما إذا كانت المظلات المنسوجة من ألياف صناعية تم الحصول عليها من موردين مختلفين لها نفس القوة. كل مجموعة لديها خمس مظلات. يتم تقسيم المجموعات حسب المورد - المورد 1، المورد 2، المورد 3 والمورد 4. يتم قياس قوة المظلات باستخدام جهاز خاص يختبر النسيج للتأكد من عدم تمزقه على كلا الجانبين. يتم قياس القوة اللازمة لكسر المظلة على مقياس خاص. كلما زادت قوة الكسر، كلما كانت المظلة أقوى. يتيح لك برنامج Excel التحليل F-الإحصائيات بنقرة واحدة. اذهب من خلال القائمة بياناتتحليل البيانات، واختر السطر اتجاه واحد أنوفا، املأ النافذة التي تفتح (الشكل 5). يتم عرض النتائج التجريبية (قوة الكسر) وبعض الإحصائيات الوصفية ونتائج تحليل التباين أحادي الاتجاه في الشكل 1. 6.

    أرز. 5. النافذة تحليل أحادي الاتجاه لحزمة تحليل التبايناكسل

    أرز. 6. مؤشرات قوة المظلات المنسوجة من الألياف الاصطناعية التي تم الحصول عليها من موردين مختلفين والإحصائيات الوصفية ونتائج تحليل التباين أحادي الاتجاه

    يوضح تحليل الشكل 6 أن هناك بعض الاختلاف بين متوسطات العينة. متوسط ​​قوة الألياف التي تم الحصول عليها من المورد الأول هو 19.52، ​​من الثاني - 24.26، من الثالث - 22.84 ومن الرابع - 21.16. هل هذا الفرق ذو دلالة إحصائية؟ يظهر توزيع قوة التمزق في مخطط التشتت (الشكل 7). ويظهر بوضوح الاختلافات بين المجموعات وداخلها. إذا كانت كل مجموعة أكبر حجمًا، فيمكن استخدام مخطط الجذع والأوراق أو مخطط الصندوق أو مخطط الجرس لتحليلها.

    أرز. 7. رسم تخطيطي لتشتت القوة للمظلات المنسوجة من الألياف الاصطناعية التي تم الحصول عليها من أربعة موردين.

    تنص الفرضية الصفرية على عدم وجود فروق ذات دلالة إحصائية بين متوسط ​​درجات القوة: ح 0: μ 1 = μ 2 = μ 3 = μ 4. هناك فرضية بديلة وهي أن هناك موردًا واحدًا على الأقل يختلف متوسط ​​قوة أليافه عن الموردين الآخرين: ح 1: ليست كل μ j متماثلة ( ي = 1, 2, …, مع).

    المتوسط ​​الإجمالي (انظر الشكل 6) = المتوسط ​​(D12:D15) = 21.945؛ لتحديد ذلك، يمكنك أيضًا حساب متوسط ​​جميع الأرقام الأصلية العشرين: = AVERAGE(A3:D7). يتم حساب قيم التباين حزمة التحليلوتنعكس في اللوحة تحليل التباين(انظر الشكل 6): SSA = 63.286، SSW = 97.504، SST = 160.790 (انظر العمود سسالجداول تحليل التباينالشكل 6). يتم حساب المتوسطات بقسمة مجموع المربعات على العدد المناسب من درجات الحرية. بسبب ال مع= 4، أ ن= 20 نحصل على قيم درجات الحرية التالية؛ بالنسبة لـ SSA: ق – 1= 3؛ لSSW: ن-ج= 16؛ لطائرة أسرع من الصوت: ن - 1= 19 (انظر العمود df). وبالتالي: MSA = SSA / ( ق – 1)= 21.095؛ MSW = SSW / ( ن-ج) = 6.094؛ مست = طائرة أسرع من الصوت / ( ن - 1) = 8.463 (انظر العمود آنسة). F-الإحصائيات = MSA / MSW = 3.462 (انظر العمود F).

    القيمة الحرجة العليا Fش، سمة من سمات F-التوزيع، تحدده الصيغة =F.OBR(0.95;3;16) = 3.239. معلمات الدالة =F.OBR(): α = 0.05، البسط لديه ثلاث درجات من الحرية، والمقام له 16. وبالتالي، فإن المحسوبة F-إحصائية تساوي 3.462 تتجاوز القيمة الحرجة العليا Fش= 3.239، تم رفض الفرضية الصفرية (الشكل 8).

    أرز. 8. المنطقة الحرجة لتحليل التباين عند مستوى دلالة 0.05 إذا كان البسط لديه ثلاث درجات من الحرية والمقام هو -16

    ر-القيمة، أي احتمال أنه إذا كانت الفرضية الصفرية صحيحة F-الإحصائيات لا تقل عن 3.46 أي ما يعادل 0.041 أو 4.1% (انظر العمود القيمة pالجداول تحليل التباينالشكل 6). وبما أن هذه القيمة لا تتجاوز مستوى الأهمية α = 5%، فقد تم رفض فرضية العدم. علاوة على ذلك، ر- تشير القيمة إلى أن احتمال اكتشاف مثل هذا الفارق أو أكبر بين التوقعات الرياضية لعموم السكان، بشرط أن تكون في الواقع متماثلة، يساوي 4.1%.

    لذا. هناك فرق بين وسائل العينة الأربعة. كانت الفرضية الصفرية هي أن جميع التوقعات الرياضية للمجتمعات الأربعة متساوية. في ظل هذه الظروف، يتم حساب مقياس التباين الإجمالي (أي إجمالي تباين درجة حرارة سطح البحر) لقوة جميع المظلات عن طريق جمع مربعات الفروق بين كل ملاحظة X إيوالمعدل العام . تم بعد ذلك فصل التباين الإجمالي إلى مكونين (انظر الشكل 1). كان العنصر الأول هو التباين بين المجموعة في SSA والثاني هو التباين داخل المجموعة في SSW.

    ما الذي يفسر التباين في البيانات؟ بمعنى آخر، لماذا ليست جميع الملاحظات متماثلة؟ أحد الأسباب هو أن الشركات المختلفة توفر أليافًا ذات قوة مختلفة. وهذا ما يفسر جزئيًا سبب اختلاف التوقعات الرياضية للمجموعات: فكلما كان تأثير الظروف التجريبية أقوى، زاد الفرق بين التوقعات الرياضية للمجموعات. سبب آخر لتباين البيانات هو التباين الطبيعي لأي عملية، وفي هذه الحالة إنتاج المظلات. حتى لو تم شراء جميع الألياف من نفس المورد، فإن قوتها لن تكون هي نفسها، حيث تكون جميع الأشياء الأخرى متساوية. ولأن هذا التأثير يحدث داخل كل مجموعة، فإنه يسمى بالتباين داخل المجموعة.

    تسمى الاختلافات بين وسائل العينة بالتباين بين المجموعات SSA. يتم تفسير جزء من التباين داخل المجموعة، كما تمت الإشارة إليه سابقًا، من خلال انتماء البيانات إلى مجموعات مختلفة. ومع ذلك، حتى لو كانت المجموعات متماثلة تمامًا (أي كانت فرضية العدم صحيحة)، فسيظل الاختلاف بين المجموعات موجودًا. والسبب في ذلك هو التباين الطبيعي لعملية تصنيع المظلة. ونظرًا لاختلاف العينات، فإن وسائل العينة الخاصة بها تختلف عن بعضها البعض. ولذلك، إذا كانت الفرضية الصفرية صحيحة، فإن التباين بين المجموعة وداخلها يمثل تقديرًا للتقلب السكاني. إذا كانت الفرضية الصفرية خاطئة، فإن الفرضية بين المجموعات ستكون أكبر. هذه هي الحقيقة التي تكمن وراءها F-معايير مقارنة الفروق بين التوقعات الرياضية لعدة مجموعات.

    بعد إجراء تحليل التباين (ANOVA) أحادي الاتجاه وإيجاد فرق كبير بين الشركات، يظل من غير المعروف أي مورد يختلف بشكل كبير عن الآخرين. نحن نعلم فقط أن التوقعات الرياضية لعامة السكان ليست متساوية. بمعنى آخر، يختلف أحد التوقعات الرياضية على الأقل بشكل كبير عن التوقعات الأخرى. لتحديد المورد الذي يختلف عن الآخرين، يمكنك استخدامه إجراء توكيباستخدام المقارنات الزوجية بين الموردين. تم تطوير هذا الإجراء بواسطة جون توكي. بعد ذلك، قام هو وK. Kramer بتعديل هذا الإجراء بشكل مستقل للمواقف التي تختلف فيها أحجام العينات عن بعضها البعض.

    المقارنة المتعددة: إجراء توكي-كرامر

    في السيناريو الخاص بنا، تم استخدام تحليل التباين أحادي الاتجاه لمقارنة قوة المظلات. وبعد العثور على اختلافات كبيرة بين التوقعات الرياضية للمجموعات الأربع، فمن الضروري تحديد المجموعات التي تختلف عن بعضها البعض. على الرغم من وجود عدة طرق لحل هذه المشكلة، إلا أننا سنصف فقط إجراء المقارنة المتعددة بين توكي وكرامر. تعد هذه الطريقة مثالاً على إجراءات المقارنة اللاحقة لأن الفرضية التي يتم اختبارها يتم صياغتها بعد تحليل البيانات. يتيح إجراء Tukey-Kramer مقارنة جميع أزواج المجموعات في وقت واحد. في المرحلة الأولى، يتم حساب الاختلافات Xي -Xي، أين ي ≠يبين التوقعات الرياضية ق(ق – 1)/2مجموعات. النطاق الحرجيتم حساب إجراء توكي-كرامر بالصيغة:

    أين س ش- القيمة الحرجة العليا لتوزيع نطاق الطالب الذي معدرجات الحرية في البسط و ن - معدرجات الحرية في المقام.

    إذا لم تكن أحجام العينات هي نفسها، يتم حساب النطاق الحرج لكل زوج من التوقعات الرياضية على حدة. وفي المرحلة الأخيرة كل من ق(ق – 1)/2تتم مقارنة أزواج التوقعات الرياضية مع النطاق الحرج المقابل. تعتبر عناصر الزوج مختلفة بشكل كبير إذا كان معامل الفرق | اكس ي -Xي| بينهما يتجاوز النطاق الحرج.

    دعونا نطبق إجراء توكي-كرامر على مشكلة قوة المظلات. بما أن شركة المظلة لديها أربعة موردين، فهناك 4(4 - 1)/2 = 6 أزواج من الموردين للتحقق (الشكل 9).

    أرز. 9. المقارنات الزوجية لوسائل العينة

    نظرًا لأن جميع المجموعات لها نفس الحجم (أي جميعها). ن ي = ن ي)، يكفي حساب نطاق حرج واحد فقط. للقيام بذلك، وفقا للجدول أنوفا(الشكل 6) نحدد القيمة MSW = 6.094. ثم نجد القيمة س شعند α = 0.05، مع= 4 (عدد درجات الحرية في البسط) و ن- مع= 20 – 4 = 16 (عدد درجات الحرية في المقام). لسوء الحظ، لم أجد الوظيفة المقابلة في Excel، لذلك استخدمت الجدول (الشكل 10).

    أرز. 10. القيمة الحرجة لنطاق الطلاب س ش

    نحن نحصل:

    وبما أن 4.74 > 4.47 فقط (انظر الجدول السفلي في الشكل 9)، يوجد فرق ذو دلالة إحصائية بين المورد الأول والثاني. جميع الأزواج الأخرى لديها وسائل عينة لا تسمح لنا بالحديث عن اختلافاتها. وبالتالي، فإن متوسط ​​قوة المظلات المنسوجة من الألياف المشتراة من المورد الأول أقل بكثير من قوة المورد الثاني.

    الشروط اللازمة لتحليل التباين في اتجاه واحد

    عند حل مشكلة قوة المظلات، لم نتحقق مما إذا كانت الظروف التي يمكن في ظلها استخدام عامل واحد F-معيار. كيف تعرف إذا كان بإمكانك استخدام عامل واحد F-معيار عند تحليل بيانات تجريبية محددة؟ عامل واحد F- لا يمكن تطبيق المعيار إلا في حالة استيفاء ثلاثة افتراضات أساسية: يجب أن تكون البيانات التجريبية عشوائية ومستقلة، ولها توزيع طبيعي، ويجب أن تكون تبايناتها متساوية.

    التخمين الأول - العشوائية واستقلالية البيانات- يجب إجراؤها دائمًا، نظرًا لأن صحة أي تجربة تعتمد على عشوائية الاختيار و/أو عملية التوزيع العشوائي. لتجنب تحيز النتائج، من الضروري استخراج البيانات منها مععامة السكان بشكل عشوائي ومستقل عن بعضهم البعض. وبالمثل، ينبغي توزيع البيانات بشكل عشوائي عبر معمستويات العامل الذي نهتم به (المجموعات التجريبية). إن انتهاك هذه الشروط يمكن أن يؤدي إلى تشويه نتائج تحليل التباين بشكل خطير.

    التخمين الثاني - الحياة الطبيعية- يعني أن البيانات مستخرجة من السكان الموزعين بشكل طبيعي. أما بالنسبة لل ر- معايير تحليل التباين الأحادي على أساسها F-المعايير حساسة نسبيًا لانتهاك هذا الشرط. إذا لم ينحرف التوزيع بشكل كبير عن الطبيعي، فسيتم تحديد مستوى الأهمية F- يتغير المعيار قليلا، خاصة إذا كان حجم العينة كبيرا بما فيه الكفاية. إذا تم انتهاك شرط التوزيع الطبيعي بشكل خطير، فيجب تطبيقه.

    التخمين الثالث - تجانس التباين- تعني أن تباينات كل مجتمع متساوية مع بعضها البعض (أي σ 1 2 = σ 2 2 = ... = σ j 2). يتيح هذا الافتراض للشخص أن يقرر ما إذا كان سيتم فصل الفروق داخل المجموعة أو تجميعها. إذا كانت أحجام المجموعات متساوية، فإن شرط تجانس التباين ليس له تأثير يذكر على الاستنتاجات التي تم الحصول عليها باستخدام F-معايير. ومع ذلك، إذا كانت أحجام العينات غير متساوية، فإن انتهاك شرط مساواة التباينات يمكن أن يؤدي إلى تشويه نتائج تحليل التباين بشكل خطير. ولذلك، ينبغي بذل الجهود للتأكد من أن أحجام العينات متساوية. إحدى طرق التحقق من افتراض تجانس التباين هي المعيار ليفينهو موضح أدناه.

    إذا تم، من بين جميع الشروط الثلاثة، انتهاك شرط تجانس التباين فقط، فإن الإجراء مشابه لـ ر-معيار استخدام التباين المنفصل (لمزيد من التفاصيل، راجع). ومع ذلك، إذا تم انتهاك افتراضات التوزيع الطبيعي وتجانس التباين في وقت واحد، فمن الضروري تطبيع البيانات وتقليل الاختلافات بين التباينات أو تطبيق إجراء غير معلمي.

    اختبار ليفين لاختبار تجانس التباين

    بالرغم من F- المعيار مقاوم نسبيا لانتهاكات شرط مساواة التباين في المجموعات، والانتهاك الجسيم لهذا الافتراض يؤثر بشكل كبير على مستوى أهمية وقوة المعيار. ربما يكون المعيار هو أحد أقوى المعايير ليفين. للتحقق من المساواة في الفروق مععموم السكان، وسوف نقوم باختبار الفرضيات التالية:

    ح 0: σ 1 2 = σ 2 2 = … = σي 2

    ح 1: ليس الكل σ ي 2هي نفسها ( ي = 1, 2, …, مع)

    يعتمد اختبار ليفين المعدل على افتراض أنه إذا كان التباين متساويًا عبر المجموعات، فيمكن استخدام تحليل التباين لاختبار فرضية العدم الخاصة بمساواة التباينات القيم المطلقةالاختلافات بين الملاحظات ومتوسطات المجموعة. لذلك، يجب عليك أولاً حساب القيم المطلقة للاختلافات بين الملاحظات والمتوسطات في كل مجموعة، ثم إجراء تحليل التباين أحادي الاتجاه على القيم المطلقة الناتجة للاختلافات. لتوضيح معيار ليفين، دعونا نعود إلى السيناريو الموضح في بداية المذكرة. باستخدام البيانات الواردة في الشكل. في الشكل 6، سنجري تحليلًا مشابهًا، ولكن فيما يتعلق بوحدات الاختلافات في البيانات الأولية والوسيطات لكل عينة على حدة (الشكل 11).



جديد على الموقع

>

الأكثر شعبية