بيت تجويف الفم كيفية التحقق من أهمية معاملات الارتباط. الاختبار: تقييم أهمية معاملات الانحدار والارتباط باستخدام اختبار الطالب f

كيفية التحقق من أهمية معاملات الارتباط. الاختبار: تقييم أهمية معاملات الانحدار والارتباط باستخدام اختبار الطالب f

يمارس. بالنسبة لمناطق المنطقة، يتم توفير بيانات 199X؛
رقم المنطقة متوسط ​​نصيب الفرد من الأجر المعيشي في اليوم لشخص واحد قادر على العمل، فرك. X متوسط ​​الأجر اليومي، فرك، في
1 78 133
2 82 148
3 87 134
4 79 154
5 89 162
6 106 195
7 67 139
8 88 158
9 73 152
10 87 162
11 76 159
12 115 173
مطلوب:
1. أنشئ معادلة خطية للانحدار الزوجي لـ y من x.
2. احسب معامل خطيالارتباط الزوجي ومتوسط ​​خطأ التقريب.
3. تقييم الأهمية الإحصائية لمعلمات الانحدار والارتباط.
4. قم بإجراء توقعات أجور y مع قيمة متوقعة لمتوسط ​​مستوى الكفاف للفرد x تصل إلى 107% من المستوى المتوسط.
5. تقييم دقة التنبؤ عن طريق حساب خطأ التنبؤ وفاصل الثقة الخاص به.

حلتجد باستخدام الآلة الحاسبة.
الاستخدام طريقة الرسم .
تُستخدم هذه الطريقة لتصوير شكل الارتباط بين المدروسين بشكل مرئي المؤشرات الاقتصادية. للقيام بذلك، يتم رسم رسم بياني في نظام إحداثيات مستطيل، ويتم رسم القيم الفردية للخاصية الناتجة Y على طول المحور الإحداثي، ويتم رسم القيم الفردية للعامل المميز X على طول محور الإحداثي السيني.
تسمى مجموعة النقاط لخصائص المحصلة والعامل مجال الارتباط.
بناءً على مجال الارتباط، يمكننا أن نفترض (بالنسبة للمجتمع) أن العلاقة بين جميع القيم الممكنة لـ X وY هي علاقة خطية.
معادلة الانحدار الخطي هي y = bx + a + ε
هنا ε خطأ عشوائي (الانحراف، الاضطراب).
أسباب وجود الخطأ العشوائي:
1. الفشل في تضمين متغيرات تفسيرية مهمة في نموذج الانحدار.
2. تجميع المتغيرات. على سبيل المثال، تعد دالة الاستهلاك الإجمالي محاولة للتعبير بشكل عام عن إجمالي قرارات الإنفاق الفردية. هذا مجرد تقريب للعلاقات الفردية التي لها معايير مختلفة.
3. وصف غير صحيح لهيكل النموذج؛
4. المواصفات الوظيفية غير صحيحة.
5. أخطاء القياس.
بما أن الانحرافات ε i لكل ملاحظة محددة i عشوائية وقيمها في العينة غير معروفة، إذن:
1) من الملاحظات x i و y i يمكن الحصول على تقديرات المعلمات α و β فقط
2) تقديرات المعلمات α و β لنموذج الانحدار هي القيم a و b على التوالي، وهي عشوائية بطبيعتها، لأن تتوافق مع عينة عشوائية.
بعد ذلك، سيكون لمعادلة الانحدار المقدرة (المنشأة من بيانات العينة) الشكل y = bx + a + ε، حيث e i هي القيم المرصودة (التقديرات) للأخطاء ε i و a و b، على التوالي، تقديرات لـ المعلمات α و β لنموذج الانحدار الذي ينبغي العثور عليه.
لتقدير المعلمات α و β - يتم استخدام طريقة المربعات الصغرى (طريقة المربعات الصغرى).
نظام المعادلات العادية.
بالنسبة لبياناتنا، فإن نظام المعادلات له الشكل
من المعادلة الأولى نعبر عن a ونعوض به في المعادلة الثانية
نحصل على ب = 0.92، أ = 76.98
معادلة الانحدار:
ص = 0.92 س + 76.98

1. معلمات معادلة الانحدار.
وسائل العينة.



فروق العينة:


الانحراف المعياري


معامل الارتباط
نحسب مؤشر قرب الاتصال. هذا المؤشر هو نموذج معامل الارتباط الخطي، والذي يتم حسابه بواسطة الصيغة:

يأخذ معامل الارتباط الخطي القيم من -1 إلى +1.
يمكن أن تكون الروابط بين الخصائص ضعيفة وقوية (قريبة). ويتم تقييم معاييرهم وفقا لمقياس تشادوك:
0.1 < r xy < 0.3: слабая;
0.3 < r xy < 0.5: умеренная;
0.5 < r xy < 0.7: заметная;
0.7 < r xy < 0.9: высокая;
0.9 < r xy < 1: весьма высокая;
في مثالنا، العلاقة بين متوسط ​​الأجر اليومي ومتوسط ​​الأجر المعيشي للفرد عالية ومباشرة.
1.2. معادلة الانحدار(تقدير معادلة الانحدار).

معادلة الانحدار الخطي هي y = 0.92 x + 76.98
معاملات المعادلة الانحدارالخطييمكن أن تعطى معنى اقتصاديا.
المعامل b = 0.92 يوضح متوسط ​​التغير في المؤشر الفعال (بوحدات القياس y) مع زيادة أو نقصان في قيمة العامل x لكل وحدة قياسه. في هذا المثال، مع زيادة قدرها 1 فرك. على مستوى الكفاف للفرد في اليوم، يرتفع متوسط ​​الأجر اليومي بمعدل 0.92.
يُظهر المعامل a = 76.98 رسميًا المستوى المتوقع لمتوسط ​​الأجر اليومي، ولكن فقط إذا كانت x=0 قريبة من قيم العينة.
من خلال استبدال قيم x المناسبة في معادلة الانحدار، يمكننا تحديد القيم المحاذاة (المتوقعة) لمؤشر الأداء y(x) لكل ملاحظة.
يتم تحديد العلاقة بين متوسط ​​الأجر اليومي ومتوسط ​​الحد الأدنى للكفاف للفرد في اليوم من خلال علامة معامل الانحدار b (إذا > 0 - علاقة مباشرة، وإلا - معكوس). في مثالنا، الاتصال مباشر.
معامل المرونة.
لا يُنصح باستخدام معاملات الانحدار (في المثال ب) لتقييم تأثير العوامل بشكل مباشر على الخاصية الناتجة إذا كان هناك اختلاف في وحدات قياس المؤشر الناتج y وخاصية العامل x.
ولهذه الأغراض، يتم حساب معاملات المرونة ومعاملات بيتا. تم العثور على معامل المرونة بالصيغة:


ويوضح النسبة المئوية في المتوسط ​​التي تتغير فيها السمة الفعالة y عندما تتغير سمة العامل x بنسبة 1٪. ولا يأخذ في الاعتبار درجة تقلب العوامل.
معامل المرونة أقل من 1. لذلك، إذا تغير متوسط ​​تكلفة المعيشة للفرد يوميًا بنسبة 1%، فإن متوسط ​​الأجر اليومي سيتغير بأقل من 1%. وبعبارة أخرى، فإن تأثير متوسط ​​مستوى الكفاف للفرد X على متوسط ​​الأجر اليومي Y ليس كبيرًا.
معامل بيتايظهر بأي جزء من قيمة متوسطه انحراف مربعسوف تتغير القيمة المتوسطة للخاصية الناتجة عندما تتغير خاصية العامل بقيمة انحرافها المعياري مع تثبيت قيمة المتغيرات المستقلة المتبقية عند مستوى ثابت:

أولئك. ستؤدي الزيادة في x بالانحراف المعياري لهذا المؤشر إلى زيادة متوسط ​​الأجر اليومي Y بمقدار 0.721 انحراف معياري لهذا المؤشر.
1.4. خطأ في التقريب.
دعونا نقيم جودة معادلة الانحدار باستخدام خطأ التقريب المطلق.


وبما أن الخطأ أقل من 15%، فيمكن استخدام هذه المعادلة كانحدار.
معامل التحديد.
ويسمى مربع معامل الارتباط (المتعدد) بمعامل التحديد، وهو يوضح نسبة التباين في السمة الناتجة مفسرة بالتباين في سمة العامل.
في أغلب الأحيان، عند تفسير معامل التحديد، يتم التعبير عنه كنسبة مئوية.
R2 = 0.722 = 0.5199
أولئك. وفي 51.99% من الحالات، تؤدي التغيرات في متوسط ​​مستوى الكفاف للفرد x إلى تغير في متوسط ​​الأجر اليومي y. بمعنى آخر أن دقة اختيار معادلة الانحدار متوسطة. يتم تفسير نسبة 48.01% المتبقية من التغير في متوسط ​​الأجر اليومي Y بعوامل لم تؤخذ في الاعتبار في النموذج.

س ذ × 2 ذ 2 س س ص ص (خ) (ص ط -y cp) 2 (ص-ص(خ)) 2 (x i -x cp) 2 |y - yx |:y
78 133 6084 17689 10374 148,77 517,56 248,7 57,51 0,1186
82 148 6724 21904 12136 152,45 60,06 19,82 12,84 0,0301
87 134 7569 17956 11658 157,05 473,06 531,48 2,01 0,172
79 154 6241 23716 12166 149,69 3,06 18,57 43,34 0,028
89 162 7921 26244 14418 158,89 39,06 9,64 11,67 0,0192
106 195 11236 38025 20670 174,54 1540,56 418,52 416,84 0,1049
67 139 4489 19321 9313 138,65 280,56 0,1258 345,34 0,0026
88 158 7744 24964 13904 157,97 5,06 0,0007 5,84 0,0002
73 152 5329 23104 11096 144,17 14,06 61,34 158,34 0,0515
87 162 7569 26244 14094 157,05 39,06 24,46 2,01 0,0305
76 159 5776 25281 12084 146,93 10,56 145,7 91,84 0,0759
115 173 13225 29929 19895 182,83 297,56 96,55 865,34 0,0568
1027 1869 89907 294377 161808 1869 3280,25 1574,92 2012,92 0,6902

2. تقدير معلمات معادلة الانحدار.
2.1. أهمية معامل الارتباط.

باستخدام جدول الطالب بمستوى الأهمية α=0.05 ودرجات الحرية k=10 نجد t Crit:
تي الحرجة = (10;0.05) = 1.812
حيث m = 1 هو عدد المتغيرات التوضيحية.
إذا لوحظ t > t حرج، فإن القيمة الناتجة لمعامل الارتباط تعتبر مهمة (تم رفض الفرضية الصفرية التي تنص على أن معامل الارتباط يساوي الصفر).
وبما أن tobs > t Crit، فإننا نرفض الفرضية القائلة بأن معامل الارتباط يساوي 0. وبعبارة أخرى، فإن معامل الارتباط ذو دلالة إحصائية.
في الانحدار الخطي المزدوج t 2 r = t 2 b ومن ثم اختبار الفرضيات حول أهمية الانحدار ومعاملات الارتباط يعادل اختبار الفرضيات حول الأهمية معادلة خط مستقيمتراجع.

2.3. تحليل دقة تحديد تقديرات معامل الانحدار.
التقدير غير المتحيز لتشتت الاضطرابات هو القيمة:


S 2 y = 157.4922 - تباين غير مفسر (مقياس لانتشار المتغير التابع حول خط الانحدار).

12.5496 - الخطأ المعياري في التقدير (خطأ الانحدار المعياري).
س أ - الانحراف المعياريالمتغير العشوائي أ.


S b - الانحراف المعياري للمتغير العشوائي ب.


2.4. فترات الثقة للمتغير التابع.
يفترض التنبؤ الاقتصادي المبني على النموذج الذي تم إنشاؤه أن العلاقات الموجودة مسبقًا بين المتغيرات يتم الحفاظ عليها خلال فترة المهلة الزمنية.
للتنبؤ بالمتغير التابع للسمة الناتجة، من الضروري معرفة القيم المتوقعة لجميع العوامل المدرجة في النموذج.
يتم استبدال القيم المتوقعة للعوامل في النموذج ويتم الحصول على تقديرات النقطة التنبؤية للمؤشر قيد الدراسة.
(أ + ب س ع ± ε)
أين

لنحسب حدود الفاصل الزمني الذي سيتركز فيه 95% القيم الممكنة Y لعدد غير محدود من الملاحظات وX p = 94

(76.98 + 0.92*94 ± 7.8288)
(155.67;171.33)
مع احتمال 95%، من الممكن ضمان أن قيمة Y لعدد غير محدود من الملاحظات لن تقع خارج حدود الفواصل الزمنية التي تم العثور عليها.
2.5. اختبار الفرضيات المتعلقة بمعاملات معادلة الانحدار الخطي.
1) إحصائيات ر. اختبار الطالب ر.
دعونا نتحقق من الفرضية H 0 حول مساواة معاملات الانحدار الفردية إلى الصفر (إذا كان البديل لا يساوي H 1) عند مستوى الدلالة α=0.05.
تي الحرجة = (10;0.05) = 1.812


وبما أن 3.2906 > 1.812 تم التأكد من الأهمية الإحصائية لمعامل الانحدار b (نرفض فرضية أن هذا المعامل يساوي صفر).


منذ 3.1793 > 1.812، تم تأكيد الأهمية الإحصائية لمعامل الانحدار a (نحن نرفض الفرضية القائلة بأن هذا المعامل يساوي الصفر).
فاصل الثقة لمعاملات معادلة الانحدار.
دعونا نحدد فترات الثقةمعاملات الانحدار والتي تبلغ ثباتها 95% ستكون كما يلي:
(ب - ر النقطة الحرجة S ب ; ب + ر النقطة الحرجة S ب)
(0.9204 - 1.812 0.2797; 0.9204 + 1.812 0.2797)
(0.4136;1.4273)

(أ - ر lang=SV>a)
(76.9765 - 1.812 24.2116; 76.9765 + 1.812 24.2116)
(33.1051;120.8478)
مع احتمال 95% يمكن القول أن قيمة هذه المعلمة سوف تقع في الفاصل الزمني الذي تم العثور عليه.
2) إحصائيات F. معيار فيشر.
يتم اختبار أهمية نموذج الانحدار باستخدام اختبار Fisher's F، والذي يتم العثور على قيمته المحسوبة كنسبة التباين في سلسلة الملاحظات الأصلية للمؤشر قيد الدراسة والتقدير غير المتحيز لتباين التسلسل المتبقي لهذا النموذج.
إذا كانت القيمة المحسوبة بدرجات الحرية k1=(m) وk2=(n-m-1) أكبر من القيمة المجدولة عند مستوى دلالة معين، فإن النموذج يعتبر مهمًا.

حيث m هو عدد العوامل في النموذج.
درجة دلالة إحصائيةيتم تنفيذ الانحدار الخطي المقترن باستخدام الخوارزمية التالية:
1. تم طرح فرضية صفرية مفادها أن المعادلة ككل غير ذات دلالة إحصائية: H 0: R 2 =0 عند مستوى الأهمية α.
2. بعد ذلك، حدد القيمة الفعلية للمعيار F:


حيث m=1 للانحدار الزوجي.
3. قيمة الجدولتم تحديدها من جداول توزيع فيشر لمستوى دلالة معين، مع الأخذ في الاعتبار عدد درجات الحرية ل المبلغ الإجماليالمربعات (التباين الأكبر) هي 1 وعدد درجات الحرية لمجموع المربعات المتبقية (التباين الأصغر) في الانحدار الخطي هو n-2.
4. إذا كانت القيمة الفعلية لاختبار F أقل من القيمة الجدولية، فيقولون أنه لا يوجد سبب لرفض الفرضية الصفرية.
وبخلاف ذلك يتم رفض الفرضية الصفرية وقبول الفرضية البديلة حول الأهمية الإحصائية للمعادلة ككل باحتمال (1-α).
القيمة الجدولية للمعيار مع درجات الحرية k1=1 و k2=10، Fkp = 4.96
وبما أن القيمة الفعلية لـ F > Fkp، فإن معامل التحديد ذو دلالة إحصائية (التقدير الموجود لمعادلة الانحدار موثوق به إحصائياً).

المرحلة 3. إيجاد العلاقات بين البيانات

الارتباط الخطي

المرحلة الأخيرة من مهمة دراسة الارتباطات بين الظواهر هي تقييم مدى قرب الارتباط بناءً على المؤشرات اتصال الارتباط. تعتبر هذه المرحلة مهمة جدًا لتحديد التبعيات بين العامل وخصائص الأداء، وبالتالي لإمكانية التشخيص والتنبؤ بالظاهرة قيد الدراسة.

تشخبص(من التعرف على التشخيص اليوناني) - تحديد جوهر وخصائص حالة الجسم أو الظاهرة بناءً على دراستها الشاملة.

تنبؤ بالمناخ(من التنبؤ اليوناني، التنبؤ) - أي تنبؤ محدد، حكم على حالة أي ظاهرة في المستقبل (توقعات الطقس، نتائج الانتخابات، وما إلى ذلك). التنبؤ هو فرضية مبنية على أساس علمي حول الحالة المستقبلية المحتملة للنظام أو الجسم أو الظاهرة قيد الدراسة والمؤشرات التي تميز هذه الحالة. التنبؤ - تطوير التنبؤ، خاص بحث علميآفاق محددة لتطوير أي ظاهرة.

لنتذكر تعريف الارتباط:

علاقة- الاعتماد بين المتغيرات العشوائية، معبرا عنه في أن توزيع قيمة واحدة يعتمد على قيمة قيمة أخرى.

ويلاحظ وجود علاقة ليس فقط بين الخصائص الكمية، ولكن أيضا بين الخصائص النوعية. يخرج طرق مختلفةومؤشرات لتقييم مدى قرب العلاقات. ولن نتوقف إلا عند معامل الارتباط الزوجي الخطي والذي يستخدم عندما تكون هناك علاقة خطية بين المتغيرات العشوائية. من الناحية العملية، غالبًا ما تكون هناك حاجة لتحديد مستوى الارتباط بين المتغيرات العشوائية ذات الأبعاد غير المتساوية، لذلك من المرغوب فيه أن يكون هناك نوع من الخصائص عديمة الأبعاد لهذا الاتصال. هذه الخاصية (مقياس الاتصال) هي معامل الارتباط الخطي ص س ص، والتي يتم تحديدها بواسطة الصيغة

أين , .

بالإشارة إلى و، يمكننا الحصول على التعبير التالي لحساب معامل الارتباط

.

إذا قدمنا ​​هذا المفهوم الانحراف الطبيعي والذي يعبر عن انحراف القيم المترابطة عن المتوسط ​​بكسور الانحراف المعياري:



عندها سيأخذ التعبير الخاص بمعامل الارتباط الشكل

.

إذا قمت بحساب معامل الارتباط باستخدام القيم النهائية للمتغيرات العشوائية الأصلية من جدول الحساب، فيمكن حساب معامل الارتباط باستخدام الصيغة

.

خصائص معامل الارتباط الخطي:

1). معامل الارتباط هو كمية بلا أبعاد.

2). |ص| 1 جنيه استرليني أو .

3). , أ، ب= const، - لن تتغير قيمة معامل الارتباط إذا تم ضرب (أو قسمة) جميع قيم المتغيرات العشوائية X و Y على ثابت.

4). , أ، ب= const، - لن تتغير قيمة معامل الارتباط إذا زادت (أو انخفضت) جميع قيم المتغيرات العشوائية X و Y بمقدار ثابت.

5). توجد علاقة بين معامل الارتباط ومعامل الانحدار:

ويمكن تفسير قيم معاملات الارتباط على النحو التالي:

المعايير الكمية لتقييم مدى قرب الاتصال:

لأغراض النذير، القيم مع |r| > 0.7.

معامل الارتباط يسمح لنا باستنتاج الوجود الاعتماد الخطيبين متغيرين عشوائيين، ولكن لا يشير إلى أي من المتغيرين يسبب التغيير في الآخر. في الواقع، يمكن أن يوجد اتصال بين متغيرين عشوائيين دون وجود علاقة سبب ونتيجة بين القيم نفسها، لأن يمكن أن يكون سبب التغيير في كلا المتغيرين العشوائيين هو تغيير (تأثير) الثالث.

معامل الارتباط ص س صمتماثل فيما يتعلق بالمتغيرات العشوائية قيد النظر Xو ي. وهذا يعني أنه لتحديد معامل الارتباط، لا يهم تمامًا أي من الكميات مستقلة وأيها تابعة.

أهمية معامل الارتباط

حتى ل كميات مستقلةوقد يختلف معامل الارتباط عن الصفر بسبب التشتت العشوائي لنتائج القياس أو بسبب عينة صغيرة من المتغيرات العشوائية. ولذلك، ينبغي التحقق من أهمية معامل الارتباط.

يتم التحقق من أهمية معامل الارتباط الخطي على أساس اختبار الطالب :

.

لو ر > ر كر(ص، ن-2)، فإن معامل الارتباط الخطي يكون معنويا، وبالتالي فإن العلاقة الإحصائية تكون معنوية أيضا Xو ي.

.

ولتسهيل الحساب تم إنشاء جداول قيم حدود الثقة لمعاملات الارتباط أرقام مختلفةدرجات الحرية و = ن-2 (اختبار ثنائي الذيل) ومستويات أهمية مختلفة أ= 0.1؛ 0.05؛ 0.01 و 0.001. يعتبر الارتباط هاما إذا تجاوز معامل الارتباط المحسوب قيمة حد الثقة لمعامل الارتباط للمعطى المعطى Fو أ.

للكبار نو أ= 0.01 يمكن حساب قيمة حد الثقة لمعامل الارتباط باستخدام الصيغة التقريبية

.

كما لوحظ مراراً وتكراراً، من أجل التوصل إلى استنتاج إحصائي حول وجود أو عدم وجود ارتباط بين المتغيرات قيد الدراسة، من الضروري التحقق من أهمية معامل ارتباط العينة. نظرًا لأن موثوقية الخصائص الإحصائية، بما في ذلك معامل الارتباط، تعتمد على حجم العينة، فقد ينشأ موقف عندما يتم تحديد قيمة معامل الارتباط بالكامل من خلال التقلبات العشوائية في العينة التي يتم حسابها على أساسها . إذا كانت هناك علاقة معنوية بين المتغيرات، فيجب أن يكون معامل الارتباط مختلفًا بشكل كبير عن الصفر. وإذا لم يكن هناك ارتباط بين المتغيرات قيد الدراسة فإن معامل الارتباط للمجتمع يساوي صفراً. في البحث العملي، كقاعدة عامة، تعتمد على ملاحظات العينة. مثل أي خاصية إحصائية، فإن معامل ارتباط العينة هو متغير عشوائيأي أن قيمها متناثرة بشكل عشوائي حول المعلمة السكانية التي تحمل الاسم نفسه (القيمة الحقيقية لمعامل الارتباط). إذا لم يكن هناك ارتباط بين المتغيرات، فإن معامل ارتباطها في المجتمع يساوي الصفر. ولكن نظرًا للطبيعة العشوائية للتشتت، تكون المواقف ممكنة بشكل أساسي عندما تكون بعض معاملات الارتباط المحسوبة من عينات من هذه المجموعة السكانية مختلفة عن الصفر.

هل يمكن أن ترجع الفروق المرصودة إلى التقلبات العشوائية في العينة، أم أنها تعكس تغيرا كبيرا في الظروف التي تشكلت فيها العلاقات بين المتغيرات؟ إذا كانت قيم معامل ارتباط العينة تقع ضمن منطقة التشتت،

ونظراً لطبيعة المؤشر نفسه عشوائية، فهذا لا يعد دليلاً على عدم وجود علاقة. وأكثر ما يمكن قوله هو أن البيانات الرصدية لا تنفي عدم وجود علاقة بين المتغيرات. أما إذا كانت قيمة معامل ارتباط العينة تقع خارج منطقة التشتت المذكورة، فقد استنتجوا أنها تختلف بشكل كبير عن الصفر، ويمكننا افتراض وجود فرق إحصائي بين المتغيرات اتصال ذو معنى. ويسمى المعيار المستخدم لحل هذه المشكلة، على أساس توزيع الإحصائيات المختلفة، بمعيار الأهمية.

يبدأ إجراء اختبار الأهمية بصياغة الفرضية الصفرية ب منظر عاميكمن في حقيقة أنه لا توجد فروق ذات دلالة إحصائية بين معلمة العينة ومعلمة المجتمع. الفرضية البديلة هي أن هناك اختلافات كبيرة بين هذه المعلمات. على سبيل المثال، عند اختبار وجود ارتباط في مجتمع ما، فإن الفرضية الصفرية هي أن معامل الارتباط الحقيقي هو صفر. إذا أدى الاختبار إلى عدم قبول الفرضية الصفرية، فإن معامل ارتباط العينة يختلف بشكل كبير عن الصفر (معامل الارتباط الصفري) تم رفض الفرضية وتم قبول البديل، وبعبارة أخرى، فإن الافتراض بأن المتغيرات العشوائية غير مترابطة في المجتمع يجب اعتباره لا أساس له من الصحة، والعكس صحيح، إذا تم قبول الفرضية الصفرية بناءً على معيار الأهمية، أي أنها تقع في المنطقة المسموح بها للتشتت العشوائي، فلا يوجد سبب لاعتبار افتراض المتغيرات غير المرتبطة في المجتمع أمرًا مشكوكًا فيه.

في اختبار الأهمية، يحدد الباحث مستوى الأهمية (أ) الذي يوفر بعض الثقة العملية بأن الاستنتاجات الخاطئة لن يتم استخلاصها إلا في حالات نادرة جدًا. يعبر مستوى الأهمية عن احتمال رفض الفرضية الصفرية عندما تكون صحيحة بالفعل. من الواضح أنه من المنطقي اختيار هذا الاحتمال بأقل قدر ممكن.

ليكن معروفًا توزيع خاصية العينة، وهو تقدير غير متحيز لمعلمة المجتمع. يتوافق مستوى الأهمية المحدد a مع المناطق المظللة أسفل منحنى هذا التوزيع (انظر الشكل 24). المنطقة غير المظللة تحت منحنى التوزيع تحدد الاحتمالية، وتسمى حدود القطاعات على محور الإحداثي السيني تحت المناطق المظللة بالقيم الحرجة، وتشكل القطاعات نفسها المنطقة الحرجة، أو منطقة رفض الفرضية.

في إجراء اختبار الفرضيات، تتم مقارنة خاصية العينة المحسوبة من نتائج الملاحظات مع القيمة الحرجة المقابلة. في هذه الحالة، يجب التمييز بين المناطق الحرجة أحادية الجانب والثنائية. يعتمد شكل تحديد المنطقة الحرجة على صياغة المشكلة ومتى البحوث الإحصائية. هناك حاجة إلى منطقة حرجة ذات وجهين عند مقارنة معلمة العينة ومعلمة السكان

ويلزم تقدير القيمة المطلقة للتناقض بينهما، أي أن الاختلافات الإيجابية والسلبية بين الكميات المدروسة هي ذات أهمية. عندما يكون من الضروري التأكد من أن قيمة واحدة في المتوسط ​​أكبر أو أقل بشكل صارم من الأخرى، يتم استخدام منطقة حرجة من جانب واحد (على الجانب الأيمن أو على الجانب الأيسر). من الواضح تمامًا أنه بالنسبة لنفس القيمة الحرجة، يكون مستوى الأهمية عند استخدام منطقة حرجة أحادية الجانب أقل منه عند استخدام منطقة حرجة ذات جانبين.

أرز. 24. اختبار الفرضية الصفرية

إذا كان توزيع خاصية العينة متماثلاً، فإن مستوى أهمية المنطقة الحرجة ذات الوجهين يساوي a، والمنطقة الحرجة أحادية الجانب تساوي y (انظر الشكل 24). دعونا نقتصر على الصياغة العامة للمشكلة. بمزيد من التفصيل مع المبررات النظرية للاختبار الفرضيات الإحصائيةيمكنك الالتقاء في الأدب المتخصص. أدناه سنشير فقط إلى معايير الأهمية إجراءات مختلفةدون التوقف عند بنائها.

ومن خلال التحقق من أهمية معامل الارتباط الزوجي، يتم إثبات وجود أو عدم وجود ارتباط بين الظواهر قيد الدراسة. إذا لم يكن هناك ارتباط فإن معامل ارتباط المجتمع يساوي صفر، وتبدأ عملية التحقق بصياغة الفرضيتين الصفرية والبديلة:

الفرق بين معامل ارتباط العينة غير مهم،

والفرق بينهما كبير، وبالتالي هناك علاقة كبيرة بين متغيراتهما. تشير الفرضية البديلة إلى أننا بحاجة إلى استخدام منطقة حرجة ذات وجهين.

وقد سبق أن ذكرنا في القسم 8.1 أن معامل ارتباط العينة، في ظل بعض الافتراضات، يرتبط بمتغير عشوائي يخضع لتوزيع الطلاب بدرجات الحرية. الإحصائيات المحسوبة من نتائج العينة

تتم مقارنتها بالقيمة الحرجة المحددة من جدول توزيع الطلاب عند مستوى أهمية معين ودرجات الحرية. قاعدة تطبيق المعيار هي كما يلي: إذا تم رفض الفرضية الصفرية عند مستوى الأهمية أ، فإن العلاقة بين المتغيرات مهمة؛ إذا تم قبول الفرضية الصفرية عند مستوى الأهمية أ. يمكن أن يعزى انحراف القيمة إلى الاختلاف العشوائي. تصف بيانات العينة الفرضية قيد النظر بأنها ممكنة ومعقولة جداً، أي أن فرضية عدم وجود ارتباط لا تثير اعتراضات.

يتم تبسيط إجراء اختبار الفرضيات إلى حد كبير إذا استخدمنا القيم الحرجة لمعامل الارتباط بدلاً من الإحصائيات، والتي يمكن تحديدها من خلال الكميات الخاصة بتوزيع الطالب عن طريق الاستبدال

وتوجد جداول تفصيلية للقيم الحرجة، يرد مقتطف منها في ملحق هذا الكتاب (انظر الجدول 6). تتلخص قاعدة اختبار الفرضية في هذه الحالة فيما يلي: إذا كان الأمر كذلك، فيمكننا التأكيد على أن العلاقة بين المتغيرات مهمة. إذا كان الأمر كذلك، فإننا نعتبر نتائج الملاحظة متسقة مع فرضية عدم وجود اتصال.

دعونا نختبر الفرضية حول استقلال إنتاجية العمل عن مستوى ميكنة العمل وفقًا للبيانات الواردة في القسم 4.1. لقد تم حسابه سابقًا أنه من (8.38) نحصل عليه

باستخدام جدول توزيع الطلاب نجد القيمة الحرجة لهذه الإحصائية: نظرًا لأننا نرفض الفرضية الصفرية، فإن الخطأ لا يحدث إلا في 5٪ من الحالات.

سنحصل على نفس النتيجة إذا قارنا القيمة الحرجة لمعامل الارتباط الموجود في الجدول المقابل في

التي لديها -التوزيع بدرجات الحرية. بعد ذلك، يتم تنفيذ إجراء التحقق من الأهمية بشكل مشابه للإجراء السابق باستخدام المعيار.

مثال

واستنادا إلى التحليل الاقتصادي للظواهر، فإننا نفترض لدى عامة السكان وجود علاقة قوية بين إنتاجية العمل ومستوى ميكنة العمل. دعونا، على سبيل المثال، . وكبديل، في هذه الحالة يمكننا طرح فرضية أن معامل ارتباط العينة وبالتالي يجب علينا استخدام منطقة حرجة من جانب واحد. ومن (8.40) يتبع ذلك

قمنا بمقارنة القيمة التي تم الحصول عليها مع القيمة الحرجة، وبذلك يمكننا عند مستوى دلالة 5% أن نفترض وجود علاقة وثيقة جداً بين الخصائص المدروسة، أي أن البيانات الأولية تجعل من الممكن اعتبار أنه من المعقول أن

يتم التحقق من أهمية معاملات الارتباط الجزئي بطريقة مماثلة. فقط عدد درجات الحرية هو الذي يتغير، حيث يصبح مساوياً لعدد المتغيرات التفسيرية. قيمة الإحصائيات المحسوبة باستخدام الصيغة

تتم مقارنتها بالقيمة الحرجة الموجودة في جدول التوزيع عند مستوى الدلالة a وعدد درجات الحرية، ويتم قبول أو رفض الفرضية الخاصة بأهمية معامل الارتباط الجزئي وفق نفس القاعدة الموضحة أعلاه . كما يمكن إجراء اختبار الدلالة باستخدام القيم الحرجة لمعامل الارتباط وفق (8.39)، وكذلك استخدام تحويل فيشر (8.40).

مثال

دعونا تحقق الموثوقية الإحصائيةمعاملات الارتباط الجزئية المحسوبة في القسم 4.5 عند مستوى الأهمية أدناه، إلى جانب معاملات الارتباط الجزئية، يتم إعطاء قيم الإحصائيات المحسوبة والحرجة المقابلة

نظرًا لقبول الفرضية حول أهمية المعاملات، نستنتج أن مستوى ميكنة العمل له تأثير كبير على إنتاجية العمل، باستثناء تأثير متوسط ​​عمر العمال (ومتوسط ​​نسبة الالتزام المعايير). الفرق من الصفر للمعاملات المتبقية

يمكن أن تعزى الارتباطات الجزئية إلى التقلبات العشوائية في العينة، وبالتالي لا يمكننا أن نقول منها أي شيء محدد عن التأثيرات الجزئية للمتغيرات ذات الصلة.

يتم الحكم على أهمية معامل الارتباط المتعدد من خلال نتيجة الإجراء الخاص بالتحقق من أهمية المعامل تحديد متعددة. سنناقش هذا بمزيد من التفصيل في القسم التالي.

والسؤال الذي غالبًا ما يكون محل اهتمام هو: هل يختلف معاملا الارتباط بشكل كبير عن بعضهما البعض؟ عند اختبار هذه الفرضية، من المفترض أن تؤخذ في الاعتبار نفس خصائص المجموعات المتجانسة؛ تمثل البيانات النتائج اختبارات مستقلة; يتم استخدام معاملات الارتباط من نفس النوع، أي إما معاملات الارتباط الزوجية أو معاملات الارتباط الجزئي عند استبعاد نفس العدد من المتغيرات.

قد تكون أحجام العينتين التي يتم حساب معاملات الارتباط منها مختلفة. الفرضية الصفرية: أي أن معاملات الارتباط بين المجتمعين قيد النظر متساوية. الفرضية البديلة: تشير الفرضية البديلة إلى أنه ينبغي استخدام المنطقة الحرجة ذات الاتجاهين. بمعنى آخر، يجب عليك التحقق مما إذا كان الفرق مختلفًا بشكل كبير عن الصفر، فلنستخدم الإحصائيات ذات التوزيع الطبيعي تقريبًا:

حيث - نتائج تحويلات معاملات الارتباط - أحجام العينة. قاعدة الاختبار: إذا تم رفض الفرضية؛ إذا تم قبول الفرضية.

إذا قبلت القيمة

بعد إعادة الحساب باستخدام (8.6) يكون بمثابة تقدير ملخص لمعامل الارتباط، وبعد ذلك يمكن اختبار الفرضية باستخدام الإحصاء

وجود التوزيع الطبيعي.

مثال

فليكن من الضروري تحديد ما إذا كان قرب العلاقة بين إنتاجية العمل ومستوى ميكنة العمل يختلف في مؤسسات نفس الصناعة الموجودة في مناطق مختلفة من البلاد. دعونا نقارن الشركات الموجودة في منطقتين. دع معامل الارتباط لأحدهم يتم حسابه باستخدام عينة حجمية (انظر القسم 4.1). بالنسبة للمنطقة الأخرى، تم حسابها باستخدام عينة حجمية

بعد تحويل كلا معاملي الارتباط إلى قيم، نحسب باستخدام (8.42) قيمة الإحصائيات X:

القيمة الحرجة للإحصاء هي وبالتالي يتم قبول الفرضية، أي أنه بناءً على العينات المتاحة، لا يمكننا تحديد فرق كبير بين معاملات الارتباط. علاوة على ذلك، فإن كلا معاملي الارتباط مهمان.

وباستخدام (8.43) و(8.6) نحصل على تقدير موجز لمعامل الارتباط لمنطقتين:

وأخيرا، دعونا نتحقق من الفرضية فيما إذا كان التقدير التلخيصي لمعامل الارتباط يختلف معنويا عن الصفر باستخدام الإحصائيات (8.44):

حيث يمكننا أن نؤكد أنه في عموم السكان هناك علاقة كبيرة بين إنتاجية العمل ومستوى ميكنة العمل.

يمكن استخدام المعيار X في جوانب مختلفة. وبالتالي، بدلاً من المناطق، يمكن النظر في صناعات مختلفة، على سبيل المثال، عندما يكون من الضروري تحديد ما إذا كانت الاختلافات في قوة العلاقات المدروسة بين المؤشرات الاقتصادية للمؤسسات التي تنتمي إلى صناعتين مختلفتين كبيرة.

دعونا نحسب، بناءً على عينتين من الحجم، معاملات الارتباط التي تميز العلاقة الوثيقة بين إنتاجية العمل ومستوى ميكنة العمل في المؤسسات التي تنتمي إلى صناعتين (مجموعتان عامتان من السكان). من (8.42) نحصل عليه

وبما أننا نرفض الفرضية الصفرية. وبالتالي، يمكن القول بأن هناك اختلافات كبيرة في تقارب العلاقة بين إنتاجية العمل ومستوى ميكنة العمل في المؤسسات التابعة لمختلف الصناعات. سنواصل هذا المثال في القسم 8.7، حيث سنقارن خطوط الانحدار التي تم إنشاؤها لمجموعتين من السكان.

وبتحليل الأمثلة المقدمة، نحن مقتنعون بأن النظر فقط في الفرق المطلق لمعاملات الارتباط المقارنة

(أحجام العينات هي نفسها في كلتا الحالتين) دون التحقق من أهمية هذا الاختلاف سيؤدي إلى استنتاجات خاطئة. وهذا يؤكد ضرورة استخدام المعايير الإحصائية عند مقارنة معاملات الارتباط.

يمكن تعميم إجراء المقارنة بين معاملي الارتباط عدد أكبرمعاملات تخضع للشروط المذكورة أعلاه. ويتم التعبير عن فرضية تساوي معاملات الارتباط بين المتغيرات على النحو التالي: يتم اختبارها على أساس معاملات الارتباط المحسوبة من عينات حجمية من عامة السكان. يتم إعادة حساب معاملات الارتباط إلى -values: منذ in الحالة العامةمجهول نجد تقديره من خلال الصيغة وهو تعميم (8.43).

عمل الدورة

الموضوع: تحليل الارتباط

مقدمة

1. تحليل الارتباط

1.1 مفهوم الارتباط

1.2 التصنيف العامالارتباطات

1.3 مجالات الارتباط والغرض من بنائها

1.4 المراحل تحليل الارتباط

1.5 معاملات الارتباط

1.6 معامل الارتباط الطبيعي لبرافيس-بيرسون

1.7 معامل ارتباط الرتبةالرامح

1.8 الخصائص الأساسية لمعاملات الارتباط

1.9 التحقق من أهمية معاملات الارتباط

1.10 القيم الحرجةمعامل الارتباط الزوجي

2. التخطيط لتجربة متعددة العوامل

2.1 حالة المشكلة

2.2 تحديد مركز الخطة (المستوى الأساسي) ومستوى تباين العوامل

2.3 بناء مصفوفة التخطيط

2.4 التحقق من تجانس التشتت وتكافؤ القياس في سلاسل مختلفة

2.5 معاملات معادلة الانحدار

2.6 تباين التكاثر

2.7 التحقق من أهمية معاملات معادلة الانحدار

2.8 التحقق من مدى كفاية معادلة الانحدار

خاتمة

فهرس

مقدمة

التخطيط التجريبي هو نظام رياضي وإحصائي يدرس أساليب التنظيم العقلاني للبحث التجريبي - من الاختيار الأمثلالعوامل التي تتم دراستها وتحديد الخطة التجريبية الفعلية بما يتوافق مع الغرض منها وطرق تحليل النتائج. بدأ التخطيط التجريبي بأعمال الإحصائي الإنجليزي ر. فيشر (1935)، الذي أكد على أن التخطيط التجريبي العقلاني يوفر مكاسب لا تقل أهمية في دقة التقديرات عن المعالجة المثلى لنتائج القياس. في الستينيات من القرن العشرين كان هناك النظرية الحديثةالتخطيط للتجربة. ترتبط أساليبها ارتباطًا وثيقًا بنظرية تقريب الوظائف والبرمجة الرياضية. تم بناء المخططات المثالية ودراسة خصائصها لفئة واسعة من النماذج.

التخطيط التجريبي – اختيار خطة تجريبية تلبي متطلبات محددة، مجموعة من الإجراءات التي تهدف إلى تطوير استراتيجية التجريب (من الحصول على معلومات مسبقة إلى الحصول على نموذج رياضي قابل للتطبيق أو تحديد الظروف المثلى). هذا هو التحكم الهادف في التجربة، والذي يتم تنفيذه في ظل ظروف المعرفة غير الكاملة لآلية الظاهرة قيد الدراسة.

في عملية القياسات، ومعالجة البيانات اللاحقة، وكذلك إضفاء الطابع الرسمي على النتائج في شكل نموذج رياضي، تنشأ أخطاء ويتم فقدان بعض المعلومات الواردة في البيانات الأصلية. إن استخدام أساليب التخطيط التجريبي يجعل من الممكن تحديد خطأ النموذج الرياضي والحكم على مدى كفايته. إذا تبين أن دقة النموذج غير كافية، فإن استخدام أساليب التخطيط التجريبي يجعل من الممكن التحديث نموذج رياضيمع تجارب إضافية دون فقدان المعلومات السابقة وبأقل التكاليف.

الغرض من التخطيط للتجربة هو العثور على الشروط والقواعد لإجراء التجارب التي يمكن من خلالها الحصول على معلومات موثوقة وموثوقة حول كائن ما بأقل قدر من العمالة، وكذلك تقديم هذه المعلومات في شكل مضغوط ومريح مع التقييم الكمي للدقة.

ومن بين أساليب التخطيط الرئيسية المستخدمة في مراحل الدراسة المختلفة ما يلي:

التخطيط لتجربة فحص، والمعنى الرئيسي لها هو الاختيار من بين مجموعة العوامل بأكملها لمجموعة من العوامل المهمة التي تخضع لمزيد من الدراسة التفصيلية؛

التخطيط لتجربة تحليل التباين، أي. وضع خطط للأشياء ذات العوامل النوعية؛

التخطيط لتجربة الانحدار التي تسمح لك بالحصول عليها نماذج الانحدار(متعددة الحدود وغيرها)؛

التخطيط لتجربة متطرفة تكون المهمة الرئيسية فيها هي التحسين التجريبي لموضوع البحث؛

التخطيط عند دراسة العمليات الديناميكية وما إلى ذلك.

الغرض من دراسة التخصص هو إعداد الطلاب للأنشطة الإنتاجية والفنية في تخصصهم باستخدام أساليب نظرية التخطيط وتقنيات المعلومات الحديثة.

أهداف الانضباط: الدراسة الأساليب الحديثةتخطيط وتنظيم وتحسين التجارب العلمية والصناعية وإجراء التجارب ومعالجة النتائج التي تم الحصول عليها.

1. تحليل الارتباط

1.1 مفهوم الارتباط

غالبًا ما يهتم الباحث بكيفية ارتباط متغيرين أو أكثر ببعضهما البعض في عينة واحدة أو أكثر قيد الدراسة. على سبيل المثال، هل يمكن أن يؤثر الطول على وزن الشخص، أو يمكن أن يؤثر ضغط الدم على جودة المنتج؟

ويسمى هذا النوع من الاعتماد بين المتغيرات الارتباط أو الارتباط. الارتباط هو تغير ثابت في خاصيتين، مما يعكس حقيقة أن تباين إحدى الخاصيتين يتوافق مع تقلب الأخرى.

فمن المعروف مثلاً أنه في المتوسط ​​هناك علاقة إيجابية بين طول الإنسان ووزنه، فكلما زاد الطول زاد وزن الشخص. ومع ذلك، هناك استثناءات لهذه القاعدة عندما نسبيا أناس قصار القامةيملك زيادة الوزن، وعلى العكس من ذلك، فإن الوهن ذو النمو المرتفع يكون وزنه منخفضًا. والسبب في هذه الاستثناءات هو أن كل بيولوجية أو فسيولوجية أو علامة نفسيةيتحدد بتأثير عوامل عديدة: بيئية، وراثية، اجتماعية، بيئية، إلخ.

اتصالات الارتباط هي تغييرات احتمالية لا يمكن دراستها إلا على عينات تمثيلية باستخدام طرق الإحصاء الرياضي. غالبًا ما يتم استخدام كلا المصطلحين - ارتباط الارتباط والاعتماد على الارتباط - بالتبادل. التبعية تعني التأثير والاتصال وأي تغييرات منسقة يمكن تفسيرها بمئات الأسباب. لا يمكن اعتبار الارتباطات الارتباطية دليلاً على وجود علاقة السبب والنتيجة، فهي تشير فقط إلى أن التغيرات في إحدى الخصائص عادة ما تكون مصحوبة بتغييرات معينة في سمة أخرى.

الاعتماد على الارتباط - هذه هي التغييرات التي تدخل قيم خاصية واحدة في احتمالية حدوثها معان مختلفةعلامة أخرى.

تتلخص مهمة تحليل الارتباط في تحديد الاتجاه (الإيجابي أو السلبي) والشكل (الخطي، غير الخطي) للعلاقة بين الخصائص المتغيرة، وقياس مدى قربها، وأخيرا التحقق من مستوى أهمية معاملات الارتباط التي تم الحصول عليها.

اتصالات الارتباط تختلف في الشكل والاتجاه والدرجة (القوة) .

يمكن أن يكون شكل علاقة الارتباط خطيًا أو منحنيًا. على سبيل المثال، قد تكون العلاقة بين عدد جلسات التدريب على جهاز المحاكاة وعدد المشكلات التي تم حلها بشكل صحيح في جلسة التحكم واضحة ومباشرة. على سبيل المثال، قد تكون العلاقة بين مستوى التحفيز وفعالية المهمة منحنية الشكل (الشكل 1). مع زيادة الدافع، تزداد فعالية إكمال المهمة أولاً، ثم يتم تحقيق المستوى الأمثل من التحفيز، والذي يتوافق مع أقصى قدر من الفعالية لإكمال المهمة؛ ويصاحب الزيادة الإضافية في التحفيز انخفاض في الكفاءة.

الشكل 1 - العلاقة بين فعالية حل المشكلات وقوة الميول التحفيزية

في الاتجاه، يمكن أن تكون علاقة الارتباط إيجابية ("مباشرة") وسلبية ("معكوسة"). في حالة الارتباط الخطي الموجب، تتوافق القيم الأعلى لخاصية ما مع قيم أعلى لخاصية أخرى، والقيم الأقل لخاصية واحدة تتوافق مع قيم منخفضةآخر (الشكل 2). مع وجود ارتباط سلبي، تكون العلاقات عكسية (الشكل 3). مع وجود علاقة إيجابية، فإن معامل الارتباط لديه علامة إيجابيةمع ارتباط سلبي - علامة سلبية.

الشكل 2 - الارتباط المباشر

الشكل 3 - الارتباط العكسي


الشكل 4 - لا يوجد ارتباط

يتم تحديد درجة أو قوة أو تقارب الارتباط من خلال قيمة معامل الارتباط. قوة الاتصال لا تعتمد على اتجاهها ويتم تحديدها من خلال القيمة المطلقة لمعامل الارتباط.

1.2 التصنيف العام للارتباطات

اعتمادا على معامل الارتباط، يتم تمييز الارتباطات التالية:

قوي، أو قريب من معامل الارتباط r>0.70؛

المتوسط ​​(عند 0.50

معتدل (عند 0.30

ضعيف (عند 0.20

ضعيف جدًا (عند ص<0,19).

1.3 مجالات الارتباط والغرض من بنائها

تتم دراسة الارتباط على أساس البيانات التجريبية، وهي القيم المقاسة (x i، y i) لخاصيتين. إذا كانت البيانات التجريبية قليلة، فسيتم تمثيل التوزيع التجريبي ثنائي الأبعاد كسلسلة مزدوجة من القيم x i و y i. وفي الوقت نفسه، يمكن وصف الاعتماد الارتباطي بين الخصائص بطرق مختلفة. يمكن إعطاء المراسلات بين الوسيطة والوظيفة من خلال جدول، أو صيغة، أو رسم بياني، وما إلى ذلك.

يعتمد تحليل الارتباط، مثل الطرق الإحصائية الأخرى، على استخدام النماذج الاحتمالية التي تصف سلوك الخصائص قيد الدراسة في مجموعة سكانية عامة معينة يتم الحصول منها على القيم التجريبية xi و y i. عند دراسة الارتباط بين الخصائص الكمية، والتي يمكن قياس قيمها بدقة بوحدات المقاييس المترية (الأمتار، الثواني، الكيلوجرامات، وما إلى ذلك)، يتم في كثير من الأحيان اعتماد نموذج سكاني ثنائي الأبعاد موزع بشكل طبيعي. يعرض مثل هذا النموذج العلاقة بين المتغيرات x i و y i بيانياً على شكل موقع هندسي للنقاط في نظام من الإحداثيات المستطيلة. وتسمى هذه العلاقة الرسومية أيضًا بمخطط التشتت أو حقل الارتباط.
هذا النموذج للتوزيع الطبيعي ثنائي الأبعاد (مجال الارتباط) يسمح لنا بإعطاء تفسير بياني واضح لمعامل الارتباط، لأن يعتمد التوزيع الإجمالي على خمس معلمات: μ x، μ y - القيم المتوسطة (التوقعات الرياضية)؛ σ x ,σ y - الانحرافات المعيارية للمتغيرات العشوائية X وY وp - معامل الارتباط، وهو مقياس للعلاقة بين المتغيرات العشوائية X وY.
إذا كانت p = 0، فإن القيم x i , y التي تم الحصول عليها من مجموعة سكانية عادية ثنائية الأبعاد تقع على الرسم البياني في الإحداثيات x, y داخل المنطقة المحددة بالدائرة (الشكل 5، أ). وفي هذه الحالة لا يوجد ارتباط بين المتغيرين العشوائيين X وY ويطلق عليهما اسم غير مرتبط. بالنسبة للتوزيع الطبيعي ثنائي الأبعاد، يعني عدم الارتباط في الوقت نفسه استقلال المتغيرات العشوائية X وY.

في البحث العلمي، غالبًا ما تكون هناك حاجة إلى إيجاد صلة بين متغيرات النتائج والعوامل (عائد المحصول وكمية هطول الأمطار، وطول ووزن الشخص في مجموعات متجانسة حسب الجنس والعمر، ومعدل ضربات القلب، ودرجة حرارة الجسم). ، إلخ.).

والثانية هي العلامات التي تساهم في إحداث تغييرات في الأشخاص المرتبطين بها (الأولى).

مفهوم تحليل الارتباط

هناك العديد منها وبناء على ما سبق يمكننا القول أن تحليل الارتباط هو أسلوب يستخدم لاختبار الفرضية حول الأهمية الإحصائية لمتغيرين أو أكثر إذا تمكن الباحث من قياسها، ولكن ليس تغييرها.

هناك تعريفات أخرى للمفهوم المعني. تحليل الارتباط هو أسلوب معالجة يتضمن دراسة معاملات الارتباط بين المتغيرات. وفي هذه الحالة تتم مقارنة معاملات الارتباط بين زوج واحد أو عدة أزواج من الخصائص لإقامة علاقات إحصائية بينها. تحليل الارتباط هو أسلوب لدراسة الاعتماد الإحصائي بين المتغيرات العشوائية مع وجود اختياري ذي طبيعة وظيفية صارمة، حيث تؤدي ديناميكيات متغير عشوائي واحد إلى ديناميكيات التوقع الرياضي لمتغير عشوائي آخر.

مفهوم الارتباط الزائف

عند إجراء تحليل الارتباط، من الضروري أن نأخذ في الاعتبار أنه يمكن إجراؤه فيما يتعلق بأي مجموعة من الخصائص، والتي غالبًا ما تكون سخيفة فيما يتعلق ببعضها البعض. في بعض الأحيان ليس لديهم علاقة سببية مع بعضهم البعض.

في هذه الحالة، يتحدثون عن علاقة خاطئة.

مشاكل تحليل الارتباط

بناءً على التعريفات المذكورة أعلاه، يمكننا صياغة المهام التالية للطريقة الموصوفة: الحصول على معلومات حول أحد المتغيرات المطلوبة باستخدام متغير آخر؛ تحديد مدى قرب العلاقة بين المتغيرات المدروسة.

يتضمن تحليل الارتباط تحديد العلاقة بين الخصائص التي تتم دراستها، وبالتالي يمكن استكمال مهام تحليل الارتباط بما يلي:

  • تحديد العوامل التي لها التأثير الأكبر على الخاصية الناتجة؛
  • تحديد أسباب الاتصالات التي لم يتم استكشافها من قبل؛
  • بناء نموذج الارتباط مع تحليله البارامترى؛
  • دراسة أهمية معلمات الاتصال وتقييم الفاصل بينها.

العلاقة بين تحليل الارتباط والانحدار

ولا يقتصر أسلوب تحليل الارتباط في كثير من الأحيان على إيجاد مدى تقارب العلاقة بين الكميات المدروسة. في بعض الأحيان يتم استكماله من خلال تجميع معادلات الانحدار، والتي يتم الحصول عليها باستخدام التحليل الذي يحمل نفس الاسم، والتي تمثل وصفًا لاعتماد الارتباط بين الخاصية الناتجة والعامل (العامل) (الميزات). تشكل هذه الطريقة، إلى جانب التحليل قيد النظر، الطريقة

شروط استخدام الطريقة

العوامل الفعالة تعتمد على واحد إلى عدة عوامل. يمكن استخدام أسلوب تحليل الارتباط إذا كان هناك عدد كبير من الملاحظات حول قيمة المؤشرات الفعالة والعاملية (العوامل)، في حين أن العوامل قيد الدراسة يجب أن تكون كمية وتنعكس في مصادر محددة. الأول يمكن تحديده بالقانون العادي - في هذه الحالة، نتيجة تحليل الارتباط هي معاملات ارتباط بيرسون، أو إذا كانت الخصائص لا تخضع لهذا القانون، يتم استخدام معامل ارتباط رتبة سبيرمان.

قواعد اختيار عوامل تحليل الارتباط

ومن الضروري عند تطبيق هذه الطريقة تحديد العوامل التي تؤثر على مؤشرات الأداء. يتم اختيارها مع الأخذ في الاعتبار حقيقة أنه يجب أن تكون هناك علاقات السبب والنتيجة بين المؤشرات. في حالة إنشاء نموذج الارتباط متعدد العوامل يتم اختيار تلك التي لها تأثير كبير على المؤشر الناتج، بينما يفضل عدم إدراج عوامل مترابطة ذات معامل ارتباط زوجي يزيد عن 0.85 في نموذج الارتباط، وكذلك تلك العوامل التي لا تكون فيها العلاقة مع المعلمة الناتجة ذات طابع خطي أو وظيفي.

عرض النتائج

يمكن عرض نتائج تحليل الارتباط في أشكال نصية ورسومية. في الحالة الأولى يتم تقديمها كمعامل ارتباط، في الحالة الثانية - في شكل مخطط مبعثر.

في حالة عدم وجود ارتباط بين المعلمات، تقع النقاط الموجودة على الرسم البياني بشكل فوضوي، ويتميز متوسط ​​درجة الاتصال بدرجة أكبر من النظام ويتميز بمسافة موحدة أكثر أو أقل من العلامات المميزة من المتوسط. يميل الاتصال القوي إلى أن يكون مستقيمًا، وعند r=1 يكون المخطط النقطي خطًا مسطحًا. يختلف الارتباط العكسي في اتجاه الرسم البياني من أعلى اليسار إلى أسفل اليمين، والارتباط المباشر - من أسفل اليسار إلى الزاوية اليمنى العليا.

تمثيل ثلاثي الأبعاد لمؤامرة مبعثرة

بالإضافة إلى عرض الرسم المبعثر التقليدي ثنائي الأبعاد، يتم الآن استخدام تمثيل رسومي ثلاثي الأبعاد لتحليل الارتباط.

يتم أيضًا استخدام مصفوفة مخطط التشتت، والتي تعرض جميع المخططات المقترنة في شكل واحد بتنسيق مصفوفة. بالنسبة للمتغيرات n، تحتوي المصفوفة على n صفوف و n أعمدة. الرسم البياني الموجود عند تقاطع الصف i والعمود j عبارة عن مخطط للمتغيرين Xi مقابل Xj. وبالتالي، فإن كل صف وعمود يمثل بعدًا واحدًا، وتعرض الخلية الواحدة مخططًا مبعثرًا ذو بعدين.

تقييم ضيق الاتصال

يتم تحديد مدى قرب اتصال الارتباط من خلال معامل الارتباط (r): قوي - r = ±0.7 إلى ±1، متوسط ​​- r = ±0.3 إلى ±0.699، ضعيف - r = 0 إلى ±0.299. هذا التصنيف ليس صارما. يوضح الشكل مخططًا مختلفًا قليلاً.

مثال على استخدام طريقة تحليل الارتباط

أجريت دراسة مثيرة للاهتمام في المملكة المتحدة. وهو مخصص للعلاقة بين التدخين وسرطان الرئة، وتم إجراؤه من خلال تحليل الارتباط. وترد هذه الملاحظة أدناه.

البيانات الأولية لتحليل الارتباط

المجموعة المهنية

معدل الوفيات

المزارعين والغابات والصيادين

عمال المناجم والمحاجر

مصنعي الغاز وفحم الكوك والمواد الكيميائية

مصنعي الزجاج والسيراميك

عمال الأفران والحدادة والمسابك ومصانع الدرفلة

عمال الكهرباء والإلكترونيات

الهندسة والمهن المرتبطة بها

الصناعات الخشبية

عمال الجلود

عمال النسيج

مصنعي ملابس العمل

العاملون في صناعات الأغذية والمشروبات والتبغ

مصنعي الورق والطباعة

الشركات المصنعة للمنتجات الأخرى

بناة

الرسامين ومصممي الديكور

سائقي المحركات الثابتة والرافعات وغيرها.

العمال غير المدرجة في أي مكان آخر

عمال النقل والاتصالات

عمال المستودعات وأمناء المخازن والتعبئة وعمال آلات التعبئة

العاملين في المكتب

البائعين

العاملون في مجال الرياضة والترفيه

الإداريين والمديرين

المهنيين والفنيين والفنانين

نبدأ تحليل الارتباط. من أجل الوضوح، من الأفضل أن نبدأ الحل بطريقة رسومية، والتي سنقوم من أجلها ببناء مخطط مبعثر.

فإنه يدل على اتصال مباشر. ومع ذلك، من الصعب استخلاص نتيجة لا لبس فيها بناءً على الطريقة الرسومية وحدها. لذلك، سوف نستمر في إجراء تحليل الارتباط. ويرد أدناه مثال لحساب معامل الارتباط.

وباستخدام البرنامج (سيتم وصف MS Excel أدناه كمثال)، نحدد معامل الارتباط وهو 0.716، مما يعني وجود ارتباط قوي بين المعلمات قيد الدراسة. دعونا نحدد الموثوقية الإحصائية للقيمة التي تم الحصول عليها باستخدام الجدول المقابل، والذي نحتاج إلى طرح 2 من 25 زوجًا من القيم، ونتيجة لذلك نحصل على 23 وباستخدام هذا السطر في الجدول نجد r حاسم لـ p = 0.01 (منذ هذه بيانات طبية، وهو اعتماد أكثر صرامة، وفي حالات أخرى يكون p = 0.05 كافيًا)، وهو 0.51 لتحليل الارتباط هذا. أظهر المثال أن r المحسوب أكبر من r الحرج، وتعتبر قيمة معامل الارتباط موثوقة إحصائياً.

استخدام البرمجيات عند إجراء تحليل الارتباط

يمكن تنفيذ النوع الموصوف من معالجة البيانات الإحصائية باستخدام البرامج، ولا سيما MS Excel. يتضمن الارتباط حساب المعلمات التالية باستخدام الوظائف:

1. يتم تحديد معامل الارتباط باستخدام الدالة CORREL (array1; array2). Array1،2 - خلية الفاصل الزمني لقيم المتغيرات الناتجة والعامل.

يُطلق على معامل الارتباط الخطي أيضًا اسم معامل ارتباط بيرسون، وبالتالي، بدءًا من Excel 2007، يمكنك استخدام الدالة مع نفس المصفوفات.

يتم عرض رسومية لتحليل الارتباط في Excel باستخدام لوحة "الرسوم البيانية" مع تحديد "Scatter Plot".

بعد تحديد البيانات الأولية، نحصل على الرسم البياني.

2. تقييم أهمية معامل الارتباط الزوجي باستخدام اختبار الطالب. تتم مقارنة القيمة المحسوبة لمعيار t مع القيمة المجدولة (الحرجة) لهذا المؤشر من جدول قيم المعلمة قيد النظر، مع مراعاة مستوى الأهمية المحدد وعدد درجات الحرية. يتم إجراء هذا التقدير باستخدام الدالة STUDISCOVER(probability;degrees_of_freedom).

3. مصفوفة معاملات الارتباط الزوجية. يتم إجراء التحليل باستخدام أداة تحليل البيانات، والتي يتم فيها تحديد الارتباط. يتم إجراء التقييم الإحصائي لمعاملات الارتباط الزوجي من خلال مقارنة قيمتها المطلقة بالقيمة المجدولة (الحرجة). عندما يتجاوز معامل الارتباط الزوجي المحسوب معامل الارتباط الحرج، يمكننا القول، مع الأخذ في الاعتبار درجة الاحتمالية المعطاة، أن الفرضية الصفرية حول أهمية العلاقة الخطية لم يتم رفضها.

أخيراً

يتيح لنا استخدام أسلوب تحليل الارتباط في البحث العلمي تحديد العلاقة بين العوامل المختلفة ومؤشرات الأداء. ومن الضروري أن نأخذ في الاعتبار أنه يمكن الحصول على معامل ارتباط مرتفع من زوج أو مجموعة من البيانات السخيفة، وبالتالي يجب إجراء هذا النوع من التحليل على مجموعة كبيرة بما فيه الكفاية من البيانات.

بعد الحصول على القيمة المحسوبة لـ r، من المستحسن مقارنتها بالقيمة r الحرجة لتأكيد الموثوقية الإحصائية لقيمة معينة. يمكن إجراء تحليل الارتباط يدويًا باستخدام الصيغ، أو باستخدام البرامج، وخاصةً MS Excel. هنا يمكنك أيضًا إنشاء مخطط مبعثر بغرض تمثيل العلاقة بشكل مرئي بين العوامل المدروسة لتحليل الارتباط والخصائص الناتجة.



جديد على الموقع

>

الأكثر شعبية