بيت تجويف الفم موثوقية معامل الارتباط. الاختبار: تقييم أهمية معاملات الانحدار والارتباط باستخدام اختبار f للطالب

موثوقية معامل الارتباط. الاختبار: تقييم أهمية معاملات الانحدار والارتباط باستخدام اختبار f للطالب

بعض الباحثين، بعد أن حسبوا قيمة معامل الارتباط، توقفوا عند هذا الحد. ولكن من وجهة نظر المنهجية التجريبية المختصة، ينبغي أيضا تحديد مستوى الأهمية (أي درجة الموثوقية) لهذا المعامل.

يتم حساب مستوى أهمية معامل الارتباط باستخدام جدول القيم الحرجة. يوجد أدناه جزء من هذا الجدول، والذي يسمح لنا بتحديد مستوى أهمية المعامل الذي حصلنا عليه.

نختار الصف الذي يتوافق مع حجم العينة. في حالتنا، n = 10. نختار في هذا الصف قيمة الجدول التي تكون أقل قليلاً من القيمة التجريبية (أو تساويها تمامًا، وهو أمر نادر للغاية). هذا الرقم بالخط العريض هو 0.632. ويشير إلى عمود بمستوى أهمية p = 0.05. أي أن القيمة التجريبية في الواقع متوسطة بين العمودين p = 0.05 و p = 0.01، وبالتالي 0.05  p  0.01. وبالتالي، فإننا نرفض فرضية العدم ونستنتج أن النتيجة التي تم الحصول عليها (R xy = 0.758) مهمة عند المستوى p< 0,05 (это уровень статистической значимости): R эмп >ركر (ص< 0,05) H 0 ,  Н 1 ! ст. зн.

في اللغة اليومية، يمكن تفسير ذلك على النحو التالي: يمكننا أن نتوقع أن قوة الاتصال هذه ستحدث في العينة بشكل أقل من خمس حالات من أصل 100، إذا كان هذا الاتصال نتيجة للصدفة.

    1. تحليل الانحدار

X(ارتفاع)

ي(وزن)

م X = 166,6

م ذ = 58,3

س = 6 , 54

ذ = 8 , 34

يستخدم تحليل الانحدار لدراسة العلاقة بين كميتين تم قياسهما على مقياس فاصل. يتضمن هذا النوع من التحليل إنشاء معادلة انحدار تسمح لك بالوصف الكمي لاعتماد إحدى الخصائص على أخرى (يشير معامل ارتباط بيرسون إلى وجود أو عدم وجود علاقة، لكنه لا يصف هذه العلاقة). وبمعرفة القيمة العشوائية لإحدى الخاصيتين وباستخدام هذه المعادلة يستطيع الباحث وبدرجة احتمالية معينة التنبؤ بالقيمة المقابلة للخاصية الثانية. يوصف الاعتماد الخطي للخصائص بالنوع التالي من المعادلة:

ص = أ +ب ذ * س ,

أين أ -الحد الحر للمعادلة يساوي ارتفاع الرسم البياني عند نقطة ما س = 0نسبة إلى محور الإحداثي السيني، ب – المعامل الزاوي لميل خط الانحدار يساوي ظل زاوية ميل الرسم البياني لمحور الإحداثي السيني (بشرط أن يكون مقياس القيم على كلا المحورين هو نفسه).

بمعرفة قيم الخصائص محل الدراسة يمكن تحديد قيمة الحد الحر ومعامل الانحدار باستخدام الصيغ التالية:

أ =م ذ ب ذ * م س

في حالتنا هذه:
;

أ = 58,3 – 0,97 * 166,6 = -103,3

وبالتالي، فإن صيغة الوزن مقابل الطول هي كما يلي: ص = 0.969 * س – 103.3

ويرد الرسم البياني المقابل أدناه.

إذا كان من الضروري وصف العلاقة بين الطول والوزن ( Xمن في)، ثم القيم أو بتصبح مختلفة ويجب تعديل الصيغ وفقًا لذلك:

س= أ +ب س * في

أ =م س ب س * م ذ

في هذه الحالة، يتغير مظهر الرسم البياني أيضًا.

يرتبط معامل الانحدار ارتباطًا وثيقًا بمعامل الارتباط. الأخير هو الوسط الهندسي لمعاملات انحدار الميزة:

ويسمى مربع معامل الارتباط بمعامل التحديد. وتحدد قيمته نسبة التأثير المتبادل للمتغيرات. في حالتنا هذه ر 2 = 0,76 2 = 0,58 . وهذا يعني أن 58% من إجمالي التباين في Y يتم تفسيره بتأثير المتغير X، أما الـ 42% المتبقية فهي بسبب تأثير عوامل لم تؤخذ بعين الاعتبار في المعادلة.

وتجدر الإشارة إلى أن المؤشر الحقيقي لدرجة العلاقة الخطية بين المتغيرات هو معامل الارتباط النظري، والذي يتم حسابه بناءً على بيانات من جميع السكان (أي جميع القيم الممكنةالمؤشرات):

أين - قياس التغاير النظري، والذي يتم حسابه على أنه التوقع الرياضي لمنتجات انحرافات SV
و من توقعاتهم الرياضية.

كقاعدة عامة، لا يمكننا حساب معامل الارتباط النظري. ومع ذلك، من حقيقة أن معامل أخذ العينات لا يساوي الصفر
ولا يعني ذلك أن المعامل النظري هو أيضًا
(أي أن المؤشرات يمكن أن تكون مستقلة خطيا). الذي - التي. وبناء على بيانات العينات العشوائية، لا يمكن القول بأن هناك علاقة بين المؤشرات.

معامل ارتباط العينة هو تقدير للمعامل النظري، لأنه يتم حسابه فقط لجزء من القيم المتغيرة.

موجود دائما خطأ في معامل الارتباط. هذا الخطأ هو التناقض بين معامل الارتباط لحجم العينة ويتم تحديد معامل الارتباط للسكان بواسطة الصيغ:

في
; و
في
.

إن اختبار أهمية معامل الارتباط الخطي يعني اختبار مدى ثقتنا في بيانات العينة.

ولهذا الغرض تم اختبار الفرضية الصفرية
أن قيمة معامل الارتباط لعموم السكان هي صفر، أي. لا يوجد أي ارتباط في عدد السكان. فرضية بديلة هي
.

لاختبار هذه الفرضية، قمنا بالحساب - إحصائيات ( -اختبار الطالب:

.

الذي لديه توزيع الطالب مع
درجات الحرية 1.

يتم تحديد القيمة الحرجة من جداول توزيع الطلاب
.

إذا كانت قيمة المعيار المحسوبة
، تم رفض الفرضية الصفرية، أي أن معامل الارتباط المحسوب يختلف بشكل كبير عن الصفر مع الاحتمال
.

لو
، فلا يمكن رفض الفرضية الصفرية. وفي هذه الحالة من الممكن أن تكون القيمة الحقيقية لمعامل الارتباط هي صفر، أي. ويمكن اعتبار العلاقة بين المؤشرات غير ذات دلالة إحصائية.

مثال 1. يوضح الجدول بيانات لمدة 8 سنوات على إجمالي الدخل ونفقات الاستهلاك النهائي .

دراسة وقياس مدى قرب العلاقة بين المؤشرات المعطاة.

الموضوع 4. الانحدار الخطي المقترن. طريقة المربع الأصغر

يشير معامل الارتباط إلى درجة تقارب العلاقة بين خاصيتين، لكنه لا يجيب على سؤال كيف يؤثر التغير في صفة واحدة بوحدة بعدها على التغير في صفة أخرى. للإجابة على هذا السؤال، يتم استخدام أساليب تحليل الانحدار.

تحليل الانحدارمجموعات استمارةالتبعيات بين متغير عشوائي والقيم المتغيرة
، والقيم
تعتبر محددة بدقة.

معادلة الانحدارهي صيغة للعلاقة الإحصائية بين المتغيرات.

إذا كانت هذه الصيغة خطية، فإننا نتحدث عنها الانحدارالخطي.تسمى صيغة العلاقة الإحصائية بين متغيرين الانحدار الزوجي(عدة متغيرات - عديد).

يسمى اختيار صيغة التبعية تخصيصمعادلات الانحدار. يسمى تقدير قيم معلمات الصيغة المحددة تحديد المعلمات.

كيفية تقدير قيم المعلمات والتحقق من موثوقية التقديرات المقدمة؟

دعونا نلقي نظرة على الرسم

    في الرسم البياني (أ) العلاقة Xو فيفهو قريب من الخطي، والخط المستقيم 1 هنا قريب من نقاط المراقبة ولا ينحرف عنه الأخير إلا نتيجة لتأثيرات عشوائية صغيرة نسبيا.

    ويوضح الرسم البياني (ب) العلاقة الحقيقية بين الكميات Xو فييتم وصفه بواسطة دالة غير خطية 2، وبغض النظر عن الخط المستقيم الذي نرسمه (على سبيل المثال، 1)، فإن انحرافات النقاط عنه ستكون غير عشوائية.

    في الرسم البياني (ج) العلاقة بين المتغيرات Xو فيمفقودة، ولن تنجح نتائج تحديد معلمات أي صيغة تبعية.

عادة ما تكون نقطة البداية لتحليل العلاقات الاقتصادية القياسية هي التقدير الاعتماد الخطيالمتغيرات. يمكنك دائمًا محاولة رسم خط مستقيم يكون "الأقرب" لنقاط المراقبة في مجملها (على سبيل المثال، في الشكل (ج) سيكون الخط المستقيم 1 أفضل من الخط المستقيم 2).

معادلة الانحدار الخطي الزوجي النظريةلديه النموذج:


,

أين
وتسمى المعلمات النظرية (المعاملات النظرية) تراجع؛ -انحراف عشوائي(خطأ عشوائي).

وبشكل عام سنقدم النموذج النظري على النحو التالي:

.

ولتحديد قيم معاملات الانحدار النظري لا بد من معرفة جميع قيم المتغيرات Xو ي، أي. الجميع عامه السكان، وهو أمر مستحيل عمليا.

المهمة هي كما يلي: وفقا لبيانات الرصد المتاحة
,
من الضروري تقدير قيم المعلمات
.

يترك أتقدير المعلمة
,بتقدير المعلمة .

ثم معادلة الانحدار المقدرة هي:
,

أين
القيم النظرية للمتغير التابع ذ, - قيم الخطأ الملحوظة . تسمى هذه المعادلة معادلة الانحدار التجريبية. وسوف نكتبها في النموذج
.

الأساس لتقدير معلمات الانحدار الخطي هو طريقة المربع الأصغر (الشركات المتعددة الجنسيات)هي طريقة لتقدير معلمات الانحدار الخطي التي تقلل من مجموع الانحرافات التربيعية لملاحظات المتغير التابع من الدالة الخطية المطلوبة.

وظيفة سيكون وظيفة من الدرجة الثانيةمعلمتين أو ب. لأن وهي مستمرة ومحدبة ومحدودة من الأسفل (
)، حتى يصل إلى الحد الأدنى. الشرط الضروري لوجود الحد الأدنى هو مساواة مشتقاته الجزئية بالصفر بالنسبة لـ أو ب:


.

قسمة معادلتي النظام على ن، نحن نحصل:


أو

وإلا يمكنك الكتابة:

و - الانحرافات المعيارية لقيم نفس الخصائص.

الذي - التي. يمر خط الانحدار عبر النقطة ذات القيم المتوسطة Xو في
، أ معامل الانحدار ب يتناسب مع مؤشر التغاير والمعامل الارتباط الخطي.

إذا إلى جانب الانحدار يعلى Xلنفس القيم التجريبية، معادلة الانحدار لـ X على Y (
، أين
)، ثم حاصل ضرب المعاملات
:

.

ل معامل الانحدار - هذه قيمة توضح عدد وحدات البعد التي ستتغير القيمة عند تغيير القيمة لكل وحدة من البعد. يتم تحديد المعامل بالمثل .

في البحث العلمي، غالبًا ما تكون هناك حاجة إلى إيجاد صلة بين متغيرات النتائج والعوامل (عائد المحصول وكمية هطول الأمطار، وطول ووزن الشخص في مجموعات متجانسة حسب الجنس والعمر، ومعدل ضربات القلب، ودرجة حرارة الجسم). ، إلخ.).

والثانية هي العلامات التي تساهم في إحداث تغييرات في الأشخاص المرتبطين بها (الأولى).

مفهوم تحليل الارتباط

هناك العديد منها وبناء على ما سبق يمكننا القول أن تحليل الارتباط هو أسلوب يستخدم لاختبار الفرضيات حولها دلالة إحصائيةمتغيرين أو أكثر إذا تمكن الباحث من قياسهما دون تغييرهما.

هناك تعريفات أخرى للمفهوم المعني. تحليل الارتباط هو أسلوب معالجة يتضمن دراسة معاملات الارتباط بين المتغيرات. وفي هذه الحالة تتم مقارنة معاملات الارتباط بين زوج واحد أو عدة أزواج من الخصائص لإقامة علاقات إحصائية بينها. تحليل الارتباط هو أسلوب لدراسة الاعتماد الإحصائي بين المتغيرات العشوائية مع وجود اختياري ذو طبيعة وظيفية صارمة، حيث تؤدي ديناميكيات متغير عشوائي واحد إلى ديناميكيات توقع رياضيآخر.

مفهوم الارتباط الزائف

عند إجراء تحليل الارتباطمن الضروري أن نأخذ في الاعتبار أنه يمكن تنفيذها فيما يتعلق بأي مجموعة من الخصائص، والتي غالبًا ما تكون سخيفة فيما يتعلق ببعضها البعض. في بعض الأحيان ليس لديهم علاقة سببية مع بعضهم البعض.

في هذه الحالة، يتحدثون عن علاقة خاطئة.

مشاكل تحليل الارتباط

بناءً على التعريفات المذكورة أعلاه، يمكننا صياغة المهام التالية للطريقة الموصوفة: الحصول على معلومات حول أحد المتغيرات المطلوبة باستخدام متغير آخر؛ تحديد مدى قرب العلاقة بين المتغيرات المدروسة.

يتضمن تحليل الارتباط تحديد العلاقة بين الخصائص التي تتم دراستها، وبالتالي يمكن استكمال مهام تحليل الارتباط بما يلي:

  • تحديد العوامل التي لها التأثير الأكبر على الخاصية الناتجة؛
  • تحديد أسباب الاتصالات التي لم يتم استكشافها من قبل؛
  • بناء نموذج الارتباط مع تحليله البارامترى؛
  • دراسة أهمية معلمات الاتصال وتقييم الفاصل بينها.

العلاقة بين تحليل الارتباط والانحدار

ولا يقتصر أسلوب تحليل الارتباط في كثير من الأحيان على إيجاد مدى تقارب العلاقة بين الكميات المدروسة. في بعض الأحيان يتم استكماله من خلال تجميع معادلات الانحدار، والتي يتم الحصول عليها باستخدام التحليل الذي يحمل نفس الاسم، والتي تمثل وصفًا لاعتماد الارتباط بين الخاصية الناتجة والعامل (العامل) (الميزات). تشكل هذه الطريقة، إلى جانب التحليل قيد النظر، الطريقة

شروط استخدام الطريقة

العوامل الفعالة تعتمد على واحد إلى عدة عوامل. يمكن استخدام أسلوب تحليل الارتباط إذا كان هناك عدد كبير من الملاحظات حول قيمة المؤشرات الفعالة والعاملية (العوامل)، في حين أن العوامل قيد الدراسة يجب أن تكون كمية وتنعكس في مصادر محددة. الأول يمكن تحديده بالقانون العادي - في هذه الحالة تكون نتيجة تحليل الارتباط هي معاملات ارتباط بيرسون، أو إذا كانت الخصائص لا تخضع لهذا القانون يتم استخدام المعامل ارتباط الرتبةالرامح.

قواعد اختيار عوامل تحليل الارتباط

عند الاستخدام هذه الطريقةومن الضروري تحديد العوامل المؤثرة على مؤشرات الأداء. يتم اختيارها مع الأخذ في الاعتبار حقيقة أنه يجب أن تكون هناك علاقات السبب والنتيجة بين المؤشرات. في حالة إنشاء نموذج الارتباط متعدد العوامل يتم اختيار تلك التي لها تأثير كبير على المؤشر الناتج، بينما يفضل عدم إدراج عوامل مترابطة ذات معامل ارتباط زوجي يزيد عن 0.85 في نموذج الارتباط، وكذلك تلك العوامل التي لا تكون فيها العلاقة مع المعلمة الناتجة ذات طابع خطي أو وظيفي.

عرض النتائج

يمكن عرض نتائج تحليل الارتباط في أشكال نصية ورسومية. في الحالة الأولى يتم تقديمها كمعامل ارتباط، في الحالة الثانية - في شكل مخطط مبعثر.

في حالة عدم وجود ارتباط بين المعلمات، تقع النقاط الموجودة على الرسم البياني بشكل فوضوي، ويتميز متوسط ​​درجة الاتصال بدرجة أكبر من النظام ويتميز بمسافة موحدة أكثر أو أقل من العلامات المميزة من المتوسط. يميل الاتصال القوي إلى أن يكون مستقيمًا، وعند r=1 يكون المخطط النقطي خطًا مسطحًا. يختلف الارتباط العكسي في اتجاه الرسم البياني من أعلى اليسار إلى أسفل اليمين، والارتباط المباشر - من أسفل اليسار إلى الزاوية اليمنى العليا.

تمثيل ثلاثي الأبعاد لمؤامرة مبعثرة

بالإضافة إلى عرض الرسم المبعثر التقليدي ثنائي الأبعاد، يتم الآن استخدام تمثيل رسومي ثلاثي الأبعاد لتحليل الارتباط.

يتم أيضًا استخدام مصفوفة مخطط التشتت، والتي تعرض جميع المخططات المقترنة في شكل واحد بتنسيق مصفوفة. بالنسبة للمتغيرات n، تحتوي المصفوفة على n صفوف و n أعمدة. الرسم البياني الموجود عند تقاطع الصف i والعمود j عبارة عن مخطط للمتغيرين Xi مقابل Xj. وبالتالي، فإن كل صف وعمود يمثل بعدًا واحدًا، وتعرض الخلية الواحدة مخططًا مبعثرًا ذو بعدين.

تقييم ضيق الاتصال

يتم تحديد مدى قرب اتصال الارتباط من خلال معامل الارتباط (r): قوي - r = ±0.7 إلى ±1، متوسط ​​- r = ±0.3 إلى ±0.699، ضعيف - r = 0 إلى ±0.299. هذا التصنيف ليس صارما. يوضح الشكل مخططًا مختلفًا قليلاً.

مثال على استخدام طريقة تحليل الارتباط

أجريت دراسة مثيرة للاهتمام في المملكة المتحدة. وهو مخصص للعلاقة بين التدخين وسرطان الرئة، وتم إجراؤه من خلال تحليل الارتباط. وترد هذه الملاحظة أدناه.

البيانات الأولية لتحليل الارتباط

المجموعة المهنية

معدل الوفيات

المزارعين والغابات والصيادين

عمال المناجم والمحاجر

مصنعي الغاز وفحم الكوك والمواد الكيميائية

مصنعي الزجاج والسيراميك

عمال الأفران والحدادة والمسابك ومصانع الدرفلة

عمال الكهرباء والإلكترونيات

الهندسة والمهن المرتبطة بها

الصناعات الخشبية

عمال الجلود

عمال النسيج

مصنعي ملابس العمل

العاملون في صناعات الأغذية والمشروبات والتبغ

مصنعي الورق والطباعة

الشركات المصنعة للمنتجات الأخرى

بناة

الرسامين ومصممي الديكور

سائقي المحركات الثابتة والرافعات وغيرها.

العمال غير المدرجة في أي مكان آخر

عمال النقل والاتصالات

عمال المستودعات وأمناء المخازن والتعبئة وعمال آلات التعبئة

العاملين في المكتب

البائعين

العاملون في مجال الرياضة والترفيه

الإداريين والمديرين

المهنيين والفنيين والفنانين

نبدأ تحليل الارتباط. من الأفضل أن يبدأ الحل من أجل الوضوح طريقة الرسم، والتي سوف نقوم ببناء مخطط مبعثر لها.

فإنه يدل على اتصال مباشر. ومع ذلك، من الصعب استخلاص نتيجة لا لبس فيها بناءً على الطريقة الرسومية وحدها. لذلك، سوف نستمر في إجراء تحليل الارتباط. ويرد أدناه مثال لحساب معامل الارتباط.

وباستخدام البرنامج (سيتم وصف MS Excel أدناه كمثال)، نحدد معامل الارتباط وهو 0.716، مما يعني وجود ارتباط قوي بين المعلمات قيد الدراسة. دعونا نحدد الموثوقية الإحصائية للقيمة التي تم الحصول عليها باستخدام الجدول المقابل، والذي نحتاج إلى طرح 2 من 25 زوجًا من القيم، ونتيجة لذلك نحصل على 23 وباستخدام هذا السطر في الجدول نجد r حاسم لـ p = 0.01 (منذ هذه بيانات طبية، وهو اعتماد أكثر صرامة، وفي حالات أخرى يكون p = 0.05 كافيًا)، وهو 0.51 لتحليل الارتباط هذا. أظهر المثال أن r المحسوب أكبر من r الحرج، وتعتبر قيمة معامل الارتباط موثوقة إحصائيا.

استخدام البرمجيات عند إجراء تحليل الارتباط

يمكن تنفيذ النوع الموصوف لمعالجة البيانات الإحصائية باستخدام برمجةوخاصة برنامج MS Excel. يتضمن الارتباط حساب المعلمات التالية باستخدام الوظائف:

1. يتم تحديد معامل الارتباط باستخدام الدالة CORREL (array1; array2). Array1،2 - خلية الفاصل الزمني لقيم المتغيرات الناتجة والعامل.

يُطلق على معامل الارتباط الخطي أيضًا اسم معامل ارتباط بيرسون، وبالتالي، بدءًا من Excel 2007، يمكنك استخدام الدالة مع نفس المصفوفات.

يتم عرض رسومية لتحليل الارتباط في Excel باستخدام لوحة "الرسوم البيانية" مع تحديد "Scatter Plot".

بعد تحديد البيانات الأولية، نحصل على الرسم البياني.

2. تقييم أهمية معامل الارتباط الزوجي باستخدام اختبار الطالب. تتم مقارنة القيمة المحسوبة لمعيار t مع القيمة المجدولة (الحرجة) لهذا المؤشر من جدول قيم المعلمة قيد النظر، مع مراعاة مستوى الأهمية المحدد وعدد درجات الحرية. يتم إجراء هذا التقدير باستخدام الدالة STUDISCOVER(probability;degrees_of_freedom).

3. مصفوفة معاملات الارتباط الزوجية. يتم إجراء التحليل باستخدام أداة تحليل البيانات، والتي يتم فيها تحديد الارتباط. يتم إجراء التقييم الإحصائي لمعاملات الارتباط الزوجي من خلال مقارنتها قيمه مطلقهبقيمة جدولية (حرجة). عندما يتجاوز معامل الارتباط الزوجي المحسوب معامل الارتباط الحرج، يمكننا القول، مع الأخذ في الاعتبار درجة الاحتمالية المعطاة، أن الفرضية الصفرية حول أهمية العلاقة الخطية لم يتم رفضها.

أخيراً

يتيح لنا استخدام طريقة تحليل الارتباط في البحث العلمي تحديد العلاقة بين عوامل مختلفةومؤشرات الأداء. ومن الضروري أن نأخذ في الاعتبار أنه يمكن الحصول على معامل ارتباط مرتفع من زوج أو مجموعة من البيانات السخيفة، وبالتالي هذا النوعيجب إجراء التحليل على مجموعة كبيرة بما فيه الكفاية من البيانات.

بعد الحصول على القيمة المحسوبة لـ r، من المستحسن مقارنتها بالقيمة r الحرجة لتأكيد الموثوقية الإحصائية لقيمة معينة. يمكن إجراء تحليل الارتباط يدويًا باستخدام الصيغ، أو باستخدام البرامج، وخاصةً MS Excel. هنا يمكنك أيضًا إنشاء مخطط مبعثر بغرض تمثيل العلاقة بشكل مرئي بين العوامل المدروسة لتحليل الارتباط والخصائص الناتجة.

المرحلة 3. إيجاد العلاقات بين البيانات

الارتباط الخطي

المرحلة الأخيرة من مهمة دراسة الارتباطات بين الظواهر هي تقييم مدى قرب الارتباط باستخدام مؤشرات الارتباط. تعتبر هذه المرحلة مهمة جدًا لتحديد التبعيات بين العامل وخصائص الأداء، وبالتالي لإمكانية التشخيص والتنبؤ بالظاهرة قيد الدراسة.

تشخبص(من التعرف على التشخيص اليوناني) - تحديد جوهر وخصائص حالة الجسم أو الظاهرة بناءً على دراستها الشاملة.

تنبؤ بالمناخ(من التنبؤ اليوناني، التنبؤ) - أي تنبؤ محدد، حكم على حالة أي ظاهرة في المستقبل (توقعات الطقس، نتائج الانتخابات، وما إلى ذلك). التنبؤ هو فرضية مبنية على أساس علمي حول الحالة المستقبلية المحتملة للنظام أو الجسم أو الظاهرة قيد الدراسة والمؤشرات التي تميز هذه الحالة. التنبؤ - تطوير التنبؤ، خاص بحث علميآفاق محددة لتطوير أي ظاهرة.

لنتذكر تعريف الارتباط:

علاقة- الاعتماد بين المتغيرات العشوائية، معبرا عنه في أن توزيع قيمة واحدة يعتمد على قيمة قيمة أخرى.

ويلاحظ وجود علاقة ليس فقط بين الخصائص الكمية، ولكن أيضا بين الخصائص النوعية. يخرج طرق مختلفةومؤشرات لتقييم مدى قرب العلاقات. ولن نتوقف إلا عند معامل الارتباط الزوجي الخطي والذي يستخدم عندما تكون هناك علاقة خطية بين المتغيرات العشوائية. من الناحية العملية، غالبًا ما تكون هناك حاجة لتحديد مستوى الارتباط بين المتغيرات العشوائية ذات الأبعاد غير المتساوية، لذلك من المرغوب فيه أن يكون هناك نوع من الخصائص عديمة الأبعاد لهذا الارتباط. هذه الخاصية (مقياس الاتصال) هي معامل الارتباط الخطي ص س ص، والتي يتم تحديدها بواسطة الصيغة

أين , .

بالإشارة إلى و، يمكننا الحصول على التعبير التالي لحساب معامل الارتباط

.

إذا قدمنا ​​هذا المفهوم الانحراف الطبيعي والذي يعبر عن انحراف القيم المترابطة عن المتوسط ​​بكسور الانحراف المعياري:



عندها سيأخذ التعبير الخاص بمعامل الارتباط الشكل

.

إذا قمت بحساب معامل الارتباط بناءً على القيم النهائية الأولية المتغيرات العشوائيةمن جدول الحساب، فيمكن حساب معامل الارتباط باستخدام الصيغة

.

خصائص معامل الارتباط الخطي:

1). معامل الارتباط هو كمية بلا أبعاد.

2). |ص| 1 جنيه استرليني أو .

3). , أ، ب= const، - لن تتغير قيمة معامل الارتباط إذا تم ضرب (أو قسمة) جميع قيم المتغيرات العشوائية X و Y على ثابت.

4). , أ، ب= const، - لن تتغير قيمة معامل الارتباط إذا زادت (أو انخفضت) جميع قيم المتغيرات العشوائية X و Y بمقدار ثابت.

5). توجد علاقة بين معامل الارتباط ومعامل الانحدار:

ويمكن تفسير قيم معاملات الارتباط على النحو التالي:

المعايير الكمية لتقييم مدى قرب الاتصال:

لأغراض النذير، القيم مع |r| > 0.7.

يسمح لنا معامل الارتباط باستنتاج أن هناك علاقة خطية بين متغيرين عشوائيين، لكنه لا يشير إلى أي من المتغيرين يسبب التغيير في الآخر. في الواقع، يمكن أن يوجد اتصال بين متغيرين عشوائيين دون وجود علاقة سبب ونتيجة بين القيم نفسها، لأن يمكن أن يكون سبب التغيير في كلا المتغيرين العشوائيين هو تغيير (تأثير) الثالث.

معامل الارتباط ص س صمتماثل فيما يتعلق بالمتغيرات العشوائية قيد النظر Xو ي. وهذا يعني أنه لتحديد معامل الارتباط، لا يهم تمامًا أي من الكميات مستقلة وأيها تابعة.

أهمية معامل الارتباط

حتى ل كميات مستقلةوقد يختلف معامل الارتباط عن الصفر بسبب التشتت العشوائي لنتائج القياس أو بسبب عينة صغيرة من المتغيرات العشوائية. ولذلك، ينبغي التحقق من أهمية معامل الارتباط.

يتم التحقق من أهمية معامل الارتباط الخطي على أساس اختبار الطالب :

.

لو ر > ر كر(ص، ن-2)، ثم معامل خطيالارتباط مهم، وبالتالي فإن الارتباط الإحصائي مهم أيضًا Xو ي.

.

ولتسهيل الحساب تم إنشاء جداول قيم حدود الثقة لمعاملات الارتباط أرقام مختلفةدرجات الحرية و = ن-2 (اختبار ثنائي الذيل) ومستويات أهمية مختلفة أ= 0.1؛ 0.05؛ 0.01 و 0.001. يعتبر الارتباط هاما إذا تجاوز معامل الارتباط المحسوب قيمة حد الثقة لمعامل الارتباط للمعطى المعطى Fو أ.

للكبار نو أ= 0.01 يمكن حساب قيمة حد الثقة لمعامل الارتباط باستخدام الصيغة التقريبية

.

مقدمة. 2

1. تقييم أهمية معاملات الانحدار والارتباط باستخدام اختبار الطالب f. 3

2. حساب أهمية معاملات الانحدار والارتباط باستخدام اختبار الطالب f. 6

خاتمة. 15

بعد إنشاء معادلة الانحدار، من الضروري التحقق من أهميتها: باستخدام معايير خاصة، تحديد ما إذا كان الاعتماد الناتج يعبر عنها بالمعادلةالانحدار، عشوائي، أي. هل يمكن استخدامه لأغراض التنبؤ و تحليل العوامل. في مجال الإحصاء، تم تطوير طرق لاختبار أهمية معاملات الانحدار بشكل صارم باستخدام تحليل التباينوحساب المعايير الخاصة (على سبيل المثال، معيار F). يمكن إجراء اختبار فضفاض عن طريق حساب متوسط ​​الانحراف الخطي النسبي (e)، ويسمى متوسط ​​الخطأالتقريبات:

دعونا ننتقل الآن إلى تقييم أهمية معاملات الانحدار bj وبناء فاصل ثقة لمعلمات نموذج الانحدار Ru (J=l,2,..., p).

الكتلة 5 - تقييم أهمية معاملات الانحدار بناءً على قيمة اختبار ^ الطالب. تتم مقارنة القيم المحسوبة لـ ta بالقيمة المسموح بها

الكتلة 5 - تقييم أهمية معاملات الانحدار بناءً على قيمة معيار ^. تتم مقارنة القيم المحسوبة لـ t0n بالقيمة المسموح بها 4,/، والتي يتم تحديدها من جداول توزيع t لاحتمال خطأ معين (a) وعدد درجات الحرية (/).

بالإضافة إلى التحقق من أهمية النموذج بأكمله، من الضروري اختبار أهمية معاملات الانحدار باستخدام اختبار الطالب/. يجب أن تتوافق القيمة الدنيا لمعامل الانحدار br مع الشرط bifob- ^t، حيث bi هي قيمة معامل معادلة الانحدار على مقياس طبيعي لخاصية العامل i؛ آه. - متوسط ​​مربع الخطأ لكل معامل. عدم القدرة على المقارنة بين المعاملات D في أهميتها؛

مزيد من التحليل الإحصائي يتعلق باختبار أهمية معاملات الانحدار. للقيام بذلك، نجد قيمة ^-المعيار لمعاملات الانحدار. ونتيجة للمقارنة بينهما، يتم تحديد أصغر معيار ^. يتم استبعاد العامل الذي يتوافق معامله مع أصغر معيار ^ من التحليل الإضافي.

لتقييم الأهمية الإحصائية لمعاملات الانحدار والارتباط، اختبار الطالب و فترات الثقةكل من المؤشرات. تم طرح فرضية حول الطبيعة العشوائية للمؤشرات، أي. حول اختلافهم الضئيل عن الصفر. يتم تقييم أهمية معاملات الانحدار والارتباط باستخدام اختبار الطالب f من خلال مقارنة قيمها مع حجم الخطأ العشوائي:

إن تقييم أهمية معاملات الانحدار الخالصة باستخدام اختبار الطالب / - يعود إلى حساب القيمة

تعد جودة العمل إحدى سمات العمل المحدد، مما يعكس درجة تعقيده وكثافته (شدته) وظروفه وأهميته بالنسبة للتنمية الاقتصادية. ك.ت. يتم قياسها من خلال نظام تعريفة يسمح بتمييز الأجور اعتمادًا على مستوى المؤهلات (تعقيد العمل)، والظروف، وشدة العمل وكثافته، فضلاً عن أهمية الصناعات والإنتاج الفردي والمناطق والأقاليم لتنمية اقتصاد البلاد. ك.ت. يجد التعبير في أجورالعمال، الذين يتطورون في سوق العمل تحت تأثير العرض والطلب قوة العمل(أنواع محددة من العمل). ك.ت. - معقدة في الهيكل

توفر الدرجات التي تم الحصول عليها للأهمية النسبية للعواقب الاقتصادية والاجتماعية والبيئية الفردية للمشروع أيضًا أساسًا لمقارنة المشاريع البديلة وخياراتها باستخدام "معيار التسجيل المعقد الذي لا أبعاد له للكفاءة الاجتماعية والبيئية والاقتصادية" لمشروع Ek، المحسوب (في متوسط ​​درجات الأهمية) باستخدام الصيغة

يضمن التنظيم داخل الصناعة وجود اختلافات في أجور العمال في صناعة معينة، اعتمادًا على أهمية أنواع الإنتاج الفردية في صناعة معينة، وعلى مدى تعقيد وظروف العمل، وكذلك على أشكال الأجور المستخدمة.

إن تقييم التصنيف الناتج للمؤسسة التي تم تحليلها فيما يتعلق بالمؤسسة القياسية دون مراعاة أهمية المؤشرات الفردية هو تقييم مقارن. عند مقارنة تقييمات العديد من الشركات أعلى تقييملديه مؤسسة ذات الحد الأدنى من قيمة التقييم المقارن الذي تم الحصول عليه.

إن فهم جودة المنتج كمقياس لفائدته يضع عمليا سؤال مهمعن قياسه. ويتم حلها من خلال دراسة أهمية الخصائص الفردية في تلبية حاجة معينة. قد تختلف أهمية نفس الخاصية اعتمادًا على ظروف استهلاك المنتج. وبالتالي فإن فائدة المنتج في ظروف مختلفةاستخداماته مختلفة.

أما المرحلة الثانية من العمل فهي دراسة البيانات الإحصائية وتحديد العلاقة والتفاعل بين المؤشرات وتحديد أهمية العوامل الفردية وأسباب التغيرات في المؤشرات العامة.

يتم دمج جميع المؤشرات المدروسة في مؤشر واحد بحيث تكون النتيجة تقييماً شاملاً لجميع الجوانب التي تم تحليلها لأنشطة المؤسسة، مع مراعاة ظروف نشاطها، مع مراعاة درجة أهمية المؤشرات الفردية أنواع مختلفةالمستثمرين:

توضح معاملات الانحدار شدة تأثير العوامل على مؤشر الأداء. إذا تم تنفيذ التوحيد الأولي لمؤشرات العوامل، فإن b0 يساوي متوسط ​​قيمة المؤشر الفعال في المجموع. المعاملات b, b2 ..... bl تظهر بعدد الوحدات التي ينحرف فيها مستوى المؤشر الفعال عن قيمته المتوسطة إذا انحرفت قيم المؤشر العامل عن المتوسط ​​تساوي صفر بمقدار واحد الانحراف المعياري. وبالتالي فإن معاملات الانحدار تميز درجة أهمية العوامل الفردية لزيادة مستوى مؤشر الأداء. يتم تحديد القيم المحددة لمعاملات الانحدار من البيانات التجريبية وفقًا للطريقة المربعات الصغرى(نتيجة حل أنظمة المعادلات العادية).

2. حساب أهمية معاملات الانحدار والارتباط باستخدام اختبار الطالب f

دعونا نعتبر الشكل الخطي للعلاقات متعددة العوامل ليس فقط هو الشكل الأبسط، ولكن أيضًا النموذج الذي توفره حزم البرامج التطبيقية لأجهزة الكمبيوتر. إذا لم تكن العلاقة بين عامل فردي والسمة الناتجة خطية، فسيتم تحويل المعادلة إلى خطية عن طريق استبدال قيمة سمة العامل أو تحويلها.

الشكل العاممعادلة الانحدار متعدد المتغيرات لها الشكل:


حيث k هو عدد خصائص العامل.

لتبسيط نظام معادلات المربعات الصغرى اللازمة لحساب معلمات المعادلة (8.32)، عادة ما يتم تقديم انحرافات القيم الفردية لجميع الخصائص عن القيم المتوسطة لهذه الخصائص.

نحصل على نظام معادلات k للمربعات الصغرى:

وبحل هذا النظام نحصل على قيم معاملات الانحدار النقي المشروط ب. يتم حساب الحد الحر للمعادلة بواسطة الصيغة


يعني مصطلح "معامل الانحدار النقي المشروط" أن كل قيمة من القيم bj تقيس متوسط ​​الانحراف الإجمالي للخاصية الناتجة عن قيمتها المتوسطة عندما ينحرف عامل معين xj عن قيمته المتوسطة بوحدة قياسه وبشرط أن تكون جميع العوامل الأخرى التي تشملها معادلة الانحدار، ثابتة عند القيم المتوسطة، لا تتغير، لا تتغير.

وهكذا، على النقيض من معامل الانحدار المقترن، فإن معامل الانحدار النقي المشروط يقيس تأثير عامل ما، ويستخلص من علاقة تباين هذا العامل مع تباين العوامل الأخرى. إذا كان من الممكن أن تدرج في معادلة الانحدار جميع العوامل المؤثرة على تباين الخاصية الناتجة، فإن قيم bj. يمكن اعتبارها مقاييس للتأثير النقي للعوامل. ولكن نظرًا لأنه من المستحيل حقًا تضمين جميع العوامل في المعادلة، فإن المعاملات bj. لا تخلو من خليط تأثير العوامل غير المدرجة في المعادلة.

من المستحيل تضمين جميع العوامل في معادلة الانحدار لواحد من ثلاثة أسباب أو جميعها في وقت واحد، حيث:

1) قد تكون بعض العوامل غير معروفة العلم الحديثالمعرفة بأي عملية دائمًا ما تكون غير مكتملة؛

2) لا توجد معلومات عن بعض العوامل النظرية المعروفة أو أنها غير موثوقة.

3) أن حجم المجتمع محل الدراسة (العينة) محدود مما يجعل من الممكن إدراج عدد محدود من العوامل في معادلة الانحدار.

معاملات الانحدار النقي المشروط BJ. هي أرقام مسماة يتم التعبير عنها بوحدات قياس مختلفة وبالتالي لا يمكن مقارنتها مع بعضها البعض. ولتحويلها إلى مؤشرات نسبية قابلة للمقارنة، يتم استخدام نفس التحويل للحصول على معامل الارتباط الزوجي. تسمى القيمة الناتجة معامل موحدالانحدار أو؟-معامل.


يحدد معامل العامل xj قياس تأثير تباين العامل xj على تباين الخاصية الناتجة y، مع التجريد من التباين المصاحب للعوامل الأخرى المدرجة في معادلة الانحدار.

من المفيد التعبير عن معاملات الانحدار النقي المشروط في شكل مؤشرات اتصال نسبية قابلة للمقارنة ومعاملات المرونة:

يقول معامل المرونة للعامل xj أنه عندما تنحرف قيمة عامل معين عن قيمته المتوسطة بنسبة 1%، مع استخلاص الانحراف المصاحب للعوامل الأخرى المدرجة في المعادلة، فإن الخاصية الناتجة سوف تنحرف عن قيمتها المتوسطة بنسبة ej في المائة من ذ. في كثير من الأحيان، يتم تفسير معاملات المرونة وتطبيقها من حيث الديناميكيات: مع زيادة العامل x بنسبة 1% من متوسط ​​قيمته، فإن الخاصية الناتجة ستزيد بنسبة ه.% من متوسط ​​قيمتها.

دعونا نفكر في حساب وتفسير معادلة الانحدار متعدد العوامل باستخدام نفس المزارع الستة عشر كمثال (الجدول 8.1). علامة النتيجة - المستوى الدخل الإجماليويتم عرض ثلاثة عوامل مؤثرة في الجدول. 8.7.

دعونا نتذكر مرة أخرى أنه من أجل الحصول على مؤشرات ارتباط موثوقة ودقيقة بما فيه الكفاية، هناك حاجة إلى عدد أكبر من السكان.


الجدول 8.7

مستوى الدخل الإجمالي وعوامله

ارقام المزرعة

إجمالي الدخل، فرك./را

تكاليف العمالة، يوم عمل/هكتار ×1

حصة من الأراضي الصالحة للزراعة،

إنتاج الحليب لكل 1 بقرة،

الجدول 8.8 مؤشرات معادلة الانحدار

المتغير التابع: ذ

معامل الانحدار

ثابت-240.112905

الأمراض المنقولة جنسيا. خطأ في التقديرات. = 79.243276


تم تنفيذ الحل باستخدام برنامج "Microstat" للكمبيوتر الشخصي. فيما يلي الجداول من النسخة المطبوعة: الجدول. 8.7 يعطي متوسط ​​القيم والانحرافات المعيارية لجميع الخصائص. طاولة 8.8 يحتوي على معاملات الانحدار وتقييمها الاحتمالي:

العمود الأول "فار" - المتغيرات، أي العوامل؛ العمود الثاني "معامل الانحدار" - معاملات الانحدار النقية المشروطة bj؛ العمود الثالث "الأمراض المنقولة جنسيا. errr" - متوسط ​​الأخطاء في تقديرات معامل الانحدار؛ العمود الرابع - قيم اختبار الطالب مع 12 درجة حرية التغيير؛ العمود الخامس "prob" - احتمال الفرضية الصفرية بالنسبة لمعاملات الانحدار؛

العمود السادس "R2 الجزئي" - معاملات التحديد الجزئية. تتم مناقشة محتوى ومنهجية حساب المؤشرات في الأعمدة من 3 إلى 6 بمزيد من التفصيل في الفصل 8. "الثابت" هو الحد الحر لمعادلة الانحدار a؛ "الأمراض المنقولة جنسيا. خطأ في التقدير." - متوسط ​​مربع الخطأ في تقدير الخاصية الفعالة باستخدام معادلة الانحدار. تم الحصول على المعادلة الانحدار المتعدد:

ص = 2.26x1 - 4.31x2 + 0.166x3 - 240.

وهذا يعني أن مقدار الدخل الإجمالي لكل هكتار واحد من الأراضي الزراعية ارتفع في المتوسط ​​بمقدار 2.26 روبل. مع زيادة في تكاليف العمالة بمقدار ساعة واحدة/هكتار؛ انخفض بمعدل 4.31 روبل. مع زيادة حصة الأراضي الصالحة للزراعة في الأراضي الزراعية بنسبة 1٪ وزادت بمقدار 0.166 روبل. مع زيادة إنتاج الحليب لكل بقرة بمقدار 1 كجم. إن القيمة السالبة للحد الحر أمر طبيعي تمامًا، وكما ذكرنا سابقًا في الفقرة 8.2، فإن العلامة الفعالة هي أن إجمالي الدخل يصبح صفرًا قبل وقت طويل من وصول العوامل إلى القيم صفر، وهو أمر مستحيل في الإنتاج.

القيمة السلبية لمعامل x^ هي إشارة إلى وجود مشكلة كبيرة في اقتصاد المزارع قيد الدراسة، حيث زراعة المحاصيل غير مربحة، وتربية الماشية فقط هي المربحة. مع الأساليب الرشيدة للزراعة والأسعار العادية (التوازن أو قريبة منها) لمنتجات جميع القطاعات، لا ينبغي أن ينخفض ​​​​الدخل، بل يزداد مع زيادة الحصة الأكثر خصوبة من الأراضي الزراعية - الأراضي الصالحة للزراعة.

بناءً على البيانات الواردة من الصفين قبل الأخيرين من الجدول. 8.7 والجدول. 8.8 نحسب معاملات p ومعاملات المرونة وفقًا للصيغتين (8.34) و (8.35).

يتأثر كل من التباين في مستوى الدخل والتغير المحتمل في الديناميكيات بقوة بالعامل x3 - إنتاجية الأبقار، والأضعف بـ x2 - حصة الأراضي الصالحة للزراعة. سيتم استخدام قيم P2/ بشكل أكبر (الجدول 8.9)؛

الجدول 8.9 التأثير المقارن للعوامل على مستوى الدخل

العوامل xj


وبذلك نكون قد توصلنا إلى أن معامل ? للعامل xj يتعلق بمعامل مرونة هذا العامل، كما أن معامل تباين العامل يرتبط بمعامل تباين الخاصية الناتجة. منذ ذلك الحين، كما يتبين من السطر الأخير من الجدول. 8.7، معاملات الاختلاف لجميع العوامل أقل من معامل الاختلاف في الخاصية الناتجة؛ جميع المعاملات أقل من معاملات المرونة.

دعونا نفكر في العلاقة بين معامل الانحدار المقترن والصافي المشروط باستخدام العامل -с، كمثال. أزواج معادلة خط مستقيماتصال y مع x له الشكل:

ص = 3.886x1 - 243.2

معامل الانحدار النقي المشروط عند x1 هو 58% فقط من المعامل المقترن. أما نسبة الـ 42% المتبقية فترجع إلى حقيقة أن التباين x1 يصاحبه تباين في العوامل x2 x3، والذي بدوره يؤثر على الصفة الناتجة. يتم عرض اتصالات جميع الخصائص ومعاملات الانحدار الزوجي الخاصة بها في الرسم البياني للاتصالات (الشكل 8.2).


إذا قمنا بجمع تقديرات التأثير المباشر وغير المباشر للتغير x1 على y، أي حاصل ضرب معاملات الانحدار المقترنة على طول جميع "المسارات" (الشكل 8.2)، نحصل على: 2.26 + 12.55 0.166 + (-0.00128) (- 4.31) + (-0.00128) 17.00 0.166 = 4.344.

هذه القيمة أكبر معامل الزوجاتصالات x1 مع y. وبالتالي، فإن التأثير غير المباشر للتغير x1 من خلال العوامل غير المدرجة في المعادلة هو عكس ذلك، مما يعطي في المجموع:

1 أيفازيان إس إيه، مخيتاريان في إس. الإحصاء التطبيقي وأساسيات الاقتصاد القياسي. كتاب مدرسي للجامعات. - م: الوحدة، 2008، – 311 ص.

2 جونستون ج. طرق الاقتصاد القياسي. - م: الإحصاء، 1980. - 282 ثانية.

3 دوجيرتي ك. مقدمة في الاقتصاد القياسي. - م: إنفرا-م، 2004، – 354 ص.

4 دراير إن، سميث جي، تطبيقي تحليل الانحدار. - م: المالية والإحصاء، 2006، – 191 ص.

5 ماغنوس واي آر، كارتيشيف بي كيه، بيريسيتسكي أ.أ. الاقتصاد القياسي. الدورة الأولية.-م.: ديلو، 2006، – 259 ص.

6 ورشة عمل حول الاقتصاد القياسي / إد. إليسيفا - م: المالية والإحصاء، 2004، – 248 ص.

7 الاقتصاد القياسي / إد. إليسيفا - م: المالية والإحصاء، 2004، – 541 ص.

8 كريمر ن.، بوتكو ب.الاقتصاد القياسي - م: UNITY-DANA، 200، – 281 ص.


أيفازيان إس إيه، مخيتاريان في إس. الإحصاء التطبيقي وأساسيات الاقتصاد القياسي. كتاب مدرسي للجامعات. - م: الوحدة، 2008، – ص. 23.

كريمر ن.، بوتكو ب. الاقتصاد القياسي.- م.: UNITY-DANA، 200، - ص 64

دراير إن، سميث جي، تحليل الانحدار التطبيقي. - م: المالية والإحصاء، 2006، – ص57.

ورشة عمل حول الاقتصاد القياسي / إد. إليسيفا - م: المالية والإحصاء، 2004، - ص 172.



جديد على الموقع

>

الأكثر شعبية