بيت صحة كيفية العثور على متوسط ​​خطأ التقريب في إكسل. تقدير الموثوقية الإحصائية لنتائج نمذجة الانحدار باستخدام اختبار فيشر F

كيفية العثور على متوسط ​​خطأ التقريب في إكسل. تقدير الموثوقية الإحصائية لنتائج نمذجة الانحدار باستخدام اختبار فيشر F

دعونا نتحقق من الفرضية H 0 حول مساواة معاملات الانحدار الفردية إلى الصفر (إذا كان البديل لا يساوي H 1) عند مستوى الدلالة b = 0.05.

إذا تبين أن الفرضية الرئيسية غير صحيحة، فإننا نقبل الفرضية البديلة. ولاختبار هذه الفرضية تم استخدام اختبار الطالب.

تتم مقارنة قيمة المعيار t التي تم العثور عليها من بيانات المراقبة (وتسمى أيضًا الملاحظة أو الفعلية) بالقيمة المجدولة (الحرجة) المحددة من جداول توزيع الطلاب (والتي يتم تقديمها عادةً في نهاية الكتب المدرسية وورش العمل حول الإحصاء أو الاقتصاد القياسي).

قيمة الجدوليتم تحديده اعتماداً على مستوى الأهمية (b) وعدد درجات الحرية، والتي في حالة الانحدار الزوجي الخطي تساوي (n-2)، n هو عدد الملاحظات.

إذا كانت القيمة الفعلية لاختبار t أكبر من القيمة الجدولية (modulo)، يتم رفض الفرضية الرئيسية ويعتبر أنه مع الاحتمال (1-b) المعلمة أو الخاصية الإحصائية في سكانتختلف بشكل كبير عن الصفر.

إذا كانت القيمة الفعلية لاختبار t أقل من القيمة الجدولية (modulo)، فلا يوجد سبب لرفض الفرضية الرئيسية، أي. لا تختلف المعلمة أو الخاصية الإحصائية في المجتمع بشكل كبير عن الصفر عند مستوى الأهمية ب.

t Crit (n-m-1;b/2) = (30;0.025) = 2.042

منذ 1.7< 2.042, то статистическая значимость коэффициента регрессии b не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в في هذه الحالةيمكن إهمال المعامل b .

منذ 0.56< 2.042, то статистическая значимость коэффициента регрессии a не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом a можно пренебречь.

فاصل الثقة لمعاملات معادلة الانحدار.

دعونا نحدد فترات الثقة لمعاملات الانحدار، والتي ستكون بموثوقية 95% على النحو التالي:

  • (ب - ر النقطة الحرجة S ب ; ب + ر النقطة الحرجة S ب)
  • (0.64 - 2.042 * 0.38; 0.64 + 2.042 * 0.38)
  • (-0.13;1.41)

بما أن النقطة 0 (صفر) تقع في الداخل فاصل الثقة، فإن تقدير الفاصل الزمني للمعامل b غير ذي دلالة إحصائية.

  • (أ - ر الحرجة S أ ; أ + ر الحرجة S أ)
  • (24.56 - 2.042 * 44.25; 24.56 + 2.042 * 44.25)
  • (-65.79;114.91)

مع احتمال 95% يمكن القول أن قيمة هذه المعلمة سوف تقع في الفاصل الزمني الذي تم العثور عليه.

وبما أن النقطة 0 (صفر) تقع داخل فاصل الثقة، فإن تقدير الفاصل للمعامل a غير ذي دلالة إحصائية.

2) إحصائيات F. معيار فيشر.

يتم استخدام معامل التحديد R2 لاختبار أهمية المعادلة الانحدارالخطيعمومًا.

يتم اختبار أهمية نموذج الانحدار باستخدام اختبار Fisher's F، والذي يتم العثور على قيمته المحسوبة كنسبة التباين في سلسلة الملاحظات الأصلية للمؤشر قيد الدراسة والتقدير غير المتحيز لتباين التسلسل المتبقي لهذا النموذج.

إذا كانت القيمة المحسوبة بدرجات الحرية k 1 =(m) وk 2 =(n-m-1) أكبر من القيمة المجدولة عند مستوى دلالة معين، فإن النموذج يعتبر مهمًا.

حيث m هو عدد العوامل في النموذج.

يتم تقييم الأهمية الإحصائية للانحدار الخطي المقترن باستخدام الخوارزمية التالية:

  • 1. تم طرح فرضية صفرية مفادها أن المعادلة ككل غير ذات دلالة إحصائية: H 0: R 2 =0 عند مستوى الأهمية b.
  • 2. بعد ذلك، حدد القيمة الفعلية للمعيار F:

حيث m=1 للانحدار الزوجي.

3. يتم تحديد القيمة الجدولية من جداول توزيع فيشر لمستوى دلالة معين مع الأخذ في الاعتبار أن عدد درجات الحرية لمجموع المربعات الكلية (التباين الأكبر) هو 1 وعدد درجات الحرية للمجموع المتبقي مجموع المربعات (التباين الأصغر) في الانحدار الخطي هو n-2 .

جدول F هو أقصى قيمة ممكنة للمعيار تحت تأثير العوامل العشوائية عند درجات معينة من الحرية ومستوى الأهمية ب. مستوى الدلالة ب - احتمال رفض الفرضية الصحيحة بشرط صحتها. عادة ما يؤخذ b يساوي 0.05 أو 0.01.

4. إذا كانت القيمة الفعلية لاختبار F أقل من القيمة الجدولية، فيقولون أنه لا يوجد سبب لرفض الفرضية الصفرية.

وبخلاف ذلك يتم رفض الفرضية الصفرية ومع الاحتمال (1-ب) يتم قبول الفرضية البديلة حول الأهمية الإحصائية للمعادلة ككل.

القيمة الجدولية للمعيار مع درجات الحرية k 1 = 1 و k 2 = 30، جدول F = 4.17

منذ القيمة الفعلية لـ F< F табл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

يتم التعبير عن العلاقة بين اختبار Fisher F وإحصائية الطالب بالمساواة:

مؤشرات جودة معادلة الانحدار.

اختبار الارتباط الذاتي للبقايا.

أحد المتطلبات الأساسية لبناء نموذج الانحدار النوعي باستخدام OLS هو استقلال قيم الانحرافات العشوائية عن قيم الانحرافات في جميع الملاحظات الأخرى. وهذا يضمن عدم وجود أي ارتباط بين أي انحرافات، وخاصة بين الانحرافات المجاورة.

يتم تعريف الارتباط التلقائي (الارتباط التسلسلي) على أنه الارتباط بين المؤشرات المرصودة مرتبة في الوقت (السلسلة الزمنية) أو الفضاء (السلسلة المتقاطعة). يعد الارتباط التلقائي للقيم المتبقية (الفروق) أمرًا شائعًا في تحليل الانحدار عند استخدام بيانات السلاسل الزمنية ونادرًا جدًا عند استخدام البيانات المقطعية.

في المشاكل الاقتصادية، يكون الارتباط الذاتي الإيجابي أكثر شيوعًا من الارتباط الذاتي السلبي. في معظم الحالات، يكون الارتباط الذاتي الإيجابي ناتجًا عن الاتجاه التعرض المستمربعض العوامل لم تؤخذ في الاعتبار في النموذج.

الارتباط الذاتي السلبي يعني في الأساس أن الانحراف الإيجابي يتبعه انحراف سلبي والعكس صحيح. وقد يحدث هذا الوضع إذا تم أخذ نفس العلاقة بين الطلب على المشروبات الغازية والدخل حسب البيانات الموسمية (الشتاء - الصيف).

من بين الأسباب الرئيسية التي تسبب الارتباط التلقائي ما يلي:

  • 1. أخطاء المواصفات. عادةً ما يؤدي الفشل في مراعاة أي متغير توضيحي مهم في النموذج أو الاختيار غير الصحيح لشكل الاعتماد إلى انحرافات نظامية لنقاط المراقبة عن خط الانحدار، مما قد يؤدي إلى الارتباط الذاتي.
  • 2. الجمود. كثير المؤشرات الاقتصادية(التضخم، البطالة، الناتج القومي الإجمالي، وما إلى ذلك) لها طبيعة دورية معينة مرتبطة بتموج النشاط التجاري. ولذلك، فإن التغيير في المؤشرات لا يحدث على الفور، ولكن له جمود معين.
  • 3. تأثير شبكة العنكبوت. في العديد من المجالات الإنتاجية وغيرها، تستجيب المؤشرات الاقتصادية للتغيرات في الظروف الاقتصادية مع تأخير (فارق زمني).
  • 4. تجانس البيانات. في كثير من الأحيان، يتم الحصول على البيانات لفترة زمنية طويلة معينة عن طريق حساب متوسط ​​البيانات على فترات زمنية المكونة لها. وهذا يمكن أن يؤدي إلى تجانس معين للتقلبات التي حدثت خلال الفترة قيد النظر، والتي بدورها يمكن أن تسبب الارتباط الذاتي.

تتشابه عواقب الارتباط الذاتي مع عواقب التغايرية: فالاستنتاجات من إحصائيات t وF التي تحدد أهمية معامل الانحدار ومعامل التحديد من المحتمل أن تكون غير صحيحة.

5. باستخدام اختبار F تبين أن معادلة الانحدار المزدوج الناتجة ككل غير ذات دلالة إحصائية ولا تصف بشكل كاف ظاهرة العلاقة المدروسة بين قيمة المعاش الشهري y وتكلفة المعيشة x.

6. تم إنشاء نموذج انحدار خطي متعدد للاقتصاد القياسي، يربط مبلغ صافي دخل شركة مشروطة y مع معدل دوران رأس المال x1 ورأس المال المستخدم x2

7. من خلال حساب معاملات المرونة يتبين أنه عندما يتغير معدل دوران رأس المال بنسبة 1% يتغير مقدار صافي دخل الشركة بنسبة 0.0008%، وعندما يتغير رأس المال المستخدم بنسبة 1% يتغير مقدار صافي دخل الشركة التغييرات بنسبة 0.56٪.

8. باستخدام اختبار t تم تقدير الدلالة الإحصائية لمعاملات الانحدار، وتبين أن المتغير التوضيحي x 1 غير ذو دلالة إحصائية ويمكن استبعاده من معادلة الانحدار، وفي نفس الوقت المتغير التوضيحي x 2 غير ذو دلالة إحصائية ويمكن استبعاده من معادلة الانحدار. ذات دلالة إحصائية.

9. باستخدام اختبار F تبين أن معادلة الانحدار المزدوج الناتجة ككل ذات دلالة إحصائية، وتصف بشكل كاف الظاهرة المدروسة للعلاقة بين صافي دخل الشركة المشروطة y ودوران رأس المال × 1 ورأس المال المستخدم × 2.

10. تم حساب متوسط ​​خطأ تقريب البيانات الإحصائية بالمعادلة الخطية الانحدار المتعددوالتي بلغت 29.8%. ويتبين من خلال الملاحظة في قاعدة البيانات الإحصائية أن حجم هذا الخطأ يتجاوز القيمة المسموح بها.

14. بناء نموذج الانحدار المزدوج دون استخدام برنامج EXCEL.

استخدام المواد الإحصائيةمن الضروري في الجدول 3.5:

2. تقييم مدى قرب الارتباط باستخدام مؤشرات الارتباط والتحديد.

3.باستخدام معامل المرونة تحديد درجة الارتباط بين العامل المميز والعامل الناتج.

4. تحديد متوسط ​​الخطأتقريبية.

5. تقييم الموثوقية الإحصائية للنمذجة باستخدام اختبار فيشر F.

الجدول 3.5. البيانات الأولية.

حصة الدخل النقدي التي تهدف إلى زيادة المدخرات في الودائع والقروض والشهادات وشراء العملات الأجنبية، من إجمالي متوسط ​​نصيب الفرد من الدخل النقدي،٪

متوسط ​​​​الأجور الشهرية المتراكمة، c.u.

كالوزسكايا

كوسترومسكايا

أورلوفسكايا

ريازان

سمولينسكايا

لتحديد المعلمات غير المعروفة b 0 , b 1 لمعادلة الانحدار الخطي المقترنة، نستخدم النظام القياسي للمعادلات العادية، والذي له الشكل

(3.7)

لحل هذا النظام، من الضروري أولاً تحديد قيم Sx 2 وSxy. يتم تحديد هذه القيم من جدول البيانات المصدر، مع استكماله بالأعمدة المناسبة (الجدول 3.6).

الجدول 3.6. نحو حساب معاملات الانحدار.

ثم يأخذ النظام (3.7) النموذج

بالتعبير عن b 0 من المعادلة الأولى واستبدال التعبير الناتج في المعادلة الثانية نحصل على:

وبإجراء عملية الضرب على الحد تلو الآخر وفتح الأقواس نحصل على:

أخيرًا، معادلة الانحدار الخطي المقترنة التي تربط قيمة حصة الدخل النقدي للسكان بهدف زيادة المدخرات y مع متوسط ​​الأجر الشهري المستحق x لها الشكل:

لذلك، عند بناء معادلة الانحدار الخطي المقترن، نحدد معامل الارتباط الخطي حسب الاعتماد:

أين هي قيم الانحرافات المعيارية للمعلمات المقابلة.

لحساب معامل الارتباط الخطي من التبعية (3.9)، نقوم بإجراء حسابات وسيطة.

استبدال قيم المعلمات الموجودة في التعبير (3.9) نحصل عليه

.

تشير القيمة التي تم الحصول عليها لمعامل الارتباط الخطي إلى وجود علاقة إحصائية عكسية ضعيفة بين حصة الدخل النقدي للسكان بهدف زيادة المدخرات y ومبلغ متوسط ​​​​الأجور الشهرية المستحقة x.

ومعامل التحديد هو، مما يعني أن 9.6% فقط يتم تفسيره من خلال انحدار المتغير التوضيحي x على y. وبناء على ذلك، فإن القيمة 1 التي تساوي 90.4% تميز حصة تباين المتغير y الناجم عن تأثير جميع المتغيرات التوضيحية الأخرى التي لم تؤخذ في الاعتبار في النموذج الاقتصادي القياسي.

معامل المرونة هو

وبالتالي، عندما يتغير متوسط ​​الأجر الشهري المستحق بنسبة 1٪، فإن حصة الدخل النقدي للسكان التي تهدف إلى زيادة المدخرات تنخفض أيضًا بنسبة 1٪، ومع زيادة الأجور، هناك انخفاض في حصة الدخل النقدي للسكان السكان تهدف إلى زيادة المدخرات. يتعارض هذا الاستنتاج مع المنطق السليم ولا يمكن تفسيره إلا من خلال عدم صحة النموذج الرياضي الذي تم إنشاؤه.

دعونا نحسب متوسط ​​خطأ التقريب.

الجدول 3.7. نحو حساب متوسط ​​خطأ التقريب.

وتتجاوز القيمة المتحصل عليها (12...15)%، مما يدل على أهمية متوسط ​​انحراف البيانات المحسوبة عن البيانات الفعلية التي بني عليها النموذج الاقتصادي القياسي.

سيتم إجراء موثوقية النمذجة الإحصائية بناءً على اختبار فيشر F. يتم تحديد القيمة النظرية لمعيار فيشر F calc من نسبة قيم العامل والتشتتات المتبقية المحسوبة لدرجة واحدة من الحرية حسب الصيغة

حيث n هو عدد الملاحظات؛

m هو عدد المتغيرات التوضيحية (على سبيل المثال قيد النظر m m =1).

يتم تحديد القيمة الحرجة F Crit من الجداول الإحصائية ولمستوى الأهمية a = 0.05 يساوي 10.13. منذ حساب F

15. بناء نموذج الانحدار المتعدد دون استخدام برنامج EXCEL.

باستخدام المواد الإحصائية الواردة في الجدول 3.8 يجب عليك:

1. بناء معادلة خط مستقيمالانحدار المتعدد، وشرح المعنى الاقتصادي لمعلماته.

2. إعطاء تقييم مقارن لمدى تقارب العلاقة بين العوامل والسمة الناتجة باستخدام معاملات المرونة المتوسطة (العامة).

3. معدل دلالة إحصائيةمعاملات الانحدار باستخدام اختبار t والفرضية الصفرية لعدم أهمية المعادلة باستخدام اختبار F.

4. تقييم جودة المعادلة من خلال تحديد متوسط ​​خطأ التقريب.

الجدول 3.8. البيانات الأولية.

صافي الدخل مليون دولار أمريكي

دوران رأس المال مليون دولار أمريكي

رأس المال المستخدم مليون دولار أمريكي

لتحديد المعلمات غير المعروفة b 0 , b 1 , b 2 لمعادلة الانحدار الخطي المتعدد، نستخدم النظام القياسي للمعادلات العادية، والذي له الشكل

(3.11)

لحل هذا النظام لا بد أولا من تحديد قيم الكميات Sx 1 2, Sx 2 2, Sx 1 y, Sx 2 y, Sx 1 x 2. يتم تحديد هذه القيم من جدول البيانات المصدر، مع استكماله بالأعمدة المناسبة (الجدول 3.9).

الجدول 3.9. نحو حساب معاملات الانحدار.

ثم يأخذ النظام (3.11) النموذج

لحل هذا النظام سنستخدم طريقة غاوس، والتي تتمثل في حذف المجهولات بالتتابع: قسمة المعادلة الأولى للنظام على 10، ثم ضرب المعادلة الناتجة في 370.6 وطرحها من المعادلة الثانية للنظام، ثم ضرب المعادلة المعادلة الناتجة على 158.20 وطرحها من المعادلة الثالثة للنظام. وبتكرار الخوارزمية المحددة للمعادلتين الثانية والثالثة المحولتين للنظام نحصل على:

Þ Þ

Þ .

بعد التحويل لدينا :

ثم يكون الاعتماد النهائي لصافي الدخل على معدل دوران رأس المال ورأس المال المستخدم في شكل معادلة الانحدار الخطي المتعدد بالشكل:

من المعادلة الاقتصادية القياسية الناتجة يمكن ملاحظة أنه مع زيادة رأس المال المستخدم، يزداد صافي الدخل، وعلى العكس من ذلك، مع زيادة معدل دوران رأس المال، ينخفض ​​صافي الدخل. وبالإضافة إلى ذلك، كلما زاد معامل الانحدار، زاد تأثير المتغير التوضيحي على المتغير التابع. في المثال قيد النظر، تكون قيمة معامل الانحدار أكبر من قيمة المعامل، وبالتالي، فإن رأس المال المستخدم له تأثير أكبر بكثير على صافي الدخل من معدل دوران رأس المال. لتحديد هذا الاستنتاج، سوف نحدد معاملات المرونة الجزئية.

ويبين تحليل النتائج أيضا أن رأس المال المستخدم له تأثير أكبر على صافي الدخل. لذلك، على وجه الخصوص، مع زيادة رأس المال المستخدم بنسبة 1٪، يرتفع صافي الدخل بنسبة 1.17٪. وفي الوقت نفسه، مع زيادة معدل دوران رأس المال بنسبة 1٪، ينخفض ​​صافي الدخل بنسبة 0.5٪.

القيمة النظرية لمعيار فيشر F calc.

يتم تحديد قيمة القيمة الحرجة F Crit من الجداول الإحصائية ولمستوى دلالة a = 0.05 يساوي 4.74. نظرًا لأن F calc > F Crit، يتم رفض الفرضية الصفرية ويتم قبول معادلة الانحدار الناتجة باعتبارها ذات دلالة إحصائية.

إن تقييم الدلالة الإحصائية لمعاملات الانحدار ومعيار t يتلخص في مقارنة القيمة العددية لهذه المعاملات مع حجم أخطائها العشوائية ووفقاً للعلاقة:

صيغة العمل لحساب القيمة النظرية لإحصائيات t هي:

, (3.13)

حيث يتم حساب معاملات الارتباط الزوجي ومعامل الارتباط المتعدد من التبعيات:

ثم القيم النظرية (المحسوبة) لإحصائيات t تساوي على التوالي:

بسبب ال قيمة حرجةيتم تحديد إحصائيات t من الجداول الإحصائية لمستوى الدلالة a=0.05 يساوي t crit =2.36 أكبر بالقيمة المطلقة من = - 1.798، وبالتالي لم يتم رفض الفرضية الصفرية والمتغير التوضيحي x 1 غير ذي دلالة إحصائية ويمكن استبعاده من معادلات الانحدار. وعلى العكس من ذلك، بالنسبة لمعامل الانحدار الثاني > t Crit (3.3 > 2.36)، والمتغير التوضيحي x 2 له دلالة إحصائية.

دعونا نحسب متوسط ​​خطأ التقريب.

الجدول 3.10. نحو حساب متوسط ​​خطأ التقريب.

ثم متوسط ​​خطأ التقريب هو

القيمة التي تم الحصول عليها لا تتجاوز الحد المسموح به وهو (12…15)%.

16. تاريخ تطور نظرية القياس

تم تطوير TI لأول مرة كنظرية للقياسات النفسية الفيزيائية. في منشورات ما بعد الحرب، كتب عالم النفس الأمريكي س.س. ركز ستيفنز على مقاييس القياس. في النصف الثاني من القرن العشرين. نطاق تطبيق TI يتوسع بسرعة. أحد مجلدات "موسوعة العلوم النفسية" التي نشرت في الولايات المتحدة في الخمسينيات كان يسمى "القياسات النفسية". قام مؤلفو هذا المنشور بتوسيع نطاق TI من الفيزياء النفسية إلى علم النفس بشكل عام. وفي مقال هذه المجموعة، "أساسيات نظرية القياس"، كان العرض على مستوى رياضي تجريدي، دون الرجوع إلى أي مجال تطبيقي محدد. في ذلك، تم التركيز على "تجانس النظم التجريبية مع العلاقات في العددية" (ليست هناك حاجة للخوض في هذه المصطلحات الرياضية هنا)، وزاد التعقيد الرياضي للعرض التقديمي مقارنة بأعمال S.S. ستيفنز.

في إحدى المقالات المحلية الأولى حول TI (أواخر الستينيات)، ثبت أن النقاط التي يعينها الخبراء عند تقييم كائنات الفحص يتم قياسها، كقاعدة عامة، على مقياس ترتيبي. أدت الأعمال التي ظهرت في أوائل السبعينيات إلى توسع كبير في نطاق استخدام TI. وقد تم تطبيقه على قياس الجودة التربوية (قياس جودة معرفة الطلاب)، وفي أبحاث النظم، وفي مختلف المشاكل النظرية تقييمات الخبراء، لتجميع مؤشرات جودة المنتج، في الدراسات الاجتماعية، الخ.

كمشكلتين رئيسيتين في TI، إلى جانب تحديد نوع المقياس لقياس بيانات محددة، تم طرح بحث عن خوارزميات تحليل البيانات، والتي لا تتغير نتيجتها مع أي تحويل مقبول للمقياس (أي ثابت فيما يتعلق إلى هذا التحول).المقاييس الترتيبية في الجغرافيا هي مقياس بوفورت للرياح ("الهادئة"، "الرياح الخفيفة"، "الرياح المعتدلة"، إلخ)، ومقياس قوة الزلازل. من الواضح أنه لا يمكن القول أن زلزالًا بقوة 2 درجة (مصباح يتمايل تحت السقف) أضعف بخمس مرات بالضبط من زلزال بقوة 10 درجات (تدمير كامل لكل شيء على سطح الأرض).

في الطب، المقاييس الترتيبية هي مقياس مراحل ارتفاع ضغط الدم (حسب مياسنيكوف)، ومقياس درجات قصور القلب (حسب ستراجيسكو-فاسيلينكو-لانج)، ومقياس شدة قصور الشريان التاجي (حسب فوغلسون)، وما إلى ذلك . تم بناء جميع هذه المقاييس وفقًا للمخطط التالي: لم يتم اكتشاف أي مرض؛ المرحلة الأولى من المرض. المرحلة الثانية؛ المرحلة الثالثة... أحياناً يتم التمييز بين المراحل 1أ و16 وغيرها، ولكل مرحلة خاصية طبية فريدة خاصة بها. عند وصف مجموعات الإعاقة، يتم استخدام الأرقام بالترتيب المعاكس: الأشد هي مجموعة الإعاقة الأولى، ثم الثانية والأخف وزنا هي الثالثة.

يتم أيضًا قياس أرقام المنازل على مقياس ترتيبي - فهي توضح الترتيب الذي تقع به المنازل على طول الشارع. عادةً ما ترتبط أرقام المجلدات في الأعمال المجمعة للكاتب أو أرقام الحالات في أرشيف المؤسسة بالترتيب الزمني لإنشائها.

عند تقييم جودة المنتجات والخدمات، تحظى المقاييس الترتيبية بشعبية فيما يسمى قياس الجودة (الترجمة الحرفية – قياس الجودة). أي أنه يتم تقييم وحدة الإنتاج على أنها مقبولة أو غير صالحة. لإجراء تحليل أكثر شمولاً، يتم استخدام مقياس بثلاثة تدرجات: هناك عيوب كبيرة - توجد عيوب بسيطة فقط - لا توجد عيوب. في بعض الأحيان يتم استخدام أربعة تدرجات: هناك عيوب حرجة (مما يجعل من المستحيل استخدامها) - هناك عيوب كبيرة - توجد عيوب بسيطة فقط - لا توجد عيوب. تصنيف المنتجات له معنى مماثل - ممتاز، درجة أولى، درجة ثانية،...

عند تقييم التأثيرات البيئية، عادة ما يكون التقييم الأول والأكثر عمومية ترتيبيًا، على سبيل المثال: البيئة الطبيعية مستقرة - البيئة الطبيعية مضطهدة (متدهورة). المقياس البيئي الطبي مشابه: لا يوجد تأثير واضح على صحة الإنسان - ويلاحظ تأثير سلبي على الصحة.

يتم استخدام المقياس الترتيبي في مجالات أخرى أيضًا. في الاقتصاد القياسي، هذه هي في المقام الأول طرق مختلفة لتقييمات الخبراء.

تنقسم جميع مقاييس القياس إلى مجموعتين - مقاييس الخصائص النوعية ومقاييس الخصائص الكمية. يعد المقياس الترتيبي ومقياس التسمية المقاييس الرئيسية للصفات النوعية، لذلك في العديد من المجالات المحددة يمكن اعتبار نتائج التحليل النوعي بمثابة قياسات على هذه المقاييس. مقاييس الخصائص الكمية هي مقاييس الفواصل والنسب والاختلافات والمطلقة. باستخدام مقياس الفترات، يتم قياس حجم الطاقة الكامنة أو إحداثيات نقطة على خط مستقيم. وفي هذه الحالات، لا يمكن تحديد الأصل الطبيعي ولا وحدة القياس الطبيعية على المقياس. ويجب على الباحث أن يحدد نقطة البداية ويختار وحدة القياس بنفسه. التحولات المقبولة في مقياس الفاصل الزمني هي تحويلات خطية متزايدة، أي. وظائف خطية. يرتبط مقياسا درجة الحرارة مئوية وفهرنهايت بهذا الاعتماد بالضبط: درجة مئوية = 5/9 (درجة فهرنهايت - 32)، حيث درجة مئوية هي درجة الحرارة (بالدرجات) على مقياس مئوية، ودرجة فهرنهايت هي درجة الحرارة على مقياس فهرنهايت حجم.

من بين المقاييس الكمية، الأكثر شيوعًا في العلم والممارسة هي المقاييس النسبية. لديهم نقطة مرجعية طبيعية - صفر، أي. غياب الكمية، ولكن لا توجد وحدة قياس طبيعية. يتم قياس معظم الوحدات المادية على مقياس النسبة: كتلة الجسم، الطول، الشحنة، وكذلك الأسعار في الاقتصاد. التحويلات المقبولة في مقياس النسبة متشابهة (تغيير المقياس فقط). بمعنى آخر، تحويلات خطية متزايدة بدون مدة حرة، على سبيل المثال تحويل الأسعار من عملة إلى أخرى بسعر ثابت. لنفترض أننا قارنا الكفاءة الاقتصادية لمشروعين استثماريين باستخدام الأسعار بالروبل. دع المشروع الأول يكون أفضل من الثاني. الآن دعنا ننتقل إلى العملة الصينية - اليوان، باستخدام معدل تحويل ثابت. من الواضح أن المشروع الأول يجب أن يكون مرة أخرى أكثر ربحية من المشروع الثاني. ومع ذلك، لا تضمن خوارزميات الحساب تلقائيًا استيفاء هذا الشرط، ومن الضروري التحقق من استيفاءه. نتائج هذا الاختبار للقيم المتوسطة موضحة أدناه.

يحتوي مقياس الفرق على وحدة قياس طبيعية، ولكن لا توجد نقطة مرجعية طبيعية. يتم قياس الوقت على مقياس الاختلافات، إذا تم أخذ السنة (أو اليوم - من الظهر إلى الظهر) كوحدة قياس طبيعية، وعلى مقياس الفترات في الحالة العامة. على المستوى الحالي للمعرفة، من المستحيل الإشارة إلى نقطة البداية الطبيعية. يحسب مؤلفون مختلفون تاريخ إنشاء العالم بطرق مختلفة، وكذلك لحظة ميلاد المسيح.

بالنسبة للمقياس المطلق فقط، تكون نتائج القياس عبارة عن أرقام بالمعنى المعتاد للكلمة، على سبيل المثال، عدد الأشخاص في الغرفة. بالنسبة للمقياس المطلق، يُسمح فقط بتحويل الهوية.

في عملية تطوير مجال المعرفة المقابل، قد يتغير نوع المقياس. لذلك، في البداية تم قياس درجة الحرارة على مقياس ترتيبي (أبرد - أكثر دفئا). ثم - حسب الفاصل الزمني (مقياس مئوية، فهرنهايت، ريومور). وأخيرا، بعد اكتشاف الصفر المطلق، يمكن اعتبار درجة الحرارة قابلة للقياس على مقياس النسبة (مقياس كلفن). تجدر الإشارة إلى أنه في بعض الأحيان تكون هناك خلافات بين المتخصصين حول المقاييس التي يجب استخدامها لاعتبار قيم حقيقية معينة يتم قياسها. بمعنى آخر، تتضمن عملية القياس أيضًا تحديد نوع المقياس (مع الأساس المنطقي لاختيار نوع معين من المقياس). بالإضافة إلى الأنواع الستة الرئيسية من المقاييس المذكورة، يتم استخدام موازين أخرى في بعض الأحيان.

17. الخوارزميات الثابتة والقيم المتوسطة.

دعونا نقوم بصياغة المتطلب الرئيسي لخوارزميات تحليل البيانات في TI: يجب ألا تتغير الاستنتاجات المستخلصة على أساس البيانات المقاسة على مقياس من نوع معين عندما يكون مقياس قياس هذه البيانات مسموحًا به. بمعنى آخر، يجب أن تكون الاستدلالات ثابتة في ظل تحويلات المقياس الصحيحة.

وبالتالي فإن أحد الأهداف الرئيسية لنظرية القياس هو محاربة ذاتية الباحث عند إسناد قيم عددية لأشياء حقيقية. وبالتالي، يمكن قياس المسافات بالأقواس، والأمتار، والميكرونات، والأميال، والفرسخ الفلكي ووحدات القياس الأخرى. الكتلة (الوزن) - بالبود والكيلوجرام والجنيه وما إلى ذلك. يمكن الإشارة إلى أسعار السلع والخدمات باليوان والروبل والتنغي والهريفنيا ولاتس والكرونات والماركات والدولار الأمريكي والعملات الأخرى (تخضع لأسعار التحويل المحددة). دعونا نؤكد على حقيقة مهمة جدًا، رغم أنها واضحة تمامًا: اختيار وحدات القياس يعتمد على الباحث، أي. شخصي. يمكن أن تكون الاستنتاجات الإحصائية ملائمة للواقع فقط عندما لا تعتمد على وحدة القياس التي يفضلها الباحث، وعندما تكون ثابتة فيما يتعلق بالتحويل المسموح به للمقياس. من بين العديد من الخوارزميات المستخدمة في تحليل البيانات الاقتصادية القياسية، هناك عدد قليل منها فقط يحقق هذا الشرط. دعونا نظهر ذلك من خلال مقارنة القيم المتوسطة.

دع X 1، X 2،..، X n تكون عينة من الحجم n. وكثيرا ما يستخدم الوسط الحسابي. إن استخدام المتوسط ​​الحسابي شائع جدًا لدرجة أنه غالبًا ما يتم حذف الكلمة الثانية في المصطلح ويتحدث الناس عن متوسط ​​الراتب ومتوسط ​​الدخل ومتوسطات أخرى لبيانات اقتصادية محددة، ويقصدون بـ "المتوسط" المتوسط ​​الحسابي. هذا التقليد يمكن أن يؤدي إلى استنتاجات خاطئة. لنعرض ذلك باستخدام مثال حساب متوسط ​​الراتب (متوسط ​​الدخل) لموظفي مؤسسة افتراضية. ومن بين 100 عامل، هناك 5 فقط لديهم راتب يتجاوز ذلك، وراتب الـ95 الباقين أقل بكثير من المتوسط ​​الحسابي. والسبب واضح - راتب شخص واحد - المدير العام - يفوق راتب 95 عاملاً - من العمال ذوي المهارات المنخفضة والعالية والمهندسين وموظفي المكاتب. ويذكرنا الوضع بما ورد في قصة معروفة عن مستشفى فيه 10 مرضى، 9 منهم درجة حرارتهم 40 درجة مئوية، وواحد يعاني بالفعل، يرقد في المشرحة ودرجة حرارته 0 درجة مئوية. ج. وفي الوقت نفسه، يبلغ متوسط ​​درجة الحرارة في المستشفى 36 درجة مئوية - وهو أمر لا يمكن أن يكون أفضل!

وبالتالي، لا يمكن استخدام المتوسط ​​الحسابي إلا لمجموعات سكانية متجانسة إلى حد ما (بدون قيم متطرفة كبيرة في اتجاه أو آخر). ما هي المتوسطات التي ينبغي استخدامها لوصف الأجور؟ من الطبيعي تمامًا استخدام الوسيط - المتوسط ​​الحسابي للموظفين الخمسين والحادي والخمسين، إذا كان عددهم الرواتبمرتبة في ترتيب غير تنازلي. تأتي أولاً رواتب 40 عاملاً من ذوي المهارات المتدنية، ثم - من العامل الحادي والأربعين إلى العامل السبعين - رواتب العمال ذوي المهارات العالية. وبالتالي، فإن الوسيط يقع عليهم بالضبط ويساوي 200. بالنسبة لـ 50 عاملاً، لا يتجاوز الراتب 200، ولـ 50 - على الأقل 200، لذلك يظهر الوسيط "المركز" الذي حوله الجزء الأكبر من القيم المدروسة​ يتم تجميعها. القيمة المتوسطة الأخرى هي الوضع، وهي القيمة الأكثر تكرارًا. في الحالة قيد النظر، هذه هي أجور العمال ذوي المهارات المنخفضة، أي. 100. وبالتالي، لوصف الراتب لدينا ثلاث قيم متوسطة - الوضع (100 وحدة)، والوسيط (200 وحدة) والوسط الحسابي (400 وحدة).

وبالنسبة لتوزيعات الدخل والأجور التي يتم ملاحظتها في الحياة الواقعية، فإن نفس النمط صحيح: المنوال أقل من الوسيط، والوسيط أقل من المتوسط ​​الحسابي.

لماذا يتم استخدام المتوسطات في الاقتصاد؟ عادةً ما يتم استبدال مجموعة من الأرقام برقم واحد لمقارنة السكان باستخدام المتوسطات. لنفترض، على سبيل المثال، Y 1، Y 2،...، Y n أن تكون مجموعة من تقييمات الخبراء "المعطاة" لموضوع واحد من الخبرة (على سبيل المثال، أحد خيارات التطوير الاستراتيجي لشركة ما)، Z 1 ، Z 2،...، Z n -الثاني (نسخة أخرى من هذا التطوير). كيف يمكن مقارنة هذه المجموعات السكانية؟ من الواضح أن أسهل طريقة هي القيم المتوسطة.

كيفية حساب المتوسطات؟ معروف أنواع مختلفةالقيم المتوسطة: الوسط الحسابي، الوسيط، المنوال، الوسط الهندسي، الوسط التوافقي، الوسط التربيعي. دعونا نذكركم بذلك المفهوم العامتم تقديم القيمة المتوسطة بواسطة عالم رياضيات فرنسي في النصف الأول من القرن التاسع عشر. الأكاديمي O. كوشي. وهي كالتالي: القيمة المتوسطة هي أي دالة Ф(Х 1, Х 2,..., Х n) بحيث تكون للجميع القيم الممكنةالوسيطات، فإن قيمة هذه الدالة لا تقل عن الحد الأدنى للأرقام X 1، X 2،...، X n، ولا تزيد عن الحد الأقصى لهذه الأرقام. جميع أنواع المتوسطات المذكورة أعلاه هي متوسطات كوشي.

ومع تحول مقياس مقبول، تتغير قيمة المتوسط ​​بشكل واضح. لكن الاستنتاجات حول أي مجموعة سكانية يكون المتوسط ​​أكبر وأيها أقل لا ينبغي أن تتغير (وفقًا لمتطلبات ثبات الاستنتاجات، المقبولة كشرط رئيسي في TI). دعونا نقوم بصياغة المشكلة الرياضية المقابلة للبحث عن نوع القيم المتوسطة، والتي تكون نتيجة مقارنتها مستقرة فيما يتعلق بتحويلات المقياس المسموح بها.

دع Ф(Х 1 Х 2 ,..., Х n) يكون متوسط ​​كوشي. دع المتوسط ​​​​للسكان الأول يكون أقل من المتوسط ​​​​للسكان الثاني: إذن، وفقًا لـ TI، من أجل استقرار نتيجة مقارنة المتوسطات، من الضروري لأي تحويل مقبول g من مجموعة التحولات المقبولة في المقياس المقابل صحيح أن متوسط ​​القيم المحولة من المجموعة الأولى أقل أيضًا من متوسط ​​القيم المحولة للمجموعة الثانية. علاوة على ذلك، يجب أن يكون الشرط المصاغ صحيحًا لأي مجموعتين Y 1، Y 2،...،Y n وZ 1، Z 2،...، Z n، وتذكر أي تحويل مقبول. نحن نسمي القيم المتوسطة التي تستوفي الشرط المصاغ مقبولة (في المقياس المناسب). ووفقا لمنظمة الشفافية الدولية، يمكن استخدام هذه المتوسطات فقط عند تحليل آراء الخبراء والبيانات الأخرى المقاسة على المقياس قيد النظر.

باستخدام النظرية الرياضية، الذي تم تطويره في السبعينيات، تمكن من وصف نوع المتوسطات المقبولة على المقاييس الأساسية. من الواضح أنه بالنسبة للبيانات المقاسة على مقياس الأسماء، فإن الوضع الوحيد هو المناسب كمتوسط.

18. القيم المتوسطة على المقياس الترتيبي

دعونا ننظر في معالجة آراء الخبراء المقاسة على مقياس ترتيبي. البيان التالي هو الصحيح.

نظرية1 . من بين جميع متوسطات كوشي، فإن المتوسطات الوحيدة المقبولة في المقياس الترتيبي هي المصطلحات سلسلة الاختلاف(الإحصائيات الترتيبية).

النظرية 1 صالحة بشرط أن يكون المتوسط ​​Ф(Х 1 Х 2 ,..., Х n) دالة مستمرة (على مجموعة المتغيرات) ومتماثلة. ويعني الأخير أنه عند إعادة ترتيب الوسائط، فإن قيمة الدالة Ф(Х 1 Х 2 ,..., Х n) لا تتغير. هذا الشرط طبيعي تمامًا، لأننا نجد القيمة المتوسطة للمجموع (المجموعة)، وليس للتسلسل. لا تتغير المجموعة حسب الترتيب الذي ندرج به عناصرها.

وفقا للنظرية 1، على وجه الخصوص، يمكن استخدام الوسيط كمتوسط ​​للبيانات المقاسة على مقياس ترتيبي (إذا كان حجم العينة فرديا). إذا كان الحجم زوجيًا، فيجب استخدام أحد الحدين المركزيين لسلسلة التباين - كما يطلق عليهم أحيانًا، الوسيط الأيسر أو الوسيط الأيمن. يمكن أيضًا استخدام الموضة - فهي دائمًا عضو في سلسلة الاختلافات. لكن لا يمكنك أبدًا حساب المتوسط ​​الحسابي أو المتوسط ​​الهندسي وما إلى ذلك.

النظرية التالية صحيحة.

النظرية 2. دع Y 1، Y 2،...،Y m تكون متغيرات عشوائية مستقلة وموزعة بشكل متماثل مع دالة التوزيع F(x)، وZ 1، Z 2،...، Zn تكون متغيرات عشوائية مستقلة وموزعة بشكل متماثل مع توزيعات الدالة H(x)، والعينات Y 1، Y 2،...،Y m وZ 1، Z 2،...، Z n مستقلة عن بعضها البعض وMY X > MZ X. لكي يميل احتمال وقوع حدث إلى 1 عند min(m, n) لأي دالة مستمرة متزايدة بشكل صارم g تحقق الشرط |g i |>X من الضروري والكافي أن يتم استيفاء المتباينة F(x) للجميع س< Н(х), причем существовало число х 0 , для которого F(x 0)

ملحوظة.الشرط مع الحد الأعلى هو بحتة داخل الرياضيات في الطبيعة. في الواقع، الدالة g هي تحويل تعسفي مقبول على مقياس ترتيبي.

وفقًا للنظرية 2، يمكن أيضًا استخدام الوسط الحسابي في مقياس ترتيبي إذا تمت مقارنة عينات من توزيعين يحققان عدم المساواة الواردة في النظرية. ببساطة، يجب أن تقع إحدى وظائف التوزيع دائمًا فوق الأخرى. لا يمكن لوظائف التوزيع أن تتقاطع، يُسمح لها فقط بلمس بعضها البعض. يتم استيفاء هذا الشرط، على سبيل المثال، إذا اختلفت وظائف التوزيع في الوردية فقط:

و(س) = ه(س + ∆)

بالنسبة للبعض ∆.

ويتحقق الشرط الأخير إذا تم قياس قيمتين لكمية معينة باستخدام نفس أداة القياس، والتي لا يتغير فيها توزيع الأخطاء عند الانتقال من قياس قيمة واحدة للكمية المعنية إلى قياس أخرى.

المتوسط ​​حسب كولموغوروف

تعميم العديد من المتوسطات المذكورة أعلاه هو متوسط ​​كولموغوروف. بالنسبة للأرقام X 1، X 2،...، X n، يتم حساب متوسط ​​كولموجوروف باستخدام الصيغة

G((F(X l) + F(X 2)+...F(X n))/n)،

حيث F هي دالة رتيبة تمامًا (أي زيادة أو نقصان صارم)،

G هي الدالة العكسية لـ F.

من بين متوسطات Kolmogorov هناك العديد من الشخصيات المعروفة. لذا، إذا كان F(x) = x، فإن متوسط ​​كولموجوروف هو الوسط الحسابي، وإذا كان F(x) = lnx، فإن المتوسط ​​الهندسي، إذا كان F(x) = 1/x، فإن المتوسط ​​التوافقي، إذا كان F( x) = x 2، ثم المربع المتوسط، وما إلى ذلك. يعد متوسط ​​كولموجوروف حالة خاصة من متوسط ​​كوشي. ومن ناحية أخرى، لا يمكن تمثيل المتوسطات الشائعة مثل المتوسط ​​والمنوال على أنها متوسطات كولموجوروف. تم إثبات العبارات التالية في الدراسة.

نظرية3 . إذا كانت بعض شروط الانتظام داخل الرياضيات صالحة في مقياس الفاصل الزمني، فمن بين جميع وسائل كولموغوروف، يكون الوسط الحسابي فقط هو المقبول. وبالتالي، فإن المتوسط ​​الهندسي أو جذر متوسط ​​مربع درجات الحرارة (بالدرجة المئوية) أو المسافات لا معنى له. ويجب استخدام الوسط الحسابي كمتوسط. يمكنك أيضًا استخدام الوسيط أو الوضع.

النظرية 4. إذا كانت بعض شروط الانتظام داخل الرياضيات في مقياس النسب صالحة، فمن بين جميع متوسطات كولموغوروف، يُسمح فقط بمتوسطات القدرة مع F(x) = x c والمتوسط ​​الهندسي.

تعليق. الوسط الهندسي هو الحد الأقصى لوسائل القدرة لـ c > 0.

هل هناك متوسطات كولموجوروف لا يمكن استخدامها في مقياس النسب؟ بالطبع. على سبيل المثال F(x) = e x.

وعلى غرار القيم المتوسطة، يمكن دراسة الخصائص الإحصائية الأخرى - مؤشرات التشتت، والاتصال، والمسافة، وما إلى ذلك. ليس من الصعب أن نبين، على سبيل المثال، أن معامل الارتباط لا يتغير مع أي تحويل مقبول في وعاء الفترات، تماما مثل نسبة التشتيتات، فإن التشتت لا يتغير في مقياس الاختلافات، ومعامل الاختلاف في مقياس النسب ، إلخ.

تُستخدم النتائج المذكورة أعلاه حول القيم المتوسطة على نطاق واسع، ليس فقط في الاقتصاد أو الإدارة أو نظرية تقييمات الخبراء أو علم الاجتماع، ولكن أيضًا في الهندسة، على سبيل المثال، لتحليل طرق تجميع أجهزة الاستشعار في أنظمة التحكم الآلي في العمليات للأفران العالية. تتمتع TI بأهمية عملية كبيرة في مشاكل التقييس وإدارة الجودة، ولا سيما في قياس الجودة، حيث تم الحصول على نتائج نظرية مثيرة للاهتمام. لذلك، على سبيل المثال، أي تغيير في معاملات الوزن للمؤشرات الفردية لجودة المنتج يؤدي إلى تغيير في ترتيب المنتجات وفقا لمؤشر المتوسط ​​​​المرجح (تم إثبات هذه النظرية من قبل البروفيسور V. V. Podinovsky). وبالتالي، فإن المعلومات الموجزة المذكورة أعلاه حول تقنية المعلومات وأساليبها تجمع، إلى حد ما، بين علوم الاقتصاد وعلم الاجتماع والهندسة، وهي أداة مناسبة لحل المشكلات المعقدة التي لم تكن قابلة للتحليل الفعال في السابق، علاوة على ذلك، فالطريق مفتوح لبناء نماذج واقعية وحل مشكلة التنبؤ.

22. الانحدار الخطي المقترن

دعونا ننتقل الآن إلى دراسة أكثر تفصيلاً لأبسط حالة للانحدار الخطي الزوجي. يوصف الانحدار الخطي بأبسط علاقة وظيفية في شكل معادلة خط مستقيم ويتميز بتفسير شفاف لمعلمات النموذج (معاملات المعادلة). يتيح لنا الجانب الأيمن من المعادلة الحصول على القيم النظرية (المحسوبة) للمتغير الناتج (الموضح) بناءً على القيم المعطاة للارتداد (المتغير التوضيحي). وتسمى هذه القيم أحيانًا أيضًا بالقيمة المتوقعة (بنفس المعنى)، أي. تم الحصول عليها من الصيغ النظرية. ومع ذلك، عند طرح فرضية حول طبيعة الاعتماد، فإن معاملات المعادلة لا تزال مجهولة. بشكل عام، يمكن الحصول على قيم تقريبية لهذه المعاملات باستخدام طرق مختلفة.

لكن أهمها وأوسعها انتشارا هي الطريقة المربعات الصغرى(الشركات المتعددة الجنسيات). وهو يعتمد (كما سبق شرحه) على متطلب تقليل مجموع الانحرافات التربيعية للقيم الفعلية للخاصية الناتجة عن القيم المحسوبة (النظرية). بدلًا من القيم النظرية (للحصول عليها)، استبدل الأطراف اليمنى لمعادلة الانحدار بمجموع مربعات الانحرافات، ثم أوجد المشتقات الجزئية لهذه الدالة (مجموع مربعات الانحرافات للقيم الفعلية) للخاصية الناتجة عن تلك النظرية). لا يتم أخذ هذه المشتقات الجزئية فيما يتعلق بالمتغيرين x وy، ولكن فيما يتعلق بالمعلمات a وb. يتم تعيين المشتقات الجزئية على الصفر، وبعد تحويلات بسيطة ولكنها مرهقة، يتم الحصول على نظام من المعادلات العادية لتحديد المعلمات. معامل المتغير x، أي. ب يسمى معامل الانحدار، وهو يوضح متوسط ​​التغير في النتيجة مع تغير العامل بمقدار وحدة واحدة. قد لا يكون للمعلمة تفسير اقتصادي، خاصة إذا كانت إشارة هذا المعامل سالبة.

يستخدم الانحدار الخطي الزوجي لدراسة وظيفة الاستهلاك. يتم استخدام معامل الانحدار في دالة الاستهلاك لحساب المضاعف. دائمًا ما يتم استكمال معادلة الانحدار بمؤشر مدى قرب الاتصال. بالنسبة لأبسط حالة من الانحدار الخطي، فإن هذا المؤشر على قرب الاتصال هو معامل خطيالارتباطات. ولكن بما أن معامل الارتباط الخطي يميز قرب العلاقة بين السمات في شكل خطي، فإن قرب القيمة المطلقة لمعامل الارتباط الخطي من الصفر لا يعمل بعد كمؤشر على عدم وجود اتصال بين السمات.

إنه مع اختيار مختلف لمواصفات النموذج، وبالتالي نوع الاعتماد، قد تكون العلاقة الفعلية قريبة جدًا من الوحدة. ولكن نوعية الاختيار دالة خطيةيتم تحديده باستخدام مربع معامل الارتباط الخطي - معامل التحديد. وهو يميز نسبة تباين السمة الفعالة y الموضحة بالانحدار في التباين الإجمالي للسمة الفعالة. القيمة التي تكمل معامل التحديد إلى 1 تميز حصة التباين الناتجة عن تأثير العوامل الأخرى التي لم تؤخذ في الاعتبار في النموذج (التباين المتبقي).

يتم تمثيل الانحدار المزدوج بمعادلة تربط بين متغيرين y وx بالشكل التالي:

حيث y هو المتغير التابع (السمة الناتجة)، وx هو المتغير المستقل (متغير توضيحي، أو عامل السمة). هناك الانحدار الخطي والانحدار غير الخطي. يوصف الانحدار الخطي بمعادلة بالشكل:

ص = أ+ بx + .

يمكن أن يكون الانحدار غير الخطي بدوره غير خطي فيما يتعلق بالمتغيرات التوضيحية المضمنة في التحليل، ولكنه خطي فيما يتعلق بالمعلمات المقدرة. أو ربما يكون الانحدار غير خطي من حيث المعلمات التي يتم تقديرها. تتضمن أمثلة الانحدار غير الخطي في المتغيرات التوضيحية، ولكنه خطي في المعلمات المقدرة، تبعيات متعددة الحدود بدرجات مختلفة (متعددة الحدود) والقطع الزائد متساوي الأضلاع.

الانحدار غير الخطي للمعلمات المقدرة هو اعتماد على القوة بالنسبة للمعلمة (المعلمة في الأس)، والاعتماد الأسي، حيث تكون المعلمة عند قاعدة الأس، والاعتماد الأسي، عندما يكون الاعتماد الخطي بالكامل بالكامل في الأس. لاحظ أنه في جميع هذه الحالات الثلاث يتم تضمين المكون العشوائي (الباقي العشوائي)  الجانب الأيمنالمعادلات على شكل عامل، وليس على شكل جمع، أي. بشكل مضاعف! يتميز متوسط ​​انحراف القيم المحسوبة للخاصية الناتجة عن القيم الفعلية بمتوسط ​​خطأ التقريب. يتم التعبير عنها كنسبة مئوية ويجب ألا تتجاوز 7-8٪. إن متوسط ​​خطأ التقريب هذا هو ببساطة النسبة المئوية للمتوسط ​​النسبي للاختلافات بين القيم الفعلية والمحسوبة.

إن متوسط ​​معامل المرونة، الذي يعد بمثابة خاصية مهمة للعديد من الظواهر والعمليات الاقتصادية، مهم. يتم حسابه على أنه حاصل ضرب قيمة مشتق علاقة وظيفية معينة ونسبة متوسط ​​قيمة x إلى متوسط ​​قيمة y. يوضح معامل المرونة النسبة المئوية في المتوسط ​​التي ستتغير فيها النتيجة y من متوسط ​​قيمتها عندما يتغير العامل x بنسبة 1% من متوسط ​​قيمته (العامل x).

ترتبط مشاكل تحليل التباين ارتباطًا وثيقًا بالانحدار الزوجي والانحدار المتعدد (عندما يكون هناك العديد من العوامل) والتباين المتبقي. تحليل التباينيفحص تباين المتغير التابع. في هذه الحالة، يتم تقسيم المبلغ الإجمالي للانحرافات التربيعية إلى قسمين. المصطلح الأول هو مجموع الانحرافات التربيعية بسبب الانحدار، أو الموضح (المضروب). المصطلح الثاني هو المجموع المتبقي للانحرافات التربيعية غير المفسرة بواسطة انحدار العوامل.

تتميز حصة التباين المفسرة بالانحدار في التباين الكلي للخاصية الناتجة y بمعامل (مؤشر) التحديد، وهو ليس أكثر من نسبة مجموع الانحرافات المربعة بسبب الانحدار إلى مجموع الانحرافات المربعة (الفصل الأول للمجموع بأكمله).

عندما يتم تحديد معلمات النموذج (معاملات المجهولين) باستخدام طريقة المربعات الصغرى، فإنه في الأساس يتم العثور على بعض المتغيرات العشوائية (في عملية الحصول على التقديرات). من الأهمية بمكان تقدير معامل الانحدار، وهو شكل خاص من أشكال المتغير العشوائي. وتعتمد خصائص هذا المتغير العشوائي على خصائص الحد المتبقي في المعادلة (في النموذج). بالنسبة لنموذج الانحدار الخطي المقترن، اعتبر المتغير التوضيحي x كمتغير خارجي غير عشوائي. هذا يعني فقط أن قيم المتغير x في جميع الملاحظات يمكن اعتبارها محددة سلفا ولا علاقة لها بأي حال من الأحوال بالتبعية قيد الدراسة. وبالتالي فإن القيمة الفعلية للمتغير الموضح تتكون من مكونين: مكون غير عشوائي ومكون عشوائي (الحد المتبقي).

ومن ناحية أخرى، فإن معامل الانحدار المحدد باستخدام طريقة المربعات الصغرى (OLS) يساوي حاصل قسمة تباين المتغيرين x و y على تباين المتغير x. لذلك فهو يحتوي أيضًا على مكون عشوائي. بعد كل شيء، يعتمد التغاير على قيم المتغير y، حيث تعتمد قيم المتغير y على قيم الحد المتبقي العشوائي . علاوة على ذلك، من السهل إظهار أن تباين المتغيرين x و y يساوي حاصل ضرب معامل الانحدار المقدر بيتا () وتباين المتغير x، بالإضافة إلى تباين المتغيرين x و . وبالتالي فإن تقدير معامل الانحدار بيتا يساوي معامل الانحدار المجهول نفسه مضافاً إلى حاصل قسمة تباين المتغيرين x و  على تباين المتغير x. أولئك. يتم تقديم تقدير معامل الانحدار b الذي تم الحصول عليه من أي عينة كمجموع حدين: قيمة ثابتة تساوي القيمة الحقيقية للمعامل  (بيتا)، ومكون عشوائي يعتمد على تباين المتغيرات x و  .

23. شروط جاوس ماركوف الرياضية وتطبيقاتها.

لكي يؤدي تحليل الانحدار المستند إلى OLS العادي إلى أفضل النتائج، يجب أن يفي المصطلح العشوائي بشروط Gauss-Markov الأربعة.

التوقع الرياضي للمصطلح العشوائي يساوي صفر، أي. إنها غير متحيزة. إذا كانت معادلة الانحدار تتضمن حدًا ثابتًا، فمن الطبيعي اعتبار هذا الشرط متحققًا، حيث أن هذا حد ثابت ويجب أن يأخذ في الاعتبار أي اتجاه منهجي في قيم المتغير y، والذي، على العكس من ذلك، يجب أن عدم احتوائها على المتغيرات التفسيرية لمعادلة الانحدار.

تباين المصطلح العشوائي ثابت لجميع الملاحظات.

تباين القيم المتغيرات العشوائية، يجب أن يكون تكوين العينة مساوياً للصفر، أي. لا توجد علاقة منهجية بين قيم المدى العشوائي في أي ملاحظتين محددتين. يجب أن يكون الأعضاء العشوائيون مستقلين عن بعضهم البعض.

يجب أن يكون قانون التوزيع للمصطلح العشوائي مستقلاً عن المتغيرات التوضيحية.

علاوة على ذلك، في العديد من التطبيقات، لا تكون المتغيرات التفسيرية عشوائية، أي. لم يكن لديك عنصر عشوائي. يجب اعتبار قيمة أي متغير مستقل في كل ملاحظة خارجية، ويتم تحديدها بالكامل بواسطة أسباب خارجية لا تؤخذ في الاعتبار في معادلة الانحدار.

جنبًا إلى جنب مع شروط غاوس-ماركوف المحددة، يُفترض أيضًا أن الحد العشوائي له توزيع طبيعي. إنها صالحة في ظل ظروف واسعة جدًا وتعتمد على ما يسمى بنظرية الحد المركزي (CLT). جوهر هذه النظرية هو أنه إذا كان المتغير العشوائي هو النتيجة الإجمالية لتفاعل عدد كبير من المتغيرات العشوائية الأخرى، وليس لأي منها تأثير سائد على سلوك هذه النتيجة الإجمالية، فسيتم وصف المتغير العشوائي الناتج بالتوزيع الطبيعي تقريباً . هذا القرب من التوزيع الطبيعييسمح لك باستخدام التوزيع الطبيعي للحصول على التقديرات وهو بمعنى معينتعميمه هو توزيع الطلاب، والذي يختلف بشكل ملحوظ عن الطبيعي بشكل رئيسي على ما يسمى "الذيول"، أي. لأحجام العينات الصغيرة. ومن المهم أيضًا أنه إذا تم توزيع الحد العشوائي بشكل طبيعي، فسيتم أيضًا توزيع معاملات الانحدار بشكل طبيعي.

يسمح لنا منحنى الانحدار المحدد (معادلة الانحدار) بحل مشكلة ما يسمى بالتنبؤ بالنقطة. في مثل هذه الحسابات، يتم أخذ قيمة معينة لـ x خارج فترة المراقبة المدروسة واستبدالها في الجانب الأيمن من معادلة الانحدار (إجراء الاستقراء). لأن تقديرات معاملات الانحدار معروفة بالفعل، فمن الممكن حساب قيمة المتغير الموضح y الموافق للقيمة المأخوذة لـ x. بطبيعة الحال، وفقا لمعنى التنبؤ (التنبؤ)، يتم إجراء الحسابات إلى الأمام (في منطقة القيم المستقبلية).

ومع ذلك، بما أن المعاملات تم تحديدها بخطأ معين، فهي ليست ذات أهمية تقدير النقطة(التنبؤ بالنقطة) للخاصية الفعالة، ومعرفة الحدود التي تقع ضمنها، مع احتمال معين، قيم الخاصية الفعالة المقابلة للقيمة المأخوذة للعامل x.

للقيام بذلك، يتم حساب الخطأ المعياري (الانحراف المعياري). ويمكن الحصول عليها بروح ما قيل للتو على النحو التالي. يتم استبدال التعبير عن الحد الحر a من التقديرات من خلال القيم المتوسطة في معادلة الانحدار الخطي. ثم يتبين أن الخطأ المعياري يعتمد على خطأ متوسط ​​العامل الفعال y ويضاف إليه خطأ معامل الانحدار b. ببساطة مربع هذا الخطأ المعياري يساوي المبلغالخطأ التربيعي لمتوسط ​​قيمة y وحاصل ضرب الخطأ التربيعي لمعامل الانحدار بالانحراف التربيعي لقيمة العامل x ومتوسطه. علاوة على ذلك، فإن الحد الأول، وفقا لقوانين الإحصاء، يساوي حاصل قسمة تباين عموم السكان على حجم (حجم) العينة.

بدلاً من التباين غير المعروف، يتم استخدام تباين العينة كتقدير. وبناء على ذلك، يتم تعريف خطأ معامل الانحدار على أنه حاصل قسمة تباين العينة على تباين العامل x. يمكنك الحصول على الخطأ المعياري (الانحراف المعياري) والاعتبارات الأخرى الأكثر استقلالية عن نموذج الانحدار الخطي. وللقيام بذلك يتم استخدام مفهوم الخطأ المتوسط ​​والخطأ الحدي والعلاقة بينهما.

ولكن حتى بعد الحصول على الخطأ المعياري، يبقى السؤال حول الحدود التي ستقع ضمنها القيمة المتوقعة. بمعنى آخر، فيما يتعلق بالفاصل الزمني لخطأ القياس، في الافتراض الطبيعي في كثير من الحالات أن منتصف هذا الفاصل الزمني يُعطى بالقيمة المحسوبة (المتوسطة) للعامل الفعال y. هنا تأتي نظرية الحد المركزي للإنقاذ، والتي تشير بدقة إلى احتمال وجود الكمية غير المعروفة ضمن فترة الثقة هذه.

في الأساس، صيغة الخطأ القياسية، بغض النظر عن كيفية وبأي شكل يتم الحصول عليها، تميز الخطأ في موضع خط الانحدار. يصل الخطأ المعياري إلى الحد الأدنى عندما تتطابق قيمة العامل x مع القيمة المتوسطة للعامل.

24. الاختبار الإحصائي للفرضيات وتقييم أهمية الانحدار الخطي باستخدام معيار فيشر.

بعد العثور على معادلة الانحدار الخطي، يتم تقييم أهمية المعادلة ككل ومعلماتها الفردية. يمكن تقييم أهمية معادلة الانحدار ككل باستخدام معايير مختلفة. من الشائع والفعال استخدام اختبار فيشر F. وفي هذه الحالة يتم طرح الفرضية الصفرية بأن معامل الانحدار يساوي الصفر، أي. b=0، وبالتالي فإن العامل x ليس له أي تأثير على النتيجة y. يسبق الحساب الفوري لاختبار F تحليل التباين. يحتل المكان المركزي فيه تحليل المجموع الإجمالي للانحرافات التربيعية للمتغير y من القيمة المتوسطة y إلى جزأين - "موضح" و "غير مفسر":

إن المجموع الإجمالي للانحرافات التربيعية للقيم الفردية للخاصية الناتجة y من القيمة المتوسطة y ناتج عن تأثير العديد من العوامل.

دعونا نقسم مجموعة الأسباب بأكملها بشكل مشروط إلى مجموعتين: العامل المدروس x وعوامل أخرى. إذا لم يؤثر العامل على النتيجة، فإن خط الانحدار على الرسم البياني يكون موازيًا لمحور OX وy=y. ثم يكون التباين الكامل للخاصية الناتجة ناتجًا عن تأثير عوامل أخرى وسيتزامن المجموع الإجمالي للانحرافات المربعة مع المتبقي. إذا لم تؤثر العوامل الأخرى على النتيجة، فإن y ترتبط وظيفيًا بـ x ويكون مجموع المربعات المتبقية صفرًا. في هذه الحالة، مجموع الانحرافات التربيعية التي يفسرها الانحدار يتزامن مع المبلغ الإجماليمربعات. وبما أنه لا تقع جميع نقاط مجال الارتباط على خط الانحدار، فإن تشتتها يحدث دائمًا بسبب تأثير العامل x، أي. انحدار y على x، والناجم عن أسباب أخرى (تباين غير مفسر). تعتمد مدى ملاءمة خط الانحدار للتنبؤ على مقدار التباين الإجمالي في السمة y الذي يتم حسابه من خلال التباين الموضح.

من الواضح أنه إذا كان مجموع الانحرافات المربعة بسبب الانحدار أكبر من مجموع المربعات المتبقية، فإن معادلة الانحدار تكون ذات دلالة إحصائية ويكون للعامل x تأثير كبير على النتيجة. وهذا يعادل أن معامل التحديد سيقترب من الوحدة. ويرتبط أي مجموع من الانحرافات التربيعية بعدد درجات الحرية، أي. عدد حرية الاختلاف المستقل للخاصية. يرتبط عدد درجات الحرية بعدد وحدات السكان أو بعدد الثوابت المحددة منها. فيما يتعلق بالمشكلة قيد الدراسة، يجب أن يوضح عدد درجات الحرية عدد الانحرافات المستقلة المطلوبة من n الممكنة [(y 1 -y), (y 2 -y),...(y n -y)] لتكوين مجموع معين من المربعات. وبالتالي، بالنسبة لمجموع المربعات ∑(y-y sr) 2، (n-1) تكون الانحرافات المستقلة مطلوبة، لأن في مجتمع مكون من وحدات n، بعد حساب المستوى المتوسط، يختلف عدد الانحرافات بحرية (n-1) فقط. عند حساب المجموع الموضح أو العامل للمربعات ∑(y-y avg) 2، يتم استخدام القيم النظرية (المحسوبة) للخاصية الناتجة y*، الموجودة على طول خط الانحدار: y(x)=a+bx.

لنعد الآن إلى توسيع المجموع الإجمالي للانحرافات التربيعية للعامل الفعال عن متوسط ​​هذه القيمة. يحتوي هذا المجموع على جزأين تم تعريفهما بالفعل أعلاه: مجموع الانحرافات المربعة الموضحة بالانحدار ومجموع آخر يسمى المجموع المتبقي للانحرافات المربعة. يرتبط هذا التحليل بتحليل التباين، والذي يجيب بشكل مباشر على السؤال الأساسي: كيفية تقييم أهمية معادلة الانحدار ككل ومعلماتها الفردية؟ كما أنه يحدد إلى حد كبير معنى هذا السؤال. ولتقييم أهمية معادلة الانحدار ككل، يتم استخدام معيار فيشر (اختبار F). وفقا للنهج الذي اقترحه فيشر، تم طرح فرضية العدم: معامل الانحدار يساوي الصفر، أي. القيمة ب=0. وهذا يعني أن العامل X ليس له أي تأثير على النتيجة Y.

دعونا نتذكر أن النقاط التي تم الحصول عليها نتيجة لدراسة إحصائية لا تقع دائمًا على خط الانحدار تمامًا. إنهم متناثرون، وهم بعيدون أكثر أو أقل عن خط الانحدار. ويعود هذا التشتت إلى تأثير عوامل أخرى تختلف عن العامل التفسيري X والتي لا تؤخذ بعين الاعتبار في معادلة الانحدار. عند حساب المجموع الموضح أو العاملي للانحرافات المربعة، يتم استخدام القيم النظرية للخاصية الناتجة الموجودة من خط الانحدار.

بالنسبة لمجموعة معينة من قيم المتغيرات Y وX، فإن القيمة المحسوبة للقيمة المتوسطة Y تكون في الانحدار الخطي دالة لمعلمة واحدة فقط - معامل الانحدار. وفقًا لهذا، فإن مجموع معامل الانحرافات المربعة له عدد من درجات الحرية يساوي 1. وعدد درجات الحرية للمجموع المتبقي من الانحرافات المربعة في الانحدار الخطي هو n-2.

وبالتالي، بتقسيم كل مجموع من الانحرافات المربعة في التوسع الأصلي على عدد درجات الحرية الخاصة به، نحصل على متوسط ​​الانحرافات المربعة (التباين لكل درجة حرية واحدة). بعد ذلك، بقسمة تباين العامل على درجة واحدة من الحرية على التباين المتبقي على درجة واحدة من الحرية، نحصل على معيار لاختبار الفرضية الصفرية، أو ما يسمى بنسبة F، أو المعيار الذي يحمل نفس الاسم. على وجه التحديد، إذا كانت الفرضية الصفرية صحيحة، فإن العامل والتباينات المتبقية متساوية ببساطة مع بعضها البعض.

لرفض الفرضية الصفرية، أي. قبول الفرضية المعاكسة، والتي تعبر عن حقيقة أهمية (وجود) العلاقة محل الدراسة، وليس مجرد صدفة عشوائية لعوامل تحاكي علاقة غير موجودة في الواقع، فلا بد من استخدام جداول القيم الحرجة للعلاقة محل الدراسة. العلاقة المحددة. باستخدام الجداول، يتم تحديد القيمة الحرجة (العتبة) لمعيار فيشر. ويسمى أيضًا نظريًا. ثم يقومون بالتحقق، من خلال مقارنتها بالقيمة التجريبية (الفعلية) المقابلة للمعيار المحسوبة من البيانات الرصدية، مما إذا كانت القيمة الفعلية للنسبة تتجاوز القيمة الحرجة من الجداول.

ويتم ذلك بمزيد من التفصيل مثل هذا. حدد مستوى معينًا من احتمالية وجود فرضية العدم وابحث من الجداول عن القيمة الحرجة للمعيار F، حيث لا يزال من الممكن حدوث تباعد عشوائي للتباينات بمقدار درجة واحدة من الحرية، أي. الحد الأقصى لهذه القيمة. ثم تعتبر القيمة المحسوبة لنسبة F موثوقة (أي تعبر عن الفرق بين التباينات الفعلية والمتبقية) إذا كانت هذه النسبة أكبر من النسبة المجدولة. ومن ثم يتم رفض الفرضية الصفرية (ليس صحيحا أنه لا توجد علامات على وجود اتصال)، وعلى العكس من ذلك، نصل إلى نتيجة مفادها أن هناك اتصال وهو مهم (هو غير عشوائي، مهم).

إذا تبين أن قيمة العلاقة أقل من المجدولة، فإن احتمال الفرضية الصفرية أعلى من المستوى المحدد (الذي تم اختياره في البداية) ولا يمكن رفض الفرضية الصفرية دون وجود خطر ملحوظ الحصول على نتيجة غير صحيحة حول وجود العلاقة. وبناء على ذلك، تعتبر معادلة الانحدار غير ذات أهمية.

ترتبط قيمة المعيار F نفسه بمعامل التحديد. بالإضافة إلى تقييم أهمية معادلة الانحدار ككل، يتم أيضًا تقييم أهمية المعلمات الفردية لمعادلة الانحدار. وفي هذه الحالة يتم تحديد الخطأ المعياري لمعامل الانحدار باستخدام الانحراف المعياري الفعلي التجريبي والتباين التجريبي لكل درجة حرية. يتم بعد ذلك استخدام توزيع الطالب لاختبار أهمية معامل الانحدار لحساب فترات الثقة الخاصة به.

يتم تقييم أهمية معاملات الانحدار والارتباط باستخدام اختبار الطالب من خلال مقارنة قيم هذه الكميات والخطأ المعياري. يتم تحديد حجم خطأ معلمات الانحدار الخطي ومعامل الارتباط بواسطة الصيغ التالية:

حيث S هو جذر متوسط ​​مربع انحراف العينة المتبقية،

r xy – معامل الارتباط.

وبناء على ذلك، فإن قيمة الخطأ المعياري الذي تنبأ به خط الانحدار تعطى بالصيغة:

تشكل النسب المقابلة لقيم معاملات الانحدار والارتباط إلى خطأها المعياري ما يسمى بإحصائيات t، كما أن مقارنة القيمة المجدولة (الحرجة) المقابلة وقيمتها الفعلية تسمح بقبول أو رفض العدم فرضية. ولكن بعد ذلك، لحساب فاصل الثقة، يتم العثور على الحد الأقصى للخطأ لكل مؤشر باعتباره حاصل ضرب القيمة الجدولية لإحصاء t في متوسط ​​الخطأ العشوائي للمؤشر المقابل. في الواقع، لقد كتبنا ذلك بشكل مختلف قليلاً أعلاه. ثم يتم الحصول على حدود فترات الثقة: الحد الأدنى يكون بطرح الخطأ الهامشي المقابل من المعاملات المقابلة (في الواقع المتوسط)، والحد الأعلى يكون عن طريق الجمع (الإضافة).

في الانحدار الخطي ∑(y x -y avg) 2 =b 2 ∑(x-x avg) 2. من السهل التحقق من ذلك بالرجوع إلى صيغة معامل الارتباط الخطي: r 2 xy = b 2 *σ 2 x /σ 2 y

حيث σ 2 y هو التباين الكلي للسمة y؛

σ 2 x - تشتت الخاصية y بسبب العامل x. وبناء على ذلك، فإن مجموع الانحرافات التربيعية بسبب الانحدار الخطي سيكون:

∑(y x -y متوسط) 2 =b 2 ∑(x-x متوسط) 2 .

نظرًا لأنه بالنسبة لحجم معين من الملاحظات في x وy، فإن مجموع عوامل المربعات في الانحدار الخطي يعتمد على ثابت واحد فقط من معامل الانحدار b، فإن مجموع المربعات هذا له درجة واحدة من الحرية. دعونا ننظر في جانب المحتوى للقيمة المحسوبة للسمة y أي. ذ س. يتم تحديد القيمة y x بواسطة معادلة الانحدار الخطي: y x ​​= a + bx.

يمكن تعريف المعلمة a على أنها a=y-bx. باستبدال تعبير المعلمة a في النموذج الخطي، نحصل على: y x ​​​​=y-bx+bx avg =y-b(x-x avg).

بالنسبة لمجموعة معينة من المتغيرات y وx، فإن القيمة المحسوبة لـ y x في الانحدار الخطي هي دالة لمعلمة واحدة فقط - معامل الانحدار. وبناء على ذلك، فإن مجموع عوامل الانحرافات التربيعية له عدد من درجات الحرية يساوي 1.

هناك مساواة بين عدد درجات الحرية للمجموع والعامل والمجاميع المتبقية للمربعات. عدد درجات الحرية لمجموع المربعات المتبقية في الانحدار الخطي هو (n-2). يتم تحديد عدد درجات الحرية للمجموع الإجمالي للمربعات من خلال عدد الآحاد، وبما أننا نستخدم المتوسط ​​المحسوب من بيانات العينة، فإننا نفقد درجة واحدة من الحرية، أي. (ن-1). إذن، لدينا مساويان: بالنسبة للمبالغ وعدد درجات الحرية. وهذا بدوره يعيدنا إلى التباينات القابلة للمقارنة لكل درجة من الحرية، والتي تعطي نسبتها معيار فيشر.

25. تقييم أهمية المعلمات الفردية لمعادلة الانحدار والمعاملات باستخدام اختبار الطالب.

27. الانحدار الخطي وغير الخطي وطرق بحثهما.

لن يكون الانحدار الخطي وطرق بحثه وتقييمه مهمًا جدًا إذا، بالإضافة إلى هذه الحالة المهمة جدًا، ولكنها لا تزال أبسط حالة، لم نحصل بمساعدتهم على أداة لتحليل التبعيات غير الخطية الأكثر تعقيدًا. يمكن تقسيم الانحدارات غير الخطية إلى فئتين مختلفتين بشكل كبير. الأول والأبسط هو فئة التبعيات غير الخطية التي يوجد فيها عدم خطية فيما يتعلق بالمتغيرات التوضيحية، ولكنها تظل خطية في المعلمات المضمنة فيها وتخضع للتقييم. وهذا يشمل كثيرات الحدود درجات مختلفةوالقطع الزائد متساوي الأضلاع.

مثل هذا الانحدار غير الخطي للمتغيرات المضمنة في الشرح عن طريق تحويل (استبدال) المتغيرات يمكن بسهولة اختزاله إلى الانحدار الخطي العادي للمتغيرات الجديدة. ولذلك، يتم تنفيذ تقدير المعلمات في هذه الحالة ببساطة عن طريق المربعات الصغرى، لأن التبعيات خطية في المعلمات. وبالتالي، يلعب الاعتماد غير الخطي دورًا مهمًا في الاقتصاد، والذي وصفه القطع الزائد متساوي الأضلاع:

يتم تقييم معالمها بشكل جيد باستخدام طريقة المربعات الصغرى، وهذا الاعتماد نفسه يميز العلاقة بين التكاليف المحددة للمواد الخام والوقود والمواد وحجم الإنتاج ووقت تداول البضائع وكل هذه العوامل مع حجم التجارة دوران. على سبيل المثال، يصف منحنى فيليبس العلاقة غير الخطية بين معدل البطالة ونسبة نمو الأجور.

يختلف الوضع تمامًا مع الانحدار غير الخطي في المعلمات التي يتم تقديرها، على سبيل المثال، ممثلة بوظيفة قوة، حيث تكون الدرجة نفسها (أسها) معلمة، أو تعتمد على المعلمة. يمكن أن تكون أيضًا دالة أسية، حيث يكون أساس الدرجة عبارة عن معلمة ووظيفة أسية، حيث يحتوي المؤشر مرة أخرى على معلمة أو مجموعة من المعلمات. وتنقسم هذه الفئة بدورها إلى فئتين فرعيتين: إحداهما تشتمل على خط غير خطي خارجيًا، ولكنها في الأساس خطية داخليًا. في هذه الحالة، يمكنك تحويل النموذج إلى شكل خطي باستخدام التحويلات. ومع ذلك، إذا كان النموذج غير خطي داخليًا، فلا يمكن اختزاله إلى دالة خطية.

وبالتالي، فإن النماذج التي تعتبر غير خطية بشكل جوهري في تحليل الانحدار هي فقط التي تعتبر غير خطية حقًا. جميع العناصر الأخرى، التي يمكن اختزالها إلى خطية من خلال التحويلات، لا تعتبر كذلك، وهي التي يتم أخذها في الاعتبار في أغلب الأحيان في دراسات الاقتصاد القياسي. وفي الوقت نفسه، هذا لا يعني أنه من المستحيل دراسة التبعيات غير الخطية بشكل أساسي في الاقتصاد القياسي. إذا كان النموذج غير خطي داخليا في معلماته، يتم استخدام الإجراءات التكرارية لتقدير المعلمات، والتي يعتمد نجاحها على نوع المعادلة لميزات الطريقة التكرارية المستخدمة.

دعنا نعود إلى التبعيات المخفضة إلى الخطية. إذا كانت غير خطية سواء في المعلمات أو في المتغيرات، على سبيل المثال، من النموذج y = a مضروبًا في قوة X، وأسها هو المعلمة -  (بيتا):

من الواضح أن مثل هذه العلاقة يمكن تحويلها بسهولة إلى معادلة خطية باستخدام اللوغاريتم البسيط.

وبعد إدخال متغيرات جديدة تدل على اللوغاريتمات، يتم الحصول على معادلة خطية. يتكون إجراء تقدير الانحدار من حساب متغيرات جديدة لكل ملاحظة عن طريق أخذ لوغاريتمات القيم الأصلية. ثم يتم تقدير اعتماد الانحدار للمتغيرات الجديدة. للانتقال إلى المتغيرات الأصلية، يجب أن تأخذ اللوغاريتم المضاد، أي العودة فعليًا إلى القوى نفسها بدلاً من أسسها (بعد كل شيء، اللوغاريتم هو الأس). يمكن النظر في حالة الدوال الأسية أو الأسية بالمثل.

بالنسبة للانحدار غير الخطي بشكل ملحوظ، ليس من الممكن تطبيق إجراء تقدير الانحدار المعتاد لأنه لا يمكن تحويل العلاقة المقابلة إلى علاقة خطية. المخطط العام للإجراءات هو كما يلي:

1. يتم قبول بعض قيم المعلمات الأولية المعقولة؛

2. يتم حساب قيم Y المتوقعة من قيم X الفعلية باستخدام قيم المعلمات هذه؛

3. يتم حساب البقايا لجميع الملاحظات في العينة ومن ثم مجموع مربعات البقايا.

4. يتم إجراء تغييرات صغيرة على واحد أو أكثر من تقديرات المعلمة؛

5. يتم حساب القيم المتوقعة الجديدة لـ Y والبقايا ومجموع مربعات البقايا؛

6. إذا كان مجموع مربعات البقايا أقل من السابق، فإن تقديرات المعلمات الجديدة أفضل من التقديرات السابقة ويجب استخدامها كنقطة بداية جديدة؛

7. يتم تكرار الخطوات 4 و 5 و 6 مرة أخرى حتى يصبح من المستحيل إجراء مثل هذه التغييرات على تقديرات المعلمات التي من شأنها أن تؤدي إلى تغيير في مجموع المربعات المتبقية؛

8. نستنتج أن مجموع المربعات المتبقية قد تم تقليله وأن تقديرات المعلمات النهائية هي تقديرات المربعات الصغرى.

ومن بين الوظائف غير الخطية التي يمكن اختزالها إلى شكل خطي، يتم استخدام وظيفة الطاقة على نطاق واسع في الاقتصاد القياسي. المعلمة ب لها تفسير واضح، كونها معامل مرونة. في النماذج غير الخطية في المعلمات المقدرة، ولكن يمكن اختزالها إلى شكل خطي، يتم تطبيق طريقة المربعات الصغرى على المعادلات المحولة. يكون الاستخدام العملي للوغاريتمات، وبالتالي الأسس، ممكنًا عندما لا تحتوي الإشارة الناتجة على قيم سالبة. عند دراسة العلاقات بين الوظائف باستخدام لوغاريتم السمة الناتجة، تهيمن تبعيات قانون القوة في الاقتصاد القياسي (منحنيات الطلب والعرض، وظائف الإنتاج، منحنيات الامتصاص لتوصيف العلاقة بين كثافة اليد العاملة للمنتجات، وحجم الإنتاج، والاعتماد الدخل القومي الإجمالي على مستوى العمالة، منحنيات إنجل).

28. النموذج العكسي واستخداماته

في بعض الأحيان يتم استخدام ما يسمى بالنموذج العكسي، وهو غير خطي داخليًا، ولكن فيه، على عكس القطع الزائد متساوي الأضلاع، لا يخضع المتغير التوضيحي للتحويل، ولكن السمة الناتجة Y. لذلك، يتحول النموذج العكسي إلى تكون غير خطية داخليًا ولا يتم استيفاء متطلبات OLS للقيم الفعلية للسمة الناتجة Y، ولقيمها العكسية. دراسة الارتباط للانحدار غير الخطي تستحق اهتماما خاصا. في الحالة العامة، القطع المكافئ من الدرجة الثانية، مثل كثيرات الحدود ذات الترتيب الأعلى، عندما تكون خطية، تأخذ شكل معادلة انحدار متعددة. إذا كانت معادلة الانحدار غير الخطية بالنسبة للمتغير الموضح، عندما تكون خطية، تأخذ شكل معادلة انحدار مقترنة خطية، فيمكن استخدام معامل الارتباط الخطي لتقييم مدى قرب العلاقة.

إذا كانت تحويلات معادلة الانحدار إلى الشكل الخطي مرتبطة بالمتغير التابع (الخاصية النتيجةية)، فإن معامل الارتباط الخطي المبني على القيم المحولة للخصائص يعطي فقط تقديرًا تقريبيًا للعلاقة ولا يتطابق عدديًا مع مؤشر الارتباط. يجب أن يؤخذ في الاعتبار أنه عند حساب مؤشر الارتباط، يتم استخدام مجموع الانحرافات التربيعية للخاصية الناتجة Y، وليس اللوغاريتمات الخاصة بها. يتم إجراء تقييم أهمية مؤشر الارتباط بنفس طريقة تقييم موثوقية (أهمية) معامل الارتباط. يتم استخدام مؤشر الارتباط نفسه، مثل مؤشر التحديد، لاختبار الأهمية الإجمالية لمعادلة الانحدار غير الخطية باستخدام اختبار فيشر F.

لاحظ أن إمكانية بناء نماذج غير خطية، سواء عن طريق اختزالها إلى شكل خطي أو باستخدام الانحدار غير الخطي، من ناحية، تزيد من عالمية تحليل الانحدار. ومن ناحية أخرى، فإنه يعقد مهام الباحث بشكل كبير. إذا اقتصرنا على تحليل الانحدار المقترن، فيمكننا رسم الملاحظات Y وX كمخطط مبعثر. غالبًا ما تقوم العديد من الدوال غير الخطية المختلفة بتقريب الملاحظات إذا كانت تقع على منحنى ما. ولكن في حالة تحليل الانحدار المتعدد، لا يمكن إنشاء مثل هذا الرسم البياني.

عند النظر في نماذج بديلة بنفس تعريف المتغير التابع، فإن إجراء الاختيار بسيط نسبيا. يمكن للمرء تقدير الانحدار بناءً على جميع الوظائف المعقولة التي يمكن تخيلها واختيار الوظيفة التي تفسر التغيير في المتغير التابع. من الواضح أنه عندما تفسر الدالة الخطية ما يقرب من 64% من التباين في y، والدالة الزائدية تفسر 99.9%، فمن الواضح أنه يجب اختيار الأخير. لكن عندما نماذج مختلفةباستخدام أشكال وظيفية مختلفة، تصبح مشكلة اختيار النموذج أكثر تعقيدًا بشكل ملحوظ.

29. استخدام اختبار بوكس ​​كوكس.

وبشكل أعم، عند النظر في نماذج بديلة بنفس تعريف المتغير التابع، يكون الاختيار بسيطا. من المعقول جدًا تقدير الانحدار بناءً على جميع الوظائف المعقولة، مع التركيز على الوظيفة التي تفسر التغيير في المتغير التابع. إذا كان معامل التحديد يقيس، في حالة واحدة، نسبة التباين المفسرة بالانحدار، وفي الحالة الأخرى، نسبة التباين في لوغاريتم هذا المتغير التابع المفسرة بالانحدار، يتم الاختيار دون صعوبة. إنها مسألة أخرى عندما تكون هذه القيم لنموذجين متقاربة جدًا وتصبح مشكلة الاختيار أكثر تعقيدًا بشكل ملحوظ.

وينبغي بعد ذلك تطبيق الإجراء القياسي في شكل اختبار Box-Cox. إذا كنت بحاجة فقط إلى مقارنة النماذج باستخدام العامل الفعال ولوغاريتمه في شكل متغير للمتغير التابع، فسيتم استخدام نسخة من اختبار Zarembka. ويقترح تحويل مقياس المراقبة Y، والذي يسمح بإجراء مقارنة مباشرة لجذر متوسط ​​مربع الخطأ (MSE) في النماذج الخطية واللوغاريتمية. يتضمن الإجراء المقابل الخطوات التالية:

    يتم حساب الوسط الهندسي لقيم Y في العينة، والذي يتطابق مع أس الوسط الحسابي للوغاريتم Y؛

    يتم إعادة حساب الملاحظات Y بحيث يتم تقسيمها على القيمة التي تم الحصول عليها في الخطوة الأولى؛

    يتم تقدير الانحدار لنموذج خطي باستخدام قيم Y المقاسة بدلاً من قيم Y الأصلية، ولنموذج لوغاريتمي باستخدام لوغاريتم قيم Y المقاسة. أصبحت قيم RMSE للانحدارين قابلة للمقارنة وبالتالي النموذج الذي يحتوي على مجموع أصغر من الانحرافات المربعة يوفر ملاءمة أفضل للعلاقة الحقيقية للقيم المرصودة؛

    للتحقق من أن أحد النماذج لا يوفر توافقًا أفضل بكثير، يمكن استخدام حاصل ضرب نصف عدد الملاحظات مضروبًا في لوغاريتم نسبة قيم RMSE في الانحدارات المعاد حسابها ثم أخذ قيمه مطلقههذه القيمة.

30. مفاهيم الترابط والتعددية الخطية للعوامل.

34. أساسيات الشركات المتعددة الجنسيات وصلاحية تطبيقها.

دعونا ننتقل الآن إلى أساسيات OLS، وصحة تطبيقه (بما في ذلك مشاكل الانحدار المتعددة) وأهم خصائص التقديرات التي تم الحصول عليها باستخدام OLS. لنبدأ بحقيقة أنه إلى جانب الاعتماد التحليلي على الجانب الأيمن من معادلة الانحدار، يلعب المصطلح العشوائي أيضًا دورًا مهمًا. هذا المكون العشوائي هو كمية غير قابلة للملاحظة. سامي الاختبارات الإحصائيةتعتمد معلمات الانحدار ومقاييس الارتباط على افتراضات غير قابلة للاختبار حول توزيع هذا المكون العشوائي للانحدار المتعدد. هذه الافتراضات أولية فقط. فقط بعد بناء معادلة الانحدار يتم التحقق مما إذا كانت تقديرات المخلفات العشوائية (نظائرها التجريبية للمكون العشوائي) لها خصائص مفترضة مسبقًا. بشكل أساسي، عند تقدير معلمات النموذج، يتم حساب الاختلافات بين القيم النظرية والفعلية للسمة الناتجة من أجل تقدير المكون العشوائي نفسه. من المهم أن تضع في اعتبارك أن هذا مجرد نموذج لتطبيق الباقي غير المعروف من معادلة معينة.

معاملات الانحدار التي تم الحصول عليها من نظام المعادلات العادية هي تقديرات عينة لقوة العلاقة. ومن الواضح أن لها أهمية عملية فقط عندما تكون غير متحيزة. دعونا نتذكر أنه في هذه الحالة يكون متوسط ​​القيم المتبقية يساوي صفرًا، أو، وهو نفس الشيء، متوسط ​​التقدير يساوي المعلمة المقدرة نفسها. ثم لن تتراكم البقايا على عدد كبير من تقديرات العينة، ويمكن اعتبار معلمة الانحدار الموجودة نفسها متوسطًا لعدد كبير من التقديرات غير المتحيزة.

بالإضافة إلى ذلك، يجب أن تحتوي التقديرات على أصغر التباين، أي. تكون فعالة ومن ثم يصبح من الممكن الانتقال من تقديرات النقاط غير القابلة للاستخدام عمليًا إلى تقدير الفترات. وأخيرًا، تكون فترات الثقة مفيدة عندما يكون احتمال الحصول على تقدير على مسافة معينة من القيمة الحقيقية (غير المعروفة) للمعلمة قريبًا من الواحد. تسمى هذه التقديرات متسقة وتتميز خاصية الاتساق بزيادة دقتها مع زيادة حجم العينة.

ومع ذلك، لا يتم استيفاء شرط الاتساق تلقائيًا ويعتمد بشكل كبير على استيفاء المتطلبين المهمين التاليين. أولا، يجب أن تكون البقايا نفسها عشوائية مع العشوائية الأكثر وضوحا، أي. يجب تضمين جميع التبعيات الوظيفية بشكل واضح على وجه التحديد في المكون التحليلي للانحدار المتعدد، وبالإضافة إلى ذلك، يجب توزيع قيم البقايا بشكل مستقل عن بعضها البعض لعينات مختلفة (لا يوجد ارتباط تلقائي للبقايا). الشرط الثاني الذي لا يقل أهمية هو أن يكون تباين كل انحراف (المتبقي) متطابقًا لجميع قيم متغيرات X (التماثلية). أولئك. يتم التعبير عن التجانس من خلال ثبات التباين لجميع الملاحظات:

على العكس من ذلك، فإن التغاير هو انتهاك لثبات التباين لملاحظات مختلفة. وفي هذه الحالة فإن الاحتمال القبلي (قبل الملاحظات) للحصول على قيم شديدة الانحراف مع توزيعات نظرية مختلفة للمصطلح العشوائي لملاحظات مختلفة في العينة سيكون مرتفعاً نسبياً.

يتم تحديد الارتباط الذاتي للبقايا، أو وجود ارتباط بين بقايا الملاحظات الحالية والسابقة (اللاحقة)، من خلال قيمة معامل الارتباط الخطي المعتاد. وإذا كانت تختلف بشكل كبير عن الصفر، فإن البقايا تكون مرتبطة ذاتيًا، وبالتالي تعتمد دالة كثافة الاحتمال (توزيع البقايا) على نقطة المراقبة وعلى توزيع القيم المتبقية عند نقاط مراقبة أخرى. من الملائم تحديد الارتباط الذاتي للبقايا باستخدام المعلومات الإحصائية المتاحة إذا كان هناك ترتيب للملاحظات حسب العامل X. ويضمن غياب الارتباط الذاتي للبقايا اتساق وفعالية تقديرات معاملات الانحدار.

35. التجانس والتغاير، الارتباط الذاتي للبقايا، المربعات الصغرى المعممة (GLM).

إن تشابه تباينات القيم المتبقية لجميع قيم المتغيرات X، أو التجانس، ضروري أيضًا للحصول على تقديرات متسقة لمعلمات الانحدار باستخدام OLS. يؤدي الفشل في استيفاء شرط المثلية إلى ما يسمى بالتغايرية. ويمكن أن يؤدي إلى تقديرات متحيزة لمعاملات الانحدار. سوف تؤثر التغايرية بشكل رئيسي على انخفاض كفاءة تقديرات معامل الانحدار. في هذه الحالة، يصبح من الصعب بشكل خاص استخدام صيغة الخطأ المعياري لمعامل الانحدار، والتي يفترض استخدامها تشتتًا منتظمًا للبقايا لأي قيم للعامل. أما بالنسبة لعدم تحيز تقديرات معاملات الانحدار، فيعتمد بالدرجة الأولى على استقلالية البقايا وقيم العوامل نفسها.

تتمثل إحدى الطرق الواضحة إلى حد ما، وإن كانت غير صارمة وتتطلب مهارة لاختبار التماثل، في دراسة طبيعة اعتماد البقايا بيانيًا على متوسط ​​السمة الناتجة المحسوبة (النظرية)، أو مجالات الارتباط المقابلة. تعتبر الطرق التحليلية لدراسة وتقييم التغايرية أكثر صرامة. إذا كان هناك وجود كبير للتغايرية، فمن المستحسن استخدام OLS المعمم (GLM) بدلاً من OLS.

بالإضافة إلى متطلبات الانحدار المتعدد الناشئة عن استخدام OLS، من الضروري أيضًا الالتزام بالشروط الخاصة بالمتغيرات المدرجة في النموذج. وتشمل هذه، أولاً وقبل كل شيء، المتطلبات المتعلقة بعدد عوامل النموذج لحجم معين من الملاحظات (من 1 إلى 7). وبخلاف ذلك، ستكون معلمات الانحدار ذات أهمية إحصائية. من وجهة نظر فعالية تطبيق الأساليب العددية المقابلة عند تنفيذ LSM، من الضروري أن يتجاوز عدد الملاحظات عدد المعلمات المقدرة (في نظام المعادلات، يكون عدد المعادلات أكبر من عدد المطلوب المتغيرات).

إن الإنجاز الأكثر أهمية للاقتصاد القياسي هو التطوير الكبير لطرق تقدير المعلمات غير المعروفة وتحسين معايير تحديد الأهمية الثابتة للتأثيرات قيد النظر. في هذا الصدد، أدت استحالة أو عدم جدوى استخدام خدمات الحياة البرية التقليدية بسبب عدم التجانس الذي تجلى بدرجات متفاوتة إلى تطوير خدمات الحياة المفتوحة المعممة (GLM). في الواقع، يتضمن ذلك تعديل النموذج وتغيير مواصفاته وتحويل البيانات الأصلية لضمان تقديرات غير متحيزة وفعالة ومتسقة لمعاملات الانحدار.

ويفترض أن متوسط ​​البقايا هو صفر، ولكن تشتتها لم يعد ثابتا، بل يتناسب مع قيم K i، حيث تكون هذه القيم عبارة عن معاملات تناسب تختلف باختلاف قيم س عامل. وبالتالي، فإن هذه المعاملات (قيم K i) هي التي تميز عدم تجانس التشتت. وبطبيعة الحال، يعتقد أن مقدار التشتت نفسه، وهو عامل مشترك لمعاملات التناسب هذه، غير معروف.

النموذج الأصلي، بعد إدخال هذه المعاملات في معادلة الانحدار المتعدد، يستمر في البقاء غير متجانس (بتعبير أدق، هذه هي القيم المتبقية للنموذج). دع هذه المخلفات (المخلفات) لا تكون مرتبطة تلقائيًا. دعونا نقدم متغيرات جديدة تم الحصول عليها عن طريق قسمة متغيرات النموذج الأولية المسجلة نتيجة الملاحظة i على الجذر التربيعي لمعاملات التناسب K i . ومن ثم نحصل على معادلة جديدة في المتغيرات المحولة، حيث تكون البقايا متجانسة. المتغيرات الجديدة نفسها هي المتغيرات القديمة (الأصلية) المرجحة.

لذلك، سيتم تخفيض تقدير معلمات المعادلة الجديدة التي تم الحصول عليها بهذه الطريقة مع المخلفات المتجانسة إلى طريقة المربعات الصغرى الموزونة (في جوهرها، هذه هي طريقة OLS). عند استخدامها بدلاً من متغيرات الانحدار نفسها، فإن انحرافاتها عن المتوسطات، تأخذ تعبيرات معاملات الانحدار شكلاً بسيطًا وموحدًا (موحدًا)، يختلف قليلاً عن OLS وOLS بواسطة عامل التصحيح 1/K في البسط والمقام من الكسر الذي يعطي معامل الانحدار.

يجب أن يؤخذ في الاعتبار أن معلمات النموذج المحول (المعدل) تعتمد بشكل كبير على المفهوم المستخدم كأساس لمعاملات التناسب K i. غالبًا ما يُفترض أن البقايا تتناسب ببساطة مع قيم العوامل. ويأخذ النموذج أبسط صوره عندما يتم قبول فرضية أن الأخطاء تتناسب مع قيم العامل الأخير في الترتيب. ثم يتيح OLS زيادة وزن الملاحظات بقيم أصغر للمتغيرات المحولة عند تحديد معلمات الانحدار مقارنة بتشغيل OLS القياسي مع متغيرات المصدر الأصلية. لكن هذه المتغيرات الجديدة تحظى بالفعل بمحتوى اقتصادي مختلف.

قد يكون للفرضية المتعلقة بتناسب البقايا مع حجم العامل أساس حقيقي. دع مجموعة معينة من البيانات غير المتجانسة تتم معالجتها، على سبيل المثال، بما في ذلك المؤسسات الكبيرة والصغيرة في نفس الوقت. ثم يمكن أن تتوافق القيم الحجمية الكبيرة للعامل مع كل من التشتت الكبير للخاصية الناتجة والتشتت الكبير للقيم المتبقية. علاوة على ذلك، فإن استخدام OLS والانتقال المقابل إلى القيم النسبية لا يقلل من تباين العامل فحسب، بل يقلل أيضًا من تباين الخطأ. وبالتالي، فإن أبسط حالة لمراعاة وتصحيح عدم التجانس في نماذج الانحدار تتحقق من خلال استخدام OLS.

يعتبر النهج المذكور أعلاه لتنفيذ عملية شريان الحياة في شكل عملية شريان الحياة المرجحة أمرًا عمليًا تمامًا - فهو يتم تنفيذه ببساطة وله تفسير اقتصادي شفاف. بالطبع، ليس هذا هو النهج الأكثر عمومية، وفي سياق الإحصاء الرياضي، الذي يعمل بمثابة الأساس النظري للاقتصاد القياسي، يُعرض علينا أسلوب أكثر صرامة يطبق OLS في حد ذاته. منظر عام. في ذلك، تحتاج إلى معرفة مصفوفة التغاير لمتجه الخطأ (العمود المتبقي). وهذا عادة ما يكون غير عادل في المواقف العملية، وقد يكون من المستحيل العثور على هذه المصفوفة في حد ذاتها. لذلك، بشكل عام، من الضروري تقدير المصفوفة المطلوبة بطريقة أو بأخرى من أجل استخدام مثل هذا التقدير في الصيغ المقابلة بدلاً من المصفوفة نفسها. وبالتالي، فإن النسخة الموصوفة لتنفيذ OMNC تمثل أحد هذه التقديرات. ويطلق عليها أحيانًا اسم المربعات الصغرى المعممة التي يمكن الوصول إليها.

وينبغي أيضًا أن يؤخذ في الاعتبار أن معامل التحديد لا يمكن أن يكون بمثابة مقياس مرضٍ لجودة الملاءمة عند استخدام OLS. وبالعودة إلى استخدام OLS، نلاحظ أيضًا أن طريقة استخدام الانحرافات المعيارية (الأخطاء المعيارية) بالشكل الأبيض (ما يسمى بالأخطاء المعيارية المتسقة في وجود التغايرية) تتمتع بعمومية كافية. تنطبق هذه الطريقة بشرط أن تكون مصفوفة التغاير لمتجه الخطأ قطريًا. إذا كان هناك ارتباط ذاتي للبواقي (الأخطاء)، وعندما تكون هناك عناصر غير صفرية (معاملات) في مصفوفة التغاير وخارج القطر الرئيسي، فيجب استخدام طريقة خطأ قياسية أكثر عمومية في نموذج Neve West. هناك قيود كبيرة: العناصر غير الصفرية، بالإضافة إلى القطر الرئيسي، توجد فقط في الأقطار المجاورة، متباعدة عن القطر الرئيسي بما لا يزيد عن كمية معينة.

يتضح مما سبق أنه من الضروري أن تكون قادرًا على التحقق من البيانات للتأكد من عدم تجانسها. الاختبارات أدناه تخدم هذا الغرض. وقاموا باختبار الفرضية الرئيسية حول مساواة تباينات البقايا مع الفرضية البديلة (حول عدم تكافؤ هذه الفرضيات). بالإضافة إلى ذلك، هناك قيود هيكلية مسبقة على طبيعة التغايرية. يستخدم اختبار Goldfeld-Quandt عادة الافتراض بأن تباين الخطأ (المتبقي) يعتمد بشكل مباشر على قيمة بعض المتغيرات المستقلة. مخطط استخدام هذا الاختبار هو كما يلي. أولاً، يتم ترتيب البيانات بترتيب تنازلي للمتغير المستقل الذي يشتبه في تغايره. تقوم مجموعة البيانات المرتبة هذه بعد ذلك بحذف متوسط ​​الملاحظات القليلة، حيث تعني كلمة "قليل" حوالي ربع (25%) من الرقم الإجماليجميع الملاحظات. بعد ذلك، يتم تشغيل اثنين من الانحدارات المستقلة على أول متوسط ​​الملاحظات المتبقية (بعد الحذف) وآخر اثنين من متوسط ​​الملاحظات المتبقية. بعد ذلك، يتم إنشاء اثنين من البقايا المقابلة. أخيرًا، تم تجميع إحصائية Fisher F وإذا كانت الفرضية قيد الدراسة صحيحة، فإن F هو بالفعل توزيع فيشر مع درجات الحرية المناسبة. ومن ثم فإن القيمة الكبيرة لهذه الإحصائية تعني أنه يجب رفض الفرضية التي يتم اختبارها. بدون خطوة الإزالة، يتم تقليل قوة هذا الاختبار.

يتم استخدام اختبار Breusch-Pagan في الحالات التي يفترض فيها مسبقًا أن التباينات تعتمد على بعض المتغيرات الإضافية. أولاً، يتم تنفيذ الانحدار العادي (القياسي) ويتم الحصول على ناقل للبقايا. ثم يتم بناء تقدير التباين. بعد ذلك، يتم إجراء انحدار للمتجه التربيعي للبقايا مقسومًا على التباين التجريبي (تقدير التباين). وله (الانحدار) وجد الجزء المفسر من التباين. ولهذا الجزء الموضح من الاختلاف، مقسم إلى النصف، يتم بناء الإحصائيات. إذا كانت الفرضية الصفرية صحيحة (لا يوجد تغايرية صحيحة)، فإن هذه القيمة لها توزيع هه-مربع. إذا كشف الاختبار، على العكس من ذلك، عن عدم تجانس التغاير، فسيتم تحويل النموذج الأصلي عن طريق قسمة مكونات متجه البقايا على المكونات المقابلة لمتجه المتغيرات المستقلة المرصودة.

36. طريقة الانحراف المعياري بالشكل الأبيض.

الاستنتاجات التالية يمكن استخلاصها. إن استخدام OLS في ظل وجود تباين متباين يؤدي إلى تقليل مجموع الانحرافات المربعة الموزونة. ويرتبط استخدام OLS المتاحة بالحاجة إلى وجود عدد كبير من الملاحظات يتجاوز عدد المعلمات المقدرة. الحالة الأكثر ملاءمة لاستخدام OLS هي الحالة التي يكون فيها الخطأ (البقايا) متناسبًا مع أحد المتغيرات المستقلة وتكون التقديرات الناتجة متسقة. ومع ذلك، إذا كان من الضروري في نموذج متغاير عدم استخدام OLS، بل OLS القياسي، فمن أجل الحصول على تقديرات متسقة، يمكن للمرء استخدام تقديرات الخطأ في النموذج الأبيض أو Nevje-West.

عند تحليل السلاسل الزمنية، غالبًا ما يكون من الضروري مراعاة الاعتماد الإحصائي للملاحظات في نقاط زمنية مختلفة. في هذه الحالة، لا يتم استيفاء افتراض الأخطاء غير المرتبطة. دعونا نفكر نموذج بسيط، حيث تشكل الأخطاء عملية انحدار ذاتي من الدرجة الأولى. في هذه الحالة، تفي الأخطاء بعلاقة تكرارية بسيطة، على الجانب الأيمن منها يكون أحد المصطلحات عبارة عن سلسلة من المتغيرات العشوائية المستقلة الموزعة بشكل طبيعي بمتوسط ​​صفر وتباين ثابت. المصطلح الثاني هو حاصل ضرب المعلمة (معامل الانحدار الذاتي) وقيم البقايا عند النقطة الزمنية السابقة. يشكل تسلسل قيم الخطأ (البقايا) في حد ذاته عملية عشوائية ثابتة. تتميز العملية العشوائية الثابتة بثبات خصائصها مع مرور الوقت، على وجه الخصوص، المتوسط ​​والتباين. في هذه الحالة، يمكن بسهولة كتابة مصفوفة التغاير (شروطها) التي تهمنا باستخدام صلاحيات المعلمة.

يتم إجراء تقدير نموذج الانحدار الذاتي لمعلمة معروفة باستخدام OLS. في هذه الحالة، يكفي ببساطة تقليل النموذج الأصلي عن طريق تحويل بسيط إلى نموذج تفي أخطائه بشروط نموذج الانحدار القياسي. إنه نادر جدًا، ولكن لا يزال هناك موقف تكون فيه معلمة الانحدار التلقائي معروفة. لذلك، من الضروري بشكل عام إجراء التقدير باستخدام معلمة انحدار ذاتي غير معروفة. هناك ثلاثة إجراءات شائعة الاستخدام لمثل هذا التقييم. طريقة كوكرين-أوركوت، طريقة هيلدريث-لو، وطريقة دوربين.

بشكل عام، الاستنتاجات التالية صحيحة. يتطلب تحليل السلاسل الزمنية تصحيح عملية OLS التقليدية، حيث أن الأخطاء في هذه الحالة عادة ما تكون مترابطة. غالبًا ما تشكل هذه الأخطاء عملية انحدار ذاتي ثابتة من الدرجة الأولى. مقدرات OLS للانحدار الذاتي من الدرجة الأولى غير متحيزة ومتسقة ولكنها غير فعالة. باستخدام معامل الانحدار الذاتي المعروف، يتم تقليل OLS إلى تحويلات بسيطة (تصحيحات) للنظام الأصلي ثم إلى تطبيق OLS القياسي. إذا كان معامل الانحدار الذاتي غير معروف، كما هو الحال في أغلب الأحيان، فهناك العديد من الإجراءات المتاحة لـ OLS، والتي تتمثل في تقدير المعلمة غير المعروفة (المعامل)، وبعد ذلك يتم تطبيق نفس التحويلات كما في الحالة السابقة للمعامل المعروف معامل.

37. مفهوم اختبار بروش-باغان، اختبار غولدفيلدت-كواندت

يعد خطأ التقريب أحد المشكلات الأكثر شيوعًا عند تطبيق طرق معينة لتقريب البيانات المصدر. هناك أنواع مختلفة من أخطاء التقريب:

الأخطاء المرتبطة بأخطاء بيانات المصدر؛

الأخطاء المرتبطة بالتناقض بين النموذج التقريبي وبنية البيانات التقريبية.

يحتوي Excel على دالة خطية متطورة لمعالجة البيانات والتقريبات التي تستخدم الرياضيات المعقدة. ولكي نحصل على فكرة عنه، دعونا ننتقل (عبر F1) إلى الجزء الوصفي من هذا التطور، والذي نعرضه مع الاختصارات وبعض التغييرات في التدوين.

لحساب إحصائيات سلسلة باستخدام المربعات الصغرى لحساب الخط المستقيم الذي يناسب البيانات المتاحة بشكل أفضل. تقوم الدالة بإرجاع مصفوفة تصف السطر الناتج. نظرًا لإرجاع مصفوفة من القيم، يجب تحديد الدالة كصيغة مصفوفة.

معادلة الخط المستقيم هي:

y=a+b1*x1+b2*x2+...bn*xn

بناء الجملة:

LINEST(y;x;const;الإحصائيات)

صفيف ص - القيم المعروفةذ.

صفيف x - القيم المعروفة لـ x. يمكن أن تحتوي المصفوفة x على مجموعة واحدة أو أكثر من المتغيرات.

كونست هو قيمة منطقية، والذي يحدد ما إذا كان المصطلح الوهمي a مطلوبًا أن يساوي 0.

إذا كانت الوسيطة const هي TRUE، أو 1، أو تم حذفها، فسيتم تقييم a كالمعتاد. إذا كانت الوسيطة const هي FALSE أو 0، فسيتم تعيين a على 0.

الإحصائيات هي قيمة منطقية تشير إلى ما إذا كان يجب إرجاع إحصائيات الانحدار الإضافية. إذا كانت الوسيطة الإحصائية TRUE أو 1، فستُرجع الدالة LINEST إحصائيات انحدار إضافية. إذا كانت الإحصائيات FALSE أو 0 أو تم حذفها، فستُرجع الدالة LINEST المعاملات والتقاطع فقط.

إحصائيات الانحدار الإضافية:

se1,se2,...,sen - قيم الخطأ القياسية للمعاملات b1,b2,...,bn.

البحر - قيمة الخطأ القياسية للثابت a (sea = #N/A إذا كانت const خاطئة).

r2 هو معامل الحتمية. تتم مقارنة القيم الفعلية لـ y والقيم التي تم الحصول عليها من معادلة الخط؛ وبناء على نتائج المقارنة يتم حساب معامل الحتمية وتطبيعه من 0 إلى 1. وإذا كان يساوي 1، فإن هناك ارتباط كامل مع النموذج، أي. لا يوجد فرق بين القيم الفعلية والمقدرة لـ y. وفي الحالة المعاكسة، إذا كان معامل التحديد 0 فإن معادلة الانحدار غير ناجحة في التنبؤ بقيم y. للحصول على معلومات حول كيفية حساب r2، راجع "الملاحظات" في نهاية هذا القسم.

sey هو الخطأ القياسي لتقدير y.

F-إحصائية، أو قيمة F-ملحوظة. يتم استخدام إحصائية F لتحديد ما إذا كانت العلاقة المرصودة بين المتغيرات التابعة والمستقلة ناتجة عن الصدفة أم لا.

مدافع - درجات الحرية. درجات الحرية مفيدة للعثور على قيم F الحرجة في جدول إحصائي. لتحديد مستوى ثقة النموذج، يمكنك مقارنة القيم الموجودة في الجدول بإحصائيات F التي يتم إرجاعها بواسطة الدالة LINEST.

ssreg هو مجموع الانحدار للمربعات.

ssresid هو مجموع المربعات المتبقية.

يوضح الشكل أدناه الترتيب الذي يتم به إرجاع إحصائيات الانحدار الإضافية.

ملحوظات

يمكن الحصول على المعلومات المحددة من الدالة من خلال الدالة INDEX، على سبيل المثال:

تقاطع Y (مصطلح حر):

الفهرس(LINEST(y,x),2)

تعتمد دقة التقريب باستخدام الخط المستقيم المحسوب بواسطة الدالة LINEST على درجة تشتت البيانات. كلما كانت البيانات أقرب إلى الخط المستقيم، كلما كان النموذج المستخدم بواسطة الدالة LINEST أكثر دقة. تستخدم الدالة LINEST المربعات الصغرى لتحديد أفضل ملاءمة للبيانات.

من خلال إجراء تحليل الانحدار، مايكروسوفت اكسليحسب لكل نقطة مربع الفرق بين قيمة y المتوقعة وقيمة y الفعلية. مجموع هذه الفروق المربعة يسمى مجموع المربعات المتبقية. يقوم Microsoft Excel بعد ذلك بحساب مجموع مربعات الاختلافات بين قيم y الفعلية وقيمة y المتوسطة، وهو ما يسمى مجموع المربعات الإجمالي (مجموع انحدار المربعات + مجموع المربعات المتبقية). كلما كان مجموع المربعات المتبقية أصغر مقارنة بالمجموع الإجمالي للمربعات، زاد معامل التحديد، r2، الذي يقيس مدى نجاح معادلة الانحدار في تفسير العلاقات بين المتغيرات.

لاحظ أن قيم y التي تنبأت بها معادلة الانحدار قد لا تكون صحيحة إذا كانت تقع خارج نطاق قيم y التي تم استخدامها لتحديد المعادلة.

مثال 1: الميل والتقاطع Y

LINEST((1;9;5;7);(0;4;2;3)) يساوي (2;1)، الميل = 2 وتقاطع y = 1.

باستخدام إحصائيات F وR2

يمكنك استخدام إحصائيات F لتحديد ما إذا كانت النتيجة ذات قيمة r2 العالية ناتجة عن الصدفة. إذا كانت F المرصودة أكبر من F الحرجة، فهناك علاقة بين المتغيرات. يمكن الحصول على F-critical من جدول قيم F-critical في أي كتاب مرجعي الإحصائيات الرياضية. للعثور على هذه القيمة باستخدام اختبار أحادي الطرف، قم بتعيين قيمة Alpha (يتم استخدام قيمة Alpha للإشارة إلى احتمال الاستنتاج الخاطئ بوجود علاقة قوية) تساوي 0.05، ولعدد درجات الحرية ( يُشار إليه عادةً بـ v1 وv2)، فلنضع v1 = k = 4 وv2 = n - (k + 1) = 11 - (4 + 1) = 6، حيث k هو عدد المتغيرات وn هو عدد نقاط البيانات . من الجدول المرجعي، F-حرج هو 4.53. قيمة F المرصودة هي 459.753674 (تم الحصول على هذه القيمة في المثال الذي حذفناه)، وهي أكبر بشكل ملحوظ من قيمة F الحرجة البالغة 4.53. وبالتالي النتيجة معادلة الانحدارمفيدة للتنبؤ بالنتيجة المرجوة.

لإجراء تقييم عام لجودة الاقتصاد القياسي الذي تم إنشاؤه، مثل خصائص مثل معامل التحديد، ومؤشر الارتباط، والمتوسط خطأ نسبيالتقريب، وكذلك التحقق من أهمية معادلة الانحدار باستخدام F- معيار فيشر. الخصائص المدرجة عالمية تمامًا ويمكن استخدامها لكل من النماذج الخطية وغير الخطية، بالإضافة إلى النماذج التي تحتوي على متغيرين عاملين أو أكثر. يلعب عدد من المخلفات دورًا حاسمًا في حساب جميع خصائص الجودة المدرجة ε ط، والتي يتم حسابها عن طريق طرح القيم الفعلية (التي تم الحصول عليها من الملاحظات) للخاصية قيد الدراسة ذ طالقيم المحسوبة باستخدام معادلة النموذج ذ ري.

معامل التحديد

يوضح نسبة التغير في الخاصية محل الدراسة التي تم أخذها بعين الاعتبار في النموذج. بمعنى آخر، يوضح معامل التحديد أي جزء من التغير في المتغير قيد الدراسة يمكن حسابه بناءً على التغيرات في متغيرات العوامل المتضمنة في النموذج باستخدام نوع الوظيفة المختارة التي تربط بين متغيرات العامل والصفة قيد الدراسة في النموذج. معادلة نموذجية.

معامل التحديد ص 2يمكن أن تأخذ القيم من 0 إلى 1. وكلما اقترب معامل التحديد ص 2إلى واحد، جودة أفضلعارضات ازياء.

مؤشر الارتباط يمكن حسابها بسهولة بمعرفة معامل التحديد:

مؤشر الارتباط ريميز مدى تقارب نوع الارتباط المختار عند بناء النموذج بين العوامل التي تم أخذها في الاعتبار في النموذج والمتغير قيد الدراسة. في حالة الانحدار الزوجي الخطي، فإن قيمته المطلقة تتزامن مع معامل ارتباط الزوج ص(س، ص)، والتي تناولناها سابقًا، وتميز بقرب العلاقة الخطية بينهما سو ذ. من الواضح أن قيم مؤشر الارتباط تقع أيضًا في النطاق من 0 إلى 1. وكلما اقتربت القيمة رللوحدة، كلما كان نوع الوظيفة المختارة يربط بشكل وثيق بين متغيرات العوامل والخصائص قيد الدراسة، كلما كانت جودة النموذج أفضل.

(2.11)

يتم التعبير عنها كنسبة مئوية ويميز دقة النموذج. يمكن تحديد الدقة المقبولة للنموذج عند حل المشكلات العملية بناءً على اعتبارات الجدوى الاقتصادية مع مراعاة الوضع المحدد. المعيار المستخدم على نطاق واسع هو أن الدقة تعتبر مرضية إذا كان متوسط ​​الخطأ النسبي أقل من 15%. لو متوسط ​​rel.أقل من 5%، فيقال أن النموذج ذو دقة عالية. لا ينصح باستخدام نماذج ذات دقة غير مرضية للتحليل والتنبؤ، أي متى متوسط ​​rel.أكثر من 15%.

اختبار فيشر F تستخدم لتقييم أهمية معادلة الانحدار. يتم تحديد القيمة المحسوبة للمعيار F من العلاقة:

. (2.12)

قيمة حرجة F-يتم تحديد المعايير من الجداول عند مستوى أهمية معين α ودرجات الحرية (يمكنك استخدام الدالة FRIST في Excel). وهنا، كما كان من قبل، م- عدد العوامل المأخوذة في الاعتبار في النموذج، ن- عدد الملاحظات. إذا كانت القيمة المحسوبة أكبر من القيمة الحرجة، فإن معادلة النموذج تعتبر مهمة. كلما ارتفعت القيمة المحسوبة F-المعايير، كلما كانت جودة النموذج أفضل.

دعونا نحدد خصائص الجودة للنموذج الخطي الذي بنينا من أجله مثال 1. دعونا نستخدم البيانات من الجدول 2. معامل التحديد:

لذلك، في إطار النموذج الخطي، يتم تفسير التغير في حجم المبيعات بنسبة 90.1٪ بالتغيرات في درجة حرارة الهواء.

مؤشر الارتباط

.

إن قيمة مؤشر الارتباط في حالة النموذج الخطي المزدوج، كما نرى، تساوي بالفعل القيمة المطلقة لمعامل الارتباط بين المتغيرات المقابلة (حجم المبيعات ودرجة الحرارة). وبما أن القيمة التي تم الحصول عليها قريبة جداً من الوحدة، فيمكن أن نستنتج أن هناك علاقة خطية وثيقة بين المتغير قيد الدراسة (حجم المبيعات) ومتغير العامل (درجة الحرارة).

اختبار فيشر F

قيمة حرجة واو كرعند α = 0.1؛ ν 1 =1; ν 2 =7-1-1=5 يساوي 4.06. القيمة المحسوبة F-المعايير أكبر من المعايير الجدولية لذلك فإن معادلة النموذج مهمة.

متوسط ​​الخطأ النسبي للتقريب

يتمتع نموذج الانحدار الخطي المقترن بدقة غير مرضية (> 15٪) ولا يوصى باستخدامه في التحليل والتنبؤ.

ونتيجة لذلك، على الرغم من أن معظم الخصائص الإحصائية تلبي المعايير الخاصة بها، فإن نموذج الانحدار الخطي الزوجي غير مناسب للتنبؤ بحجم المبيعات اعتمادا على درجة حرارة الهواء. إن الطبيعة غير الخطية للعلاقة بين هذه المتغيرات وفقًا لبيانات الرصد واضحة تمامًا في الشكل 1. وأكد التحليل هذا.


سنحدد معاملات الانحدار التجريبية b 0 , b 1 باستخدام أداة "الانحدار" الخاصة بالوظيفة الإضافية "تحليل البيانات" لمعالج جداول البيانات MS Excel.

خوارزمية تحديد المعاملات هي كما يلي.

1. أدخل البيانات الأولية في معالج جداول البيانات MS Excel.

2. اتصل بالوظيفة الإضافية لتحليل البيانات (الشكل 2).

3. حدد أداة التحليل الانحدار (الشكل 3).

4. املأ المواضع المقابلة لنافذة الانحدار (الشكل 4).

5. انقر فوق الزر "موافق" في نافذة الانحدار واحصل على بروتوكول لحل المشكلة (الشكل 5)


الشكل 3 - تحديد أداة الانحدار




الشكل 4 - نافذة الانحدار

الشكل 5 - بروتوكول لحل المشكلة

من الشكل 5 يمكن ملاحظة أن معاملات الانحدار التجريبي متساوية على التوالي

ب 0 = 223،

ب1 = 0.0088.

ثم تكون معادلة الانحدار الخطي المقترن الذي يربط قيمة المعاش الشهري y بقيمة الحد الأدنى للكفاف بالشكل

.(3.2)

بعد ذلك، وفقًا للمهمة، من الضروري تقييم مدى قرب العلاقة الإحصائية بين قيمة تكلفة المعيشة x وقيمة المعاش الشهري y. ويمكن إجراء هذا التقدير باستخدام معامل الارتباط. تم تحديد قيمة هذا المعامل في الشكل 5 كمضاعف R، وبالتالي يساوي 0.038. وبما أن قيمة هذا المعامل من الناحية النظرية تقع في النطاق من -1 إلى +1، فيمكننا أن نستنتج أن العلاقة الإحصائية بين قيمة تكلفة المعيشة x وقيمة المعاش الشهري y ليست كبيرة.

المعلمة "R - Square"، الواردة في الشكل 5، هي مربع معامل الارتباط وتسمى معامل التحديد. وتميز قيمة هذا المعامل حصة تباين المتغير التابع y المفسر بالانحدار (المتغير التوضيحي x). وعليه فإن القيمة 1- تميز حصة التباين في المتغير y الناتج عن تأثير جميع المتغيرات التفسيرية الأخرى التي لم تؤخذ في الاعتبار في النموذج الاقتصادي القياسي. من الشكل 5 يمكن ملاحظة أن حصة جميع المتغيرات التوضيحية التي لم تؤخذ في الاعتبار في نموذج الاقتصاد القياسي الناتج تبلغ حوالي 1 - 0.00145 = 0.998 أو 99.8٪.



في المرحلة التالية، وفقًا للمهمة، من الضروري تحديد درجة الارتباط بين المتغير التوضيحي x والمتغير التابع y، باستخدام معامل المرونة. يتم تعريف معامل المرونة لنموذج الانحدار الخطي المقترن على النحو التالي:

وبالتالي، إذا تغيرت تكلفة المعيشة بنسبة 1%، يتغير المعاش الشهري بنسبة 0.000758%.

. (3.4)

للقيام بذلك، نكمل الجدول الأصلي 1 بعمودين نحدد فيهما القيم المحسوبة باستخدام التبعية (3.2) وقيمة الفرق.

الجدول 3.2. حساب متوسط ​​خطأ التقريب.

ثم متوسط ​​خطأ التقريب هو

.

ومن المعروف من الناحية العملية أن قيمة متوسط ​​خطأ التقريب يجب ألا تزيد عن (12...15)%

في المرحلة الأخيرة، سنقوم بتقييم الثبات الإحصائي للنمذجة باستخدام اختبار فيشر F. وللقيام بذلك سنقوم باختبار الفرضية الصفرية H 0 حول الدلالة الإحصائية لمعادلة الانحدار الناتجة حسب الشرط:

إذا كانت القيمة النظرية (المحسوبة) للمعيار F عند مستوى أهمية معين a = 0.05 أكبر من قيمته الحرجة F Crit (مجدولة)، فسيتم رفض فرضية العدم ويتم قبول معادلة الانحدار الناتجة على أنها مهمة.

ويترتب على الشكل 5 أن F المحسوبة = 0.0058. يتم تحديد القيمة الحرجة للمعيار F باستخدام الدالة الإحصائية أسرع (الشكل 6). معلمات إدخال الدالة هي مستوى الأهمية (الاحتمالية) وعدد درجات الحرية 1 و2. بالنسبة لنموذج الانحدار المقترن، يكون عدد درجات الحرية على التوالي 1 (متغير توضيحي واحد) وn-2 = 6 -2=4.



الشكل 6 - نافذة الدالة الإحصائية بشكل أسرع

من الشكل 6 يمكن ملاحظة أن القيمة الحرجة لاختبار F هي 7.71.

منذ حساب F< F крит, то нулевая гипотеза не отвергается и полученное регрессионное уравнение статистически незначимо.

13. بناء نموذج الانحدار المتعدد باستخدام برنامج EXCEL.

وفقا لخيار التعيين، من الضروري استخدام المواد الإحصائية.

1. بناء معادلة الانحدار الخطي المتعدد وشرح المعنى الاقتصادي لمتغيراتها.

2. إعطاء تقييم مقارن لمدى تقارب العلاقة بين العوامل والسمة الناتجة باستخدام معاملات المرونة المتوسطة (العامة).

3. تقييم الدلالة الإحصائية لمعاملات الانحدار باستخدام اختبار الطالب والفرضية الصفرية حول أهمية المعادلة باستخدام اختبار F.

4. تقييم جودة المعادلة من خلال تحديد متوسط ​​خطأ التقريب.

وترد البيانات الأولية لبناء نموذج الانحدار المزدوج في الجدول 3.3.

الجدول 3.3. البيانات الأولية.

صافي الدخل مليون دولار أمريكي دوران رأس المال، مل. دولار أمريكي × 1 رأس المال المستخدم، مل. دولار أمريكي × 2
6,6 6,9 83,6
2,7 93,6 25,4
1,6 10,0 6,4
2,4 31,5 12,5
3,3 36,7 14,3
1,8 13,8 6,5
2,4 64,8 22,7
1,6 30,4 15,8
1,4 12,1 9,3
0,9 31,3 18,9

تشبه تقنية إنشاء معادلة الانحدار الخوارزمية الموضحة في الفقرة 3.1. ويرد في الشكل 7 بروتوكول بناء معادلة الانحدار.

استنتاج النتائج
إحصائيات الانحدار
الجمع ر 0,901759207
R-مربع 0,813169667
تطبيع مربع R 0,759789572
خطأ تقليدي 0,789962026
الملاحظات
تحليل التباين
df آنسة F
تراجع 9,50635999 15,23357468
بقية 0,624040003
المجموع
احتمال t-إحصائية
تقاطع Y 1,113140304 2,270238114
المتغير × 1 -0,000592199 -0,061275574
المتغير × 2 0,063902851 5,496523193

الشكل 7. الاستنتاج.



جديد على الموقع

>

الأكثر شعبية