بيت أسنان الحكمة مصفوفة معاملات الارتباط الخطي المقترنة. تحليل مصفوفة معاملات الارتباط الزوجية

مصفوفة معاملات الارتباط الخطي المقترنة. تحليل مصفوفة معاملات الارتباط الزوجية

في البداية في النموذج فيتشمل جميع المكونات الرئيسية (يشار إلى القيم المحسوبة بين قوسين ر-معايير):

وتتميز جودة النموذج بـ: تعدد معامل التحديد ص = 0.517، متوسط ​​الخطأ التقريبي = 10.4%، التباين المتبقي ق 2= 1.79 و فيمكن ملاحظتها = 121. لأن فأوب> فكر = 2.85 عند α = 0.05، ضد 1 = 6, ضد 2= 14، معادلة الانحدار مهمة وواحد على الأقل من معاملات الانحدار - β 1، β 2، β 3، β 4 - لا يساوي الصفر.

إذا كانت أهمية معادلة الانحدار (الفرضية ح 0:β 1 = β 2 = β 3 = β 4 = تم التحقق من 0 عند α = 0.05، ثم أهمية معاملات الانحدار، أي. فرضيات ح0: β ي = 0 (ي = 1، 2، 3، 4)، يجب اختبارها عند مستوى أهمية أكبر من 0.05، على سبيل المثال عند α = 0.1. ثم عند α = 0.1، ضد= 14 حجم ركر = 1.76، والمعنوية، على النحو التالي من المعادلة (53.41)، هي معاملات الانحدار β 1، β 2، β 3.

بالنظر إلى أن المكونات الرئيسية غير مرتبطة ببعضها البعض، فيمكننا على الفور حذف جميع المعاملات غير المهمة من المعادلة، وستأخذ المعادلة الشكل

(53.42)

بمقارنة المعادلتين (53.41) و (53.42)، نرى أنه باستثناء المكونات الرئيسية غير الهامة و 4و و 5ولم يؤثر على قيم معاملات المعادلة ب 0 = 9,52, ب 1 = 0,93, ب2= 0.66 وما يقابلها ر ي (ي = 0, 1, 2, 3).

ويرجع ذلك إلى الطبيعة غير المترابطة للمكونات الرئيسية. والمثير للاهتمام هنا هو توازي معادلات الانحدار للمؤشرات الأولية (53.22)، (53.23) والمكونات الرئيسية (53.41)، (53.42).

المعادلة (53.42) مهمة لأن فأوبس = 194> فكر = 3.01، وجدت عند α = 0.05، ضد 1 = 4, ضد 2= 16. معاملات المعادلة مهمة أيضًا، حيث أن ر ي > ركر . = 1.746، الموافق α = 0.01، ضد= 16 ل ي= 0، 1، 2، 3. معامل التحديد ص= 0.486 تشير إلى 48.6% من التباين فيبسبب تأثير المكونات الثلاثة الرئيسية الأولى.

تتميز المعادلة (53.42) بمتوسط ​​خطأ نسبي للتقريب = 9.99% وتباين متبقي ق2= 1,91.

تتمتع معادلة الانحدار على المكونات الرئيسية (53.42) بخصائص تقريبية أفضل قليلاً مقارنة بنموذج الانحدار (53.23) بناءً على المؤشرات الأولية: ص= 0,486 > ص= 0,469; = 9,99% < (X) = 10.5% و ق2(و)= 1,91 < ق 2 (س) = 1.97. بالإضافة إلى ذلك، في المعادلة (53.42)، المكونات الرئيسية هي وظائف خطيةجميع المؤشرات الأولية، في حين تتضمن المعادلة (53.23) متغيرين فقط ( × 1و × 4). في عدد من الحالات، من الضروري الأخذ في الاعتبار أن النموذج (53.42) يصعب تفسيره، لأنه يتضمن نموذجا ثالثا. المكون الرئيسي و 3والتي لم نفسرها والتي ساهمت في التشتت الكلي للمؤشرات الأولية ( × 1، ..., × 5) 8.6% فقط. ومع ذلك، الاستثناء و 3من المعادلة (53.42) يؤدي إلى تفاقم الخصائص التقريبية للنموذج بشكل كبير: ص= 0.349؛ = 12.4% و ق 2(و) = 2.41. ومن ثم ينصح باختيار المعادلة (53.23) كنموذج انحدار للعائد.

تحليل الكتلة

في البحوث الإحصائيةتجميع البيانات الأولية هو أسلوب الحل الرئيسي مشاكل التصنيفوبالتالي الأساس لجميع الأعمال الإضافية مع المعلومات التي تم جمعها.

تقليديا، يتم حل هذه المشكلة على النحو التالي. من بين الميزات العديدة التي تصف كائنًا ما، يتم تحديد واحدة منها، وهي الأكثر إفادة من وجهة نظر الباحث، ويتم تجميع البيانات وفقًا لقيم هذه الميزة. إذا كان لا بد من إجراء تصنيف بناء على عدة معايير، مرتبة فيما بينها حسب درجة الأهمية، فيتم أولا التصنيف حسب المعيار الأول، ثم يتم تقسيم كل فئة من الفئات الناتجة إلى فئات فرعية حسب المعيار الثاني ، إلخ. يتم إنشاء معظم المجموعات الإحصائية التوافقية بطريقة مماثلة.

في الحالات التي لا يكون فيها من الممكن تنظيم خصائص التصنيف، يتم استخدام أبسط طريقة للتجميع متعدد الأبعاد - إنشاء مؤشر متكامل (فهرس)، يعتمد وظيفيًا على الخصائص الأولية، يليه التصنيف وفقًا لهذا المؤشر.

إن تطوير هذا النهج هو خيار تصنيف يعتمد على عدة مؤشرات عامة (المكونات الرئيسية) يتم الحصول عليها باستخدام طرق تحليل العوامل أو المكونات.

وفي حالة وجود عدة ميزات (أولية أو معممة)، فيمكن حل مشكلة التصنيف عن طريق طرق التحليل العنقودي، والتي تختلف عن طرق التصنيف الأخرى متعددة الأبعاد بغياب العينات التدريبية، أي. معلومات أولية عن توزيع السكان.

يتم تحديد الاختلافات بين مخططات حل مشكلة التصنيف إلى حد كبير من خلال ما هو المقصود بمفاهيم "التشابه" و "درجة التشابه".

بعد صياغة الهدف من العمل، من الطبيعي محاولة تحديد معايير الجودة، والوظيفة الموضوعية، والتي ستسمح لنا قيمها بمقارنتها مخططات مختلفةالتصنيفات.

في البحوث الاقتصادية وظيفة موضوعيةكقاعدة عامة، ينبغي تقليل بعض المعلمات المحددة على مجموعة من الكائنات (على سبيل المثال، قد يكون الغرض من تصنيف المعدات عبارة عن مجموعة تقلل من التكلفة الإجمالية للوقت والمال لأعمال الإصلاح).

في الحالات التي لا يكون من الممكن فيها إضفاء الطابع الرسمي على هدف المهمة، يمكن أن يكون معيار جودة التصنيف هو إمكانية التفسير الهادف للمجموعات التي تم العثور عليها.

دعونا نفكر في المشكلة التالية. دع المجموعة تدرس نالكائنات، وتتميز كل منها كعلامات مقاسة. والمطلوب تقسيم هذه الكلية إلى مجموعات (طبقات) متجانسة بمعنى معين. في الوقت نفسه، لا توجد معلومات مسبقة حول طبيعة التوزيع ك-ناقل الأبعاد Xداخل الفصول .

عادةً ما تسمى المجموعات التي تم الحصول عليها نتيجة التقسيم بالمجموعات* (التصنيفات**، الصور)، وتسمى طرق العثور عليها بالتحليل العنقودي (على التوالي، التصنيف العددي أو التعرف على الأنماط من خلال التعلم الذاتي).

* تَجَمَّع(إنجليزي) - مجموعة من العناصر تتميز ببعض الخصائص المشتركة.

**تاهو(الإنجليزية) - مجموعة منهجية من أي فئة.

من الضروري منذ البداية أن نفهم بوضوح أي من مشكلتي التصنيف يجب حلها. إذا تم حل مشكلة الكتابة المعتادة، فسيتم تقسيم مجموعة الملاحظات إلى عدد صغير نسبيًا من مناطق التجميع (على سبيل المثال، الفاصل الزمني سلسلة الاختلاففي حالة الملاحظات أحادية البعد) بحيث تكون عناصر إحدى هذه المناطق قريبة قدر الإمكان من بعضها البعض.

الحل لمشكلة أخرى هو تحديد التقسيم الطبقي الطبيعي لنتائج المراقبة إلى مجموعات محددة بوضوح تقع على مسافة معينة من بعضها البعض.

إذا كانت مشكلة التصنيف الأولى لها حل دائمًا، ففي الحالة الثانية قد يتبين أن مجموعة الملاحظات لا تكشف عن التقسيم الطبقي الطبيعي إلى مجموعات، أي. تشكل كتلة واحدة.

على الرغم من أن العديد من طرق التحليل العنقودي تعتبر أولية تمامًا، إلا أن معظم الأعمال التي تم اقتراحها فيها تعود إلى العقد الماضي. ويفسر ذلك حقيقة أن حل فعالمهام البحث العنقودية التي تتطلب إجراء عدد كبير من العمليات الحسابية و العمليات المنطقيةأصبح ممكنا فقط مع ظهور وتطور تكنولوجيا الكمبيوتر.

الشكل المعتاد لتمثيل البيانات الأولية في مشاكل التحليل العنقودي هو المصفوفة

يمثل كل سطر منها نتائج القياس كالعلامات المعتبرة في أحد الأشياء المفحوصة. في مواقف محددة، قد يكون تجميع الكائنات وتجميع الميزات أمرًا ذا أهمية. في الحالات التي لا يكون فيها الفرق بين هاتين المهمتين كبيرًا، على سبيل المثال، عند وصف بعض الخوارزميات، سنستخدم مصطلح "الكائن" فقط، بما في ذلك مصطلح "الميزة" في هذا المفهوم.

مصفوفة Xليست الطريقة الوحيدة لتقديم البيانات في مشاكل التحليل العنقودي. في بعض الأحيان يتم تقديم المعلومات الأولية في شكل مصفوفة مربعة

عنصر ص يالذي يحدد درجة القرب أنا-الكائن ل ي-مو.

تعتمد معظم خوارزميات التحليل العنقودي كليًا على مصفوفة المسافات (أو القرب) أو تتطلب حساب عناصرها الفردية، لذلك إذا تم تقديم البيانات في النموذج فإن المرحلة الأولى من حل مشكلة البحث عن التجمعات ستكون اختيار طريقة لحساب المسافات أو القرب بين الأشياء أو المعالم.

إن مسألة تحديد القرب بين الخصائص أسهل إلى حد ما في الحل. كقاعدة عامة، يسعى التحليل العنقودي للميزات إلى تحقيق نفس الأهداف تحليل العوامل: تحديد مجموعات من السمات المترابطة التي تعكس جانبًا معينًا من الكائنات قيد الدراسة. مقياس القرب في هذه الحالة مختلف المعاملات الإحصائيةالاتصالات.


المعلومات ذات الصلة.


لتحديد درجة الاعتماد بين عدة مؤشرات، يتم استخدام معاملات الارتباط المتعددة. ثم يتم تلخيصها في جدول منفصل يسمى مصفوفة الارتباط. أسماء الصفوف والأعمدة في هذه المصفوفة هي أسماء المعلمات التي تم تحديد اعتمادها على بعضها البعض. عند تقاطع الصفوف والأعمدة، توجد معاملات الارتباط المقابلة. دعنا نكتشف كيف يمكنك إجراء عملية حسابية مماثلة باستخدام أدوات Excel.

ومن المعتاد تحديد مستوى العلاقة بين المؤشرات المختلفة على النحو التالي، اعتماداً على معامل الارتباط:

  • 0 - 0.3 - لا يوجد اتصال؛
  • 0.3 - 0.5 - اتصال ضعيف؛
  • 0.5 – 0.7 – اتصال متوسط
  • 0.7 - 0.9 - مرتفع؛
  • 0.9 – 1 – قوي جداً .

لو معامل الارتباطسلبية، وهذا يعني أن العلاقة بين المعلمات هي عكسية.

لإنشاء مصفوفة ارتباط في Excel، يمكنك استخدام أداة واحدة مضمنة في الحزمة "تحليل البيانات". هذا ما يطلق عليه - "علاقة". دعونا نتعلم كيف يمكن استخدامه لحساب مقاييس الارتباط المتعددة.

الخطوة 1: تفعيل حزمة التحليل

يجب أن يقال على الفور أن الحزمة الافتراضية "تحليل البيانات"عاجز. لذلك، قبل الشروع في إجراء حساب معاملات الارتباط مباشرة، تحتاج إلى تنشيطه. ولسوء الحظ، ليس كل مستخدم يعرف كيفية القيام بذلك. لذلك، سوف نتناول هذه المسألة.


بعد الإجراء المحدد، حزمة الأداة "تحليل البيانات"سيتم تفعيلها.

المرحلة الثانية: حساب المعامل

يمكنك الآن المتابعة مباشرة لحساب معامل الارتباط المتعدد. دعونا نستخدم مثال الجدول أدناه لمؤشرات إنتاجية العمالة ونسبة رأس المال إلى العمالة ونسبة الطاقة إلى العمالة في مختلف المؤسسات لحساب معامل الارتباط المتعدد لهذه العوامل.


المرحلة 3: تحليل النتيجة التي تم الحصول عليها

الآن دعونا نتعرف على كيفية فهم النتيجة التي تلقيناها في عملية معالجة البيانات باستخدام الأداة "علاقة" V برنامج اكسل.

وكما نرى من الجدول، فإن معامل الارتباط لنسبة رأس المال إلى العمالة (العمود 2) وتوافر الطاقة ( العمود 1) هو 0.92، وهو ما يتوافق مع علاقة قوية جدًا. بين إنتاجية العمل ( العمود 3) وتوافر الطاقة ( العمود 1) هذا المؤشر هو 0.72، وهي درجة عالية من الاعتماد. معامل الارتباط بين إنتاجية العمل ( العمود 3) ونسبة رأس المال إلى العمالة ( العمود 2) تساوي 0.88، وهو ما يتوافق أيضًا مع درجة عالية من الاعتماد. وبالتالي يمكننا القول أن العلاقة بين جميع العوامل المدروسة قوية جدًا.

كما ترون، الحزمة "تحليل البيانات"يعد برنامج Excel أداة مريحة للغاية وسهلة الاستخدام إلى حد ما لتحديد معامل الارتباط المتعدد. بمساعدتها، يمكنك أيضًا حساب الارتباط المعتاد بين عاملين.

حسب أراضي الجنوب المنطقة الفيدراليةيقدم الاتحاد الروسي بيانات لعام 2011

مناطق المقاطعة الفيدرالية

الناتج الإقليمي الإجمالي، مليار روبل، Y

الاستثمارات في الأصول الثابتة، مليار روبل، X1

1. مندوب. أديغيا

2. مندوب. داغستان

3. مندوب. إنغوشيا

4. جمهورية قبردينو بلقاريا

5. مندوب. كالميكيا

6. جمهورية قراتشاي-شركيسيا

7. مندوب. أوسيتيا الشمالية- ألانيا

8. منطقة كراسنودار)

9. منطقة ستافروبول

10. منطقة استراخان.

11. منطقة فولغوجراد.

12. منطقة روستوف.

  • 1. احسب مصفوفة معاملات الارتباط الزوجية؛ معدل أهمية إحصائيةمعاملات الارتباط.
  • 2. بناء مجال ارتباط بين الخاصية الفعالة والعامل الأكثر ارتباطاً بها.
  • 3. احسب معاملات الانحدار الزوجي الخطي لكل عامل X..
  • 4. تقييم جودة كل نموذج من خلال معامل التحديد ومتوسط ​​خطأ التقريب واختبار فيشر F. اختر النموذج الأفضل.

سيكون 80٪ من قيمته القصوى. تقديم بيانيا: القيم الفعلية والنموذجية، ونقاط التنبؤ.

  • 6. باستخدام الانحدار المتعدد خطوة بخطوة (طريقة الاستبعاد أو طريقة التضمين)، قم ببناء نموذج لتكوين أسعار الشقق بسبب عوامل مهمة. إعطاء تفسير اقتصادي لمعاملات نموذج الانحدار.
  • 7. تقييم جودة النموذج المبني. هل تحسنت جودة النموذج مقارنة بنموذج العامل الواحد؟ قم بتقييم تأثير العوامل المهمة على النتيجة باستخدام معاملات المرونة في - و -؟ معاملات

عند حل هذه المشكلة، سيتم إجراء الحسابات وإنشاء الرسوم البيانية والمخططات باستخدام إعدادات تحليل بيانات Excel.

1. احسب مصفوفة معاملات الارتباط الزوجية وقم بتقييم الأهمية الإحصائية لمعاملات الارتباط

في مربع الحوار الارتباط، في حقل الفاصل الزمني للإدخال، أدخل نطاق الخلايا الذي يحتوي على البيانات المصدر. وبما أننا قمنا أيضًا بتحديد عناوين الأعمدة، فإننا نحدد خانة الاختيار التسميات في الصف الأول.

حصلنا على النتائج التالية:

الجدول 1.1 مصفوفة معاملات الارتباط الزوجية

ويبين تحليل مصفوفة معاملات الارتباط الزوجي أن المتغير التابع Y، أي الناتج الإقليمي الإجمالي، له علاقة أوثق مع X1 (الاستثمار في رأس المال الثابت). معامل الارتباط هو 0.936. وهذا يعني أن 93.6% من المتغير التابع Y (الناتج الإقليمي الإجمالي) يعتمد على المؤشر X1 (الاستثمار في رأس المال الثابت).

سيتم تحديد الأهمية الإحصائية لمعاملات الارتباط باستخدام اختبار الطالب. نقارن قيمة الجدول بالقيم المحسوبة.

لنحسب قيمة الجدول باستخدام الدالة STUDISCOVER.

جدول ر = 0.129 في احتمال الثقةيساوي 0.9 ودرجة الحرية (n-2).

العامل X1 ذو دلالة إحصائية.

2. دعونا نبني مجالاً للارتباط بين الخاصية الفعالة (الناتج الإقليمي الإجمالي) والعامل الأكثر ارتباطاً بها (الاستثمار في رأس المال الثابت)

للقيام بذلك، سوف نستخدم أداة الرسم المبعثر في Excel.

ونتيجة لذلك، نحصل على مجال ارتباط لسعر الناتج الإقليمي الإجمالي، مليار روبل. والاستثمارات في الأصول الثابتة مليار روبل. (الشكل 1.1).

الشكل 1.1

3. احسب معلمات الانحدار الزوجي الخطي لكل عامل X

لحساب معلمات الانحدار الخطي الزوجي، سوف نستخدم أداة الانحدار المضمنة في إعداد تحليل البيانات.

في مربع حوار الانحدار، في الحقل الفاصل الزمني للإدخال Y، أدخل عنوان نطاق الخلايا الذي يمثله المتغير التابع. في الميدان

الفاصل الزمني للإدخال X ندخل عنوان النطاق الذي يحتوي على قيم المتغيرات المستقلة. دعونا نحسب معلمات الانحدار المقترن للعامل X.

بالنسبة لـ X1، تلقينا البيانات التالية الواردة في الجدول 1.2:

الجدول 1.2

معادلة الانحدار لاعتماد سعر الناتج الإقليمي الإجمالي على الاستثمار في رأس المال الثابت لها الشكل التالي:

4. دعونا نقيم جودة كل نموذج من خلال معامل التحديد ومتوسط ​​خطأ التقريب واختبار فيشر F. دعونا نحدد النموذج الذي هو الأفضل.

لقد حصلنا على معامل التحديد، متوسط ​​خطأ التقريب، نتيجة للحسابات التي أجريت في الفقرة 3. وترد البيانات التي تم الحصول عليها في الجداول التالية:

بيانات X1:

الجدول 1.3أ

الجدول 1.4ب

أ) يحدد معامل التحديد نسبة تباين السمة Y المأخوذة في الاعتبار في النموذج والتي ترجع إلى تأثير العامل X عليه. كلما زادت قيمة معامل التحديد، كلما اقتربت العلاقة بين الخصائص في البناء نموذج رياضي.

يشير Excel إلى R-squared.

وبناء على هذا المعيار فإن النموذج الأكثر ملاءمة هو معادلة الانحدار لاعتماد سعر الناتج الإقليمي الإجمالي على الاستثمار في رأس المال الثابت (X1).

ب) نحسب متوسط ​​خطأ التقريب باستخدام الصيغة:

حيث البسط هو مجموع مربعات انحراف القيم المحسوبة عن القيم الفعلية. في الجداول، يقع في عمود SS، السطر المتبقي.

نقوم بحساب متوسط ​​سعر الشقة في برنامج Excel باستخدام الدالة AVERAGE. = 24.18182 مليار روبل.

عند إجراء الحسابات الاقتصادية، يعتبر النموذج دقيقا بما فيه الكفاية إذا متوسط ​​الخطأإذا كانت نسبة التقريب أقل من 5%، يعتبر النموذج مقبولاً إذا كان متوسط ​​خطأ التقريب أقل من 15%.

ووفقاً لهذا المعيار فإن النموذج الرياضي الأكثر ملائمة لمعادلة الانحدار لاعتماد سعر الناتج الإقليمي الإجمالي على الاستثمار في رأس المال الثابت (X1).

ج) يستخدم اختبار F لاختبار أهمية نموذج الانحدار. وللقيام بذلك، يتم أيضًا إجراء مقارنة بين القيم الحرجة (الجدولية) لاختبار Fisher F.

القيم المحسوبة موضحة في الجداول 1.4 ب (يشار إليها بالحرف F).

سنقوم بحساب القيمة الجدولية لاختبار Fisher's F في Excel باستخدام الدالة FDIST. لنأخذ الاحتمال يساوي 0.05. المستلمة: = 4.75

القيم المحسوبة لاختبار Fisher's F لكل عامل قابلة للمقارنة مع قيمة الجدول:

71.02 > = 4.75 النموذج مناسب وفق هذا المعيار.

وبعد تحليل البيانات وفقا للمعايير الثلاثة، يمكننا أن نستنتج أن أفضل نموذج رياضي مبني على عامل الناتج الإقليمي الإجمالي، والذي يتم وصفه بالمعادلة الخطية

5. بالنسبة للنموذج المختار للاعتماد على سعر الناتج الإقليمي الإجمالي

سوف نتنبأ بمتوسط ​​قيمة المؤشر عند مستوى الأهمية إذا كانت القيمة المتوقعة للعامل هي 80٪ من قيمته القصوى. دعونا نعرضها بيانيا: القيم الفعلية والنموذجية، ونقاط التنبؤ.

لنحسب القيمة المتوقعة لـ X وفقًا للشرط، وستكون 80% من القيمة القصوى.

دعونا نحسب X max في Excel باستخدام الدالة MAX.

0,8 *52,8 = 42,24

للحصول على تقديرات تنبؤية للمتغير التابع، نستبدل القيمة التي تم الحصول عليها للمتغير المستقل في المعادلة الخطية:

5.07+2.14*42.24 = 304.55 مليار روبل.

دعونا نحدد فترة الثقة للتنبؤ، والتي سيكون لها الحدود التالية:

لحساب فاصل الثقةبالنسبة للقيمة المتوقعة، نحسب الانحراف عن خط الانحدار.

بالنسبة لنموذج الانحدار المقترن، يتم حساب قيمة الانحراف:

أولئك. قيمة الخطأ القياسية من الجدول 1.5 أ.

(بما أن عدد درجات الحرية يساوي واحدًا، فإن المقام سيكون مساويًا لـ n-2). توقعات انحدار زوج الارتباط

لحساب المعامل، سنستخدم دالة Excel STUDISCOVER، ونأخذ الاحتمال يساوي 0.1، وعدد درجات الحرية 38.

نحسب القيمة باستخدام Excel ونحصل على 12294.


دعونا نحدد الحدود العلوية والسفلية للفاصل الزمني.

  • 304,55+27,472= 332,022
  • 304,55-27,472= 277,078

وبذلك فإن القيمة المتوقعة = 304.55 ألف دولار ستكون بين الحد الأدنى الذي يساوي 277.078 ألف دولار. و الحد الأعلى، أي ما يعادل 332.022 مليار. فرك.

يتم عرض القيم الفعلية والنموذجية ونقاط التنبؤ بيانياً في الشكل 1.2.


الشكل 1.2

6. باستخدام الانحدار المتعدد خطوة بخطوة (طريقة الحذف)، سنقوم ببناء نموذج لتكوين سعر الناتج الإقليمي الإجمالي بسبب عوامل مهمة

لبناء الانحدار المتعدددعونا نستخدم وظيفة الانحدار في Excel، بما في ذلك جميع العوامل. ونتيجة لذلك نحصل على جداول النتائج التي نحتاج منها إلى اختبار الطالب.

الجدول 1.8أ

الجدول 1.8ب

الجدول 1.8ج.

نحصل على نموذج مثل:

منذ< (4,75 < 71,024), уравнение регрессии следует признать адекватным.

لنختار أصغر قيمة مطلقة لاختبار t للطالب، وهي تساوي 8.427، ونقارنها بالقيمة الجدولية التي نحسبها في Excel، ونأخذ مستوى الأهمية الذي يساوي 0.10، وعدد درجات الحرية n-m-1= 12-4=8: =1.8595

منذ 8.427> 1.8595 يجب اعتبار النموذج مناسبًا.

7. للتقييم عامل مهمتم الحصول على نموذج رياضي، وحساب معاملات المرونة، و - المعاملات

يوضح معامل المرونة النسبة المئوية التي ستتغير بها السمة الفعالة عندما تتغير سمة العامل بنسبة 1٪:

ه X4 = 2.137 * (10.69/24.182) = 0.94%

أي أنه مع زيادة الاستثمار في رأس المال الثابت بنسبة 1%، تزيد التكلفة في المتوسط ​​بنسبة 0.94%.

يوضح المعامل أي جزء من الانحراف المعياري يتغير متوسط ​​قيمة المتغير التابع مع تغير المتغير المستقل بانحراف معياري واحد.

2,137* (14.736/33,632) = 0,936.

يتم أخذ بيانات الانحراف المعياري من الجداول التي تم الحصول عليها باستخدام أداة الإحصائيات الوصفية.

الجدول 1.11 الإحصائيات الوصفية (Y)

الجدول 1.12 الإحصائيات الوصفية (X4)

يحدد المعامل حصة تأثير العامل في التأثير الكلي لجميع العوامل:

لحساب معاملات الارتباط الزوجية، نقوم بحساب مصفوفة معاملات الارتباط الزوجية في برنامج Excel باستخدام أداة الارتباط في إعدادات تحليل البيانات.

الجدول 1.14

(0,93633*0,93626) / 0,87 = 1,00.

الاستنتاج: من الحسابات التي تم الحصول عليها، يمكننا أن نستنتج أن السمة الفعالة Y (الناتج الإقليمي الإجمالي) لها اعتماد كبير على العامل X1 (الاستثمار في رأس المال الثابت) (بنسبة 100٪).

مراجع

  • 1. ماغنوس واي آر، كاتيشيف بي كيه، بيريسيتسكي أ.أ. الاقتصاد القياسي. دورة المبتدئين. درس تعليمي. الطبعة الثانية. - م: ديلو، 1998. - ص. 69 - 74.
  • 2. ورشة عمل حول الاقتصاد القياسي: كتاب مدرسي / I.I. إليسيفا ، إس. كوريشيفا، ن.م. جوردينكو وآخرون 2002. - ص. 49 - 105.
  • 3. دوجيرتي ك. مقدمة في الاقتصاد القياسي: ترجمة. من اللغة الإنجليزية - م: INFRA-M، 1999. - الرابع عشر، ص. 262 - 285.
  • 4. أيفيزيان إس.إيه، ميختيريان في.س. الرياضيات التطبيقية وأساسيات الاقتصاد القياسي. -1998.، ص 115-147.
  • 5. كريمر إن.ش.، بوتكو بي.إيه. الاقتصاد القياسي. -2007. من 175-251.
ذ س (1) س (2) س (3) س (4) س (5)
ذ 1.00 0.43 0.37 0.40 0.58 0.33
س (1) 0.43 1.00 0.85 0.98 0.11 0.34
س (2) 0.37 0.85 1.00 0.88 0.03 0.46
س (3) 0.40 0.98 0.88 1.00 0.03 0.28
س (4) 0.58 0.11 0.03 0.03 1.00 0.57
س (5) 0.33 0.34 0.46 0.28 0.57 1.00

يوضح تحليل مصفوفة معاملات الارتباط المقترنة أن المؤشر الفعال هو الأكثر ارتباطًا بالمؤشر س(4)- كمية الأسمدة المستهلكة لكل 1 هكتار ().

وفي الوقت نفسه، فإن العلاقة بين وسيطات السمات قريبة جدًا. وبالتالي توجد علاقة وظيفية عمليا بين عدد الجرارات ذات العجلات ( س(1)) وعدد أدوات الحراثة السطحية .

يشار أيضًا إلى وجود علاقة خطية متداخلة من خلال معاملات الارتباط و . مع الأخذ في الاعتبار العلاقة الوثيقة بين المؤشرات س (1) ، س(2) و س(3) يمكن تضمين واحد منهم فقط في نموذج انحدار العائد.

لتوضيح التأثير السلبي للعلاقة الخطية المتعددة، فكر في نموذج انحدار العائد، بما في ذلك جميع مؤشرات المدخلات:

ف أوبس = 121.

قيم التقديرات المصححة للانحرافات المعيارية لتقديرات معاملات المعادلة مبينة بين قوسين .

يتم عرض معلمات الكفاية التالية ضمن معادلة الانحدار: معامل التحديد المتعدد؛ التقدير المصحح للتباين المتبقي ومتوسط ​​الخطأ النسبي للتقريب والقيمة المحسوبة للمعيار F obs = 121.

معادلة الانحدار مهمة لأن F obs = 121 > F kp = 2.85 وجدت من الجدول ف- التوزيعات عند = 0.05؛ ن 1 = 6 و ن 2 = 14.

ويترتب على ذلك أن Q¹0، أي. وواحد على الأقل من معاملات المعادلة q ي (ي= 0، 1، 2، ...، 5) ليست صفراً.

لاختبار الفرضية حول أهمية معاملات الانحدار الفردية H0: q j =0، حيث ي=1،2،3،4،5، قارن قيمة حرجة ر kp = 2.14، وجدت من الجدول ر-التوزيعات عند مستوى الأهمية أ=2 س=0.05 وعدد درجات الحرية n=14 والقيمة المحسوبة . ويترتب على المعادلة أن معامل الانحدار يكون ذا دلالة إحصائية فقط عندما س(٤) منذ النصف ر 4 ½=2.90> رك = 2.14.



غير قابلة للتفسير الاقتصادي علامات سلبيةمعاملات الانحدار في س(1) و س(5) . ويترتب على القيم السالبة للمعاملات أن الزيادة في تشبع الزراعة بالجرارات ذات العجلات ( س(1)) ومنتجات الصحة النباتية ( س(5)) له تأثير سلبي على العائد. ولذلك، فإن معادلة الانحدار الناتجة غير مقبولة.

للحصول على معادلة الانحدار ذات المعاملات الهامة، نستخدم خوارزمية خطوة بخطوة تحليل الانحدار. في البداية، نستخدم خوارزمية خطوة بخطوة مع إزالة المتغيرات.

دعونا نستبعد المتغير من النموذج س(١) أي يوافق الحد الأدنى القيمة المطلقةالقيمة ½ ر 1 ½=0.01. بالنسبة للمتغيرات المتبقية، نقوم مرة أخرى ببناء معادلة الانحدار:

المعادلة الناتجة مهمة لأن F المرصودة = 155 > F kp = 2.90، وجدت عند مستوى الأهمية a=0.05 وأعداد درجات الحرية n 1 =5 و n 2 =15 وفقًا للجدول ف-التوزيع، أي. ناقلات ف¹0. ومع ذلك، فقط معامل الانحدار في س(4) . القيم المقدرة ½ ري ½ للمعاملات الأخرى أقل ر kr = 2.131، وجدت من الجدول ر-التوزيعات عند a=2 س=0.05 و ن = 15.

وذلك باستبعاد المتغير من النموذج س(٣) وهو مطابق للقيمة الدنيا ر 3 =0.35 ونحصل على معادلة الانحدار:

(2.9)

في المعادلة الناتجة، المعامل عند س(5) . بالاستبعاد س(5) نحصل على معادلة الانحدار:

(2.10)

وصلنا معادلة هامةالانحدارات مع معاملات كبيرة وقابلة للتفسير.

ومع ذلك، فإن المعادلة الناتجة ليست نموذج العائد "الجيد" الوحيد وليس "الأفضل" في مثالنا.

دعونا نظهر ذلك في حالة العلاقة الخطية المتعددة، تكون الخوارزمية المتدرجة مع تضمين المتغيرات أكثر كفاءة.الخطوة الأولى في نموذج العائد ذمتغير المدرجة س(4) والذي له أعلى معامل ارتباط ذ، موضح بالمتغير - ص(ذ,س(4))=0.58. في الخطوة الثانية، بما في ذلك المعادلة مع س(4) المتغيرات س(1) أو س(3) سنحصل على نماذج تتجاوز لأسباب اقتصادية وخصائص إحصائية (2.10):

(2.11)

(2.12)

إن تضمين أي من المتغيرات الثلاثة المتبقية في المعادلة يؤدي إلى تفاقم خصائصها. انظر على سبيل المثال المعادلة (2.9).

وبالتالي، أصبح لدينا ثلاثة نماذج للعائد "الجيد"، والتي يتعين علينا اختيار واحد منها لأسباب اقتصادية وإحصائية.

ووفقا للمعايير الإحصائية فإن النموذج (2.11) هو الأكثر ملائمة. وهو يتوافق مع الحد الأدنى لقيم التباين المتبقي = 2.26 ومتوسط ​​الخطأ النسبي للتقريب و أعلى القيمو F obs = 273.

بعض أسوأ أداءالنموذج (2.12) له الكفاية، ومن ثم النموذج (2.10).

وسوف نختار الآن أفضل الموديلين (2.11) و (2.12). وتختلف هذه النماذج عن بعضها البعض من حيث المتغيرات س(1) و س(3) . ومع ذلك، في نماذج العائد المتغير س(1) (عدد الجرارات ذات العجلات لكل 100 هكتار) هو الأفضل من المتغير س(3) (عدد أدوات الحراثة السطحية لكل 100 هكتار)، وهو ثانوي إلى حد ما (أو مشتق من س (1)).

وفي هذا الصدد، ولأسباب اقتصادية، ينبغي إعطاء الأفضلية للنموذج (2.12). وبالتالي، بعد تنفيذ خوارزمية تحليل الانحدار التدريجي مع إدراج المتغيرات ومراعاة حقيقة أن واحدًا فقط من المتغيرات الثلاثة المرتبطة يجب أن يدخل في المعادلة ( س (1) , س(2) أو س(3)) اختر معادلة الانحدار النهائية:

المعادلة مهمة عند a=0.05، لأن F obs = 266 > F kp = 3.20، وجدت من الجدول ف-التوزيعات في = س=0.05؛ ن 1 = 3 و ن 2 = 17. تعتبر جميع معاملات الانحدار في المعادلة ½ مهمة أيضًا ري½> رك ب (أ = 2 س=0.05؛ ن = 17) = 2.11. يجب اعتبار معامل الانحدار q 1 مهمًا (q 1 ¹0) لأسباب اقتصادية، بينما ر 1 = 2.09 أقل بقليل رك ب = 2.11.

ويترتب على معادلة الانحدار أن زيادة بمقدار واحد في عدد الجرارات لكل 100 هكتار من الأراضي الصالحة للزراعة (بقيمة ثابتة س(4)) يؤدي إلى زيادة إنتاجية الحبوب بمعدل 0.345 سنت/هكتار.

حساب تقريبي لمعاملات المرونة e 1 »0.068 و e 2 »0.161 يوضح أنه مع زيادة المؤشرات س(1) و س(4) بنسبة 1%، يزداد إنتاج الحبوب في المتوسط ​​بنسبة 0.068% و0.161% على التوالي.

معامل متعدديشير التحديد إلى أن 46.9% فقط من تباين العائد يتم تفسيره من خلال المؤشرات المدرجة في النموذج ( س(1) و س(4))، أي تشبع إنتاج المحاصيل بالجرارات والأسمدة. بقية الاختلاف يرجع إلى عمل عوامل غير محسوبة ( س (2) , س (3) , س(5)، الأحوال الجوية، الخ). يميز متوسط ​​الخطأ النسبي للتقريب مدى كفاية النموذج، وكذلك قيمة التباين المتبقي. عند تفسير معادلة الانحدار، تكون القيم محل الاهتمام الأخطاء النسبيةتقريبية . لنتذكر أن - القيمة النموذجية للمؤشر الفعال تميز متوسط ​​قيمة العائد لمجموع المناطق قيد النظر، بشرط أن تكون قيم المتغيرات التوضيحية س(1) و س(4) ثابتة على نفس المستوى، وهي س (1) = × ط(1) و س (4) = الحادي عشر(4) . ثم حسب قيم د أنايمكنك مقارنة المناطق حسب العائد. المناطق التي تتوافق معها قيم d أنا> 0، يكون العائد أعلى من المتوسط، و د أنا<0 - ниже среднего.

في مثالنا، من حيث الإنتاجية، يكون إنتاج المحاصيل أكثر فعالية في المنطقة المقابلة لـ d 7 = 28%، حيث يكون العائد أعلى بنسبة 28% من المتوسط ​​الإقليمي، والأقل فعالية في المنطقة ذات الكثافة السكانية العالية 20 =-27,3%.


المهام والتمارين

2.1. من عموم السكان ( ذ, س (1) , ..., س(ع))، حيث ذلديه قانون التوزيع الطبيعي مع التوقع الرياضي المشروط والتباين s2، عينة عشوائية من ن، ودع ( ذ ط, × ط (1) , ..., × ط(ع)) - النتيجة أناالملاحظة ( أنا=1, 2, ..., ن). تحديد: أ) التوقع الرياضي لتقدير المربعات الصغرى للمتجه س; ب) مصفوفة التغاير لتقدير المربعات الصغرى للمتجه س; ج) التوقع الرياضي للتقييم.

2.2. وفقا لشروط المشكلة 2.1، أوجد التوقع الرياضي لمجموع مربعات الانحرافات بسبب الانحدار، أي. معادل ر، أين

.

2.3. وفقًا لشروط المشكلة 2.1، حدد التوقع الرياضي لمجموع الانحرافات المربعة الناتجة عن التباين المتبقي بالنسبة لخطوط الانحدار، أي: معادلأوست، حيث

2.4. أثبت أنه عند استيفاء الفرضية H 0: q=0 إحصائيات

لديه توزيع F مع درجات الحرية n 1 =p+1 و n 2 =n-p-1.

2.5. أثبت أنه عند استيفاء الفرضية H 0: q j =0، يكون للإحصاء توزيع t مع عدد درجات الحرية n=n-p-1.

2.6. استنادا إلى البيانات (الجدول 2.3) على اعتماد انكماش الخبز العلفي ( ذ) على مدة التخزين ( س) العثور على تقدير نقطي للتوقع الشرطي بافتراض أن معادلة الانحدار العامة خطية.

الجدول 2.3.

المطلوب: أ) إيجاد تقديرات للتباين المتبقي s 2 بافتراض أن معادلة الانحدار العام لها الشكل ؛ ب) تحقق عند a=0.05 من أهمية معادلة الانحدار، أي. الفرضية H 0: q=0؛ ج) مع الموثوقية g=0.9، تحديد تقديرات الفاصل الزمني للمعلمات q 0, q 1; د) بالموثوقية g=0.95، حدد تقدير الفاصل الزمني للتوقع الرياضي المشروط عند X 0 =6; هـ) حدد عند g=0.95 فترة الثقة للتنبؤ عند هذه النقطة X=12.

2.7. بناءً على البيانات المتعلقة بديناميكيات معدل نمو أسعار الأسهم لمدة 5 أشهر، المبينة في الجدول. 2.4.

الجدول 2.4.

شهور ( س)
ذ (%)

وبافتراض أن معادلة الانحدار العامة لها الشكل المطلوب: أ) تحديد تقديرات كل من معلمات معادلة الانحدار والتباين المتبقي ق 2 ; ب) تحقق عند a=0.01 من أهمية معامل الانحدار، أي. الفرضيات H 0: q 1 =0؛

ج) مع الموثوقية g=0.95، ابحث عن تقديرات الفاصل الزمني للمعلمات q 0 و q 1؛ د) مع الموثوقية g = 0.9، قم بإنشاء تقدير فاصل للتوقع الرياضي المشروط عند س 0 =4; هـ) حدد عند g=0.9 فترة الثقة للتنبؤ عند هذه النقطة س=5.

2.8. نتائج دراسة ديناميكيات زيادة الوزن لدى الحيوانات الصغيرة مبينة في الجدول 2.5.

الجدول 2.5.

بافتراض أن معادلة الانحدار العامة خطية، فمن المطلوب: أ) تحديد تقديرات كل من معلمات معادلة الانحدار والتباين المتبقي ق 2 ؛ ب) تحقق عند a=0.05 من أهمية معادلة الانحدار، أي. الفرضيات H 0: q=0;

ج) مع الموثوقية g=0.8، ابحث عن تقديرات الفاصل الزمني للمعلمات q 0 و q 1؛ د) بموثوقية g=0.98، حدد وقارن بين تقديرات الفترات للتوقع الرياضي المشروط عند س 0 =3 و س 1 =6;

هـ) حدد عند g=0.98 فترة الثقة للتنبؤ عند هذه النقطة س=8.

2.9. يكلف ( ذ) نسخة واحدة من الكتاب حسب الإنتشار ( س) (ألف نسخة) وتتميز بالبيانات التي تجمعها دار النشر (الجدول 2.6). تحديد تقديرات المربعات الصغرى ومعلمات معادلة الانحدار الزائدي، بموثوقية g=0.9، وإنشاء فترات ثقة للمعلمات q 0 وq 1، بالإضافة إلى التوقع الشرطي عند س=10.

الجدول 2.6.

تحديد تقديرات ومعادلة الانحدار من النموذج واختبار الفرضية H 0 عند a = 0.05: q 1 = 0 وإنشاء فترات ثقة بموثوقية g = 0.9 للمعلمات q 0 و q 1 والتوقع الرياضي المشروط عند س=20.

2.11. في الجدول 2.8 عرض بيانات عن معدلات النمو (%) لمؤشرات الاقتصاد الكلي التالية ن=10 دول العالم المتقدمة لعام 1992: الناتج القومي الإجمالي - س(1) الإنتاج الصناعي - س(2) مؤشر الأسعار - س (3) .

الجدول 2.8.

بلدان x ومعلمات معادلة الانحدار، وتقدير التباين المتبقي؛ ب) تحقق عند a=0.05 من أهمية معامل الانحدار، أي. ح 0: ف 1 =0؛ ج) مع الموثوقية g=0.9، ابحث عن تقديرات الفترات q 0 و q 1؛ د) أوجد عند g=0.95 فترة الثقة عند هذه النقطة X 0 =× ط، أين أنا=5؛ هـ) مقارنة الخصائص الإحصائية لمعادلات الانحدار: 1 و 2 و 3.

2.12. حل المشكلة 2.11 بأخذ ( في) المؤشر س(١) وللتوضيح ( X) عامل س (3) .

1. أيفازيان إس. إيه.، مخيتاريان ف.س. الإحصاء التطبيقي وأساسيات الاقتصاد القياسي: كتاب مدرسي. م.، الوحدة، 1998 (الطبعة الثانية 2001)؛

2. أيفازيان إس. إيه.، مخيتاريان ف.س. الإحصاء التطبيقي في المشاكل والتمارين: كتاب مدرسي. م. الوحدة - دانا، 2001؛

3. أيفازيان إس إيه، إنيوكوف آي إس، ميشالكين إل دي الإحصائيات التطبيقية. أبحاث التبعية. م.، المالية والإحصاء، 1985، 487 صفحة؛

4. أيفازيان إس إيه، بوكستابر في إم، إنيوكوف آي إس، ميشالكين إل دي الإحصائيات التطبيقية. التصنيف والحد من الأبعاد. م.، المالية والإحصاء، 1989، 607 ص؛

5. جونستون ج. أساليب الاقتصاد القياسي، م.: الإحصائيات، 1980، 446 صفحة؛

6. دوبروف إيه في، مخيتاريان في إس، تروشين إل. الأساليب الإحصائية متعددة المتغيرات. ماجستير، المالية والإحصاء، 2000؛

7. مخيتاريان في.س.، تروشين إل.آي. دراسة التبعيات باستخدام طرق الارتباط والانحدار. م.، ميسي، 1995، 120 صفحة؛

8. مخيتاريان ف.س.، دوبروف إيه إم، تروشين إل.آي. الأساليب الإحصائية متعددة المتغيرات في الاقتصاد. م.، ميسي، 1995، 149 ص.

9. دوبروف إيه إم، مخيتاريان في إس، تروشين إل. الإحصاء الرياضي لرجال الأعمال والمديرين. م.، ميسي، 2000، 140 ص.

10. لوكاشين يو. الانحدار وأساليب التنبؤ التكيفي: كتاب مدرسي، M.، MESI، 1997.

11. لوكاشين يو. الأساليب التكيفية للتنبؤ على المدى القصير. - م. الإحصاء، 1979.


التطبيقات


الملحق 1. خيارات لمهام أبحاث الكمبيوتر المستقلة.

العوامل المترابطة...

حل:

يعتبر المتغيران على خط واحد بشكل واضح، أي. هم في علاقة خطية مع بعضهم البعض إذا . في نموذجنا، فقط معامل الانحدار الخطي المقترن بين العوامل أكبر من 0.7. مما يعني أن العوامل على خط واحد.

4. في نموذج الانحدار المتعدد، محدد مصفوفة معاملات الارتباط المقترنة بين العوامل، وقريب من الصفر. وهذا يعني أن العوامل، و...

متعدد الخطية

مستقل

قابلة للقياس الكمي

حل:

لتقييم العلاقة الخطية المتعددة للعوامل، يمكن استخدام محدد مصفوفة معاملات الارتباط المقترنة بين العوامل. إذا لم تكن العوامل مرتبطة ببعضها البعض، فإن مصفوفة معاملات الارتباط المقترنة بين العوامل ستكون وحدة. منذ جميع العناصر غير قطري سيكون مساوياً للصفر.
، بما أن = = و = = =0.
إذا كانت هناك علاقة خطية كاملة بين العوامل وكانت جميع معاملات الارتباط الزوجية تساوي واحدًا، فإن محدد هذه المصفوفة يساوي الصفر.


كلما اقترب محدد مصفوفة الارتباط بين العوامل من الصفر، كلما كانت العلاقة الخطية المتعددة للعوامل أقوى وكلما كانت نتائج الانحدار المتعدد غير موثوقة. وعلى العكس من ذلك، كلما كان محدد مصفوفة الارتباط البيني أقرب إلى واحد، كلما قلت التعددية الخطية للعوامل.

5. بالنسبة لنموذج الاقتصاد القياسي لمعادلة الانحدار الخطي المتعدد من النموذج، مصفوفة معاملات الارتباط الخطية المقترنة ( ذ- المتغير التابع؛ × (1),س (2), × (3), × (4)– المتغيرات المستقلة):


المتغيرات الخطية (ذات الصلة الوثيقة) المستقلة (التوضيحية). ليست كذلك

س(2)و س(3)

× (1)و س(3)

× (1)و × (4)

س(2)و × (4)

حل:

عند بناء نموذج الانحدار المتعدد فمن الضروري استبعاد احتمال وجود علاقة خطية وثيقة بين المتغيرات المستقلة (التوضيحية)، مما يؤدي إلى مشكلة تعدد الخطية. وفي هذه الحالة يتم التحقق من معاملات الارتباط الخطي لكل زوج من المتغيرات المستقلة (التوضيحية). تنعكس هذه القيم في مصفوفة معاملات الارتباط الخطي الزوجي. ويعتقد أن وجود معاملات ارتباط زوجية بين المتغيرات التفسيرية تزيد عن 0.7 بالقيمة المطلقة يعكس وجود علاقة وثيقة بين هذه المتغيرات (قرب العلاقة مع المتغير ذلا يعتبر في هذه الحالة). وتسمى هذه المتغيرات المستقلة خطية متداخلة. إذا كانت قيمة معامل الارتباط الزوجي بين المتغيرات التوضيحية لا تتجاوز 0.7 في القيمة المطلقة، فإن هذه المتغيرات التوضيحية ليست على خط واحد. دعونا نفكر في قيم معاملات الارتباط بين العوامل المقترنة: بين × (1)و س(2)القيمة 0.45؛ بين × (1)و س(3)- يساوي 0.82؛ بين × (1)و × (4)- يساوي 0.94؛ بين س(2)و س(3)- يساوي 0.3؛ بين س(2)و × (4)- يساوي 0.7؛ بين س(3)و × (4)- يساوي 0.12. وبالتالي فإن قيم , , لا تتجاوز 0.7. لذلك، على استقامة واحدة ليست كذلكعوامل × (1)و س(2), س(2)و س(3), س(3)و × (4). من بين الأزواج المدرجة الأخيرة، تحتوي خيارات الإجابة على زوج س(2)و س(3)- هذه هي الإجابة الصحيحة. للأزواج الآخرين: × (1و س(3), × (1)و × (4), س(2)و × (4)– تتجاوز قيم معاملات الارتباط بين العوامل المقترنة 0.7، وهذه العوامل على خط واحد.

الموضوع الثالث: المتغيرات الوهمية

1. يتم إعطاء جدول البيانات الأولية لبناء نموذج الانحدار الاقتصادي القياسي:

المتغيرات الوهمية ليست كذلك

خبرة في العمل

إنتاجية العمل

مستوى التعليم

مستوى تأهيل الموظف

حل:

عند بناء نموذج الانحدار، قد ينشأ موقف عندما يكون من الضروري أن تدرج في المعادلة، بالإضافة إلى المتغيرات الكمية، متغيرات تعكس بعض خصائص السمات (الجنس والتعليم والمنطقة وما إلى ذلك). تسمى هذه الأنواع من المتغيرات النوعية بالمتغيرات "الوهمية". لبناء النموذج المحدد في بيان المهمة، يتم استخدام متغيرات وهمية: المستوى التعليمي والمستوى المهاري للموظف. متغيرات أخرى ليست كذلكوهمي، ومن بين الخيارات المقترحة طول مدة الخدمة وإنتاجية العمل.

2. عند دراسة مدى اعتماد استهلاك اللحوم على مستوى دخل المستهلك وجنسه يمكن أن نوصي...

استخدم متغيرًا وهميًا – جنس المستهلك

تقسيم السكان إلى قسمين: المستهلكين الإناث والمستهلكين الذكور

استخدم متغيرًا وهميًا - مستوى الدخل

استبعاد جنس المستهلك من الاعتبار، حيث لا يمكن قياس هذا العامل كمياً

حل:

عند بناء نموذج الانحدار، قد ينشأ موقف عندما يكون من الضروري أن تدرج في المعادلة، بالإضافة إلى المتغيرات الكمية، متغيرات تعكس بعض خصائص السمات (الجنس والتعليم والمنطقة وما إلى ذلك). تسمى هذه الأنواع من المتغيرات النوعية بالمتغيرات "الوهمية". إنها تعكس عدم تجانس المجتمع الإحصائي قيد الدراسة وتستخدم لنمذجة أفضل للتبعيات في كائنات المراقبة غير المتجانسة هذه. عند نمذجة التبعيات الفردية للبيانات غير المتجانسة، يمكنك أيضًا استخدام طريقة تقسيم مجموعة البيانات غير المتجانسة بأكملها إلى عدة مجموعات منفصلة، ​​عددها يساوي عدد حالات المتغير الوهمي. وبالتالي، فإن خيارات الإجابة الصحيحة هي: "استخدام متغير وهمي - جنس المستهلك" و"تقسيم السكان إلى قسمين: المستهلكين الإناث والمستهلكين الذكور".

3. ندرس مدى اعتماد سعر الشقة ( في) من منطقة معيشتها ( X) ونوع المنزل. يتضمن النموذج متغيرات وهمية تعكس أنواع المنازل قيد النظر: متجانسة، لوحة، الطوب. تم الحصول على معادلة الانحدار : ,
أين ,
معادلات الانحدار الخاصة للطوب والمتجانسة هي ...

لنوع المنزل من الطوب

لنوع المنزل متجانسة

لنوع المنزل من الطوب

لنوع المنزل متجانسة

حل:

مطلوب معرفة معادلة الانحدار الخاصة للمنازل المبنية من الطوب والمتجانسة. بالنسبة لمنزل من الطوب، تكون قيم المتغيرات الوهمية كما يلي: , . المعادلة سوف تأخذ الشكل: أو لنوع المنزل: لبنة.
بالنسبة للمنزل المتجانس، تكون قيم المتغيرات الوهمية كما يلي: , . سوف تأخذ المعادلة الشكل
أو لنوع المنزل متجانسة.



جديد على الموقع

>

الأكثر شعبية