বাড়ি স্বাস্থ্যবিধি কিভাবে এক্সেলে আনুমানিক গড় ত্রুটি খুঁজে বের করতে হয়। ফিশারের এফ পরীক্ষা ব্যবহার করে রিগ্রেশন মডেলিং ফলাফলের পরিসংখ্যানগত নির্ভরযোগ্যতার অনুমান

স্বাস্থ্যবিধি

কিভাবে এক্সেলে আনুমানিক গড় ত্রুটি খুঁজে বের করতে হয়। ফিশারের এফ পরীক্ষা ব্যবহার করে রিগ্রেশন মডেলিং ফলাফলের পরিসংখ্যানগত নির্ভরযোগ্যতার অনুমান

আসুন তাত্পর্য স্তর b = 0.05-এ স্বতন্ত্র রিগ্রেশন সহগগুলির সমতা শূন্য (যদি বিকল্পটি H 1 এর সমান না হয়) সম্পর্কে হাইপোথিসিস H 0 পরীক্ষা করি।

যদি মূল অনুমানটি ভুল বলে প্রমাণিত হয়, আমরা বিকল্পটি গ্রহণ করি। এই অনুমান পরীক্ষা করার জন্য, শিক্ষার্থীর টি-টেস্ট ব্যবহার করা হয়।

পর্যবেক্ষণমূলক ডেটা থেকে পাওয়া টি-মাপদণ্ডের মান (যাকে পর্যবেক্ষিত বা বাস্তবও বলা হয়) শিক্ষার্থীদের বিতরণ সারণী (যা সাধারণত পাঠ্যপুস্তক এবং পরিসংখ্যান বা ইকোনোমেট্রিক্সের কর্মশালার শেষে দেওয়া হয়) থেকে নির্ধারিত ট্যাবুলেড (সমালোচনামূলক) মানের সাথে তুলনা করা হয়।

টেবিল মানতাৎপর্যের স্তর (b) এবং স্বাধীনতার ডিগ্রির সংখ্যার উপর নির্ভর করে নির্ধারিত হয়, যা রৈখিক জোড়া রিগ্রেশনের ক্ষেত্রে (n-2) সমান, n হল পর্যবেক্ষণের সংখ্যা।

যদি টি-পরীক্ষার প্রকৃত মান টেবিলের মান (মডুলো) থেকে বেশি হয়, তবে মূল অনুমানটি প্রত্যাখ্যান করা হয় এবং এটি বিবেচনা করা হয় যে সম্ভাব্যতা (1-বি) এর সাথে প্যারামিটার বা পরিসংখ্যানগত বৈশিষ্ট্য জনসংখ্যাশূন্য থেকে উল্লেখযোগ্যভাবে ভিন্ন।

যদি টি-পরীক্ষার প্রকৃত মান টেবিলের মান (মডুলো) থেকে কম হয়, তাহলে মূল অনুমানটিকে প্রত্যাখ্যান করার কোনো কারণ নেই, যেমন জনসংখ্যার একটি পরামিতি বা পরিসংখ্যানগত বৈশিষ্ট্য তাত্পর্য স্তরে শূন্য থেকে উল্লেখযোগ্যভাবে আলাদা নয় খ।

t crit (n-m-1;b/2) = (30;0.025) = 2.042

1.7 থেকে< 2.042, то статистическая значимость коэффициента регрессии b не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в এক্ষেত্রেসহগ b অবহেলা করা যেতে পারে।

0.56 সাল থেকে< 2.042, то статистическая значимость коэффициента регрессии a не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом a можно пренебречь.

রিগ্রেশন সমীকরণ সহগগুলির জন্য আত্মবিশ্বাসের ব্যবধান।

আসুন আমরা রিগ্রেশন সহগগুলির আত্মবিশ্বাসের ব্যবধানগুলি নির্ধারণ করি, যা 95% এর নির্ভরযোগ্যতার সাথে নিম্নরূপ হবে:

(b - t crit S b ; b + t crit S b)
(0.64 - 2.042 * 0.38; 0.64 + 2.042 * 0.38)
(-0.13;1.41)

যেহেতু বিন্দু 0 (শূন্য) ভিতরে রয়েছে আস্থা ব্যবধান, তাহলে b সহগ-এর ব্যবধান অনুমান পরিসংখ্যানগতভাবে নগণ্য।

(a - t crit S a ; a + t crit S a)
(24.56 - 2.042 * 44.25; 24.56 + 2.042 * 44.25)
(-65.79;114.91)

95% এর সম্ভাব্যতার সাথে এটি বলা যেতে পারে যে এই প্যারামিটারের মান পাওয়া ব্যবধানে থাকবে।

যেহেতু বিন্দু 0 (শূন্য) আত্মবিশ্বাসের ব্যবধানের মধ্যে রয়েছে, তাই সহগ a এর ব্যবধান অনুমান পরিসংখ্যানগতভাবে নগণ্য।

2) F- পরিসংখ্যান। মাছ ধরার মানদণ্ড।

নির্ণয়ের সহগ R2 সমীকরণের তাৎপর্য পরীক্ষা করতে ব্যবহৃত হয় লিনিয়ার রিগ্রেশনসাধারণভাবে

ফিশারের এফ পরীক্ষা ব্যবহার করে রিগ্রেশন মডেলের তাৎপর্য পরীক্ষা করা হয়, যার গণনা করা মান অধ্যয়ন করা সূচকটির পর্যবেক্ষণের মূল সিরিজের বৈচিত্র্যের অনুপাত এবং অবশিষ্ট ক্রমটির ভিন্নতার নিরপেক্ষ অনুমান হিসাবে পাওয়া যায়। এই মডেলের জন্য।

যদি k 1 =(m) এবং k 2 =(n-m-1) স্বাধীনতার ডিগ্রী সহ গণনা করা মান একটি প্রদত্ত তাৎপর্য স্তরে সারণীকৃত মানের চেয়ে বেশি হয়, তাহলে মডেলটিকে তাৎপর্যপূর্ণ হিসাবে বিবেচনা করা হবে।

যেখানে m হল মডেলের ফ্যাক্টরের সংখ্যা।

পেয়ারড লিনিয়ার রিগ্রেশনের পরিসংখ্যানগত তাত্পর্য নিম্নলিখিত অ্যালগরিদম ব্যবহার করে মূল্যায়ন করা হয়:

1. একটি শূন্য হাইপোথিসিস সামনে রাখা হয়েছে যে সামগ্রিকভাবে সমীকরণটি পরিসংখ্যানগতভাবে নগণ্য: H 0: R 2 =0 তাত্পর্য স্তরে b।
2. পরবর্তী, F-মাপদণ্ডের প্রকৃত মান নির্ধারণ করুন:

যেখানে পেয়ারওয়াইজ রিগ্রেশনের জন্য m=1।

3. একটি প্রদত্ত তাৎপর্য স্তরের জন্য ফিশার বন্টন সারণী থেকে সারণীকৃত মান নির্ধারণ করা হয়, মোট বর্গক্ষেত্রের (বৃহত্তর বৈচিত্র্য) জন্য স্বাধীনতা ডিগ্রীর সংখ্যা 1 এবং অবশিষ্টদের জন্য স্বাধীনতা ডিগ্রীর সংখ্যা। রৈখিক রিগ্রেশনে বর্গক্ষেত্রের সমষ্টি (ছোট প্রকরণ) হল n-2।

F টেবিল হল স্বাধীনতা এবং তাত্পর্য স্তরের প্রদত্ত ডিগ্রীতে এলোমেলো কারণের প্রভাবের অধীনে মানদণ্ডের সর্বাধিক সম্ভাব্য মান। তাত্পর্য স্তর বি - সঠিক অনুমান প্রত্যাখ্যান করার সম্ভাবনা, যদি এটি সত্য হয়। সাধারণত b 0.05 বা 0.01 এর সমান নেওয়া হয়।

4. যদি F-পরীক্ষার প্রকৃত মান টেবিলের মানের থেকে কম হয়, তাহলে তারা বলে যে শূন্য অনুমান প্রত্যাখ্যান করার কোন কারণ নেই।

অন্যথায়, শূন্য হাইপোথিসিস প্রত্যাখ্যান করা হয় এবং সম্ভাব্যতার সাথে (1-b) সামগ্রিকভাবে সমীকরণের পরিসংখ্যানগত তাত্পর্য সম্পর্কে বিকল্প অনুমান গৃহীত হয়।

স্বাধীনতার ডিগ্রী সহ মানদণ্ডের সারণী মান k 1 =1 এবং k 2 =30, F টেবিল = 4.17

যেহেতু F এর প্রকৃত মান< F табл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

ফিশার এফ-টেস্ট এবং স্টুডেন্ট টি-পরিসংখ্যানের মধ্যে সম্পর্ক সমতা দ্বারা প্রকাশ করা হয়:

রিগ্রেশন সমীকরণ মানের সূচক।

অবশিষ্টাংশের স্বতঃসম্পর্ক পরীক্ষা করা হচ্ছে।

OLS ব্যবহার করে একটি গুণগত রিগ্রেশন মডেল নির্মাণের জন্য একটি গুরুত্বপূর্ণ পূর্বশর্ত হল অন্যান্য সমস্ত পর্যবেক্ষণে বিচ্যুতির মান থেকে এলোমেলো বিচ্যুতির মানগুলির স্বাধীনতা। এটি নিশ্চিত করে যে কোনো বিচ্যুতি এবং বিশেষ করে, সন্নিহিত বিচ্যুতির মধ্যে কোনো সম্পর্ক নেই।

স্বয়ংক্রিয় সম্পর্ক (ক্রমিক সম্পর্ক) সময় (টাইম সিরিজ) বা স্থান (ক্রস সিরিজ) অনুসারে পর্যবেক্ষিত সূচকগুলির মধ্যে পারস্পরিক সম্পর্ক হিসাবে সংজ্ঞায়িত করা হয়। টাইম সিরিজ ডেটা ব্যবহার করার সময় রিগ্রেশন বিশ্লেষণে অবশিষ্টাংশের অটোকোরিলেশন (ভিন্নতা) সাধারণ এবং ক্রস-বিভাগীয় ডেটা ব্যবহার করার সময় খুব বিরল।

অর্থনৈতিক সমস্যায়, ইতিবাচক স্বতঃসম্পর্ক নেতিবাচক স্বতঃসম্পর্কের চেয়ে অনেক বেশি সাধারণ। বেশিরভাগ ক্ষেত্রে, ইতিবাচক স্বতঃসম্পর্ক নির্দেশমূলক দ্বারা সৃষ্ট হয় ধ্রুবক এক্সপোজারকিছু কারণ মডেল একাউন্টে নেওয়া হয় না.

নেতিবাচক স্বয়ংক্রিয় সম্পর্ক বলতে বোঝায় যে একটি ইতিবাচক বিচ্যুতি একটি নেতিবাচক এবং তদ্বিপরীত দ্বারা অনুসরণ করা হয়। এই পরিস্থিতি ঘটতে পারে যদি কোমল পানীয়ের চাহিদা এবং আয়ের মধ্যে একই সম্পর্ক ঋতুভিত্তিক তথ্য (শীত-গ্রীষ্ম) অনুসারে বিবেচনা করা হয়।

স্বতঃসম্পর্কের প্রধান কারণগুলির মধ্যে নিম্নলিখিতগুলি হল:

1. স্পেসিফিকেশন ত্রুটি। মডেলের কোনো গুরুত্বপূর্ণ ব্যাখ্যামূলক পরিবর্তনশীল বিবেচনায় নিতে ব্যর্থতা বা নির্ভরতার ফর্মের একটি ভুল পছন্দ সাধারণত রিগ্রেশন লাইন থেকে পর্যবেক্ষণ পয়েন্টগুলির পদ্ধতিগত বিচ্যুতির দিকে নিয়ে যায়, যা স্বতঃসম্পর্কের দিকে নিয়ে যেতে পারে।
2. জড়তা। অনেক অর্থনৈতিক সূচক(মুদ্রাস্ফীতি, বেকারত্ব, জিএনপি, ইত্যাদি) ব্যবসায়িক কার্যকলাপের ভারসাম্যহীনতার সাথে সম্পর্কিত একটি নির্দিষ্ট চক্রাকার প্রকৃতি রয়েছে। অতএব, সূচকগুলির পরিবর্তন তাত্ক্ষণিকভাবে ঘটে না, তবে একটি নির্দিষ্ট জড়তা রয়েছে।
3. মাকড়সার ওয়েব প্রভাব। অনেক উত্পাদন এবং অন্যান্য ক্ষেত্রে, অর্থনৈতিক সূচকগুলি বিলম্বের সাথে (সময়ের ব্যবধানে) অর্থনৈতিক অবস্থার পরিবর্তনের প্রতিক্রিয়া জানায়।
4. ডেটা মসৃণ করা। প্রায়শই, একটি নির্দিষ্ট দীর্ঘ সময়ের জন্য ডেটা তার উপাদান ব্যবধানে ডেটা গড় করে প্রাপ্ত হয়। এটি বিবেচনাধীন সময়ের মধ্যে ঘটে যাওয়া ওঠানামাগুলির একটি নির্দিষ্ট মসৃণতা ঘটাতে পারে, যার ফলে স্বতঃসম্পর্ক হতে পারে।

স্বতঃসম্পর্কের পরিণতিগুলি হেটেরোস্কডেস্টিসিটির পরিণতির মতোই: টি- এবং এফ-পরিসংখ্যান থেকে প্রাপ্ত উপসংহারগুলি যা রিগ্রেশন সহগ এবং সংকল্পের সহগ-এর তাত্পর্য নির্ধারণ করে তা ভুল হওয়ার সম্ভাবনা রয়েছে।

5. F-পরীক্ষা ব্যবহার করে, এটি প্রতিষ্ঠিত হয়েছিল যে সামগ্রিকভাবে ফলাফল যুক্ত রিগ্রেশন সমীকরণটি পরিসংখ্যানগতভাবে নগণ্য এবং এটি মাসিক পেনশন মূল্য y এবং জীবনযাত্রার ব্যয় x এর মধ্যে সম্পর্কের অধ্যয়নকৃত ঘটনাকে পর্যাপ্তভাবে বর্ণনা করে না।

6. একটি ইকোনোমেট্রিক মাল্টিপল লিনিয়ার রিগ্রেশন মডেল তৈরি করা হয়েছে, একটি শর্তসাপেক্ষ ফার্ম y এর নেট আয়ের পরিমাণকে মূলধন টার্নওভার x1 এবং মূলধন ব্যবহৃত x2 এর সাথে সংযুক্ত করে।

7. স্থিতিস্থাপকতা সহগ গণনা করে, এটি দেখানো হয় যে যখন মূলধনের টার্নওভার 1% দ্বারা পরিবর্তিত হয়, তখন কোম্পানির নিট আয়ের পরিমাণ 0.0008% দ্বারা পরিবর্তিত হয় এবং যখন ব্যবহৃত মূলধন 1% দ্বারা পরিবর্তিত হয়, তখন কোম্পানির নিট আয়ের পরিমাণ 0.56% দ্বারা পরিবর্তন

8. টি-পরীক্ষা ব্যবহার করে, রিগ্রেশন সহগগুলির পরিসংখ্যানগত তাত্পর্য মূল্যায়ন করা হয়েছিল যে ব্যাখ্যামূলক পরিবর্তনশীল x 1 পরিসংখ্যানগতভাবে নগণ্য এবং রিগ্রেশন সমীকরণ থেকে বাদ দেওয়া যেতে পারে, একই সময়ে ব্যাখ্যামূলক পরিবর্তনশীল x 2। পরিসংখ্যানগত ভাবে উল্লেখযোগ্য.

9. F-পরীক্ষা ব্যবহার করে, এটি প্রতিষ্ঠিত হয়েছিল যে সামগ্রিকভাবে ফলাফল যুক্ত রিগ্রেশন সমীকরণটি পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ, এবং শর্তসাপেক্ষ ফার্ম y এবং মূলধনের টার্নওভার x 1 এবং ব্যবহৃত মূলধনের মধ্যে সম্পর্কের অধ্যয়নকৃত ঘটনাকে পর্যাপ্তভাবে বর্ণনা করে। x 2।

10. একটি রৈখিক সমীকরণ দ্বারা পরিসংখ্যানগত তথ্যের আনুমানিক গড় ত্রুটি গণনা করা হয়েছিল একাধিক সংশ্লেষণ, যার পরিমাণ 29.8%। এটি দেখানো হয়েছে যে পরিসংখ্যানগত ডাটাবেসে পর্যবেক্ষণের কারণে এই ত্রুটির মাত্রা অনুমোদিত মানকে ছাড়িয়ে গেছে।

14. EXCEL ব্যবহার না করে একটি জোড়া রিগ্রেশন মডেল তৈরি করা।

ব্যবহার পরিসংখ্যানগত উপাদানসারণী 3.5 এ দেওয়া প্রয়োজন:

2. পারস্পরিক সম্পর্ক এবং সংকল্পের সূচক ব্যবহার করে সংযোগের ঘনিষ্ঠতা মূল্যায়ন করুন।

3. স্থিতিস্থাপকতা সহগ ব্যবহার করে, গুণনীয়ক বৈশিষ্ট্য এবং ফলাফলের মধ্যে সংযোগের মাত্রা নির্ধারণ করুন।

4. সংজ্ঞায়িত করুন গড় ত্রুটিঅনুমান

5. ফিশারের এফ-টেস্ট ব্যবহার করে মডেলিংয়ের পরিসংখ্যানগত নির্ভরযোগ্যতা মূল্যায়ন করুন।

টেবিল 3.5। প্রাথমিক তথ্য।

	মাথাপিছু গড় নগদ আয়ের মোট পরিমাণে আমানত, ঋণ, সার্টিফিকেট এবং বৈদেশিক মুদ্রা ক্রয়ের জন্য সঞ্চয় বাড়ানোর লক্ষ্যে নগদ আয়ের ভাগ, %	গড় মাসিক অর্জিত মজুরি, c.u.

কালুজস্কায়া
কোস্ট্রমস্কায়া
অরলোভস্কায়া
রায়জান
স্মোলেনস্কায়া

পেয়ার করা রৈখিক রিগ্রেশন সমীকরণের অজানা প্যারামিটার b 0 , b 1 নির্ধারণ করতে, আমরা সাধারণ সমীকরণের স্ট্যান্ডার্ড সিস্টেম ব্যবহার করি, যার ফর্ম রয়েছে

(3.7)

এই সিস্টেমটি সমাধান করার জন্য, প্রথমে Sx 2 এবং Sxy এর মান নির্ধারণ করা প্রয়োজন। এই মানগুলি উত্স ডেটা টেবিল থেকে নির্ধারিত হয়, এটি উপযুক্ত কলামগুলির সাথে পরিপূরক করে (সারণী 3.6)।

টেবিল 3.6। রিগ্রেশন সহগ গণনার দিকে।

তারপর সিস্টেম (3.7) ফর্ম নেয়

প্রথম সমীকরণ থেকে b 0 প্রকাশ করা এবং দ্বিতীয় সমীকরণে ফলস্বরূপ অভিব্যক্তি প্রতিস্থাপন করে আমরা পাই:

টার্ম-বাই-টার্ম গুন সঞ্চালন এবং বন্ধনী খোলার মাধ্যমে আমরা পাই:

অবশেষে, গড় মাসিক অর্জিত মজুরি x এর সাথে সঞ্চয় y বাড়ানোর লক্ষ্যে জনসংখ্যার নগদ আয়ের ভাগের মানকে সংযুক্ত করে যুক্ত রৈখিক রিগ্রেশন সমীকরণটির ফর্ম রয়েছে:

সুতরাং, পেয়ারড রৈখিক রিগ্রেশনের সমীকরণটি তৈরি করা হলে, আমরা নির্ভরতা অনুসারে রৈখিক পারস্পরিক সম্পর্ক সহগ নির্ধারণ করি:

সংশ্লিষ্ট প্যারামিটারের মান বিচ্যুতির মান কোথায়।

নির্ভরতা (3.9) থেকে রৈখিক পারস্পরিক সম্পর্ক সহগ গণনা করতে, আমরা মধ্যবর্তী গণনা করি।

পাওয়া প্যারামিটারের মানগুলিকে এক্সপ্রেশনে প্রতিস্থাপন করে (3.9) আমরা পাই

রৈখিক পারস্পরিক সম্পর্ক সহগের প্রাপ্ত মান জনসংখ্যার নগদ আয়ের ভাগের মধ্যে একটি দুর্বল বিপরীত পরিসংখ্যানগত সম্পর্কের উপস্থিতি নির্দেশ করে যার লক্ষ্য সঞ্চয় y এবং গড় মাসিক অর্জিত মজুরির পরিমাণ x বৃদ্ধি করা।

নির্ণয়ের সহগ হল , যার মানে হল যে শুধুমাত্র 9.6% ব্যাখ্যামূলক চলক x-কে y-এ প্রত্যাবর্তন করে ব্যাখ্যা করা হয়েছে। তদনুসারে, 90.4% এর সমান 1 মানটি ইকোনোমেট্রিক মডেলে বিবেচনা না করা অন্যান্য সমস্ত ব্যাখ্যামূলক ভেরিয়েবলের প্রভাবের কারণে সৃষ্ট পরিবর্তনশীল y-এর পরিবর্তনের ভাগকে চিহ্নিত করে।

স্থিতিস্থাপকতা সহগ হল

ফলস্বরূপ, যখন গড় মাসিক অর্জিত মজুরি 1% পরিবর্তিত হয়, তখন সঞ্চয় বাড়ানোর লক্ষ্যে জনসংখ্যার নগদ আয়ের অংশও 1% হ্রাস পায় এবং মজুরি বৃদ্ধির সাথে সাথে নগদ আয়ের অংশ হ্রাস পায়। জনসংখ্যা সঞ্চয় বৃদ্ধির লক্ষ্যে। এই উপসংহারটি সাধারণ জ্ঞানের বিরোধিতা করে এবং শুধুমাত্র উত্পন্ন গাণিতিক মডেলের ভুল দ্বারা ব্যাখ্যা করা যেতে পারে।

গড় আনুমানিক ত্রুটি গণনা করা যাক।

সারণি 3.7। গড় অনুমান ত্রুটির গণনার দিকে।

প্রাপ্ত মান (12...15)% ছাড়িয়ে গেছে, যা ইকোনোমেট্রিক মডেল তৈরি করা প্রকৃত ডেটা থেকে গণনা করা ডেটার গড় বিচ্যুতির তাত্পর্য নির্দেশ করে।

পরিসংখ্যানগত মডেলিংয়ের নির্ভরযোগ্যতা ফিশারের এফ-টেস্টের উপর ভিত্তি করে সঞ্চালিত হবে। ফিশার মানদণ্ড F ক্যালকের তাত্ত্বিক মানটি সূত্র অনুসারে এক ডিগ্রি স্বাধীনতার জন্য গণনা করা ফ্যাক্টর এবং অবশিষ্ট বিচ্ছুরণের মানগুলির অনুপাত থেকে নির্ধারিত হয়

যেখানে n হল পর্যবেক্ষণের সংখ্যা;

m হল ব্যাখ্যামূলক ভেরিয়েবলের সংখ্যা (উদাহরণস্বরূপ m m =1 বিবেচনা করা হচ্ছে)।

সমালোচনামূলক মান F ক্রিট পরিসংখ্যান সারণী থেকে নির্ধারিত হয় এবং একটি তাৎপর্য স্তরের জন্য a = 0.05 সমান 10.13। যেহেতু F গণনা করা হয়েছে

15. EXCEL ব্যবহার না করে একাধিক রিগ্রেশন মডেল তৈরি করা।

সারণি 3.8 এ প্রদত্ত পরিসংখ্যানগত উপাদান ব্যবহার করে আপনাকে অবশ্যই:

1. নির্মাণ একঘাত সমীকরণএকাধিক রিগ্রেশন, এর পরামিতিগুলির অর্থনৈতিক অর্থ ব্যাখ্যা করুন।

2. গড় (সাধারণ) স্থিতিস্থাপকতা সহগ ব্যবহার করে ফ্যাক্টর এবং ফলাফলের বৈশিষ্ট্যের মধ্যে সম্পর্কের ঘনিষ্ঠতার একটি তুলনামূলক মূল্যায়ন দিন।

3. হার পরিসংখ্যানিক গুরুত্বটি-টেস্ট ব্যবহার করে রিগ্রেশন কোফিসিয়েন্ট এবং এফ-টেস্ট ব্যবহার করে সমীকরণের অ-তাৎপর্যের শূন্য হাইপোথিসিস।

4. আনুমানিক গড় ত্রুটি নির্ধারণ করে সমীকরণের গুণমান মূল্যায়ন করুন।

সারণি 3.8। প্রাথমিক তথ্য।

নেট আয়, মিলিয়ন মার্কিন ডলার	মূলধন টার্নওভার, মিলিয়ন মার্কিন ডলার	ব্যবহৃত মূলধন, মিলিয়ন মার্কিন ডলার

একাধিক রৈখিক রিগ্রেশন সমীকরণের অজানা পরামিতি b 0, b 1, b 2 নির্ধারণ করতে, আমরা সাধারণ সমীকরণের স্ট্যান্ডার্ড সিস্টেম ব্যবহার করি, যার ফর্ম রয়েছে

(3.11)

এই সিস্টেমটি সমাধান করার জন্য, প্রথমে Sx 1 2, Sx 2 2, Sx 1 y, Sx 2 y, Sx 1 x 2 পরিমাণের মান নির্ধারণ করা প্রয়োজন। এই মানগুলি উত্স ডেটা টেবিল থেকে নির্ধারিত হয়, এটি উপযুক্ত কলামগুলির সাথে পরিপূরক করে (সারণী 3.9)।

টেবিল 3.9। রিগ্রেশন সহগ গণনার দিকে।

তারপর সিস্টেম (3.11) ফর্ম নেয়

এই সিস্টেমটি সমাধান করার জন্য, আমরা গাউস পদ্ধতিটি ব্যবহার করব, যার মধ্যে রয়েছে ক্রমানুসারে অজানাগুলি নির্মূল করা: সিস্টেমের প্রথম সমীকরণটিকে 10 দ্বারা ভাগ করুন, তারপরে 370.6 দ্বারা গুনিত করুন এবং সিস্টেমের দ্বিতীয় সমীকরণ থেকে এটি বিয়োগ করুন, তারপর গুণ করুন ফলাফলের সমীকরণ 158.20 দ্বারা এবং সিস্টেমের তৃতীয় সমীকরণ থেকে বিয়োগ করুন। সিস্টেমের রূপান্তরিত দ্বিতীয় এবং তৃতীয় সমীকরণের জন্য নির্দিষ্ট অ্যালগরিদম পুনরাবৃত্তি করে, আমরা পাই:

Þ Þ

Þ .

রূপান্তরের পরে আমাদের আছে:

তারপর মূলধনের টার্নওভার এবং লিনিয়ার মাল্টিপল রিগ্রেশন সমীকরণের আকারে ব্যবহৃত মূলধনের উপর নেট আয়ের চূড়ান্ত নির্ভরতার ফর্ম রয়েছে:

ফলস্বরূপ অর্থনৈতিক সমীকরণ থেকে এটি দেখা যায় যে ব্যবহৃত মূলধন বৃদ্ধির সাথে, নেট আয় বৃদ্ধি পায় এবং বিপরীতভাবে, মূলধনের টার্নওভার বৃদ্ধির সাথে, নিট আয় হ্রাস পায়। উপরন্তু, রিগ্রেশন সহগ যত বড় হবে, নির্ভরশীল ভেরিয়েবলের উপর ব্যাখ্যামূলক চলকের প্রভাব তত বেশি। বিবেচনাধীন উদাহরণে, রিগ্রেশন সহগের মান সহগের মানের চেয়ে বেশি, তাই ব্যবহৃত মূলধন মূলধন টার্নওভারের তুলনায় নিট আয়ের উপর উল্লেখযোগ্যভাবে বেশি প্রভাব ফেলে। এই উপসংহারটি পরিমাপ করতে, আমরা আংশিক স্থিতিস্থাপকতা সহগ নির্ধারণ করব।

ফলাফলের বিশ্লেষণে দেখা যায় যে ব্যবহৃত মূলধন নিট আয়ের উপর বেশি প্রভাব ফেলে। সুতরাং, বিশেষ করে, 1% দ্বারা ব্যবহৃত মূলধন বৃদ্ধির সাথে, নিট আয় 1.17% বৃদ্ধি পায়। একই সময়ে, মূলধনের টার্নওভার 1% বৃদ্ধির সাথে, নিট আয় 0.5% হ্রাস পায়।

ফিশার মানদণ্ড F ক্যালকের তাত্ত্বিক মান।

সমালোচনামূলক মানের F ক্রিটের মান পরিসংখ্যান সারণী থেকে নির্ধারিত হয় এবং a = 0.05 এর তাৎপর্য স্তরের জন্য 4.74 এর সমান। যেহেতু F calc > F crit, নাল হাইপোথিসিস প্রত্যাখ্যান করা হয় এবং ফলস্বরূপ রিগ্রেশন সমীকরণটি পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ হিসাবে গৃহীত হয়।

রিগ্রেশন সহগ এবং টি-মাপদণ্ডের পরিসংখ্যানগত তাত্পর্য মূল্যায়ন এই সহগগুলির সংখ্যাগত মানকে তাদের এলোমেলো ত্রুটিগুলির মাত্রার সাথে এবং সম্পর্ক অনুসারে তুলনা করার জন্য নেমে আসে:

টি-পরিসংখ্যানের তাত্ত্বিক মান গণনা করার জন্য কার্যকরী সূত্র হল:

, (3.13)

যেখানে জোড়া পারস্পরিক সম্পর্ক সহগ এবং একাধিক পারস্পরিক সম্পর্ক সহগ নির্ভরতা থেকে গণনা করা হয়:

তারপরে টি-পরিসংখ্যানের তাত্ত্বিক (গণনা করা) মানগুলি যথাক্রমে সমান:

কারন সমালোচনামূলক মান t-পরিসংখ্যান তাৎপর্য স্তরের জন্য পরিসংখ্যান সারণী থেকে নির্ধারিত a=0.05 সমান t crit =2.36 পরম মান = - 1.798 এর চেয়ে বড়, তাহলে শূন্য অনুমান প্রত্যাখ্যান করা হয় না এবং ব্যাখ্যামূলক পরিবর্তনশীল x 1 পরিসংখ্যানগতভাবে নগণ্য এবং বাদ দেওয়া যেতে পারে রিগ্রেশন সমীকরণ থেকে। বিপরীতভাবে, দ্বিতীয় রিগ্রেশন সহগ > t ক্রিট (3.3 > 2.36) এর জন্য এবং ব্যাখ্যামূলক পরিবর্তনশীল x 2 পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ।

গড় আনুমানিক ত্রুটি গণনা করা যাক।

টেবিল 3.10। গড় অনুমান ত্রুটির গণনার দিকে।

তারপর গড় আনুমানিক ত্রুটি হয়

প্রাপ্ত মান (12…15)% এর সমান অনুমোদিত সীমা অতিক্রম করে না।

16. পরিমাপ তত্ত্বের বিকাশের ইতিহাস

টিআই প্রথম সাইকোফিজিক্যাল পরিমাপের একটি তত্ত্ব হিসাবে বিকশিত হয়েছিল। যুদ্ধোত্তর প্রকাশনাগুলিতে, আমেরিকান মনোবিজ্ঞানী এস.এস. স্টিভেনস পরিমাপের স্কেলগুলিতে মনোনিবেশ করেছিলেন। 20 শতকের দ্বিতীয়ার্ধে। টিআই এর প্রয়োগের সুযোগ দ্রুত প্রসারিত হচ্ছে। 50 এর দশকে মার্কিন যুক্তরাষ্ট্রে প্রকাশিত "মনস্তাত্ত্বিক বিজ্ঞানের এনসাইক্লোপিডিয়া" এর একটি ভলিউমকে "সাইকোলজিক্যাল মেজারমেন্টস" বলা হয়। এই প্রকাশনার লেখকরা TI এর পরিধিকে সাইকোফিজিক্স থেকে সাধারণভাবে সাইকোলজিতে প্রসারিত করেছেন। এই সংগ্রহের নিবন্ধে, "মাপের তত্ত্বের মৌলিক বিষয়গুলি," উপস্থাপনাটি ছিল একটি বিমূর্ত গাণিতিক স্তরে, প্রয়োগের কোনো নির্দিষ্ট ক্ষেত্রের উল্লেখ ছাড়াই। এতে, "সংখ্যাসূচকের সাথে সম্পর্কযুক্ত অভিজ্ঞতামূলক সিস্টেমের সমতুল্যতা" (এখানে এই গাণিতিক পদগুলিতে যাওয়ার দরকার নেই) উপর জোর দেওয়া হয়েছিল এবং এসএস-এর কাজের তুলনায় উপস্থাপনার গাণিতিক জটিলতা বৃদ্ধি পেয়েছে। স্টিভেনস।

টিআই-এর প্রথম গার্হস্থ্য নিবন্ধগুলির মধ্যে একটিতে (60 এর দশকের শেষের দিকে), এটি প্রতিষ্ঠিত হয়েছিল যে পরীক্ষার বিষয়গুলি মূল্যায়ন করার সময় বিশেষজ্ঞদের দ্বারা নির্ধারিত পয়েন্টগুলি, একটি নিয়ম হিসাবে, একটি অর্ডিনাল স্কেলে পরিমাপ করা হয়। 70 এর দশকের গোড়ার দিকে প্রদর্শিত কাজগুলি টিআই ব্যবহারের সুযোগের একটি উল্লেখযোগ্য সম্প্রসারণ ঘটায়। এটি শিক্ষাগত গুণমান (ছাত্রদের জ্ঞানের গুণমান পরিমাপ), সিস্টেম গবেষণায় এবং বিভিন্ন তাত্ত্বিক সমস্যায় প্রয়োগ করা হয়েছে বিশেষজ্ঞের মূল্যায়ন, পণ্যের গুণমান সূচকের সমষ্টির জন্য, সমাজতাত্ত্বিক গবেষণায়, ইত্যাদি।

টিআই-এর দুটি প্রধান সমস্যা হিসাবে, নির্দিষ্ট ডেটা পরিমাপের জন্য স্কেলের ধরণ প্রতিষ্ঠার পাশাপাশি, ডেটা বিশ্লেষণ অ্যালগরিদমগুলির জন্য একটি অনুসন্ধান এগিয়ে দেওয়া হয়েছিল, যার ফলাফল স্কেলের কোনও গ্রহণযোগ্য রূপান্তরের সাথে পরিবর্তিত হয় না (অর্থাৎ, সম্মানের সাথে অপরিবর্তনীয় এই রূপান্তরের জন্য) ভূগোলের সাধারণ স্কেলগুলি হল বিউফোর্ট স্কেল বায়ু ("শান্ত", "হালকা বাতাস", "মধ্যম বায়ু" ইত্যাদি), ভূমিকম্প শক্তির স্কেল। স্পষ্টতই, এটা বলা যাবে না যে 2 মাত্রার ভূমিকম্প (ছাদের নীচে একটি বাতি জ্বলছে) 10 মাত্রার ভূমিকম্পের (পৃথিবীর পৃষ্ঠের সমস্ত কিছুর সম্পূর্ণ ধ্বংস) থেকে ঠিক 5 গুণ দুর্বল।

মেডিসিনে, অর্ডিনাল স্কেল হল হাইপারটেনশনের পর্যায়ের স্কেল (মায়াসনিকভের মতে), হার্ট ফেইলিউরের মাত্রার স্কেল (স্ট্রাজেস্কো-ভাসিলেনকো-ল্যাং অনুসারে), করোনারি অপ্রতুলতার তীব্রতার স্কেল (ফগেলসনের মতে) ইত্যাদি। . এই সমস্ত স্কেল নিম্নলিখিত স্কিম অনুযায়ী নির্মিত হয়: কোন রোগ সনাক্ত করা হয়নি; রোগের প্রথম পর্যায়ে; দ্বিতীয় পর্যায়; তৃতীয় পর্যায়... কখনও কখনও 1a, 16, ইত্যাদি পর্যায়গুলিকে আলাদা করা হয় প্রতিটি পর্যায়ের একটি বিশেষ বৈশিষ্ট্য রয়েছে। অক্ষমতা গোষ্ঠীগুলিকে বর্ণনা করার সময়, সংখ্যাগুলি বিপরীত ক্রমে ব্যবহার করা হয়: সবচেয়ে গুরুতর হল প্রথম অক্ষমতা গোষ্ঠী, তারপরে দ্বিতীয়টি, সবচেয়ে হালকাটি তৃতীয়টি।

বাড়ির সংখ্যাগুলিও একটি সাধারণ স্কেলে পরিমাপ করা হয় - তারা দেখায় যে বাড়িগুলি রাস্তার ধারে কী ক্রমে অবস্থিত। একজন লেখকের সংগৃহীত কাজের ভলিউম নম্বর বা এন্টারপ্রাইজ আর্কাইভের কেস নম্বরগুলি সাধারণত তাদের সৃষ্টির কালানুক্রমিক ক্রমে যুক্ত থাকে।

পণ্য এবং পরিষেবার গুণমান মূল্যায়ন করার সময়, তথাকথিত কোয়ালিমেট্রিতে অর্ডিনাল স্কেল জনপ্রিয় (আক্ষরিক অনুবাদ - গুণমান পরিমাপ)। যথা, উৎপাদনের একটি ইউনিটকে পাসযোগ্য বা অযোগ্য হিসাবে মূল্যায়ন করা হয়। আরও পুঙ্খানুপুঙ্খ বিশ্লেষণের জন্য, তিনটি গ্রেডেশন সহ একটি স্কেল ব্যবহার করা হয়: উল্লেখযোগ্য ত্রুটি রয়েছে - কেবলমাত্র ছোটখাটো ত্রুটি রয়েছে - কোনও ত্রুটি নেই। কখনও কখনও চারটি গ্রেডেশন ব্যবহার করা হয়: গুরুতর ত্রুটি রয়েছে (এটি ব্যবহার করা অসম্ভব করে তোলে) - উল্লেখযোগ্য ত্রুটি রয়েছে - কেবলমাত্র ছোটখাটো ত্রুটি রয়েছে - কোনও ত্রুটি নেই। পণ্যের গ্রেডিংয়ের একই অর্থ রয়েছে - প্রিমিয়াম, প্রথম গ্রেড, দ্বিতীয় গ্রেড,...

পরিবেশগত প্রভাবগুলি মূল্যায়ন করার সময়, প্রথম, সর্বাধিক সাধারণ মূল্যায়ন সাধারণত নিয়মানুযায়ী হয়, উদাহরণস্বরূপ: প্রাকৃতিক পরিবেশ স্থিতিশীল - প্রাকৃতিক পরিবেশ নিপীড়িত (অপতন)। পরিবেশগত-চিকিৎসা স্কেল অনুরূপ: মানুষের স্বাস্থ্যের উপর কোন উচ্চারিত প্রভাব নেই - স্বাস্থ্যের উপর একটি নেতিবাচক প্রভাব উল্লেখ করা হয়েছে।

অর্ডিনাল স্কেল অন্যান্য ক্ষেত্রেও ব্যবহৃত হয়। অর্থনীতিতে, এগুলি মূলত বিশেষজ্ঞের মূল্যায়নের বিভিন্ন পদ্ধতি।

সমস্ত পরিমাপের স্কেল দুটি গ্রুপে বিভক্ত - গুণগত বৈশিষ্ট্যের স্কেল এবং পরিমাণগত বৈশিষ্ট্যের স্কেল। অর্ডিনাল স্কেল এবং নামকরণ স্কেল হল গুণগত বৈশিষ্ট্যগুলির প্রধান স্কেল, তাই অনেক নির্দিষ্ট ক্ষেত্রে গুণগত বিশ্লেষণের ফলাফলগুলিকে এই স্কেলের পরিমাপ হিসাবে বিবেচনা করা যেতে পারে। পরিমাণগত বৈশিষ্ট্যের স্কেলগুলি হল অন্তরের স্কেল, অনুপাত, পার্থক্য, পরম। একটি ব্যবধান স্কেল ব্যবহার করে, সম্ভাব্য শক্তির মাত্রা বা সরলরেখার একটি বিন্দুর স্থানাঙ্ক পরিমাপ করা হয়। এই ক্ষেত্রে, প্রাকৃতিক উত্স বা পরিমাপের প্রাকৃতিক একক স্কেলে চিহ্নিত করা যায় না। গবেষককে অবশ্যই সূচনা বিন্দু নির্ধারণ করতে হবে এবং পরিমাপের এককটি নিজেই বেছে নিতে হবে। ব্যবধান স্কেলে গ্রহণযোগ্য রূপান্তরগুলি হল রৈখিক ক্রমবর্ধমান রূপান্তর, যেমন রৈখিক ফাংশন। তাপমাত্রা স্কেল সেলসিয়াস এবং ফারেনহাইট ঠিক এই নির্ভরতা দ্বারা সংযুক্ত: °C = 5/9 (°F - 32), যেখানে °C হল সেলসিয়াস স্কেলে তাপমাত্রা (ডিগ্রীতে), এবং °F হল ফারেনহাইটের তাপমাত্রা স্কেল.

পরিমাণগত স্কেলগুলির মধ্যে, বিজ্ঞান এবং অনুশীলনে সর্বাধিক সাধারণ অনুপাত স্কেল। তাদের একটি প্রাকৃতিক রেফারেন্স পয়েন্ট আছে - শূন্য, i.e. পরিমাণের অনুপস্থিতি, কিন্তু পরিমাপের কোন প্রাকৃতিক একক নেই। বেশিরভাগ ভৌত ইউনিট অনুপাতের স্কেলে পরিমাপ করা হয়: শরীরের ভর, দৈর্ঘ্য, চার্জ, সেইসাথে অর্থনীতিতে দাম। অনুপাত স্কেলে গ্রহণযোগ্য রূপান্তর একই রকম (শুধুমাত্র স্কেল পরিবর্তন করা)। অন্য কথায়, একটি বিনামূল্যের মেয়াদ ছাড়াই রৈখিক ক্রমবর্ধমান রূপান্তর, উদাহরণস্বরূপ, একটি নির্দিষ্ট হারে একটি মুদ্রা থেকে অন্য মুদ্রায় মূল্য রূপান্তর করা। ধরুন আমরা রুবেলে দাম ব্যবহার করে দুটি বিনিয়োগ প্রকল্পের অর্থনৈতিক দক্ষতা তুলনা করি। প্রথম প্রকল্পটি দ্বিতীয়টির চেয়ে ভাল হতে দিন। এখন একটি নির্দিষ্ট রূপান্তর হার ব্যবহার করে চীনা মুদ্রা - ইউয়ানে স্যুইচ করা যাক। স্পষ্টতই, প্রথম প্রকল্পটি আবার দ্বিতীয়টির চেয়ে বেশি লাভজনক হওয়া উচিত। যাইহোক, গণনার অ্যালগরিদমগুলি স্বয়ংক্রিয়ভাবে নিশ্চিত করে না যে এই শর্তটি পূরণ হয়েছে এবং এটি পূরণ হয়েছে কিনা তা পরীক্ষা করা প্রয়োজন। গড় মানগুলির জন্য এই জাতীয় পরীক্ষার ফলাফলগুলি নীচে বর্ণিত হয়েছে।

একটি পার্থক্য স্কেল পরিমাপের একটি প্রাকৃতিক একক আছে, কিন্তু কোন প্রাকৃতিক রেফারেন্স বিন্দু নেই। সময়কে পার্থক্যের স্কেলে পরিমাপ করা হয়, যদি বছরকে (বা দিন - দুপুর থেকে দুপুর পর্যন্ত) পরিমাপের একটি প্রাকৃতিক একক হিসাবে নেওয়া হয় এবং ব্যবধানের স্কেলে সাধারণ ক্ষেত্রে. জ্ঞানের বর্তমান স্তরে, একটি স্বাভাবিক শুরু বিন্দু নির্দেশ করা অসম্ভব। বিভিন্ন লেখক বিভিন্ন উপায়ে বিশ্বের সৃষ্টির তারিখ গণনা করেন, সেইসাথে খ্রিস্টের জন্মের মুহূর্তও।

শুধুমাত্র পরম স্কেলের জন্য পরিমাপের ফলাফল হল শব্দের স্বাভাবিক অর্থে সংখ্যা, উদাহরণস্বরূপ, একটি ঘরে মানুষের সংখ্যা। একটি পরম স্কেলের জন্য, শুধুমাত্র একটি পরিচয় রূপান্তর অনুমোদিত।

জ্ঞানের সংশ্লিষ্ট ক্ষেত্রের বিকাশের প্রক্রিয়ায়, স্কেলের ধরন পরিবর্তিত হতে পারে। সুতরাং, প্রথমে তাপমাত্রা একটি অর্ডিনাল স্কেলে পরিমাপ করা হয়েছিল (ঠান্ডা - উষ্ণ)। তারপর - ব্যবধান অনুযায়ী (সেলসিয়াস, ফারেনহাইট, রেউমুর স্কেল)। অবশেষে, পরম শূন্য আবিষ্কারের পরে, তাপমাত্রা একটি অনুপাত স্কেলে (কেলভিন স্কেল) পরিমাপ করা যেতে পারে। এটি উল্লেখ করা উচিত যে কখনও কখনও বিশেষজ্ঞদের মধ্যে মতবিরোধ রয়েছে যে কোন স্কেলগুলি পরিমাপ করা নির্দিষ্ট বাস্তব মানগুলি বিবেচনা করতে ব্যবহার করা উচিত। অন্য কথায়, পরিমাপ প্রক্রিয়ার মধ্যে স্কেলের ধরন নির্ধারণ করাও অন্তর্ভুক্ত থাকে (একটি নির্দিষ্ট ধরণের স্কেল বেছে নেওয়ার যুক্তি সহ)। তালিকাভুক্ত ছয়টি প্রধান ধরনের স্কেল ছাড়াও, অন্যান্য স্কেল কখনও কখনও ব্যবহার করা হয়।

17. অপরিবর্তনীয় অ্যালগরিদম এবং গড় মান।

আসুন TI-তে ডেটা বিশ্লেষণ অ্যালগরিদমের জন্য প্রধান প্রয়োজনীয়তা তৈরি করি: একটি নির্দিষ্ট ধরণের স্কেলে পরিমাপ করা ডেটার ভিত্তিতে আঁকা উপসংহারগুলি যখন এই ডেটার পরিমাপের স্কেল অনুমোদিত হয় তখন পরিবর্তন করা উচিত নয়। অন্য কথায়, অনুমানগুলি অবশ্যই বৈধ স্কেল রূপান্তরের অধীনে অপরিবর্তনীয় হতে হবে।

সুতরাং, পরিমাপ তত্ত্বের প্রধান লক্ষ্যগুলির মধ্যে একটি হল বাস্তব বস্তুতে সংখ্যাসূচক মান নির্ধারণ করার সময় গবেষকের বিষয়গততার সাথে লড়াই করা। এইভাবে, দূরত্বগুলি আরশিন, মিটার, মাইক্রন, মাইল, পার্সেক এবং পরিমাপের অন্যান্য এককে পরিমাপ করা যেতে পারে। ভর (ওজন) - পুড, কিলোগ্রাম, পাউন্ড ইত্যাদিতে। পণ্য ও পরিষেবার দাম ইউয়ান, রুবেল, টেঙ্গে, রিভনিয়া, ল্যাটস, ক্রুন, মার্কস, মার্কিন ডলার এবং অন্যান্য মুদ্রায় নির্দেশিত হতে পারে (নির্দিষ্ট রূপান্তর হার সাপেক্ষে)। আসুন আমরা একটি অত্যন্ত গুরুত্বপূর্ণ বিষয়ের উপর জোর দিই, যদিও বেশ সুস্পষ্ট, সত্য: পরিমাপের এককের পছন্দ গবেষকের উপর নির্ভর করে, যেমন বিষয়ী. পরিসংখ্যানগত উপসংহারগুলি বাস্তবতার জন্য পর্যাপ্ত হতে পারে শুধুমাত্র যখন তারা পরিমাপের এককের উপর নির্ভর করে না যে গবেষকরা পছন্দ করেন, যখন তারা স্কেলের অনুমতিযোগ্য রূপান্তরের ক্ষেত্রে অপরিবর্তনীয় থাকে। ইকোনোমেট্রিক ডেটা বিশ্লেষণের জন্য অনেক অ্যালগরিদমের মধ্যে, মাত্র কয়েকটি এই শর্তটি পূরণ করে। গড় মান তুলনা করে দেখাই যাক।

X 1, X 2,.., X n ভলিউম n এর নমুনা হতে দিন। পাটিগণিত গড় প্রায়ই ব্যবহৃত হয়। গাণিতিক গড় ব্যবহার এতটাই সাধারণ যে শব্দটির দ্বিতীয় শব্দটি প্রায়শই বাদ দেওয়া হয় এবং লোকেরা নির্দিষ্ট অর্থনৈতিক ডেটার জন্য গড় বেতন, গড় আয় এবং অন্যান্য গড় সম্পর্কে কথা বলে, যার অর্থ "গড়" দ্বারা গাণিতিক গড়। এই ঐতিহ্য ভুল সিদ্ধান্তের দিকে নিয়ে যেতে পারে। একটি অনুমানমূলক এন্টারপ্রাইজের কর্মীদের গড় বেতন (গড় আয়) গণনার উদাহরণ ব্যবহার করে এটি দেখাই। 100 জন শ্রমিকের মধ্যে মাত্র 5 জনের বেতন আছে যা এর চেয়ে বেশি, এবং বাকি 95 জনের বেতন গাণিতিক গড় থেকে উল্লেখযোগ্যভাবে কম। কারণটি সুস্পষ্ট - একজন ব্যক্তির বেতন - সাধারণ পরিচালক - 95 জন কর্মী - স্বল্প-দক্ষ এবং উচ্চ দক্ষ কর্মী, প্রকৌশলী এবং অফিস কর্মীদের বেতন ছাড়িয়ে গেছে। পরিস্থিতিটি একটি হাসপাতালের একটি পরিচিত গল্পে বর্ণিত ঘটনাটির স্মরণ করিয়ে দেয় যেখানে 10 জন রোগী রয়েছে, যাদের মধ্যে 9 জনের তাপমাত্রা 40 ডিগ্রি সেলসিয়াস এবং একজন ইতিমধ্যেই ভুগছেন, 0 ডিগ্রি তাপমাত্রায় মর্গে শুয়ে আছেন। গ. এদিকে, হাসপাতালের গড় তাপমাত্রা 36 ডিগ্রি সেলসিয়াস - এটি ভাল হতে পারে না!

এইভাবে, গাণিতিক গড় শুধুমাত্র মোটামুটি সমজাতীয় জনসংখ্যার জন্য ব্যবহার করা যেতে পারে (এক দিক বা অন্য দিকে বড় বাহ্যিক ছাড়া)। মজুরি বর্ণনা করতে কোন গড় ব্যবহার করা উচিত? মধ্যমা ব্যবহার করা খুবই স্বাভাবিক - 50 তম এবং 51 তম কর্মচারীদের গাণিতিক গড়, যদি তাদের বেতননন-ডিসেন্ডিং ক্রমে সাজানো। প্রথমে 40 জন স্বল্প-দক্ষ শ্রমিকের বেতন, এবং তারপর - 41 তম থেকে 70 তম কর্মী - উচ্চ দক্ষ শ্রমিকদের বেতন। ফলস্বরূপ, মধ্যমা তাদের উপর বিশেষভাবে পড়ে এবং 200 এর সমান। 50 জন শ্রমিকের জন্য, বেতন 200-এর বেশি হয় না, এবং 50-এর জন্য কমপক্ষে 200, তাই মধ্যমাটি "কেন্দ্র" দেখায় যার চারপাশে অধ্যয়ন করা মানগুলির বেশিরভাগ অংশ দলবদ্ধ করা হয়। আরেকটি গড় মান হল মোড, সবচেয়ে ঘন ঘন ঘটমান মান। বিবেচনাধীন ক্ষেত্রে, এগুলি নিম্ন-দক্ষ শ্রমিকদের মজুরি, অর্থাৎ 100. সুতরাং, বেতন বর্ণনা করার জন্য আমাদের তিনটি গড় মান আছে - মোড (100 ইউনিট), মধ্যক (200 ইউনিট) এবং গাণিতিক গড় (400 ইউনিট)।

বাস্তব জীবনে পরিলক্ষিত আয় এবং মজুরি বণ্টনের জন্য, একই প্যাটার্নটি সত্য: মোডটি মাঝারি থেকে কম, এবং মধ্যমাটি গাণিতিক গড় থেকে কম।

অর্থনীতিতে গড় কেন ব্যবহৃত হয়? গড় ব্যবহার করে জনসংখ্যার তুলনা করার জন্য সাধারণত সংখ্যার সংগ্রহকে একটি একক সংখ্যা দিয়ে প্রতিস্থাপন করা। উদাহরণ স্বরূপ, Y 1, Y 2,..., Y n একটি বিশেষজ্ঞের মূল্যায়নের একটি সেট হতে দিন যা দক্ষতার একটি বস্তুকে "প্রদত্ত" (উদাহরণস্বরূপ, একটি কোম্পানির কৌশলগত উন্নয়নের বিকল্পগুলির মধ্যে একটি), Z 1 , Z 2,..., Z n -সেকেন্ড (এই বিকাশের অন্য সংস্করণ)। এই জনসংখ্যার তুলনা কিভাবে? স্পষ্টতই, সবচেয়ে সহজ উপায় হল গড় মান।

গড় গণনা কিভাবে? পরিচিত বিভিন্ন ধরনেরগড় মান: গাণিতিক গড়, মধ্যমা, মোড, জ্যামিতিক গড়, হারমোনিক গড়, দ্বিঘাত গড়। আমাদের আপনাকে মনে করিয়ে দেওয়া যাক সাধারণ ধারণাগড় মান 19 শতকের প্রথমার্ধের একজন ফরাসি গণিতবিদ দ্বারা প্রবর্তিত হয়েছিল। শিক্ষাবিদ ও. কচি। এটি নিম্নরূপ: গড় মান হল যেকোনো ফাংশন Ф(Х 1, Х 2,..., Х n) যেমন সবার জন্য সম্ভাব্য মানআর্গুমেন্ট, এই ফাংশনের মান X 1, X 2,..., X n সংখ্যাগুলির সর্বনিম্ন থেকে কম নয় এবং এই সংখ্যাগুলির সর্বাধিকের চেয়ে বেশি নয়৷ উপরে তালিকাভুক্ত সব ধরনের গড় হল Cauchy গড়।

একটি গ্রহণযোগ্য স্কেল রূপান্তরের সাথে, গড় মান স্পষ্টতই পরিবর্তিত হয়। কিন্তু কোনটির জন্য জনসংখ্যার গড় বেশি এবং কোনটির জন্য এটি কম সে সম্পর্কে উপসংহারগুলি পরিবর্তন করা উচিত নয় (টিআই-তে প্রধান প্রয়োজনীয়তা হিসাবে গৃহীত সিদ্ধান্তের পরিবর্তনের প্রয়োজনীয়তা অনুসারে)। আসুন আমরা গড় মানগুলির প্রকারের জন্য অনুসন্ধানের সংশ্লিষ্ট গাণিতিক সমস্যাটি প্রণয়ন করি, যার তুলনার ফলাফল গ্রহণযোগ্য স্কেল রূপান্তরের ক্ষেত্রে স্থিতিশীল।

ধরা যাক Ф(Х 1 Х 2,..., Х n) কচি গড়। প্রথম জনসংখ্যার গড় দ্বিতীয় জনসংখ্যার গড় থেকে কম হোক: তারপরে, টিআই অনুসারে, গড় তুলনা করার ফলাফলের স্থায়িত্বের জন্য, এটি প্রয়োজনীয় যে কোনও গ্রহণযোগ্য রূপান্তর জিতে গ্রহণযোগ্য রূপান্তরের গ্রুপ থেকে সংশ্লিষ্ট স্কেল এটি সত্য যে প্রথম জনসংখ্যা থেকে রূপান্তরিত মানগুলির গড় দ্বিতীয় সেটের রূপান্তরিত মানগুলির গড় থেকেও কম। অধিকন্তু, প্রণয়নকৃত শর্তটি অবশ্যই যেকোন দুটি সেট Y 1, Y 2,...,Y n এবং Z 1, Z 2,..., Z n এবং প্রত্যাহারযোগ্য যে কোনো গ্রহণযোগ্য রূপান্তরের জন্য সত্য হতে হবে। আমরা গড় মানকে বলি যেগুলি প্রণয়নকৃত শর্ত পূরণ করে গ্রহণযোগ্য (উপযুক্ত স্কেলে)। TI এর মতে, বিশেষজ্ঞের মতামত এবং বিবেচনাধীন স্কেলে পরিমাপ করা অন্যান্য ডেটা বিশ্লেষণ করার সময় শুধুমাত্র এই ধরনের গড় ব্যবহার করা যেতে পারে।

ব্যবহার করে গাণিতিক তত্ত্ব 1970-এর দশকে বিকশিত, মৌলিক স্কেলে গ্রহণযোগ্য গড়গুলির ধরন বর্ণনা করতে পরিচালনা করে। এটা স্পষ্ট যে নামের স্কেলে পরিমাপ করা ডেটার জন্য, শুধুমাত্র মোড গড় হিসাবে উপযুক্ত।

18. একটি অর্ডিনাল স্কেলে গড় মান

আসুন একটি অর্ডিনাল স্কেলে পরিমাপ করা বিশেষজ্ঞের মতামতের প্রক্রিয়াকরণ বিবেচনা করা যাক। নিম্নলিখিত বিবৃতি সত্য.

উপপাদ্য1 . সমস্ত কচি গড়গুলির মধ্যে, অর্ডিনাল স্কেলে একমাত্র গ্রহণযোগ্য গড়গুলি হল পদগুলি৷ ভিন্নতা সিরিজ(সাধারণ পরিসংখ্যান)।

উপপাদ্য 1 বৈধ যদি গড় Ф(Х 1 Х 2 ,..., Х n) একটি অবিচ্ছিন্ন (ভেরিয়েবলের সেটের উপরে) এবং প্রতিসম ফাংশন। পরবর্তীটির অর্থ হল যখন আর্গুমেন্টগুলিকে পুনরায় সাজানো হয়, তখন ফাংশনের মান Ф(Х 1 Х 2 ,..., Х n) পরিবর্তন হয় না। এই অবস্থাটি বেশ স্বাভাবিক, কারণ আমরা সামগ্রিকতার (সেট) জন্য গড় মান খুঁজে পাই, অনুক্রমের জন্য নয়। আমরা এর উপাদানগুলি যে ক্রমে তালিকাভুক্ত করি তার উপর নির্ভর করে সেটটি পরিবর্তিত হয় না।

উপপাদ্য 1 অনুসারে, বিশেষ করে, মধ্যমাটি একটি অর্ডিনাল স্কেলে পরিমাপ করা ডেটার জন্য গড় হিসাবে ব্যবহার করা যেতে পারে (যদি নমুনার আকার বিজোড় হয়)। ভলিউম জোড় হলে, ভিন্নতা সিরিজের দুটি কেন্দ্রীয় সদস্যের মধ্যে একটি ব্যবহার করা উচিত - যেমনটি কখনও কখনও বলা হয়, বাম মধ্যক বা ডান মধ্যমা। ফ্যাশনও ব্যবহার করা যেতে পারে - এটি সর্বদা বৈচিত্র্য সিরিজের সদস্য। কিন্তু আপনি কখনই পাটিগণিত গড়, জ্যামিতিক গড় ইত্যাদি গণনা করতে পারবেন না।

নিম্নলিখিত উপপাদ্যটি সত্য।

উপপাদ্য 2. চলুন Y 1, Y 2,...,Y m কে ডিস্ট্রিবিউশন ফাংশন F(x) সহ স্বতন্ত্র অভিন্নভাবে বিতরণ করা র্যান্ডম ভেরিয়েবল এবং Z 1, Z 2,..., Zn ফাংশন ডিস্ট্রিবিউশনের সাথে স্বতন্ত্র অভিন্নভাবে বিতরণ করা র্যান্ডম ভেরিয়েবল হতে দিন H(x), এবং নমুনা Y 1, Y 2,...,Y m এবং Z 1, Z 2,..., Z n একে অপরের থেকে স্বাধীন এবং MY X > MZ X। কোনো ঘটনার সম্ভাব্যতা 1 এ min(m, n) এ প্রবণতার জন্য যে কোনো কঠোরভাবে ক্রমবর্ধমান ক্রমাগত ফাংশন g শর্ত |g i |>X সন্তুষ্ট করার জন্য এটি প্রয়োজনীয় এবং যথেষ্ট যে অসমতা F(x) সবার জন্য সন্তুষ্ট এক্স< Н(х), причем существовало число х 0 , для которого F(x 0)

বিঃদ্রঃ.ঊর্ধ্ব সীমা সহ শর্তটি সম্পূর্ণরূপে আন্তঃ-গাণিতিক প্রকৃতির। প্রকৃতপক্ষে, ফাংশনটি একটি অর্ডিন্যাল স্কেলে একটি নির্বিচারে গ্রহণযোগ্য রূপান্তর।

উপপাদ্য 2 অনুসারে, যদি উপপাদ্যে প্রদত্ত অসমতাকে সন্তুষ্ট করে এমন দুটি বন্টনের নমুনা তুলনা করা হয় তাহলে পাটিগণিতের গড় একটি অর্ডিনাল স্কেলেও ব্যবহার করা যেতে পারে। সহজ কথায়, ডিস্ট্রিবিউশন ফাংশনগুলির একটি সর্বদা অন্যটির উপরে থাকা উচিত। ডিস্ট্রিবিউশন ফাংশন ছেদ করতে পারে না, তাদের শুধুমাত্র একে অপরকে স্পর্শ করার অনুমতি দেওয়া হয়। এই শর্ত পূরণ করা হয়, উদাহরণস্বরূপ, যদি বন্টন ফাংশন শুধুমাত্র শিফটে ভিন্ন হয়:

F(x) = Н(x + ∆)

কিছু জন্য ∆.

শেষ শর্তটি সন্তুষ্ট হয় যদি একটি নির্দিষ্ট পরিমাণের দুটি মান একই পরিমাপের যন্ত্র ব্যবহার করে পরিমাপ করা হয়, যেখানে প্রশ্নে থাকা পরিমাণের একটি মান পরিমাপ করা থেকে অন্য পরিমাপের দিকে যাওয়ার সময় ত্রুটির বন্টন পরিবর্তন হয় না।

Kolmogorov অনুযায়ী গড়

উপরে তালিকাভুক্ত বেশ কয়েকটি গড়ের একটি সাধারণীকরণ হল কোলমোগোরভ গড়। X 1, X 2,..., X n সংখ্যাগুলির জন্য, কলমোগোরভ গড় সূত্রটি ব্যবহার করে গণনা করা হয়

G((F(X l) + F(X 2)+...F(X n))/n),

যেখানে F একটি কঠোরভাবে একঘেয়ে ফাংশন (যেমন কঠোরভাবে বৃদ্ধি বা কঠোরভাবে হ্রাস),

G হল F এর বিপরীত ফাংশন।

কলমোগোরভের গড়গুলির মধ্যে অনেকগুলি সুপরিচিত চরিত্র রয়েছে। সুতরাং, যদি F(x) = x, তাহলে Kolmogorov গড় হল পাটিগণিত গড়, যদি F(x) = lnx, তাহলে জ্যামিতিক গড়, যদি F(x) = 1/x, তাহলে হারমোনিক গড়, যদি F( x) = x 2, তারপর গড় বর্গ, ইত্যাদি। কোলমোগোরভ গড় হল কচি গড় একটি বিশেষ ক্ষেত্রে। অন্যদিকে, মিডিয়ান এবং মোডের মতো জনপ্রিয় গড়গুলিকে কলমোগোরভ গড় হিসাবে উপস্থাপন করা যায় না। নিম্নলিখিত বিবৃতি মনোগ্রাফ প্রমাণিত হয়.

উপপাদ্য3 . ব্যবধান স্কেলে নিয়মিততার কিছু অন্তঃগণিতিক শর্ত বৈধ হলে, কোলমোগোরভের সমস্ত উপায়ে, শুধুমাত্র গাণিতিক গড় গ্রহণযোগ্য। এইভাবে, জ্যামিতিক গড় বা মূল গড় তাপমাত্রার বর্গক্ষেত্র (সেলসিয়াসে) বা দূরত্ব অর্থহীন। গাণিতিক গড় গড় হিসাবে ব্যবহার করা আবশ্যক. আপনি মধ্যমা বা মোড ব্যবহার করতে পারেন।

উপপাদ্য 4. যদি অনুপাতের স্কেলে নিয়মিততার নির্দিষ্ট অন্তঃগণিতিক শর্তগুলি বৈধ হয়, সমস্ত কলমোগোরভের গড়গুলির মধ্যে, শুধুমাত্র F(x) = x c এবং জ্যামিতিক গড় সহ পাওয়ার গড় গ্রহণযোগ্য।

মন্তব্য করুন। জ্যামিতিক গড় হল c > 0 এর শক্তির সীমা।

Kolmogorov গড় আছে যে অনুপাত স্কেলে ব্যবহার করা যাবে না? অবশ্যই আছে. যেমন F(x) = e x।

গড় মানগুলির অনুরূপ, অন্যান্য পরিসংখ্যানগত বৈশিষ্ট্যগুলি অধ্যয়ন করা যেতে পারে - বিক্ষিপ্ততার সূচক, সংযোগ, দূরত্ব ইত্যাদি। এটি দেখানো কঠিন নয়, উদাহরণস্বরূপ, পারস্পরিক সম্পর্কের সহগ একটি ব্যবধানের একটি বাটিতে কোন গ্রহণযোগ্য রূপান্তরের সাথে পরিবর্তিত হয় না, যেমন বিচ্ছুরণের অনুপাতের মতো, বিচ্ছুরণটি পার্থক্যের স্কেলে, পার্থক্যের সহগ পরিবর্তিত হয় না। অনুপাতের স্কেল, ইত্যাদি

গড় মূল্যের উপরোক্ত ফলাফলগুলি ব্যাপকভাবে ব্যবহৃত হয়, শুধুমাত্র অর্থনীতি, ব্যবস্থাপনা, বিশেষজ্ঞের মূল্যায়নের তত্ত্ব বা সমাজবিজ্ঞানে নয়, প্রকৌশলেও, উদাহরণস্বরূপ, ব্লাস্ট ফার্নেসের স্বয়ংক্রিয় প্রক্রিয়া নিয়ন্ত্রণ ব্যবস্থায় সেন্সরগুলিকে একত্রিত করার পদ্ধতিগুলি বিশ্লেষণ করতে। স্ট্যান্ডার্ডাইজেশন এবং কোয়ালিটি ম্যানেজমেন্টের সমস্যায় টিআই এর অনেক ব্যবহারিক গুরুত্ব রয়েছে, বিশেষ করে কোয়ালিমেট্রিতে, যেখানে আকর্ষণীয় তাত্ত্বিক ফলাফল পাওয়া গেছে। সুতরাং, উদাহরণস্বরূপ, পণ্যের গুণমানের স্বতন্ত্র সূচকগুলির ওজন সহগগুলির যে কোনও পরিবর্তন ওজনযুক্ত গড় সূচক অনুসারে পণ্যগুলির ক্রম পরিবর্তনের দিকে নিয়ে যায় (এই উপপাদ্যটি প্রফেসর ভিভি পডিনোভস্কি দ্বারা প্রমাণিত হয়েছিল)। ফলস্বরূপ, টিআই এবং এর পদ্ধতি সম্পর্কে উপরের সংক্ষিপ্ত তথ্যগুলি এক অর্থে অর্থনীতি, সমাজবিজ্ঞান এবং প্রকৌশল বিজ্ঞানকে একত্রিত করে এবং জটিল সমস্যাগুলি সমাধানের জন্য একটি পর্যাপ্ত যন্ত্র যা আগে কার্যকর বিশ্লেষণের জন্য উপযুক্ত ছিল না, উপরন্তু, উপায় বাস্তবসম্মত মডেল নির্মাণ এবং পূর্বাভাস সমস্যা সমাধানের জন্য খোলা.

22. পেয়ারড লিনিয়ার রিগ্রেশন

আসুন এখন পেয়ারওয়াইজ লিনিয়ার রিগ্রেশনের সবচেয়ে সহজ ক্ষেত্রে আরও বিশদ অধ্যয়নের দিকে ফিরে যাই। রৈখিক রিগ্রেশন একটি সরল রেখা সমীকরণ আকারে সহজ কার্যকরী সম্পর্ক দ্বারা বর্ণনা করা হয় এবং মডেল পরামিতি (সমীকরণ সহগ) এর একটি স্বচ্ছ ব্যাখ্যা দ্বারা চিহ্নিত করা হয়। সমীকরণের ডান দিকটি আমাদের রিগ্রেসর (ব্যাখ্যামূলক পরিবর্তনশীল) এর প্রদত্ত মানের উপর ভিত্তি করে ফলাফল (ব্যাখ্যা করা) পরিবর্তনশীলের তাত্ত্বিক (গণনা করা) মানগুলি পেতে দেয়। এই মানগুলিকে কখনও কখনও ভবিষ্যদ্বাণী করাও বলা হয় (একই অর্থে), যেমন তাত্ত্বিক সূত্র থেকে প্রাপ্ত। যাইহোক, নির্ভরতার প্রকৃতি সম্পর্কে একটি হাইপোথিসিস করার সময়, সমীকরণের সহগগুলি এখনও অজানা থেকে যায়। সাধারণভাবে বলতে গেলে, বিভিন্ন পদ্ধতি ব্যবহার করে এই সহগগুলির আনুমানিক মান প্রাপ্ত করা সম্ভব।

তবে তাদের মধ্যে সবচেয়ে গুরুত্বপূর্ণ এবং ব্যাপক হল পদ্ধতি সর্বনিম্ন বর্গক্ষেত্র(MNC)। এটি গণনা করা (তাত্ত্বিক) মানগুলি থেকে ফলাফলের বৈশিষ্ট্যের প্রকৃত মানের বর্গক্ষেত্র বিচ্যুতির যোগফলকে হ্রাস করার প্রয়োজনীয়তার উপর ভিত্তি করে (ইতিমধ্যে ব্যাখ্যা করা হয়েছে)। তাত্ত্বিক মানগুলির পরিবর্তে (এগুলি পেতে), রিগ্রেশন সমীকরণের ডানদিকের দিকগুলিকে বর্গক্ষেত্র বিচ্যুতির যোগফলের মধ্যে প্রতিস্থাপন করুন এবং তারপরে এই ফাংশনের আংশিক ডেরিভেটিভগুলি খুঁজুন (প্রকৃত মানের বর্গক্ষেত্র বিচ্যুতির সমষ্টি) তাত্ত্বিক থেকে প্রাপ্ত বৈশিষ্ট্যের)। এই আংশিক ডেরিভেটিভগুলি x এবং y ভেরিয়েবলের সাপেক্ষে নয়, a এবং b প্যারামিটারের ক্ষেত্রে নেওয়া হয়। আংশিক ডেরিভেটিভগুলি শূন্যের সমান সেট করা হয় এবং, সহজ কিন্তু কষ্টকর রূপান্তরের পরে, প্যারামিটারগুলি নির্ধারণের জন্য স্বাভাবিক সমীকরণের একটি সিস্টেম পাওয়া যায়। পরিবর্তনশীল x এর সহগ, অর্থাৎ b কে রিগ্রেশন সহগ বলা হয়, এটি একটি ইউনিট দ্বারা ফ্যাক্টরের পরিবর্তনের সাথে ফলাফলের গড় পরিবর্তন দেখায়। প্যারামিটার a এর একটি অর্থনৈতিক ব্যাখ্যা নাও থাকতে পারে, বিশেষ করে যদি এই সহগের চিহ্নটি নেতিবাচক হয়।

পেয়ারওয়াইজ লিনিয়ার রিগ্রেশন ব্যবহার ফাংশন অধ্যয়ন করতে ব্যবহৃত হয়। খরচ ফাংশনে রিগ্রেশন সহগ গুণক গণনা করতে ব্যবহৃত হয়। প্রায় সবসময়, রিগ্রেশন সমীকরণটি সংযোগের ঘনিষ্ঠতার একটি সূচকের সাথে সম্পূরক হয়। লিনিয়ার রিগ্রেশনের সবচেয়ে সহজ ক্ষেত্রে, সংযোগের ঘনিষ্ঠতার এই সূচকটি রৈখিক সহগপারস্পরিক সম্পর্ক কিন্তু যেহেতু রৈখিক পারস্পরিক সম্পর্ক সহগ বৈশিষ্ট্যগুলির মধ্যে সংযোগের ঘনিষ্ঠতাকে একটি রৈখিক আকারে চিহ্নিত করে, তাই শূন্যের সাথে রৈখিক পারস্পরিক সম্পর্ক সহগটির পরম মানের নৈকট্য বৈশিষ্ট্যগুলির মধ্যে সংযোগের অনুপস্থিতির সূচক হিসাবে কাজ করে না।

এটি মডেল স্পেসিফিকেশনের একটি ভিন্ন পছন্দের সাথে এবং তাই নির্ভরতার ধরন যে প্রকৃত সম্পর্কটি একতার কাছাকাছি হতে পারে। কিন্তু নির্বাচনের মান লিনিয়ার ফাংশনরৈখিক পারস্পরিক সম্পর্ক সহগের বর্গ ব্যবহার করে নির্ধারিত হয় - নির্ণয়ের সহগ। এটি কার্যকরী বৈশিষ্ট্যের বৈচিত্র্যের অনুপাতকে চিহ্নিত করে y কার্যকরী বৈশিষ্ট্যের মোট প্রকরণে রিগ্রেশন দ্বারা ব্যাখ্যা করা হয়েছে। যে মানটি 1-এ সংকল্পের সহগকে পরিপূরক করে তা মডেলে (অবশিষ্ট প্রকরণ) বিবেচনা না করা অন্যান্য কারণের প্রভাব দ্বারা সৃষ্ট বৈচিত্র্যের ভাগকে চিহ্নিত করে।

পেয়ারড রিগ্রেশন নিম্নলিখিত ফর্মের দুটি ভেরিয়েবল y এবং x সম্পর্কিত একটি সমীকরণ দ্বারা উপস্থাপিত হয়:

যেখানে y হল নির্ভরশীল পরিবর্তনশীল (ফলাফলমূলক বৈশিষ্ট্য), এবং x হল স্বাধীন পরিবর্তনশীল (ব্যাখ্যামূলক পরিবর্তনশীল, বা বৈশিষ্ট্য-ফ্যাক্টর)। লিনিয়ার রিগ্রেশন এবং ননলাইনার রিগ্রেশন আছে। লিনিয়ার রিগ্রেশন ফর্মের একটি সমীকরণ দ্বারা বর্ণনা করা হয়:

y = a+ bx + ।

অরৈখিক রিগ্রেশন, ঘুরে, বিশ্লেষণে অন্তর্ভুক্ত ব্যাখ্যামূলক ভেরিয়েবলের ক্ষেত্রে অরৈখিক হতে পারে, কিন্তু আনুমানিক পরামিতিগুলির ক্ষেত্রে রৈখিক হতে পারে। অথবা অনুমান করা প্যারামিটারের পরিপ্রেক্ষিতে রিগ্রেশন অরৈখিক। রিগ্রেশনের উদাহরণ যা ব্যাখ্যামূলক ভেরিয়েবলে অরৈখিক, কিন্তু আনুমানিক পরামিতিতে রৈখিক, বিভিন্ন ডিগ্রির বহুপদী নির্ভরতা (বহুপদ) এবং একটি সমবাহু হাইপারবোলা অন্তর্ভুক্ত করে।

আনুমানিক পরামিতিগুলির জন্য অরৈখিক রিগ্রেশন হল পরামিতি (প্যারামিটারটি সূচকে থাকে) এর সাথে সম্পর্কিত একটি শক্তি নির্ভরতা, একটি সূচকীয় নির্ভরতা, যেখানে প্যারামিটারটি সূচকের ভিত্তিতে থাকে এবং একটি সূচকীয় নির্ভরতা, যখন সম্পূর্ণ রৈখিক নির্ভরতা সম্পূর্ণ হয় সূচকে উল্লেখ্য যে এই তিনটি ক্ষেত্রে এলোমেলো উপাদান (এলোমেলো অবশিষ্ট)  অন্তর্ভুক্ত করা হয়েছে ডান পাশসমীকরণগুলি একটি ফ্যাক্টর আকারে, এবং একটি সমন্ডের আকারে নয়, যেমন গুণগতভাবে! প্রকৃত থেকে প্রাপ্ত বৈশিষ্ট্যের গণনাকৃত মানগুলির গড় বিচ্যুতি আনুমানিক গড় ত্রুটি দ্বারা চিহ্নিত করা হয়। এটি শতাংশ হিসাবে প্রকাশ করা হয় এবং 7-8% এর বেশি হওয়া উচিত নয়। আনুমানিকতার এই গড় ত্রুটিটি হল প্রকৃত এবং গণনা করা মানের মধ্যে পার্থক্যের আপেক্ষিক মাত্রার শতকরা গড়।

গড় স্থিতিস্থাপকতা সহগ, যা অনেক অর্থনৈতিক ঘটনা এবং প্রক্রিয়াগুলির একটি গুরুত্বপূর্ণ বৈশিষ্ট্য হিসাবে কাজ করে, গুরুত্বপূর্ণ। এটি একটি প্রদত্ত কার্যকরী সম্পর্কের ডেরিভেটিভের মানের গুণফল এবং x এর গড় মানের সাথে y এর গড় মানের অনুপাত হিসাবে গণনা করা হয়। স্থিতিস্থাপকতা সহগ দেখায় যে ফলাফল y এর গড় মান থেকে কত শতাংশ পরিবর্তিত হবে যখন ফ্যাক্টর x তার (ফ্যাক্টর x) গড় মান থেকে 1% পরিবর্তিত হয়।

বৈকল্পিক বিশ্লেষণের সমস্যাগুলি পেয়ারওয়াইজ রিগ্রেশন এবং একাধিক রিগ্রেশন (যখন অনেকগুলি কারণ থাকে) এবং অবশিষ্ট প্রকরণের সাথে ঘনিষ্ঠভাবে সম্পর্কিত। বৈচিত্র্যের বিশ্লেষণনির্ভরশীল ভেরিয়েবলের প্রকরণ পরীক্ষা করে। এই ক্ষেত্রে, বর্গক্ষেত্র বিচ্যুতির মোট যোগফলকে দুটি ভাগে ভাগ করা হয়। প্রথম পদটি হল রিগ্রেশনের কারণে বর্গক্ষেত্র বিচ্যুতির সমষ্টি, বা ব্যাখ্যা করা (ফ্যাক্টরিয়াল)। দ্বিতীয় পদটি হল ফ্যাক্টর রিগ্রেশন দ্বারা ব্যাখ্যা করা হয়নি এমন বর্গক্ষেত্র বিচ্যুতির অবশিষ্ট যোগফল।

ফলাফলের বৈশিষ্ট্যগত y-এর মোট প্রকরণে রিগ্রেশন দ্বারা ব্যাখ্যা করা প্রকরণের ভাগটি নির্ধারণের সহগ (সূচক) দ্বারা চিহ্নিত করা হয়, যা বর্গীয় বিচ্যুতির মোট যোগফলের রিগ্রেশনের কারণে বর্গীয় বিচ্যুতির সমষ্টির অনুপাত ছাড়া আর কিছুই নয়। (সম্পূর্ণ যোগফলের প্রথম পদ)।

সর্বনিম্ন বর্গ পদ্ধতি ব্যবহার করে যখন মডেল প্যারামিটার (অজানা সহগ) নির্ধারণ করা হয়, তখন, সারমর্মে, কিছু র্যান্ডম ভেরিয়েবল পাওয়া যায় (অনুমান প্রাপ্তির প্রক্রিয়ায়)। বিশেষ গুরুত্ব হল রিগ্রেশন সহগ-এর অনুমান, যা একটি এলোমেলো পরিবর্তনশীলের কিছু বিশেষ রূপ। এই র‍্যান্ডম ভেরিয়েবলের বৈশিষ্ট্য সমীকরণে (মডেলে) অবশিষ্ট পদের বৈশিষ্ট্যের উপর নির্ভর করে। পেয়ারড লিনিয়ার রিগ্রেশন মডেলের জন্য, ব্যাখ্যামূলক ভেরিয়েবল x কে একটি নন-এলোমেলো বহির্মুখী পরিবর্তনশীল হিসাবে বিবেচনা করুন। এর মানে হল যে সমস্ত পর্যবেক্ষণে ভেরিয়েবল x এর মানগুলিকে পূর্বনির্ধারিত বিবেচনা করা যেতে পারে এবং অধ্যয়নের অধীনে নির্ভরতার সাথে সম্পর্কিত নয়। এইভাবে, ব্যাখ্যা করা ভেরিয়েবলের প্রকৃত মান দুটি উপাদান নিয়ে গঠিত: একটি নন-র্যান্ডম এবং একটি এলোমেলো উপাদান (অবশিষ্ট শব্দ)।

অন্যদিকে, ন্যূনতম বর্গক্ষেত্র পদ্ধতি (OLS) ব্যবহার করে নির্ধারিত রিগ্রেশন সহগটি x এবং y ভেরিয়েবলের কোভ্যারিয়েন্সকে x এর প্রকরণ দ্বারা ভাগ করার ভাগফলের সমান। তাই এটিতে একটি এলোমেলো উপাদানও রয়েছে। সর্বোপরি, কোভেরিয়েন্স নির্ভর করে ভেরিয়েবল y-এর মানের উপর, যেখানে y ভেরিয়েবলের মানগুলি র্যান্ডম রেসিডুয়াল টার্ম  এর মানের উপর নির্ভর করে। আরও, এটা দেখানো সহজ যে x এবং y ভেরিয়েবলের কোভেরিয়েন্স আনুমানিক রিগ্রেশন কোফিসিয়েন্ট বিটা () এবং ভেরিয়েবল x এর ভ্যারিয়েন্সের সাথে x এবং  ভেরিয়েবলের কোভেরিয়েন্সের সমান। এইভাবে, রিগ্রেশন সহগ বিটার অনুমান এই অজানা রিগ্রেশন সহগের সমান, পরিবর্তনশীল x এবং  ভেরিয়েবলের কোভ্যারিয়েন্সকে x এর প্রকরণ দ্বারা ভাগ করার ভাগফলের সাথে যোগ করা হয়েছে। সেগুলো. যেকোন নমুনা থেকে প্রাপ্ত রিগ্রেশন সহগ b এর অনুমান দুটি পদের যোগফল হিসাবে উপস্থাপন করা হয়: একটি ধ্রুবক মান সহগ  (বিটা) এর প্রকৃত মানের সমান এবং একটি এলোমেলো উপাদান x এবং  ভেরিয়েবলের কোভারিয়েন্সের উপর নির্ভর করে .

23. গাণিতিক গাউস-মার্কভ শর্ত এবং তাদের প্রয়োগ।

সর্বোত্তম ফলাফলের জন্য সাধারণ OLS-এর উপর ভিত্তি করে রিগ্রেশন বিশ্লেষণের জন্য, র্যান্ডম শব্দটিকে অবশ্যই চারটি গাউস-মার্কভ শর্ত পূরণ করতে হবে।

এলোমেলো শব্দের গাণিতিক প্রত্যাশা শূন্যের সমান, অর্থাৎ এটা নিরপেক্ষ। যদি রিগ্রেশন সমীকরণ একটি ধ্রুবক পদ অন্তর্ভুক্ত করে, তবে এই প্রয়োজনীয়তাটি পূরণ হয়েছে বলে বিবেচনা করা স্বাভাবিক, যেহেতু এটি একটি ধ্রুবক পদ এবং এটিকে অবশ্যই y-এর মানগুলির মধ্যে যে কোনও পদ্ধতিগত প্রবণতা বিবেচনায় নিতে হবে, যা বিপরীতে রিগ্রেশন সমীকরণের ব্যাখ্যামূলক ভেরিয়েবলের মধ্যে থাকবে না।

এলোমেলো শব্দের প্রকরণ সব পর্যবেক্ষণের জন্য ধ্রুবক।

মূল্যবোধের সমপরিমাণতা এলোমেলো ভেরিয়েবল, নমুনা গঠন অবশ্যই শূন্যের সমান হতে হবে, অর্থাৎ কোনো দুটি নির্দিষ্ট পর্যবেক্ষণে এলোমেলো শব্দের মানের মধ্যে কোনো পদ্ধতিগত সম্পর্ক নেই। র্যান্ডম সদস্যদের একে অপরের থেকে স্বাধীন হতে হবে।

এলোমেলো শব্দের বন্টন আইন ব্যাখ্যামূলক ভেরিয়েবল থেকে স্বাধীন হতে হবে।

অধিকন্তু, অনেক অ্যাপ্লিকেশনে ব্যাখ্যামূলক ভেরিয়েবলগুলি স্টোকাস্টিক নয়, যেমন একটি র্যান্ডম উপাদান আছে না. প্রতিটি পর্যবেক্ষণে যেকোন স্বাধীন পরিবর্তনশীলের মান অবশ্যই বহিরাগত হিসাবে বিবেচিত হবে, সম্পূর্ণরূপে বাহ্যিক কারণগুলির দ্বারা নির্ধারিত হবে যা রিগ্রেশন সমীকরণে বিবেচনা করা হয় না।

নির্দিষ্ট গাউস-মার্কভ অবস্থার সাথে, এটাও অনুমান করা হয় যে এলোমেলো শব্দের একটি স্বাভাবিক বন্টন আছে। এটি অত্যন্ত বিস্তৃত পরিস্থিতিতে বৈধ এবং তথাকথিত কেন্দ্রীয় সীমা উপপাদ্য (CLT) এর উপর ভিত্তি করে। এই উপপাদ্যটির সারমর্ম হল যে যদি একটি র্যান্ডম ভেরিয়েবল অন্য সংখ্যক র্যান্ডম ভেরিয়েবলের মিথস্ক্রিয়ার সামগ্রিক ফলাফল হয়, যার কোনোটিরই এই সামগ্রিক ফলাফলের আচরণের উপর প্রভাব বিস্তার করে না, তাহলে ফলস্বরূপ র্যান্ডম চলকটি বর্ণনা করা হবে। মোটামুটি স্বাভাবিক বন্টন দ্বারা। এই নৈকট্য স্বাভাবিক বন্টনঅনুমান প্রাপ্ত করার জন্য আপনাকে স্বাভাবিক বন্টন ব্যবহার করতে দেয় এবং হয় একটি নির্দিষ্ট অর্থেএর সাধারণীকরণ হল ছাত্র বন্টন, যা মূলত তথাকথিত "টেইল"-এ স্বাভাবিকের থেকে লক্ষণীয়ভাবে আলাদা। ছোট নমুনা আকারের জন্য। এটিও গুরুত্বপূর্ণ যে যদি র্যান্ডম শব্দটি সাধারণত বিতরণ করা হয়, তবে রিগ্রেশন সহগগুলিও সাধারণভাবে বিতরণ করা হবে।

প্রতিষ্ঠিত রিগ্রেশন বক্ররেখা (রিগ্রেশন সমীকরণ) আমাদের তথাকথিত বিন্দু পূর্বাভাসের সমস্যা সমাধান করতে দেয়। এই ধরনের গণনায়, x এর একটি নির্দিষ্ট মান অধ্যয়ন করা পর্যবেক্ষণ ব্যবধানের বাইরে নেওয়া হয় এবং রিগ্রেশন সমীকরণের (এক্সট্রাপোলেশন পদ্ধতি) ডান দিকে প্রতিস্থাপিত হয়। কারণ রিগ্রেশন সহগগুলির জন্য অনুমান ইতিমধ্যেই পরিচিত, তারপর x এর নেওয়া মানের সাথে সঙ্গতিপূর্ণ ব্যাখ্যা করা পরিবর্তনশীল y এর মান গণনা করা সম্ভব। স্বাভাবিকভাবেই, ভবিষ্যদ্বাণী (পূর্বাভাস) এর অর্থ অনুসারে, গণনাগুলি এগিয়ে নেওয়া হয় (ভবিষ্যত মানগুলির অঞ্চলে)।

যাইহোক, যেহেতু সহগগুলি একটি নির্দিষ্ট ত্রুটির সাথে নির্ধারিত হয়েছিল, এটি আগ্রহের নয় পয়েন্ট অনুমান(পয়েন্ট পূর্বাভাস) একটি কার্যকর বৈশিষ্ট্যের জন্য, এবং সীমা সম্পর্কে জ্ঞান যার মধ্যে, একটি নির্দিষ্ট সম্ভাবনার সাথে, কার্যকর বৈশিষ্ট্যের মানগুলি মিথ্যা হবে, ফ্যাক্টর x এর নেওয়া মানের সাথে সম্পর্কিত।

এটি করার জন্য, মান ত্রুটি (মান বিচ্যুতি) গণনা করা হয়। এটি নিম্নরূপ যা বলা হয়েছে তার চেতনায় প্রাপ্ত করা যেতে পারে। গড় মানের মাধ্যমে অনুমান থেকে মুক্ত শব্দ a এর অভিব্যক্তিটি রৈখিক রিগ্রেশন সমীকরণে প্রতিস্থাপিত হয়। তারপর দেখা যাচ্ছে যে স্ট্যান্ডার্ড ত্রুটি নির্ভর করে গড় কার্যকরী ফ্যাক্টর y এর ত্রুটির উপর এবং যোগ করে রিগ্রেশন সহগ b এর ত্রুটির উপর। সহজভাবে এই স্ট্যান্ডার্ড ত্রুটির বর্গ যোগফলের সমানগড় মান y এর বর্গ ত্রুটি এবং গুণনীয়ক x এবং এর গড় এর মানের বর্গ বিচ্যুতি দ্বারা রিগ্রেশন সহগের বর্গ ত্রুটির গুণফল। আরও, পরিসংখ্যানের আইন অনুসারে প্রথম পদটি নমুনার আকার (ভলিউম) দ্বারা সাধারণ জনসংখ্যার প্রকরণকে ভাগ করার ভাগফলের সমান।

অজানা বৈচিত্র্যের পরিবর্তে, নমুনা বৈচিত্রটি একটি অনুমান হিসাবে ব্যবহৃত হয়। তদনুসারে, রিগ্রেশন সহগের ত্রুটিটিকে x ফ্যাক্টরের প্রকরণ দ্বারা নমুনা প্রকরণকে ভাগ করার ভাগফল হিসাবে সংজ্ঞায়িত করা হয়। আপনি স্ট্যান্ডার্ড ত্রুটি (স্ট্যান্ডার্ড বিচ্যুতি) এবং অন্যান্য বিবেচনা পেতে পারেন যা রৈখিক রিগ্রেশন মডেল থেকে আরও স্বাধীন। এটি করার জন্য, গড় ত্রুটি এবং প্রান্তিক ত্রুটির ধারণা এবং তাদের মধ্যে সম্পর্ক ব্যবহার করা হয়।

কিন্তু স্ট্যান্ডার্ড ত্রুটি পাওয়ার পরেও, প্রশ্নটি রয়ে গেছে সেই সীমানা সম্পর্কে যার মধ্যে পূর্বাভাসিত মানটি থাকবে। অন্য কথায়, পরিমাপ ত্রুটির ব্যবধান সম্পর্কে, অনেক ক্ষেত্রে স্বাভাবিক অনুমানে যে এই ব্যবধানের মাঝামাঝিটি কার্যকরী ফ্যাক্টর y এর গণনাকৃত (গড়) মান দ্বারা দেওয়া হয়। এখানে কেন্দ্রীয় সীমা উপপাদ্যটি উদ্ধারের জন্য আসে, যা সঠিকভাবে নির্দেশ করে যে অজানা পরিমাণটি এই আস্থার ব্যবধানের মধ্যে কতটা সম্ভাবনা রয়েছে।

মূলত, স্ট্যান্ডার্ড ত্রুটি সূত্র, কিভাবে এবং কোন আকারে এটি প্রাপ্ত হয় তা নির্বিশেষে, রিগ্রেশন লাইনের অবস্থানে ত্রুটিটিকে চিহ্নিত করে। যখন ফ্যাক্টর x এর মান ফ্যাক্টরের গড় মানের সাথে মিলে যায় তখন স্ট্যান্ডার্ড ত্রুটিটি সর্বনিম্ন হয়।

24. ফিশার মানদণ্ড ব্যবহার করে অনুমানগুলির পরিসংখ্যানগত পরীক্ষা এবং রৈখিক রিগ্রেশনের তাত্পর্যের মূল্যায়ন।

রৈখিক রিগ্রেশন সমীকরণ পাওয়া যাওয়ার পরে, সামগ্রিকভাবে সমীকরণ এবং এর পৃথক পরামিতি উভয়ের তাত্পর্য মূল্যায়ন করা হয়। সামগ্রিকভাবে রিগ্রেশন সমীকরণের তাত্পর্য মূল্যায়ন বিভিন্ন মানদণ্ড ব্যবহার করে করা যেতে পারে। বেশ সাধারণ এবং কার্যকর হল ফিশারের এফ পরীক্ষার ব্যবহার। এই ক্ষেত্রে, নাল হাইপোথিসিসটি সামনে রাখা হয় যে রিগ্রেশন সহগ শূন্যের সমান, অর্থাৎ b=0, এবং তাই y ফলাফলের উপর x ফ্যাক্টরটির কোন প্রভাব নেই। এফ-টেস্টের তাৎক্ষণিক গণনাটি বৈচিত্র্যের বিশ্লেষণের আগে হয়। এটির কেন্দ্রীয় স্থানটি গড় মান y থেকে ভেরিয়েবল y এর বর্গক্ষেত্র বিচ্যুতির মোট যোগফলের পচন দ্বারা দখল করা হয়েছে দুটি অংশে - "ব্যাখ্যা করা" এবং "অব্যক্ত":

গড় মান y থেকে ফলস্বরূপ বৈশিষ্ট্যযুক্ত y এর পৃথক মানের বর্গক্ষেত্র বিচ্যুতির মোট যোগফল অনেকগুলি কারণের প্রভাবের কারণে ঘটে।

আসুন শর্তসাপেক্ষে কারণগুলির সম্পূর্ণ সেটটিকে দুটি গ্রুপে ভাগ করি: অধ্যয়নকৃত ফ্যাক্টর x এবং অন্যান্য কারণগুলি। যদি ফ্যাক্টর ফলাফলকে প্রভাবিত না করে, তাহলে গ্রাফের রিগ্রেশন লাইনটি OX এবং y=y অক্ষের সমান্তরাল। তারপর ফলাফলের বৈশিষ্ট্যের সম্পূর্ণ বৈচিত্রটি অন্যান্য কারণের প্রভাবের কারণে হয় এবং বর্গীয় বিচ্যুতির মোট যোগফল অবশিষ্টাংশের সাথে মিলে যাবে। যদি অন্য কারণগুলি ফলাফলকে প্রভাবিত না করে, তাহলে y কার্যকরীভাবে x এর সাথে সম্পর্কিত এবং বর্গের অবশিষ্ট যোগফল শূন্য। এই ক্ষেত্রে, রিগ্রেশন দ্বারা ব্যাখ্যা করা বর্গক্ষেত্র বিচ্যুতির সমষ্টির সাথে মিলে যায় সর্বমোট পরিমাণবর্গক্ষেত্র যেহেতু পারস্পরিক সম্পর্ক ক্ষেত্রের সমস্ত বিন্দু রিগ্রেশন লাইনের উপর থাকে না, তাদের বিক্ষিপ্ততা সবসময় ফ্যাক্টর x এর প্রভাবের কারণে ঘটে, যেমন x-এ y-এর রিগ্রেশন, এবং অন্যান্য কারণে সৃষ্ট (অব্যক্ত প্রকরণ)। ভবিষ্যদ্বাণীর জন্য একটি রিগ্রেশন লাইনের উপযুক্ততা নির্ভর করে ব্যাখ্যা করা বৈচিত্রের দ্বারা y বৈশিষ্ট্যের মোট বৈচিত্র্যের কতটা হিসাব করা হয়েছে তার উপর।

স্পষ্টতই, রিগ্রেশনের কারণে বর্গক্ষেত্রের বিচ্যুতির যোগফল যদি বর্গক্ষেত্রের অবশিষ্ট যোগফলের চেয়ে বেশি হয়, তাহলে রিগ্রেশন সমীকরণটি পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ এবং x ফ্যাক্টর ফলাফলের উপর উল্লেখযোগ্য প্রভাব ফেলে। এটি এই সত্যের সমতুল্য যে সংকল্পের সহগ একতার কাছে যাবে। বর্গক্ষেত্র বিচ্যুতির যেকোন যোগফল স্বাধীনতার ডিগ্রির সংখ্যার সাথে সম্পর্কিত, যেমন একটি বৈশিষ্ট্যের স্বাধীন পরিবর্তনের স্বাধীনতার সংখ্যা। স্বাধীনতার ডিগ্রির সংখ্যা জনসংখ্যার এককের সংখ্যার সাথে বা এটি থেকে নির্ধারিত ধ্রুবকের সংখ্যার সাথে সম্পর্কিত। অধ্যয়নের অধীনে সমস্যা সম্পর্কিত, স্বাধীনতার ডিগ্রীর সংখ্যা দেখাতে হবে যে n সম্ভাব্য [(y 1 -y), (y 2 -y),...(y n -y)] এর মধ্যে কতগুলি স্বাধীন বিচ্যুতি প্রয়োজন। বর্গক্ষেত্রের একটি প্রদত্ত যোগফল গঠন করতে। এইভাবে, বর্গের মোট যোগফলের জন্য ∑(y-y sr) 2, (n-1) স্বাধীন বিচ্যুতি প্রয়োজন, কারণ n ইউনিটের জনসংখ্যার মধ্যে, গড় স্তর গণনা করার পরে, শুধুমাত্র (n-1) বিচ্যুতির সংখ্যা অবাধে পরিবর্তিত হয়। ∑(y-y avg) 2 বর্গক্ষেত্রের ব্যাখ্যা করা বা ফ্যাক্টর যোগফল গণনা করার সময়, ফলাফলের বৈশিষ্ট্যযুক্ত y* এর তাত্ত্বিক (গণনা করা) মানগুলি ব্যবহার করা হয়, যা রিগ্রেশন লাইন বরাবর পাওয়া যায়: y(x)=a+bx।

আসুন এখন এই মানের গড় থেকে কার্যকর গুণকের বর্গক্ষেত্র বিচ্যুতির মোট যোগফলের প্রসারণে ফিরে আসি। এই যোগফলটিতে ইতিমধ্যে উপরে সংজ্ঞায়িত দুটি অংশ রয়েছে: রিগ্রেশন দ্বারা ব্যাখ্যা করা বর্গক্ষেত্র বিচ্যুতির সমষ্টি এবং আরেকটি যোগফল যাকে বর্গীয় বিচ্যুতির অবশিষ্ট সমষ্টি বলা হয়। এই পচনের সাথে যুক্ত হল প্রকরণের বিশ্লেষণ, যা সরাসরি মৌলিক প্রশ্নের উত্তর দেয়: কীভাবে সামগ্রিকভাবে রিগ্রেশন সমীকরণের তাৎপর্য এবং এর স্বতন্ত্র পরামিতিগুলি মূল্যায়ন করা যায়? এটি মূলত এই প্রশ্নের অর্থ নির্ধারণ করে। সামগ্রিকভাবে রিগ্রেশন সমীকরণের তাত্পর্য মূল্যায়ন করতে, ফিশার মানদণ্ড (এফ-টেস্ট) ব্যবহার করা হয়। ফিশারের প্রস্তাবিত পদ্ধতি অনুসারে, একটি শূন্য অনুমান সামনে রাখা হয়েছে: রিগ্রেশন সহগ শূন্যের সমান, অর্থাৎ মানb=0। এর মানে হল X ফ্যাক্টর Y ফলাফলের উপর কোন প্রভাব ফেলে না।

আসুন আমরা মনে রাখি যে প্রায় সবসময় পরিসংখ্যানগত অধ্যয়নের ফলে প্রাপ্ত পয়েন্টগুলি রিগ্রেশন লাইনে ঠিক থাকে না। তারা বিক্ষিপ্ত, কম-বেশি রিগ্রেশন লাইন থেকে অনেক দূরে। এই ধরনের বিচ্ছুরণ অন্যান্য কারণের প্রভাবের কারণে হয়, ব্যাখ্যামূলক ফ্যাক্টর X থেকে ভিন্ন, যা রিগ্রেশন সমীকরণে বিবেচনা করা হয় না। বর্গীয় বিচ্যুতির ব্যাখ্যা করা বা ফ্যাক্টর যোগফল গণনা করার সময়, রিগ্রেশন লাইন থেকে প্রাপ্ত ফলাফলের বৈশিষ্ট্যের তাত্ত্বিক মান ব্যবহার করা হয়।

Y এবং X ভেরিয়েবলের মানগুলির একটি প্রদত্ত সেটের জন্য, গড় মান Y এর গণনা করা মানটি রৈখিক রিগ্রেশনে শুধুমাত্র একটি প্যারামিটারের একটি ফাংশন - রিগ্রেশন সহগ। এটি অনুসারে, বর্গীয় বিচ্যুতির গুণনীয়ক যোগফলের স্বাধীনতার ডিগ্রীর সংখ্যা 1 এর সমান। এবং রৈখিক রিগ্রেশনে বর্গীয় বিচ্যুতির অবশিষ্ট যোগফলের স্বাধীনতার ডিগ্রির সংখ্যা হল n-2।

ফলস্বরূপ, স্বাধীনতার ডিগ্রীর সংখ্যা দ্বারা মূল সম্প্রসারণে প্রতিটি বর্গ বিচ্যুতির সমষ্টিকে ভাগ করলে, আমরা গড় বর্গীয় বিচ্যুতি (স্বাধীনতার এক ডিগ্রি প্রতি পার্থক্য) পাই। এরপরে, ফ্যাক্টর ভ্যারিয়েন্সকে স্বাধীনতার এক ডিগ্রী দ্বারা রেসিডুয়াল ভ্যারিয়েন্স দ্বারা বিভক্ত করে, আমরা নাল হাইপোথিসিস, তথাকথিত F-অনুপাত, বা একই নামের মাপদণ্ড পরীক্ষা করার জন্য একটি মানদণ্ড পাই। যথা, যদি শূন্য অনুমান সত্য হয়, গুণনীয়ক এবং অবশিষ্ট পার্থক্যগুলি একে অপরের সমান।

শূন্য হাইপোথিসিস প্রত্যাখ্যান করতে, i.e. বিপরীত অনুমান গ্রহণ করা, যা অধ্যয়নের অধীনে সম্পর্কের তাত্পর্য (উপস্থিতি) এর সত্যতা প্রকাশ করে এবং বাস্তবে বিদ্যমান নেই এমন একটি সম্পর্কের অনুকরণকারী কারণগুলির একটি এলোমেলো কাকতালীয় নয়, এর সমালোচনামূলক মানগুলির টেবিল ব্যবহার করা প্রয়োজন নির্দিষ্ট সম্পর্ক। টেবিল ব্যবহার করে, ফিশার মানদণ্ডের সমালোচনামূলক (থ্রেশহোল্ড) মান নির্ধারণ করা হয়। একে তাত্ত্বিকও বলা হয়। তারপরে তারা পরীক্ষা করে, পর্যবেক্ষণমূলক ডেটা থেকে গণনা করা মানদণ্ডের সংশ্লিষ্ট অভিজ্ঞতামূলক (প্রকৃত) মানের সাথে তুলনা করে, অনুপাতের প্রকৃত মান টেবিলের সমালোচনামূলক মানকে ছাড়িয়ে গেছে কিনা।

এই মত আরো বিস্তারিতভাবে করা হয়. শূন্য অনুমানের উপস্থিতির সম্ভাব্যতার একটি প্রদত্ত স্তর নির্বাচন করুন এবং সারণী থেকে এফ-মাপদণ্ডের সমালোচনামূলক মান খুঁজুন, যেখানে 1 ডিগ্রি স্বাধীনতার দ্বারা ভিন্নতার এলোমেলো বিচ্যুতি এখনও ঘটতে পারে, যেমন সর্বোচ্চ যেমন মান. তারপর এফ-অনুপাতের গণনা করা মানকে নির্ভরযোগ্য হিসাবে বিবেচনা করা হয় (অর্থাৎ, প্রকৃত এবং অবশিষ্ট প্রকরণের মধ্যে পার্থক্য প্রকাশ করে) যদি এই অনুপাতটি সারণীর চেয়ে বেশি হয়। তারপরে নাল অনুমানটি প্রত্যাখ্যান করা হয় (এটি সত্য নয় যে সংযোগের কোনও লক্ষণ নেই) এবং বিপরীতে, আমরা এই সিদ্ধান্তে পৌঁছেছি যে একটি সংযোগ রয়েছে এবং এটি তাৎপর্যপূর্ণ (এটি অ-র্যান্ডম, উল্লেখযোগ্য)।

যদি সম্পর্কের মান সারণীকৃত একের চেয়ে কম হতে দেখা যায়, তবে শূন্য অনুমানের সম্ভাবনা নির্দিষ্ট স্তরের (যা প্রাথমিকভাবে বেছে নেওয়া হয়েছিল) থেকে বেশি হতে পারে এবং শূন্য অনুমানটি লক্ষণীয় বিপদ ছাড়া প্রত্যাখ্যান করা যায় না। সম্পর্কের উপস্থিতি সম্পর্কে একটি ভুল উপসংহার প্রাপ্ত করা। তদনুসারে, রিগ্রেশন সমীকরণটি তুচ্ছ বলে বিবেচিত হয়।

F- মানদণ্ডের মান নিজেই নির্ধারণের সহগের সাথে সম্পর্কিত। সামগ্রিকভাবে রিগ্রেশন সমীকরণের তাত্পর্য মূল্যায়ন করার পাশাপাশি, রিগ্রেশন সমীকরণের পৃথক পরামিতিগুলির তাত্পর্যও মূল্যায়ন করা হয়। এই ক্ষেত্রে, রিগ্রেশন সহগের মানক ত্রুটি পরীক্ষামূলক প্রকৃত মান বিচ্যুতি এবং স্বাধীনতার ডিগ্রী প্রতি অভিজ্ঞতাগত বৈচিত্র ব্যবহার করে নির্ধারিত হয়। ছাত্র বন্টন তারপর আত্মবিশ্বাসের ব্যবধান গণনা করার জন্য রিগ্রেশন সহগ এর তাৎপর্য পরীক্ষা করতে ব্যবহৃত হয়।

শিক্ষার্থীর টি-পরীক্ষা ব্যবহার করে রিগ্রেশন এবং পারস্পরিক সম্পর্ক সহগগুলির তাত্পর্য মূল্যায়ন এই পরিমাণের মান এবং মান ত্রুটির তুলনা করে সঞ্চালিত হয়। রৈখিক রিগ্রেশন প্যারামিটার এবং পারস্পরিক সম্পর্ক সহগগুলির ত্রুটির মাত্রা নিম্নলিখিত সূত্র দ্বারা নির্ধারিত হয়:

যেখানে S হল মূল মানে বর্গক্ষেত্র অবশিষ্ট নমুনা বিচ্যুতি,

r xy – পারস্পরিক সম্পর্ক সহগ।

তদনুসারে, রিগ্রেশন লাইন দ্বারা পূর্বাভাসিত স্ট্যান্ডার্ড ত্রুটির মান সূত্র দ্বারা দেওয়া হয়:

রিগ্রেশন এবং পারস্পরিক সম্পর্ক সহগগুলির মানগুলির মানগুলির সাথে তাদের মানক ত্রুটির অনুপাতগুলি তথাকথিত টি-পরিসংখ্যান গঠন করে এবং সংশ্লিষ্ট সারণী (সমালোচনামূলক) মানের তুলনা এবং এর প্রকৃত মান একজনকে শূন্য গ্রহণ বা প্রত্যাখ্যান করতে দেয় অনুমান কিন্তু তারপর, আত্মবিশ্বাসের ব্যবধান গণনা করতে, প্রতিটি সূচকের জন্য সর্বাধিক ত্রুটিটি সংশ্লিষ্ট সূচকের গড় এলোমেলো ত্রুটি দ্বারা t পরিসংখ্যানের সারণী মানের গুণফল হিসাবে পাওয়া যায়। আসলে, আমরা আসলে উপরে একটু ভিন্নভাবে এটি লিখেছি। তারপরে আত্মবিশ্বাসের ব্যবধানের সীমানা পাওয়া যায়: নিম্ন সীমাটি সংশ্লিষ্ট সহগ (আসলে গড়) থেকে সংশ্লিষ্ট প্রান্তিক ত্রুটি বিয়োগ করে এবং উপরের সীমাটি যোগ (যোগ) দ্বারা।

লিনিয়ার রিগ্রেশনে ∑(y x -y avg) 2 =b 2 ∑(x-x avg) 2। রৈখিক পারস্পরিক সম্পর্ক সহগের সূত্রটি উল্লেখ করে এটি যাচাই করা সহজ: r 2 xy = b 2 *σ 2 x /σ 2 y

যেখানে σ 2 y হল y বৈশিষ্ট্যের মোট প্রকরণ;

σ 2 x - ফ্যাক্টর x এর কারণে বৈশিষ্ট্যগত y এর বিচ্ছুরণ। তদনুসারে, রৈখিক রিগ্রেশনের কারণে বর্গক্ষেত্র বিচ্যুতির যোগফল হবে:

∑(y x -y গড়) 2 =b 2 ∑(x-x গড়) 2।

যেহেতু, x এবং y-তে পর্যবেক্ষণের একটি নির্দিষ্ট আয়তনের জন্য, রৈখিক রিগ্রেশনে বর্গক্ষেত্রের ফ্যাক্টর যোগফল রিগ্রেশন সহগ b-এর শুধুমাত্র একটি ধ্রুবকের উপর নির্ভর করে, তাহলে বর্গক্ষেত্রের এই যোগফলের এক ডিগ্রি স্বাধীনতা রয়েছে। আসুন আমরা গুণের গণনাকৃত মানের বিষয়বস্তুর দিকটি বিবেচনা করি y.e. y x। মান y x রৈখিক রিগ্রেশন সমীকরণ দ্বারা নির্ধারিত হয়: y x = a + bx।

প্যারামিটার a কে a=y-bx হিসাবে সংজ্ঞায়িত করা যেতে পারে। রৈখিক মডেলে প্যারামিটার a-এর জন্য অভিব্যক্তি প্রতিস্থাপন করে, আমরা পাই: y x =y-bx+bx avg =y-b(x-x avg)।

y এবং x ভেরিয়েবলের একটি প্রদত্ত সেটের জন্য, রৈখিক রিগ্রেশনে y x এর গণনা করা মান শুধুমাত্র একটি প্যারামিটারের একটি ফাংশন - রিগ্রেশন সহগ। তদনুসারে, বর্গক্ষেত্র বিচ্যুতির ফ্যাক্টর যোগফল 1 এর সমান স্বাধীনতার ডিগ্রীর সংখ্যা রয়েছে।

মোট, গুণনীয়ক এবং বর্গক্ষেত্রের অবশিষ্ট যোগফলের স্বাধীনতার ডিগ্রির সংখ্যার মধ্যে সমতা রয়েছে। রৈখিক রিগ্রেশনে বর্গক্ষেত্রের অবশিষ্ট যোগফলের স্বাধীনতার ডিগ্রীর সংখ্যা হল (n-2)। বর্গক্ষেত্রের মোট যোগফলের জন্য স্বাধীনতার ডিগ্রীর সংখ্যাটি সংখ্যার দ্বারা নির্ধারিত হয়, এবং যেহেতু আমরা নমুনা ডেটা থেকে গণনা করা গড় ব্যবহার করি, তাই আমরা এক ডিগ্রি স্বাধীনতা হারাই, যেমন (n-1)। সুতরাং, আমাদের দুটি সমতা রয়েছে: যোগফলের জন্য এবং স্বাধীনতার ডিগ্রির সংখ্যার জন্য। এবং এটি, ঘুরে, আমাদের স্বাধীনতার ডিগ্রী প্রতি তুলনীয় বৈচিত্রগুলিতে ফিরিয়ে আনে, যার অনুপাত ফিশার মানদণ্ড দেয়।

25. শিক্ষার্থীর পরীক্ষা ব্যবহার করে রিগ্রেশন সমীকরণ এবং সহগগুলির পৃথক প্যারামিটারের তাত্পর্য মূল্যায়ন করা।

27. রৈখিক এবং অরৈখিক রিগ্রেশন এবং তাদের অধ্যয়নের জন্য পদ্ধতি।

রৈখিক রিগ্রেশন এবং এর গবেষণা ও মূল্যায়নের পদ্ধতিগুলি এত গুরুত্বপূর্ণ হবে না যদি, এই অত্যন্ত গুরুত্বপূর্ণ, কিন্তু এখনও সহজ ক্ষেত্রে, আমরা তাদের সাহায্যে আরও জটিল অরৈখিক নির্ভরতা বিশ্লেষণের জন্য একটি সরঞ্জাম না পাই। অরৈখিক রিগ্রেশন দুটি উল্লেখযোগ্যভাবে ভিন্ন শ্রেণীতে বিভক্ত করা যেতে পারে। প্রথম এবং সহজ হল অরৈখিক নির্ভরতার শ্রেণী যেখানে ব্যাখ্যামূলক ভেরিয়েবলের ক্ষেত্রে অরৈখিকতা রয়েছে, কিন্তু যা তাদের অন্তর্ভুক্ত প্যারামিটারগুলিতে রৈখিক থাকে এবং মূল্যায়ন সাপেক্ষে। এর মধ্যে বহুপদ রয়েছে বিভিন্ন ডিগ্রীএবং একটি সমবাহু হাইপারবোলা।

ব্যাখ্যায় অন্তর্ভুক্ত ভেরিয়েবলের জন্য এই ধরনের অরৈখিক রিগ্রেশন সহজভাবে পরিবর্তন করে (প্রতিস্থাপন) নতুন ভেরিয়েবলের জন্য সাধারণ রৈখিক রিগ্রেশনে কমিয়ে আনা যায়। অতএব, এই ক্ষেত্রে পরামিতিগুলির অনুমান কেবলমাত্র ন্যূনতম বর্গ দ্বারা সঞ্চালিত হয়, যেহেতু নির্ভরতাগুলি পরামিতিতে রৈখিক। সুতরাং, অর্থনীতিতে একটি গুরুত্বপূর্ণ ভূমিকা একটি সমবাহু হাইপারবোলা দ্বারা বর্ণিত অরৈখিক নির্ভরতা দ্বারা অভিনয় করা হয়:

এর পরামিতিগুলি সর্বনিম্ন স্কোয়ার পদ্ধতি ব্যবহার করে ভালভাবে মূল্যায়ন করা হয় এবং এই নির্ভরতা নিজেই কাঁচামাল, জ্বালানী, আউটপুট পরিমাণের সাথে উপকরণের নির্দিষ্ট খরচ, পণ্যের সঞ্চালনের সময় এবং বাণিজ্যের পরিমাণের সাথে এই সমস্ত কারণগুলির মধ্যে সংযোগকে চিহ্নিত করে। টার্নওভার উদাহরণস্বরূপ, ফিলিপস বক্ররেখা বেকারত্বের হার এবং মজুরি বৃদ্ধির শতাংশের মধ্যে অরৈখিক সম্পর্ককে চিহ্নিত করে।

রিগ্রেশনের সাথে পরিস্থিতি সম্পূর্ণ ভিন্ন যেটি অনুমান করা প্যারামিটারগুলিতে অরৈখিক, উদাহরণস্বরূপ, একটি পাওয়ার ফাংশন দ্বারা প্রতিনিধিত্ব করা হয়, যেখানে ডিগ্রী নিজেই (এর সূচক) একটি প্যারামিটার, বা প্যারামিটারের উপর নির্ভর করে। এটি একটি সূচকীয় ফাংশনও হতে পারে, যেখানে ডিগ্রির ভিত্তিটি একটি পরামিতি এবং একটি সূচকীয় ফাংশন, যেখানে আবার নির্দেশকটিতে একটি পরামিতি বা পরামিতিগুলির সংমিশ্রণ থাকে। এই শ্রেণীটি, ঘুরে, দুটি উপশ্রেণীতে বিভক্ত: একটি বাহ্যিকভাবে অরৈখিক, কিন্তু মূলত অভ্যন্তরীণভাবে রৈখিক অন্তর্ভুক্ত। এই ক্ষেত্রে, আপনি রূপান্তর ব্যবহার করে মডেলটিকে একটি রৈখিক আকারে আনতে পারেন। যাইহোক, যদি মডেলটি অভ্যন্তরীণভাবে অরৈখিক হয়, তবে এটি একটি রৈখিক ফাংশনে হ্রাস করা যাবে না।

সুতরাং, রিগ্রেশন বিশ্লেষণে অভ্যন্তরীণভাবে অরৈখিক যে মডেলগুলিকে সত্যিকারের অরৈখিক হিসাবে বিবেচনা করা হয়। অন্য সমস্ত, যা রূপান্তরের মাধ্যমে রৈখিক হ্রাস করা যেতে পারে, সেগুলিকে সেরকম হিসাবে বিবেচনা করা হয় না, এবং তারাই প্রায়শই অর্থনীতির গবেষণায় বিবেচিত হয়। একই সময়ে, এর অর্থ এই নয় যে অর্থনীতিতে অরৈখিক নির্ভরতা অধ্যয়ন করা অসম্ভব। যদি মডেলটি তার পরামিতিগুলিতে অভ্যন্তরীণভাবে অরৈখিক হয়, তবে পরামিতিগুলি অনুমান করার জন্য পুনরাবৃত্তিমূলক পদ্ধতিগুলি ব্যবহার করা হয়, যার সাফল্য ব্যবহৃত পুনরাবৃত্তিমূলক পদ্ধতির বৈশিষ্ট্যগুলির জন্য সমীকরণের ধরণের উপর নির্ভর করে।

চলুন রৈখিক হ্রাস নির্ভরতা ফিরে আসা যাক. যদি তারা প্যারামিটার এবং ভেরিয়েবল উভয় ক্ষেত্রেই অরৈখিক হয়, উদাহরণস্বরূপ, ফর্ম y = একটি X এর শক্তি দ্বারা গুণিত হয়, যার সূচকটি প্যারামিটার -  (বিটা):

স্পষ্টতই, এই ধরনের সম্পর্ক সহজ লগারিদম দ্বারা একটি রৈখিক সমীকরণে রূপান্তরিত হতে পারে।

লগারিদম বোঝানো নতুন ভেরিয়েবল প্রবর্তনের পর, একটি রৈখিক সমীকরণ পাওয়া যায়। রিগ্রেশন অনুমান করার পদ্ধতিটি মূল মানের লগারিদম গ্রহণ করে প্রতিটি পর্যবেক্ষণের জন্য নতুন ভেরিয়েবল গণনা করে। তারপর নতুন ভেরিয়েবলের রিগ্রেশন নির্ভরতা অনুমান করা হয়। মূল ভেরিয়েবলে যাওয়ার জন্য, আপনার অ্যান্টিলগারিদম নেওয়া উচিত, অর্থাৎ, তাদের সূচকের পরিবর্তে শক্তিতে ফিরে আসুন (সর্বশেষে, লগারিদম হল সূচক)। সূচকীয় বা সূচকীয় ফাংশনের ক্ষেত্রেও একইভাবে বিবেচনা করা যেতে পারে।

একটি উল্লেখযোগ্যভাবে অরৈখিক রিগ্রেশনের জন্য, স্বাভাবিক রিগ্রেশন অনুমান পদ্ধতি প্রয়োগ করা সম্ভব নয় কারণ সংশ্লিষ্ট সম্পর্কটিকে রৈখিক রূপে রূপান্তর করা যায় না। কর্মের সাধারণ স্কিম নিম্নরূপ:

1. কিছু যুক্তিসঙ্গত প্রাথমিক পরামিতি মান গৃহীত হয়;

2. পূর্বাভাসিত Y মানগুলি এই প্যারামিটার মানগুলি ব্যবহার করে প্রকৃত X মানগুলি থেকে গণনা করা হয়;

3. অবশিষ্টাংশগুলি নমুনার সমস্ত পর্যবেক্ষণের জন্য গণনা করা হয় এবং তারপর অবশিষ্টগুলির বর্গের সমষ্টি;

4. এক বা একাধিক প্যারামিটার অনুমানে ছোট পরিবর্তন করা হয়;

5. Y এর নতুন পূর্বাভাসিত মান, অবশিষ্টাংশ এবং অবশিষ্টাংশের বর্গক্ষেত্রের যোগফল গণনা করা হয়;

6. অবশিষ্টাংশের বর্গক্ষেত্রের যোগফল যদি আগের থেকে কম হয়, তাহলে নতুন প্যারামিটারের অনুমানগুলি আগেরগুলির থেকে ভাল এবং একটি নতুন শুরু বিন্দু হিসাবে ব্যবহার করা উচিত;

7. ধাপ 4, 5 এবং 6 আবার পুনরাবৃত্তি করা হয় যতক্ষণ না পরামিতি অনুমানে এমন পরিবর্তন করা অসম্ভব হয়ে ওঠে যা বর্গক্ষেত্রের অবশিষ্টাংশের যোগফলের পরিবর্তনের দিকে নিয়ে যায়;

8. এটি উপসংহারে পৌঁছেছে যে বর্গক্ষেত্র অবশিষ্টাংশের যোগফল ন্যূনতম করা হয়েছে এবং চূড়ান্ত পরামিতি অনুমান হল সর্বনিম্ন বর্গ অনুমান।

অরৈখিক ফাংশনগুলির মধ্যে যা হ্রাস করা যেতে পারে রৈখিক ফর্ম, পাওয়ার ফাংশন ব্যাপকভাবে অর্থনীতিতে ব্যবহৃত হয়। প্যারামিটার b এর একটি স্পষ্ট ব্যাখ্যা রয়েছে, এটি একটি স্থিতিস্থাপকতা সহগ। যে মডেলগুলি আনুমানিক প্যারামিটারে অরৈখিক, কিন্তু রৈখিক আকারে হ্রাস করা যেতে পারে, রূপান্তরিত সমীকরণগুলিতে ন্যূনতম বর্গক্ষেত্র প্রয়োগ করা হয়। লগারিদম এবং তদনুসারে, সূচকের ব্যবহারিক ব্যবহার সম্ভব যখন ফলাফল চিহ্নের নেতিবাচক মান থাকে না। ফলস্বরূপ বৈশিষ্ট্যের লগারিদম ব্যবহার করে ফাংশনের মধ্যে সম্পর্কগুলি অধ্যয়ন করার সময়, শক্তি-আইন নির্ভরতা অর্থনীতিতে প্রাধান্য পায় (চাহিদা এবং সরবরাহ বক্ররেখা, উত্পাদন ফাংশন, শোষণ বক্ররেখা পণ্যের শ্রমের তীব্রতা, উত্পাদনের স্কেল, নির্ভরতার মধ্যে সম্পর্ক চিহ্নিত করার জন্য কর্মসংস্থানের স্তরের উপর GNI এর, Engel curves)।

28. বিপরীত মডেল এবং এর ব্যবহার

কখনও কখনও তথাকথিত বিপরীত মডেল ব্যবহার করা হয়, যা অভ্যন্তরীণভাবে অরৈখিক, তবে এটিতে, একটি সমবাহু হাইপারবোলার বিপরীতে, এটি ব্যাখ্যামূলক পরিবর্তনশীল নয় যা রূপান্তর সাপেক্ষে, তবে ফলাফলের বৈশিষ্ট্য Y। অতএব, বিপরীত মডেলটি পরিণত হয় অভ্যন্তরীণভাবে অরৈখিক হতে হবে এবং OLS প্রয়োজনীয়তা Y এর প্রকৃত মানের জন্য এবং তাদের বিপরীত মানের জন্য সন্তুষ্ট নয়। ননলাইনার রিগ্রেশনের পারস্পরিক সম্পর্কের অধ্যয়ন বিশেষ মনোযোগের দাবি রাখে। সাধারণ ক্ষেত্রে, দ্বিতীয় ডিগ্রির একটি প্যারাবোলা, উচ্চতর ক্রমে বহুপদীর মতো, যখন রৈখিক করা হয়, তখন একাধিক রিগ্রেশন সমীকরণের রূপ নেয়। যদি, রৈখিক করা হলে, ব্যাখ্যা করা ভেরিয়েবলের সাপেক্ষে অরৈখিক একটি রিগ্রেশন সমীকরণ একটি রৈখিক জোড়াযুক্ত রিগ্রেশন সমীকরণের রূপ নেয়, তাহলে সম্পর্কের ঘনিষ্ঠতা মূল্যায়ন করতে একটি রৈখিক পারস্পরিক সম্পর্ক সহগ ব্যবহার করা যেতে পারে।

যদি রিগ্রেশন সমীকরণের রৈখিক আকারে রূপান্তরগুলি নির্ভরশীল পরিবর্তনশীল (ফলাফলমূলক বৈশিষ্ট্য) এর সাথে যুক্ত হয়, তবে বৈশিষ্ট্যগুলির রূপান্তরিত মানগুলির উপর ভিত্তি করে রৈখিক পারস্পরিক সম্পর্ক সহগ শুধুমাত্র সম্পর্কের একটি আনুমানিক অনুমান দেয় এবং সংখ্যাগতভাবে এর সাথে মিলিত হয় না পারস্পরিক সম্পর্ক সূচক। এটা মনে রাখা উচিত যে পারস্পরিক সম্পর্ক সূচক গণনা করার সময়, ফলে বৈশিষ্ট্যযুক্ত Y এর বর্গক্ষেত্র বিচ্যুতির যোগফল ব্যবহার করা হয়, তাদের লগারিদম নয়। পারস্পরিক সম্পর্ক সূচকের তাত্পর্য মূল্যায়ন একইভাবে সম্পাদিত হয় যেভাবে পারস্পরিক সম্পর্ক সহগের নির্ভরযোগ্যতা (তাৎপর্য) মূল্যায়ন করা হয়। পারস্পরিক সম্পর্ক সূচক নিজেই, নির্ধারণ সূচকের মতো, ফিশার এফ পরীক্ষা ব্যবহার করে অরৈখিক রিগ্রেশন সমীকরণের সামগ্রিক তাত্পর্য পরীক্ষা করতে ব্যবহৃত হয়।

উল্লেখ্য যে, ননলাইনার মডেল নির্মাণের সম্ভাবনা, উভয়ই তাদের একটি রৈখিক আকারে হ্রাস করে এবং অরৈখিক রিগ্রেশন ব্যবহার করে, একদিকে, রিগ্রেশন বিশ্লেষণের সার্বজনীনতা বৃদ্ধি করে। অন্যদিকে, এটি গবেষকের কাজগুলিকে উল্লেখযোগ্যভাবে জটিল করে তোলে। আমরা যদি নিজেদেরকে জোড়াযুক্ত রিগ্রেশন বিশ্লেষণে সীমাবদ্ধ রাখি, তাহলে আমরা পর্যবেক্ষণগুলি Y এবং Xকে একটি বিক্ষিপ্ত প্লট হিসাবে প্লট করতে পারি। প্রায়শই বিভিন্ন অরৈখিক ফাংশন আনুমানিক পর্যবেক্ষণ করে যদি তারা কিছু বক্ররেখায় থাকে। কিন্তু মাল্টিপল রিগ্রেশন অ্যানালাইসিসের ক্ষেত্রে এই ধরনের গ্রাফ তৈরি করা যায় না।

নির্ভরশীল ভেরিয়েবলের একই সংজ্ঞা সহ বিকল্প মডেল বিবেচনা করার সময়, নির্বাচন পদ্ধতি তুলনামূলকভাবে সহজ। কেউ কল্পনা করা যায় এমন সমস্ত যুক্তিসঙ্গত ফাংশনের উপর ভিত্তি করে একটি রিগ্রেশন অনুমান করতে পারে এবং সেই ফাংশনটি নির্বাচন করতে পারে যা নির্ভরশীল ভেরিয়েবলের পরিবর্তনকে সবচেয়ে বেশি ব্যাখ্যা করে। এটা স্পষ্ট যে যখন একটি রৈখিক ফাংশন y-তে বৈচিত্র্যের প্রায় 64% ব্যাখ্যা করে এবং একটি হাইপারবোলিক ফাংশন 99.9% ব্যাখ্যা করে, তখন স্পষ্টতই পরবর্তীটি বেছে নেওয়া উচিত। কিন্তু যখন বিভিন্ন মডেলবিভিন্ন কার্যকরী ফর্ম ব্যবহার করুন, একটি মডেল নির্বাচন করার সমস্যা উল্লেখযোগ্যভাবে আরো জটিল হয়ে ওঠে।

29. বক্স-কক্স পরীক্ষা ব্যবহার করা।

আরও সাধারণভাবে, নির্ভরশীল পরিবর্তনশীলের একই সংজ্ঞা সহ বিকল্প মডেলগুলি বিবেচনা করার সময়, পছন্দটি সহজ। নির্ভরশীল ভেরিয়েবলের পরিবর্তনকে সবচেয়ে বেশি ব্যাখ্যা করে এমন ফাংশনের উপর ফোকাস করে, সমস্ত যুক্তিসঙ্গত ফাংশনের উপর ভিত্তি করে রিগ্রেশন অনুমান করা সবচেয়ে যুক্তিসঙ্গত। যদি নির্ণয়ের পরিমাপের সহগ, একটি ক্ষেত্রে, রিগ্রেশন দ্বারা ব্যাখ্যা করা বৈকল্পিক অনুপাত, এবং অন্য ক্ষেত্রে, এই নির্ভরশীল চলকের লগারিদমে প্রকরণের অনুপাত রিগ্রেশন দ্বারা ব্যাখ্যা করা হয়, তাহলে পছন্দটি অসুবিধা ছাড়াই করা হয়। এটি অন্য বিষয় যখন দুটি মডেলের জন্য এই মানগুলি খুব কাছাকাছি থাকে এবং পছন্দের সমস্যাটি উল্লেখযোগ্যভাবে আরও জটিল হয়ে যায়।

তারপরে বক্স-কক্স পরীক্ষার আকারে আদর্শ পদ্ধতি প্রয়োগ করা উচিত। আপনি যদি নির্ভরশীল ভেরিয়েবলের একটি বৈকল্পিক আকারে কার্যকর ফ্যাক্টর এবং এর লগারিদম ব্যবহার করে মডেলগুলির তুলনা করতে চান, তাহলে Zarembka পরীক্ষার একটি সংস্করণ ব্যবহার করা হয়। এটি পর্যবেক্ষণ স্কেল Y-এর একটি রূপান্তর প্রস্তাব করে, যা রৈখিক এবং লগারিদমিক মডেলগুলিতে রুট গড় বর্গ ত্রুটি (MSE) এর সরাসরি তুলনা করার অনুমতি দেয়। সংশ্লিষ্ট পদ্ধতিতে নিম্নলিখিত পদক্ষেপগুলি অন্তর্ভুক্ত রয়েছে:

নমুনায় Y মানের জ্যামিতিক গড় গণনা করা হয়, যা Y-এর লগারিদমের পাটিগণিত গড়ের সূচকের সাথে মিলে যায়;

পর্যবেক্ষণ Y এমনভাবে পুনঃগণনা করা হয় যে সেগুলিকে প্রথম ধাপে প্রাপ্ত মান দ্বারা ভাগ করা হয়;

রিগ্রেশন অনুমান করা হয় একটি রৈখিক মডেলের জন্য মূল Y মানের পরিবর্তে স্কেল করা Y মান ব্যবহার করে, এবং একটি লগারিদমিক মডেলের জন্য স্কেল করা Y মানের লগারিদম ব্যবহার করে দুটি রিগ্রেশনের জন্য RMSE মানগুলি এখন তুলনীয় বর্গক্ষেত্র বিচ্যুতির ছোট সমষ্টি সহ মডেলটি পর্যবেক্ষিত মানগুলির সত্যিকারের সম্পর্কের জন্য আরও ভাল ফিট প্রদান করে;

মডেলগুলির মধ্যে একটি উল্লেখযোগ্যভাবে ভাল ফিট প্রদান করে না তা পরীক্ষা করার জন্য, কেউ পুনরায় গণনা করা রিগ্রেশনে RMSE মানের অনুপাতের লগারিদমের অর্ধেক সংখ্যক পর্যবেক্ষণের গুণফল ব্যবহার করতে পারে এবং তারপর গ্রহণ করতে পারে পরম মানএই মান।

30. আন্তঃসম্পর্কের ধারণা এবং কারণগুলির বহুসংখ্যা।

34. MNC এর মৌলিক বিষয় এবং এর আবেদনের বৈধতা।

আসুন এখন আমরা OLS এর মূল বিষয়, এর প্রয়োগের বৈধতা (একাধিক রিগ্রেশন সমস্যা সহ) এবং OLS ব্যবহার করে প্রাপ্ত অনুমানের সবচেয়ে গুরুত্বপূর্ণ বৈশিষ্ট্যগুলিতে ফিরে আসি। আসুন এই সত্যটি দিয়ে শুরু করি যে, রিগ্রেশন সমীকরণের ডানদিকে বিশ্লেষণাত্মক নির্ভরতার পাশাপাশি, এলোমেলো শব্দটিও একটি গুরুত্বপূর্ণ ভূমিকা পালন করে। এই এলোমেলো উপাদানটি একটি অদৃশ্য পরিমাণ। সামি পরিসংখ্যানগত পরীক্ষারিগ্রেশন প্যারামিটার এবং পারস্পরিক সম্পর্ক ব্যবস্থা একাধিক রিগ্রেশনের এই এলোমেলো উপাদানের বন্টন সম্পর্কে অপ্রত্যাশিত অনুমানের উপর ভিত্তি করে। এই অনুমান শুধুমাত্র প্রাথমিক. রিগ্রেশন সমীকরণটি তৈরি করার পরেই এটি পরীক্ষা করা হয় যে এলোমেলো অবশিষ্টাংশের অনুমান (এলোমেলো উপাদানের অভিজ্ঞতামূলক অ্যানালগ) বৈশিষ্ট্যগুলি একটি অগ্রাধিকার ধরে নিয়েছে কিনা। মূলত, যখন মডেলের পরামিতিগুলি অনুমান করা হয়, তখন ফলাফলের বৈশিষ্ট্যের তাত্ত্বিক এবং বাস্তব মানের মধ্যে পার্থক্যগুলি গণনা করা হয় যাতে এইভাবে এলোমেলো উপাদানটি নিজেই অনুমান করা যায়। এটা মনে রাখা গুরুত্বপূর্ণ যে এটি একটি প্রদত্ত সমীকরণের অজানা অবশিষ্টাংশের একটি নমুনা বাস্তবায়ন মাত্র।

স্বাভাবিক সমীকরণের একটি সিস্টেম থেকে প্রাপ্ত রিগ্রেশন সহগ হল সম্পর্কের শক্তির নমুনা অনুমান। এটা স্পষ্ট যে তাদের ব্যবহারিক তাৎপর্য তখনই থাকে যখন তারা নিরপেক্ষ হয়। আমাদের স্মরণ করা যাক যে এই ক্ষেত্রে অবশিষ্টাংশের গড় শূন্যের সমান, বা, যা একই, অনুমানের গড় অনুমান করা প্যারামিটারের সমান। তারপরে অবশিষ্টাংশগুলি প্রচুর পরিমাণে নমুনা অনুমানের উপর জমা হবে না এবং পাওয়া রিগ্রেশন প্যারামিটারটিকেই নিরপেক্ষ অনুমানের একটি বড় সংখ্যার গড় হিসাবে বিবেচনা করা যেতে পারে।

উপরন্তু, অনুমানগুলির ক্ষুদ্রতম বৈচিত্র্য থাকা উচিত, যেমন কার্যকর হবে এবং তারপর কার্যত অব্যবহারযোগ্য বিন্দু অনুমান থেকে ব্যবধান অনুমানে সরানো সম্ভব হবে। পরিশেষে, আত্মবিশ্বাসের ব্যবধানগুলি উপযোগী হয় যখন প্যারামিটারের সত্য (অজানা) মান থেকে একটি নির্দিষ্ট দূরত্বে একটি অনুমান পাওয়ার সম্ভাবনা একের কাছাকাছি হয়। এই ধরনের অনুমানগুলিকে সামঞ্জস্যপূর্ণ বলা হয় এবং সামঞ্জস্যের বৈশিষ্ট্যগুলি নমুনার আকার বৃদ্ধির সাথে তাদের নির্ভুলতা বৃদ্ধির দ্বারা চিহ্নিত করা হয়।

যাইহোক, সামঞ্জস্য অবস্থা স্বয়ংক্রিয়ভাবে সন্তুষ্ট হয় না এবং উল্লেখযোগ্যভাবে নিম্নলিখিত দুটি গুরুত্বপূর্ণ প্রয়োজনীয়তা পূরণের উপর নির্ভর করে। প্রথমত, অবশিষ্টাংশগুলিকে অবশ্যই সর্বাধিক উচ্চারিত এলোমেলোতার সাথে স্টোকাস্টিক হতে হবে, যেমন সমস্ত স্পষ্টভাবে কার্যকরী নির্ভরতাগুলিকে একাধিক রিগ্রেশনের বিশ্লেষণাত্মক উপাদানে বিশেষভাবে অন্তর্ভুক্ত করতে হবে, এবং উপরন্তু, অবশিষ্টাংশের মানগুলিকে আলাদা নমুনার জন্য একে অপরের থেকে স্বাধীনভাবে বিতরণ করা আবশ্যক (অবশিষ্টগুলির কোন স্বয়ংক্রিয় সম্পর্ক নেই)। দ্বিতীয়, কোন কম গুরুত্বপূর্ণ প্রয়োজনীয়তা হল যে প্রতিটি বিচ্যুতি (অবশিষ্ট) এক্স ভেরিয়েবলের সমস্ত মানের জন্য অভিন্ন হবে (হোমোসেড্যাস্টিসিটি)। সেগুলো. সমজাতীয়তা সমস্ত পর্যবেক্ষণের বৈচিত্র্যের স্থায়িত্ব দ্বারা প্রকাশ করা হয়:

বিপরীতভাবে, ভিন্ন ভিন্ন পর্যবেক্ষণের জন্য ভিন্নতার এই ধরনের স্থায়িত্বের লঙ্ঘন হল হেটেরোসেডেস্টিসিটি। এই ক্ষেত্রে, নমুনায় বিভিন্ন পর্যবেক্ষণের জন্য এলোমেলো শব্দের বিভিন্ন তাত্ত্বিক বন্টন সহ অত্যন্ত বিচ্যুত মান প্রাপ্তির অগ্রাধিকার (পর্যবেক্ষণের আগে) সম্ভাবনা তুলনামূলকভাবে বেশি হবে।

অবশিষ্টাংশের স্বতঃসম্পর্ক, বা বর্তমান এবং পূর্ববর্তী (পরবর্তী) পর্যবেক্ষণের অবশিষ্টাংশের মধ্যে একটি পারস্পরিক সম্পর্কের উপস্থিতি, স্বাভাবিক রৈখিক পারস্পরিক সম্পর্ক সহগের মান দ্বারা নির্ধারিত হয়। যদি এটি শূন্য থেকে উল্লেখযোগ্যভাবে পৃথক হয়, তবে অবশিষ্টাংশগুলি স্বয়ংক্রিয়ভাবে সম্পর্কিত এবং সেইজন্য, সম্ভাব্য ঘনত্ব ফাংশন (অবশিষ্টগুলির বিতরণ) পর্যবেক্ষণ বিন্দুর উপর এবং অন্যান্য পর্যবেক্ষণ বিন্দুতে অবশিষ্ট মানগুলির বিতরণের উপর নির্ভর করে। উপলব্ধ পরিসংখ্যানগত তথ্য ব্যবহার করে অবশিষ্টাংশের স্বতঃসম্পর্ক নির্ধারণ করা সুবিধাজনক যদি এক্স ফ্যাক্টর দ্বারা পর্যবেক্ষণের একটি ক্রম থাকে। অবশিষ্টাংশের স্বতঃসম্পর্কের অনুপস্থিতি রিগ্রেশন সহগগুলির অনুমানের ধারাবাহিকতা এবং কার্যকারিতা নিশ্চিত করে।

35. হোমোসেডেস্টিসিটি এবং হেটেরোসেডেস্টিসিটি, অবশিষ্টাংশের স্বতঃসম্পর্ক, সর্বনিম্ন বর্গক্ষেত্র (GLM)।

OLS ব্যবহার করে রিগ্রেশন প্যারামিটারগুলির সামঞ্জস্যপূর্ণ অনুমান পাওয়ার জন্য X ভেরিয়েবলের সমস্ত মানের জন্য অবশিষ্টাংশের বৈচিত্রের একইতা, বা হোমোসেড্যাস্টিসিটিও একেবারে প্রয়োজনীয়। হোমোসেডেস্টিসিটি শর্ত পূরণ করতে ব্যর্থতা তথাকথিত হেটেরোসেডেস্টিসিটির দিকে পরিচালিত করে। এটি রিগ্রেশন সহগগুলির পক্ষপাতমূলক অনুমানের দিকে পরিচালিত করতে পারে। Heteroscedasticity প্রধানত রিগ্রেশন সহগ অনুমানের কার্যকারিতা হ্রাসকে প্রভাবিত করবে। এই ক্ষেত্রে, রিগ্রেশন সহগের মানক ত্রুটির সূত্রটি ব্যবহার করা বিশেষত কঠিন হয়ে ওঠে, যার ব্যবহার ফ্যাক্টরের যে কোনও মানের জন্য অবশিষ্টাংশগুলির একটি অভিন্ন বিচ্ছুরণ অনুমান করে। রিগ্রেশন সহগগুলির অনুমানের নিরপেক্ষতার জন্য, এটি প্রাথমিকভাবে অবশিষ্টাংশের স্বাধীনতা এবং উপাদানগুলির মানগুলির উপর নির্ভর করে।

একটি মোটামুটি পরিষ্কার, যদিও অ-কঠোর এবং দক্ষতা-প্রয়োজনীয় উপায় হল হোমোসেড্যাস্টিটি পরীক্ষা করার জন্য গড় গণনা করা (তাত্ত্বিক) ফলাফলের বৈশিষ্ট্য, বা সংশ্লিষ্ট পারস্পরিক সম্পর্ক ক্ষেত্রগুলির উপর অবশিষ্টাংশের নির্ভরতার প্রকৃতি গ্রাফিকভাবে অধ্যয়ন করা। অধ্যয়ন এবং heteroscedasticity মূল্যায়নের জন্য বিশ্লেষণাত্মক পদ্ধতি আরো কঠোর. যদি হেটেরোসেডেস্টিসিটির উল্লেখযোগ্য উপস্থিতি থাকে তবে OLS এর পরিবর্তে সাধারণীকৃত OLS (GLM) ব্যবহার করার পরামর্শ দেওয়া হয়।

ওএলএস ব্যবহার থেকে উদ্ভূত একাধিক রিগ্রেশনের প্রয়োজনীয়তা ছাড়াও, মডেলে অন্তর্ভুক্ত ভেরিয়েবলের শর্তগুলি মেনে চলাও প্রয়োজনীয়। এর মধ্যে প্রথমত, একটি নির্দিষ্ট ভলিউম পর্যবেক্ষণের জন্য মডেল ফ্যাক্টরগুলির সংখ্যা সম্পর্কিত প্রয়োজনীয়তাগুলি অন্তর্ভুক্ত করে (1 থেকে 7)। অন্যথায়, রিগ্রেশন প্যারামিটারগুলি পরিসংখ্যানগতভাবে নগণ্য হবে। LSM প্রয়োগ করার সময় সংশ্লিষ্ট সংখ্যাগত পদ্ধতি প্রয়োগের কার্যকারিতার দৃষ্টিকোণ থেকে, পর্যবেক্ষণের সংখ্যা আনুমানিক পরামিতিগুলির সংখ্যাকে ছাড়িয়ে যাওয়া প্রয়োজন (একটি সমীকরণের সিস্টেমে, সমীকরণের সংখ্যা চাওয়া সংখ্যার চেয়ে বেশি ভেরিয়েবল)।

অর্থনীতির সবচেয়ে উল্লেখযোগ্য অর্জন হল অজানা পরামিতিগুলি অনুমান করার পদ্ধতিগুলির উল্লেখযোগ্য বিকাশ এবং বিবেচনাধীন প্রভাবগুলির স্ট্যাটিক তাত্পর্য সনাক্ত করার জন্য মানদণ্ডের উন্নতি। এই বিষয়ে, ভিন্ন মাত্রায় উদ্ভাসিত ভিন্ন ভিন্ন মাত্রায় উদ্ভাসিত হওয়ার কারণে ঐতিহ্যগত OLS ব্যবহার করার অসম্ভবতা বা অপ্রয়োজনীয়তা একটি সাধারণীকৃত OLS (GLM) এর বিকাশের দিকে পরিচালিত করে। প্রকৃতপক্ষে, এর মধ্যে রয়েছে মডেল সামঞ্জস্য করা, এর স্পেসিফিকেশন পরিবর্তন করা এবং রিগ্রেশন সহগগুলির নিরপেক্ষ, দক্ষ এবং সামঞ্জস্যপূর্ণ অনুমান নিশ্চিত করতে মূল ডেটা রূপান্তর করা।

এটা ধরে নেওয়া হয় যে অবশিষ্টাংশের গড় শূন্য, কিন্তু তাদের বিচ্ছুরণ আর ধ্রুবক নয়, তবে K i এর মানের সাথে সমানুপাতিক, যেখানে এই মানগুলি সমানুপাতিক সহগ যা বিভিন্ন মানের জন্য আলাদা ফ্যাক্টর x। এইভাবে, এই সহগগুলি (K i মান) যা বিচ্ছুরণের ভিন্নতাকে চিহ্নিত করে। স্বাভাবিকভাবেই, এটি বিশ্বাস করা হয় যে বিচ্ছুরণের পরিমাণ নিজেই, যা এই আনুপাতিকতার সহগগুলির জন্য একটি সাধারণ ফ্যাক্টর, অজানা।

মূল মডেল, একাধিক রিগ্রেশন সমীকরণে এই সহগগুলি প্রবর্তন করার পরে, হেটেরোসেডেস্টিক থেকে যায় (আরো স্পষ্টভাবে, এইগুলি মডেলের অবশিষ্ট মান)। এই অবশিষ্টাংশ (অবশিষ্ট) স্বয়ংক্রিয় সম্পর্কযুক্ত করা যাক না. আনুপাতিকতা সহগ K i এর বর্গমূল দ্বারা i-ম পর্যবেক্ষণের ফলে রেকর্ড করা প্রাথমিক মডেল ভেরিয়েবলগুলিকে ভাগ করে প্রাপ্ত নতুন ভেরিয়েবলগুলি প্রবর্তন করা যাক। তারপরে আমরা রূপান্তরিত ভেরিয়েবলগুলিতে একটি নতুন সমীকরণ পাই, যেখানে অবশিষ্টাংশগুলি হোমোসেডস্টিক হবে। নতুন ভেরিয়েবলগুলি নিজেই ওজনযুক্ত পুরানো (মূল) ভেরিয়েবল।

অতএব, হোমোসেডেস্টিক অবশিষ্টাংশের সাথে এইভাবে প্রাপ্ত নতুন সমীকরণের পরামিতিগুলির অনুমান ওজনযুক্ত সর্বনিম্ন বর্গ পদ্ধতিতে হ্রাস করা হবে (সারাংশে, এটি হল ওএলএস পদ্ধতি)। যখন রিগ্রেশন ভেরিয়েবলের পরিবর্তে ব্যবহার করা হয়, তখন গড় থেকে তাদের বিচ্যুতি, রিগ্রেশন সহগগুলির অভিব্যক্তিগুলি একটি সহজ এবং প্রমিত (ইউনিফর্ম) ফর্ম ধারণ করে, লব এবং হর-এর সংশোধন ফ্যাক্টর 1/K দ্বারা OLS এবং OLS-এর জন্য কিছুটা আলাদা। রিগ্রেশন সহগ প্রদানকারী ভগ্নাংশের।

এটি মনে রাখা উচিত যে রূপান্তরিত (সামঞ্জস্য) মডেলের পরামিতিগুলি আনুপাতিকতার সহগ K i-এর ভিত্তি হিসাবে কী ধারণা ব্যবহার করা হয় তার উপর উল্লেখযোগ্যভাবে নির্ভর করে। এটা প্রায়ই অনুমান করা হয় যে অবশিষ্টাংশগুলি কেবল ফ্যাক্টর মানের সমানুপাতিক। মডেলটি তার সহজতম রূপ নেয় যখন অনুমানটি গৃহীত হয় যে ত্রুটিগুলি ক্রম অনুসারে শেষ ফ্যাক্টরের মানগুলির সমানুপাতিক। তারপর OLS মূল উৎস ভেরিয়েবলের সাথে স্ট্যান্ডার্ড OLS-এর অপারেশনের তুলনায় রিগ্রেশন প্যারামিটার নির্ধারণ করার সময় রূপান্তরিত ভেরিয়েবলের ছোট মানের সাথে পর্যবেক্ষণের ওজন বাড়ানো সম্ভব করে। কিন্তু এই নতুন ভেরিয়েবলগুলি ইতিমধ্যে একটি ভিন্ন অর্থনৈতিক বিষয়বস্তু গ্রহণ করে।

ফ্যাক্টরের আকারের সাথে অবশিষ্টাংশের আনুপাতিকতা সম্পর্কে অনুমানের একটি বাস্তব ভিত্তি থাকতে পারে। ডেটার একটি নির্দিষ্ট অপর্যাপ্ত সমজাতীয় সেট প্রক্রিয়া করা যাক, উদাহরণস্বরূপ, একই সময়ে বড় এবং ছোট উদ্যোগগুলি সহ। তারপর ফ্যাক্টরের বড় ভলিউমেট্রিক মানগুলি ফলাফলের বৈশিষ্ট্যের একটি বৃহৎ বিচ্ছুরণ এবং অবশিষ্ট মানের একটি বৃহৎ বিচ্ছুরণ উভয়ের সাথে মিলে যেতে পারে। আরও, ওএলএস ব্যবহার এবং আপেক্ষিক মানগুলির সাথে সম্পর্কিত রূপান্তর শুধুমাত্র ফ্যাক্টর বৈচিত্র্যকে হ্রাস করে না, তবে ত্রুটির পার্থক্যকেও হ্রাস করে। সুতরাং, রিগ্রেশন মডেলগুলিতে হেটেরোস্কেড্যাস্টিসিটি বিবেচনায় নেওয়া এবং সংশোধন করার সহজতম ক্ষেত্রে ওএলএস ব্যবহারের মাধ্যমে উপলব্ধি করা হয়।

ওজনযুক্ত OLS আকারে OLS বাস্তবায়নের উপরোক্ত পদ্ধতিটি বেশ ব্যবহারিক - এটি সহজভাবে বাস্তবায়িত এবং একটি স্বচ্ছ অর্থনৈতিক ব্যাখ্যা রয়েছে। অবশ্যই, এটি সবচেয়ে সাধারণ পদ্ধতি নয়, এবং গাণিতিক পরিসংখ্যানের পরিপ্রেক্ষিতে, যা অর্থনীতির তাত্ত্বিক ভিত্তি হিসাবে কাজ করে, আমাদেরকে একটি আরও কঠোর পদ্ধতি অফার করা হয় যা OLS-কে প্রয়োগ করে সাধারণ দৃষ্টিকোণ. এটিতে, আপনাকে ত্রুটি ভেক্টর (অবশিষ্ট কলাম) এর কোভেরিয়েন্স ম্যাট্রিক্স জানতে হবে। এবং এটি ব্যবহারিক পরিস্থিতিতে সাধারণত অন্যায্য, এবং এই ম্যাট্রিক্সটিকে এমনভাবে খুঁজে পাওয়া অসম্ভব হতে পারে। অতএব, সাধারণভাবে বলতে গেলে, ম্যাট্রিক্সের পরিবর্তে সংশ্লিষ্ট সূত্রগুলিতে এই জাতীয় অনুমান ব্যবহার করার জন্য প্রয়োজনীয় ম্যাট্রিক্সের অনুমান করা প্রয়োজন। সুতরাং, OMNC বাস্তবায়নের বর্ণিত সংস্করণটি এই ধরনের অনুমানের একটিকে উপস্থাপন করে। একে কখনও কখনও অ্যাক্সেসযোগ্য সাধারণীকৃত সর্বনিম্ন বর্গ বলা হয়।

এটিও বিবেচনায় নেওয়া উচিত যে ওএলএস ব্যবহার করার সময় সংকল্পের গুণাঙ্কটি উপযুক্ত গুণমানের একটি সন্তোষজনক পরিমাপ হিসাবে কাজ করতে পারে না। ওএলএস-এর ব্যবহারে ফিরে এসে, আমরা আরও লক্ষ করি যে সাদা আকারে স্ট্যান্ডার্ড বিচ্যুতি (স্ট্যান্ডার্ড ত্রুটি) ব্যবহার করার পদ্ধতির (হিটারোসেডেস্টিসিটির উপস্থিতিতে তথাকথিত সামঞ্জস্যপূর্ণ মান ত্রুটি) যথেষ্ট সাধারণতা রয়েছে। এই পদ্ধতিটি প্রযোজ্য যদি ত্রুটি ভেক্টরের কোভেরিয়েন্স ম্যাট্রিক্স তির্যক হয়। যদি অবশিষ্টাংশের (ত্রুটির) স্বতঃসম্পর্ক থাকে, যখন কোভ্যারিয়েন্স ম্যাট্রিক্সে এবং মূল কর্ণের বাইরে অ-শূন্য উপাদান (গুণ) থাকে, তাহলে নেভ ওয়েস্ট ফর্মে আরও সাধারণ স্ট্যান্ডার্ড ত্রুটি পদ্ধতি ব্যবহার করা উচিত। একটি উল্লেখযোগ্য সীমাবদ্ধতা রয়েছে: প্রধান তির্যক ছাড়াও অ-শূন্য উপাদানগুলি কেবলমাত্র সন্নিহিত কর্ণগুলিতে পাওয়া যায়, মূল কর্ণ থেকে নির্দিষ্ট পরিমাণের বেশি ব্যবধান নয়।

উপরোক্ত থেকে এটা স্পষ্ট যে heteroskedasticity জন্য ডেটা চেক করতে সক্ষম হওয়া প্রয়োজন। নীচের পরীক্ষাগুলি এই উদ্দেশ্যে পরিবেশন করে। তারা বিকল্প অনুমানের বিপরীতে অবশিষ্টাংশের বৈচিত্র্যের সমতা সম্পর্কে মূল অনুমান পরীক্ষা করে (এই অনুমানের অসমতা সম্পর্কে)। উপরন্তু, heteroscedasticity প্রকৃতির উপর একটি অগ্রাধিকার কাঠামোগত সীমাবদ্ধতা আছে। গোল্ডফেল্ড-কোয়ান্ড্ট পরীক্ষা সাধারণত এই ধারণাটি ব্যবহার করে যে ত্রুটির প্রকরণ (অবশিষ্ট) কিছু স্বাধীন পরিবর্তনশীলের মানের উপর সরাসরি নির্ভরশীল। এই পরীক্ষাটি ব্যবহার করার স্কিমটি নিম্নরূপ। প্রথমত, ডেটাগুলি স্বাধীন ভেরিয়েবলের নিচের ক্রম অনুসারে সাজানো হয় যার জন্য হেটেরোসেডেস্টিসিটি সন্দেহ করা হয়। এই অর্ডার করা ডেটা সেটটি গড় কিছু পর্যবেক্ষণকে সরিয়ে দেয়, যেখানে "কয়েক" শব্দের অর্থ প্রায় এক চতুর্থাংশ (25%) মোট সংখ্যাসমস্ত পর্যবেক্ষণ। এর পরে, দুটি স্বাধীন রিগ্রেশন বাকী (বর্জন করার পরে) গড় পর্যবেক্ষণের প্রথমটিতে এবং এই অবশিষ্ট গড় পর্যবেক্ষণগুলির শেষ দুটিতে চালানো হয়। এর পরে, দুটি সংশ্লিষ্ট অবশিষ্টাংশ নির্মিত হয়। অবশেষে, ফিশার এফ পরিসংখ্যান সংকলিত হয় এবং যদি অধ্যয়নের অধীনে অনুমানটি সত্য হয়, তবে F প্রকৃতপক্ষে স্বাধীনতার উপযুক্ত ডিগ্রি সহ ফিশার বিতরণ। তারপর এই পরিসংখ্যানের একটি বড় মান মানে হল যে হাইপোথিসিস পরীক্ষা করা হচ্ছে তা অবশ্যই প্রত্যাখ্যান করতে হবে। নির্মূল পদক্ষেপ ছাড়া, এই পরীক্ষার শক্তি হ্রাস করা হয়।

ব্রুশ-প্যাগান পরীক্ষাটি এমন ক্ষেত্রে ব্যবহৃত হয় যেখানে এটি একটি অগ্রাধিকার বলে ধরে নেওয়া হয় যে বৈচিত্রগুলি কিছু অতিরিক্ত ভেরিয়েবলের উপর নির্ভর করে। প্রথমত, সাধারণ (মান) রিগ্রেশন সঞ্চালিত হয় এবং অবশিষ্টাংশের একটি ভেক্টর পাওয়া যায়। তারপর একটি প্রকরণ অনুমান নির্মিত হয়। এরপরে, অভিজ্ঞতামূলক বৈচিত্র (ভেরিয়েন্স অনুমান) দ্বারা বিভক্ত অবশিষ্টাংশের বর্গ ভেক্টরের একটি রিগ্রেশন সঞ্চালিত হয়। এর জন্য (রিগ্রেশন), প্রকরণের ব্যাখ্যাকৃত অংশ পাওয়া যায়। এবং এই প্রকরণের ব্যাখ্যা করা অংশের জন্য, অর্ধেক বিভক্ত, পরিসংখ্যান তৈরি করা হয়। যদি নাল হাইপোথিসিসটি সত্য হয় (কোনও হেটেরোস্কডেস্টিসিটি সত্য নয়), তাহলে এই মানটির একটি বন্টন আছে হি-বর্গক্ষেত্র। যদি পরীক্ষা, বিপরীতে, heteroskedasticity প্রকাশ করে, তাহলে মূল মডেলটি পর্যবেক্ষিত স্বাধীন চলকের ভেক্টরের অনুরূপ উপাদানগুলির দ্বারা অবশিষ্টাংশের ভেক্টরের উপাদানগুলিকে ভাগ করে রূপান্তরিত হয়।

36. সাদা আকারে স্ট্যান্ডার্ড বিচ্যুতি পদ্ধতি।

নিম্নলিখিত সিদ্ধান্তে টানা যেতে পারে। Heteroskedasticity উপস্থিতিতে OLS-এর ব্যবহার ওজনযুক্ত বর্গক্ষেত্র বিচ্যুতির যোগফলকে হ্রাস করার জন্য নেমে আসে। উপলব্ধ ওএলএসের ব্যবহার আনুমানিক পরামিতিগুলির সংখ্যা ছাড়িয়ে প্রচুর পরিমাণে পর্যবেক্ষণের প্রয়োজনের সাথে যুক্ত। OLS ব্যবহার করার জন্য সবচেয়ে অনুকূল ক্ষেত্রে হল সেই ক্ষেত্রে যখন ত্রুটি (অবশিষ্ট) স্বাধীন ভেরিয়েবলগুলির একটির সমানুপাতিক হয় এবং ফলস্বরূপ অনুমানগুলি সামঞ্জস্যপূর্ণ হয়। তা সত্ত্বেও, যদি ভিন্ন ভিন্ন মডেলে ওএলএস নয়, স্ট্যান্ডার্ড ওএলএস ব্যবহার করা প্রয়োজন, তাহলে সামঞ্জস্যপূর্ণ অনুমান পেতে, কেউ হোয়াইট বা নেভজে-ওয়েস্ট ফর্মে ত্রুটির অনুমান ব্যবহার করতে পারেন।

সময় সিরিজ বিশ্লেষণ করার সময়, বিভিন্ন সময়ে বিভিন্ন সময়ে পর্যবেক্ষণের পরিসংখ্যান নির্ভরতা বিবেচনায় নেওয়া প্রয়োজন। এই ক্ষেত্রে, অসম্পর্কিত ত্রুটির অনুমান সন্তুষ্ট নয়। চলো বিবেচনা করি সহজ মডেল, যেখানে ত্রুটিগুলি একটি প্রথম-ক্রম অটোরিগ্রেসিভ প্রক্রিয়া গঠন করে। এই ক্ষেত্রে, ত্রুটিগুলি একটি সাধারণ পুনরাবৃত্তি সম্পর্ককে সন্তুষ্ট করে, যার ডানদিকে একটি পদটি শূন্য গড় এবং ধ্রুবক বৈচিত্র সহ স্বাধীনভাবে বিতরণ করা র্যান্ডম ভেরিয়েবলের একটি ক্রম। দ্বিতীয় শব্দটি হল পরামিতির গুণফল (অটোরিগ্রেশন সহগ) এবং সময়ের পূর্ববর্তী বিন্দুতে অবশিষ্টাংশের মান। ত্রুটির মানের ক্রম (অবশিষ্ট) নিজেই একটি স্থির এলোমেলো প্রক্রিয়া গঠন করে। একটি স্থির এলোমেলো প্রক্রিয়া সময়ের সাথে সাথে এর বৈশিষ্ট্যগুলির স্থায়িত্ব দ্বারা চিহ্নিত করা হয়, বিশেষ করে, গড় এবং প্রকরণ। এই ক্ষেত্রে, প্যারামিটারের ক্ষমতা ব্যবহার করে আমাদের আগ্রহের কোভেরিয়েন্স ম্যাট্রিক্স (এর শর্তাবলী) সহজেই লেখা যেতে পারে।

একটি পরিচিত প্যারামিটারের জন্য একটি অটোরিগ্রেসিভ মডেলের অনুমান OLS ব্যবহার করে সঞ্চালিত হয়। এই ক্ষেত্রে, এটি একটি মডেলে একটি সাধারণ রূপান্তর দ্বারা মূল মডেলটিকে হ্রাস করার জন্য যথেষ্ট যার ত্রুটিগুলি একটি স্ট্যান্ডার্ড রিগ্রেশন মডেলের শর্তগুলিকে সন্তুষ্ট করে। এটি খুব বিরল, তবে এখনও এমন একটি পরিস্থিতি রয়েছে যেখানে অটোরিগ্রেশন প্যারামিটারটি পরিচিত। অতএব, সাধারণত একটি অজানা অটোরিগ্রেসিভ প্যারামিটার দিয়ে অনুমান করা প্রয়োজন। এই ধরনের মূল্যায়নের জন্য তিনটি সর্বাধিক ব্যবহৃত পদ্ধতি রয়েছে। Cochrane-Orcutt পদ্ধতি, Hildreth-Lu পদ্ধতি এবং Durbin পদ্ধতি।

সাধারণভাবে, নিম্নলিখিত সিদ্ধান্তগুলি সত্য। টাইম সিরিজ বিশ্লেষণের জন্য প্রচলিত OLS-এর সংশোধন প্রয়োজন, যেহেতু এই ক্ষেত্রে ত্রুটিগুলি সাধারণত পারস্পরিক সম্পর্কযুক্ত। প্রায়শই এই ত্রুটিগুলি একটি প্রথম-ক্রম স্থির অটোরিগ্রেসিভ প্রক্রিয়া গঠন করে। প্রথম-ক্রম অটোরিগ্রেশনের জন্য OLS অনুমানকারীরা নিরপেক্ষ, সামঞ্জস্যপূর্ণ, কিন্তু অকার্যকর। একটি পরিচিত অটোরিগ্রেশন সহগ সহ, OLS মূল সিস্টেমের সাধারণ রূপান্তর (সংশোধন) এবং তারপরে আদর্শ OLS প্রয়োগে হ্রাস করে। যদি, প্রায়শই ক্ষেত্রে, অটোরিগ্রেসিভ সহগ অজানা থাকে, তাহলে ওএলএস-এর জন্য বেশ কয়েকটি পদ্ধতি উপলব্ধ রয়েছে, যা অজানা পরামিতি (গুণ) অনুমান করার জন্য গঠিত, যার পরে পরিচিতের পূর্ববর্তী ক্ষেত্রের মতো একই রূপান্তরগুলি প্রয়োগ করা হয়। প্যারামিটার

37. ব্রুশ-প্যাগান পরীক্ষার ধারণা, গোল্ডফেল্ড-কোয়ান্ড্ট পরীক্ষা

উৎস ডেটার আনুমানিক কিছু পদ্ধতি প্রয়োগ করার সময় আনুমানিক ত্রুটি হল সবচেয়ে ঘন ঘন উদ্ভূত সমস্যাগুলির মধ্যে একটি। বিভিন্ন ধরণের আনুমানিক ত্রুটি রয়েছে:

উৎস তথ্য ত্রুটির সাথে যুক্ত ত্রুটি;

আনুমানিক মডেল এবং আনুমানিক ডেটার কাঠামোর মধ্যে পার্থক্যের সাথে সম্পর্কিত ত্রুটি৷

এক্সেলের ডেটা প্রসেসিং এবং আনুমানিকতার জন্য একটি সু-বিকশিত লিনিয়ার ফাংশন রয়েছে যা পরিশীলিত গণিত ব্যবহার করে। এটি সম্পর্কে ধারণা পাওয়ার জন্য, আসুন (F1 এর মাধ্যমে) এই বিকাশের বর্ণনামূলক অংশে ফিরে যাই, যা আমরা সংক্ষিপ্ত রূপ এবং স্বরলিপিতে কিছু পরিবর্তন সহ উপস্থাপন করি।

উপলব্ধ ডেটার সাথে সবচেয়ে উপযুক্ত সরলরেখা গণনা করতে সর্বনিম্ন বর্গক্ষেত্র ব্যবহার করে একটি সিরিজের পরিসংখ্যান গণনা করে৷ ফাংশনটি একটি অ্যারে প্রদান করে যা ফলাফলের লাইনটি বর্ণনা করে। যেহেতু মানগুলির একটি অ্যারে ফেরত দেওয়া হয়, ফাংশনটি অবশ্যই একটি অ্যারে সূত্র হিসাবে নির্দিষ্ট করা উচিত।

সরলরেখার সমীকরণ হল:

y=a+b1*x1+b2*x2+...bn*xn

বাক্য গঠন:

LINEST(y;x;const;পরিসংখ্যান)

অ্যারে y - পরিচিত মান y

অ্যারে x - x এর পরিচিত মান। x অ্যারেতে এক বা একাধিক সেট ভেরিয়েবল থাকতে পারে।

কনস্ট হল বুলিয়ান মান, যা সুনির্দিষ্ট করে যে ডামি শব্দ a-এর সমান 0 হতে হবে কিনা।

যদি const আর্গুমেন্ট TRUE, 1, বা বাদ দেওয়া হয়, তাহলে a কে যথারীতি মূল্যায়ন করা হয়। যদি কনস্ট আর্গুমেন্ট FALSE বা 0 হয়, তাহলে a 0 এ সেট করা হয়।

পরিসংখ্যান হল একটি বুলিয়ান মান যা নির্দেশ করে যে অতিরিক্ত রিগ্রেশন পরিসংখ্যান ফেরত দেওয়া উচিত কিনা। যদি পরিসংখ্যান যুক্তিটি সত্য বা 1 হয়, তাহলে LINEST অতিরিক্ত রিগ্রেশন পরিসংখ্যান প্রদান করে। যদি পরিসংখ্যান FALSE, 0, বা বাদ দেওয়া হয়, তাহলে LINEST শুধুমাত্র সহগ এবং ইন্টারসেপ্ট প্রদান করে।

অতিরিক্ত রিগ্রেশন পরিসংখ্যান:

se1,se2,...,sen - সহগ b1,b2,...,bn এর জন্য আদর্শ ত্রুটির মান।

sea - ধ্রুবক a (sea = #N/A যদি const FALSE হয়) এর মানক ত্রুটির মান।

r2 হল নির্ধারণবাদের সহগ। y এর প্রকৃত মান এবং রেখার সমীকরণ থেকে প্রাপ্ত মান তুলনা করা হয়; তুলনা ফলাফলের উপর ভিত্তি করে, নির্ণয়বাদের সহগ গণনা করা হয়, 0 থেকে 1 পর্যন্ত স্বাভাবিক করা হয়। যদি এটি 1 এর সমান হয়, তাহলে মডেলটির সাথে একটি সম্পূর্ণ সম্পর্ক রয়েছে, অর্থাৎ y এর প্রকৃত এবং আনুমানিক মানের মধ্যে কোন পার্থক্য নেই। বিপরীত ক্ষেত্রে, যদি নির্ণয়ের সহগ 0 হয়, তাহলে রিগ্রেশন সমীকরণটি y-এর মানগুলির পূর্বাভাস দিতে ব্যর্থ হয়। কিভাবে r2 গণনা করা হয় সে সম্পর্কে তথ্যের জন্য, এই বিভাগের শেষে "নোট" দেখুন।

sey হল y অনুমানের জন্য আদর্শ ত্রুটি।

F- পরিসংখ্যান, বা F- পর্যবেক্ষণ করা মান। F-পরিসংখ্যানটি নির্ভরশীল এবং স্বাধীন চলকের মধ্যে পর্যবেক্ষিত সম্পর্ক সুযোগের কারণে হয়েছে কিনা তা নির্ধারণ করতে ব্যবহৃত হয়।

df - স্বাধীনতার ডিগ্রি। স্বাধীনতার ডিগ্রীগুলি পরিসংখ্যান সারণীতে F-সমালোচনামূলক মানগুলি খুঁজে বের করার জন্য দরকারী। মডেলের আত্মবিশ্বাসের স্তর নির্ধারণ করতে, আপনি LINEST ফাংশন দ্বারা প্রত্যাবর্তিত F-পরিসংখ্যানের সাথে টেবিলের মানগুলি তুলনা করুন৷

ssreg হল বর্গক্ষেত্রের রিগ্রেশন যোগফল।

ssresid হল বর্গক্ষেত্রের অবশিষ্ট সমষ্টি।

নীচের চিত্রটি অতিরিক্ত রিগ্রেশন পরিসংখ্যানের ক্রম দেখায়।

মন্তব্য

ফাংশন থেকে নির্বাচিত তথ্য INDEX ফাংশনের মাধ্যমে পাওয়া যেতে পারে, উদাহরণস্বরূপ:

Y-ইন্টারসেপ্ট (ফ্রি টার্ম):

INDEX(LINEST(y,x),2)

LINEST ফাংশন দ্বারা গণনা করা সরলরেখা ব্যবহার করে আনুমানিকতার নির্ভুলতা ডেটা স্ক্যাটারের ডিগ্রির উপর নির্ভর করে। ডেটা একটি সরলরেখার যত কাছাকাছি, LINEST ফাংশন দ্বারা ব্যবহৃত মডেলটি তত বেশি নির্ভুল। LINEST ফাংশনটি ডেটার জন্য সর্বোত্তম ফিট নির্ধারণ করতে সর্বনিম্ন বর্গক্ষেত্র ব্যবহার করে৷

রিগ্রেশন বিশ্লেষণ সম্পাদন করে, মাইক্রোসফট এক্সেলপ্রতিটি বিন্দুর জন্য পূর্বাভাসিত y মান এবং প্রকৃত y মানের মধ্যে পার্থক্যের বর্গ গণনা করে। এই বর্গীয় পার্থক্যের সমষ্টিকে বর্গক্ষেত্রের অবশিষ্ট যোগফল বলা হয়। মাইক্রোসফ্ট এক্সেল তারপর প্রকৃত y মান এবং গড় y মানের মধ্যে পার্থক্যের বর্গক্ষেত্রের যোগফল গণনা করে, যাকে বলা হয় স্কোয়ারের মোট যোগফল (বর্গের রিগ্রেশন যোগফল + বর্গক্ষেত্রের অবশিষ্ট যোগফল)। বর্গক্ষেত্রের মোট যোগফলের তুলনায় বর্গক্ষেত্রের অবশিষ্ট যোগফল যত ছোট হবে, নির্ণয়ের সহগ r2 তত বড় হবে, যা পরিমাপ করে যে রিগ্রেশন সমীকরণটি ভেরিয়েবলের মধ্যে সম্পর্ককে কতটা ভালোভাবে ব্যাখ্যা করে।

মনে রাখবেন যে রিগ্রেশন সমীকরণ দ্বারা ভবিষ্যদ্বাণী করা y মানগুলি সঠিক নাও হতে পারে যদি তারা y মানগুলির পরিসরের বাইরে পড়ে যা সমীকরণটি সংজ্ঞায়িত করতে ব্যবহৃত হয়েছিল।

উদাহরণ 1 ঢাল এবং Y-ইন্টারসেপ্ট

LINEST((1;9;5;7);(0;4;2;3)) সমান (2;1), ঢাল = 2 এবং y-ইন্টারসেপ্ট = 1।

F এবং R2 পরিসংখ্যান ব্যবহার করে

উচ্চ r2 মানের ফলাফল সুযোগের কারণে হয়েছে কিনা তা নির্ধারণ করতে আপনি F পরিসংখ্যান ব্যবহার করতে পারেন। যদি F- পর্যবেক্ষণ করা F- সমালোচনার চেয়ে বড় হয়, তাহলে ভেরিয়েবলগুলির মধ্যে একটি সম্পর্ক রয়েছে। F-critical যেকোন রেফারেন্স বইয়ের F-critical মানের টেবিল থেকে পাওয়া যেতে পারে গাণিতিক পরিসংখ্যান. এক-টেইলড পরীক্ষা ব্যবহার করে এই মানটি খুঁজে পেতে, আলফার মান সেট করুন (আলফার মানটি ভুলভাবে উপসংহারে আসার সম্ভাবনা নির্দেশ করতে ব্যবহৃত হয় যে একটি শক্তিশালী সম্পর্ক রয়েছে) 0.05 এর সমান, এবং স্বাধীনতার ডিগ্রি সংখ্যার জন্য ( সাধারণত v1 এবং v2 বোঝানো হয়), চলুন v1 = k = 4 এবং v2 = n - (k + 1) = 11 - (4 + 1) = 6 রাখি, যেখানে k হল ভেরিয়েবলের সংখ্যা এবং n হল ডেটা পয়েন্টের সংখ্যা . রেফারেন্স টেবিল থেকে, এফ-ক্রিটিকাল হল 4.53। পর্যবেক্ষণ করা F-মান হল 459.753674 (এই মানটি আমরা বাদ দেওয়া উদাহরণে প্রাপ্ত হয়েছে), যা 4.53-এর F-গুরুত্বপূর্ণ মানের থেকে লক্ষণীয়ভাবে বেশি। অতএব, ফলাফল রিগ্রেশন সমীকরণপছন্দসই ফলাফল ভবিষ্যদ্বাণী করার জন্য দরকারী।

নির্মিত ইকোনোমেট্রিকের গুণমানের একটি সাধারণ মূল্যায়নের জন্য, নির্ণয়ের সহগ, পারস্পরিক সম্পর্ক সূচক, গড় হিসাবে বৈশিষ্ট্যগুলি আপেক্ষিক ত্রুটিঅনুমান, এবং এটি ব্যবহার করে রিগ্রেশন সমীকরণের তাত্পর্য পরীক্ষা করে চ- মাছ ধরার মানদণ্ড। তালিকাভুক্ত বৈশিষ্ট্যগুলি বেশ সর্বজনীন এবং রৈখিক এবং অরৈখিক উভয় মডেলের পাশাপাশি দুটি বা ততোধিক ফ্যাক্টর ভেরিয়েবল সহ মডেলগুলির জন্য ব্যবহার করা যেতে পারে। তালিকাভুক্ত সমস্ত গুণমানের বৈশিষ্ট্যগুলি গণনা করার ক্ষেত্রে বেশ কয়েকটি অবশিষ্টাংশ একটি নিষ্পত্তিমূলক ভূমিকা পালন করে ε আমি, যা অধ্যয়ন করা বৈশিষ্ট্যের প্রকৃত (পর্যবেক্ষণ থেকে প্রাপ্ত) মানগুলি থেকে বিয়োগ করে গণনা করা হয় yiমডেল সমীকরণ ব্যবহার করে মান গণনা করা হয় y рi.

নির্ণয় সহগ

অধ্যয়ন করা বৈশিষ্ট্যের পরিবর্তনের অনুপাতটি মডেলটিতে বিবেচনা করা হয়েছে তা দেখায়। অন্য কথায়, নির্ণয়ের সহগ দেখায় যে অধ্যয়ন করা ভেরিয়েবলের পরিবর্তনের কোন অংশটি ফ্যাক্টর ভেরিয়েবলের সাথে সংযোগকারী নির্বাচিত ধরণের ফাংশন ব্যবহার করে মডেলে অন্তর্ভুক্ত ফ্যাক্টর ভেরিয়েবলের পরিবর্তনের উপর ভিত্তি করে গণনা করা যেতে পারে এবং বৈশিষ্ট্যটি অধ্যয়ন করা হচ্ছে। মডেল সমীকরণ।

নির্ণয় সহগ আর 2 0 থেকে 1 পর্যন্ত মান নিতে পারে। নির্ণয়ের সহগ যত কাছাকাছি আর 2একজনের কাছে, ভালো মানেরমডেল

পারস্পরিক সম্পর্ক সূচক নির্ণয়ের সহগ জেনে সহজেই গণনা করা যেতে পারে:

পারস্পরিক সম্পর্ক সূচক আরমডেলে বিবেচনা করা ফ্যাক্টর এবং অধ্যয়নের অধীনে পরিবর্তনশীলের মধ্যে মডেল নির্মাণ করার সময় নির্বাচিত সংযোগের প্রকারের ঘনিষ্ঠতা চিহ্নিত করে। লিনিয়ার পেয়ার রিগ্রেশনের ক্ষেত্রে, এর পরম মান জোড়া পারস্পরিক সম্পর্ক সহগের সাথে মিলে যায় r(x, y), যা আমরা আগে পরীক্ষা করেছি, এবং এর মধ্যে রৈখিক সম্পর্কের ঘনিষ্ঠতাকে চিহ্নিত করে এক্সএবং y. স্পষ্টতই, পারস্পরিক সম্পর্ক সূচকের মানগুলিও 0 থেকে 1 এর মধ্যে থাকে। মান যত কাছাকাছি আরঐক্যের জন্য, নির্বাচিত ধরণের ফাংশন ফ্যাক্টর ভেরিয়েবল এবং অধ্যয়নের অধীনে থাকা বৈশিষ্ট্যকে যত বেশি ঘনিষ্ঠভাবে সংযুক্ত করে, মডেলের গুণমান তত ভাল।

(2.11)

শতাংশ হিসাবে প্রকাশ করে এবং মডেলের নির্ভুলতাকে চিহ্নিত করে। ব্যবহারিক সমস্যাগুলি সমাধান করার সময় মডেলের গ্রহণযোগ্য নির্ভুলতা নির্দিষ্ট পরিস্থিতি বিবেচনা করে অর্থনৈতিক সম্ভাব্যতার বিবেচনার ভিত্তিতে নির্ধারণ করা যেতে পারে। একটি বহুল ব্যবহৃত মানদণ্ড হল যে গড় আপেক্ষিক ত্রুটি 15% এর কম হলে নির্ভুলতা সন্তোষজনক বলে বিবেচিত হয়। যদি E rel.avg.কম 5%, তারপর মডেল উচ্চ নির্ভুলতা আছে বলা হয়. বিশ্লেষণ এবং পূর্বাভাসের জন্য অসন্তোষজনক নির্ভুলতার সাথে মডেলগুলি ব্যবহার করার পরামর্শ দেওয়া হয় না, যখন E rel.avg. 15% এর বেশি।

ফিশারের এফ পরীক্ষা রিগ্রেশন সমীকরণের তাৎপর্য মূল্যায়ন করতে ব্যবহৃত হয়। F-মাপদণ্ডের গণনা করা মান সম্পর্ক থেকে নির্ধারিত হয়:

. (2.12)

সমালোচনামূলক মান চ- মানদণ্ড একটি প্রদত্ত তাত্পর্য স্তর α এবং স্বাধীনতার ডিগ্রীতে টেবিল থেকে নির্ধারিত হয় (আপনি এক্সেলে FRIST ফাংশন ব্যবহার করতে পারেন)। এখানে, আগের মত, মি- মডেলে বিবেচনা করা কারণগুলির সংখ্যা, n- পর্যবেক্ষণের সংখ্যা। যদি গণনা করা মান সমালোচনামূলক মানের থেকে বেশি হয়, তাহলে মডেল সমীকরণটি তাৎপর্যপূর্ণ বলে বিবেচিত হয়। গণনা করা মান যত বেশি চ-মাপদণ্ড, মডেলের মান তত ভালো।

আসুন আমরা যে রৈখিক মডেলটির জন্য তৈরি করেছি তার গুণমানের বৈশিষ্ট্যগুলি নির্ধারণ করি উদাহরণ 1. টেবিল 2 থেকে ডেটা ব্যবহার করা যাক। নির্ণয় সহগ:

অতএব, রৈখিক মডেলের কাঠামোর মধ্যে, 90.1% বিক্রয় পরিমাণে পরিবর্তন বায়ু তাপমাত্রার পরিবর্তন দ্বারা ব্যাখ্যা করা হয়।

পারস্পরিক সম্পর্ক সূচক

একটি জোড়া রৈখিক মডেলের ক্ষেত্রে পারস্পরিক সম্পর্ক সূচকের মান, যেমনটি আমরা দেখতে পাই, প্রকৃতপক্ষে সংশ্লিষ্ট ভেরিয়েবলের (বিক্রয় পরিমাণ এবং তাপমাত্রা) মধ্যে পারস্পরিক সম্পর্ক সহগ-এর পরম মানের সমান। যেহেতু প্রাপ্ত মানটি একতার বেশ কাছাকাছি, তাই আমরা উপসংহারে আসতে পারি যে অধ্যয়নের অধীনে চলক (বিক্রয় পরিমাণ) এবং ফ্যাক্টর পরিবর্তনশীল (তাপমাত্রা) এর মধ্যে একটি ঘনিষ্ঠ রৈখিক সম্পর্ক রয়েছে।

ফিশারের এফ পরীক্ষা

সমালোচনামূলক মান চ ক্রα = 0.1 এ; ν 1 = 1; ν 2 =7-1-1=5 হল 4.06। গণনা করা মান চ-মাপদণ্ড সারণীর চেয়ে বড়, তাই মডেল সমীকরণটি তাৎপর্যপূর্ণ।

আনুমানিক গড় আপেক্ষিক ত্রুটি

নির্মিত লিনিয়ার পেয়ারড রিগ্রেশন মডেলের অসন্তোষজনক নির্ভুলতা (>15%) এবং বিশ্লেষণ এবং পূর্বাভাসের জন্য ব্যবহারের জন্য সুপারিশ করা হয় না।

ফলস্বরূপ, বেশিরভাগ পরিসংখ্যানগত বৈশিষ্ট্যগুলি তাদের জন্য মানদণ্ডকে সন্তুষ্ট করা সত্ত্বেও, রৈখিক পেয়ারওয়াইজ রিগ্রেশন মডেলটি বাতাসের তাপমাত্রার উপর নির্ভর করে বিক্রয়ের পরিমাণের পূর্বাভাস দেওয়ার জন্য অনুপযুক্ত। পর্যবেক্ষণমূলক তথ্য অনুসারে এই ভেরিয়েবলগুলির মধ্যে সম্পর্কের অরৈখিক প্রকৃতি চিত্র 1-এ বেশ স্পষ্টভাবে দৃশ্যমান। বিশ্লেষণ এটি নিশ্চিত করেছে।

আমরা এমএস এক্সেল স্প্রেডশীট প্রসেসরের "ডেটা অ্যানালাইসিস" অ্যাড-ইন-এর "রিগ্রেশন" টুল ব্যবহার করে পরীক্ষামূলক রিগ্রেশন কোফিসিয়েন্ট b 0 , b 1 নির্ধারণ করব।

সহগ নির্ধারণের জন্য অ্যালগরিদম নিম্নরূপ।

1. MS Excel স্প্রেডশীট প্রসেসরে প্রাথমিক ডেটা প্রবেশ করান৷

2. ডেটা বিশ্লেষণ অ্যাড-ইন কল করুন (চিত্র 2)।

3. বিশ্লেষণ টুল রিগ্রেশন নির্বাচন করুন (চিত্র 3)।

4. রিগ্রেশন উইন্ডোর সংশ্লিষ্ট অবস্থানগুলি পূরণ করুন (চিত্র 4)।

5. রিগ্রেশন উইন্ডোতে ওকে বোতামে ক্লিক করুন এবং সমস্যা সমাধানের জন্য একটি প্রোটোকল পান (চিত্র 5)

চিত্র 3 – রিগ্রেশন টুল নির্বাচন করা

চিত্র 4 – রিগ্রেশন উইন্ডো

চিত্র 5 – সমস্যা সমাধানের জন্য প্রোটোকল

চিত্র 5 থেকে দেখা যায় যে অভিজ্ঞতামূলক রিগ্রেশন সহগ যথাক্রমে সমান

b 0 = 223,

b1 = 0.0088।

তারপর পেয়ারড রৈখিক রিগ্রেশনের সমীকরণটি মাসিক পেনশন y এর মানকে নির্বাহের সর্বনিম্ন মূল্যের সাথে সংযুক্ত করে

.(3.2)

পরবর্তী, টাস্ক অনুসারে, জীবনযাত্রার ব্যয় x এবং মাসিক পেনশন y-এর মূল্যের মধ্যে পরিসংখ্যানগত সম্পর্কের ঘনিষ্ঠতা মূল্যায়ন করা প্রয়োজন। এই অনুমানটি পারস্পরিক সম্পর্ক সহগ ব্যবহার করে করা যেতে পারে। চিত্র 5-এ এই সহগের মানটিকে একাধিক R হিসাবে মনোনীত করা হয়েছে এবং সেই অনুযায়ী, 0.038 এর সমান। যেহেতু তাত্ত্বিকভাবে এই সহগের মান –1 থেকে +1-এর মধ্যে রয়েছে, তাই আমরা উপসংহারে আসতে পারি যে জীবনযাত্রার ব্যয়ের মূল্য এবং মাসিক পেনশন y-এর মূল্যের মধ্যে পরিসংখ্যানগত সংযোগ উল্লেখযোগ্য নয়।

চিত্র 5-এ উপস্থাপিত প্যারামিটার “R – বর্গক্ষেত্র” হল পারস্পরিক সম্পর্ক সহগের বর্গ এবং একে নির্ণয়ের সহগ বলা হয়। এই সহগের মান রিগ্রেশন (ব্যাখ্যামূলক পরিবর্তনশীল x) দ্বারা ব্যাখ্যা করা নির্ভরশীল ভেরিয়েবল y-এর প্রকরণের ভাগকে চিহ্নিত করে। তদনুসারে, মান 1- ইকোনোমেট্রিক মডেলে বিবেচনা না করা অন্যান্য সমস্ত ব্যাখ্যামূলক ভেরিয়েবলের প্রভাবের কারণে সৃষ্ট ভেরিয়েবল y-তে পরিবর্তনের ভাগকে চিহ্নিত করে। চিত্র 5 থেকে দেখা যায় যে সমস্ত ব্যাখ্যামূলক ভেরিয়েবলের ভাগ ফলস্বরূপ ইকোনোমেট্রিক মডেলে বিবেচনায় নেওয়া হয়নি প্রায় 1 - 0.00145 = 0.998 বা 99.8%।

পরবর্তী পর্যায়ে, টাস্ক অনুসারে, স্থিতিস্থাপকতা সহগ ব্যবহার করে ব্যাখ্যামূলক চলক x এবং নির্ভরশীল পরিবর্তনশীল y-এর মধ্যে সংযোগের মাত্রা নির্ধারণ করা প্রয়োজন। একটি জোড়া রৈখিক রিগ্রেশন মডেলের জন্য স্থিতিস্থাপকতা সহগ হিসাবে সংজ্ঞায়িত করা হয়:

অতএব, যদি জীবনযাত্রার ব্যয় 1% পরিবর্তিত হয়, মাসিক পেনশন 0.000758% দ্বারা পরিবর্তিত হয়।

. (3.4)

এটি করার জন্য, আমরা দুটি কলাম সহ মূল টেবিল 1 এর পরিপূরক করি যেখানে আমরা নির্ভরতা (3.2) এবং পার্থক্য মান ব্যবহার করে গণনা করা মানগুলি নির্ধারণ করি।

সারণি 3.2। গড় অনুমান ত্রুটির গণনা।

তারপর গড় আনুমানিক ত্রুটি হয়

এটি অনুশীলন থেকে জানা যায় যে গড় অনুমান ত্রুটির মান (12...15)% এর বেশি হওয়া উচিত নয়

শেষ পর্যায়ে, আমরা ফিশারের এফ পরীক্ষা ব্যবহার করে মডেলিংয়ের পরিসংখ্যানগত নির্ভরযোগ্যতা মূল্যায়ন করব। এটি করার জন্য, আসুন শর্ত অনুসারে ফলাফল রিগ্রেশন সমীকরণের পরিসংখ্যানগত তুচ্ছতা সম্পর্কে নাল হাইপোথিসিস H 0 পরীক্ষা করি:

যদি একটি প্রদত্ত তাৎপর্য স্তরে a = 0.05 F-মাপদণ্ডের তাত্ত্বিক (গণনাকৃত) মান তার সমালোচনামূলক মানের F ক্রিট (সারণীকৃত) থেকে বেশি হয়, তাহলে শূন্য অনুমানটি প্রত্যাখ্যান করা হয় এবং ফলস্বরূপ রিগ্রেশন সমীকরণটি তাৎপর্যপূর্ণ হিসাবে গৃহীত হয়।

চিত্র 5 থেকে এটি অনুসরণ করে যে F গণনা করা হয়েছে = 0.0058। F-মাপদণ্ডের সমালোচনামূলক মান পরিসংখ্যানগত ফাংশন FASTER (চিত্র 6) ব্যবহার করে নির্ধারিত হয়। ফাংশনের ইনপুট পরামিতিগুলি হল তাত্পর্য স্তর (সম্ভাব্যতা) এবং স্বাধীনতা 1 এবং 2 এর ডিগ্রির সংখ্যা। একটি জোড়া রিগ্রেশন মডেলের জন্য, স্বাধীনতার ডিগ্রীর সংখ্যা যথাক্রমে 1 (একটি ব্যাখ্যামূলক পরিবর্তনশীল) এবং n-2 = 6 -2=4।

চিত্র 6 – পরিসংখ্যানগত ফাংশনের উইন্ডো দ্রুততর

চিত্র 6 থেকে দেখা যায় যে F-পরীক্ষার সমালোচনামূলক মান হল 7.71।

যেহেতু F গণনা করা হয়েছে< F крит, то нулевая гипотеза не отвергается и полученное регрессионное уравнение статистически незначимо.

13. EXCEL ব্যবহার করে একাধিক রিগ্রেশন মডেল তৈরি করা।

অ্যাসাইনমেন্ট বিকল্প অনুসারে, পরিসংখ্যানগত উপাদান ব্যবহার করা প্রয়োজন।

1. একটি রৈখিক একাধিক রিগ্রেশন সমীকরণ তৈরি করুন এবং এর পরামিতিগুলির অর্থনৈতিক অর্থ ব্যাখ্যা করুন।

3. শিক্ষার্থীর টি-পরীক্ষা ব্যবহার করে রিগ্রেশন সহগগুলির পরিসংখ্যানগত তাত্পর্য এবং F-পরীক্ষা ব্যবহার করে সমীকরণের তাত্পর্য সম্পর্কে শূন্য অনুমান মূল্যায়ন করুন।

4. আনুমানিক গড় ত্রুটি নির্ধারণ করে সমীকরণের গুণমান মূল্যায়ন করুন।

একটি জোড়া রিগ্রেশন মডেল নির্মাণের জন্য প্রাথমিক তথ্য সারণী 3.3 এ দেওয়া হয়েছে।

টেবিল 3.3. প্রাথমিক তথ্য।

নেট আয়, মিলিয়ন মার্কিন ডলার	মূলধন টার্নওভার, মিলি. মার্কিন ডলার, x 1	ব্যবহৃত মূলধন, মিলি. মার্কিন ডলার x 2
6,6	6,9	83,6
2,7	93,6	25,4
1,6	10,0	6,4
2,4	31,5	12,5
3,3	36,7	14,3
1,8	13,8	6,5
2,4	64,8	22,7
1,6	30,4	15,8
1,4	12,1	9,3
0,9	31,3	18,9

একটি রিগ্রেশন সমীকরণ নির্মাণের প্রযুক্তি অনুচ্ছেদ 3.1 এ বর্ণিত অ্যালগরিদমের অনুরূপ। রিগ্রেশন সমীকরণ নির্মাণের প্রোটোকল চিত্র 7 এ দেখানো হয়েছে।

ফলাফলের উপসংহার
রিগ্রেশন পরিসংখ্যান
বহুবচন আর	0,901759207
আর-বর্গক্ষেত্র	0,813169667
স্বাভাবিকীকৃত R-বর্গ	0,759789572
মান ত্রুটি	0,789962026
পর্যবেক্ষণ
বৈচিত্র্যের বিশ্লেষণ
	df	মাইক্রোসফট	চ
রিগ্রেশন		9,50635999	15,23357468
অবশিষ্ট		0,624040003
মোট
	মতভেদ	t-পরিসংখ্যান
Y- ছেদ	1,113140304	2,270238114
পরিবর্তনশীল X 1	-0,000592199	-0,061275574
পরিবর্তনশীল X 2	0,063902851	5,496523193