বাড়ি মাড়ি একটি রিগ্রেশন বিশ্লেষণ মডেল প্রয়োজনীয়তা কি. গাণিতিক পরিসংখ্যানের পদ্ধতি

মাড়ি

একটি রিগ্রেশন বিশ্লেষণ মডেল প্রয়োজনীয়তা কি. গাণিতিক পরিসংখ্যানের পদ্ধতি

ফলাফলের উপসংহার

সারণি 8.3a. রিগ্রেশন পরিসংখ্যান

রিগ্রেশন পরিসংখ্যান
বহুবচন আর	0,998364
আর-বর্গক্ষেত্র	0,99673
স্বাভাবিকীকৃত R-বর্গাকার	0,996321
মান ত্রুটি	0,42405
পর্যবেক্ষণ	10

প্রথমে বিবেচনা করা যাক উপরের অংশসারণী 8.3a-এ উপস্থাপিত গণনা - রিগ্রেশন পরিসংখ্যান।

মান R-স্কয়ার, যাকে নিশ্চিততার পরিমাপও বলা হয়, ফলে রিগ্রেশন লাইনের গুণমানকে চিহ্নিত করে। এই গুণটি উত্স ডেটা এবং রিগ্রেশন মডেল (গণনা করা ডেটা) এর মধ্যে চিঠিপত্রের ডিগ্রি দ্বারা প্রকাশ করা হয়। নিশ্চিততার পরিমাপ সর্বদা ব্যবধানের মধ্যে থাকে।

বেশিরভাগ ক্ষেত্রে, R-বর্গের মান এই মানের মধ্যে পড়ে, যাকে বলা হয় চরম মান, যেমন শূন্য এবং একের মধ্যে।

যদি R-স্কোয়ার মান একের কাছাকাছি হয়, তাহলে এর মানে হল যে নির্মিত মডেলটি প্রাসঙ্গিক ভেরিয়েবলের প্রায় সমস্ত পরিবর্তনশীলতা ব্যাখ্যা করে। বিপরীতভাবে, শূন্যের কাছাকাছি একটি R-স্কোয়ার মান মানে নির্মিত মডেলের গুণমান খারাপ।

আমাদের উদাহরণে, নিশ্চিততার পরিমাপ হল 0.99673, যা মূল ডেটাতে রিগ্রেশন লাইনের খুব ভাল ফিট নির্দেশ করে।

বহুবচন আর- একাধিক পারস্পরিক সম্পর্ক সহগ R - স্বাধীন ভেরিয়েবল (X) এবং নির্ভরশীল চলকের (Y) নির্ভরতার মাত্রা প্রকাশ করে।

একাধিক R সমান বর্গমূলনির্ণয়ের সহগ থেকে, এই পরিমাণটি শূন্য থেকে এক পর্যন্ত পরিসরে মান নেয়।

সরল রৈখিক রিগ্রেশন বিশ্লেষণে, একাধিক R পিয়ারসন পারস্পরিক সম্পর্ক সহগের সমান। প্রকৃতপক্ষে, আমাদের ক্ষেত্রে একাধিক R পূর্ববর্তী উদাহরণ (0.998364) থেকে পিয়ারসন পারস্পরিক সম্পর্ক সহগের সমান।

সারণি 8.3 খ. রিগ্রেশন সহগ

	মতভেদ	মান ত্রুটি	t-পরিসংখ্যান
Y- ছেদ	2,694545455	0,33176878	8,121757129
পরিবর্তনশীল X 1	2,305454545	0,04668634	49,38177965
* গণনার একটি ছোট সংস্করণ প্রদান করা হয়

এখন গণনার মাঝের অংশটি বিবেচনা করুন, সারণি 8.3b এ উপস্থাপিত। এখানে রিগ্রেশন সহগ b (2.305454545) এবং অর্ডিনেট অক্ষ বরাবর স্থানচ্যুতি দেওয়া হয়েছে, যেমন ধ্রুবক a (2.694545455)।

গণনার উপর ভিত্তি করে, আমরা নিম্নরূপ রিগ্রেশন সমীকরণ লিখতে পারি:

Y= x*2.305454545+2.694545455

ভেরিয়েবলের মধ্যে সম্পর্কের দিকটি চিহ্নের (নেতিবাচক বা ইতিবাচক) উপর ভিত্তি করে নির্ধারিত হয় রিগ্রেশন সহগ(গুণ খ)।

যদি সাইন এ রিগ্রেশন সহগ- ধনাত্মক, নির্ভরশীল পরিবর্তনশীল এবং স্বাধীন পরিবর্তনশীলের মধ্যে সম্পর্ক ধনাত্মক হবে। আমাদের ক্ষেত্রে, রিগ্রেশন সহগের চিহ্নটি ইতিবাচক, তাই সম্পর্কটিও ইতিবাচক।

যদি সাইন এ রিগ্রেশন সহগ- ঋণাত্মক, নির্ভরশীল চলক এবং স্বাধীন চলকের মধ্যে সম্পর্ক ঋণাত্মক (বিপরীত)।

সারণিতে 8.3c. অবশিষ্টাংশের উদ্ভূত ফলাফল উপস্থাপন করা হয়. রিপোর্টে এই ফলাফলগুলি দেখানোর জন্য, "রিগ্রেশন" টুলটি চালানোর সময় আপনাকে অবশ্যই "অবশিষ্ট" চেকবক্স সক্রিয় করতে হবে।

বাকিদের প্রত্যাহার

সারণি 8.3c. অবশিষ্টাংশ

পর্যবেক্ষণ	ভবিষ্যদ্বাণী Y	অবশিষ্টাংশ	স্ট্যান্ডার্ড ব্যালেন্স
1	9,610909091	-0,610909091	-1,528044662
2	7,305454545	-0,305454545	-0,764022331
3	11,91636364	0,083636364	0,209196591
4	14,22181818	0,778181818	1,946437843
5	16,52727273	0,472727273	1,182415512
6	18,83272727	0,167272727	0,418393181
7	21,13818182	-0,138181818	-0,34562915
8	23,44363636	-0,043636364	-0,109146047
9	25,74909091	-0,149090909	-0,372915662
10	28,05454545	-0,254545455	-0,636685276

প্রতিবেদনের এই অংশটি ব্যবহার করে, আমরা নির্মিত রিগ্রেশন লাইন থেকে প্রতিটি বিন্দুর বিচ্যুতি দেখতে পারি। সবচেয়ে বড় পরম মান

রিগ্রেশন বিশ্লেষণের উদ্দেশ্য হল একটি নির্ভরশীল ভেরিয়েবল এবং একটি (পেয়ারওয়াইজ রিগ্রেশন অ্যানালাইসিস) বা একাধিক (একাধিক) স্বাধীন ভেরিয়েবলের মধ্যে সম্পর্ক পরিমাপ করা। স্বাধীন চলকগুলিকে ফ্যাক্টর, ব্যাখ্যামূলক, নির্ধারক, রিগ্রেসর এবং ভবিষ্যদ্বাণীকারী ভেরিয়েবলও বলা হয়।

নির্ভরশীল পরিবর্তনশীলকে কখনো কখনো নির্ধারিত, ব্যাখ্যা করা বা "প্রতিক্রিয়া" ভেরিয়েবল বলা হয়। অভিজ্ঞতামূলক গবেষণায় রিগ্রেশন বিশ্লেষণের অত্যন্ত ব্যাপক ব্যবহার শুধুমাত্র এই কারণেই নয় যে এটি হাইপোথিসিস পরীক্ষা করার জন্য একটি সুবিধাজনক হাতিয়ার। রিগ্রেশন, বিশেষ করে একাধিক রিগ্রেশন হল কার্যকর পদ্ধতিমডেলিং এবং পূর্বাভাস।

চলুন শুরু করা যাক রিগ্রেশন এনালাইসিসের সাথে কাজ করার নীতিগুলিকে একটি সহজ-এর সাথে ব্যাখ্যা করা - জোড়া পদ্ধতি।

পেয়ারড রিগ্রেশন বিশ্লেষণ

রিগ্রেশন অ্যানালাইসিস ব্যবহার করার সময় প্রথম ধাপগুলি আমরা পারস্পরিক সম্পর্ক সহগ গণনা করার জন্য নেওয়া প্রায় একই রকম হবে। কার্যকারিতার জন্য তিনটি প্রধান শর্ত পারস্পরিক সম্পর্ক বিশ্লেষণপিয়ারসন পদ্ধতি অনুসারে - ভেরিয়েবলের স্বাভাবিক বন্টন, ভেরিয়েবলের ব্যবধান পরিমাপ, ভেরিয়েবলের মধ্যে রৈখিক সম্পর্ক - একাধিক রিগ্রেশনের জন্যও প্রাসঙ্গিক। তদনুসারে, প্রথম পর্যায়ে, স্ক্যাটারপ্লটগুলি তৈরি করা হয়, ভেরিয়েবলগুলির একটি পরিসংখ্যানগত এবং বর্ণনামূলক বিশ্লেষণ করা হয় এবং একটি রিগ্রেশন লাইন গণনা করা হয়। পারস্পরিক সম্পর্ক বিশ্লেষণের কাঠামোর মতো, পদ্ধতি ব্যবহার করে রিগ্রেশন লাইনগুলি তৈরি করা হয় সর্বনিম্ন বর্গক্ষেত্র.

ডেটা বিশ্লেষণের দুটি পদ্ধতির মধ্যে পার্থক্য আরও স্পষ্টভাবে বোঝাতে, আসুন আমরা "এসপিএস সমর্থন" এবং "গ্রামীণ জনসংখ্যা ভাগ" ভেরিয়েবলগুলির সাথে ইতিমধ্যে আলোচনা করা উদাহরণের দিকে ফিরে যাই। উৎস তথ্য অভিন্ন. স্ক্যাটারপ্লটগুলির মধ্যে পার্থক্যটি হবে যে রিগ্রেশন বিশ্লেষণে নির্ভরশীল ভেরিয়েবল প্লট করা সঠিক - আমাদের ক্ষেত্রে, Y-অক্ষে "SPS সমর্থন", যেখানে পারস্পরিক সম্পর্ক বিশ্লেষণে এটি কোন ব্যাপার নয়। আউটলিয়ারগুলি পরিষ্কার করার পরে, স্ক্যাটারপ্লটটি এর মতো দেখায়:

রিগ্রেশন বিশ্লেষণের মৌলিক ধারণা হল, থাকা সাধারণ প্রবণতাভেরিয়েবলের জন্য - একটি রিগ্রেশন লাইন আকারে - আপনি নির্ভরশীল ভেরিয়েবলের মান ভবিষ্যদ্বাণী করতে পারেন, স্বাধীনটির মান বিবেচনা করে।

এর স্বাভাবিক গাণিতিক কল্পনা করা যাক লিনিয়ার ফাংশন. ইউক্লিডীয় স্থানের যেকোনো সরলরেখা সূত্র দ্বারা বর্ণনা করা যেতে পারে:

যেখানে a একটি ধ্রুবক যা অর্ডিনেট অক্ষ বরাবর স্থানচ্যুতিকে নির্দিষ্ট করে; b হল একটি সহগ যা রেখার প্রবণতার কোণ নির্ধারণ করে।

ঢাল এবং ধ্রুবক জেনে, আপনি যে কোনো x এর জন্য y-এর মান গণনা (ভবিষ্যদ্বাণী) করতে পারেন।

এই সহজ ফাংশনএবং সতর্কতা সহ একটি রিগ্রেশন বিশ্লেষণ মডেলের ভিত্তি তৈরি করেছে যে আমরা ঠিক y এর মান ভবিষ্যদ্বাণী করব না, তবে একটি নির্দিষ্ট সময়ের মধ্যে আস্থা ব্যবধান, অর্থাৎ আন্দাজ.

ধ্রুবক হল রিগ্রেশন লাইন এবং y-অক্ষের ছেদ বিন্দু (F-ছেদ, সাধারণত পরিসংখ্যানগত প্যাকেজে "ইন্টারসেপ্টর" হিসাবে চিহ্নিত)। ডান বাহিনীর ইউনিয়নের জন্য ভোট দেওয়ার ক্ষেত্রে আমাদের উদাহরণে, এর বৃত্তাকার মান হবে 10.55। কৌণিক সহগ b হবে প্রায় -0.1 (যেমন পারস্পরিক সম্পর্ক বিশ্লেষণে, চিহ্নটি সংযোগের ধরন দেখায় - প্রত্যক্ষ বা বিপরীত)। সুতরাং, ফলস্বরূপ মডেলের ফর্ম SP C = -0.1 x Sel হবে। আমাদের. + 10.55।

ATP = -0.10 x 47 + 10.55 = 5.63।

মূল এবং ভবিষ্যদ্বাণীকৃত মানের মধ্যে পার্থক্যটিকে অবশিষ্ট বলা হয় (আমরা ইতিমধ্যে এই শব্দটির মুখোমুখি হয়েছি, যা পরিসংখ্যানের জন্য মৌলিক, যখন আকস্মিক সারণী বিশ্লেষণ করার সময়)। সুতরাং, "Adygea প্রজাতন্ত্র" এর ক্ষেত্রে অবশিষ্টাংশ 3.92 - 5.63 = -1.71 এর সমান হবে। অবশিষ্টাংশের মডুলার মান যত বড় হবে, অনুমানকৃত মান তত কম সফল হবে।

আমরা সমস্ত ক্ষেত্রে পূর্বাভাসিত মান এবং অবশিষ্টাংশ গণনা করি:

ঘটছে	বসেছিল. আমাদের.	ধন্যবাদ (মূল)	ধন্যবাদ (ভবিষ্যদ্বাণী করা)	অবশিষ্টাংশ
Adygea প্রজাতন্ত্র	47	3,92	5,63	-1,71 -
আলতাই প্রজাতন্ত্র	76	5,4	2,59	2,81
বাশকোর্তোস্তান প্রজাতন্ত্র	36	6,04	6,78	-0,74
বুরিয়াটিয়া প্রজাতন্ত্র	41	8,36	6,25	2,11
দাগেস্তান প্রজাতন্ত্র	59	1,22	4,37	-3,15
ইঙ্গুশেটিয়া প্রজাতন্ত্র	59	0,38	4,37	3,99
ইত্যাদি।

প্রাথমিক এবং ভবিষ্যদ্বাণীকৃত মানগুলির অনুপাতের বিশ্লেষণ ফলাফলের মডেলের গুণমান এবং এর ভবিষ্যদ্বাণী করার ক্ষমতা মূল্যায়ন করে। রিগ্রেশন পরিসংখ্যানের প্রধান সূচকগুলির মধ্যে একটি হল একাধিক পারস্পরিক সম্পর্ক সহগ R - নির্ভরশীল পরিবর্তনশীলের মূল এবং পূর্বাভাসিত মানের মধ্যে পারস্পরিক সম্পর্ক সহগ। পেয়ারড রিগ্রেশন বিশ্লেষণে, এটি নির্ভরশীল এবং স্বাধীন ভেরিয়েবলের মধ্যে সাধারণ পিয়ারসন পারস্পরিক সম্পর্ক সহগের সমান, আমাদের ক্ষেত্রে - 0.63। একাধিক Rকে অর্থপূর্ণভাবে ব্যাখ্যা করতে, এটিকে সংকল্পের সহগ-এ রূপান্তর করতে হবে। এটি পারস্পরিক সম্পর্ক বিশ্লেষণের মতো একইভাবে করা হয় - স্কোয়ারিং দ্বারা। নির্ণয়ের সহগ R-বর্গ (R 2) নির্ভরশীল পরিবর্তনশীলের পরিবর্তনের অনুপাত দেখায় যা স্বাধীন পরিবর্তনশীল(গুলি) দ্বারা ব্যাখ্যা করা হয়।

আমাদের ক্ষেত্রে, R 2 = 0.39 (0.63 2); এর মানে হল যে পরিবর্তনশীল "গ্রামীণ জনসংখ্যা ভাগ" পরিবর্তনশীল "এসপিএস সমর্থন" এর পরিবর্তনের প্রায় 40% ব্যাখ্যা করে। নির্ণয়ের সহগ যত বড়, মডেলের গুণমান তত বেশি।

মডেলের মানের আরেকটি সূচক হল অনুমানের স্ট্যান্ডার্ড ত্রুটি। এটি রিগ্রেশন লাইনের চারপাশে বিন্দুগুলি কতটা ব্যাপকভাবে "বিক্ষিপ্ত" হয় তার একটি পরিমাপ। ইন্টারভাল ভেরিয়েবলের স্প্রেডের পরিমাপ হল আদর্শ চ্যুতি. তদনুসারে, অনুমানের প্রমিত ত্রুটি হল অবশিষ্টাংশের বিতরণের মানক বিচ্যুতি। এর মান যত বেশি, তত বেশি বিক্ষিপ্ত এবং মডেলটি তত খারাপ। আমাদের ক্ষেত্রে, স্ট্যান্ডার্ড ত্রুটি হল 2.18। এই পরিমাণ দ্বারাই আমাদের মডেল "SPS সমর্থন" ভেরিয়েবলের মান ভবিষ্যদ্বাণী করার সময় "গড়ে ভুল" করবে।

রিগ্রেশন পরিসংখ্যান এছাড়াও পরিবর্তনের বিশ্লেষণ অন্তর্ভুক্ত. এর সাহায্যে, আমরা খুঁজে পাই: 1) নির্ভরশীল চলকের পরিবর্তনের (বিচ্ছুরণ) কোন অনুপাত স্বাধীন চলক দ্বারা ব্যাখ্যা করা হয়েছে; 2) নির্ভরশীল ভেরিয়েবলের পরিবর্তনের কি অনুপাত অবশিষ্টাংশ (অব্যক্ত অংশ) দ্বারা হিসাব করা হয়; 3) এই দুটি পরিমাণের অনুপাত কত (/"-অনুপাত)। বিচ্ছুরণ পরিসংখ্যান বিশেষভাবে গুরুত্বপূর্ণ নমুনা অধ্যয়ন- এটি দেখায় যে স্বাধীন এবং নির্ভরশীল ভেরিয়েবলের মধ্যে একটি সম্পর্ক থাকার সম্ভাবনা কতটা জনসংখ্যা. যাইহোক, এমনকি ক্রমাগত গবেষণার জন্য (আমাদের উদাহরণ হিসাবে), ফলাফল অধ্যয়নরত বৈচিত্র্যের বিশ্লেষণদরকারী নয় এই ক্ষেত্রে, তারা পরীক্ষা করে যে চিহ্নিত পরিসংখ্যানগত প্যাটার্নটি এলোমেলো পরিস্থিতির কাকতালীয় কারণে সৃষ্ট হয়েছে কিনা, অধ্যয়নের অধীনে জনসংখ্যার অবস্থানের অবস্থার সেটের জন্য এটি কতটা সাধারণ, যেমন এটি কিছু বৃহত্তর সাধারণ জনসংখ্যার জন্য প্রাপ্ত ফলাফলের সত্য নয় যা প্রতিষ্ঠিত হয়েছে, তবে এর নিয়মিততা এবং এলোমেলো প্রভাব থেকে মুক্তির মাত্রা।

আমাদের ক্ষেত্রে, ANOVA পরিসংখ্যান নিম্নরূপ:

	এসএস	df	মাইক্রোসফট	চ	অর্থ
প্রত্যাবর্তন।	258,77	1,00	258,77	54,29	0.000000001
অবশিষ্ট	395,59	83,00	এল,১১
মোট	654,36

0.0000000001 স্তরে 54.29 এর F-অনুপাত উল্লেখযোগ্য। তদনুসারে, আমরা আত্মবিশ্বাসের সাথে শূন্য অনুমানকে প্রত্যাখ্যান করতে পারি (যে সম্পর্কটি আমরা আবিষ্কার করেছি তা সুযোগের কারণে)।

টি মানদণ্ড একটি অনুরূপ ফাংশন সঞ্চালন করে, কিন্তু রিগ্রেশন সহগ (কৌণিক এবং এফ-ছেদ) সম্পর্কিত। / মানদণ্ড ব্যবহার করে, আমরা অনুমানটি পরীক্ষা করি যে সাধারণ জনসংখ্যার রিগ্রেশন সহগ শূন্যের সমান। আমাদের ক্ষেত্রে, আমরা আবার আত্মবিশ্বাসের সাথে শূন্য হাইপোথিসিস প্রত্যাখ্যান করতে পারি।

একাধিক রিগ্রেশন বিশ্লেষণ

মডেল একাধিক সংশ্লেষণপেয়ারড রিগ্রেশন মডেলের প্রায় অভিন্ন; শুধুমাত্র পার্থক্য হল যে কয়েকটি স্বাধীন ভেরিয়েবল ক্রমিকভাবে লিনিয়ার ফাংশনে অন্তর্ভুক্ত করা হয়েছে:

Y = b1X1 + b2X2 + …+ bpXp + a.

যদি দুটির বেশি স্বাধীন ভেরিয়েবল থাকে তবে আমরা তাদের সম্পর্কের একটি চাক্ষুষ ধারণা পেতে সক্ষম নই; এই ক্ষেত্রে, একাধিক রিগ্রেশন পেয়ারওয়াইজ রিগ্রেশনের চেয়ে কম "ভিজ্যুয়াল"। যখন আপনার দুটি স্বাধীন ভেরিয়েবল থাকে, তখন এটি একটি 3D স্ক্যাটারপ্লটে ডেটা প্রদর্শন করতে উপযোগী হতে পারে। পেশাদার পরিসংখ্যানগত সফ্টওয়্যার প্যাকেজগুলিতে (উদাহরণস্বরূপ, স্ট্যাটিসটিকা) একটি ত্রিমাত্রিক চার্ট ঘোরানোর বিকল্প রয়েছে, যা আপনাকে ডেটার কাঠামোটি দৃশ্যতভাবে উপস্থাপন করতে দেয়।

একাধিক রিগ্রেশনের সাথে কাজ করার সময়, পেয়ারওয়াইজ রিগ্রেশনের বিপরীতে, বিশ্লেষণ অ্যালগরিদম নির্ধারণ করা প্রয়োজন। স্ট্যান্ডার্ড অ্যালগরিদম চূড়ান্ত রিগ্রেশন মডেলের সমস্ত উপলব্ধ ভবিষ্যদ্বাণী অন্তর্ভুক্ত করে। ধাপে ধাপে অ্যালগরিদমতাদের ব্যাখ্যামূলক "ওজন" এর উপর ভিত্তি করে স্বাধীন ভেরিয়েবলের অনুক্রমিক অন্তর্ভুক্তি (বর্জন) জড়িত। যখন অনেকগুলি স্বাধীন ভেরিয়েবল থাকে তখন ধাপে ধাপে পদ্ধতিটি ভাল; এটি স্পষ্টভাবে দুর্বল ভবিষ্যদ্বাণীকারীদের মডেলটিকে "পরিষ্কার" করে, এটিকে আরও কম্প্যাক্ট এবং সংক্ষিপ্ত করে তোলে।

একাধিক রিগ্রেশনের সঠিকতার জন্য একটি অতিরিক্ত শর্ত (ব্যবধান, স্বাভাবিকতা এবং রৈখিকতা সহ) হল মাল্টিকোলিনিয়ারিটির অনুপস্থিতি - স্বাধীন ভেরিয়েবলের মধ্যে শক্তিশালী পারস্পরিক সম্পর্কের উপস্থিতি।

একাধিক রিগ্রেশন পরিসংখ্যানের ব্যাখ্যায় আমরা পেয়ারওয়াইজ রিগ্রেশনের ক্ষেত্রে বিবেচনা করা সমস্ত উপাদান অন্তর্ভুক্ত করে। এছাড়াও, একাধিক রিগ্রেশন বিশ্লেষণের পরিসংখ্যানের অন্যান্য গুরুত্বপূর্ণ উপাদান রয়েছে।

আমরা রাশিয়ান অঞ্চল জুড়ে নির্বাচনী কার্যকলাপের স্তরের পার্থক্য ব্যাখ্যা করে এমন অনুমান পরীক্ষার উদাহরণ ব্যবহার করে একাধিক রিগ্রেশন সহ কাজটি চিত্রিত করব। সুনির্দিষ্ট অভিজ্ঞতামূলক গবেষণায় পরামর্শ দেওয়া হয়েছে যে ভোটার ভোটদানের মাত্রা এর দ্বারা প্রভাবিত হয়:

ন্যাশনাল ফ্যাক্টর (ভেরিয়েবল "রাশিয়ান জনসংখ্যা"; রাশিয়ান ফেডারেশনের উপাদান সত্তাগুলিতে রাশিয়ান জনসংখ্যার ভাগ হিসাবে কার্যকর)। এটা অনুমান করা হয় যে রাশিয়ান জনসংখ্যার অংশ বৃদ্ধির ফলে ভোটারদের উপস্থিতি হ্রাস পায়;

নগরায়ন ফ্যাক্টর (পরিবর্তনশীল " শহরের জনসংখ্যা"; রাশিয়ান ফেডারেশনের গঠনমূলক সত্ত্বাগুলিতে শহুরে জনসংখ্যার অংশ হিসাবে কার্যকর করা হয়েছে; আমরা ইতিমধ্যে পারস্পরিক সম্পর্ক বিশ্লেষণের কাঠামোর মধ্যে এই ফ্যাক্টর নিয়ে কাজ করেছি)। এটা অনুমান করা হয় যে শহুরে জনসংখ্যার অংশ বৃদ্ধির ফলে ভোটার উপস্থিতি হ্রাস পায়।

নির্ভরশীল পরিবর্তনশীল - "নির্বাচনী কার্যকলাপের তীব্রতা" ("সক্রিয়") 1995 থেকে 2003 সাল পর্যন্ত ফেডারেল নির্বাচনে অঞ্চল অনুসারে গড় ভোটের ডেটার মাধ্যমে কার্যকর করা হয়। দুটি স্বাধীন এবং একটি নির্ভরশীল পরিবর্তনশীলের প্রাথমিক ডেটা টেবিলটি নিম্নরূপ হবে:

ঘটছে	ভেরিয়েবল
ঘটছে	সম্পদ।	গোর। আমাদের.	রস আমাদের.
Adygea প্রজাতন্ত্র	64,92	53	68
আলতাই প্রজাতন্ত্র	68,60	24	60
বুরিয়াটিয়া প্রজাতন্ত্র	60,75	59	70
দাগেস্তান প্রজাতন্ত্র	79,92	41	9
ইঙ্গুশেটিয়া প্রজাতন্ত্র	75,05	41	23
কাল্মিকিয়া প্রজাতন্ত্র	68,52	39	37
কারাচে-চের্কেস প্রজাতন্ত্র	66,68	44	42
কারেলিয়া প্রজাতন্ত্র	61,70	73	73
কোমি প্রজাতন্ত্র	59,60	74	57
মারি এল প্রজাতন্ত্র	65,19	62	47

ইত্যাদি। (নিঃসরণ পরিষ্কার করার পরে, 88 টির মধ্যে 83টি রয়ে গেছে)

মডেলের গুণমান বর্ণনাকারী পরিসংখ্যান:

1. একাধিক R = 0.62; এল-বর্গ = ০.৩৮। ফলস্বরূপ, জাতীয় ফ্যাক্টর এবং নগরায়ন ফ্যাক্টর একসাথে "নির্বাচনী কার্যকলাপ" পরিবর্তনশীলের প্রায় 38% পরিবর্তনকে ব্যাখ্যা করে।

2. গড় ত্রুটিহল 3.38। ভোটের স্তরের পূর্বাভাস দেওয়ার সময় নির্মিত মডেলটি ঠিক কতটা "গড় ভুল" হয়৷

3. 0.000000003 স্তরে ব্যাখ্যা করা এবং অব্যক্ত প্রকরণের /l-অনুপাত হল 25.2। চিহ্নিত সম্পর্কের এলোমেলোতা সম্পর্কে শূন্য অনুমান প্রত্যাখ্যান করা হয়।

4. "শহুরে জনসংখ্যা" এবং "রাশিয়ান জনসংখ্যা" ভেরিয়েবলগুলির ধ্রুবক এবং রিগ্রেশন সহগগুলির জন্য মানদণ্ড / 0.0000001 স্তরে তাৎপর্যপূর্ণ; যথাক্রমে 0.00005 এবং 0.007। শূন্য অনুমান যে সহগগুলি এলোমেলো তা প্রত্যাখ্যান করা হয়।

নির্ভরশীল ভেরিয়েবলের মূল এবং পূর্বাভাসিত মানের মধ্যে সম্পর্ক বিশ্লেষণে অতিরিক্ত দরকারী পরিসংখ্যান হল মহালনোবিস দূরত্ব এবং কুকের দূরত্ব। প্রথমটি হল কেসের স্বতন্ত্রতার একটি পরিমাপ (দেখায় যে সমস্ত স্বাধীন ভেরিয়েবলের মানগুলির সংমিশ্রণ কত এই ক্ষেত্রেএকই সাথে সমস্ত স্বাধীন ভেরিয়েবলের গড় থেকে বিচ্যুত হয়)। দ্বিতীয়টি মামলার প্রভাবের একটি পরিমাপ। রিগ্রেশন লাইনের ঢালের উপর বিভিন্ন পর্যবেক্ষণের বিভিন্ন প্রভাব রয়েছে এবং এই সূচকে তাদের তুলনা করতে কুকের দূরত্ব ব্যবহার করা যেতে পারে। বহিরাগতদের পরিষ্কার করার সময় এটি কার্যকর হতে পারে (একটি বহিরাগতকে অত্যধিক প্রভাবশালী কেস হিসাবে বিবেচনা করা যেতে পারে)।

আমাদের উদাহরণে, অনন্য এবং প্রভাবশালী ক্ষেত্রে দাগেস্তান অন্তর্ভুক্ত।

ঘটছে	আসল মান	প্রেডস্কা মান	অবশিষ্টাংশ	দূরত্ব মহলনোবিস	দূরত্ব
অডিজিয়া	64,92	66,33	-1,40	0,69	0,00
আলতাই প্রজাতন্ত্র	68,60	69.91	-1,31	6,80	0,01
বুরিয়াটিয়া প্রজাতন্ত্র	60,75	65,56	-4,81	0,23	0,01
দাগেস্তান প্রজাতন্ত্র	79,92	71,01	8,91	10,57	0,44
ইঙ্গুশেটিয়া প্রজাতন্ত্র	75,05	70,21	4,84	6,73	0,08
কাল্মিকিয়া প্রজাতন্ত্র	68,52	69,59	-1,07	4,20	0,00

রিগ্রেশন মডেলের নিজেই নিম্নলিখিত পরামিতি রয়েছে: Y-ছেদ (ধ্রুবক) = 75.99; b (অনুভূমিক) = -0.1; Kommersant (রাশিয়ান nas.) = -0.06. চূড়ান্ত সূত্র।

কার্যকারণ নির্ভরতার বৈশিষ্ট্য

কারণ এবং প্রভাব সম্পর্ক- এটি ঘটনা এবং প্রক্রিয়াগুলির মধ্যে একটি সংযোগ, যখন তাদের একটিতে পরিবর্তন - কারণ - অন্যটির পরিবর্তনের দিকে নিয়ে যায় - প্রভাব।

সম্পর্ক অধ্যয়নের জন্য তাদের তাত্পর্য অনুযায়ী চিহ্ন দুটি শ্রেণীতে বিভক্ত।

যে চিহ্নগুলি অন্যান্য সম্পর্কিত লক্ষণগুলির পরিবর্তন ঘটায় তাকে বলা হয় ফ্যাক্টোরিয়াল (বা কারণ)।

যে লক্ষণগুলি ফ্যাক্টর লক্ষণগুলির প্রভাবে পরিবর্তিত হয় কার্যকর

যোগাযোগের নিম্নলিখিত ফর্মগুলি আলাদা করা হয়: কার্যকরী এবং স্টোকাস্টিক। কার্যকরীএমন একটি সম্পর্ক যেখানে একটি গুণনীয়ক বৈশিষ্ট্যের একটি নির্দিষ্ট মান ফলাফলের বৈশিষ্ট্যের একটি এবং শুধুমাত্র একটি মানের সাথে মিলে যায়। কার্যকরী সংযোগ পর্যবেক্ষণের সমস্ত ক্ষেত্রে এবং অধ্যয়নের অধীনে জনসংখ্যার প্রতিটি নির্দিষ্ট ইউনিটের জন্য উদ্ভাসিত হয়।

কার্যকরী সম্পর্ক নিম্নলিখিত সমীকরণ দ্বারা প্রতিনিধিত্ব করা যেতে পারে:
y i = f(x i),যেখানে: y i - ফলাফল চিহ্ন; f(x i) - ফলাফল এবং ফ্যাক্টর বৈশিষ্ট্যের মধ্যে সংযোগের একটি পরিচিত ফাংশন; একাদশ - ফ্যাক্টর সাইন।
বাস্তব প্রকৃতিতে কোন কার্যকরী সংযোগ নেই। তারা শুধুমাত্র বিমূর্ততা, ঘটনা বিশ্লেষণে দরকারী, কিন্তু বাস্তবতা সরলীকরণ.

স্টোকাস্টিক (পরিসংখ্যানগত বা এলোমেলো)সংযোগপরিমাণের মধ্যে একটি সম্পর্ককে প্রতিনিধিত্ব করে যেখানে তাদের মধ্যে একটি বন্টন আইন পরিবর্তন করে অন্য একটি পরিমাণ বা পরিমাণের পরিবর্তনে প্রতিক্রিয়া দেখায়। অন্য কথায়, এই সংযোগ সঙ্গে বিভিন্ন অর্থএকটি ভেরিয়েবল অন্য ভেরিয়েবলের বিভিন্ন ডিস্ট্রিবিউশনের সাথে মিলে যায়। এটি এই কারণে যে নির্ভরশীল পরিবর্তনশীল, বিবেচনাধীন স্বাধীনগুলি ছাড়াও, অনেকগুলি হিসাববিহীন বা অনিয়ন্ত্রিত এলোমেলো কারণগুলির দ্বারা প্রভাবিত হয়, সেইসাথে ভেরিয়েবলগুলির পরিমাপের ক্ষেত্রে কিছু অনিবার্য ত্রুটিগুলি দ্বারা প্রভাবিত হয়৷ নির্ভরশীল ভেরিয়েবলের মানগুলি র্যান্ডম স্ক্যাটারের সাপেক্ষে থাকার কারণে, তাদের যথেষ্ট নির্ভুলতার সাথে ভবিষ্যদ্বাণী করা যায় না, তবে শুধুমাত্র একটি নির্দিষ্ট সম্ভাবনার সাথে নির্দেশ করা যেতে পারে।

Y এবং X-এর মধ্যে স্টোকাস্টিক নির্ভরতার অস্পষ্টতার কারণে, বিশেষ করে, x-এর উপর গড় নির্ভরতা স্কিমটি আগ্রহের, অর্থাৎ গড় মানের পরিবর্তনের একটি প্যাটার্ন - শর্তসাপেক্ষ গাণিতিক প্রত্যাশা Mx(Y) (এলোমেলো পরিবর্তনশীল Y-এর গাণিতিক প্রত্যাশা, যদি পাওয়া যায় যে পরিবর্তনশীল X মান x গ্রহণ করে) x এর উপর নির্ভর করে।

স্টোকাস্টিক যোগাযোগের একটি বিশেষ ক্ষেত্রে পারস্পরিক সম্পর্ক যোগাযোগ। পারস্পরিক সম্পর্ক(lat থেকে। পারস্পরিক সম্পর্ক- পারস্পরিক সম্পর্ক, সম্পর্ক)। শব্দটির সরাসরি সংজ্ঞা পারস্পরিক সম্পর্ক - স্টোকাস্টিক, সম্ভাব্য, সম্ভব সংযোগ দুই (জোড়া) বা একাধিক (একাধিক) এর মধ্যে এলোমেলো ভেরিয়েবল.

দুটি ভেরিয়েবলের মধ্যে পারস্পরিক সম্পর্ক নির্ভরতাকে এই ভেরিয়েবলের মধ্যে একটি পরিসংখ্যানগত সম্পর্কও বলা হয়, যেখানে একটি ভেরিয়েবলের প্রতিটি মান একটি নির্দিষ্ট গড় মানের সাথে মিলে যায়, যেমন শর্তযুক্ত গাণিতিক প্রত্যাশা ভিন্ন। পারস্পরিক নির্ভরতা হল স্টোকাস্টিক নির্ভরতার একটি বিশেষ ক্ষেত্রে, যেখানে ফ্যাক্টর বৈশিষ্ট্যের মানগুলির একটি পরিবর্তন (x 1 x 2 ..., x n) ফলে বৈশিষ্ট্যের গড় মান পরিবর্তন করে।

নিম্নলিখিত ধরণের পারস্পরিক সম্পর্কের পার্থক্য করা প্রথাগত:

1. জোড়া পারস্পরিক সম্পর্ক - দুটি বৈশিষ্ট্যের মধ্যে একটি সংযোগ (ফলাফলমূলক এবং ফ্যাক্টর বা দুটি ফ্যাক্টর)।

2. আংশিক পারস্পরিক সম্পর্ক - গবেষণায় অন্তর্ভুক্ত অন্যান্য ফ্যাক্টর বৈশিষ্ট্যগুলির একটি নির্দিষ্ট মান সহ ফলাফল এবং একটি ফ্যাক্টর বৈশিষ্ট্যের মধ্যে নির্ভরতা।

3. একাধিক পারস্পরিক সম্পর্ক- ফলাফলের নির্ভরতা এবং গবেষণায় অন্তর্ভুক্ত দুই বা ততোধিক ফ্যাক্টর বৈশিষ্ট্য।

রিগ্রেশন বিশ্লেষণের উদ্দেশ্য

কারণ-এবং-প্রভাব সম্পর্ক উপস্থাপনের বিশ্লেষণাত্মক রূপ হল রিগ্রেশন মডেল। রিগ্রেশন বিশ্লেষণের বৈজ্ঞানিক বৈধতা এবং জনপ্রিয়তা এটিকে অধ্যয়নের অধীনে ঘটনাটির মডেলিংয়ের জন্য প্রধান গাণিতিক সরঞ্জামগুলির মধ্যে একটি করে তোলে। এই পদ্ধতিটি পরীক্ষামূলক ডেটা মসৃণ করতে এবং তুলনামূলক প্রভাবের পরিমাণগত অনুমান পেতে ব্যবহৃত হয় বিভিন্ন কারণফলাফল পরিবর্তনশীল.

রিগ্রেশন বিশ্লেষণ হয়একটি সম্পর্কের বিশ্লেষণাত্মক অভিব্যক্তি নির্ধারণে যেখানে এক বা একাধিক ব্যক্তির প্রভাবের কারণে একটি মানের পরিবর্তন (নির্ভরশীল পরিবর্তনশীল বা ফলস্বরূপ বৈশিষ্ট্য) হয় স্বাধীন পরিমাণ(ফ্যাক্টর বা ভবিষ্যদ্বাণীকারী), এবং অন্যান্য সমস্ত কারণের সেট যা নির্ভরশীল মানকে প্রভাবিত করে ধ্রুবক এবং গড় মান হিসাবে নেওয়া হয়।

রিগ্রেশন বিশ্লেষণের লক্ষ্য:

ফ্যাক্টর ফ্যাক্টর (x 1, x 2, ..., x n);

স্বাধীন চলক(গুলি) ব্যবহার করে একটি নির্ভরশীল ভেরিয়েবলের মান অনুমান করা।

নির্ভরশীল ভেরিয়েবলের পরিবর্তনে স্বতন্ত্র স্বাধীন ভেরিয়েবলের অবদান নির্ধারণ করা।

ভেরিয়েবলের মধ্যে সম্পর্ক আছে কিনা তা নির্ধারণ করতে রিগ্রেশন বিশ্লেষণ ব্যবহার করা যায় না, যেহেতু এই ধরনের সম্পর্কের উপস্থিতি বিশ্লেষণটি প্রয়োগ করার পূর্বশর্ত।

রিগ্রেশন বিশ্লেষণে, এটি আগে থেকেই ধরে নেওয়া হয় যে ফলাফল (U) এবং ফ্যাক্টর বৈশিষ্ট্য x 1, x 2 ..., x n এর মধ্যে কারণ-ও-প্রভাব সম্পর্ক রয়েছে।

ফাংশন , অপপরামিতিগুলির উপর সূচকের নির্ভরতা নির্ধারণকে রিগ্রেশন সমীকরণ (ফাংশন) বলা হয় 1 রিগ্রেশন সমীকরণটি স্বাধীন ভেরিয়েবলের নির্দিষ্ট মান দেওয়া নির্ভরশীল ভেরিয়েবলের প্রত্যাশিত মান দেখায়।
মডেল অন্তর্ভুক্ত কারণের সংখ্যা উপর নির্ভর করে এক্সমডেলগুলি একক-ফ্যাক্টর (পেয়ার রিগ্রেশন মডেল) এবং মাল্টি-ফ্যাক্টর (মাল্টিপল রিগ্রেশন মডেল) এ বিভক্ত। ফাংশনের ধরণের উপর নির্ভর করে, মডেলগুলিকে রৈখিক এবং অরৈখিক ভাগে ভাগ করা হয়।

পেয়ারড রিগ্রেশন মডেল

হিসাববিহীন এলোমেলো কারণ এবং কারণের প্রভাবের কারণে, পৃথক পর্যবেক্ষণ y রিগ্রেশন ফাংশন f(x) থেকে বৃহত্তর বা কম পরিমাণে বিচ্যুত হবে। এই ক্ষেত্রে, দুটি ভেরিয়েবলের (পেয়ারড রিগ্রেশন মডেল) মধ্যে সম্পর্কের সমীকরণটি এইভাবে উপস্থাপন করা যেতে পারে:

Y=f(X) + ɛ,

যেখানে ɛ রিগ্রেশন ফাংশন থেকে বিচ্যুতিকে চিহ্নিত করে একটি এলোমেলো পরিবর্তনশীল। এই পরিবর্তনশীলকে বলা হয় ঝামেলা বা বিঘ্ন (অবশিষ্ট বা ত্রুটি)। সুতরাং, রিগ্রেশন মডেলে নির্ভরশীল পরিবর্তনশীল Yকিছু ফাংশন আছে f(X)এলোমেলো ঝামেলা পর্যন্ত ɛ.

আসুন ক্লাসিক্যাল লিনিয়ার পেয়ারওয়াইজ রিগ্রেশন মডেল (CLMPR) বিবেচনা করি। সে দেখতে কেমন

y i =β 0 +β 1 x i +ɛ i (i=1,2, …, n),(1)

কোথায় yi- ব্যাখ্যা করা হয়েছে (ফলাফল, নির্ভরশীল, অন্তঃসত্ত্বা পরিবর্তনশীল); একাদশ- ব্যাখ্যামূলক (ভবিষ্যদ্বাণীকারী, ফ্যাক্টর, বহিরাগত) পরিবর্তনশীল; β 0, β 1- সংখ্যাগত সহগ; ɛi- এলোমেলো (স্টকাস্টিক) উপাদান বা ত্রুটি।

KLMPR-এর মৌলিক শর্ত (পূর্বশর্ত, অনুমান):

1) একাদশ- একটি নির্ধারক (অ-এলোমেলো) পরিমাণ, এবং এটি অনুমান করা হয় যে মানগুলির মধ্যে x i - সবগুলি একই নয়।

2) প্রত্যাশিত মান(গড় মান) ঝামেলা ɛiশূন্যের সমান:

М[ɛ i ]=0 (i=1,2, …, n)।

3) বিঘ্নের বিচ্ছুরণ i এর যেকোন মানের জন্য ধ্রুবক (হোমোসেড্যাস্টিটি অবস্থা):

D[ɛ i ]=σ 2 (i=1,2, …, n)।

4) বিভিন্ন পর্যবেক্ষণের জন্য ব্যাঘাতগুলি সম্পর্কহীন:

cov[ɛ i , ɛ j ] = M[ɛ i , ɛ j ] = i≠j এর জন্য,

যেখানে cov[ɛ i , ɛ j ] হল কোভারিয়েন্স সহগ (সম্পর্কের মুহূর্ত)।

5) ব্যাঘাতগুলি সাধারণত শূন্য গড় এবং প্রকরণ σ 2 সহ র্যান্ডম ভেরিয়েবল বিতরণ করা হয়:

ɛ i ≈ N(0, σ 2)।

একটি রিগ্রেশন সমীকরণ প্রাপ্ত করার জন্য, প্রথম চারটি প্রাঙ্গন যথেষ্ট। রিগ্রেশন সমীকরণ এবং এর পরামিতিগুলির যথার্থতা মূল্যায়ন করার জন্য পঞ্চম পূর্বশর্ত পূরণের প্রয়োজনীয়তা প্রয়োজন।

মন্তব্য:রৈখিক সম্পর্কের উপর ফোকাসটি ভেরিয়েবলের সীমিত পরিবর্তনের দ্বারা ব্যাখ্যা করা হয় এবং এই সত্য যে বেশিরভাগ ক্ষেত্রে সম্পর্কের অরৈখিক ফর্মগুলি গণনা সম্পাদনের জন্য একটি রৈখিক আকারে (লগরিদম বা ভেরিয়েবলের প্রতিস্থাপন দ্বারা) রূপান্তরিত হয়।

প্রথাগত পদ্ধতিসর্বনিম্ন বর্গক্ষেত্র (LS)

নমুনা থেকে মডেল অনুমান হল সমীকরণ

ŷ i = a 0 + a 1 x i(i=1,2, …, n), (2)

যেখানে ŷ i – রিগ্রেশন সমীকরণ থেকে প্রাপ্ত নির্ভরশীল পরিবর্তনশীলের তাত্ত্বিক (আনুমানিক) মান; a 0 , a 1 - রিগ্রেশন সমীকরণের সহগ (প্যারামিটার) (যথাক্রমে β 0, β 1 সহগগুলির নমুনা অনুমান)।

ন্যূনতম বর্গক্ষেত্র অনুসারে, অজানা পরামিতিগুলি a 0 , a 1 বেছে নেওয়া হয়েছে যাতে অভিজ্ঞতামূলক মান y i (বর্গগুলির অবশিষ্ট যোগফল) থেকে ŷ i মানের বর্গের বিচ্যুতির যোগফল ন্যূনতম হয়:

Q e = ∑e i 2 = ∑(y i – ŷ i) 2 = ∑(yi – (a 0 + a 1 x i)) 2 → মিনিট, (3)

যেখানে e i = y i - ŷ i - ঝামেলার নমুনা অনুমান ɛ i, বা রিগ্রেশন অবশিষ্টাংশ।

সমস্যাটি 0 এবং একটি 1 প্যারামিটারের এই ধরনের মান খুঁজে বের করতে আসে যার জন্য Q e ফাংশন নেয় ক্ষুদ্রতম মান. লক্ষ্য করুন যে ফাংশন Q e = Q e (a 0 , a 1) দুটি ভেরিয়েবল a 0 এবং a 1 এর একটি ফাংশন যতক্ষণ না আমরা খুঁজে পাই এবং তারপরে তাদের "সর্বোত্তম" (সর্বনিম্ন বর্গ পদ্ধতির অর্থে) মান, একটি x i স্থির করি। , y i হল পরীক্ষামূলকভাবে পাওয়া ধ্রুবক সংখ্যা।

প্রয়োজনীয় শর্তাবলীদুটি ভেরিয়েবলের এই ফাংশনের আংশিক ডেরিভেটিভকে শূন্যে সমান করে extrema (3) পাওয়া যায়। ফলস্বরূপ, আমরা দুটি সিস্টেম প্রাপ্ত রৈখিক সমীকরণ, যাকে সাধারণ সমীকরণের সিস্টেম বলা হয়:

(4)

সহগ a 1 হল x-এর উপর y-এর একটি নমুনা রিগ্রেশন সহগ, যা দেখায় যে পরিবর্তনশীল x পরিমাপের এক একক দ্বারা পরিবর্তিত হলে গড় কতগুলি একক y পরিবর্তিত হয়, অর্থাৎ, x-এর পরিবর্তনের একক প্রতি y-এর তারতম্য। চিহ্ন একটি 1এই পরিবর্তনের দিক নির্দেশ করে। সহগ একটি 0 – স্থানচ্যুতি, (2) অনুযায়ী মানের সমান x=0 এর জন্য ŷ i এবং এর কোনো অর্থপূর্ণ ব্যাখ্যা নাও থাকতে পারে। এই কারণে, নির্ভরশীল পরিবর্তনশীলকে কখনও কখনও প্রতিক্রিয়া বলা হয়।

রিগ্রেশন সহগ অনুমানের পরিসংখ্যানগত বৈশিষ্ট্য:

সহগ অনুমান a 0, a 1 নিরপেক্ষ;

অনুমানের ভিন্নতা a 0 , a 1 হ্রাস পায় (অনুমানের নির্ভুলতা বৃদ্ধি পায়) নমুনার আকার n বৃদ্ধির সাথে;

ঢাল a 1 এর অনুমানের পার্থক্য বৃদ্ধির সাথে হ্রাস পায় এবং তাই x i বেছে নেওয়ার পরামর্শ দেওয়া হয় যাতে গড় মানের চারপাশে তাদের বিস্তার বড় হয়;

x¯ > 0 এর জন্য (যা সবচেয়ে বেশি আগ্রহের), একটি 0 এবং 1 এর মধ্যে একটি নেতিবাচক পরিসংখ্যানগত সম্পর্ক রয়েছে (একটি 1-এর বৃদ্ধি 0-এর হ্রাসের দিকে নিয়ে যায়)।

রিগ্রেশন বিশ্লেষণের প্রধান বৈশিষ্ট্য: এর সাহায্যে, আপনি অধ্যয়নের অধীনে ভেরিয়েবলের মধ্যে সম্পর্ক কী ফর্ম এবং প্রকৃতি সম্পর্কে নির্দিষ্ট তথ্য পেতে পারেন।

রিগ্রেশন বিশ্লেষণের পর্যায়গুলির ক্রম

আসুন সংক্ষেপে রিগ্রেশন বিশ্লেষণের পর্যায়গুলি বিবেচনা করি।

সমস্যা তৈয়ার. এই পর্যায়ে, অধ্যয়নের অধীনে ঘটনার নির্ভরতা সম্পর্কে প্রাথমিক অনুমান গঠিত হয়।

নির্ভরশীল এবং স্বাধীন (ব্যাখ্যামূলক) ভেরিয়েবলের সংজ্ঞা।

পরিসংখ্যানগত তথ্য সংগ্রহ। রিগ্রেশন মডেলে অন্তর্ভুক্ত প্রতিটি ভেরিয়েবলের জন্য ডেটা সংগ্রহ করতে হবে।

সংযোগের ফর্ম সম্পর্কে একটি অনুমান প্রণয়ন (সরল বা একাধিক, রৈখিক বা অরৈখিক)।

সংজ্ঞা রিগ্রেশন ফাংশন (রিগ্রেশন সমীকরণের পরামিতিগুলির সংখ্যাসূচক মান গণনা করে)

রিগ্রেশন বিশ্লেষণের যথার্থতা মূল্যায়ন।

প্রাপ্ত ফলাফলের ব্যাখ্যা। রিগ্রেশন বিশ্লেষণের প্রাপ্ত ফলাফলগুলি প্রাথমিক অনুমানের সাথে তুলনা করা হয়। প্রাপ্ত ফলাফলের সঠিকতা এবং বিশ্বাসযোগ্যতা মূল্যায়ন করা হয়।

ভবিষ্যদ্বাণী অজানা মাননির্ভরশীল পরিবর্তনশীল।

রিগ্রেশন বিশ্লেষণ ব্যবহার করে, পূর্বাভাস এবং শ্রেণীবিভাগের সমস্যা সমাধান করা সম্ভব। রিগ্রেশন সমীকরণে ব্যাখ্যামূলক ভেরিয়েবলের মানগুলিকে প্রতিস্থাপন করে পূর্বাভাসিত মানগুলি গণনা করা হয়। শ্রেণিবিন্যাসের সমস্যাটি এইভাবে সমাধান করা হয়: রিগ্রেশন লাইন বস্তুর সম্পূর্ণ সেটটিকে দুটি শ্রেণীতে বিভক্ত করে, এবং সেটের যে অংশে ফাংশনের মান শূন্যের চেয়ে বেশি সেটি একটি শ্রেণীর অন্তর্গত, এবং যে অংশটি শূন্যের চেয়ে কম সেটি অন্য শ্রেণীর অন্তর্গত।

রিগ্রেশন বিশ্লেষণ সমস্যা

আসুন রিগ্রেশন বিশ্লেষণের প্রধান কাজগুলি বিবেচনা করি: নির্ভরতার ফর্ম প্রতিষ্ঠা করা, নির্ধারণ করা রিগ্রেশন ফাংশন, নির্ভরশীল ভেরিয়েবলের অজানা মানের অনুমান।

নির্ভরতার রূপ প্রতিষ্ঠা করা।

ভেরিয়েবলের মধ্যে সম্পর্কের প্রকৃতি এবং ফর্ম নিম্নলিখিত ধরনের রিগ্রেশন গঠন করতে পারে:

ইতিবাচক লিনিয়ার রিগ্রেশন(ফাংশনের অভিন্ন বৃদ্ধিতে প্রকাশিত);

ইতিবাচক অভিন্নভাবে বৃদ্ধি রিগ্রেশন;

নেতিবাচক লিনিয়ার রিগ্রেশন (ফাংশনে অভিন্ন পতন হিসাবে প্রকাশ করা হয়);

নেতিবাচক অভিন্নভাবে ত্বরিত হ্রাস রিগ্রেশন;

নেতিবাচক অভিন্নভাবে হ্রাস রিগ্রেশন.

যাইহোক, বর্ণিত জাতগুলি সাধারণত পাওয়া যায় না বিশুদ্ধ ফর্ম, কিন্তু একে অপরের সাথে সংমিশ্রণে। এই ক্ষেত্রে, আমরা রিগ্রেশনের সম্মিলিত ফর্ম সম্পর্কে কথা বলি।

রিগ্রেশন ফাংশনের সংজ্ঞা।

দ্বিতীয় কাজটি প্রধান কারণ বা কারণগুলির নির্ভরশীল পরিবর্তনশীলের উপর প্রভাব চিহ্নিত করার জন্য নেমে আসে, অন্যান্য জিনিসগুলি সমান হয় এবং নির্ভরশীল ভেরিয়েবলের উপর র্যান্ডম উপাদানগুলির প্রভাবকে বাদ দেওয়া হয়। রিগ্রেশন ফাংশনএক প্রকার বা অন্য একটি গাণিতিক সমীকরণ আকারে সংজ্ঞায়িত করা হয়।

নির্ভরশীল ভেরিয়েবলের অজানা মানের অনুমান।

এই সমস্যার সমাধান নিম্নলিখিত ধরনের একটি সমস্যা সমাধানে নেমে আসে:

প্রাথমিক ডেটার বিবেচিত ব্যবধানের মধ্যে নির্ভরশীল ভেরিয়েবলের মানগুলির অনুমান, যেমন অনুপস্থিত মানের; এই ক্ষেত্রে, ইন্টারপোলেশন সমস্যা সমাধান করা হয়।

নির্ভরশীল ভেরিয়েবলের ভবিষ্যত মানের অনুমান, যেমন উৎস ডেটার নির্দিষ্ট ব্যবধানের বাইরে মান খুঁজে বের করা; এই ক্ষেত্রে, এক্সট্রাপোলেশন সমস্যা সমাধান করা হয়।

রিগ্রেশন সমীকরণে স্বাধীন ভেরিয়েবলের মানের জন্য পাওয়া প্যারামিটার অনুমানগুলি প্রতিস্থাপন করে উভয় সমস্যাই সমাধান করা হয়। সমীকরণ সমাধানের ফলাফল হল লক্ষ্য (নির্ভরশীল) চলকের মানের অনুমান।

আসুন কিছু অনুমানের দিকে তাকাই যা রিগ্রেশন বিশ্লেষণ নির্ভর করে।

লিনিয়ারিটি অনুমান, অর্থাৎ বিবেচনাধীন ভেরিয়েবলের মধ্যে সম্পর্ক রৈখিক বলে ধরে নেওয়া হয়। সুতরাং, এই উদাহরণে, আমরা একটি স্ক্যাটারপ্লট তৈরি করেছি এবং একটি স্পষ্ট রৈখিক সম্পর্ক দেখতে সক্ষম হয়েছি। যদি, ভেরিয়েবলের স্ক্যাটার ডায়াগ্রামে, আমরা একটি রৈখিক সম্পর্কের স্পষ্ট অনুপস্থিতি দেখতে পাই, যেমন যদি একটি অরৈখিক সম্পর্ক থাকে, তাহলে অরৈখিক বিশ্লেষণ পদ্ধতি ব্যবহার করা উচিত।

স্বাভাবিকতা অনুমান অবশিষ্টাংশ. এটি অনুমান করে যে ভবিষ্যদ্বাণী করা এবং পর্যবেক্ষণ করা মানগুলির মধ্যে পার্থক্যের বন্টন স্বাভাবিক। চাক্ষুষভাবে বিতরণের প্রকৃতি নির্ধারণ করতে, আপনি হিস্টোগ্রাম ব্যবহার করতে পারেন অবশিষ্টাংশ.

রিগ্রেশন বিশ্লেষণ ব্যবহার করার সময়, এর প্রধান সীমাবদ্ধতা বিবেচনা করা উচিত। এটির মধ্যে রয়েছে যে রিগ্রেশন বিশ্লেষণ আমাদের শুধুমাত্র নির্ভরতা সনাক্ত করতে দেয়, এবং এই নির্ভরতাগুলির অন্তর্নিহিত সংযোগগুলি নয়।

রিগ্রেশন বিশ্লেষণ আপনাকে কয়েকটি পরিচিত মানের উপর ভিত্তি করে একটি পরিবর্তনশীলের আনুমানিক মান গণনা করে ভেরিয়েবলের মধ্যে সম্পর্কের শক্তি অনুমান করতে দেয়।

রিগ্রেশন সমীকরণ.

রিগ্রেশন সমীকরণটি এইরকম দেখায়: Y=a+b*X

এই সমীকরণটি ব্যবহার করে, ভেরিয়েবল Yটিকে একটি ধ্রুবক a এবং রেখার ঢাল (বা ঢাল) b এর পরিপ্রেক্ষিতে প্রকাশ করা হয়, যা চলক X-এর মান দিয়ে গুণ করে। ধ্রুবক aকে ইন্টারসেপ্ট টার্মও বলা হয় এবং ঢাল হল রিগ্রেশন সহগ বা বি-গুণ।

বেশিরভাগ ক্ষেত্রে (যদি সর্বদা না হয়) রিগ্রেশন লাইনের সাথে সম্পর্কিত পর্যবেক্ষণের একটি নির্দিষ্ট বিক্ষিপ্ততা রয়েছে।

অবশিষ্ট রিগ্রেশন লাইন (পূর্বাভাসিত মান) থেকে একটি একক বিন্দু (পর্যবেক্ষণ) এর বিচ্যুতি।

এমএস এক্সেলে রিগ্রেশন বিশ্লেষণের সমস্যা সমাধান করতে, মেনু থেকে নির্বাচন করুন সেবা"বিশ্লেষণ প্যাকেজ"এবং রিগ্রেশন বিশ্লেষণ টুল। আমরা ইনপুট ব্যবধান X এবং Y সেট করি। ইনপুট ব্যবধান Y হল নির্ভরশীল বিশ্লেষণকৃত ডেটার পরিসর, এটি অবশ্যই একটি কলাম অন্তর্ভুক্ত করতে হবে। ইনপুট ব্যবধান X হল স্বাধীন ডেটার পরিসর যা বিশ্লেষণ করা প্রয়োজন। ইনপুট ব্যাপ্তির সংখ্যা 16 এর বেশি হওয়া উচিত নয়।

আউটপুট পরিসরে পদ্ধতির আউটপুটে আমরা প্রদত্ত প্রতিবেদনটি পাই টেবিল 8.3a-8.3v.

ফলাফলের উপসংহার

সারণি 8.3a. রিগ্রেশন পরিসংখ্যান
রিগ্রেশন পরিসংখ্যান
বহুবচন আর
আর-বর্গক্ষেত্র
স্বাভাবিকীকৃত R-বর্গাকার
মান ত্রুটি
পর্যবেক্ষণ

আসুন প্রথমে উপস্থাপিত হিসাবের উপরের অংশটি দেখি টেবিল 8.3a, - রিগ্রেশন পরিসংখ্যান।

মাত্রা আর-বর্গক্ষেত্র, যাকে নিশ্চিততার পরিমাপও বলা হয়, ফলে রিগ্রেশন লাইনের গুণমানকে চিহ্নিত করে। এই গুণটি উত্স ডেটা এবং রিগ্রেশন মডেল (গণনা করা ডেটা) এর মধ্যে চিঠিপত্রের ডিগ্রি দ্বারা প্রকাশ করা হয়। নিশ্চিততার পরিমাপ সর্বদা ব্যবধানের মধ্যে থাকে।

অধিকাংশ ক্ষেত্রে মান আর-বর্গক্ষেত্রএই মানগুলির মধ্যে রয়েছে, যাকে চরম বলা হয়, অর্থাৎ শূন্য এবং একের মধ্যে।

মান থাকলে আর-বর্গক্ষেত্রএকতার কাছাকাছি, এর মানে হল যে নির্মিত মডেলটি সংশ্লিষ্ট ভেরিয়েবলের প্রায় সমস্ত পরিবর্তনশীলতা ব্যাখ্যা করে। বিপরীতভাবে, অর্থ আর-বর্গক্ষেত্র, শূন্যের কাছাকাছি, মানে নির্মিত মডেলের নিম্নমানের।

বহুবচন R - একাধিক পারস্পরিক সম্পর্ক সহগ R - স্বাধীন ভেরিয়েবল (X) এবং নির্ভরশীল চলকের (Y) নির্ভরতার মাত্রা প্রকাশ করে।

বহুবচন আরনির্ণয়ের সহগের বর্গমূলের সমান; এই পরিমাণটি শূন্য থেকে এক পর্যন্ত পরিসরে মান নেয়।

সহজ লিনিয়ার রিগ্রেশন বিশ্লেষণে বহুবচন Rপিয়ারসন পারস্পরিক সম্পর্ক সহগ সমান। সত্যিই, বহুবচন Rআমাদের ক্ষেত্রে, এটি পূর্ববর্তী উদাহরণ (0.998364) থেকে পিয়ারসন পারস্পরিক সম্পর্ক সহগের সমান।

সারণি 8.3 খ. রিগ্রেশন সহগ
	মতভেদ	মান ত্রুটি	t-পরিসংখ্যান
Y- ছেদ
পরিবর্তনশীল X 1
* গণনার একটি ছোট সংস্করণ প্রদান করা হয়

এখন উপস্থাপিত গণনার মাঝের অংশ বিবেচনা করুন টেবিল 8.3b. এখানে রিগ্রেশন সহগ b (2.305454545) এবং অর্ডিনেট অক্ষ বরাবর স্থানচ্যুতি দেওয়া হয়েছে, যেমন ধ্রুবক a (2.694545455)।

গণনার উপর ভিত্তি করে, আমরা নিম্নরূপ রিগ্রেশন সমীকরণ লিখতে পারি:

Y= x*2.305454545+2.694545455

ভেরিয়েবলের মধ্যে সম্পর্কের দিক নির্ধারণ করা হয় রিগ্রেশন সহগ (গুণ খ) এর চিহ্নের (নেতিবাচক বা ইতিবাচক) উপর ভিত্তি করে।

রিগ্রেশন সহগ চিহ্নটি ধনাত্মক হলে, নির্ভরশীল চলক এবং স্বাধীন চলকের মধ্যে সম্পর্ক ধনাত্মক হবে। আমাদের ক্ষেত্রে, রিগ্রেশন সহগের চিহ্নটি ইতিবাচক, তাই সম্পর্কটিও ইতিবাচক।

রিগ্রেশন সহগের চিহ্নটি ঋণাত্মক হলে, নির্ভরশীল চলক এবং স্বাধীন চলকের মধ্যে সম্পর্ক ঋণাত্মক (বিপরীত)।

ভিতরে টেবিল 8.3c. আউটপুট ফলাফল উপস্থাপন করা হয় অবশিষ্টাংশ. রিপোর্টে এই ফলাফলগুলি দেখানোর জন্য, "রিগ্রেশন" টুলটি চালানোর সময় আপনাকে অবশ্যই "অবশিষ্ট" চেকবক্স সক্রিয় করতে হবে।

বাকিদের প্রত্যাহার

সারণি 8.3c. অবশিষ্টাংশ
পর্যবেক্ষণ	ভবিষ্যদ্বাণী Y	অবশিষ্টাংশ	স্ট্যান্ডার্ড ব্যালেন্স

প্রতিবেদনের এই অংশটি ব্যবহার করে, আমরা নির্মিত রিগ্রেশন লাইন থেকে প্রতিটি বিন্দুর বিচ্যুতি দেখতে পারি। সবচেয়ে বড় পরম মান অবশিষ্টআমাদের ক্ষেত্রে - 0.778, সবচেয়ে ছোট - 0.043। এই ডেটাগুলিকে আরও ভালভাবে ব্যাখ্যা করার জন্য, আমরা মূল ডেটার গ্রাফ এবং এতে উপস্থাপিত নির্মিত রিগ্রেশন লাইন ব্যবহার করব চাল 8.3. আপনি দেখতে পাচ্ছেন, রিগ্রেশন লাইনটি মূল ডেটার মানগুলির সাথে বেশ সঠিকভাবে "ফিট" করা হয়েছে।

এটি বিবেচনায় নেওয়া উচিত যে বিবেচনাধীন উদাহরণটি বেশ সহজ এবং গুণগতভাবে একটি লিনিয়ার রিগ্রেশন লাইন তৈরি করা সবসময় সম্ভব নয়।

ভাত। ৮.৩।উৎস তথ্য এবং রিগ্রেশন লাইন

স্বাধীন ভেরিয়েবলের পরিচিত মানের উপর ভিত্তি করে নির্ভরশীল ভেরিয়েবলের অজানা ভবিষ্যত মান অনুমান করার সমস্যাটি বিবেচনার বাইরে থেকে গেছে, যেমন পূর্বাভাস সমস্যা।

একটি রিগ্রেশন সমীকরণ থাকার ফলে, পূর্বাভাস সমস্যাটি x এর পরিচিত মানগুলির সাথে Y= x*2.305454545+2.694545455 সমীকরণটি সমাধান করার জন্য হ্রাস করা হয়। নির্ভরশীল ভেরিয়েবল Y ছয় ধাপ এগিয়ে ভবিষ্যদ্বাণী করার ফলাফল উপস্থাপন করা হয়েছে টেবিল 8.4-এ.

টেবিল 8.4. Y পরিবর্তনশীল পূর্বাভাসের ফলাফল
	Y(ভবিষ্যদ্বাণী করা)

সুতরাং, মাইক্রোসফ্ট এক্সেলে রিগ্রেশন বিশ্লেষণ ব্যবহারের ফলে, আমরা:

একটি রিগ্রেশন সমীকরণ তৈরি;

ভেরিয়েবলের মধ্যে সংযোগের নির্ভরতা এবং দিকনির্দেশের ফর্ম প্রতিষ্ঠিত করেছে - ইতিবাচক রৈখিক রিগ্রেশন, যা ফাংশনের অভিন্ন বৃদ্ধিতে প্রকাশ করা হয়;

ভেরিয়েবলের মধ্যে সম্পর্কের দিকনির্দেশ স্থাপন করে;

ফলাফল রিগ্রেশন লাইনের গুণমান মূল্যায়ন;

মূল সেটের ডেটা থেকে গণনা করা ডেটার বিচ্যুতি দেখতে সক্ষম হয়েছিল;

নির্ভরশীল ভেরিয়েবলের ভবিষ্যত মান।

যদি রিগ্রেশন ফাংশনসংজ্ঞায়িত, ব্যাখ্যা করা এবং ন্যায়সঙ্গত, এবং রিগ্রেশন বিশ্লেষণের নির্ভুলতার মূল্যায়ন প্রয়োজনীয়তা পূরণ করে, নির্মিত মডেল এবং ভবিষ্যদ্বাণীকৃত মানগুলিকে যথেষ্ট নির্ভরযোগ্যতা হিসাবে বিবেচনা করা যেতে পারে।

এইভাবে প্রাপ্ত ভবিষ্যদ্বাণীকৃত মানগুলি হল গড় মান যা আশা করা যেতে পারে।

এই কাজের মধ্যে আমরা প্রধান বৈশিষ্ট্য পর্যালোচনা বর্ণনামূলক পরিসংখ্যানএবং তাদের মধ্যে যেমন ধারণা গড় মূল্য,মধ্যমা,সর্বোচ্চ,সর্বনিম্নএবং ডেটা বৈচিত্রের অন্যান্য বৈশিষ্ট্য।

ধারণাটিও সংক্ষিপ্তভাবে আলোচনা করা হয়েছিল নির্গমন. বিবেচিত বৈশিষ্ট্যগুলি তথাকথিত অনুসন্ধানমূলক ডেটা বিশ্লেষণের সাথে সম্পর্কিত; এর উপসংহারগুলি সাধারণ জনসংখ্যার জন্য প্রযোজ্য নাও হতে পারে, তবে শুধুমাত্র ডেটার একটি নমুনার জন্য। অনুসন্ধানমূলক তথ্য বিশ্লেষণ প্রাথমিক সিদ্ধান্তে প্রাপ্ত এবং জনসংখ্যা সম্পর্কে অনুমান গঠন করতে ব্যবহৃত হয়।

পারস্পরিক সম্পর্ক এবং রিগ্রেশন বিশ্লেষণের মূল বিষয়গুলি, তাদের কাজ এবং ব্যবহারিক ব্যবহারের জন্য সম্ভাবনাগুলিও আলোচনা করা হয়েছিল।

রিগ্রেশন বিশ্লেষণ পদ্ধতিটি মান সম্পর্ক তৈরি এবং সারিবদ্ধ করার জন্য একটি নির্দিষ্ট প্যারামেট্রিক সিরিজের পণ্যগুলির প্রযুক্তিগত এবং অর্থনৈতিক পরামিতি নির্ধারণ করতে ব্যবহৃত হয়। এই পদ্ধতিটি এক বা একাধিক প্রযুক্তিগত এবং অর্থনৈতিক পরামিতির উপস্থিতি দ্বারা চিহ্নিত পণ্যগুলির স্তর এবং মূল্যের অনুপাত বিশ্লেষণ এবং ন্যায্যতা দিতে ব্যবহৃত হয় যা প্রধান ভোক্তা বৈশিষ্ট্যগুলিকে প্রতিফলিত করে। রিগ্রেশন বিশ্লেষণ আমাদের একটি অভিজ্ঞতামূলক সূত্র খুঁজে পেতে দেয় যা পণ্যের প্রযুক্তিগত এবং অর্থনৈতিক পরামিতিগুলির উপর মূল্যের নির্ভরতা বর্ণনা করে:

P=f(X1X2,...,Xn),

যেখানে P হল পণ্যের একক মূল্যের মান, ঘষা। (X1, X2, ... Xn) - পণ্যের প্রযুক্তিগত এবং অর্থনৈতিক পরামিতি।

রিগ্রেশন বিশ্লেষণের পদ্ধতি - ব্যবহৃত আদর্শ-প্যারামেট্রিক পদ্ধতিগুলির মধ্যে সবচেয়ে উন্নত - আধুনিক ব্যবহারের উপর ভিত্তি করে গণনা করার সময় কার্যকর। তথ্য প্রযুক্তিএবং সিস্টেম। এর প্রয়োগে নিম্নলিখিত প্রধান পদক্ষেপগুলি অন্তর্ভুক্ত রয়েছে:

পণ্যের শ্রেণীবিভাগ প্যারামেট্রিক গ্রুপ নির্ধারণ;
পণ্যের দামকে সবচেয়ে বেশি প্রভাবিত করে এমন পরামিতিগুলির নির্বাচন;
পরামিতি পরিবর্তন হলে মূল্য পরিবর্তনের মধ্যে সংযোগের ফর্ম নির্বাচন এবং ন্যায্যতা;
স্বাভাবিক সমীকরণের একটি সিস্টেম নির্মাণ এবং রিগ্রেশন সহগ গণনা।

মৌলিক যোগ্যতা গ্রুপপণ্য, যার মূল্য সমীকরণ সাপেক্ষে, একটি প্যারামেট্রিক সিরিজ, যার মধ্যে পণ্যগুলি তাদের প্রয়োগ, অপারেটিং শর্ত এবং প্রয়োজনীয়তা ইত্যাদির উপর নির্ভর করে বিভিন্ন ডিজাইনে গোষ্ঠীভুক্ত করা যেতে পারে। প্যারামেট্রিক সিরিজ গঠন করার সময়, স্বয়ংক্রিয় শ্রেণীবিভাগ পদ্ধতি ব্যবহার করা যেতে পারে, পণ্যগুলিকে তাদের সমজাতীয় গোষ্ঠীগুলি সনাক্ত করা সম্ভব করে তোলে। প্রযুক্তিগত এবং অর্থনৈতিক পরামিতিগুলির নির্বাচন নিম্নলিখিত মৌলিক প্রয়োজনীয়তার উপর ভিত্তি করে করা হয়:

নির্বাচিত পরামিতিগুলি স্ট্যান্ডার্ডগুলিতে রেকর্ড করা পরামিতিগুলি অন্তর্ভুক্ত করে এবং প্রযুক্তিগত শর্ত; প্রযুক্তিগত পরামিতিগুলি (শক্তি, লোড ক্ষমতা, গতি, ইত্যাদি) ছাড়াও, পণ্যের ক্রমিককরণের সূচক, জটিলতা সহগ, একীকরণ ইত্যাদি ব্যবহার করা হয়;
নির্বাচিত পরামিতিগুলির সেটটি সিরিজে অন্তর্ভুক্ত পণ্যগুলির নকশা, প্রযুক্তিগত এবং কার্যক্ষম বৈশিষ্ট্যগুলিকে পর্যাপ্তভাবে চিহ্নিত করতে হবে এবং দামের সাথে মোটামুটি ঘনিষ্ঠ সম্পর্ক থাকতে হবে;
পরামিতি পরস্পর নির্ভরশীল হওয়া উচিত নয়।

মূল্যকে উল্লেখযোগ্যভাবে প্রভাবিত করে এমন প্রযুক্তিগত এবং অর্থনৈতিক পরামিতিগুলি নির্বাচন করতে, জোড়া পারস্পরিক সম্পর্ক সহগগুলির একটি ম্যাট্রিক্স গণনা করা হয়। পরামিতিগুলির মধ্যে পারস্পরিক সম্পর্ক সহগগুলির মাত্রার উপর ভিত্তি করে, কেউ তাদের সংযোগের ঘনিষ্ঠতা বিচার করতে পারে। একই সময়ে, শূন্যের কাছাকাছি একটি পারস্পরিক সম্পর্ক মূল্যের উপর প্যারামিটারের একটি নগণ্য প্রভাব দেখায়। প্রযুক্তিগত এবং অর্থনৈতিক পরামিতিগুলির চূড়ান্ত নির্বাচন ধাপে ধাপে রিগ্রেশন বিশ্লেষণের প্রক্রিয়ায় সম্পাদিত হয় কম্পিউটার এর যন্ত্রাদিএবং সংশ্লিষ্ট স্ট্যান্ডার্ড প্রোগ্রাম।

মূল্য নির্ধারণের অনুশীলনে, ফাংশনের নিম্নলিখিত সেট ব্যবহার করা হয়:

রৈখিক

P = ao + alXl + ... + antXn,

রৈখিক শক্তি

P = ao + a1X1 + ... + anXn + (an+1Xn) (an+1Xn) +... + (an+nXn2) (an+nXn2)

বিপরীত লগারিদম

P = a0 + a1: X1 + ... + an: Xn-এ,

ক্ষমতা

P = a0 (X1^a1) (X2^a2) .. (Xn^an)

নির্দেশক

P = e^(a1+a1X1+...anXn)

অধিবৃত্ত

P = ao + a1:X1 + a2:X2 + ... + ap:Xn,

যেখানে P হল মূল্য সমীকরণ; X1 X2,..., Xn - সিরিজের পণ্যগুলির প্রযুক্তিগত এবং অর্থনৈতিক পরামিতির মান; a0, a1 ..., а - রিগ্রেশন সমীকরণের গণনাকৃত সহগ।

মূল্য নির্ধারণের ব্যবহারিক কাজে, মূল্য এবং প্রযুক্তিগত এবং অর্থনৈতিক পরামিতিগুলির মধ্যে সম্পর্কের উপর নির্ভর করে, অন্যান্য রিগ্রেশন সমীকরণ ব্যবহার করা যেতে পারে। মূল্য এবং প্রযুক্তিগত এবং অর্থনৈতিক পরামিতিগুলির একটি সেটের মধ্যে সংযোগের ফাংশনের ধরন কম্পিউটার প্রক্রিয়াকরণের সময় প্রিসেট বা স্বয়ংক্রিয়ভাবে নির্বাচন করা যেতে পারে। ঘনিষ্ঠতা পারস্পরিক সম্পর্কমূল্য এবং পরামিতি সেটের মধ্যে একাধিক পারস্পরিক সম্পর্ক সহগের মান দ্বারা মূল্যায়ন করা হয়। একজনের সাথে এর নৈকট্য একটি ঘনিষ্ঠ সংযোগ নির্দেশ করে। রিগ্রেশন সমীকরণ ব্যবহার করে, প্রদত্ত প্যারামেট্রিক সিরিজের পণ্যগুলির জন্য সমান (গণনা করা) মূল্য মানগুলি প্রাপ্ত হয়। সমীকরণের ফলাফলগুলি মূল্যায়ন করার জন্য, প্রকৃত মূল্য থেকে গণনাকৃত মূল্য মানগুলির বিচ্যুতির আপেক্ষিক মানগুলি গণনা করা হয়:

Tsr = Rf - Rr: R x 100

যেখানে Рф, Рр - প্রকৃত এবং গণনাকৃত মূল্য।

CR এর মান 8-10% এর বেশি হওয়া উচিত নয়। প্রকৃত মান থেকে গণনা করা মানগুলির উল্লেখযোগ্য বিচ্যুতির ক্ষেত্রে, এটি তদন্ত করা প্রয়োজন:

একটি প্যারামেট্রিক সিরিজ গঠনের সঠিকতা, যেহেতু এতে এমন পণ্য থাকতে পারে যা তাদের পরামিতিতে, সিরিজের অন্যান্য পণ্যগুলির থেকে তীব্রভাবে পৃথক। তাদের অবশ্যই বাদ দিতে হবে;
প্রযুক্তিগত এবং অর্থনৈতিক পরামিতিগুলির সঠিক নির্বাচন। মূল্যের সাথে দুর্বলভাবে সম্পর্কযুক্ত পরামিতিগুলির একটি সেট সম্ভব। এই ক্ষেত্রে, অনুসন্ধান এবং পরামিতি নির্বাচন চালিয়ে যাওয়া প্রয়োজন।

রিগ্রেশন বিশ্লেষণ পরিচালনার জন্য পদ্ধতি এবং পদ্ধতি, সমীকরণের অজানা পরামিতিগুলি এবং প্রাপ্ত ফলাফলের অর্থনৈতিক মূল্যায়ন প্রয়োজনীয়তা অনুসারে পরিচালিত হয় গাণিতিক পরিসংখ্যান.