ফলাফলের উপসংহার
রিগ্রেশন পরিসংখ্যান | |
বহুবচন আর | 0,998364 |
আর-বর্গক্ষেত্র | 0,99673 |
স্বাভাবিকীকৃত R-বর্গাকার | 0,996321 |
মান ত্রুটি | 0,42405 |
পর্যবেক্ষণ | 10 |
প্রথমে বিবেচনা করা যাক উপরের অংশসারণী 8.3a-এ উপস্থাপিত গণনা - রিগ্রেশন পরিসংখ্যান।
মান R-স্কয়ার, যাকে নিশ্চিততার পরিমাপও বলা হয়, ফলে রিগ্রেশন লাইনের গুণমানকে চিহ্নিত করে। এই গুণটি উত্স ডেটা এবং রিগ্রেশন মডেল (গণনা করা ডেটা) এর মধ্যে চিঠিপত্রের ডিগ্রি দ্বারা প্রকাশ করা হয়। নিশ্চিততার পরিমাপ সর্বদা ব্যবধানের মধ্যে থাকে।
বেশিরভাগ ক্ষেত্রে, R-বর্গের মান এই মানের মধ্যে পড়ে, যাকে বলা হয় চরম মান, যেমন শূন্য এবং একের মধ্যে।
যদি R-স্কোয়ার মান একের কাছাকাছি হয়, তাহলে এর মানে হল যে নির্মিত মডেলটি প্রাসঙ্গিক ভেরিয়েবলের প্রায় সমস্ত পরিবর্তনশীলতা ব্যাখ্যা করে। বিপরীতভাবে, শূন্যের কাছাকাছি একটি R-স্কোয়ার মান মানে নির্মিত মডেলের গুণমান খারাপ।
আমাদের উদাহরণে, নিশ্চিততার পরিমাপ হল 0.99673, যা মূল ডেটাতে রিগ্রেশন লাইনের খুব ভাল ফিট নির্দেশ করে।
বহুবচন আর- একাধিক পারস্পরিক সম্পর্ক সহগ R - স্বাধীন ভেরিয়েবল (X) এবং নির্ভরশীল চলকের (Y) নির্ভরতার মাত্রা প্রকাশ করে।
একাধিক R সমান বর্গমূলনির্ণয়ের সহগ থেকে, এই পরিমাণটি শূন্য থেকে এক পর্যন্ত পরিসরে মান নেয়।
সরল রৈখিক রিগ্রেশন বিশ্লেষণে, একাধিক R পিয়ারসন পারস্পরিক সম্পর্ক সহগের সমান। প্রকৃতপক্ষে, আমাদের ক্ষেত্রে একাধিক R পূর্ববর্তী উদাহরণ (0.998364) থেকে পিয়ারসন পারস্পরিক সম্পর্ক সহগের সমান।
মতভেদ | মান ত্রুটি | t-পরিসংখ্যান | |
Y- ছেদ | 2,694545455 | 0,33176878 | 8,121757129 |
পরিবর্তনশীল X 1 | 2,305454545 | 0,04668634 | 49,38177965 |
* গণনার একটি ছোট সংস্করণ প্রদান করা হয় |
এখন গণনার মাঝের অংশটি বিবেচনা করুন, সারণি 8.3b এ উপস্থাপিত। এখানে রিগ্রেশন সহগ b (2.305454545) এবং অর্ডিনেট অক্ষ বরাবর স্থানচ্যুতি দেওয়া হয়েছে, যেমন ধ্রুবক a (2.694545455)।
গণনার উপর ভিত্তি করে, আমরা নিম্নরূপ রিগ্রেশন সমীকরণ লিখতে পারি:
Y= x*2.305454545+2.694545455
ভেরিয়েবলের মধ্যে সম্পর্কের দিকটি চিহ্নের (নেতিবাচক বা ইতিবাচক) উপর ভিত্তি করে নির্ধারিত হয় রিগ্রেশন সহগ(গুণ খ)।
যদি সাইন এ রিগ্রেশন সহগ- ধনাত্মক, নির্ভরশীল পরিবর্তনশীল এবং স্বাধীন পরিবর্তনশীলের মধ্যে সম্পর্ক ধনাত্মক হবে। আমাদের ক্ষেত্রে, রিগ্রেশন সহগের চিহ্নটি ইতিবাচক, তাই সম্পর্কটিও ইতিবাচক।
যদি সাইন এ রিগ্রেশন সহগ- ঋণাত্মক, নির্ভরশীল চলক এবং স্বাধীন চলকের মধ্যে সম্পর্ক ঋণাত্মক (বিপরীত)।
সারণিতে 8.3c. অবশিষ্টাংশের উদ্ভূত ফলাফল উপস্থাপন করা হয়. রিপোর্টে এই ফলাফলগুলি দেখানোর জন্য, "রিগ্রেশন" টুলটি চালানোর সময় আপনাকে অবশ্যই "অবশিষ্ট" চেকবক্স সক্রিয় করতে হবে।
বাকিদের প্রত্যাহার
পর্যবেক্ষণ | ভবিষ্যদ্বাণী Y | অবশিষ্টাংশ | স্ট্যান্ডার্ড ব্যালেন্স |
---|---|---|---|
1 | 9,610909091 | -0,610909091 | -1,528044662 |
2 | 7,305454545 | -0,305454545 | -0,764022331 |
3 | 11,91636364 | 0,083636364 | 0,209196591 |
4 | 14,22181818 | 0,778181818 | 1,946437843 |
5 | 16,52727273 | 0,472727273 | 1,182415512 |
6 | 18,83272727 | 0,167272727 | 0,418393181 |
7 | 21,13818182 | -0,138181818 | -0,34562915 |
8 | 23,44363636 | -0,043636364 | -0,109146047 |
9 | 25,74909091 | -0,149090909 | -0,372915662 |
10 | 28,05454545 | -0,254545455 | -0,636685276 |
প্রতিবেদনের এই অংশটি ব্যবহার করে, আমরা নির্মিত রিগ্রেশন লাইন থেকে প্রতিটি বিন্দুর বিচ্যুতি দেখতে পারি। সবচেয়ে বড় পরম মান
রিগ্রেশন বিশ্লেষণের উদ্দেশ্য হল একটি নির্ভরশীল ভেরিয়েবল এবং একটি (পেয়ারওয়াইজ রিগ্রেশন অ্যানালাইসিস) বা একাধিক (একাধিক) স্বাধীন ভেরিয়েবলের মধ্যে সম্পর্ক পরিমাপ করা। স্বাধীন চলকগুলিকে ফ্যাক্টর, ব্যাখ্যামূলক, নির্ধারক, রিগ্রেসর এবং ভবিষ্যদ্বাণীকারী ভেরিয়েবলও বলা হয়।
নির্ভরশীল পরিবর্তনশীলকে কখনো কখনো নির্ধারিত, ব্যাখ্যা করা বা "প্রতিক্রিয়া" ভেরিয়েবল বলা হয়। অভিজ্ঞতামূলক গবেষণায় রিগ্রেশন বিশ্লেষণের অত্যন্ত ব্যাপক ব্যবহার শুধুমাত্র এই কারণেই নয় যে এটি হাইপোথিসিস পরীক্ষা করার জন্য একটি সুবিধাজনক হাতিয়ার। রিগ্রেশন, বিশেষ করে একাধিক রিগ্রেশন হল কার্যকর পদ্ধতিমডেলিং এবং পূর্বাভাস।
চলুন শুরু করা যাক রিগ্রেশন এনালাইসিসের সাথে কাজ করার নীতিগুলিকে একটি সহজ-এর সাথে ব্যাখ্যা করা - জোড়া পদ্ধতি।
পেয়ারড রিগ্রেশন বিশ্লেষণ
রিগ্রেশন অ্যানালাইসিস ব্যবহার করার সময় প্রথম ধাপগুলি আমরা পারস্পরিক সম্পর্ক সহগ গণনা করার জন্য নেওয়া প্রায় একই রকম হবে। কার্যকারিতার জন্য তিনটি প্রধান শর্ত পারস্পরিক সম্পর্ক বিশ্লেষণপিয়ারসন পদ্ধতি অনুসারে - ভেরিয়েবলের স্বাভাবিক বন্টন, ভেরিয়েবলের ব্যবধান পরিমাপ, ভেরিয়েবলের মধ্যে রৈখিক সম্পর্ক - একাধিক রিগ্রেশনের জন্যও প্রাসঙ্গিক। তদনুসারে, প্রথম পর্যায়ে, স্ক্যাটারপ্লটগুলি তৈরি করা হয়, ভেরিয়েবলগুলির একটি পরিসংখ্যানগত এবং বর্ণনামূলক বিশ্লেষণ করা হয় এবং একটি রিগ্রেশন লাইন গণনা করা হয়। পারস্পরিক সম্পর্ক বিশ্লেষণের কাঠামোর মতো, পদ্ধতি ব্যবহার করে রিগ্রেশন লাইনগুলি তৈরি করা হয় সর্বনিম্ন বর্গক্ষেত্র.
ডেটা বিশ্লেষণের দুটি পদ্ধতির মধ্যে পার্থক্য আরও স্পষ্টভাবে বোঝাতে, আসুন আমরা "এসপিএস সমর্থন" এবং "গ্রামীণ জনসংখ্যা ভাগ" ভেরিয়েবলগুলির সাথে ইতিমধ্যে আলোচনা করা উদাহরণের দিকে ফিরে যাই। উৎস তথ্য অভিন্ন. স্ক্যাটারপ্লটগুলির মধ্যে পার্থক্যটি হবে যে রিগ্রেশন বিশ্লেষণে নির্ভরশীল ভেরিয়েবল প্লট করা সঠিক - আমাদের ক্ষেত্রে, Y-অক্ষে "SPS সমর্থন", যেখানে পারস্পরিক সম্পর্ক বিশ্লেষণে এটি কোন ব্যাপার নয়। আউটলিয়ারগুলি পরিষ্কার করার পরে, স্ক্যাটারপ্লটটি এর মতো দেখায়:
রিগ্রেশন বিশ্লেষণের মৌলিক ধারণা হল, থাকা সাধারণ প্রবণতাভেরিয়েবলের জন্য - একটি রিগ্রেশন লাইন আকারে - আপনি নির্ভরশীল ভেরিয়েবলের মান ভবিষ্যদ্বাণী করতে পারেন, স্বাধীনটির মান বিবেচনা করে।
এর স্বাভাবিক গাণিতিক কল্পনা করা যাক লিনিয়ার ফাংশন. ইউক্লিডীয় স্থানের যেকোনো সরলরেখা সূত্র দ্বারা বর্ণনা করা যেতে পারে:
যেখানে a একটি ধ্রুবক যা অর্ডিনেট অক্ষ বরাবর স্থানচ্যুতিকে নির্দিষ্ট করে; b হল একটি সহগ যা রেখার প্রবণতার কোণ নির্ধারণ করে।
ঢাল এবং ধ্রুবক জেনে, আপনি যে কোনো x এর জন্য y-এর মান গণনা (ভবিষ্যদ্বাণী) করতে পারেন।
এই সহজ ফাংশনএবং সতর্কতা সহ একটি রিগ্রেশন বিশ্লেষণ মডেলের ভিত্তি তৈরি করেছে যে আমরা ঠিক y এর মান ভবিষ্যদ্বাণী করব না, তবে একটি নির্দিষ্ট সময়ের মধ্যে আস্থা ব্যবধান, অর্থাৎ আন্দাজ.
ধ্রুবক হল রিগ্রেশন লাইন এবং y-অক্ষের ছেদ বিন্দু (F-ছেদ, সাধারণত পরিসংখ্যানগত প্যাকেজে "ইন্টারসেপ্টর" হিসাবে চিহ্নিত)। ডান বাহিনীর ইউনিয়নের জন্য ভোট দেওয়ার ক্ষেত্রে আমাদের উদাহরণে, এর বৃত্তাকার মান হবে 10.55। কৌণিক সহগ b হবে প্রায় -0.1 (যেমন পারস্পরিক সম্পর্ক বিশ্লেষণে, চিহ্নটি সংযোগের ধরন দেখায় - প্রত্যক্ষ বা বিপরীত)। সুতরাং, ফলস্বরূপ মডেলের ফর্ম SP C = -0.1 x Sel হবে। আমাদের. + 10.55।
ATP = -0.10 x 47 + 10.55 = 5.63।
মূল এবং ভবিষ্যদ্বাণীকৃত মানের মধ্যে পার্থক্যটিকে অবশিষ্ট বলা হয় (আমরা ইতিমধ্যে এই শব্দটির মুখোমুখি হয়েছি, যা পরিসংখ্যানের জন্য মৌলিক, যখন আকস্মিক সারণী বিশ্লেষণ করার সময়)। সুতরাং, "Adygea প্রজাতন্ত্র" এর ক্ষেত্রে অবশিষ্টাংশ 3.92 - 5.63 = -1.71 এর সমান হবে। অবশিষ্টাংশের মডুলার মান যত বড় হবে, অনুমানকৃত মান তত কম সফল হবে।
আমরা সমস্ত ক্ষেত্রে পূর্বাভাসিত মান এবং অবশিষ্টাংশ গণনা করি:
|
প্রাথমিক এবং ভবিষ্যদ্বাণীকৃত মানগুলির অনুপাতের বিশ্লেষণ ফলাফলের মডেলের গুণমান এবং এর ভবিষ্যদ্বাণী করার ক্ষমতা মূল্যায়ন করে। রিগ্রেশন পরিসংখ্যানের প্রধান সূচকগুলির মধ্যে একটি হল একাধিক পারস্পরিক সম্পর্ক সহগ R - নির্ভরশীল পরিবর্তনশীলের মূল এবং পূর্বাভাসিত মানের মধ্যে পারস্পরিক সম্পর্ক সহগ। পেয়ারড রিগ্রেশন বিশ্লেষণে, এটি নির্ভরশীল এবং স্বাধীন ভেরিয়েবলের মধ্যে সাধারণ পিয়ারসন পারস্পরিক সম্পর্ক সহগের সমান, আমাদের ক্ষেত্রে - 0.63। একাধিক Rকে অর্থপূর্ণভাবে ব্যাখ্যা করতে, এটিকে সংকল্পের সহগ-এ রূপান্তর করতে হবে। এটি পারস্পরিক সম্পর্ক বিশ্লেষণের মতো একইভাবে করা হয় - স্কোয়ারিং দ্বারা। নির্ণয়ের সহগ R-বর্গ (R 2) নির্ভরশীল পরিবর্তনশীলের পরিবর্তনের অনুপাত দেখায় যা স্বাধীন পরিবর্তনশীল(গুলি) দ্বারা ব্যাখ্যা করা হয়।
আমাদের ক্ষেত্রে, R 2 = 0.39 (0.63 2); এর মানে হল যে পরিবর্তনশীল "গ্রামীণ জনসংখ্যা ভাগ" পরিবর্তনশীল "এসপিএস সমর্থন" এর পরিবর্তনের প্রায় 40% ব্যাখ্যা করে। নির্ণয়ের সহগ যত বড়, মডেলের গুণমান তত বেশি।
মডেলের মানের আরেকটি সূচক হল অনুমানের স্ট্যান্ডার্ড ত্রুটি। এটি রিগ্রেশন লাইনের চারপাশে বিন্দুগুলি কতটা ব্যাপকভাবে "বিক্ষিপ্ত" হয় তার একটি পরিমাপ। ইন্টারভাল ভেরিয়েবলের স্প্রেডের পরিমাপ হল আদর্শ চ্যুতি. তদনুসারে, অনুমানের প্রমিত ত্রুটি হল অবশিষ্টাংশের বিতরণের মানক বিচ্যুতি। এর মান যত বেশি, তত বেশি বিক্ষিপ্ত এবং মডেলটি তত খারাপ। আমাদের ক্ষেত্রে, স্ট্যান্ডার্ড ত্রুটি হল 2.18। এই পরিমাণ দ্বারাই আমাদের মডেল "SPS সমর্থন" ভেরিয়েবলের মান ভবিষ্যদ্বাণী করার সময় "গড়ে ভুল" করবে।
রিগ্রেশন পরিসংখ্যান এছাড়াও পরিবর্তনের বিশ্লেষণ অন্তর্ভুক্ত. এর সাহায্যে, আমরা খুঁজে পাই: 1) নির্ভরশীল চলকের পরিবর্তনের (বিচ্ছুরণ) কোন অনুপাত স্বাধীন চলক দ্বারা ব্যাখ্যা করা হয়েছে; 2) নির্ভরশীল ভেরিয়েবলের পরিবর্তনের কি অনুপাত অবশিষ্টাংশ (অব্যক্ত অংশ) দ্বারা হিসাব করা হয়; 3) এই দুটি পরিমাণের অনুপাত কত (/"-অনুপাত)। বিচ্ছুরণ পরিসংখ্যান বিশেষভাবে গুরুত্বপূর্ণ নমুনা অধ্যয়ন- এটি দেখায় যে স্বাধীন এবং নির্ভরশীল ভেরিয়েবলের মধ্যে একটি সম্পর্ক থাকার সম্ভাবনা কতটা জনসংখ্যা. যাইহোক, এমনকি ক্রমাগত গবেষণার জন্য (আমাদের উদাহরণ হিসাবে), ফলাফল অধ্যয়নরত বৈচিত্র্যের বিশ্লেষণদরকারী নয় এই ক্ষেত্রে, তারা পরীক্ষা করে যে চিহ্নিত পরিসংখ্যানগত প্যাটার্নটি এলোমেলো পরিস্থিতির কাকতালীয় কারণে সৃষ্ট হয়েছে কিনা, অধ্যয়নের অধীনে জনসংখ্যার অবস্থানের অবস্থার সেটের জন্য এটি কতটা সাধারণ, যেমন এটি কিছু বৃহত্তর সাধারণ জনসংখ্যার জন্য প্রাপ্ত ফলাফলের সত্য নয় যা প্রতিষ্ঠিত হয়েছে, তবে এর নিয়মিততা এবং এলোমেলো প্রভাব থেকে মুক্তির মাত্রা।
আমাদের ক্ষেত্রে, ANOVA পরিসংখ্যান নিম্নরূপ:
এসএস | df | মাইক্রোসফট | চ | অর্থ | |
প্রত্যাবর্তন। | 258,77 | 1,00 | 258,77 | 54,29 | 0.000000001 |
অবশিষ্ট | 395,59 | 83,00 | এল,১১ | ||
মোট | 654,36 |
0.0000000001 স্তরে 54.29 এর F-অনুপাত উল্লেখযোগ্য। তদনুসারে, আমরা আত্মবিশ্বাসের সাথে শূন্য অনুমানকে প্রত্যাখ্যান করতে পারি (যে সম্পর্কটি আমরা আবিষ্কার করেছি তা সুযোগের কারণে)।
টি মানদণ্ড একটি অনুরূপ ফাংশন সঞ্চালন করে, কিন্তু রিগ্রেশন সহগ (কৌণিক এবং এফ-ছেদ) সম্পর্কিত। / মানদণ্ড ব্যবহার করে, আমরা অনুমানটি পরীক্ষা করি যে সাধারণ জনসংখ্যার রিগ্রেশন সহগ শূন্যের সমান। আমাদের ক্ষেত্রে, আমরা আবার আত্মবিশ্বাসের সাথে শূন্য হাইপোথিসিস প্রত্যাখ্যান করতে পারি।
একাধিক রিগ্রেশন বিশ্লেষণ
মডেল একাধিক সংশ্লেষণপেয়ারড রিগ্রেশন মডেলের প্রায় অভিন্ন; শুধুমাত্র পার্থক্য হল যে কয়েকটি স্বাধীন ভেরিয়েবল ক্রমিকভাবে লিনিয়ার ফাংশনে অন্তর্ভুক্ত করা হয়েছে:
Y = b1X1 + b2X2 + …+ bpXp + a.
যদি দুটির বেশি স্বাধীন ভেরিয়েবল থাকে তবে আমরা তাদের সম্পর্কের একটি চাক্ষুষ ধারণা পেতে সক্ষম নই; এই ক্ষেত্রে, একাধিক রিগ্রেশন পেয়ারওয়াইজ রিগ্রেশনের চেয়ে কম "ভিজ্যুয়াল"। যখন আপনার দুটি স্বাধীন ভেরিয়েবল থাকে, তখন এটি একটি 3D স্ক্যাটারপ্লটে ডেটা প্রদর্শন করতে উপযোগী হতে পারে। পেশাদার পরিসংখ্যানগত সফ্টওয়্যার প্যাকেজগুলিতে (উদাহরণস্বরূপ, স্ট্যাটিসটিকা) একটি ত্রিমাত্রিক চার্ট ঘোরানোর বিকল্প রয়েছে, যা আপনাকে ডেটার কাঠামোটি দৃশ্যতভাবে উপস্থাপন করতে দেয়।
একাধিক রিগ্রেশনের সাথে কাজ করার সময়, পেয়ারওয়াইজ রিগ্রেশনের বিপরীতে, বিশ্লেষণ অ্যালগরিদম নির্ধারণ করা প্রয়োজন। স্ট্যান্ডার্ড অ্যালগরিদম চূড়ান্ত রিগ্রেশন মডেলের সমস্ত উপলব্ধ ভবিষ্যদ্বাণী অন্তর্ভুক্ত করে। ধাপে ধাপে অ্যালগরিদমতাদের ব্যাখ্যামূলক "ওজন" এর উপর ভিত্তি করে স্বাধীন ভেরিয়েবলের অনুক্রমিক অন্তর্ভুক্তি (বর্জন) জড়িত। যখন অনেকগুলি স্বাধীন ভেরিয়েবল থাকে তখন ধাপে ধাপে পদ্ধতিটি ভাল; এটি স্পষ্টভাবে দুর্বল ভবিষ্যদ্বাণীকারীদের মডেলটিকে "পরিষ্কার" করে, এটিকে আরও কম্প্যাক্ট এবং সংক্ষিপ্ত করে তোলে।
একাধিক রিগ্রেশনের সঠিকতার জন্য একটি অতিরিক্ত শর্ত (ব্যবধান, স্বাভাবিকতা এবং রৈখিকতা সহ) হল মাল্টিকোলিনিয়ারিটির অনুপস্থিতি - স্বাধীন ভেরিয়েবলের মধ্যে শক্তিশালী পারস্পরিক সম্পর্কের উপস্থিতি।
একাধিক রিগ্রেশন পরিসংখ্যানের ব্যাখ্যায় আমরা পেয়ারওয়াইজ রিগ্রেশনের ক্ষেত্রে বিবেচনা করা সমস্ত উপাদান অন্তর্ভুক্ত করে। এছাড়াও, একাধিক রিগ্রেশন বিশ্লেষণের পরিসংখ্যানের অন্যান্য গুরুত্বপূর্ণ উপাদান রয়েছে।
আমরা রাশিয়ান অঞ্চল জুড়ে নির্বাচনী কার্যকলাপের স্তরের পার্থক্য ব্যাখ্যা করে এমন অনুমান পরীক্ষার উদাহরণ ব্যবহার করে একাধিক রিগ্রেশন সহ কাজটি চিত্রিত করব। সুনির্দিষ্ট অভিজ্ঞতামূলক গবেষণায় পরামর্শ দেওয়া হয়েছে যে ভোটার ভোটদানের মাত্রা এর দ্বারা প্রভাবিত হয়:
ন্যাশনাল ফ্যাক্টর (ভেরিয়েবল "রাশিয়ান জনসংখ্যা"; রাশিয়ান ফেডারেশনের উপাদান সত্তাগুলিতে রাশিয়ান জনসংখ্যার ভাগ হিসাবে কার্যকর)। এটা অনুমান করা হয় যে রাশিয়ান জনসংখ্যার অংশ বৃদ্ধির ফলে ভোটারদের উপস্থিতি হ্রাস পায়;
নগরায়ন ফ্যাক্টর (পরিবর্তনশীল " শহরের জনসংখ্যা"; রাশিয়ান ফেডারেশনের গঠনমূলক সত্ত্বাগুলিতে শহুরে জনসংখ্যার অংশ হিসাবে কার্যকর করা হয়েছে; আমরা ইতিমধ্যে পারস্পরিক সম্পর্ক বিশ্লেষণের কাঠামোর মধ্যে এই ফ্যাক্টর নিয়ে কাজ করেছি)। এটা অনুমান করা হয় যে শহুরে জনসংখ্যার অংশ বৃদ্ধির ফলে ভোটার উপস্থিতি হ্রাস পায়।
নির্ভরশীল পরিবর্তনশীল - "নির্বাচনী কার্যকলাপের তীব্রতা" ("সক্রিয়") 1995 থেকে 2003 সাল পর্যন্ত ফেডারেল নির্বাচনে অঞ্চল অনুসারে গড় ভোটের ডেটার মাধ্যমে কার্যকর করা হয়। দুটি স্বাধীন এবং একটি নির্ভরশীল পরিবর্তনশীলের প্রাথমিক ডেটা টেবিলটি নিম্নরূপ হবে:
ঘটছে | ভেরিয়েবল | ||
সম্পদ। | গোর। আমাদের. | রস আমাদের. | |
Adygea প্রজাতন্ত্র | 64,92 | 53 | 68 |
আলতাই প্রজাতন্ত্র | 68,60 | 24 | 60 |
বুরিয়াটিয়া প্রজাতন্ত্র | 60,75 | 59 | 70 |
দাগেস্তান প্রজাতন্ত্র | 79,92 | 41 | 9 |
ইঙ্গুশেটিয়া প্রজাতন্ত্র | 75,05 | 41 | 23 |
কাল্মিকিয়া প্রজাতন্ত্র | 68,52 | 39 | 37 |
কারাচে-চের্কেস প্রজাতন্ত্র | 66,68 | 44 | 42 |
কারেলিয়া প্রজাতন্ত্র | 61,70 | 73 | 73 |
কোমি প্রজাতন্ত্র | 59,60 | 74 | 57 |
মারি এল প্রজাতন্ত্র | 65,19 | 62 | 47 |
ইত্যাদি। (নিঃসরণ পরিষ্কার করার পরে, 88 টির মধ্যে 83টি রয়ে গেছে)
মডেলের গুণমান বর্ণনাকারী পরিসংখ্যান:
1. একাধিক R = 0.62; এল-বর্গ = ০.৩৮। ফলস্বরূপ, জাতীয় ফ্যাক্টর এবং নগরায়ন ফ্যাক্টর একসাথে "নির্বাচনী কার্যকলাপ" পরিবর্তনশীলের প্রায় 38% পরিবর্তনকে ব্যাখ্যা করে।
2. গড় ত্রুটিহল 3.38। ভোটের স্তরের পূর্বাভাস দেওয়ার সময় নির্মিত মডেলটি ঠিক কতটা "গড় ভুল" হয়৷
3. 0.000000003 স্তরে ব্যাখ্যা করা এবং অব্যক্ত প্রকরণের /l-অনুপাত হল 25.2। চিহ্নিত সম্পর্কের এলোমেলোতা সম্পর্কে শূন্য অনুমান প্রত্যাখ্যান করা হয়।
4. "শহুরে জনসংখ্যা" এবং "রাশিয়ান জনসংখ্যা" ভেরিয়েবলগুলির ধ্রুবক এবং রিগ্রেশন সহগগুলির জন্য মানদণ্ড / 0.0000001 স্তরে তাৎপর্যপূর্ণ; যথাক্রমে 0.00005 এবং 0.007। শূন্য অনুমান যে সহগগুলি এলোমেলো তা প্রত্যাখ্যান করা হয়।
নির্ভরশীল ভেরিয়েবলের মূল এবং পূর্বাভাসিত মানের মধ্যে সম্পর্ক বিশ্লেষণে অতিরিক্ত দরকারী পরিসংখ্যান হল মহালনোবিস দূরত্ব এবং কুকের দূরত্ব। প্রথমটি হল কেসের স্বতন্ত্রতার একটি পরিমাপ (দেখায় যে সমস্ত স্বাধীন ভেরিয়েবলের মানগুলির সংমিশ্রণ কত এই ক্ষেত্রেএকই সাথে সমস্ত স্বাধীন ভেরিয়েবলের গড় থেকে বিচ্যুত হয়)। দ্বিতীয়টি মামলার প্রভাবের একটি পরিমাপ। রিগ্রেশন লাইনের ঢালের উপর বিভিন্ন পর্যবেক্ষণের বিভিন্ন প্রভাব রয়েছে এবং এই সূচকে তাদের তুলনা করতে কুকের দূরত্ব ব্যবহার করা যেতে পারে। বহিরাগতদের পরিষ্কার করার সময় এটি কার্যকর হতে পারে (একটি বহিরাগতকে অত্যধিক প্রভাবশালী কেস হিসাবে বিবেচনা করা যেতে পারে)।
আমাদের উদাহরণে, অনন্য এবং প্রভাবশালী ক্ষেত্রে দাগেস্তান অন্তর্ভুক্ত।
ঘটছে | আসল মান | প্রেডস্কা মান | অবশিষ্টাংশ | দূরত্ব মহলনোবিস | দূরত্ব |
অডিজিয়া | 64,92 | 66,33 | -1,40 | 0,69 | 0,00 |
আলতাই প্রজাতন্ত্র | 68,60 | 69.91 | -1,31 | 6,80 | 0,01 |
বুরিয়াটিয়া প্রজাতন্ত্র | 60,75 | 65,56 | -4,81 | 0,23 | 0,01 |
দাগেস্তান প্রজাতন্ত্র | 79,92 | 71,01 | 8,91 | 10,57 | 0,44 |
ইঙ্গুশেটিয়া প্রজাতন্ত্র | 75,05 | 70,21 | 4,84 | 6,73 | 0,08 |
কাল্মিকিয়া প্রজাতন্ত্র | 68,52 | 69,59 | -1,07 | 4,20 | 0,00 |
রিগ্রেশন মডেলের নিজেই নিম্নলিখিত পরামিতি রয়েছে: Y-ছেদ (ধ্রুবক) = 75.99; b (অনুভূমিক) = -0.1; Kommersant (রাশিয়ান nas.) = -0.06. চূড়ান্ত সূত্র।
কার্যকারণ নির্ভরতার বৈশিষ্ট্য
কারণ এবং প্রভাব সম্পর্ক- এটি ঘটনা এবং প্রক্রিয়াগুলির মধ্যে একটি সংযোগ, যখন তাদের একটিতে পরিবর্তন - কারণ - অন্যটির পরিবর্তনের দিকে নিয়ে যায় - প্রভাব।
সম্পর্ক অধ্যয়নের জন্য তাদের তাত্পর্য অনুযায়ী চিহ্ন দুটি শ্রেণীতে বিভক্ত।
যে চিহ্নগুলি অন্যান্য সম্পর্কিত লক্ষণগুলির পরিবর্তন ঘটায় তাকে বলা হয় ফ্যাক্টোরিয়াল (বা কারণ)।
যে লক্ষণগুলি ফ্যাক্টর লক্ষণগুলির প্রভাবে পরিবর্তিত হয় কার্যকর
যোগাযোগের নিম্নলিখিত ফর্মগুলি আলাদা করা হয়: কার্যকরী এবং স্টোকাস্টিক। কার্যকরীএমন একটি সম্পর্ক যেখানে একটি গুণনীয়ক বৈশিষ্ট্যের একটি নির্দিষ্ট মান ফলাফলের বৈশিষ্ট্যের একটি এবং শুধুমাত্র একটি মানের সাথে মিলে যায়। কার্যকরী সংযোগ পর্যবেক্ষণের সমস্ত ক্ষেত্রে এবং অধ্যয়নের অধীনে জনসংখ্যার প্রতিটি নির্দিষ্ট ইউনিটের জন্য উদ্ভাসিত হয়।
কার্যকরী সম্পর্ক নিম্নলিখিত সমীকরণ দ্বারা প্রতিনিধিত্ব করা যেতে পারে:
y i = f(x i),যেখানে: y i -
ফলাফল চিহ্ন; f(x i) -
ফলাফল এবং ফ্যাক্টর বৈশিষ্ট্যের মধ্যে সংযোগের একটি পরিচিত ফাংশন; একাদশ -
ফ্যাক্টর সাইন।
বাস্তব প্রকৃতিতে কোন কার্যকরী সংযোগ নেই। তারা শুধুমাত্র বিমূর্ততা, ঘটনা বিশ্লেষণে দরকারী, কিন্তু বাস্তবতা সরলীকরণ.
স্টোকাস্টিক (পরিসংখ্যানগত বা এলোমেলো)সংযোগপরিমাণের মধ্যে একটি সম্পর্ককে প্রতিনিধিত্ব করে যেখানে তাদের মধ্যে একটি বন্টন আইন পরিবর্তন করে অন্য একটি পরিমাণ বা পরিমাণের পরিবর্তনে প্রতিক্রিয়া দেখায়। অন্য কথায়, এই সংযোগ সঙ্গে বিভিন্ন অর্থএকটি ভেরিয়েবল অন্য ভেরিয়েবলের বিভিন্ন ডিস্ট্রিবিউশনের সাথে মিলে যায়। এটি এই কারণে যে নির্ভরশীল পরিবর্তনশীল, বিবেচনাধীন স্বাধীনগুলি ছাড়াও, অনেকগুলি হিসাববিহীন বা অনিয়ন্ত্রিত এলোমেলো কারণগুলির দ্বারা প্রভাবিত হয়, সেইসাথে ভেরিয়েবলগুলির পরিমাপের ক্ষেত্রে কিছু অনিবার্য ত্রুটিগুলি দ্বারা প্রভাবিত হয়৷ নির্ভরশীল ভেরিয়েবলের মানগুলি র্যান্ডম স্ক্যাটারের সাপেক্ষে থাকার কারণে, তাদের যথেষ্ট নির্ভুলতার সাথে ভবিষ্যদ্বাণী করা যায় না, তবে শুধুমাত্র একটি নির্দিষ্ট সম্ভাবনার সাথে নির্দেশ করা যেতে পারে।
Y এবং X-এর মধ্যে স্টোকাস্টিক নির্ভরতার অস্পষ্টতার কারণে, বিশেষ করে, x-এর উপর গড় নির্ভরতা স্কিমটি আগ্রহের, অর্থাৎ গড় মানের পরিবর্তনের একটি প্যাটার্ন - শর্তসাপেক্ষ গাণিতিক প্রত্যাশা Mx(Y) (এলোমেলো পরিবর্তনশীল Y-এর গাণিতিক প্রত্যাশা, যদি পাওয়া যায় যে পরিবর্তনশীল X মান x গ্রহণ করে) x এর উপর নির্ভর করে।
স্টোকাস্টিক যোগাযোগের একটি বিশেষ ক্ষেত্রে পারস্পরিক সম্পর্ক যোগাযোগ। পারস্পরিক সম্পর্ক(lat থেকে। পারস্পরিক সম্পর্ক- পারস্পরিক সম্পর্ক, সম্পর্ক)। শব্দটির সরাসরি সংজ্ঞা পারস্পরিক সম্পর্ক - স্টোকাস্টিক, সম্ভাব্য, সম্ভব সংযোগ দুই (জোড়া) বা একাধিক (একাধিক) এর মধ্যে এলোমেলো ভেরিয়েবল.
দুটি ভেরিয়েবলের মধ্যে পারস্পরিক সম্পর্ক নির্ভরতাকে এই ভেরিয়েবলের মধ্যে একটি পরিসংখ্যানগত সম্পর্কও বলা হয়, যেখানে একটি ভেরিয়েবলের প্রতিটি মান একটি নির্দিষ্ট গড় মানের সাথে মিলে যায়, যেমন শর্তযুক্ত গাণিতিক প্রত্যাশা ভিন্ন। পারস্পরিক নির্ভরতা হল স্টোকাস্টিক নির্ভরতার একটি বিশেষ ক্ষেত্রে, যেখানে ফ্যাক্টর বৈশিষ্ট্যের মানগুলির একটি পরিবর্তন (x 1 x 2 ..., x n) ফলে বৈশিষ্ট্যের গড় মান পরিবর্তন করে।
নিম্নলিখিত ধরণের পারস্পরিক সম্পর্কের পার্থক্য করা প্রথাগত:
1. জোড়া পারস্পরিক সম্পর্ক - দুটি বৈশিষ্ট্যের মধ্যে একটি সংযোগ (ফলাফলমূলক এবং ফ্যাক্টর বা দুটি ফ্যাক্টর)।
2. আংশিক পারস্পরিক সম্পর্ক - গবেষণায় অন্তর্ভুক্ত অন্যান্য ফ্যাক্টর বৈশিষ্ট্যগুলির একটি নির্দিষ্ট মান সহ ফলাফল এবং একটি ফ্যাক্টর বৈশিষ্ট্যের মধ্যে নির্ভরতা।
3. একাধিক পারস্পরিক সম্পর্ক- ফলাফলের নির্ভরতা এবং গবেষণায় অন্তর্ভুক্ত দুই বা ততোধিক ফ্যাক্টর বৈশিষ্ট্য।
রিগ্রেশন বিশ্লেষণের উদ্দেশ্য
কারণ-এবং-প্রভাব সম্পর্ক উপস্থাপনের বিশ্লেষণাত্মক রূপ হল রিগ্রেশন মডেল। রিগ্রেশন বিশ্লেষণের বৈজ্ঞানিক বৈধতা এবং জনপ্রিয়তা এটিকে অধ্যয়নের অধীনে ঘটনাটির মডেলিংয়ের জন্য প্রধান গাণিতিক সরঞ্জামগুলির মধ্যে একটি করে তোলে। এই পদ্ধতিটি পরীক্ষামূলক ডেটা মসৃণ করতে এবং তুলনামূলক প্রভাবের পরিমাণগত অনুমান পেতে ব্যবহৃত হয় বিভিন্ন কারণফলাফল পরিবর্তনশীল.
রিগ্রেশন বিশ্লেষণ হয়একটি সম্পর্কের বিশ্লেষণাত্মক অভিব্যক্তি নির্ধারণে যেখানে এক বা একাধিক ব্যক্তির প্রভাবের কারণে একটি মানের পরিবর্তন (নির্ভরশীল পরিবর্তনশীল বা ফলস্বরূপ বৈশিষ্ট্য) হয় স্বাধীন পরিমাণ(ফ্যাক্টর বা ভবিষ্যদ্বাণীকারী), এবং অন্যান্য সমস্ত কারণের সেট যা নির্ভরশীল মানকে প্রভাবিত করে ধ্রুবক এবং গড় মান হিসাবে নেওয়া হয়।
রিগ্রেশন বিশ্লেষণের লক্ষ্য:
ফ্যাক্টর ফ্যাক্টর (x 1, x 2, ..., x n);
স্বাধীন চলক(গুলি) ব্যবহার করে একটি নির্ভরশীল ভেরিয়েবলের মান অনুমান করা।
নির্ভরশীল ভেরিয়েবলের পরিবর্তনে স্বতন্ত্র স্বাধীন ভেরিয়েবলের অবদান নির্ধারণ করা।
ভেরিয়েবলের মধ্যে সম্পর্ক আছে কিনা তা নির্ধারণ করতে রিগ্রেশন বিশ্লেষণ ব্যবহার করা যায় না, যেহেতু এই ধরনের সম্পর্কের উপস্থিতি বিশ্লেষণটি প্রয়োগ করার পূর্বশর্ত।
রিগ্রেশন বিশ্লেষণে, এটি আগে থেকেই ধরে নেওয়া হয় যে ফলাফল (U) এবং ফ্যাক্টর বৈশিষ্ট্য x 1, x 2 ..., x n এর মধ্যে কারণ-ও-প্রভাব সম্পর্ক রয়েছে।
ফাংশন ,
অপপরামিতিগুলির উপর সূচকের নির্ভরতা নির্ধারণকে রিগ্রেশন সমীকরণ (ফাংশন) বলা হয় 1 রিগ্রেশন সমীকরণটি স্বাধীন ভেরিয়েবলের নির্দিষ্ট মান দেওয়া নির্ভরশীল ভেরিয়েবলের প্রত্যাশিত মান দেখায়।
মডেল অন্তর্ভুক্ত কারণের সংখ্যা উপর নির্ভর করে এক্সমডেলগুলি একক-ফ্যাক্টর (পেয়ার রিগ্রেশন মডেল) এবং মাল্টি-ফ্যাক্টর (মাল্টিপল রিগ্রেশন মডেল) এ বিভক্ত। ফাংশনের ধরণের উপর নির্ভর করে, মডেলগুলিকে রৈখিক এবং অরৈখিক ভাগে ভাগ করা হয়।
পেয়ারড রিগ্রেশন মডেল
হিসাববিহীন এলোমেলো কারণ এবং কারণের প্রভাবের কারণে, পৃথক পর্যবেক্ষণ y রিগ্রেশন ফাংশন f(x) থেকে বৃহত্তর বা কম পরিমাণে বিচ্যুত হবে। এই ক্ষেত্রে, দুটি ভেরিয়েবলের (পেয়ারড রিগ্রেশন মডেল) মধ্যে সম্পর্কের সমীকরণটি এইভাবে উপস্থাপন করা যেতে পারে:
Y=f(X) + ɛ,
যেখানে ɛ রিগ্রেশন ফাংশন থেকে বিচ্যুতিকে চিহ্নিত করে একটি এলোমেলো পরিবর্তনশীল। এই পরিবর্তনশীলকে বলা হয় ঝামেলা বা বিঘ্ন (অবশিষ্ট বা ত্রুটি)। সুতরাং, রিগ্রেশন মডেলে নির্ভরশীল পরিবর্তনশীল Yকিছু ফাংশন আছে f(X)এলোমেলো ঝামেলা পর্যন্ত ɛ.
আসুন ক্লাসিক্যাল লিনিয়ার পেয়ারওয়াইজ রিগ্রেশন মডেল (CLMPR) বিবেচনা করি। সে দেখতে কেমন
y i =β 0 +β 1 x i +ɛ i (i=1,2, …, n),(1)
কোথায় yi- ব্যাখ্যা করা হয়েছে (ফলাফল, নির্ভরশীল, অন্তঃসত্ত্বা পরিবর্তনশীল); একাদশ- ব্যাখ্যামূলক (ভবিষ্যদ্বাণীকারী, ফ্যাক্টর, বহিরাগত) পরিবর্তনশীল; β 0, β 1- সংখ্যাগত সহগ; ɛi- এলোমেলো (স্টকাস্টিক) উপাদান বা ত্রুটি।
KLMPR-এর মৌলিক শর্ত (পূর্বশর্ত, অনুমান):
1) একাদশ- একটি নির্ধারক (অ-এলোমেলো) পরিমাণ, এবং এটি অনুমান করা হয় যে মানগুলির মধ্যে x i - সবগুলি একই নয়।
2) প্রত্যাশিত মান(গড় মান) ঝামেলা ɛiশূন্যের সমান:
М[ɛ i ]=0 (i=1,2, …, n)।
3) বিঘ্নের বিচ্ছুরণ i এর যেকোন মানের জন্য ধ্রুবক (হোমোসেড্যাস্টিটি অবস্থা):
D[ɛ i ]=σ 2 (i=1,2, …, n)।
4) বিভিন্ন পর্যবেক্ষণের জন্য ব্যাঘাতগুলি সম্পর্কহীন:
cov[ɛ i , ɛ j ] = M[ɛ i , ɛ j ] = i≠j এর জন্য,
যেখানে cov[ɛ i , ɛ j ] হল কোভারিয়েন্স সহগ (সম্পর্কের মুহূর্ত)।
5) ব্যাঘাতগুলি সাধারণত শূন্য গড় এবং প্রকরণ σ 2 সহ র্যান্ডম ভেরিয়েবল বিতরণ করা হয়:
ɛ i ≈ N(0, σ 2)।
একটি রিগ্রেশন সমীকরণ প্রাপ্ত করার জন্য, প্রথম চারটি প্রাঙ্গন যথেষ্ট। রিগ্রেশন সমীকরণ এবং এর পরামিতিগুলির যথার্থতা মূল্যায়ন করার জন্য পঞ্চম পূর্বশর্ত পূরণের প্রয়োজনীয়তা প্রয়োজন।
মন্তব্য:রৈখিক সম্পর্কের উপর ফোকাসটি ভেরিয়েবলের সীমিত পরিবর্তনের দ্বারা ব্যাখ্যা করা হয় এবং এই সত্য যে বেশিরভাগ ক্ষেত্রে সম্পর্কের অরৈখিক ফর্মগুলি গণনা সম্পাদনের জন্য একটি রৈখিক আকারে (লগরিদম বা ভেরিয়েবলের প্রতিস্থাপন দ্বারা) রূপান্তরিত হয়।
প্রথাগত পদ্ধতিসর্বনিম্ন বর্গক্ষেত্র (LS)
নমুনা থেকে মডেল অনুমান হল সমীকরণ
ŷ i = a 0 + a 1 x i(i=1,2, …, n), (2)
যেখানে ŷ i – রিগ্রেশন সমীকরণ থেকে প্রাপ্ত নির্ভরশীল পরিবর্তনশীলের তাত্ত্বিক (আনুমানিক) মান; a 0 , a 1 - রিগ্রেশন সমীকরণের সহগ (প্যারামিটার) (যথাক্রমে β 0, β 1 সহগগুলির নমুনা অনুমান)।
ন্যূনতম বর্গক্ষেত্র অনুসারে, অজানা পরামিতিগুলি a 0 , a 1 বেছে নেওয়া হয়েছে যাতে অভিজ্ঞতামূলক মান y i (বর্গগুলির অবশিষ্ট যোগফল) থেকে ŷ i মানের বর্গের বিচ্যুতির যোগফল ন্যূনতম হয়:
Q e = ∑e i 2 = ∑(y i – ŷ i) 2 = ∑(yi – (a 0 + a 1 x i)) 2 → মিনিট, (3)
যেখানে e i = y i - ŷ i - ঝামেলার নমুনা অনুমান ɛ i, বা রিগ্রেশন অবশিষ্টাংশ।
সমস্যাটি 0 এবং একটি 1 প্যারামিটারের এই ধরনের মান খুঁজে বের করতে আসে যার জন্য Q e ফাংশন নেয় ক্ষুদ্রতম মান. লক্ষ্য করুন যে ফাংশন Q e = Q e (a 0 , a 1) দুটি ভেরিয়েবল a 0 এবং a 1 এর একটি ফাংশন যতক্ষণ না আমরা খুঁজে পাই এবং তারপরে তাদের "সর্বোত্তম" (সর্বনিম্ন বর্গ পদ্ধতির অর্থে) মান, একটি x i স্থির করি। , y i হল পরীক্ষামূলকভাবে পাওয়া ধ্রুবক সংখ্যা।
প্রয়োজনীয় শর্তাবলীদুটি ভেরিয়েবলের এই ফাংশনের আংশিক ডেরিভেটিভকে শূন্যে সমান করে extrema (3) পাওয়া যায়। ফলস্বরূপ, আমরা দুটি সিস্টেম প্রাপ্ত রৈখিক সমীকরণ, যাকে সাধারণ সমীকরণের সিস্টেম বলা হয়:
(4)
সহগ a 1 হল x-এর উপর y-এর একটি নমুনা রিগ্রেশন সহগ, যা দেখায় যে পরিবর্তনশীল x পরিমাপের এক একক দ্বারা পরিবর্তিত হলে গড় কতগুলি একক y পরিবর্তিত হয়, অর্থাৎ, x-এর পরিবর্তনের একক প্রতি y-এর তারতম্য। চিহ্ন একটি 1এই পরিবর্তনের দিক নির্দেশ করে। সহগ একটি 0 – স্থানচ্যুতি, (2) অনুযায়ী মানের সমান x=0 এর জন্য ŷ i এবং এর কোনো অর্থপূর্ণ ব্যাখ্যা নাও থাকতে পারে। এই কারণে, নির্ভরশীল পরিবর্তনশীলকে কখনও কখনও প্রতিক্রিয়া বলা হয়।
রিগ্রেশন সহগ অনুমানের পরিসংখ্যানগত বৈশিষ্ট্য:
সহগ অনুমান a 0, a 1 নিরপেক্ষ;
অনুমানের ভিন্নতা a 0 , a 1 হ্রাস পায় (অনুমানের নির্ভুলতা বৃদ্ধি পায়) নমুনার আকার n বৃদ্ধির সাথে;
ঢাল a 1 এর অনুমানের পার্থক্য বৃদ্ধির সাথে হ্রাস পায় এবং তাই x i বেছে নেওয়ার পরামর্শ দেওয়া হয় যাতে গড় মানের চারপাশে তাদের বিস্তার বড় হয়;
x¯ > 0 এর জন্য (যা সবচেয়ে বেশি আগ্রহের), একটি 0 এবং 1 এর মধ্যে একটি নেতিবাচক পরিসংখ্যানগত সম্পর্ক রয়েছে (একটি 1-এর বৃদ্ধি 0-এর হ্রাসের দিকে নিয়ে যায়)।
রিগ্রেশন বিশ্লেষণের প্রধান বৈশিষ্ট্য: এর সাহায্যে, আপনি অধ্যয়নের অধীনে ভেরিয়েবলের মধ্যে সম্পর্ক কী ফর্ম এবং প্রকৃতি সম্পর্কে নির্দিষ্ট তথ্য পেতে পারেন।
রিগ্রেশন বিশ্লেষণের পর্যায়গুলির ক্রম
আসুন সংক্ষেপে রিগ্রেশন বিশ্লেষণের পর্যায়গুলি বিবেচনা করি।
সমস্যা তৈয়ার. এই পর্যায়ে, অধ্যয়নের অধীনে ঘটনার নির্ভরতা সম্পর্কে প্রাথমিক অনুমান গঠিত হয়।
নির্ভরশীল এবং স্বাধীন (ব্যাখ্যামূলক) ভেরিয়েবলের সংজ্ঞা।
পরিসংখ্যানগত তথ্য সংগ্রহ। রিগ্রেশন মডেলে অন্তর্ভুক্ত প্রতিটি ভেরিয়েবলের জন্য ডেটা সংগ্রহ করতে হবে।
সংযোগের ফর্ম সম্পর্কে একটি অনুমান প্রণয়ন (সরল বা একাধিক, রৈখিক বা অরৈখিক)।
সংজ্ঞা রিগ্রেশন ফাংশন (রিগ্রেশন সমীকরণের পরামিতিগুলির সংখ্যাসূচক মান গণনা করে)
রিগ্রেশন বিশ্লেষণের যথার্থতা মূল্যায়ন।
প্রাপ্ত ফলাফলের ব্যাখ্যা। রিগ্রেশন বিশ্লেষণের প্রাপ্ত ফলাফলগুলি প্রাথমিক অনুমানের সাথে তুলনা করা হয়। প্রাপ্ত ফলাফলের সঠিকতা এবং বিশ্বাসযোগ্যতা মূল্যায়ন করা হয়।
ভবিষ্যদ্বাণী অজানা মাননির্ভরশীল পরিবর্তনশীল।
রিগ্রেশন বিশ্লেষণ ব্যবহার করে, পূর্বাভাস এবং শ্রেণীবিভাগের সমস্যা সমাধান করা সম্ভব। রিগ্রেশন সমীকরণে ব্যাখ্যামূলক ভেরিয়েবলের মানগুলিকে প্রতিস্থাপন করে পূর্বাভাসিত মানগুলি গণনা করা হয়। শ্রেণিবিন্যাসের সমস্যাটি এইভাবে সমাধান করা হয়: রিগ্রেশন লাইন বস্তুর সম্পূর্ণ সেটটিকে দুটি শ্রেণীতে বিভক্ত করে, এবং সেটের যে অংশে ফাংশনের মান শূন্যের চেয়ে বেশি সেটি একটি শ্রেণীর অন্তর্গত, এবং যে অংশটি শূন্যের চেয়ে কম সেটি অন্য শ্রেণীর অন্তর্গত।
রিগ্রেশন বিশ্লেষণ সমস্যা
আসুন রিগ্রেশন বিশ্লেষণের প্রধান কাজগুলি বিবেচনা করি: নির্ভরতার ফর্ম প্রতিষ্ঠা করা, নির্ধারণ করা রিগ্রেশন ফাংশন, নির্ভরশীল ভেরিয়েবলের অজানা মানের অনুমান।
নির্ভরতার রূপ প্রতিষ্ঠা করা।
ভেরিয়েবলের মধ্যে সম্পর্কের প্রকৃতি এবং ফর্ম নিম্নলিখিত ধরনের রিগ্রেশন গঠন করতে পারে:
ইতিবাচক লিনিয়ার রিগ্রেশন(ফাংশনের অভিন্ন বৃদ্ধিতে প্রকাশিত);
ইতিবাচক অভিন্নভাবে বৃদ্ধি রিগ্রেশন;
ইতিবাচক অভিন্নভাবে বৃদ্ধি রিগ্রেশন;
নেতিবাচক লিনিয়ার রিগ্রেশন (ফাংশনে অভিন্ন পতন হিসাবে প্রকাশ করা হয়);
নেতিবাচক অভিন্নভাবে ত্বরিত হ্রাস রিগ্রেশন;
নেতিবাচক অভিন্নভাবে হ্রাস রিগ্রেশন.
যাইহোক, বর্ণিত জাতগুলি সাধারণত পাওয়া যায় না বিশুদ্ধ ফর্ম, কিন্তু একে অপরের সাথে সংমিশ্রণে। এই ক্ষেত্রে, আমরা রিগ্রেশনের সম্মিলিত ফর্ম সম্পর্কে কথা বলি।
রিগ্রেশন ফাংশনের সংজ্ঞা।
দ্বিতীয় কাজটি প্রধান কারণ বা কারণগুলির নির্ভরশীল পরিবর্তনশীলের উপর প্রভাব চিহ্নিত করার জন্য নেমে আসে, অন্যান্য জিনিসগুলি সমান হয় এবং নির্ভরশীল ভেরিয়েবলের উপর র্যান্ডম উপাদানগুলির প্রভাবকে বাদ দেওয়া হয়। রিগ্রেশন ফাংশনএক প্রকার বা অন্য একটি গাণিতিক সমীকরণ আকারে সংজ্ঞায়িত করা হয়।
নির্ভরশীল ভেরিয়েবলের অজানা মানের অনুমান।
এই সমস্যার সমাধান নিম্নলিখিত ধরনের একটি সমস্যা সমাধানে নেমে আসে:
প্রাথমিক ডেটার বিবেচিত ব্যবধানের মধ্যে নির্ভরশীল ভেরিয়েবলের মানগুলির অনুমান, যেমন অনুপস্থিত মানের; এই ক্ষেত্রে, ইন্টারপোলেশন সমস্যা সমাধান করা হয়।
নির্ভরশীল ভেরিয়েবলের ভবিষ্যত মানের অনুমান, যেমন উৎস ডেটার নির্দিষ্ট ব্যবধানের বাইরে মান খুঁজে বের করা; এই ক্ষেত্রে, এক্সট্রাপোলেশন সমস্যা সমাধান করা হয়।
রিগ্রেশন সমীকরণে স্বাধীন ভেরিয়েবলের মানের জন্য পাওয়া প্যারামিটার অনুমানগুলি প্রতিস্থাপন করে উভয় সমস্যাই সমাধান করা হয়। সমীকরণ সমাধানের ফলাফল হল লক্ষ্য (নির্ভরশীল) চলকের মানের অনুমান।
আসুন কিছু অনুমানের দিকে তাকাই যা রিগ্রেশন বিশ্লেষণ নির্ভর করে।
লিনিয়ারিটি অনুমান, অর্থাৎ বিবেচনাধীন ভেরিয়েবলের মধ্যে সম্পর্ক রৈখিক বলে ধরে নেওয়া হয়। সুতরাং, এই উদাহরণে, আমরা একটি স্ক্যাটারপ্লট তৈরি করেছি এবং একটি স্পষ্ট রৈখিক সম্পর্ক দেখতে সক্ষম হয়েছি। যদি, ভেরিয়েবলের স্ক্যাটার ডায়াগ্রামে, আমরা একটি রৈখিক সম্পর্কের স্পষ্ট অনুপস্থিতি দেখতে পাই, যেমন যদি একটি অরৈখিক সম্পর্ক থাকে, তাহলে অরৈখিক বিশ্লেষণ পদ্ধতি ব্যবহার করা উচিত।
স্বাভাবিকতা অনুমান অবশিষ্টাংশ. এটি অনুমান করে যে ভবিষ্যদ্বাণী করা এবং পর্যবেক্ষণ করা মানগুলির মধ্যে পার্থক্যের বন্টন স্বাভাবিক। চাক্ষুষভাবে বিতরণের প্রকৃতি নির্ধারণ করতে, আপনি হিস্টোগ্রাম ব্যবহার করতে পারেন অবশিষ্টাংশ.
রিগ্রেশন বিশ্লেষণ ব্যবহার করার সময়, এর প্রধান সীমাবদ্ধতা বিবেচনা করা উচিত। এটির মধ্যে রয়েছে যে রিগ্রেশন বিশ্লেষণ আমাদের শুধুমাত্র নির্ভরতা সনাক্ত করতে দেয়, এবং এই নির্ভরতাগুলির অন্তর্নিহিত সংযোগগুলি নয়।
রিগ্রেশন বিশ্লেষণ আপনাকে কয়েকটি পরিচিত মানের উপর ভিত্তি করে একটি পরিবর্তনশীলের আনুমানিক মান গণনা করে ভেরিয়েবলের মধ্যে সম্পর্কের শক্তি অনুমান করতে দেয়।
রিগ্রেশন সমীকরণ.
রিগ্রেশন সমীকরণটি এইরকম দেখায়: Y=a+b*X
এই সমীকরণটি ব্যবহার করে, ভেরিয়েবল Yটিকে একটি ধ্রুবক a এবং রেখার ঢাল (বা ঢাল) b এর পরিপ্রেক্ষিতে প্রকাশ করা হয়, যা চলক X-এর মান দিয়ে গুণ করে। ধ্রুবক aকে ইন্টারসেপ্ট টার্মও বলা হয় এবং ঢাল হল রিগ্রেশন সহগ বা বি-গুণ।
বেশিরভাগ ক্ষেত্রে (যদি সর্বদা না হয়) রিগ্রেশন লাইনের সাথে সম্পর্কিত পর্যবেক্ষণের একটি নির্দিষ্ট বিক্ষিপ্ততা রয়েছে।
অবশিষ্ট রিগ্রেশন লাইন (পূর্বাভাসিত মান) থেকে একটি একক বিন্দু (পর্যবেক্ষণ) এর বিচ্যুতি।
এমএস এক্সেলে রিগ্রেশন বিশ্লেষণের সমস্যা সমাধান করতে, মেনু থেকে নির্বাচন করুন সেবা"বিশ্লেষণ প্যাকেজ"এবং রিগ্রেশন বিশ্লেষণ টুল। আমরা ইনপুট ব্যবধান X এবং Y সেট করি। ইনপুট ব্যবধান Y হল নির্ভরশীল বিশ্লেষণকৃত ডেটার পরিসর, এটি অবশ্যই একটি কলাম অন্তর্ভুক্ত করতে হবে। ইনপুট ব্যবধান X হল স্বাধীন ডেটার পরিসর যা বিশ্লেষণ করা প্রয়োজন। ইনপুট ব্যাপ্তির সংখ্যা 16 এর বেশি হওয়া উচিত নয়।
আউটপুট পরিসরে পদ্ধতির আউটপুটে আমরা প্রদত্ত প্রতিবেদনটি পাই টেবিল 8.3a-8.3v.
ফলাফলের উপসংহার
সারণি 8.3a. রিগ্রেশন পরিসংখ্যান |
|
রিগ্রেশন পরিসংখ্যান |
|
বহুবচন আর | |
আর-বর্গক্ষেত্র | |
স্বাভাবিকীকৃত R-বর্গাকার | |
মান ত্রুটি | |
পর্যবেক্ষণ |
আসুন প্রথমে উপস্থাপিত হিসাবের উপরের অংশটি দেখি টেবিল 8.3a, - রিগ্রেশন পরিসংখ্যান।
মাত্রা আর-বর্গক্ষেত্র, যাকে নিশ্চিততার পরিমাপও বলা হয়, ফলে রিগ্রেশন লাইনের গুণমানকে চিহ্নিত করে। এই গুণটি উত্স ডেটা এবং রিগ্রেশন মডেল (গণনা করা ডেটা) এর মধ্যে চিঠিপত্রের ডিগ্রি দ্বারা প্রকাশ করা হয়। নিশ্চিততার পরিমাপ সর্বদা ব্যবধানের মধ্যে থাকে।
অধিকাংশ ক্ষেত্রে মান আর-বর্গক্ষেত্রএই মানগুলির মধ্যে রয়েছে, যাকে চরম বলা হয়, অর্থাৎ শূন্য এবং একের মধ্যে।
মান থাকলে আর-বর্গক্ষেত্রএকতার কাছাকাছি, এর মানে হল যে নির্মিত মডেলটি সংশ্লিষ্ট ভেরিয়েবলের প্রায় সমস্ত পরিবর্তনশীলতা ব্যাখ্যা করে। বিপরীতভাবে, অর্থ আর-বর্গক্ষেত্র, শূন্যের কাছাকাছি, মানে নির্মিত মডেলের নিম্নমানের।
আমাদের উদাহরণে, নিশ্চিততার পরিমাপ হল 0.99673, যা মূল ডেটাতে রিগ্রেশন লাইনের খুব ভাল ফিট নির্দেশ করে।
বহুবচন R - একাধিক পারস্পরিক সম্পর্ক সহগ R - স্বাধীন ভেরিয়েবল (X) এবং নির্ভরশীল চলকের (Y) নির্ভরতার মাত্রা প্রকাশ করে।
বহুবচন আরনির্ণয়ের সহগের বর্গমূলের সমান; এই পরিমাণটি শূন্য থেকে এক পর্যন্ত পরিসরে মান নেয়।
সহজ লিনিয়ার রিগ্রেশন বিশ্লেষণে বহুবচন Rপিয়ারসন পারস্পরিক সম্পর্ক সহগ সমান। সত্যিই, বহুবচন Rআমাদের ক্ষেত্রে, এটি পূর্ববর্তী উদাহরণ (0.998364) থেকে পিয়ারসন পারস্পরিক সম্পর্ক সহগের সমান।
সারণি 8.3 খ. রিগ্রেশন সহগ |
|||
মতভেদ |
মান ত্রুটি |
t-পরিসংখ্যান |
|
Y- ছেদ | |||
পরিবর্তনশীল X 1 | |||
* গণনার একটি ছোট সংস্করণ প্রদান করা হয় |
এখন উপস্থাপিত গণনার মাঝের অংশ বিবেচনা করুন টেবিল 8.3b. এখানে রিগ্রেশন সহগ b (2.305454545) এবং অর্ডিনেট অক্ষ বরাবর স্থানচ্যুতি দেওয়া হয়েছে, যেমন ধ্রুবক a (2.694545455)।
গণনার উপর ভিত্তি করে, আমরা নিম্নরূপ রিগ্রেশন সমীকরণ লিখতে পারি:
Y= x*2.305454545+2.694545455
ভেরিয়েবলের মধ্যে সম্পর্কের দিক নির্ধারণ করা হয় রিগ্রেশন সহগ (গুণ খ) এর চিহ্নের (নেতিবাচক বা ইতিবাচক) উপর ভিত্তি করে।
রিগ্রেশন সহগ চিহ্নটি ধনাত্মক হলে, নির্ভরশীল চলক এবং স্বাধীন চলকের মধ্যে সম্পর্ক ধনাত্মক হবে। আমাদের ক্ষেত্রে, রিগ্রেশন সহগের চিহ্নটি ইতিবাচক, তাই সম্পর্কটিও ইতিবাচক।
রিগ্রেশন সহগের চিহ্নটি ঋণাত্মক হলে, নির্ভরশীল চলক এবং স্বাধীন চলকের মধ্যে সম্পর্ক ঋণাত্মক (বিপরীত)।
ভিতরে টেবিল 8.3c. আউটপুট ফলাফল উপস্থাপন করা হয় অবশিষ্টাংশ. রিপোর্টে এই ফলাফলগুলি দেখানোর জন্য, "রিগ্রেশন" টুলটি চালানোর সময় আপনাকে অবশ্যই "অবশিষ্ট" চেকবক্স সক্রিয় করতে হবে।
বাকিদের প্রত্যাহার
সারণি 8.3c. অবশিষ্টাংশ |
|||
পর্যবেক্ষণ |
ভবিষ্যদ্বাণী Y |
অবশিষ্টাংশ |
স্ট্যান্ডার্ড ব্যালেন্স |
প্রতিবেদনের এই অংশটি ব্যবহার করে, আমরা নির্মিত রিগ্রেশন লাইন থেকে প্রতিটি বিন্দুর বিচ্যুতি দেখতে পারি। সবচেয়ে বড় পরম মান অবশিষ্টআমাদের ক্ষেত্রে - 0.778, সবচেয়ে ছোট - 0.043। এই ডেটাগুলিকে আরও ভালভাবে ব্যাখ্যা করার জন্য, আমরা মূল ডেটার গ্রাফ এবং এতে উপস্থাপিত নির্মিত রিগ্রেশন লাইন ব্যবহার করব চাল 8.3. আপনি দেখতে পাচ্ছেন, রিগ্রেশন লাইনটি মূল ডেটার মানগুলির সাথে বেশ সঠিকভাবে "ফিট" করা হয়েছে।
এটি বিবেচনায় নেওয়া উচিত যে বিবেচনাধীন উদাহরণটি বেশ সহজ এবং গুণগতভাবে একটি লিনিয়ার রিগ্রেশন লাইন তৈরি করা সবসময় সম্ভব নয়।
ভাত। ৮.৩।উৎস তথ্য এবং রিগ্রেশন লাইন
স্বাধীন ভেরিয়েবলের পরিচিত মানের উপর ভিত্তি করে নির্ভরশীল ভেরিয়েবলের অজানা ভবিষ্যত মান অনুমান করার সমস্যাটি বিবেচনার বাইরে থেকে গেছে, যেমন পূর্বাভাস সমস্যা।
একটি রিগ্রেশন সমীকরণ থাকার ফলে, পূর্বাভাস সমস্যাটি x এর পরিচিত মানগুলির সাথে Y= x*2.305454545+2.694545455 সমীকরণটি সমাধান করার জন্য হ্রাস করা হয়। নির্ভরশীল ভেরিয়েবল Y ছয় ধাপ এগিয়ে ভবিষ্যদ্বাণী করার ফলাফল উপস্থাপন করা হয়েছে টেবিল 8.4-এ.
টেবিল 8.4. Y পরিবর্তনশীল পূর্বাভাসের ফলাফল |
|
Y(ভবিষ্যদ্বাণী করা) |
|
সুতরাং, মাইক্রোসফ্ট এক্সেলে রিগ্রেশন বিশ্লেষণ ব্যবহারের ফলে, আমরা:
একটি রিগ্রেশন সমীকরণ তৈরি;
ভেরিয়েবলের মধ্যে সংযোগের নির্ভরতা এবং দিকনির্দেশের ফর্ম প্রতিষ্ঠিত করেছে - ইতিবাচক রৈখিক রিগ্রেশন, যা ফাংশনের অভিন্ন বৃদ্ধিতে প্রকাশ করা হয়;
ভেরিয়েবলের মধ্যে সম্পর্কের দিকনির্দেশ স্থাপন করে;
ফলাফল রিগ্রেশন লাইনের গুণমান মূল্যায়ন;
মূল সেটের ডেটা থেকে গণনা করা ডেটার বিচ্যুতি দেখতে সক্ষম হয়েছিল;
নির্ভরশীল ভেরিয়েবলের ভবিষ্যত মান।
যদি রিগ্রেশন ফাংশনসংজ্ঞায়িত, ব্যাখ্যা করা এবং ন্যায়সঙ্গত, এবং রিগ্রেশন বিশ্লেষণের নির্ভুলতার মূল্যায়ন প্রয়োজনীয়তা পূরণ করে, নির্মিত মডেল এবং ভবিষ্যদ্বাণীকৃত মানগুলিকে যথেষ্ট নির্ভরযোগ্যতা হিসাবে বিবেচনা করা যেতে পারে।
এইভাবে প্রাপ্ত ভবিষ্যদ্বাণীকৃত মানগুলি হল গড় মান যা আশা করা যেতে পারে।
এই কাজের মধ্যে আমরা প্রধান বৈশিষ্ট্য পর্যালোচনা বর্ণনামূলক পরিসংখ্যানএবং তাদের মধ্যে যেমন ধারণা গড় মূল্য,মধ্যমা,সর্বোচ্চ,সর্বনিম্নএবং ডেটা বৈচিত্রের অন্যান্য বৈশিষ্ট্য।
ধারণাটিও সংক্ষিপ্তভাবে আলোচনা করা হয়েছিল নির্গমন. বিবেচিত বৈশিষ্ট্যগুলি তথাকথিত অনুসন্ধানমূলক ডেটা বিশ্লেষণের সাথে সম্পর্কিত; এর উপসংহারগুলি সাধারণ জনসংখ্যার জন্য প্রযোজ্য নাও হতে পারে, তবে শুধুমাত্র ডেটার একটি নমুনার জন্য। অনুসন্ধানমূলক তথ্য বিশ্লেষণ প্রাথমিক সিদ্ধান্তে প্রাপ্ত এবং জনসংখ্যা সম্পর্কে অনুমান গঠন করতে ব্যবহৃত হয়।
পারস্পরিক সম্পর্ক এবং রিগ্রেশন বিশ্লেষণের মূল বিষয়গুলি, তাদের কাজ এবং ব্যবহারিক ব্যবহারের জন্য সম্ভাবনাগুলিও আলোচনা করা হয়েছিল।
রিগ্রেশন বিশ্লেষণ পদ্ধতিটি মান সম্পর্ক তৈরি এবং সারিবদ্ধ করার জন্য একটি নির্দিষ্ট প্যারামেট্রিক সিরিজের পণ্যগুলির প্রযুক্তিগত এবং অর্থনৈতিক পরামিতি নির্ধারণ করতে ব্যবহৃত হয়। এই পদ্ধতিটি এক বা একাধিক প্রযুক্তিগত এবং অর্থনৈতিক পরামিতির উপস্থিতি দ্বারা চিহ্নিত পণ্যগুলির স্তর এবং মূল্যের অনুপাত বিশ্লেষণ এবং ন্যায্যতা দিতে ব্যবহৃত হয় যা প্রধান ভোক্তা বৈশিষ্ট্যগুলিকে প্রতিফলিত করে। রিগ্রেশন বিশ্লেষণ আমাদের একটি অভিজ্ঞতামূলক সূত্র খুঁজে পেতে দেয় যা পণ্যের প্রযুক্তিগত এবং অর্থনৈতিক পরামিতিগুলির উপর মূল্যের নির্ভরতা বর্ণনা করে:
P=f(X1X2,...,Xn),
যেখানে P হল পণ্যের একক মূল্যের মান, ঘষা। (X1, X2, ... Xn) - পণ্যের প্রযুক্তিগত এবং অর্থনৈতিক পরামিতি।
রিগ্রেশন বিশ্লেষণের পদ্ধতি - ব্যবহৃত আদর্শ-প্যারামেট্রিক পদ্ধতিগুলির মধ্যে সবচেয়ে উন্নত - আধুনিক ব্যবহারের উপর ভিত্তি করে গণনা করার সময় কার্যকর। তথ্য প্রযুক্তিএবং সিস্টেম। এর প্রয়োগে নিম্নলিখিত প্রধান পদক্ষেপগুলি অন্তর্ভুক্ত রয়েছে:
- পণ্যের শ্রেণীবিভাগ প্যারামেট্রিক গ্রুপ নির্ধারণ;
- পণ্যের দামকে সবচেয়ে বেশি প্রভাবিত করে এমন পরামিতিগুলির নির্বাচন;
- পরামিতি পরিবর্তন হলে মূল্য পরিবর্তনের মধ্যে সংযোগের ফর্ম নির্বাচন এবং ন্যায্যতা;
- স্বাভাবিক সমীকরণের একটি সিস্টেম নির্মাণ এবং রিগ্রেশন সহগ গণনা।
মৌলিক যোগ্যতা গ্রুপপণ্য, যার মূল্য সমীকরণ সাপেক্ষে, একটি প্যারামেট্রিক সিরিজ, যার মধ্যে পণ্যগুলি তাদের প্রয়োগ, অপারেটিং শর্ত এবং প্রয়োজনীয়তা ইত্যাদির উপর নির্ভর করে বিভিন্ন ডিজাইনে গোষ্ঠীভুক্ত করা যেতে পারে। প্যারামেট্রিক সিরিজ গঠন করার সময়, স্বয়ংক্রিয় শ্রেণীবিভাগ পদ্ধতি ব্যবহার করা যেতে পারে, পণ্যগুলিকে তাদের সমজাতীয় গোষ্ঠীগুলি সনাক্ত করা সম্ভব করে তোলে। প্রযুক্তিগত এবং অর্থনৈতিক পরামিতিগুলির নির্বাচন নিম্নলিখিত মৌলিক প্রয়োজনীয়তার উপর ভিত্তি করে করা হয়:
- নির্বাচিত পরামিতিগুলি স্ট্যান্ডার্ডগুলিতে রেকর্ড করা পরামিতিগুলি অন্তর্ভুক্ত করে এবং প্রযুক্তিগত শর্ত; প্রযুক্তিগত পরামিতিগুলি (শক্তি, লোড ক্ষমতা, গতি, ইত্যাদি) ছাড়াও, পণ্যের ক্রমিককরণের সূচক, জটিলতা সহগ, একীকরণ ইত্যাদি ব্যবহার করা হয়;
- নির্বাচিত পরামিতিগুলির সেটটি সিরিজে অন্তর্ভুক্ত পণ্যগুলির নকশা, প্রযুক্তিগত এবং কার্যক্ষম বৈশিষ্ট্যগুলিকে পর্যাপ্তভাবে চিহ্নিত করতে হবে এবং দামের সাথে মোটামুটি ঘনিষ্ঠ সম্পর্ক থাকতে হবে;
- পরামিতি পরস্পর নির্ভরশীল হওয়া উচিত নয়।
মূল্যকে উল্লেখযোগ্যভাবে প্রভাবিত করে এমন প্রযুক্তিগত এবং অর্থনৈতিক পরামিতিগুলি নির্বাচন করতে, জোড়া পারস্পরিক সম্পর্ক সহগগুলির একটি ম্যাট্রিক্স গণনা করা হয়। পরামিতিগুলির মধ্যে পারস্পরিক সম্পর্ক সহগগুলির মাত্রার উপর ভিত্তি করে, কেউ তাদের সংযোগের ঘনিষ্ঠতা বিচার করতে পারে। একই সময়ে, শূন্যের কাছাকাছি একটি পারস্পরিক সম্পর্ক মূল্যের উপর প্যারামিটারের একটি নগণ্য প্রভাব দেখায়। প্রযুক্তিগত এবং অর্থনৈতিক পরামিতিগুলির চূড়ান্ত নির্বাচন ধাপে ধাপে রিগ্রেশন বিশ্লেষণের প্রক্রিয়ায় সম্পাদিত হয় কম্পিউটার এর যন্ত্রাদিএবং সংশ্লিষ্ট স্ট্যান্ডার্ড প্রোগ্রাম।
মূল্য নির্ধারণের অনুশীলনে, ফাংশনের নিম্নলিখিত সেট ব্যবহার করা হয়:
রৈখিক
P = ao + alXl + ... + antXn,
রৈখিক শক্তি
P = ao + a1X1 + ... + anXn + (an+1Xn) (an+1Xn) +... + (an+nXn2) (an+nXn2)
বিপরীত লগারিদম
P = a0 + a1: X1 + ... + an: Xn-এ,
ক্ষমতা
P = a0 (X1^a1) (X2^a2) .. (Xn^an)
নির্দেশক
P = e^(a1+a1X1+...anXn)
অধিবৃত্ত
P = ao + a1:X1 + a2:X2 + ... + ap:Xn,
যেখানে P হল মূল্য সমীকরণ; X1 X2,..., Xn - সিরিজের পণ্যগুলির প্রযুক্তিগত এবং অর্থনৈতিক পরামিতির মান; a0, a1 ..., а - রিগ্রেশন সমীকরণের গণনাকৃত সহগ।
মূল্য নির্ধারণের ব্যবহারিক কাজে, মূল্য এবং প্রযুক্তিগত এবং অর্থনৈতিক পরামিতিগুলির মধ্যে সম্পর্কের উপর নির্ভর করে, অন্যান্য রিগ্রেশন সমীকরণ ব্যবহার করা যেতে পারে। মূল্য এবং প্রযুক্তিগত এবং অর্থনৈতিক পরামিতিগুলির একটি সেটের মধ্যে সংযোগের ফাংশনের ধরন কম্পিউটার প্রক্রিয়াকরণের সময় প্রিসেট বা স্বয়ংক্রিয়ভাবে নির্বাচন করা যেতে পারে। ঘনিষ্ঠতা পারস্পরিক সম্পর্কমূল্য এবং পরামিতি সেটের মধ্যে একাধিক পারস্পরিক সম্পর্ক সহগের মান দ্বারা মূল্যায়ন করা হয়। একজনের সাথে এর নৈকট্য একটি ঘনিষ্ঠ সংযোগ নির্দেশ করে। রিগ্রেশন সমীকরণ ব্যবহার করে, প্রদত্ত প্যারামেট্রিক সিরিজের পণ্যগুলির জন্য সমান (গণনা করা) মূল্য মানগুলি প্রাপ্ত হয়। সমীকরণের ফলাফলগুলি মূল্যায়ন করার জন্য, প্রকৃত মূল্য থেকে গণনাকৃত মূল্য মানগুলির বিচ্যুতির আপেক্ষিক মানগুলি গণনা করা হয়:
Tsr = Rf - Rr: R x 100
যেখানে Рф, Рр - প্রকৃত এবং গণনাকৃত মূল্য।
CR এর মান 8-10% এর বেশি হওয়া উচিত নয়। প্রকৃত মান থেকে গণনা করা মানগুলির উল্লেখযোগ্য বিচ্যুতির ক্ষেত্রে, এটি তদন্ত করা প্রয়োজন:
- একটি প্যারামেট্রিক সিরিজ গঠনের সঠিকতা, যেহেতু এতে এমন পণ্য থাকতে পারে যা তাদের পরামিতিতে, সিরিজের অন্যান্য পণ্যগুলির থেকে তীব্রভাবে পৃথক। তাদের অবশ্যই বাদ দিতে হবে;
- প্রযুক্তিগত এবং অর্থনৈতিক পরামিতিগুলির সঠিক নির্বাচন। মূল্যের সাথে দুর্বলভাবে সম্পর্কযুক্ত পরামিতিগুলির একটি সেট সম্ভব। এই ক্ষেত্রে, অনুসন্ধান এবং পরামিতি নির্বাচন চালিয়ে যাওয়া প্রয়োজন।
রিগ্রেশন বিশ্লেষণ পরিচালনার জন্য পদ্ধতি এবং পদ্ধতি, সমীকরণের অজানা পরামিতিগুলি এবং প্রাপ্ত ফলাফলের অর্থনৈতিক মূল্যায়ন প্রয়োজনীয়তা অনুসারে পরিচালিত হয় গাণিতিক পরিসংখ্যান.