صفحه اصلی بهداشت ارزیابی تخصصی روش Minimax و روش Bayes-Laplace و Savage. به صفحاتی که اصطلاح معیار بیز ذکر شده است مراجعه کنید

ارزیابی تخصصی روش Minimax و روش Bayes-Laplace و Savage. به صفحاتی که اصطلاح معیار بیز ذکر شده است مراجعه کنید

ورزش. این شرکت قصد دارد محصولات خود را با در نظر گرفتن گزینه های احتمالی برای تقاضای مصرف کننده P j , j = 1.4 (کم، متوسط، زیاد، بسیار زیاد) در بازار بفروشد. این شرکت سه استراتژی برای فروش کالاهای A 1، A 2، A 3 ایجاد کرده است. حجم گردش مالی (واحد پول)، بسته به استراتژی و تقاضای مصرف کننده، در جدول ارائه شده است.
P 1P 2ص 3ص 4
الف 130+ N10 20 25 + N/2
الف 250 70 - ن10 + N/225
الف 325 - N/235 40 60 - N/2
که در آن N=3
حالات احتمالی تقاضای مصرف کننده مشخص است که به ترتیب عبارتند از: q 1 = 0.3، q 2 = 0.2، q 3 = 0.4، q 4 = 0.1. یافتن یک استراتژی فروش ضروری است که میانگین گردش مالی شرکت را به حداکثر برساند. در این مورد از معیارهای Wald، Hurwitz، Savage و Bayes استفاده کنید.

راه حلبا استفاده از ماشین حساب پیدا کنید
معیار بیز.
با توجه به معیار بیز، استراتژی (خالص) A i را به حداکثر می رساند میانگین برد a یا میانگین ریسک r به حداقل می رسد.
ما مقادیر ∑ (a ij p j) را می شماریم.
∑(a 1,j p j) = 33 0.3 + 10 0.2 + 20 0.4 + 26.5 0.1 = 22.55
∑(a 2,j p j) = 50 0.3 + 67 0.2 + 11.5 0.4 + 25 0.1 = 35.5
∑(a 3,j p j) = 23.5 0.3 + 35 0.2 + 40 0.4 + 58.5 0.1 = 35.9

یک آیP 1P 2ص 3ص 4∑(a ij p j)
الف 1 9.9 2 8 2.65 22.55
الف 2 15 13.4 4.6 2.5 35.5
الف 3 7.05 7 16 5.85 35.9
p j 0.3 0.2 0.4 0.1

معیار لاپلاس.
اگر احتمالات حالت‌های طبیعت قابل قبول باشد، از اصل دلیل ناکافی لاپلاس برای ارزیابی آنها استفاده می‌شود، که طبق آن همه حالات طبیعت به یک اندازه محتمل فرض می‌شوند، یعنی:
q 1 = q 2 = ... = q n = 1/n.
q i = 1/4
یک آیP 1P 2ص 3ص 4∑ (a ij)
الف 1 8.25 2.5 5 6.63 22.38
الف 2 12.5 16.75 2.88 6.25 38.38
الف 3 5.88 8.75 10 14.63 39.25
p j 0.25 0.25 0.25 0.25
نتیجه گیری: استراتژی N=3 را انتخاب کنید.
معیار والد.
با توجه به معیار والد، یک استراتژی خالص به عنوان بهینه در نظر گرفته می شود که در بدترین شرایط حداکثر سود را تضمین می کند، یعنی.
a = حداکثر (حداقل یک ij)
معیار والد آمار را بر نامطلوب ترین حالت های طبیعت متمرکز می کند. این معیار ارزیابی بدبینانه از وضعیت را بیان می کند.
یک آیP 1P 2ص 3ص 4min (a ij)
الف 1 33 10 20 26.5 10
الف 2 50 67 11.5 25 11.5
الف 3 23.5 35 40 58.5 23.5
نتیجه گیری: استراتژی N=3 را انتخاب کنید.
معیار وحشیانه.
معیار حداقل ریسک Savage انتخاب را توصیه می کند استراتژی بهینهموردی که در آن میزان حداکثر ریسک در بدترین شرایط به حداقل می رسد. ارائه شده:
a = حداقل (حداکثر r ij)
معیار ساویج آمار را بر نامطلوب ترین حالت های طبیعت متمرکز می کند. این معیار ارزیابی بدبینانه از وضعیت را بیان می کند.
ماتریس ریسک را پیدا می کنیم.
خطر- اندازه گیری اختلاف بین نتایج ممکن مختلف اتخاذ استراتژی های خاص. حداکثر بهره در ستون j b j = max(a ij) وضعیت مطلوب طبیعت را مشخص می کند.
1. ستون 1 ماتریس ریسک را محاسبه کنید.
r 11 = 50 - 33 = 17; r 21 = 50 - 50 = 0; r 31 = 50 - 23.5 = 26.5;
2. ستون 2 ماتریس ریسک را محاسبه کنید.
r 12 = 67 - 10 = 57; r 22 = 67 - 67 = 0; r 32 = 67 - 35 = 32;
3. ستون 3 ماتریس ریسک را محاسبه کنید.
r 13 = 40 - 20 = 20; r 23 = 40 - 11.5 = 28.5; r 33 = 40 - 40 = 0;
4. ستون 4 ماتریس ریسک را محاسبه کنید.
r 14 = 58.5 - 26.5 = 32; r 24 = 58.5 - 25 = 33.5; r 34 = 58.5 - 58.5 = 0;
یک آیP 1P 2ص 3ص 4
الف 1 17 57 20 32
الف 2 0 0 28.5 33.5
الف 3 26.5 32 0 0

یک آیP 1P 2ص 3ص 4حداکثر (a ij)
الف 1 17 57 20 32 57
الف 2 0 0 28.5 33.5 33.5
الف 3 26.5 32 0 0 32
نتیجه گیری: استراتژی N=3 را انتخاب کنید.
معیار هورویتز.
معیار هورویتز معیار بدبینی - خوش بینی است. استراتژی بهینه به عنوان استراتژی در نظر گرفته می شود که رابطه زیر برای آن برقرار است:
حداکثر (s i)
جایی که s i = y min(a ij) + (1-y) max(a ij)
برای y = 1، معیار والد را به دست می آوریم، برای y = 0، معیار خوش بینانه (حداکثر) را به دست می آوریم.
معیار هورویتز امکان بدترین و بهترین رفتار طبیعت را برای انسان ها در نظر می گیرد. چگونه y انتخاب می شود؟ چگونه عواقب بدتراز تصمیمات اشتباه، هر چه تمایل به بیمه شدن در برابر خطاها بیشتر باشد، y به 1 نزدیکتر است.
ما s i را محاسبه می کنیم.
s 1 = 0.5 10+ (1-0.5) 33 = 21.5
s 2 = 0.5 11.5+ (1-0.5) 67 = 39.25
s 3 = 0.5 23.5+ (1-0.5) 58.5 = 41
یک آیP 1P 2ص 3ص 4min (a ij)حداکثر (a ij)y min(a ij) + (1-y) max(a ij)
الف 1 33 10 20 26.5 10 33 21.5
الف 2 50 67 11.5 25 11.5 67 39.25
الف 3 23.5 35 40 58.5 23.5 58.5 41
نتیجه گیری: استراتژی N=3 را انتخاب کنید.
بنابراین، در نتیجه تصمیم بازی آماریبر اساس معیارهای مختلف، استراتژی A 3 بیشتر از سایرین توصیه شد.

مدیریت شرکت تصمیم می گیرد که محل تولید یک محصول جدید را در یک مکان خاص قرار دهد. برای شکل دادن به وضعیت بازار یک محصول جدید در زمان تسلط بر تولید، لازم است هزینه های تحویل محصولات نهایی به مصرف کننده، توسعه زیرساخت های حمل و نقل و اجتماعی در نظر گرفته شود. منطقه، رقابت در بازار، رابطه بین عرضه و تقاضا، نرخ ارز و بسیاری موارد دیگر. گزینه های ممکنتصمیماتی که جذابیت سرمایه گذاری آن به عنوان درصد رشد درآمد نسبت به میزان سرمایه گذاری تعریف شده است، در جدول ارائه شده است.
انتخاب کنید:
1) مکانی برای قرار دادن تولید، اگر رئیس شرکت مطمئن باشد که وضعیت 4 در بازار ایجاد می شود.
2) مکانی برای مکان تولید در صورتی که مدیریت احتمال وضعیت 1 را 0.2 برآورد کند. موقعیت های 2 در 0.1; وضعیت 3 در 0.25;
3) یک گزینه را در شرایط عدم قطعیت با توجه به معیار انتخاب کنید: حداکثر، حداکثر، معیار لاپلاس، معیار Savage، معیار Hurwitz (y = 0.3).
4) آیا تغییر خواهد کرد بهترین گزینهاگر مقدار a به 0.5 افزایش یابد بر اساس معیار هورویتز جواب می دهد؟
5) با فرض اینکه داده های جدول هزینه های شرکت را نشان می دهد، انتخابی را که شرکت هنگام استفاده از هر یک از آنها انجام می دهد تعیین کنید. معیارهای زیر: maximin; حداکثر معیار هورویتز (? = 0.3); معیار وحشی; معیار لاپلاس

فرض بر این است که سپرده ها به طور مساوی در سراسر قلمرو توزیع می شوند. این رویکرد را به سختی می توان مشروع دانست، زیرا نتایج به دست آمده با کمک آن مبنای منطقی ندارد. با این حال، معیار بیز-لاپلاس دلخواه تر از معیار هورویتز نیست.


رویکرد خوش بینانه، رویکردهای مبتنی بر معیار هورویتز، معیار بیز-لاپلاس و معیار ساویج در در این موردنمای بعدی

معیار بیزی (لاپلاس) 27، 224 رویکرد بیزی 27 تعادل 27 تعادل (یا تعادل)

در میان این معیارها و قواعد، جایگاه ویژه ای را قواعد و معیارهای مبتنی بر قضیه معروف بیز به خود اختصاص داده اند. رویکرد مبتنی بر این قضیه اجازه می دهد اولاً از برخی اصول روش شناختی علوم طبیعی در مدیریت استفاده شود و ثانیاً اطمینان حاصل شود که قضاوت ها و تصمیم گیری ها با کسب تجربه تنظیم می شوند. دومی به معنای یادگیری مدیریت (به معنای تصمیم گیری) در خود فرآیند مدیریت است.

گاهی اوقات در طول یک عملیات، عدم قطعیت به تدریج با در دسترس شدن اطلاعات آشکار می شود. در این مورد، برای توجیه تصمیمات، استفاده از معیار عینی مانند احتمال عقبی یک رویداد راحت است. این احتمال به راحتی با استفاده از فرمول بیز بر حسب شانس محاسبه می شود. بیایید جوهر این رویکرد را در نظر بگیریم.

معیار بیز در مواردی استفاده می شود که توزیع احتمال حالت های ممکن مشخص باشد. اگر این توزیع احتمال گسسته توسط مجموعه احتمالات داده شود، پس با توجه به معیار بیز، استراتژی Si به Sj ترجیح داده می شود (s > if

موارد خاص این معیار، معیار بیز (برای A = 1) و معیار Wald (برای A = 0) است.

معیار بیز-لاپلاس، بر خلاف معیار والد، هر یک از پیامدهای احتمالی همه گزینه های تصمیم را در نظر می گیرد.

معیار بیز-لاپلاس الزامات زیر را در موقعیتی که در آن تصمیم گرفته می شود تحمیل می کند:

هنگامی که z = 1، معیار به معیار بیز-لاپلاس تبدیل می شود، و زمانی که z = O به معیار والد تبدیل می شود. بنابراین، انتخاب پارامتر z تابع ذهنیت است. علاوه بر این، تعداد پیاده سازی ها بدون توجه باقی می ماند. بنابراین، این معیار به ندرت در هنگام تصمیم گیری فنی مورد استفاده قرار می گیرد.

ما چندین رویکرد اساسی برای تصمیم‌گیری را در مورد عوامل نامشخص در مدل مورد مطالعه بررسی کردیم. وقتی همه معیارهای تصمیم‌گیری منجر به انتخاب همان راه‌حل x e X می‌شوند، می‌توانید مثال بزنید، اما معمولاً این اتفاق نمی‌افتد، هر معیار به تصمیم خود منجر می‌شود (مثالی از این نوع در فصل بعدی مورد بحث قرار می‌گیرد). بنابراین، بحث در مورد اینکه کدام معیار و چه زمانی ارجحیت دارد، مطرح می شود. تلاش برای ساختن یک واحد بر اساس چندین معیار است. به ویژه، معیار هورویتز ترکیبی از دو معیار است. همچنین سعی شده است معیار هورتز و معیار بیز لاپلاس ترکیب شود. همه معیارهای به دست آمده دارای درجه بالایی از خودسری هستند. به نظر ما تنها راه غلبه بر این مشکلات، رویکرد چند معیاره است که در آن تصمیم گیرنده می تواند گزینه هایی را برای تصمیم گیری که از منظر مجموعه ای از شاخص ها موثر است، در نظر گرفته و از بین آن ها مناسب ترین را انتخاب کند. آنها را این رویکرد در مثال ارائه شده در فصل بعد استفاده می شود. البته مجموع شاخص ها نباید خیلی زیاد باشد.

به طور معمول، چندین پیکربندی با آن امتحان می شود عدد متفاوتعناصر و ساختار اتصالات یکی از مهمترین شاخص های مهمحجم مجموعه آموزشی و حصول اطمینان از توانایی تعمیم در حین کار بیشتر است و می توان به نتیجه مطلوب رسید طرح های مختلف. متداول‌ترین روش‌های مورد استفاده عبارتند از فرود متوالی (با مجموعه تاییدی) یا اعتبارسنجی متقاطع N برابر. معیارهای اطلاعاتی قدرتمندتر را نیز می توان اعمال کرد (1) اعتبار متقابل تعمیم یافته (GV)، خطای پیش بینی نهایی آکایک (FPE)، معیار بیز (BI) و معیارهای آکایک (AI) (نگاه کنید به ). به منظور بهبود توانایی های تعمیم و رفع خطر بیش از حد تناسب از کاهش وزن و حذف (نازک شدن درختان) نیز استفاده می شود. در عین حال، معماری شبکه تغییر می‌کند، برخی از اتصالات حذف می‌شوند و تاثیری که بر کارایی داشته‌اند، بررسی می‌شود. >،

معیار BAYES (LAPLACE) - در تئوری تصمیم، معیاری برای تصمیم گیری در غیاب هرگونه اطلاعات در مورد احتمالات نسبی استراتژی های "طبیعت". (به مسائل نامشخص مراجعه کنید.) با توجه به B.(L.)k. پیشنهاد شده است که احتمالات یکسانی به همه استراتژی‌های مورد بررسی داده شود، و سپس راهبردی که بیشترین بازده مورد انتظار را دارد، بپذیرد. این عیب دارد که دامنه گزینه های ارزیابی شده در یک مسئله می تواند متفاوت باشد و بر این اساس، احتمال نسبی هر یک از آنها نیز می تواند متفاوت باشد.

معیار هاجز-لمن. هنگام اجرای این معیار، از دو شاخص ذهنی استفاده می شود: اول، توزیع احتمال استفاده شده در معیار بیز، و دوم، "پارامتر خوش بینی" از معیار هورویتز.

معیار هاج-لمن به طور همزمان بر اساس معیارهای والد و بیز-لاپلاس است.

هنگام جستجوی راه حل های بهینه، معمولاً از آنها استفاده می کنند معیارهای مختلف، ارائه برخی از طرح های تصمیم گیری. بیایید به برخی از آنها نگاه کنیم.

معیار بیز هنگام استفاده از معیار بیز، آماردان احتمالات q k وقوع رویداد Pk را می داند. به طور معمول، احتمالات q k با انجام آزمایشات تعیین می شود. چنین احتمالاتی را پسین می نامند. استراتژی خالص با توجه به معیار بیز به عنوان بهینه پذیرفته شده است یک آی، که در آن میانگین آمار برنده حداکثر می شود.

معیار لاپلاس تفاوت معیار لاپلاس با معیار بیز در این است که احتمالات پسین ناشناخته هستند. سپس آنها را مساوی گرفته و با استفاده از فرمول محاسبه می شود

معیار وحشیانه. این معیار ملاک بدبینی شدید است، یعنی. آماردان از این فرض شروع می کند که طبیعت به بدترین شکل ممکن علیه او عمل می کند. معیار Savage توصیه می کند که استراتژی خالص A i را به عنوان بهینه انتخاب کنید که در آن حداکثر ریسک حداقل است. این ریسک حداقل حداکثر نام دارد و با فرمول محاسبه می شود

معیار والد معیار والد نیز مانند معیار ساویج، معیار بدبینی شدید است. بنابراین، آمارگیر یک استراتژی خالص A را انتخاب می کند که کوچکترین بازده حداکثر باشد. این بهره ماکسیمین نامیده می شود و با فرمول محاسبه می شود

معیار هورویتز این معیار معیار بدبینی- خوش بینی است و توصیه می کند از چیزی در این بین استفاده کنید. در این مورد، آمارگیر یک استراتژی خالص A i را انتخاب می کند که شرایط زیر برای آن برقرار است:

که در آن γ=0÷1 از ملاحظات ذهنی انتخاب شده است. وقتی γ = 1، معیار هورویتز به معیار والد تبدیل می شود.

مثال 4.6. یک استودیو برای تعمیر تلویزیون در حال ایجاد است شرایط بستری. برای سادگی، فرض می کنیم که جریان درخواست تعمیرات با اعداد 2، 4، 6 و 8 هزار درخواست در سال بیان می شود. از نظر تجربه مشخص است که سود تعمیر یک تلویزیون 9 den است. واحدها در سال. خسارات ناشی از عدم تعمیر به دلیل کمبود ظرفیت - 5 den. واحدها خسارات ناشی از خرابی متخصصان و تجهیزات در صورت عدم وجود برنامه - 6 روز. واحدها برای هر برنامه



اطلاعاتی در مورد ظرفیت استودیو در حال ایجاد با استفاده از معیارهای داده شده ارائه دهید.

راه حل. بازیکن A در اینجا بدنی است که در مورد ظرفیت استودیو ایجاد شده تصمیم می گیرد. راهبردهای ناب او عبارتند از:

■ A 1 - افتتاح استودیو با ظرفیت 2 هزار تلویزیون در سال.

§ الف 2 - افتتاح استودیو با ظرفیت 4 هزار تلویزیون در سال.

■ 3 - افتتاح استودیو با ظرفیت 6 هزار تلویزیون در سال.

■ 4 - افتتاح استودیو با ظرفیت 8 هزار تلویزیون در سال.

پخش کننده دوم مجموع تمام شرایطی است که در آن جریان درخواست تعمیر تلویزیون در یک استودیو شکل می گیرد، یعنی. طبیعت پ. طبیعت می تواند هر یک از چهار حالت را درک کند:

P 1- جریان 2 هزار تلویزیون در سال خواهد بود.

■ P g - جریان 4 هزار تلویزیون در سال خواهد بود.

ص 3- جریان 6 هزار تلویزیون در سال خواهد بود.

§ ص 4- جریان 8 هزار تلویزیون در سال خواهد بود.

بیایید بازده بازیکن A را تحت هر شرایط ترکیبی محاسبه کنیم ( A i، P k). مطلوب ترین موقعیت زمانی خواهد بود که تعداد برنامه های دریافت شده با قابلیت های استودیو مطابقت داشته باشد.

برای ترکیب ( A 1، P 1) سود 11 = 2 * 9 = 18 هزار خواهد بود. واحدها برای ترکیب ( A 2, P 2) 22 = 4 * 9 = 36 هزار دن داریم. واحدها و غیره.

برای مورد ( A 1, P 2) در استودیو می توانید 2 هزار تلویزیون را تعمیر کنید و 4 هزار برنامه دریافت شده است که ضرر در این مورد 2 * 5 = 10 هزار خواهد بود. واحد و سود کل n=2*9-2*5=8 هزار den. واحدها

برای مورد ( A i، P k) در استودیو می توانید 4 هزار تلویزیون را تعمیر کنید و 2 هزار برنامه دریافت شده است که ضرر در این مورد 2 * 6 = 12 هزار خواهد بود. واحد، و سود کل 21 = 18-12 = 6 هزار den. واحدها سایر عناصر ماتریس پرداخت به طور مشابه یافت می شوند. نتایج محاسبات در جدول ارائه شده است. 4.13.

از روی میز 4.13 نتیجه می شود که قیمت خالص کمتر بازی

و قیمت خالص بالای بازی

از آنجایی که α ≠ β، بازی حاوی نقطه زین نیست. آمارگیر هیچ استراتژی غالبی ندارد.____________

معیار بیز احتمالات q k حالت طبیعت P k معلوم باشد.در جدول. 4.13 این احتمالات به عنوان . با استفاده از فرمول (4.23) مقادیر میانگین برد را پیدا می کنیم. این مقادیر در ستون هفتم جدول آورده شده است. 4.13. به عنوان بهینه با توجه به معیار بیز، استراتژی خالص A 3 (باز کردن یک کارگاه برای 6 هزار تعمیر در سال) پذیرفته شده است که میانگین سود در آن آمار است. .

جدول 4.13

P 1(2) P 2(4) ص 3(6) ص 4(8) αi 0.8α i δi 0.2δi سلام
A 1 (2) -2 -12 -12 3,5 -9,6 3,6 -6
A 2 (4) 23,5 4,8 7,2
A 3 (6) -6 -6 29,5 -4,8 10,8
A 4 (8) -18 -18 25,5 -14,4 14,4
β i
0,2 0,35 0,25 0,2
0,25 0,25 0,25 0,25

از نمادهای زیر در اینجا استفاده می شود:

معیار لاپلاس با توجه به این معیار، احتمالات برابر فرض شده و با استفاده از فرمول محاسبه می شوند

استراتژی خالص A 3 نیز با توجه به معیار لاپلاس به عنوان بهینه پذیرفته شده است، که آمار میانگین بازده برای آن

معیار وحشیانه. برای تحلیل بازی با استفاده از این روش، ماتریس ریسک می سازیم. از فرمول های (4.21)، (4.22) برای محاسبات استفاده می شود. نتایج محاسبات در جدول ارائه شده است. 4.14.

به شرح زیر از جدول. 4.14، حداقل تمام خطرات حداکثر برابر است با . این ریسک با استراتژی خالص A 3 (باز کردن یک کارگاه برای 6 هزار تعمیر در سال) مطابقت دارد.

جدول 4.14

P 1 P 2 ص 3 ص 4 حداکثر ریک
الف 1
الف 2
الف 3
الف 4

معیار والد از روی میز 4.13 مشخص است که قیمت خالص بازی کمتر است . این قیمت با استراتژی خالص A g (باز کردن استودیو برای 4 هزار تعمیر در سال) مطابقت دارد.

معیار هورویتز بیایید γ = 0.8 قرار دهیم. با استفاده از فرمول محاسبه می کنیم δi= max a ik (به ستون 10 جدول 4.13 مراجعه کنید). سپس با استفاده از داده های ستون های 6 و 10 جدول. 4.13، ما محاسبه را با استفاده از فرمول انجام می دهیم.

نتیجه در ستون 12 جدول ارائه شده است. 4.13. استراتژی معنا و تناسب الف 2(باز کردن استودیو برای 4 هزار تعمیر در سال).

معیار لاپلاس

در تعدادی از موارد، استدلال زیر قابل قبول به نظر می رسد: از آنجایی که حالات آینده طبیعت ناشناخته هستند، می توان آنها را به همان اندازه محتمل دانست. این رویکرد راه حل در معیار لاپلاس "دلیل ناکافی" استفاده می شود.

برای حل مسئله، برای هر راه حل، انتظار ریاضی سود محاسبه می شود (احتمالات حالت های طبیعت برابر با qj = 1/n، j = 1:n در نظر گرفته می شود)، و راه حلی انتخاب می شود که در آن مقدار این سود حداکثر است.

فرضیه یکسان بودن حالات طبیعت کاملاً مصنوعی است، بنابراین اصل لاپلاس فقط در موارد محدودی قابل استفاده است. در بیشتر مورد کلیباید فرض کرد که حالت های طبیعت به یک اندازه محتمل نیستند و از معیار بیز-لاپلاس برای حل استفاده کرد.

معیار بیز-لاپلاس

این معیار از شرایط عدم قطعیت کامل خارج می شود - فرض می کند که حالت های ممکن طبیعت را می توان احتمال مشخصی از وقوع آنها را نسبت داد و با تعیین انتظار ریاضی سود برای هر تصمیم، یکی را انتخاب کرد که بیشترین مقدار سود را ارائه می دهد:

این روش امکان استفاده از هرگونه اطلاعات اولیه در مورد حالات طبیعت را در نظر می گیرد. این امر هم تکرارپذیری حالت‌های طبیعت و هم تکرارپذیری تصمیم‌گیری‌ها و بالاتر از همه، در دسترس بودن داده‌های به اندازه کافی قابل اعتماد در مورد وضعیت‌های طبیعی گذشته را فرض می‌کند. یعنی بر اساس مشاهدات قبلی وضعیت آینده طبیعت را پیش بینی کنید (اصل آماری).

با بازگشت به جدول 1 خود، فرض می کنیم که q1=0.4، q2=0.2 و q3=0.4. سپس با توجه به معیار بیز-لاپلاس، جدول 1 را با ستونی از انتظارات ریاضی تکمیل می کنیم و حداکثر را از بین این مقادیر انتخاب می کنیم. جدول 13 را دریافت می کنیم.

جدول 13.

راه حل بهینه X1 است.

معیار بیز-لاپلاس الزامات زیر را در موقعیتی که در آن تصمیم گرفته می شود تحمیل می کند:

  • v احتمال وقوع حالات Bj مشخص است و به زمان بستگی ندارد.
  • v راه حل (به لحاظ نظری) بی نهایت بارها اجرا می شود.
  • v برای تعداد کمی از پیاده سازی راه حل، مقداری ریسک قابل قبول است.

با تعداد کافی پیاده سازی، مقدار متوسط ​​به تدریج تثبیت می شود. بنابراین با اجرای کامل (بی نهایت) هرگونه ریسک از بین می رود.

موقعیت اولیه کاربر - معیار نسبت به معیار Wald خوش بینانه تر است، با این حال، بیشتر فرض می کند سطح بالاآگاهی و اجرای به اندازه کافی طولانی.

معیارهای ذکر شده تنوع معیارهای انتخاب راه حل را در شرایط عدم قطعیت، به ویژه معیارهای انتخاب بهترین استراتژی های ترکیبی را تمام نمی کند، با این حال، این کافی است تا مشکل انتخاب راه حل مبهم شود:

جدول 14. گزینه های بهینه به دست آمده با استفاده از معیارهای مختلف

از جدول 14 مشخص است که انتخاب راه حل بهینه به معیار انتخاب شده (و در نهایت، به مفروضات) بستگی دارد.

انتخاب معیار (و همچنین انتخاب اصل بهینگی) دشوارترین و مهم ترین کار در تئوری تصمیم گیری است. با این حال، یک موقعیت خاص هرگز آنقدر نامطمئن نیست که به دست آوردن حداقل اطلاعات جزئی در مورد توزیع احتمال حالت های طبیعت غیرممکن باشد. در این حالت پس از تخمین توزیع احتمال حالت های طبیعت، از روش بیز-لاپلاس استفاده می شود و یا آزمایشی برای روشن شدن رفتار طبیعت انجام می شود.

از آنجایی که معیارهای مختلف با شرایط متفاوتی که در آن تصمیم گرفته می شود همراه است، بهترین راه برای مقایسه توصیه های معیارهای خاص، به دست آوردن اطلاعات اضافی در مورد خود موقعیت است. به طور خاص، اگر تصمیم گرفته شده مربوط به صدها ماشین با پارامترهای یکسان باشد، توصیه می شود از معیار Bayes-Laplace استفاده شود. اگر تعداد ماشین ها زیاد نیست، بهتر است از معیارهای مینی مکس یا ساویج استفاده کنید.

نمونه هایی از فرمول های حل مسئله

در این بخش با استفاده از مثال حل مسائل باید یاد بگیریم که بردار استراتژی ها، بردار حالت ها و ماتریس پرداخت را تعیین کنیم و معیارهای مختلفی را برای به دست آوردن جواب بهینه اعمال کنیم.

وظیفه. تصمیم گرفته شد که یک باشگاه قایق بادبانی در شهر ساحلی افتتاح شود. اگر تعداد تخمینی اعضای باشگاه بین 10 تا 25 نفر باشد، چند قایق تفریحی باید خریداری شود (بر اساس: یک قایق برای 5 نفر). هزینه اشتراک سالانه 100 واحد ارزی است. قیمت قایق بادبانی 170 واحد پولی است. اجاره محل و نگهداری قایق های تفریحی 730 واحد پولی در سال هزینه دارد.

راه حل. بدون شک، منطقی است که تعداد قایق‌های تفریحی را در بازه دو تا پنج (4 گزینه) و تعداد قایق‌بازان احتمالی از 10 تا 25 در نظر بگیریم. برای کاهش حجم شمارش، خود را به گزینه 10 محدود می‌کنیم. ، 15، 20، 25 (اگر نتایج به دست آمده برای گزینه های مرتبط به طور قابل توجهی متفاوت باشد، ما یک محاسبه اضافی و روشن کننده انجام خواهیم داد). بنابراین: X= (Xi) = (2، 3، 4، 5) - تعداد قایق های تفریحی (i=1،2،3،4)؛ B = (Bj) = (10، 15، 20، 25) - تعداد اعضای باشگاه قایق بادبانی (j=1،2،3،4).

برای شروع جستجوی راه حل، یک ماتریس تصمیم می سازیم که عناصر آن سود را هنگام تصمیم گیری iام با j-امین تعداد اعضای باشگاه قایق بادبانی نشان می دهد:

aij = 100 دقیقه (5Xi ؛ Bj) - 170Xi - 730

آن ها قاعده تعیین کنندهدر مسئله ما به عنوان "درآمد - هزینه" فرموله شده است.

پس از انجام محاسبات ساده، اجازه دهید ماتریس تصمیم (aij) را پر کنیم (جدول 15 را ببینید):

راه حل ماتریس بازی تئوری

جدول 15. ماتریس پرداخت

به عنوان مثال، a11 = 100min(52,10) - 1702-730 =-70

a12=100 دقیقه (52، 15)-1702-730=-70

a13 = a14 = -70 (تقاضا برای قایق‌های تفریحی برآورده نمی‌شود). مقادیر منفی نشان می دهد که با این نسبت های تقاضا برای قایق های تفریحی و در دسترس بودن آنها، باشگاه قایق بادبانی متحمل ضرر می شود.

معیار والد (انتخاب یک استراتژی محتاطانه و بدبینانه) - برای هر جایگزین (تعداد قایق های تفریحی در باشگاه) بدترین وضعیت انتخاب می شود ( کوچکترین ارزشمقدار سود) و در میان آنها حداکثر اثر تضمین شده یافت می شود:

ZMM=max(-70; -240; -410; -580)=-70

نتیجه گیری: هنگام تصمیم گیری با معیار والد، باشگاه قایق بادبانی باید 2 قایق تفریحی خریداری کند و حداکثر ضرر مورد انتظار از CU 70 تجاوز نکند.

معیار هورویتز (یک راه حل سازش بین بدترین نتیجه و یک راه حل بیش از حد خوش بینانه). اجازه دهید تغییر در راه حل مشکل خود را بسته به مقادیر ضریب خوش بینی در نظر بگیریم (در جدول 16 مقادیری که معیار Hurwitz را برآورده می کنند برای موارد مختلف برجسته شده اند):

جدول 16. راه حل های هورویتز برای انواع مختلف

نتیجه گیری: در 0.5 باید 5 قایق تفریحی بخرید و انتظار سودی در حدود 170 روبل داشته باشید. (ما به محبوبیت گسترده باشگاه خود و توانایی مالی معین آماتورها امیدواریم)، ​​در = 0.2 نباید بیش از 2 قایق تفریحی خریداری کنیم (ما در پیش بینی های خود محتاط تر هستیم و به احتمال زیاد ترجیح می دهیم از ایجاد یک قایق تفریحی خودداری کنیم. باشگاه).

معیار وحشی (یافتن حداقل ریسک). هنگام انتخاب راه حل بر اساس این معیار، ماتریس ابزار ابتدا با ماتریس پشیمانی D مقایسه می شود - برای مثال ما با کم کردن (70-) از ستون اول ماتریس ابزار، 260 از ستون دوم، 590 و 920 از ستون های سوم و چهارم، به ترتیب، ماتریس ریسک را به دست می آوریم (نگاه کنید به جدول 17):

جدول 17. ماتریس ریسک

کوچکترین مقدار در بین حداکثر عناصر ردیف (مقادیر برجسته شده در جدول) برابر است با:

ZS=min(990; 660; 340; 510)=340

نتیجه گیری: با خرید 4 قایق تفریحی برای باشگاه قایق بادبانی که افتتاح می کنیم، مطمئن هستیم که در بدترین حالت، ضرر باشگاه از 340 CU بیشتر نخواهد شد.

معیار تصمیم گیری بیز-لاپلاس. اجازه دهید فرض کنیم که داده های آماری وجود دارد که به ما امکان می دهد احتمال تقاضای خاصی برای عضویت در یک باشگاه قایق بادبانی را تخمین بزنیم: q=(0.1؛ 0.2؛ 0.4؛ 0.3). سپس انتظارات ریاضی ارزش سود برای هر یک از گزینه های راه حل در نظر گرفته شده (تامین قایق در باشگاه قایق بادبانی):

a1r = (-700.1)+(-700.2)+(-700.4)+(-700.3) =-70،

a2r= (-2400.1)+(2600.2)+(2600.4)+(2600.3) =210;

a3r = 390; a4r = 370.

نتیجه گیری: در شرایط مورد نظر، خرید 4 قایق تفریحی توصیه می شود (در این صورت حداکثر سود مورد انتظار باشگاه قایق بادبانی 390 واحد پولی خواهد بود).

برای اعمال معیار لاپلاس، متوجه می شویم:

a1r = ((-70)+(-70)+(-70)+(-70)) / 4 = -70 ;

a2r = ((-240)+(260)+(260)+(260)) / 4 =135;

a3r = 215; a4r = 170.

نتیجه گیری: در شرایط برابر احتمال وقوع یک یا آن تقاضا برای عضویت در یک باشگاه قایق بادبانی، باید 4 قایق تفریحی خریداری کنید و در عین حال می توانید روی سود 215 CU حساب کنید.

نتیجه گیری کلی معیارهای در نظر گرفته شده منجر به تصمیم گیری های مختلفی می شود و در نتیجه منبعی برای تفکر فراهم می کند. تصمیم گیریدر اینجا به طور قابل توجهی به روانشناسی و شهود موضوع تصمیم بستگی دارد). این تعجب آور نیست، زیرا معیارها بر اساس فرضیه های مختلف است. با ارائه یک یا آن فرضیه در مورد رفتار محیط، ما "عدم قطعیت" را حذف می کنیم، اما خود این فرضیه فقط یک فرض است، نه دانش. عجیب است اگر فرضیات مختلف همیشه به یک نتیجه منجر شود.

تصمیم گیری در معرض خطر

همانطور که در بالا ذکر شد، تصمیم گیری در شرایط خطر با این واقعیت مشخص می شود که رفتار طبیعت (محیط) تصادفی است. این در این واقعیت آشکار می شود که اندازه گیری احتمال خاصی وجود دارد که مطابق با آن حالات خاصی از طبیعت بوجود می آیند (روی می شوند). در عین حال، صورت راه حل داده شده دارای اطلاعات خاصی در مورد احتمالات ظاهر حالت های محیط است که می تواند ماهیت بسیار متنوعی داشته باشد. به عنوان مثال، سه حالت محیطی B1، B2 و B3 وجود دارد، سپس اطلاعات اضافی در مورد وقوع این حالت ها ممکن است این باشد که حالت B1 کمترین احتمال را دارد و حالت B3 احتمال بیشتری دارد.

در نتیجه، تصمیم‌گیری در شرایط ریسک، علاوه بر مشخص کردن عملکرد اجرایی، مشخص کردن برخی اطلاعات اضافیدر مورد احتمالات وضعیت محیط. اگر مجموعه حالت های طبیعت B محدود باشد (تعداد حالت ها برابر m است)، می توان اندازه گیری احتمال روی آن را با بردار احتمال q=(q1, q2, …, qm) مشخص کرد که در آن qj?0 و

بنابراین، ماتریس بازده تحت شرایط ریسک را می توان به صورت زیر ارائه کرد (جدول 1 را ببینید).

شرایط محیطی

هنگام انتخاب راه حل Xi، بازیکن می داند که یکی از بازده های a11، ...، a1m را به ترتیب با احتمالات q1، ...، qm دریافت خواهد کرد. در نتیجه، نتیجه برای تصمیم گیرنده هنگام انتخاب راه حل Xi یک متغیر تصادفی است.

بنابراین، مقایسه دو راه حل X1 و X2 به مقایسه متغیرهای تصادفی متناظر آنها ختم می شود.

انتخاب راه حل بهینه معمولاً بر اساس یکی از معیارهای زیر است:

  • 1) معیار بیز-لاپلاس - ارزش مورد انتظار (سود یا هزینه).
  • 2) ترکیبی از ارزش مورد انتظار و واریانس.
  • 3) معیار محصول؛
  • 4) محتمل ترین رویداد در آینده و موارد دیگر.

بیایید نگاهی دقیق تر به معیار بیز-لاپلاس بیندازیم.

آزمون ارزش مورد انتظار (آزمون بیز-لاپلاس)

در آخرین سخنرانی ما به معیار بیز-لاپلاس نگاه کردیم. استفاده از این معیار (نام دیگری در ادبیات یافت می شود - معیار "مقدار متوسط ​​مورد انتظار") به دلیل تمایل به حداکثر کردن سود مورد انتظار (یا به حداقل رساندن هزینه های مورد انتظار) است. استفاده از مقادیر مورد انتظار حاکی از امکان حل مکرر همان مشکل تا زمانی که مقادیر به اندازه کافی دقیق به دست آید. فرمول های محاسبه. از نظر ریاضی، به این صورت است: اجازه دهید o یک متغیر تصادفی با انتظار ریاضی Mo و واریانس Do باشد. اگر x1، x2،...، xn مقادیر هستند متغیر تصادفی(s.v.) اوه، پس میانگین حسابی مقادیر (میانگین نمونه) آنها

واریانس دارد بنابراین، زمانی که n>

به عبارت دیگر، با حجم نمونه به اندازه کافی بزرگ، تفاوت بین میانگین حسابی و انتظارات ریاضی به صفر می‌رسد (به اصطلاح قضیه حدی نظریه احتمال). در نتیجه، استفاده از معیار "مقدار مورد انتظار" تنها در مواردی معتبر است که همان راه حل باید به تعداد کافی بارها اعمال شود. عکس آن نیز صادق است: تمرکز بر انتظارات منجر به نتایج نادرست برای تصمیماتی می شود که باید چند بار گرفته شوند.

قبل از اینکه به اصلاح معیار بیز-لاپلاس بپردازیم، اجازه دهید این معیار را با جزئیات بیشتری در نظر بگیریم.

مشخص است که مشخصه عددی طبیعی یک متغیر تصادفی o انتظار ریاضی آن Mo است که میانگین مقدار این متغیر تصادفی در تعداد زیادی از آزمون ها به آن نزدیک می شود.

اگر فردی که مخالف طبیعت است داده های آماری در مورد الگوهایی در مظاهر خاص طبیعت داشته باشد، آنگاه می توان با استفاده از روش های احتمالی مشکل را به راحتی حل کرد.

بنابراین، اگر احتمالات حالت‌های طبیعت شناخته شده باشند و در طول زمان تغییر نکنند (ایستا)، باید راه‌حلی که سود مورد انتظار را به حداکثر می‌رساند (که بیشترین انتظار ریاضی را در برابر استراتژی شناخته‌شده طبیعت - حالت یا شرایط) ایجاد می‌کند. بهینه در نظر گرفته شود.

مثال. این شرکت دستگاه را به قیمت 100 واحد پولی خریداری کرد. برای تعمیر آن می توانید تجهیزات مخصوص 50 واحدی خریداری کنید. یا به وسایل قدیمی بسنده کنید. اگر دستگاهی خراب شود، تعمیر آن با کمک تجهیزات ویژه 10 واحد هزینه دارد، بدون تجهیزات ویژه - 40 واحد. مشخص است که دستگاه در طول عمر خود بیش از سه بار خراب نمی شود: احتمال شکستن دستگاه 0.3 است. استراحت 1 بار - 0.4؛ 2 بار می شکند - 0.2؛ 3 بار می شکند - 0.1. امکان سنجی خرید تجهیزات تعمیر تخصصی ضروری است.

رسمی سازی. بازیکن اول دو استراتژی خالص دارد: خرید (X1) و عدم خرید (X2) تجهیزات تعمیر تخصصی. طبیعت، بازیکن دوم، چهار حالت دارد: ماشین از کار نمی افتد، یک بار خراب می شود، دو بار می شکند و سه بار می شکند. تابع پرداخت هزینه های شرکت برای خرید و تعمیر ماشین است که توسط ماتریس پرداخت مشخص شده است (جدول 1 را ببینید):

میز 1.

خرابی ماشین

B1، هرگز

X1، خرید نکنید

X2، خرید

راه حل. اجازه دهید ابتدا این مشکل را به عنوان یک بازی متضاد در نظر بگیریم. با استفاده از روش مینیمکس، نقطه زین را در ماتریس پیدا می کنیم: (X2، B4)، بنابراین، قیمت بازی v= - 180 واحد پولی است (جدول 2 را ببینید).

جدول 2.

خرابی ماشین

B1، هرگز

X1، خرید نکنید

X2، خرید

پاسخ: شما نیاز به خرید تجهیزات تخصصی دارید.

با این حال، در بازی با طبیعت، وضعیت به طور اساسی تغییر می کند: شرایط از قبل حاوی یک استراتژی ترکیبی پایدار از طبیعت است: q = (0.3; 0.4; 0.2; 0.1) و می دانیم که این استراتژی است که طبیعت به آن پایبند است.

اگر یک نفر - اولین بازیکن - به بازی بهینه ادامه دهد، سود او M=-150Х0.3-160Ч0.4-170Ч0.2-180Ч0.1=-161 خواهد بود و اگر از اولین استفاده کند، غیربهینه است. استراتژی، سپس انتظارات ریاضی او برد M=-100Х0.3 - 140Х0.4 - 180Х0.2 -220Х0.1 =-144 خواهد بود.

بنابراین، برای اولین بازیکن سودآور است که کمتر از حد مطلوب بازی کند!

جدول 3.

خرابی ماشین

B1، هرگز

X1، خرید نکنید

X2، خرید

پاسخ: تجهیزات تخصصی نخرید.

تفاوت معنادار بین مقادیر v(x*) و v(x") با این واقعیت توضیح داده می شود که استراتژی مختلط طبیعت بهینه نیست و با "انحراف" از استراتژی بهینه خود، "از دست می دهد" 36 واحدهای پولی برنده

بنابراین در بازی با طبیعت جهت گیری به سمت انتظار ریاضی برنده شدن در واقع جهت گیری به سمت میانگین برد است که با تکرار این بازی (با فرض عدم تغییر شرایط بازی) به دست می آید. البته اگر بازی واقعاً بارها تکرار شود، می توان معیار سود متوسط ​​(مثلاً در مشکلات اقتصادی - سود متوسط) را موجه دانست. با این حال، آیا معقول است که در یک آزمون روی این معیار تمرکز کنیم؟

مثال زیر را در نظر بگیرید. شرکت I می تواند یکی از کالاهای TI1 یا TI2 را برای فروش بگذارد و شرکت II می تواند یکی از کالاهای TII1، TII2، TII3 را ارائه دهد. کالاهای TI1 و TII1 رقابتی هستند (به عنوان مثال، آبجو و لیموناد)، و کالاهای TI1 و TII3 مکمل یکدیگر هستند (به عنوان مثال، آبجو و سوسک). سایر محصولات خنثی هستند. سود شرکت I به ترکیب کالاهای عرضه شده برای فروش توسط هر دو شرکت بستگی دارد و توسط جدول 4 تعیین می شود. مشخص است که شرکت II محصول TII3 را سه برابر کمتر از TII1 و چهار برابر کمتر از TII2 برای فروش قرار می دهد. . کدام محصول باید به شرکت I فروخته شود؟

جدول 4

شرایط محیطی

در اینجا تصمیم برای فروش توسط شرکت I محصول TI1، تصمیم X2 برای فروش توسط شرکت I محصول TI2 است.

بیایید انتظارات ریاضی را برای این جدول محاسبه کنیم:

M=8H3/8+18H4/8+40H1/8=17، M=18H3/8+15H4/8+14H1/8=16.

استراتژی بهینه راه حل X1 خواهد بود، یعنی. شرکت I کالاها را به TI1 عرضه می کند. البته، پرداخت 17 واحد پولی بهتر از 16 است. با این حال، هنگام انتخاب راه حل X1، ما نه 17 واحد پولی، بلکه یکی از برنده ها دریافت خواهیم کرد: 8، 18 یا 40. هنگام انتخاب راه حل X2، ما دریافت نمی کنیم. 16 واحد پولی، اما یکی از بردها 18، 15 یا 14 است. بیایید جدولی تهیه کنیم که انحراف برنده های احتمالی از مقادیر مورد انتظار آنها و احتمال این انحرافات را نشان می دهد.

جدول 5. مقادیر انحراف

از این جدول می توان دریافت که با بردهای مورد انتظار برابر، انحراف از بردهای مورد انتظار متفاوت است: برای X1 این انحرافات قابل توجه و برای X2 نسبتاً کوچک هستند.

از تجزیه و تحلیل می توان نتیجه گرفت: در شرایط ریسک، معیار بیز-لاپلاس (میانگین سود مورد انتظار) کافی نیست و باید با در نظر گرفتن تغییر کند. انحرافات احتمالیمتغیر تصادفی از مقدار متوسط ​​آن.

در تئوری احتمال، واریانس Do یا انحراف استاندارد y= معمولاً به عنوان معیاری برای انحراف یک متغیر تصادفی از مقدار میانگین آن استفاده می‌شود. در مسائل تصمیم گیری تحت شرایط ریسک، انحراف معیار y را به عنوان یک شاخص ریسک در نظر می گیریم y ابعادی مشابه با متغیر تصادفی o دارد، انتظار ریاضی Mo.

بنابراین، برای تصمیم گیری در شرایط ریسک، انتخاب Xi جایگزین منجر به یک متغیر تصادفی oi می شود که می تواند با یک جفت شاخص (Mo، yi) مشخص شود. حال بیایید شروع به ساخت یک معیار مناسب برای مقایسه گزینه ها کنیم. در واقع، در اینجا یک مسئله بهینه‌سازی دو معیاره را دریافت می‌کنیم، که معیارهای جزئی انتظار ریاضی Mo (مقدار این معیار باید حداکثر شود) و انحراف استاندارد y (مقدار این معیار باید به حداقل برسد) است.

بیایید یافتن راه‌حل‌های بهینه پارتو برای این مسئله چند معیاره را در نظر بگیریم. اجازه دهید فرض کنیم که لازم است یک راه حل بهینه از مجموعه ای از راه حل های امکان پذیر انتخاب شود، که هر کدام توسط یک جفت شاخص تعیین می شوند (Moi، уi). با به تصویر کشیدن نقاط با مختصات (Moi، уi) در صفحه مختصات، تصویری از نوع نشان داده شده در شکل به دست می آوریم. 1، یعنی ما فضای برآورد را بدست آوردیم. سمت چپمعانی تصویر (نقاط قرمز). انتظارات ریاضیما مقادیر مثبت و y منفی گرفتیم، زیرا ما باید این معیار (y) را به حداقل برسانیم. برآوردهای بهینه پارتو درست است حد بالاو بر این اساس راه حل های بهینه پارتو X1، X2، X9 و X7.

در این مثال مجموعه راه حل های پارتو بهینه X1، X2، X9، X7 است و انتخاب نهایی راه حل بهینه از این مجموعه انجام می شود. همانطور که در بالا ذکر شد، دو رویکرد وجود دارد: رویکرد اول این است که مجموعه‌ای از راه‌حل‌های بهینه پارتو ساخته می‌شود و از این مجموعه، تصمیم‌گیرنده یک راه‌حل منحصربه‌فرد را بر اساس ملاحظات اضافی غیررسمی انتخاب می‌کند. بیایید رویکرد دوم را بر اساس محدود کردن مجموعه گزینه‌های بهینه پارتو در نظر بگیریم.

  • 1. انتخاب ملاک اصلی و تعیین حدود پایین برای سایر معیارها. اجازه دهید یک کران پایین را با توجه به معیار M اختصاص دهیم و معیار y را به حداقل برسانیم. به عنوان حد پایین معیار M، مقدار M4 را در نظر می گیریم (شکل 1 را ببینید)، سپس راه حل بهینه X2 خواهد بود، بنابراین در بین راه حل هایی که شرط Mi را برآورده می کند؟ M4، کمترین خطر را دارد.
  • 2. بهینه سازی واژگانی شامل ترتیب معیارها بر اساس اهمیت است. مثلاً M مهمترین معیار باشد. از آنجایی که تنها راه حل X7 دارای حداکثر مقدار بر اساس معیار M است، بهینه است. این به وضوح نقطه ضعف روش بهینه سازی واژگانی را نشان می دهد: در نظر گرفتن یک (مهم ترین) معیار. این اشکال با نیاز به معرفی اولویت دقیق معیارها همراه است و می توان با تضعیف "سفتی" اولویت ها برطرف شود. در این مورد از روش امتیازات متوالی (روش تغییر هدف) که در بالا به آن پرداخته شد، استفاده می شود.

به عنوان مثال، در مورد ما، به عنوان یک امتیاز با توجه به معیار M، مقدار D نشان داده شده در شکل. 1. سپس نتیجه انتخاب در مرحله اول گزینه های جایگزین X7، X8، X9 خواهد بود. در بین آنها بهترین با توجه به معیار دوم X9 خواهد بود. بنابراین، با اندکی کاهش الزامات معیار M، ارزیابی معیار y را به طور قابل توجهی بهبود دادیم (به عنوان مثال، کاهش جزئی در سود مورد انتظار منجر به کاهش قابل توجه ریسک شد).


برنج. 1.

بیایید کاربرد یک معیار تعمیم یافته را برای مشکل خود در نظر بگیریم. اجازه دهید به عنوان یک معیار تعمیم یافته تابعی از شکل را در نظر بگیریم:

f(M، y) = M-lChu، (1)

جایی که l مقداری ثابت است. در واقع، معیار (1) یک معیار بهینه افزایشی را برای معیارهای جزئی M, y با ضرایب وزنی 1 و - l نشان می دهد. وقتی n>0 باشد، برآورد یک متغیر تصادفی با استفاده از معیار افزایشی (1) کمتر از مقدار متوسط ​​آن است که برای فرد مراقب، یعنی یک فرد ریسک گریز برعکس، زمانی که ل<0 оценка (1) выше, чем среднее значение, что характеризует человека, склонного к риску. Наконец, при л=0 оценка случайной величины совпадает с её средним значением (т.е. возможные отклонения случайной величины от её среднего значения игнорируются) - это характеризует человека, безразличного к риску.

معنای اصلی معیار افزایشی (1) برای n>0 این است که افزایش در معیار f(M, y) می تواند هم به دلیل افزایش M و هم به دلیل کاهش y رخ دهد. بنابراین، برای یک فرد ریسک گریز، معیار (1) نشان دهنده تمایل به افزایش سود مورد انتظار و کاهش خطر انحراف از آن است. در این مورد، شاخص l نگرش ذهنی تصمیم گیرنده به ریسک را مشخص می کند. بنابراین، l را می توان به عنوان شاخص ذهنی معیار ریسک گریزی (شاخص ذهنی احتیاط) در نظر گرفت.

انتخاب یک نوع محصول برای تولید. این شرکت می تواند محصولاتی از شش نوع زیر تولید کند: چتر (Z)، کاپشن (K)، بارانی (P)، کیف (S)، کفش (T) و (W). رئیس شرکت باید تصمیم بگیرد که کدام یک از این نوع محصولات را در فصل تابستان آینده تولید کند. سود شرکت بستگی به این دارد که چه تابستانی خواهد بود - بارانی، گرم یا متوسط، و با جدول 6 تعیین می شود. کدام گزینه تولید بهینه خواهد بود؟

در صورت عدم وجود اطلاعات اضافی در مورد حالات محیط در شرایط عدم قطعیت، حل آن با پذیرش هرگونه فرضیه در مورد رفتار محیط امکان پذیر است. اگر تصمیم گیرنده اطلاعاتی در مورد احتمالات یک تابستان بارانی، گرم و معتدل داشته باشد، مشکل مشخص شده به یک مشکل تصمیم گیری ریسک تبدیل می شود. در این صورت می توان اطلاعات لازم را از داده های آماری (مشاهدات آب و هوا در یک منطقه معین) به دست آورد. فرض کنید که احتمال یک تابستان بارانی، گرم و معتدل به ترتیب 0.2، 0.5 و 0.3 باشد. سپس با مشکل تصمیم گیری در شرایط ریسک مواجه می شویم، توسط جدول ارائه شده است 7.

جدول 6.

بیایید بازده مورد انتظار مربوط به راه حل های Z، K، P، S، T، W را پیدا کنیم.

MZ=0.2H80+0.5H60+0.3H40=58،

Mk=0.2H70+0.5H40+0.3H80=58،

MP=0.2H70+0.5H50+0.3H60=57،

MS=0.2H50+0.5H50+0.3H70=56،

MT=0.2H75+0.5H50+0.3H50=55،

DoZ=196، DoK=336، DoP=61، DoC=84، DoT=100، DoSh=231.5. انحراف معیارمتغیرهای تصادفی مورد بررسی عبارتند از:

yZ=14.0، yK=18.3، yP=7.8، yS=9.2، yT=10.0، ySh=15.2.

بیایید جدولی از مقادیر معیارهای M و y برای هر جایگزین ایجاد کنیم (جدول 8)

جدول 8

شاخص

اجازه دهید راه حل های مورد بررسی را به صورت نقاطی در صفحه مختصات متغیرهای M و y نشان دهیم و شکل 1 را بدست آوریم. 2 که از آن راه حل های بهینه پارتو عبارتند از Z, P, Sh. انتخاب نهایی جایگزین بهینه باید از این مجموعه انجام شود.

محدود کردن مجموعه پارتو بهینه (به طور ایده آل به یک عنصر) تنها در صورتی انجام می شود که اطلاعات بیشتری در مورد رابطه بین معیارهای M و y وجود داشته باشد. همانطور که در بالا ذکر شد، این کار را می توان با روش معیار اصلی، روش امتیازات متوالی یا با استفاده از معیار واژگانی انجام داد.

بررسی معیارهای تصمیم گیری در شرایط ریسک

معیار کارها

قانون انتخاب در این مورد به صورت زیر تنظیم می شود:

ماتریس تصمیم با یک ستون جدید حاوی محصولات تمام نتایج هر ردیف تکمیل می شود. آن دسته از گزینه‌هایی انتخاب می‌شوند که خطوط آنها حاوی بالاترین ارزش هااین ستون

اعمال این معیار به دلیل شرایط زیر است:

  • · احتمال وقوع حالت Bj ناشناخته است.
  • · ظاهر هر یک از حالات Bj به طور جداگانه باید در نظر گرفته شود.
  • · این معیار همچنین برای تعداد کمی از پیاده سازی راه حل قابل اجرا است.
  • · برخی از خطرات قابل قبول است.

معیار محصول در درجه اول برای مواردی که همه aij مثبت هستند تطبیق داده شده است. اگر شرط مثبت نقض شد، مقداری shift aij+a با مقداری ثابت a> باید انجام شود. نتیجه به طور طبیعی به a بستگی دارد. در عمل اغلب

اگر نمی توان هیچ ثابتی را به عنوان معنی دار تشخیص داد، در این صورت معیار محصول قابل اجرا نیست.

صفحه اصلی قبلی بعدی

تصمیم گیری در شرایط خطر با امکان انجام آزمایش

هنگام تصمیم گیری در شرایط عدم اطمینان (یا در شرایط خطر)، دشواری اساسی انتخاب راه حل به دلیل ناآگاهی تصمیم گیرنده از وضعیت واقعی محیط است. در سخنرانی‌های قبلی، معیارهای متعددی در نظر گرفته شد که هر کدام به روش خود با عدم قطعیت مبارزه می‌کنند: با طرح فرضیه‌ای در مورد رفتار محیط (معیار لاپلاس، والد، هورویتز و ساویج). با میانگین گیری سود حاصل (معیار بیز-لاپلاس یا معیار سود مورد انتظار). با در نظر گرفتن هر دو سود مورد انتظار و اندازه گیری انحراف از آن. با این حال، هر یک از این رویکردها تنها راهی برای تحلیل منطقی عدم قطعیت، بدون حذف خود عدم قطعیت، ارائه می‌کند. حذف یا حداقل کاهش عدم قطعیت تنها بر اساس روشن شدن وضعیت واقعی محیط انجام می شود.

در عمل، چنین شفاف سازی، به عنوان یک قاعده، با جمع آوری اطلاعات اضافی، و همچنین با انجام آزمایش هایی انجام می شود که از نتایج آن برای قضاوت در مورد وضعیت فعلی محیط استفاده می شود. به عنوان مثال، قبل از شروع درمان یک بیمار با تشخیص نامشخص، پزشک انجام می دهد تست های اضافی; قبل از حفاری یک چاه نفت گران قیمت، یک زمین شناس اکتشاف لرزه ای انجام می دهد. قبل از شروع تولید هر محصولی، کارآفرین یک دسته آزمایشی از این محصول و غیره تهیه می کند. در چارچوب تئوری تصمیم گیری، همه این اقدامات چیزی جز انجام یک آزمایش برای روشن شدن وضعیت محیط نیست.

آزمایشی ایده آل نامیده می شود که بر اساس نتایج آن، تصمیم گیرنده وضعیت واقعی محیط را تشخیص دهد. در عمل، داشتن یک آزمایش کامل بسیار نادر است. اغلب، نتیجه یک آزمایش اطلاعاتی را ارائه می دهد که بر اساس آن می توان محیط را روشن کرد.

چگونه می توان از نتایج آزمایش و داده های آماری موجود هنگام تصمیم گیری موثرتر استفاده کرد؟ یکی از روش های حل این مشکل بر اساس فرمول بیز است - فرمولی برای تخمین مجدد احتمالات وقایع با در نظر گرفتن نتایج آزمایش.

توجه داشته باشید که آزمایش برای هر مشکل تصمیم گیری امکان پذیر نیست. اگر آزمایش برای یک کار خاص امکان پذیر باشد، آنگاه وظیفه ارزیابی امکان سنجی اجرای آن مطرح می شود. واقعیت این است که انجام یک آزمایش همیشه مستلزم هزینه (مادی، سازمانی، زمان و غیره) است.

[روزن] نشان می‌دهد که یک آزمایش ایده‌آل سودآور است اگر و تنها در صورتی که هزینه آن کمتر از حداقل ریسک مورد انتظار باشد:

جایی که rij خطرات است، C هزینه آزمایش است.

برای ارائه رویکرد بیزی برای برآورد مجدد احتمالات، اجازه دهید برخی از مفاهیم نظریه احتمال را یادآوری کنیم.

احتمال شرطی رویداد A با توجه به اینکه رویداد B رخ داده است با P(A/B) نشان داده می شود و با فرمول محاسبه می شود.

بیایید طرح احتمالی-نظری زیر را در نظر بگیریم. اجازه دهید B1، B2، …، Bm یک گروه کامل از رویدادها باشند و برای هر رویداد Bj، j= احتمال آن P(Bj) مشخص است. اجازه دهید آزمایشی انجام شود که در نتیجه آن رویداد A رخ داده است. اگر احتمالات شرطی P(A/Bj) برای همه j= مشخص باشد، احتمال شرطی (پس از آزمایش) رویداد Bj (j=، ) را می توان با استفاده از فرمول بیز پیدا کرد

اجازه دهید اکنون به شکل شماتیک مسئله تصمیم گیری در شرایط ریسک را که با استفاده از یک ماتریس بازده مشخص شده است، که دارای جدول فرم است، در نظر بگیریم.

جدول 1. ماتریس پرداخت با بردار احتمالی وضعیت محیط

شرایط محیطی

در اینجا B1، B2، …، Bm حالت‌های محیط هستند، aij در شرایطی که بازیکن استراتژی Xi را انتخاب می‌کند، بازده است و محیط حالت Bj را می‌گیرد. تصمیم گیرنده احتمال P(Bj)= qj وقوع حالت Bj و P(Bj)?0 و را می داند. فرض بر این است که محیط می تواند در یک و تنها یکی از حالت های B1، B2، ...، Bm باشد. به عبارت دیگر، رویدادهای تصادفی B1، B2، ...، Bm یک گروه کامل از رویدادها را تشکیل می دهند، بنابراین می توان آنها را به عنوان فرضیه در نظر گرفت. احتمالات حالت های محیط شناخته شده برای تصمیم گیرنده P(Bj) (j=) احتمالات غیرشرطی (پیش آزمایشی، پیشینی) هستند.

فرض کنید آزمایشی در حال انجام است که نتیجه آن به نحوی به وضعیت موجود محیط بستگی دارد. اگر در نتیجه آزمایش، رویداد A مشاهده شود و علاوه بر این، احتمالات شرطی P(A/Bj) برای همه j= شناخته شود، با استفاده از فرمول بیز، می توان پسآزمایشی (پسین) را پیدا کرد. احتمالات هر حالت از محیط آگاهی از احتمالات تصفیه شده حالت های محیطی به شما امکان می دهد استراتژی تصمیم گیرنده را با دقت بیشتری مشخص کنید.

رویکرد توصیف شده برای تصمیم گیری تحت ریسک، بیزی نامیده می شود، زیرا بر اساس فرمول بیز است. این رویکرد با مثال مورد بحث در زیر نشان داده شده است.

وظیفه. حفر چاه نفت

رئیس گروه جستجو باید تصمیم بگیرد: حفر چاه نفت یا نه. ممکن است چاه "خشک" باشد (C)، به عنوان مثال. بدون روغن، "کم توان" (M)، یعنی. با محتوای روغن کم، و "غنی" (B)، یعنی. با محتوای روغن بالا گزینه های رهبر گروه عبارتند از: x1 - مته و x2 - سوراخ نکنید. سود خالص هنگام انتخاب یکی از گزینه ها، بسته به نوع احتمالی چاه، در جدول سود نشان داده شده است (جدول 1 را ببینید).

جدول 1. ماتریس پرداخت

خوب تایپ کنید

علاوه بر این، رهبر گروه جستجو می داند که در یک منطقه مشخص، احتمال وجود یک چاه خشک، نازک یا غنی به شرح زیر است: P(C)=0.5، P(M)=0.3، P(B)=0.2.

رئیس گروه جستجو می تواند آزمایشی را برای روشن شدن ساختار خاک (وضعیت محیط) انجام دهد. این آزمایش یک بررسی لرزه ای است که نتیجه آن پاسخ خواهد بود - ساختار خاک در یک منطقه مشخص چگونه است (اما نه پاسخ به سؤال در مورد نوع چاه!). در اصل ساختار خاک می تواند باز (O) یا بسته (C) باشد. رهبر گروه جدولی از نتایج آزمایشات ارائه شده در این زمینه دارد (جدول 2 را ببینید).

جدول 2. جدول داده های تجربی

این جدول نشان می‌دهد که چند بار چاه‌های نوع C، M، B در خاک‌های ساختار باز و بسته مواجه شده‌اند (یعنی آمار مشترک خاک و نوع چاه‌ها را برای یک منطقه مشخص ارائه می‌دهد).

اجازه دهید داده های تجربی جدول به دست آمده را تجزیه و تحلیل کنیم. فرض کنید n آزمایش انجام شده است که نتایج آن مقادیر متغیرهای تصادفی گسسته X (نوع چاه) و Y (ساختار خاک) است که مقادیر C، M، B و O را می گیرند. به ترتیب Z. اجازه دهید با n11 تعداد آزمایش‌هایی را که در آن X=C و Y=O، بعد از n12 تعداد آزمایش‌هایی را که در آن X=C و Y=Z، بعد از n21 تعداد آزمایش‌هایی را که در آن X=M نشان می‌دهند، نشان دهیم. و Y=O و غیره در مورد ما n=100، n11=45، n12=5، n21=11. با تقسیم مقادیر جدول 2 بر 100 (بر تعداد آزمایش های انجام شده)، قانون توزیع یک متغیر تصادفی دو بعدی (X, Y) را به دست می آوریم که به صورت جدولی ارائه شده است (جدول 3 را ببینید).

جدول 3. سری های آماریتوزیع r.v دو بعدی (X, Y)

از جدول 3 چنین است که P(X=C)=P(C)=0.5، P(X=M)=P(M)=0.3، P(X=B)=P(B)=0.2; Р(Y=O)=P(O)=0.6، Р(Y=З)=P(З)=0.4،

بنابراین، رهبر گروه باید تصمیم بگیرد:

  • · آیا برای انجام آزمایش (هزینه آن 10 واحد است).
  • · اگر انجام شود، بسته به نتایج آزمایش در آینده چه باید کرد.

بنابراین، یک مشکل تصمیم گیری چند مرحله ای تحت شرایط ریسک به دست آمده است. اجازه دهید روش یافتن راه حل بهینه را شرح دهیم.

مرحله 1. بیایید یک درخت بسازیم (شکل 1)، که تمام مراحل فرآیند تصمیم گیری را نشان می دهد - درخت تصمیم. شاخه های درخت با جایگزین های ممکن مطابقت دارند و راس ها با موقعیت های نوظهور مطابقت دارند. گزینه های جایگزین برای رهبر گروه جستجو عبارتند از: ب - امتناع از آزمایش، ج - انجام آزمایش، x1 - مته، x2 - مته نیست. وضعیت های طبیعت: انتخاب نوع چاه (C، M، B)، و همچنین انتخاب ساختار خاک (O، W).

درخت ساخته شده بازی رهبر گروه با طبیعت را تعیین می کند. موقعیت های این بازی رئوس درخت هستند و حرکات بازیکنان راه حلی است که انتخاب می کنند. موقعیت هایی که رهبر گروه در آن حرکت می کند با یک مستطیل به تصویر کشیده می شود. موقعیت هایی که طبیعت در آنها حرکت می کند دایره ای هستند.

بازی به شرح زیر ادامه دارد. در موقعیت شروع، رهبر گروه حرکت را انجام می دهد. او باید تصمیم بگیرد - آزمایش را رد کند (راه حل b را انتخاب کنید) یا آزمایش را انجام دهید (راه حل c را انتخاب کنید). اگر آزمایش را رها کرد، بازی به موقعیت بعدی می رود که در آن رهبر گروه باید تصمیم بگیرد: حفاری (انتخاب جایگزین x1) یا مته زدن (گزینه جایگزین x2) را انتخاب کند. اگر تصمیم گرفت آزمایشی انجام دهد، بازی به موقعیتی می رود که در آن طبیعت حرکت می کند و یکی از حالت های O یا Z را انتخاب می کند. نتایج احتمالیآزمایش و غیره. بازی زمانی به پایان می رسد که به موقعیت نهایی برسد (یعنی بالای درختی که هیچ شاخه ای از آن خارج نمی شود)

مرحله 2. برای هر تصمیمی که حرکتی از طبیعت است (یعنی از موقعیتی که توسط یک دایره به تصویر کشیده می شود) باید احتمال این حرکت را پیدا کنیم. برای این کار به صورت زیر عمل می کنیم. برای هر موقعیت درخت، یک مسیر واحد وجود دارد که آن موقعیت را به موقعیت شروع متصل می کند. اگر این برای موقعیت طبیعت باشد، مسیری که آن را به موقعیت اولیه متصل می کند، از موقعیت (E) یعنی آزمایش نمی گذرد، پس احتمالات حالت های P(S)، P(M) و P(B) وجود دارد. ) بدون قید و شرط (پیش آزمایشی) هستند و از جدول هستند. 3:

P(S)=50/100، P(M)=30/100، P(B)=20/100.

اگر برای موقعیت طبیعت، مسیری که آن را به موقعیت اولیه متصل می کند از موقعیت (E) بگذرد، احتمالات حالت های محیط به احتمالات شرطی تبدیل می شوند و با استفاده از داده های جدول مطابق فرمول (1) پیدا می شوند. . 3:

در موقعیت (E)، احتمال حرکت های منتهی به موقعیت های (O) و (W) از جدول 3 آمده است: P(O)=0.6، P(Z)=0.4.


برنج. 1.

مرحله 3. بیایید تمام موقعیت های درخت بازی را ارزیابی کنیم، "نزول" از موقعیت های نهایی به موقعیت اولیه. ارزیابی یک موقعیت، برنده های مورد انتظار در این موقعیت است. ما تخمین‌هایی را برای موقعیت‌های نهایی از جدول 2 پیدا می‌کنیم. اکنون روشی را برای یافتن یک تخمین برای موقعیت دلخواه درخت بازی با این فرض نشان می‌دهیم که تخمین‌هایی برای همه موقعیت‌های پس از آن قبلاً پیدا شده است.

برای موقعیت طبیعت، ارزیابی آن نشان دهنده سود مورد انتظار است (شکل 2 را ببینید).

برای موقعیت یک بازیکن، تخمین حداکثر تمام موقعیت های پشت آن است. انگیزه: در موقعیت "خود" بازیکن می تواند هر حرکتی را انجام دهد، بنابراین او حرکتی را انتخاب می کند که به بیشترین برد ممکن منجر شود (شکل 3 را ببینید). در هر موقعیت، بازیکن با یک خط تیره، شاخه درختی را که با حداکثر امتیاز به موقعیت منتهی می‌شود، علامت‌گذاری می‌کند.


بیایید به شکل. 1. دریافتیم که در موقعیت اولیه سود مورد انتظار بدون انجام آزمایش (جایگزین b) 20 واحد است. سود مورد انتظار با آزمایش (جایگزین ج) 28 واحد است. بنابراین راه حل مناسب انجام آزمایش (اکتشاف لرزه ای) است. در ادامه، اگر آزمایش نشان داد که خاک باز است، نباید حفاری انجام شود، اما اگر بسته باشد، باید حفاری انجام شود.

  • 1 - شاخه: =20
  • 2 - شاخه: 0
  • 3 - شاخه:= -30
  • 4 - شاخه: 0
  • 5 - شعبه: =95
  • 6 - شاخه: 0

همانطور که از شرایط مسئله به دست می آید، می توانیم مقدار 95 واحد را با احتمال 0.4 بدست آوریم. بنابراین، برد مورد انتظار 0.4*95=38 واحد خواهد بود. هزینه آزمایش را معادل 10 واحد کم می کنیم.

در نتیجه 28 واحد بدست می آوریم.

درختان تصمیم به صورت سلسله مراتبی ساختار منطقی تصمیم گیری را نشان می دهند و در نتیجه درک مسئله و فرآیند حل آن را تسهیل می کنند. برخلاف ماتریس تصمیم، در اینجا می توانید دوره زمانی فرآیند تصمیم گیری را مشاهده کنید. با این حال، یک درخت تصمیم را نمی توان به طور کلی با یک ماتریس تصمیم ساده نشان داد. فقط مراحل تکی فرآیند را می توان به این شکل نشان داد. تقسیم به مراحل به گونه ای انجام می شود که انتخاب راه حل با یک گره تصمیم خاص شروع می شود، که از آن یک یا چند شاخه سرچشمه می گیرد که گزینه های راه حل را نشان می دهد. به دنبال آن گره های رویداد و در انتها - برگ ها نشان دهنده حالت های نهایی است که مقادیر پارامترهای خروجی مربوطه را نشان می دهد. اگر گره های رویداد دوباره توسط یک گره تصمیم با اقدامات مربوطه دنبال شوند، این و همه شاخه های بعدی به بیشتر مربوط می شود مرحله آخرانتخاب راه حل.. بنابراین، می توانید کل مسیر را از ابتدا تا انتهای درخت تصمیم ردیابی کنید.

درخت تصمیم بین گره های رویداد و گره های تصمیم تمایز قائل می شود. می توان تصور کرد که در گره های رویداد انتخاب مسیر بیشتر تعیین می شود شرایط خارجی(طبیعت، در تئوری بازی توسط حریف)، و در گره های تصمیم گیری توسط تصمیم گیرنده.

اصلاح درختان تصمیم آسان است: در صورت لزوم، می توان آنها را بیشتر توسعه داد، و در مواردی که برخی از شاخه ها عملاً بی معنی هستند، می توان آنها را بر این اساس کاهش داد. گره های تصمیم، اگر با یک عمل مرتبط باشند و با گره های رویداد از هم جدا نشوند، می توانند ترکیب شوند. همین امر برای گره های رویداد نیز صادق است.



جدید در سایت

>

محبوبترین