Додому Гігієна Експертні оцінки мінімаксного методу та методів Байєса – Лапласа та Севіджа. Дивитись сторінки де згадується термін байєсу критерій

Експертні оцінки мінімаксного методу та методів Байєса – Лапласа та Севіджа. Дивитись сторінки де згадується термін байєсу критерій

Завдання. Фірма планує реалізацію своєї продукції ринках, враховуючи можливі варіанти купівельного попиту П j , j=1,4 (низький, середній, високий, дуже високий). На підприємстві розроблено три стратегії збуту товарів A1, A2, A3. Обсяг товарообігу (ден.од.), що залежить від стратегії та купівельного попиту, представлений у таблиці.
П 1П 2П 3П 4
А 130 +N10 20 25 + N/2
А 250 70 - N10 + N/225
А 325 – N/235 40 60 - N/2
де N = 3
Відомі можливі стани попиту, які відповідно q 1 =0,3, q 2 =0,2, q 3 =0,4, q 4 =0,1. Необхідно знайти стратегію збуту, що максимізує середній товарообіг фірми. При цьому використовувати критерії Вальда, Гурвіца, Севіджа, Байєса.

Рішеннязнаходимо за допомогою калькулятора.
Критерій Байєса.
За критерієм Байєса за оптимальні приймається та стратегія (чиста) A i , коли максимізується середній виграш a або мінімізується середній ризик r.
Вважаємо значення ∑(a ij p j)
∑(a 1,j p j) = 33 0.3 + 10 0.2 + 20 0.4 + 26.5 0.1 = 22.55
∑(a 2,j p j) = 50 0.3 + 67 0.2 + 11.5 0.4 + 25 0.1 = 35.5
∑(a 3,j p j) = 23.5 0.3 + 35 0.2 + 40 0.4 + 58.5 0.1 = 35.9

A іП 1П 2П 3П 4∑(a ij p j)
A 1 9.9 2 8 2.65 22.55
A 2 15 13.4 4.6 2.5 35.5
A 3 7.05 7 16 5.85 35.9
p j 0.3 0.2 0.4 0.1

Критерій Лапласа.
Якщо ймовірності станів природи правдоподібні, для їхньої оцінки використовують принцип недостатньої основи Лапласа, згідно з яким усі стани природи вважаються рівноймовірними, тобто:
q 1 = q 2 = ... = q n = 1/n.
q i = 1/4
A іП 1П 2П 3П 4∑(a ij)
A 1 8.25 2.5 5 6.63 22.38
A 2 12.5 16.75 2.88 6.25 38.38
A 3 5.88 8.75 10 14.63 39.25
p j 0.25 0.25 0.25 0.25
Висновок: вибираємо стратегію N = 3.
Критерій Вальда.
За критерієм Вальда за оптимальну приймається чиста стратегія, що у найгірших умовах гарантує максимальний виграш, тобто.
a = max(min a ij)
Критерій Вальда орієнтує статистику на несприятливі стану природи, тобто. цей критерій висловлює песимістичну оцінку ситуації.
A іП 1П 2П 3П 4min(a ij)
A 1 33 10 20 26.5 10
A 2 50 67 11.5 25 11.5
A 3 23.5 35 40 58.5 23.5
Висновок: вибираємо стратегію N = 3.
Критерій Севіджа.
Критерій мінімального ризику Севіджа рекомендує вибирати як оптимальної стратегіїту, коли він величина максимального ризику мінімізується в найгірших умовах, тобто. забезпечується:
a = min(max r ij)
Критерій Севіджа орієнтує статистику найнесприятливіші стану природи, тобто. цей критерій висловлює песимістичну оцінку ситуації.
Знаходимо матрицю ризиків.
Ризик– міра невідповідності між різними можливими результатами ухвалення певних стратегій. Максимальний виграш у j-му стовпчику b j = max(a ij) характеризує сприятливість стану природи.
1. Розраховуємо 1-й стовпець матриці ризиків.
r 11 = 50 - 33 = 17; r 21 = 50 - 50 = 0; r 31 = 50 – 23.5 = 26.5;
2. Розраховуємо 2-й стовпець матриці ризиків.
r 12 = 67 - 10 = 57; r 22 = 67 - 67 = 0; r 32 = 67 - 35 = 32;
3. Розраховуємо 3 стовпець матриці ризиків.
r 13 = 40 - 20 = 20; r 23 = 40 – 11.5 = 28.5; r 33 = 40 - 40 = 0;
4. Розраховуємо 4 стовпець матриці ризиків.
r 14 = 58.5 – 26.5 = 32; r 24 = 58.5 – 25 = 33.5; r 34 = 58.5 – 58.5 = 0;
A іП 1П 2П 3П 4
A 1 17 57 20 32
A 2 0 0 28.5 33.5
A 3 26.5 32 0 0

A іП 1П 2П 3П 4max(a ij)
A 1 17 57 20 32 57
A 2 0 0 28.5 33.5 33.5
A 3 26.5 32 0 0 32
Висновок: вибираємо стратегію N = 3.
Критерій Гурвіца.
Критерій Гурвіца є критерієм песимізму – оптимізму. За (оптимальну приймається та стратегія, на яку виконується співвідношення:
max(s i)
де s i = y min(a ij) + (1-y)max(a ij)
При y = 1 отримаємо критерій Вальде, за y = 0 отримаємо – оптимістичний критерій (максимакс).
Критерій Гурвіца враховує можливість як найгіршої, так і найкращої для людини поведінки природи. Як вибирається y? Чим гірші наслідкипомилкових рішень, тим більше бажання застрахуватися від помилок, тим у ближче до 1.
Розраховуємо s i.
s 1 = 0.5 10+(1-0.5) 33 = 21.5
s 2 = 0.5 11.5 + (1-0.5) 67 = 39.25
s 3 = 0.5 23.5 + (1-0.5) 58.5 = 41
A іП 1П 2П 3П 4min(a ij)max(a ij)y min(a ij) + (1-y)max(a ij)
A 1 33 10 20 26.5 10 33 21.5
A 2 50 67 11.5 25 11.5 67 39.25
A 3 23.5 35 40 58.5 23.5 58.5 41
Висновок: вибираємо стратегію N = 3.
Таким чином, в результаті рішення статистичної гриза різними критеріями найчастіше рекомендувалася стратегія A 3 .

Керівництво компанії приймає рішення щодо розміщення виробництва нового продукту в деякому місці. Щоб сформувати уявлення про ситуацію на ринку нового продукту на момент освоєння виробництва, йому необхідно врахувати витрати на доставку готової продукції до споживача, розвиненість транспортної та соціальної інфраструктури регіону, конкуренцію на ринку, співвідношення попиту та пропозиції, курси валют та багато іншого. Можливі варіантирішень, інвестиційна привабливість яких визначається як відсоток приросту доходу до суми капітальних вкладень, представлені в таблиці.
Вибрати:
1) місце для розміщення виробництва, якщо керівник підприємства упевнений у тому, що на ринку складеться ситуація 4;
2) місце для розміщення виробництва, якщо керівництво оцінює ймовірність ситуації 1 0,2; ситуації 2 - 0,1; ситуації 3 0,25;
3) провести вибір варіанта за умов невизначеності за критерієм: максимакс, максимін, критерій Лапласа, критерій Севеджа, критерій Гурвіца (y = 0,3);
4) чи зміниться найкращий варіантрішення за критерієм Гурвіца якщо величину a збільшити до 0,5?
5) припустивши, що дані таблиці представляють витрати підприємства, визначити вибір, який зробить підприємство при використанні кожного з наступних критеріїв: максимін; максимакс; критерій Гурвіца (? = 0,3); критерій Севеджа; критерій Лапласа

Передбачалося, що родовища розташовані рівномірно по всій території. Такий підхід навряд можна вважати правомірним, оскільки висновки, отримані з його допомогою, немає під собою логічної основи. Втім, критерій Байєса - Лапласа не є довільнішим за критерій Гурвіца.


Оптимістичний підхід, підходи на основі критерію Гурвіца, критерію Байєса - Лапласа та критерію Севіджа мають даному випадкунаступний вигляд

Байєса (Лапласа) критерій 27, 224 Байєсовський підхід 27 Баланс 27 Балансуюча (або рівноважна)

Серед цих критеріїв та правил особливе місце посідають правила та критерії, засновані на відомій теоремі Байєса. Підхід, заснований на цій теоремі, дозволяє, по-перше, використовувати деякі методологічні принципи природничих наук в управлінні, а по-друге, забезпечити коригування суджень та прийняття рішень у міру накопичення досвіду. Останнє означає навчання управлінню (у сенсі прийняття рішень) у процесі управління 1.

Іноді під час операції невизначеність розкривається поступово, у міру надходження інформації. У цьому випадку для обґрунтування рішень зручно використовувати такий об'єктивний критерій як апостеріорна ймовірність події. Саму цю можливість найпростіше обчислювати з використанням формули Байєса в термінах шансів. Розглянемо суть цього підходу.

Критерій Байєса застосовується у тих випадках, коли відомий розподіл ймовірностей можливих станів. Якщо цей дискретний розподіл ймовірностей задано набором ймовірностей, то за критерієм Байєса стратегія Si переважніше Sj (s > якщо

Окремими випадками цього критерію є критерій Байєса (при А = 1) та критерій Вальда (при А = 0).

Критерій Байєса-Лапласа, на відміну від критерію Вальда, враховує кожне з можливих наслідків усіх варіантів рішень.

Критерій Байєса-Лапласа пред'являє до ситуації, в якій приймається рішення, такі вимоги

При z = 1 критерій перетворюється на критерій Байєса-Лапласа, а при z = Про перетворюється на критерій Вальда. Таким чином, вибір параметра z схильний до впливу суб'єктивізму. Крім того, поза увагою залишається і кількість реалізацій. Тому цей критерій рідко застосовується під час прийняття технічних рішень.

Ми розглянули кілька основних підходів до прийняття рішення у разі невизначених факторів у моделі, що вивчається. Можна навести приклади, коли всі критерії прийняття рішення призводять до вибору одного і того ж рішення x e X, зазвичай цього не відбувається, кожен критерій призводить до свого рішення (приклад такого роду розглянутий в наступному розділі). Тому виникають дискусії про те, який критерій і коли краще. робляться спроби побудувати на основі кількох критеріїв єдиний. Зокрема, критерій Гурвіца є таким об'єднанням двох критеріїв. Були також спроби об'єднати критерій Гурвпца та критерій Байєса – Лапласа. Усі одержувані критерії мають високий рівень довільності. На нашу думку, єдиним шляхом подолання цих труднощів є багатокритеріальний підхід, у якому ЛПР змогло б розглянути варіанти прийнятого рішення, ефективні з погляду сукупності показників, і вибрати серед них найбільш підходящий. Такий підхід використаний у прикладі, наведеному у наступному розділі. Звичайно, сукупність показників при цьому має бути не надто великою.

Зазвичай випробувається кілька конфігурацій з різним числомелементів та структурою з'єднань. Одними з найбільш важливих показниківє обсяг навчальної множини та забезпечення здатності до узагальнення при подальшій роботі, і потрібного результату можна досягти на різних схемах. Найчастіше використовуються процедури послідовного спуску (з підтвердженням безліччю) або N-кратного перехресного підтвердження. Можуть бути застосовані і більш потужні інформаційні критерії (1) узагальнене перехресне підтвердження (G V), підсумкова помилка передбачення Акаїки (FPE), критерії Байєса (BI) та Акаїки (AI) (див. ). Для того, щоб покращити здатність до узагальнення та усунути небезпеку перенавчання, застосовуються також зменшення ваг та їх виключення (проріджування дерева). При цьому змінюється архітектура мережі, видаляються деякі зв'язки і вивчається, який вплив вони надавали на ефективність. >,

БАЙЕСА (ЛАПЛАСА) КРИТЕРІЙ - в теорії рішень критерій прийняття рішень в умовах відсутності будь-якої інформації про відносні ймовірності стратегій "природи". (Див. Невизначені завдання.) За Б. (Л.) до. пропонується надати рівні ймовірності всім стратегіям, що розглядаються, після чого прийняти ту з них, при якій очікуваний виграш виявиться найбільшим. Має той недолік, що коло оцінюваних альтернатив в одній і тій же задачі може бути різним і відповідно різною може бути відносна ймовірність кожної з них.

Критерій Ходжеса – Лемана. При реалізації цього критерію використовуються два суб'єктивні показники, по-перше, розподіл ймовірностей, що використовується в критерії Байєса, по-друге, "параметр оптимізму" з критерію Гурвіца.

Критерій Ходжа-Лемана базується одночасно на критеріях Вальда та Байєса-Лапласа

При пошуку оптимальних рішень зазвичай використовують різні критерії, що дають деяку схему ухвалення рішень. Розглянемо деякі з них.

Критерій Байєса. При використанні критерію Байєса статистику відомі ймовірності q k настання події П к. Зазвичай ймовірності q k визначаються шляхом проведення експериментів. Такі ймовірності називаються апостеріорними. Як оптимальна за критерієм Байєса приймається чиста стратегія A і, коли середній виграш статистика , стає максимальним.

Критерій Лапласа. Критерій Лапласа відрізняється від критерію Байєса тим, що апостеріорні ймовірності невідомі. Тоді їх приймають рівними та розраховують за формулою

Критерій Севіджа. Цей критерій є критерієм останнього песимізму, тобто. статистик виходить із припущення, що природа діє проти нього найгіршим чином. Критерій Севіджа рекомендує вибирати як оптимальну ту чисту стратегію A i , при якій максимальний ризик є мінімальним. Такий ризик називається мінімаксом і розраховується за формулою

Критерій Вальд. Як і критерій Севіджа, критерій Вальда є критерієм крайнього песимізму. Тому статистик вибирає таку чисту стратегію А, за якої найменший виграш буде максимальним. Цей виграш називається максиміном і обчислюється за формулою

Критерій Гурвіца. Цей критерій є критерієм песимізму-оптимізму та рекомендує застосовувати щось середнє. І тут статистик вибирає таку чисту стратегію А i , котрій справедливо умова:

де γ=0÷1 вибирається із суб'єктивних міркувань. При γ = 1 Критерій Гурвіца перетворюється на критерій Вальда.

Приклад 4.6. Створюється ательє для ремонту телевізорів стаціонарних умов. Для простоти приймаємо, що потік заявок на ремонт виражається числами 2, 4, 6 та 8 тис. заявок на рік. З досвіду відомо, що прибуток від ремонту одного телевізора становить 9 грош. од. на рік. Втрати, спричинені відмовою у ремонті через брак потужностей, - 5 ден. од. Збитки від простою фахівців та обладнання за відсутності заявок – 6 ден. од. за кожну заявку.



Дати інформацію про потужність створюваного ательє, використовуючи наведені критерії.

Рішення. Як гравець А тут виступає орган, що приймає рішення про потужність ательє, що створюється. Його чистими стратегіями є:

■ А 1 – відкриття ательє потужністю 2 тис. телевізорів на рік;

§ A 2 – відкриття ательє потужністю 4 тис. телевізорів на рік;

■ A 3 – відкриття ательє потужністю 6 тис. телевізорів на рік;

■ A 4 – відкриття ательє потужністю 8 тис. телевізорів на рік.

Другим гравцем виступає сукупність всіх причин, у яких формується потік заявок на ремонт телевізорів за умов ательє, тобто. природа П. Природа може реалізувати будь-який із чотирьох станів:

П 1- Потік складе 2 тис. телевізорів на рік;

■ П г - потік становитиме 4 тис. телевізорів на рік;

П 3- Потік складе 6 тис. телевізорів на рік;

§ П 4- Потік становитиме 8 тис. телевізорів на рік.

Обчислимо виграші a ik гравця А за будь-яких поєднань обставин ( A i , П k). Найбільш сприятливими будуть ситуації, коли кількість заявок, що надійшли, збігається з можливостями ательє.

Для комбінації ( A 1 , П 1) прибуток складе а 11 = 2 * 9 = 18 тис. ден. од., для комбінації ( A 2 , П 2) маємо а 22 = 4 * 9 = 36 тис. ден. од. і т.д.

Для випадку ( A 1 , П 2) в ательє можна відремонтувати 2 тис. телевізорів, а заявок надійшло 4 тис. Втрати у своїй становитимуть 2*5=10 тис. ден. од., а загальний прибуток а п = 2 * 9-2 * 5 = 8 тис. ден. од.

Для випадку ( A i , П k) в ательє можна відремонтувати 4 тис. телевізорів, а заявок надійшло 2 тис. Втрати при цьому становитимуть 2*6 = 12 тис. ден. од., а загальний прибуток а 21 = 18-12 = 6 тис. ден. од. Аналогічно є інші елементи платіжної матриці. Результати розрахунків представлені у табл. 4.13.

З табл. 4.13 слід, що нижня чиста ціна гри

а верхня чиста ціна гри

Оскільки α ≠ β, то гра не містить сідлової точки. Домінуючих стратегій статистика немає.____________

Критерій Байєса. Нехай відомі ймовірності q k стану природи П к. табл. 4.13 ці ймовірності позначені як . За формулою (4.23) знаходимо значення середніх виграшів. Ці значення наведено у сьомому стовпці табл. 4.13. Як оптимальну за критерієм Байєса приймається чиста стратегія А 3 (відкрити ательє на 6 тис. ремонтів на рік), за якої середній виграш статистика .

Таблиця 4.13

П 1(2) П 2(4) П 3(6) П 4(8) α i 0,8α i δ i 0,2δ i h i
A 1 (2) -2 -12 -12 3,5 -9,6 3,6 -6
A 2 (4) 23,5 4,8 7,2
A 3 (6) -6 -6 29,5 -4,8 10,8
A 4 (8) -18 -18 25,5 -14,4 14,4
β i
0,2 0,35 0,25 0,2
0,25 0,25 0,25 0,25

Тут використані такі позначення:

Критерій Лапласа. За цим критерієм ймовірності приймаються рівними та розраховують за формулою

Як оптимальна за критерієм Лапласа також приймається чиста стратегія А 3 , за якої середній виграш статистика

Критерій Севіджа. Для аналізу гри за цим методом збудуємо матрицю ризиків. Для розрахунків використовуються формули (4.21), (4.22). Результати розрахунків представлені у табл. 4.14.

Як випливає з табл. 4.14, мінімальний з усіх максимальних ризиків дорівнює . Цей ризик відповідає чистій стратегії А3 (відкрити ательє на 6 тис. ремонтів на рік).

Таблиця 4.14

П 1 П 2 П 3 П 4 max r ik
A 1
A 2
A 3
A 4

Критерій Вальд. З табл. 4.13 видно, що нижня чиста ціна гри . Ця ціна відповідає чистій стратегії А (відкрити ательє на 4 тис. ремонтів на рік).

Критерій Гурвіца. Покладемо γ = 0,8. Розраховуємо за формулою δ i= max a ik (див. стовпець 10 табл. 4.13). Потім, використовуючи дані стовпців 6 та 10 табл. 4.13 проводимо розрахунок за формулою .

Результат представлений у стовпці 12 табл. 4.13. Значення та відповідає стратегії A 2(Відкрити ательє на 4 тис. ремонтів на рік).

Критерій Лапласа

У ряді випадків є правдоподібним наступне міркування: оскільки невідомі майбутні стани природи, остільки можна вважати їх рівноймовірними. Цей підхід до рішення використовується в критерії "недостатньої підстави" Лапласа.

Для розв'язання задачі для кожного рішення підраховується математичне очікування виграшу (імовірності станів природи вважаються рівними qj = 1/n, j = 1:n), і вибирається рішення, при якому величина цього виграшу максимальна.

Гіпотеза про рівноймовірність станів природи є досить штучною, тому принцип Лапласа можна користуватися лише в обмежених випадках. У більш загальному випадкуСлід вважати, що стану природи не рівноймовірні і використовуватиме вирішення умов Байєса-Лапласа.

Критерій Байєса-Лапласа

Цей критерій відступає від умов повної невизначеності - він припускає, що можливим станам природи можна приписати певну ймовірність їхнього наступу і, визначивши математичне очікування виграшу для кожного рішення, вибрати те, що забезпечує найбільше значення виграшу:

Цей метод передбачає можливість використання будь-якої попередньої інформації про стан природи. У цьому передбачається як повторюваність станів природи, і повторюваність рішень, і, насамперед, наявність досить достовірних даних про минулих станах природи. Тобто, ґрунтуючись на попередніх спостереженнях, прогнозувати майбутній стан природи (статистичний принцип).

Повертаючись до таблиці 1 припустимо, що q1=0.4, q2=0.2 і q3=0.4. Тоді, згідно з критерієм Байєса-Лапласа, таблицю 1 доповнюємо стовпцем математичних очікувань і серед цих значень вибираємо максимальне. Отримаємо таблицю 13.

Таблиця 13

Оптимальним є рішення X1.

Критерій Байєса-Лапласа пред'являє до ситуації, в якій приймається рішення, такі вимоги:

  • v ймовірності появи станів Вj відомі і залежить від часу;
  • v рішення реалізується (теоретично) нескінченно багато разів;
  • v для небагатьох реалізацій рішення допускається певний ризик.

При досить велику кількість реалізацій середнє значення поступово стабілізується. Тому за повної (нескінченної) реалізації будь-який ризик виключено.

Вихідна позиція застосовуючого - критерій оптимістичніший, ніж у разі критерію Вальда, проте вона передбачає більш високий рівеньпоінформованості та досить довгі реалізації.

Перелічені критерії не вичерпують всього різноманіття критеріїв вибору рішення в умовах невизначеності, зокрема, критеріїв вибору найкращих змішаних стратегій, однак цього достатньо, щоб проблема вибору рішення стала неоднозначною:

Таблиця 14. Оптимальні варіанти, отримані за допомогою різних критеріїв

З таблиці 14 видно, що з обраного критерію (а, зрештою - від припущень) залежить вибір оптимального рішення.

Вибір критерію (як і вибір принципу оптимальності) є найважчим і найвідповідальнішим завданням у теорії прийняття рішень. Однак конкретна ситуація ніколи не буває настільки невизначеною, щоб не можна було отримати хоча б часткової інформації щодо ймовірнісного розподілу станів природи. У цьому випадку, оцінивши розподіл ймовірностей станів природи, застосовують метод Байєса-Лапласа або проводять експеримент, що дозволяє уточнити поведінку природи.

Оскільки різні критерії пов'язані з різними умовами, в яких приймається рішення, найкраще для порівняльної оцінки рекомендації тих чи інших критеріїв отримати додаткову інформацію про ситуацію. Зокрема, якщо прийняте рішення стосується сотень машин з однаковими параметрами, то рекомендується застосовувати критерій Байєса-Лапласа. Якщо ж число машин не велике, краще скористатися критеріями мінімакса або Севіджа.

Приклади постановки розв'язання задач

У цьому параграфі на прикладі розв'язання задач ми повинні навчитися визначати вектор стратегій, вектор станів та платіжну матрицю та застосовувати різні критерії для отримання оптимального рішення.

Завдання. У приморському місті вирішено відкрити яхт-клуб. Скільки слід закупити яхт (з розрахунку: одна яхта на 5 осіб), якщо передбачувана кількість членів клубу коливається від 10 до 25 осіб. Річний абонемент коштує 100 грошових одиниць. Ціна яхти – 170 грошових одиниць. Оренда приміщення та зберігання яхт обходиться у 730 грошових одиниць на рік.

Рішення. Безсумнівно, що має сенс розглядати кількість яхт, що купуються в діапазоні від двох до п'яти (4 варіанти) і кількість потенційних яхтсменів від 10 до 25. Для зменшення обсягу перебору обмежимося варіантами 10, 15, 20, 25 (якщо отримані висновки для суміжних варіантів будуть істотно відрізнятись, проведемо додатковий, уточнюючий розрахунок). Отже: X = (Xi) = (2, 3, 4, 5) - кількість яхт (i = 1,2,3,4); B = (Bj) = (10, 15, 20, 25) - кількість членів яхт-клубу (j = 1,2,3,4).

Для того, щоб почати пошук рішення, побудуємо матрицю рішень, елементи якої показують прибуток при прийнятті i-го рішення при j-й кількості членів яхт-клубу:

aij = 100min(5Xi ; Bj) - 170Xi - 730

тобто. вирішальне правилоу нашій задачі формулюється як "дохід – витрати".

Виконавши нескладні розрахунки, заповнимо матрицю рішень (aij) (див. табл. 15):

теорія гра матричний рішення

Таблиця 15. Платіжна матриця

Наприклад, a11 = 100min(52, 10) - 1702-730 =-70

a12=100min(52, 15)-1702-730=-70

a13 = a14 = -70 (попит на яхти залишиться незадоволеним). Негативні значення показують, що за цих співвідношеннях попиту яхти та його наявності яхт-клуб зазнає збитків.

Критерій Вальда (вибір обережної, песимістичної стратегії) - для кожної альтернативи (кількість яхт у клубі) вибирається найгірша ситуація ( найменше значеннявеличини прибутку) і серед них знаходиться гарантований максимальний ефект:

ZMM=max(-70; -240; -410; -580)=-70

Висновок: приймаючи рішення за критерієм Вальда, яхт-клуб слід закупити 2 яхти і максимум очікуваного збитку не перевищить 70 д.е.

Критерій Гурвіца (компромісне рішення між найгіршим результатом і надмірно оптимістичним). Розглянемо зміну розв'язання нашого завдання залежно від значень коефіцієнта оптимізму (у таблиці 16 виділено значення, що задовольняють критерію Гурвіца за різних):

Таблиця 16. Рішення щодо Гурвіца для різних

Висновок: при 0,5 слід закупити 5 яхт і чекати на прибуток порядку, не меншу 170 д.е. (Сподіваємося на широку популярність нашого клубу та певну фінансову спроможність любителів), при = 0,2 не слід закуповувати більше 2 яхт (ми більш обережні у своїх прогнозах і, швидше за все, віддамо перевагу відмовитися від створення клубу).

Критерій Севіджа (знаходження мінімального ризику). При виборі рішення за цим критерієм спочатку матриці корисності зіставляється матриця жаль D - для нашого прикладу, відніманням (-70) з першого стовпця матриці корисності, 260 з другого стовпця, 590 і 920 з третього і четвертого стовпців відповідно, отримаємо матрицю ризиків (див. Таблиця 17):

Таблиця 17. Матриця ризиків

Найменше значення серед максимальних елементів рядків (виділені в таблиці значення) дорівнює:

ZS=min(990; 660; 340; 510)=340

Висновок: купуючи 4 яхти для яхт-клубу, що відкривається, ми впевнені, що в гіршому випадку збитки клубу не перевищать 340 д.е.

Критерій ухвалення рішення Байєса-Лапласа. Припустимо, що є статистичні дані, що дозволяють оцінити можливість того чи іншого попиту на членство в яхт-клубі: q=(0,1; 0,2; 0,4; 0,3). Тоді математичне очікування величини прибутку для кожного з розглянутих варіантів рішення (пропозиція яхт у яхт-клубі):

a1r = (-700,1)+(-700,2)+(-700,4)+(-700,3) =-70 ,

a2r = (-2400,1) + (2600,2) + (2600,4) + (2600,3) = 210;

a3r = 390; a4r = 370.

Висновок: в умовах цієї ситуації найбільш доцільно закупити 4 яхти (у цьому випадку максимальний очікуваний прибуток яхт-клубу складе 390 грошових одиниць).

Для застосування критерію Лапласа знаходимо:

a1r = ((-70) + (-70) + (-70) + (-70)) / 4 = -70;

a2r = ((-240) + (260) + (260) + (260)) / 4 = 135;

a3r = 215; a4r = 170.

Висновок: в умовах рівноймовірності виникнення тієї чи іншої величини попиту на членство в яхт-клубі слід закупити 4 яхти і при цьому можна розраховувати на прибуток у розмірі 215 д.о.

Загальний висновок. Розглянуті критерії призводять до різних рішень і дають цим інформацію до роздумів ( прийняте рішеннятут істотно залежатиме від психології та інтуїції суб'єкта рішення). Це не дивно, оскільки критерії ґрунтуються на різних гіпотезах. вводячи ту чи іншу гіпотезу про поведінку середовища, тим самим " знімаємо невизначеність " , проте сама гіпотеза є лише припущенням, а чи не знанням. Було б дивним, якщо різні припущення завжди приводили до одного й того результату.

Ухвалення рішень в умовах ризику

Як було зазначено вище, прийняття рішень за умов ризику характеризується тим, що поведінка природи (середовища) має випадковий характер. Це проявляється в тому, що існує деяка ймовірнісна міра, відповідно до якої виникають (настають) ті чи інші стани природи. При цьому особа прин має рішення має певну інформацію про ймовірності появи станів середовища, яка за своїм характером може бути дуже різноманітна. Наприклад, є три стани середовища B1, B2 і B3, додаткова інформація про появу цих станів може полягати в тому, що стан B1 найменш ймовірно, а стан B3 більш ймовірно.

Отже, прийняття рішень за умов ризику передбачає, крім завдання функції реалізації, завдання деякої додаткової інформаціїпро ймовірність стану середовища. Якщо безліч станів природи B звичайно (кількість станів дорівнює m), то імовірнісний захід на ньому може бути заданий імовірнісним вектором q=(q1, q2, …, qm), де qj?0 і.

Таким чином, матриця виграшів в умовах ризику може бути представлена ​​у такому вигляді (див. таблицю 1)

Стану середовища

Вибираючи рішення Xi, гравець знає, що отримає один із виграшів a11, …, a1m з ймовірностями q1, …, qm відповідно. Отже, результатом для рішення, що приймає при виборі ним рішення Xi є випадкова величина

Отже, порівняння двох рішень X1 і X2 зводиться до порівняння відповідних їм випадкових величин.

Вибір оптимального рішення зазвичай ґрунтується на одному з наступних критеріїв:

  • 1) критерій Байєса-Лапласа – очікуваного значення (прибутку або витрат);
  • 2) комбінації очікуваного значення та дисперсії;
  • 3) критерій праці;
  • 4) найбільш ймовірні події в майбутньому та інші.

Розглянемо докладніше критерій Байєса-Лапласа.

Критерій очікуваного значення (критерій Байєса-Лапласа)

Минулої лекції ми розглянули критерій Байєса-Лапласа. Використання цього критерію (у літературі зустрічається інша назва - критерій "очікуваного середнього значення") обумовлено прагненням максимізувати очікуваний прибуток (або мінімізувати очікувані витрати). Використання очікуваних величин передбачає можливість багаторазового вирішення одного і того ж завдання, доки не будуть отримані досить точні розрахункові формули. Математично це виглядає так: нехай - випадкова величина з математичним очікуванням Mо і дисперсією Dо. Якщо x1, x2,..., xn – значення випадкової величини(с.в.) о, то середнє арифметичне їх (вибіркове середнє) значень

має дисперсію. Таким чином, коли n>

Тобто при досить великому обсязі вибірки різниця між середнім арифметичним і математичним очікуванням прагне нуля (так звана гранична теорема теорії ймовірності). Отже, використання критерію "очікуване значення" справедливе лише у разі, коли одне й те саме рішення доводиться застосовувати досить велику кількість разів. Правильне і зворотне: орієнтація на очікування призводитиме до невірних результатів, для рішень, які доводиться приймати невелику кількість разів.

Перш ніж перейти до модифікації критерію Байєса-Лапласа, розглянемо цей критерій докладніше.

Відомо, що природною числовою характеристикою випадкової величини є її математичне очікування Mо, до якого наближається середнє значення цієї випадкової величини при великій кількості випробувань.

Якщо людина, яка виступає проти природи, є статистичні дані про закономірності в конкретних проявах природи, то завдання легко може бути вирішена імовірнісними методами.

Таким чином, якщо ймовірності станів природи відомі і не змінюються з часом (стаціонарні), то оптимальним слід вважати рішення, що максимізує очікуваний виграш (який дає найбільше математичне очікування виграшу проти відомої стратегії природи – стану чи умови).

приклад. Фірма купила верстат за 100 грошових одиниць. Для його ремонту можна придбати спеціальне обладнання за 50 од. або обійтися старим обладнанням. Якщо верстат виходить з ладу, його ремонт за допомогою спецобладнання коштує 10 од., без спецобладнання - 40 од. Відомо, що протягом терміну експлуатації верстат виходить з ладу не більше трьох разів: ймовірність того, що верстат не зламається – 0.3; зламається 1 раз – 0.4; зламається 2 рази – 0.2; зламається 3 рази – 0.1. Потрібно визначити доцільність придбання спеціалізованого ремонтного устаткування.

Формалізація. Перший гравець має дві чисті стратегії: купувати (X1) та не купувати (X2) спеціалізоване ремонтне обладнання. У природи - другого гравця - чотири стани: верстат не вийде з ладу, вийде один раз, зламається двічі і тричі. Функція виграшу - витрати фірми на купівлю та ремонт верстата, що визначається платіжною матрицею (див. таблицю 1):

Таблиця 1.

Вихід верстата з ладу

B1, жодного разу

X1, не купити

X2, купити

Рішення. Розглянемо спочатку це завдання як антагоністичну гру. У матриці методом мінімаксу знаходимо сідлову точку: (X2, B4), в такий спосіб, ціна гри v= - 180 грошових одиниць (див. таблицю 2).

Таблиця 2.

Вихід верстата з ладу

B1,ні разу

X1, не купити

X2, купити

Відповідь: потрібно придбати спеціалізоване обладнання.

Однак у іграх із природою становище докорінно змінюється: вже за умови закладена стійка змішана стратегія природи: q= (0,3; 0,4; 0,2; 0,1) і ми знаємо, що саме цієї стратегії дотримується природа.

Якщо ж людина - перший гравець - продовжуватиме грати оптимально, то її виграш складе M=-150Ч0.3-160Ч0.4-170Ч0.2-180Ч0.1=-161, а якщо застосує першу, неоптимальну стратегію, то його математичне очікування виграшу становитиме M=-100Ч0.3 - 140Ч0.4 - 180Ч0.2 -220Ч0.1 =-144.

Таким чином, першому гравцю вигідно не оптимально грати!

Таблиця 3.

Вихід верстата з ладу

B1, жодного разу

X1, не купити

X2, купити

Відповідь: не купувати спеціалізованого обладнання.

Істотне різницю між значеннями v(x*) і v(x") пояснюється тим, що змішана стратегія природи неоптимальна і вона, "відхиляючись" від своєї оптимальної стратегії "недоотримує" 36 грошових одиниць виграшу.

Отже, у грі з природою орієнтація на математичне очікування виграшу є фактично орієнтація на середній виграш, який вийде за багаторазового повторення цієї гри (при припущенні, що умови гри не змінюються). Зрозуміло, якщо гра насправді багаторазово повторюється, то критерій середнього виграшу (наприклад, в економічних завданнях - середнього прибутку) вважатимуться виправданим. Проте чи розумно орієнтуватися цей критерій при одиничному випробуванні?

Розглянемо наступний приклад. Фірма I може виставити на продаж один із товарів TI1або TI2, а фірма II - один із товарів TII1, TII2, TII3. Товари TI1 та TII1 є конкуруючими (наприклад, пиво та лимонад), а товари TI1 та TII3 додатковими (наприклад, пиво та вобла); Інші товари нейтральні. Прибуток фірми I залежить від поєднання товарів, що виставляються на продаж обома фірмами, і визначається таблицею 4. Відомо, що фірма II виставляє на продаж товар TII3 втричі рідше, ніж TII1 і в чотири рази рідше, ніж TII2. Який товар слід постачати продаж фірмі I?

Таблиця 4

Стану середовища

Тут рішення виставити продаж фірмою I товар TI1, рішення X2 виставити продаж фірмою I товар TI2.

Обчислимо математичні очікування даної таблиці:

M=8Ч3/8+18Ч4/8+40Ч1/8=17, M=18Ч3/8+15Ч4/8+14Ч1/8=16.

Оптимальною стратегією буде рішення X1, тобто. фірма I постачати товар TI1. Безумовно, виграш у 17 грошових одиниць краще, ніж у 16. Однак при виборі рішення X1 ми отримаємо не 17 грошових одиниць, а один із виграшів: 8, 18 або 40. При виборі рішення X2 ми отримаємо не 16 грошових одиниць, а один із виграшів 18, 15 або 14. Складемо таблицю, де зазначені відхилення можливих виграшів від їх очікуваних значень та ймовірності цих відхилень.

Таблиця 5. Значення відхилень

З цієї таблиці видно, що з рівних очікуваних виграшах, по-різному ведуть відхилення від очікуваних виграшів: X1 ці відхилення значні, а X2 - порівняно невеликі.

З проведеного аналізу можна зробити висновок: в умовах ризику критерій Байєса-Лапласа (очікуваного середнього виграшу) не є адекватним і має бути змінено з урахуванням можливих відхиленьвипадкової величини від середнього значення.

Теоретично ймовірностей як міру відхилення випадкової величини від її середнього значення зазвичай використовують дисперсію D або середньоквадратичне відхилення у =. У завданнях прийняття рішень в умовах ризику розглядатимемо як показник ризику середньоквадратичне відхилення, т.к. має таку ж розмірність, що і випадкова величина о, математичне очікування Mо.

Таким чином, для ухвалення рішення в умовах ризику вибір альтернативи Xi призводить до випадкової величини оi, яка може бути охарактеризована парою показників (Mо, уi). Тепер приступимо до побудови адекватного критерію порівняння альтернатив. Фактично тут виходить завдання двокритеріальної оптимізації, де як приватні критерії виступають математичне очікування Mо (значення даного критерію потрібно максимізувати) і середньоквадратичне відхилення у (значення даного критерію потрібно мінімізувати).

Розглянемо перебування Парето-оптимальних рішень для даної багатокритеріальної задачі. Припустимо, що потрібно вибрати одну оптимальне рішення з множини допустимих рішень, кожне з яких визначається парою показників (Mоi, уi). Зобразивши на координатній площині точки з координатами (Mоi, уi), отримаємо картинку типу зображеної на рис. 1, тобто. ми отримали простір оцінок. Ліва частинамалюнку (червоні точки) значення математичного очікуваннями взяли позитивними, а й у негативні значення, т.к. цей критерій ми повинні мінімізувати. Парето-оптимальними оцінками є права верхня межаі відповідно Парето оптимальними рішеннями X1, X2, X9 та X7.

У цьому прикладі безліч Парето-оптимальних рішень є X1, X2, X9, X7 і остаточний вибір оптимального рішення проводиться з цієї множини. Як було сказано вище, тут є два підходи: перший підхід полягає в тому, що будується безліч Парето-оптимальних рішень і з цієї множини ЛПР вибирає єдине рішення на основі неформальних додаткових міркувань. Розглянемо другий підхід з урахуванням звуження безлічі Парето-оптимальних альтернатив.

  • 1. Вибір головного критерію та призначення нижніх кордонів за іншими критеріями. Призначимо нижню межу за критерієм M та мінімізувати критерій у. Як нижня межа критерію M візьмемо значення M4 (див. рис. 1), то оптимальним буде рішення X2, так серед рішень, що задовольняють умові Mi? M4, вона менш ризикована.
  • 2. Лексикографічна оптимізація передбачає впорядкування критеріїв важливості. Нехай, наприклад, M – найважливіший критерій. Так як максимальне значення за критерієм M має єдине рішення X7, воно і є оптимальним. Тут наочно проявляється недолік методу лексикографічної оптимізації: облік одного (найважливішого) критерію. Цей недолік пов'язаний з необхідністю введення жорсткого пріоритету критеріїв і може бути знятий за рахунок послаблення жорсткості пріоритетів. У цьому випадку використовують метод послідовних поступок (метод зміни мети), який було розглянуто вище.

Наприклад, у нашому випадку як поступка за критерієм M величину Д, вказану на рис. 1. Тоді результатом вибору першому кроці будуть альтернативи X7, X8, X9. Серед них найкращим за другим критерієм буде X9. Таким чином, дещо знизивши вимоги за критерієм M, ми значно покращили оцінку за критерієм (тобто деяке зменшення очікуваного виграшу призвело до істотного зниження ризику).


Мал. 1.

Розглянемо застосування узагальненого критерію нашого завдання. Візьмемо як узагальнений критерій функцію виду:

f(M, у)= M-лЧу, (1)

де л – деяка постійна величина. Фактично критерій (1) представляє адитивний критерій оптимальності приватних критеріїв M, з ваговими коефіцієнтами 1 і - л. При л>0 оцінка випадкової величини за допомогою адитивного критерію (1) менша, ніж її середнє значення, що характерно для обережної людини, тобто. людини не схильного до ризику. Навпаки, при л<0 оценка (1) выше, чем среднее значение, что характеризует человека, склонного к риску. Наконец, при л=0 оценка случайной величины совпадает с её средним значением (т.е. возможные отклонения случайной величины от её среднего значения игнорируются) - это характеризует человека, безразличного к риску.

Змістовний зміст адитивного критерію (1) при л>0 полягає в тому, що збільшення критерію f(M, у) може відбуватися як рахунок збільшення M, так і рахунок зменшення у. Таким чином, для людини, яка не схильна до ризику, критерій (1) відображає прагнення до збільшення очікуваного виграшу та зменшення ризику відхилення від нього. У цьому показник л характеризує суб'єктивне ставлення приймаючого рішення ризику. Отже, л можна як суб'єктивний показник заходи несхильності до ризику (суб'єктивний показник обережності).

Вибір варіанта виробленого товару. Фірма може випускати продукцію з наступних шести видів: парасольки (З), куртки (К), плащі (П), сумки (С), туфлі (Т) та (Ш). Глава фірми має ухвалити рішення, який із цих видів продукції випускати протягом майбутнього літнього сезону. Прибуток фірми залежить від цього, яким буде літо - дощовим, жарким чи помірним, і визначається таблицею 6. Вибір якого варіанта виробництва буде оптимальним?

За відсутності додаткової інформації про стани середовища в умовах невизначеності, і її рішення можливе при прийнятті будь-якої гіпотези про поведінку середовища. Якщо той, хто приймає рішення, має інформацію про ймовірності настання дощового, спекотного та помірного літа, то зазначене завдання стає завданням прийняття в умовах ризику. У даному випадку необхідна інформація може бути взята зі статистичних даних (спостережень за погодою в цій місцевості). Припустимо, що ймовірність дощового, спекотного та помірного літа дорівнює відповідно 0.2, 0.5 та 0.3. Тоді отримуємо завдання ухвалення рішення в умовах ризику, задану таблицею 7.

Таблиця 6.

Знайдемо очікувані виграші, що відповідають рішенням З, К, П, С, Т, Ш. Маємо:

МОЗ=0.2Ч80+0.5Ч60+0.3Ч40=58,

Мк=0.2Ч70+0.5Ч40+0.3Ч80=58,

МП=0.2Ч70+0.5Ч50+0.3Ч60=57,

МС=0.2Ч50+0.5Ч50+0.3Ч70=56,

МТ=0.2Ч75+0.5Ч50+0.3Ч50=55,

DоЗ = 196, DоК = 336, DоП = 61, DоС = 84, DоТ = 100, DоШ = 231.5. Середньоквадратичні відхиленняаналізованих випадкових величин такі:

уЗ=14.0, уК=18.3, уП=7.8, уС=9.2, уТ=10.0, уШ=15.2.

Складемо таблицю значень критеріїв M і для кожної альтернативи (таблиця 8)

таблиця 8

Критерії

Представимо розглянуті рішення точками на координатній площині змінних M і отримаємо рис. 2, з якого Парето-оптимальні рішення З, П, Ш. Остаточний вибір оптимальної альтернативи повинен проводитися з цієї множини.

Звуження Парето-оптимальної множини (в ідеалі - до одного елемента) може бути зроблено тільки за наявності додаткової інформації про співвідношення критеріїв M та у. Як було зазначено вище, це можна зробити методом головного критерію, методом послідовних поступок або з використанням лексикографічного критерію.

Огляд критеріїв ухвалення рішення в умовах ризику

Критерій творів

Правило вибору у разі формулюється так:

Матриця рішень доповнюється новим стовпцем, що містить добутки всіх результатів кожного рядка. Вибираються варіанти, у рядках яких перебувають найбільші значенняцього стовпця.

Застосування цього критерію обумовлено такими обставинами:

  • · Імовірності появи стану Bj невідомі;
  • · З появою кожного зі станів Bj окремо необхідно рахуватися;
  • · Критерій застосуємо і при малій кількості реалізацій рішення;
  • · Деякий ризик допускається.

Критерій творів пристосований насамперед для випадків, коли всі aij позитивні. Якщо умова позитивності порушується, слід виконувати деяке зрушення aij+а з деякою константою а> . Результат при цьому, звичайно, залежатиме від а. На практиці найчастіше

Якщо ж жодна константа може бути визнана має сенс, то критерій творів не застосовний.

Попередня Головна Наступна

Ухвалення рішення в умовах ризику з можливістю проведення експерименту

При прийнятті рішення за умов невизначеності (чи умовах ризику) принципова складність вибору рішення виникає через незнання ЛПР істинного стану середовища. У попередніх лекціях розглянуто кілька критеріїв, кожен із яких по-своєму "бореться" з невизначеністю: за допомогою висування гіпотези про поведінку середовища (критерій Лапласа, Вальда, Гурвіца та Севіджа); за допомогою усереднення отримуваних виграшів (критерій Байєса-Лапласа або критерій очікуваного виграшу); за допомогою обліку як очікуваного виграшу, і заходи відхилення від нього. Однак, кожен із цих підходів дає лише спосіб раціонального аналізу невизначеності, не усуваючи самої невизначеності. Усунення чи навіть зменшення невизначеності може бути зроблено лише з урахуванням уточнення істинного стану середовища.

Насправді таке уточнення здійснюється, зазвичай, з допомогою збору додаткової інформації, і навіть з допомогою проведення експериментів, за результатами яких судять про стан середовища. Наприклад, перш ніж приступити до лікування хворого при незрозумілому діагнозі, лікар проводить додаткові аналізи; перш ніж бурити дорогу нафтову свердловину, геолог робить сейсморозвідку; перш ніж налагодити виробництво якогось товару, підприємець виготовляє пробну партію цього товару тощо. У рамках теорії прийняття рішень всі ці дії означають не що інше, як проведення експерименту з метою уточнення стану середовища.

Експеримент називається ідеальним, якщо за його результатами ЛПР дізнається справжній стан середовища. Насправді наявність ідеального експерименту - явище досить рідкісне. Найчастіше результат експерименту дає деяку інформацію, на основі якої може бути зроблено уточнення середовища.

Як використовувати результати експерименту та наявні статистичні дані при прийнятті рішень найефективніше? Одна з методик, що дозволяє вирішити цю проблему, заснована на формулі Байєса - формула переоцінки ймовірностей подій з урахуванням результату проведеного експерименту.

Зазначимо, що не для будь-якої задачі прийняття рішення експеримент є можливим. Якщо для деякого завдання експеримент можливий, виникає завдання оцінки доцільності його проведення. Справа в тому, що проведення експерименту завжди потребує витрат (матеріальних, організаційних, тимчасових та ін.).

У книзі [Розен] показано, що ідеальний експеримент є вигідним тоді і тільки тоді, коли його вартість менша за мінімальний очікуваний ризик:

де rij – ризики, C – вартість експерименту.

Для викладу байєсовського підходу до переоцінки ймовірностей нагадаємо деякі поняття з теорії ймовірностей.

Умовна ймовірність події A за умови, що сталася подія B, позначається P(A/B) та обчислюється за формулою

Розглянемо наступну теоретико-імовірнісну схему. Нехай B1, B2, …, Bm - повна група подій й у кожної події Bj, j= відома її можливість P(Bj). Нехай зроблено досвід, в результаті якого сталася подія A. Якщо відомі умовні ймовірності P(A/Bj) для всіх j=, тоді умовна ймовірність (після досвідчена) ймовірність події Bj (j=,) може бути знайдена за формулою Байєса

Розглянемо тепер у схематичній формі завдання ухвалення рішення в умовах ризику, задану за допомогою матриці виграшів, яка має вигляд табл.

Таблиця 1. Платіжна матриця з ймовірним вектором стану середовища

Стану середовища

Тут B1, B2, …, Bm – стану середовища, aij – виграш гравця у ситуації, коли він вибирає стратегію Xi, а середовище приймає стан Bj. ЛПР відома ймовірність P(Bj)= qj настання стану Bj, причому P(Bj)?0 і. Передбачається, що середовище може бути в одному і тільки в одному стані B1, B2, …, Bm. Іншими словами, випадкові події B1, B2, …, Bm утворюють повну групу подій, тому їх можна взяти як гіпотези. Відомі ЛПР ймовірності станів середовища P(Bj) (j=) є безумовними (досвідченими, апріорними) ймовірностями.

Припустимо, що проводиться деякий експеримент, результат якого залежить від наявного стану середовища. Якщо в результаті експерименту спостерігається подія A і, крім того, відомі умовні ймовірності P(A/Bj) для всіх j=, використовуючи формулу Байєса, можна знайти післядосвідчені (апостеріорні) ймовірності кожного стану середовища. Знання уточнених ймовірностей станів середовища дозволяє точніше вказати стратегію ЛПР.

Описаний підхід до прийняття рішень в умовах ризику називається байєсовським, оскільки він ґрунтується на формулі Байєса. Цей підхід ілюструється прикладом, розглянутим нижче.

Завдання. Буріння нафтової свердловини.

Керівник пошукової групи має ухвалити рішення: бурити нафтову свердловину чи ні. Свердловина може бути " сухий " (С), тобто. без нафти, " малопотужної " (М), тобто. з мінімальним вмістом нафти, і " багатої " (Б), тобто. з великим вмістом нафти. Альтернативами керівника групи є: x1 – бурити та x2 – не бурити. Чистий прибуток при виборі однієї з альтернатив залежно від можливого типу свердловини наведено у таблиці прибутків (див. табл. 1)

Таблиця 1. Платіжна матриця

Тип свердловини

Крім того, керівнику пошукової групи відомо, що в даній місцевості ймовірності сухої, малопотужної або багатої свердловини такі: P(C)=0.5, P(M)=0.3, P(Б)=0.2.

Керівник пошукової групи може провести експеримент із метою уточнення структури ґрунту (стану середовища). Цей експеримент є сейсморозвідкою, результатом якої буде відповідь - яка структура грунту в даній місцевості (але не відповідь на питання про тип свердловини!). У принципі структура ґрунту може бути або відкритою (О), або замкнутою (З). Керівник групи має таблицю результатів експериментів, наведену у цій місцевості (див. табл. 2).

Таблиця 2. Таблиця експериментальних даних

Ця таблиця показує, скільки разів на ґрунтах відкритої та ґрунтах замкнутої структури зустрічалися свердловини типу С, М, Б (тобто дає спільну статистику ґрунту та типу свердловин для даної місцевості).

Проведемо аналіз експериментальних даних отриманої таблиці. Припустимо, що зроблено n експериментів, результати яких є значеннями дискретних випадкових величин X (тип свердловини) і Y (структура грунту), які приймають відповідно значення С, М, Б та О, З. Позначимо через n11 число експериментів, у яких X= З і Y=О, через n12 число експериментів, у яких X=З і Y=З, через n21 число експериментів, у яких X=М та Y=О тощо. У разі n=100, n11=45, n12=5, n21=11. Розділивши значення таблиці 2 на 100 (на число проведених експериментів), ми отримаємо закон розподілу двовимірної випадкової величини (X, Y), заданої в табличній формі (див. табл. 3).

Таблиця 3. Статистичний рядрозподілу двовимірної с.в. (X, Y)

З таблиці 3 слід, що Р(X=C)=P(C)=0.5, Р(X=M)=P(M)=0.3, Р(X=Б)=P(Б)=0.2; Р(Y=O)=P(O)=0.6, Р(Y=З)=P(З)=0.4,

Отже, керівник групи має ухвалити рішення:

  • · Чи проводити експеримент (його вартість становить 10 одиниць);
  • · Якщо проводити, то, як чинити надалі в залежності від результатів експерименту.

Таким чином, отримано багатокрокове завдання ухвалення рішень в умовах ризику. Опишемо методику знаходження оптимального рішення.

Крок 1. Побудуємо дерево (рис. 1), на якому вказані всі етапи процесу прийняття рішень – дерево рішень. Гілки дерева відповідають можливим альтернативам, а вершини - ситуаціям, що виникають. Альтернативами керівника пошукової групи є: б - відмова від експерименту, - проведення експерименту, x1 - бурити, x2 - не бурити. Стан природи: вибір типу свердловини (З, М, Б), і навіть вибір структури грунту (О, З).

Побудоване дерево визначає гру керівника групи із природою. Позиціями цієї гри служать вершини дерева, а ходами гравців - обираються ними рішення. Позиції, у яких хід робить керівник групи, зображені прямокутником; позиції, у яких хід робить природа, – кружком.

Гра протікає в такий спосіб. У початковій позиції хід виконує керівник групи. Він повинен прийняти рішення - відмовитися від експерименту (вибрати рішення б) або проводити експеримент (вибрати рішення). Якщо він відмовився від експерименту, то гра переходить у наступну позицію, в якій керівник групи має ухвалити рішення: бурити (вибрати альтернативу x1) або не бурити (вибрати альтернативу x2). Якщо ж він вирішує проводити експеримент, то гра переходить у позицію, в якій хід робить природа, вибираючи один із станів або З, відповідних можливим результатамексперименту, і т. д. Гра закінчується тоді, коли вона переходить в остаточну позицію (тобто вершину дерева, для якої немає гілок, що виходять з неї)

Крок 2. Для кожного рішення, яке є ходом природи (тобто виходить із позиції, зображеної гуртком), треба знайти ймовірність цього ходу. Для цього чинимо так. Для кожної позиції дерева існує єдиний шлях, що поєднує цю позицію з початковою позицією. Якщо це для позиції природи, шлях, що з'єднує її з початковою позицією, не проходить через позицію (Е), що означає проведення експерименту, то ймовірності станів Р(С), Р(М) та Р(Б) є безумовними (досвідченими) і перебувають із табл. 3:

Р(С)=50/100, Р(М)=30/100, Р(Б)=20/100.

Якщо ж позиції природи шлях, що з'єднує її з початкової позицією, проходить через позицію (Е), то ймовірності станів середовища стають умовними ймовірностями і перебувають за формулами (1), використовуючи дані табл. 3:

У позиції (Е) ймовірності ходів, що призводять до позицій (О) та (З), знаходяться з таблиці 3: Р(О)=0.6, Р(З)=0.4.


Мал. 1.

Крок 3. Зробимо оцінку всіх позицій дерева гри, "спускаючись" від кінцевих позицій до початкової. Оцінкою позиції є очікуваний виграш у цій позиції. Оцінки кінцевих позицій знаходимо з таблиці 2. Вкажемо тепер спосіб знаходження оцінки довільної позиції дерева гри у припущенні, що знайдено оцінки всіх наступних позицій.

Для позиції природи її оцінка є очікуваним виграшем (див. рис 2);

Для позиції гравця оцінкою є максимум всіх за нею позицій. Мотив: у "своєї" позиції гравець може зробити будь-який хід, тому він вибере той, який призводить до найбільшого можливого виграшу (див. рис 3). У кожній позиції гравець позначає рисою ту гілку дерева, яка призводить до позиції, що має максимальну оцінку.


Звернемося до рис. 1. Отримуємо, що у початковій позиції очікуваний прибуток без проведення експерименту (альтернатива б) – 20 одиниць; очікуваний прибуток з проведенням експерименту (альтернатива в) – 28 одиниць. Таким чином, доцільним є рішення – проводити експеримент (сейсморозвідку). Далі, якщо експеримент покаже, що грунт відкритий, буріння виробляти не слід, а якщо замкнутий, то потрібно бурити.

  • 1 - гілка: =20
  • 2 - гілка: 0
  • 3 - гілка: = -30
  • 4 - гілка: 0
  • 5 - гілка: = 95
  • 6 - гілка: 0

Як випливає з умови завдання, значення 95 одиниць ми можемо отримати з ймовірністю 0.4. Отже, очікуваний виграш дорівнюватиме 0.4*95=38 одиницям. Віднімаємо витрати на проведення експерименту 10 одиниць.

У результаті отримаємо 28 одиниць.

Дерева рішень ієрархічно є логічну структуру прийняття рішень, і полегшує цим розуміння завдання і процес її решения. На відміну від матриці рішень, тут можна бачити тимчасовий хід процесу прийняття рішення. Дерево рішень не можна, однак, у загальному випадку уявити простою матрицею рішень; так можуть бути лише окремі етапи процесу. Розбиття на етапи роблять так, щоб вибір рішення починався з деякого вузла рішень, від якого виходять одна або кілька гілок, що представляють варіанти рішень. Далі йдуть вузли подій і на кінці - листя", що представляють кінцеві стани із зазначенням значень відповідних вихідних параметрів. Якщо ж за вузлами подій слід знову вузол рішень з відповідними діями, тоді це і всі наступні розгалуження відносяться до більш пізньої стадіївибору рішення.. Таким чином, можна простежити весь шлях від початку до кінця дерева рішень.

У дереві рішень розрізняють вузли подій та вузли рішень. Можна уявити, що у вузлах подій вибір подальшого шляху визначається зовнішніми умовами(Природою, в теорії ігор противником), а у вузлах рішень - особою, що приймає рішення.

Дерева рішень легко піддаються модифікації: при необхідності їх можна додатково розвинути, а у випадках, коли якісь гілки практично позбавлені значення, - відповідно зменшити. Вузли рішень, якщо вони пов'язані з однією дією і не розділені вузлами подій, можуть бути об'єднані. Те саме справедливо і для вузлів подій.



Нове на сайті

>

Найпопулярніше